ISO 8859-2

ISO 8859-2 lub bardziej formalnie ISO/IEC 8859-2, również znane jako ISO Latin-2, bądź „środkowo–” i „wschodnioeuropejskie”, jest drugą częścią standardu kodowania znaków zdefiniowanego przez Międzynarodową Organizację Normalizacyjną (ISO). Składa się ze 191 znaków łacińskiego pisma, z czego każdy jest zapisywany przy pomocy ośmiu bitów. Na jego podstawie została utworzona Polska Norma (PN-T-42118:1993) opisująca kodowanie polskich liter diakrytyzowanych w kodach 8-bitowych.

Pokrycie języków

Używając tego zestawu znaków da się zapisać teksty w językach czeskim, węgierskim, polskim, rumuńskim, serbsko–chorwackim, słowackim, słoweńskim, jak również w górno– i dolnołużyckim. Jak widać poniżej, brakuje jednak polskich cudzysłowów, te są obecne w nowszym ISO 8859-16. Dodatkowo nadaje się do przedstawienia kilku zachodnioeuropejskich języków jak niemiecki, czy też angielski (choć dla tych języków powinien zostać zastosowany zestaw ISO 8859-1 lub nowszy ISO 8859-15).

W przeciwieństwie do ISO 8859-1, choć nie jest to stosowane, da się w tym zestawie znaków przedstawić też język fiński. Sporną kwestią jest natomiast dostosowanie tego kodowania do języka rumuńskiego z powodu faktu, iż zamiast liter Șș i Țț (S i T z przecinkiem) występują znaki Şş i Ţţ (S i T z cedillą). Co prawda, litery te zostały zunifikowane w pierwszej wersji Unicode’u, gdzie pojawienie się ich z cedillą czy przecinkiem było traktowane jako wybór glifu, a nie jako oddzielne znaki, to jednak fonty przeznaczone do użycia z tym językiem winny mieć znaki z przecinkiem w ich miejscach.

Tablica kodów

ISO/IEC 8859-2:1999
 x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xZnaki kontrolne
1x
2xSP!"#$%&'()*+Przecinek,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{|}~
8xNieużywane
9x
AxNBSPĄ˘Ł¤ĽŚ§¨ŠŞŤŹSHYŽŻ
Bx°ą˛ł´ľśˇ¸šşťź˝žż
CxŔÁÂĂÄĹĆÇČÉĘËĚÍÎĎ
DxĐŃŇÓÔŐÖ×ŘŮÚŰÜÝŢß
Exŕáâăäĺćçčéęëěíîď
Fxđńňóôőö÷řůúűüýţ˙

W powyższej tabeli znak o kodzie 0x20 to zwykła spacja, 0xA0 to twarda spacja, a znak 0xAD to miękki dywiz.

Mapowanie na Unicode

Poniższa tabela przedstawia miejsca znaków z ISO 8859-2 w Unicode:

ISO/IEC 8859-2:1999
HexZnakUnicodeHexZnakUnicodeHexZnakUnicode
0xA0NBSPU+00A00xC0ŔU+01540xE0ŕU+0155
0xA1ĄU+01040xC1ÁU+00C10xE1áU+00E1
0xA2˘U+02D80xC2ÂU+00C20xE2âU+00E2
0xA3ŁU+01410xC3ĂU+01020xE3ăU+0103
0xA4¤U+00A40xC4ÄU+00C40xE4äU+00E4
0xA5ĽU+013D0xC5ĹU+01390xE5ĺU+013A
0xA6ŚU+015A0xC6ĆU+01060xE6ćU+0107
0xA7§U+00A70xC7ÇU+00C70xE7çU+00E7
0xA8¨U+00A80xC8ČU+010C0xE8čU+010D
0xA9ŠU+01600xC9ÉU+00C90xE9éU+00E9
0xAAŞU+015E0xCAĘU+01180xEAęU+0119
0xABŤU+01640xCBËU+00CB0xEBëU+00EB
0xACŹU+01790xCCĚU+011A0xECěU+011B
0xADSHYU+00AD0xCDÍU+00CD0xEDíU+00ED
0xAEŽU+017D0xCEÎU+00CE0xEEîU+00EE
0xAFŻU+017B0xCFĎU+010E0xEFďU+010F
0xB0°U+00B00xD0ĐU+01100xF0đU+0111
0xB1ąU+01050xD1ŃU+01430xF1ńU+0144
0xB2˛U+02DB0xD2ŇU+01470xF2ňU+0148
0xB3łU+01420xD3ÓU+00D30xF3óU+00F3
0xB4´U+00B40xD4ÔU+00D40xF4ôU+00F4
0xB5ľU+013E0xD5ŐU+01500xF5őU+0151
0xB6śU+015B0xD6ÖU+00D60xF6öU+00F6
0xB7ˇU+02C70xD7×U+00D70xF7÷U+00F7
0xB8¸U+00B80xD8ŘU+01580xF8řU+0159
0xB9šU+01610xD9ŮU+016E0xF9ůU+016F
0xBAşU+015F0xDAÚU+00DA0xFAúU+00FA
0xBBťU+01650xDBŰU+01700xFBűU+0171
0xBCźU+017A0xDCÜU+00DC0xFCüU+00FC
0xBD˝U+02DD0xDDÝU+00DD0xFDýU+00FD
0xBEžU+017E0xDEŢU+01620xFEţU+0163
0xBFżU+017C0xDFßU+00DF0xFF˙U+02D9

Znaki o kodach 0x20 – 0x7E mają bezpośrednie odpowiedniki w Unicode. (0x20 → U+0020, 0x21 → U+0021 itd.)

Kody z przedziałów: 0x01 – 0x1F oraz 0x7F – 0x9F nie są używane w ISO 8859-2.

Zobacz też

Linki zewnętrzne