ISO 8859-1

ISO 8859-1, formalnie ISO/IEC 8859-1, potocznie Latin-1 lub zachodnioeuropejskie – pierwsza część ISO/IEC 8859, standardu kodowania znaków ustalonego przez Międzynarodową Organizację Normalizacyjną, a później wspólnie utrzymywanym przez tę organizację i Międzynarodową Komisję Elektrotechniczną. Standard po rozszerzeniu o dodatkowe przypisania znaków jest podstawą dla dwóch powszechnie używanych mapowań znaków znanych jako ISO-8859-1 (z dodatkowym łącznikiem) i Windows-1252.

Status

W czerwcu 2004 roku trzecia grupa robocza ISO/IEC odpowiedzialna za utrzymywanie zestawów znaków kodowanych ośmiobitowo została rozwiązana i, co za tym idzie, wszelkie prace i utrzymanie ISO 8859 (w tym ISO 8859-1) zostały wstrzymane w celu skoncentrowania się nad uniwersalnym zestawem znaków i Unicode. W informatyce kodowania dostarczające pełne wsparcie dla UCS (takie jak UTF-8 czy UTF-16) coraz częściej są wybierane zamiast zestawów znaków opartych na Latin-1.

Pokrycie języków

Przy pomocy ISO 8859-1 można zakodować to, co zwane jest alfabetem łacińskim numer 1, który składa się ze 191 znaków pisma łacińskiego. Każdy znak jest kodowany jako pojedyncza 8-bitowa wartość. Mogą one być użyte w prawie każdym systemie wymiany danych do komunikowania się w poniższych europejskich językach (z kilkoma wyjątkami, z powodu brakujących znaków):

Innymi pokrytymi językami są:

W związku z powyższym to kodowanie znaków jest używane w Amerykach, Europie Zachodniej, Oceanii i większej części Afryki, lecz dla niektórych języków brakuje poprawnych typograficznie cudzysłowów, zamiast których są dostępne « i ».

Różnice w stosunku do ISO/IEC 8859–15

W ISO/IEC 8859-1 brakuje znaków: zaczynając od kilku francuskich liter, poprzez reprezentację „IJ” jako jednego znaku (IJ), fińskich liter używanych w transkrypcjach obcych nazw i kilku zapożyczeniach, skończywszy na braku kilku powszechnych glifów takich jak sztylet (†), typograficzne cudzysłowy („,”) i dywizów (-, –, –), a dodatkowo brak symbolu Euro (€). Z tych powodów powstało ISO/IEC 8859-15, jako uaktualnienie ISO/IEC 8859-1 dodające symbol euro i kilka innych wymaganych znaków. To jednak wymusiło usunięcie z ISO/IEC 8859-1 kilku mniej używanych znaków, takich jak ułamki i bezliterowe diakrytyki: ¤, ¦, ¨, ´, ¸, ¼, ½, i ¾. Szczegółowo przedstawia to poniższa tabela:

Porównanie kodowań
HexISO 8859-1ISO 8859-15HexISO 8859-1ISO 8859-15HexISO 8859-1ISO 8859-15HexISO 8859-1ISO 8859-15
0x80ZK0xA0 0xC0À0xE0à
0x81ZK0xA1¡0xC1Á0xE1á
0x82ZK0xA2¢0xC2Â0xE2â
0x83ZK0xA3£0xC3Ã0xE3ã
0x84ZK0xA4¤0xC4Ä0xE4ä
0x85ZK0xA5¥0xC5Å0xE5å
0x86ZK0xA6¦Š0xC6Æ0xE6æ
0x87ZK0xA7§0xC7Ç0xE7ç
0x88ZK0xA8¨š0xC8È0xE8è
0x89ZK0xA9©0xC9É0xE9é
0x8AZK0xAAª0xCAÊ0xEAê
0x8BZK0xAB«0xCBË0xEBë
0x8CZK0xAC¬0xCCÌ0xECì
0x8DZK0xAD0xCDÍ0xEDí
0x8EZK0xAE®0xCEÎ0xEEî
0x8FZK0xAF¯0xCFÏ0xEFï
0x90ZK0xB0°0xD0Ð0xF0ð
0x91ZK0xB1±0xD1Ñ0xF1ñ
0x92ZK0xB2²0xD2Ò0xF2ò
0x93ZK0xB3³0xD3Ó0xF3ó
0x94ZK0xB4´Ž0xD4Ô0xF4ô
0x95ZK0xB5µ0xD5Õ0xF5õ
0x96ZK0xB60xD6Ö0xF6ö
0x97ZK0xB7·0xD7×0xF7÷
0x98ZK0xB8¸ž0xD8Ø0xF8ø
0x99ZK0xB9¹0xD9Ù0xF9ù
0x9AZK0xBAº0xDAÚ0xFAú
0x9BZK0xBB»0xDBÛ0xFBû
0x9CZK0xBC¼Œ0xDCÜ0xFCü
0x9DZK0xBD½œ0xDDÝ0xFDý
0x9EZK0xBE¾Ÿ0xDEÞ0xFEþ
0x9FZK0xBF¿0xDFß0xFFÿ

Gdzie „ZK” oznacza znak kontrolny, a „Znak” oznacza znak wspólny dla obydwu zestawów znaków.

Tablica kodów

Zważywszy na fakt, że 191 znaków kodowanych przez ISO/IEC 8859-1 jest graficzne i zgodne z większością przeglądarek, mogą być wyświetlone w poniższej tabeli. Przez to, że znaki spacji (0x20), twardej spacji (0xA0) i miękkiego dywizu (0xAD) nie zostałyby wyświetlone w sposób widoczny, zastosowano skróty ich nazw.

ISO/IEC 8859-1:1998
 x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xZnaki kontrolne
1x
2xSP!"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{|}~
8xNieużywane
9x
AxNBSP¡¢£¤¥¦§¨©ª«¬SHY[a]®¯
Bx°±²³´µ·¸¹º»¼½¾¿
CxÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ
DxÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞß
Exàáâãäåæçèéêëìíîï
Fxðñòóôõö÷øùúûüýþÿ

Wartości 0x00–0x1F i 0x80–0x9F nie są przydzielone do znaków przez ISO/IEC 8859-1.

ISO 8859-1 został oparty na międzynarodowym zestawie znaków używanym przez DEC w popularnym terminalu VT220. Kodowanie to opracowane zostało przez Europejskie Stowarzyszenie na rzecz Standaryzacji Systemów Informatycznych i Komunikacyjnych i opublikowane wraz z ISO 8859-2, ISO 8859-3 i ISO 8859-4 jako część specyfikacji ECMA-94.

Mapowanie na Unicode

Poniższa tabela przedstawia miejsca znaków z ISO 8859-1 w Unicode.

ISO/IEC 8859-1:1998
HexZnakUnicodeHexZnakUnicodeHexZnakUnicodeHexZnakUnicode
0x80ZKU+00800xA0NBSPU+00A00xC0ÀU+00C00xE0àU+00E0
0x81ZKU+00810xA1¡U+00A10xC1ÁU+00C10xE1áU+00E1
0x82ZKU+00820xA2¢U+00A20xC2ÂU+00C20xE2âU+00E2
0x83ZKU+00830xA3£U+00A30xC3ÃU+00C30xE3ãU+00E3
0x84ZKU+00840xA4¤U+00A40xC4ÄU+00C40xE4äU+00E4
0x85ZKU+00850xA5¥U+00A50xC5ÅU+00C50xE5åU+00E5
0x86ZKU+00860xA6¦U+00A60xC6ÆU+00C60xE6æU+00E6
0x87ZKU+00870xA7§U+00A70xC7ÇU+00C70xE7çU+00E7
0x88ZKU+00880xA8¨U+00A80xC8ÈU+00C80xE8èU+00E8
0x89ZKU+00890xA9©U+00A90xC9ÉU+00C90xE9éU+00E9
0x8AZKU+008A0xAAªU+00AA0xCAÊU+00CA0xEAêU+00EA
0x8BZKU+008B0xAB«U+00AB0xCBËU+00CB0xEBëU+00EB
0x8CZKU+008C0xAC¬U+00AC0xCCÌU+00CC0xECìU+00EC
0x8DZKU+008D0xADSHYU+00AD0xCDÍU+00CD0xEDíU+00ED
0x8EZKU+008E0xAE®U+00AE0xCEÎU+00CE0xEEîU+00EE
0x8FZKU+008F0xAF¯U+00AF0xCFÏU+00CF0xEFïU+00EF
0x90ZKU+00900xB0°U+00B00xD0ÐU+00D00xF0ðU+00F0
0x91ZKU+00910xB1±U+00B10xD1ÑU+00D10xF1ñU+00F1
0x92ZKU+00920xB2²U+00B20xD2ÒU+00D20xF2òU+00F2
0x93ZKU+00930xB3³U+00B30xD3ÓU+00D30xF3óU+00F3
0x94ZKU+00940xB4´U+00B40xD4ÔU+00D40xF4ôU+00F4
0x95ZKU+00950xB5µU+00B50xD5ÕU+00D50xF5õU+00F5
0x96ZKU+00960xB6U+00B60xD6ÖU+00D60xF6öU+00F6
0x97ZKU+00970xB7·U+00B70xD7×U+00D70xF7÷U+00F7
0x98ZKU+00980xB8¸U+00B80xD8ØU+00D80xF8øU+00F8
0x99ZKU+00990xB9¹U+00B90xD9ÙU+00D90xF9ùU+00F9
0x9AZKU+009A0xBAºU+00BA0xDAÚU+00DA0xFAúU+00FA
0x9BZKU+009B0xBB»U+00BB0xDBÛU+00DB0xFBûU+00FB
0x9CZKU+009C0xBC¼U+00BC0xDCÜU+00DC0xFCüU+00FC
0x9DZKU+009D0xBD½U+00BD0xDDÝU+00DD0xFDýU+00FD
0x9EZKU+009E0xBE¾U+00BE0xDEÞU+00DE0xFEþU+00FE
0x9FZKU+009F0xBF¿U+00BF0xDFßU+00DF0xFFÿU+00FF

Uwagi

  1. Miękki dywiz.

Linki zewnętrzne