Kody polskich liter


Na stronie tej zebrane są wszystkie znane mi kody polskich liter. Osobiście dawniej propagowałem standard ISO 8859-2 jako jedyny uznany międzynarodowo i zatwierdzony w kraju jako polska norma PN-93/T-42118.

Obecnie najpowszechniejsze stało się kodowanie Unicode znane też jako ISO/IEC 10646. Przy okazji proszę zwrocić uwagę na to, że kody IBM Latin 2 i ISO Latin 2 to zupełnie różne kody.

Polecam też konwerter: polcnv obsługujący wszystkie wymienione tu sposoby kodowania (i parę innych) i wyposażony w autodetekcję kodu.


Najpopularniejsze metody kodowania polskich znaków
Nazwa Status Uwagi
Unicode≈ISO/IEC 10646 standard międzynarodowy Używany pod różnymi postaciami: UTF-8, UTF-16≈UCS-2, UTF-32=UCS-4
ISO 8859-2 standard międzynarodowy ISO Latin 2 = polska norma PN-93/T-42118
CP 1250 prywatny firmy Microsoft Microsoft Windows (code page 1250)
CP 852 prywatny firmy Microsoft IBM PC Latin 2 (ELWRO) (code page 852)
Mazowia popularny w Polsce Znany też jako: CP 667, CP 790, CP 991, CP 3843

Kody polskich znaków rozszerzajace kod ASCII - szesnastkowe
a c e l n o s x z A C E L N O S X Z
Unicode UCS4 105 107 119 142 144 F3 15B 17A 17C 104 106 118 141 143 D3 15A 179 17B
Unicode UTF8 C4/85 C4/87 C4/99 C5/82 C5/84 C3/B3 C5/9B C5/BA C5/BC C4/84 C4/86 C4/98 C5/81 C5/83 C3/93 C5/9A C5/B9 C5/BB
ISO 8859-2 B1 E6 EA B3 F1 F3 B6 BC BF A1 C6 CA A3 D1 D3 A6 AC AF
CP 1250 B9 E6 EA B3 F1 F3 9C 9F BF A5 C6 CA A3 D1 D3 8C 8F AF
CP 852 A5 86 A9 88 E4 A2 98 AB BE A4 8F A8 9D E3 E0 97 8D BD
Mazowia 86 8D 91 92 A4 A2 9E A6 A7 8F 95 90 9C A5 A3 98 A0 A1
AmigaPL E2 EA EB EE EF F3 F4 FA FB C2 CA CB CE CF D3 D4 DA DB
Atari-Calamus D1 D2 D3 D4 D5 D6 D7 D8 D9 C1 C2 C3 C4 C5 C6 C7 C8 C9
ATM E4 E7 EB F0 F1 F3 F6 FA FC C4 C7 CB D0 D1 D3 D6 DA DC
CorelDraw! E5 EC E6 C6 F1 F3 A5 AA BA C5 F2 C9 A3 D1 D3 FF E1 ED
CP 668 A5 86 A9 88 AD A2 98 AB A7 A4 8F A8 9D AC 9E 97 8D A6
CSK A0 A1 A2 A3 A4 A5 A6 A8 A7 80 81 82 83 84 85 86 88 87
Cyfromat 90 91 92 93 94 95 96 98 97 80 81 82 83 84 85 86 88 87
DHN 89 8A 8B 8C 8D 8E 8F 91 90 80 81 82 83 84 85 86 88 87
ELWRO-Junior E1 E3 E5 EC EE EF F3 FA F9 C1 C3 C5 CC CE CF D3 DA D9
IEA-Swierk A0 9B 82 9F A4 A2 87 A8 91 8F 80 90 9C A5 99 EB 9D 92
IINTE-ISIS 90 91 92 93 94 95 96 97 98 80 81 82 83 84 85 86 87 88
ISO 6937/2 61/CE 63/C2 65/CE F8 6E/C2 6F/C2 73/C2 7A/C2 7A/C7 41/CE 43/C2 45/CE E8 4E/C2 4F/C2 54/C2 5A/C2 5A/C7
Logic 89 8A 8B 8C 8D 8E 8F 90 91 80 81 82 83 84 85 86 87 88
Macintosh 88 8D AB B8 C4 97 E6 90 FD 84 8C A2 FC C1 EE E5 8F FB
Mazowia 157 86 8D 91 92 A4 A2 9D A6 A7 8F 95 90 9C A5 A3 98 A0 A1
Mazowia Fido 86 87 91 92 A4 A2 9D A6 A7 8F 80 90 9C A5 A3 98 A0 A1
Microvex A0 9B 82 9F A4 A2 87 A8 91 8F 80 90 9C A5 93 98 9D 92
TeXPL A1 A2 A6 AA AB F3 B1 B9 BB 81 82 86 8A 8B D3 91 99 9B
Unia 86 95 82 91 A4 94 84 A8 81 8F 97 90 92 A5 99 8E AD 9A
Ventura 96 94 A4 A7 91 A2 84 82 87 97 99 A5 A6 92 8F 8E 90 80

Kody polskich znaków zmieniające kod EBCDIC - szesnastkowe
a c e l n o s x z A C E L N O S X Z
CP 1153/1375 Latin 2 A0 49 52 9A 9B CE 8A B7 B2 B1 69 72 BA BB EE AA B9 B4
RIAD AA 9F 9E 98 9A 9D 8A 8D AD EA DF DE D8 DA BD CA CD ED
SIEMENS PESEL B1 B3 B2 B4 B5 B6 B7 B8 B9

Wiele kodów zostało wpisanych na podstawie informacji od pracowników AGH. Kody: "CorelDraw!" i "ATM" podał pracownik IPPT (pierwszy pochodzi z "jakiejś firmy w Warszawie", drugi był stosowany w fontach postscriptowych dodanych do PageMakera). Kody oparte na EBCDIC zgłosił autor strony "Co to jest cyfra kontrolna?". Wartości kodu EBCDIC Latin2 na podstawie dokumentacji firmy IBM: CP 1153/1375 EBCDIC Latin 2. Wariany kodu Mazowia na podstawie wikipedii.

Relacje pomiedzy Unicode i ISO 10646 opisane są na stronach: Wikipedia Unicode FAQ Unicde versions Opis różnic pomiędzy formami UTF-8, UTF-16, UTF-32 UCS-2, UCS-4 mozna znaleźć w Wikipedii i Unicode FAQ.


JS (foto)
E-mail: J.Sobczyk@ia.pw.edu.pl