ISO 8859-2
ISO 8859-2, formálně správně ISO/IEC 8859-2, je v informatice znaková sada známá rovněž jako Latin-2 (pozor na možnou záměnu použití pojmu Latin-2 v prostředí Microsoft Windows v prostředí MS DOS, viz CP852), nebo „středo-“ či „východoevropská“, která je druhou částí standardního kódování znaků definovaného organizací ISO. Obsahuje 191 znaků latinky kódovaných pomocí 8 bitů a poprvé byla publikována v roce 1987.
Pokrytí jazyků
[editovat | editovat zdroj]Pomocí této znakové sady je možné zapisovat texty následujících jazycích: bosenština, chorvatština, čeština, maďarština, polština, rumunština, srbština (psaná v latinské transkripci), srbochorvatština, slovenština, slovinština, hornolužičtina, dolnolužičtina. Jako dodatkové jazyky lze použít angličtinu a němčinu, což má význam zvláště ve vícejazyčných dokumentech (pro tyto jazyky se normálně upřednostňuje ISO 8859-1).
Na rozdíl od ISO 8859-1 je tato sestava znaků použitelná i pro finštinu (kromě znaku „å“ používaného v některých švédsko-finských jménech) a němčinu. Sporné je zde použití pro rumunštinu, protože místo znaků Șș i Țț (S a T s čárkou) se musí použít znaky Şş i Ţţ (S a T s cedillou). Toto omezení se dostalo i do první verze unikódu, kde zobrazení s cedillou nebo tečkou bylo bráno jako výběr fontu a ne jako oddělené znaky. Unicode 3.0 již obsahuje správné rumunské znaky.
Latin 2
[editovat | editovat zdroj]Tato kódová stránka bývá často nazývána Latin 2, nicméně stejné označení se používá v MS-DOSu pro CP852. Někdy tak dochází k omylům, kterým se lze vyhnout označováním ISO 8859-2 jako ISO Latin 2, zatímco CP852 lze nazývat PC Latin 2 nebo IBM Latin 2. [1]
Podobnost s Windows-1250
[editovat | editovat zdroj]ISO 8859-2 se velmi podobá znakové sadě Windows-1250, která vznikla později. Kódování Windows-1250 zavedené firmou Microsoft obsahuje všechny tisknutelné znaky ISO 8859-2, ale některé z nich na jiných místech. V češtině je tento rozdíl nejmarkantnější u písmen Š, Ť a Ž.
Tabulka znaků
[editovat | editovat zdroj]ISO/IEC 8859-2:1999 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Řídící znaky | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | , | - | . | / | |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | Nevyužíváno | |||||||||||||||
9x | ||||||||||||||||
Ax | NBSP | Ą | ˘ | Ł | ¤ | Ľ | Ś | § | ¨ | Š | Ş | Ť | Ź | SHY | Ž | Ż |
Bx | ° | ą | ˛ | ł | ´ | ľ | ś | ˇ | ¸ | š | ş | ť | ź | ˝ | ž | ż |
Cx | Ŕ | Á | Â | Ă | Ä | Ĺ | Ć | Ç | Č | É | Ę | Ë | Ě | Í | Î | Ď |
Dx | Đ | Ń | Ň | Ó | Ô | Ő | Ö | × | Ř | Ů | Ú | Ű | Ü | Ý | Ţ | ß |
Ex | ŕ | á | â | ă | ä | ĺ | ć | ç | č | é | ę | ë | ě | í | î | ď |
Fx | đ | ń | ň | ó | ô | ő | ö | ÷ | ř | ů | ú | ű | ü | ý | ţ | ˙ |
Znak s kódem 0x20 je obyčejná mezera, 0xA0 je nezlomitelná mezera, znak 0xAD měkký rozdělovník.
Mapování do Unikódu
[editovat | editovat zdroj]ISO/IEC 8859-2:1999 | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode |
0x80 | ŘZ | U 0080 | 0xA0 | NBSP | U 00A0 | 0xC0 | Ŕ | U 0154 | 0xE0 | ŕ | U 0155 |
0x81 | ŘZ | U 0081 | 0xA1 | Ą | U 0104 | 0xC1 | Á | U 00C1 | 0xE1 | á | U 00E1 |
0x82 | ŘZ | U 0082 | 0xA2 | ˘ | U 02D8 | 0xC2 | Â | U 00C2 | 0xE2 | â | U 00E2 |
0x83 | ŘZ | U 0083 | 0xA3 | Ł | U 0141 | 0xC3 | Ă | U 0102 | 0xE3 | ă | U 0103 |
0x84 | ŘZ | U 0084 | 0xA4 | ¤ | U 00A4 | 0xC4 | Ä | U 00C4 | 0xE4 | ä | U 00E4 |
0x85 | ŘZ | U 0085 | 0xA5 | Ľ | U 013D | 0xC5 | Ĺ | U 0139 | 0xE5 | ĺ | U 013A |
0x86 | ŘZ | U 0086 | 0xA6 | Ś | U 015A | 0xC6 | Ć | U 0106 | 0xE6 | ć | U 0107 |
0x87 | ŘZ | U 0087 | 0xA7 | § | U 00A7 | 0xC7 | Ç | U 00C7 | 0xE7 | ç | U 00E7 |
0x88 | ŘZ | U 0088 | 0xA8 | ¨ | U 00A8 | 0xC8 | Č | U 010C | 0xE8 | č | U 010D |
0x89 | ŘZ | U 0089 | 0xA9 | Š | U 0160 | 0xC9 | É | U 00C9 | 0xE9 | é | U 00E9 |
0x8A | ŘZ | U 008A | 0xAA | Ş | U 015E | 0xCA | Ę | U 0118 | 0xEA | ę | U 0119 |
0x8B | ŘZ | U 008B | 0xAB | Ť | U 0164 | 0xCB | Ë | U 00CB | 0xEB | ë | U 00EB |
0x8C | ŘZ | U 008C | 0xAC | Ź | U 0179 | 0xCC | Ě | U 011A | 0xEC | ě | U 011B |
0x8D | ŘZ | U 008D | 0xAD | SHY | U 00AD | 0xCD | Í | U 00CD | 0xED | í | U 00ED |
0x8E | ŘZ | U 008E | 0xAE | Ž | U 017D | 0xCE | Î | U 00CE | 0xEE | î | U 00EE |
0x8F | ŘZ | U 008F | 0xAF | Ż | U 017B | 0xCF | Ď | U 010E | 0xEF | ď | U 010F |
0x90 | ŘZ | U 0090 | 0xB0 | ° | U 00B0 | 0xD0 | Đ | U 0110 | 0xF0 | đ | U 0111 |
0x91 | ŘZ | U 0091 | 0xB1 | ą | U 0105 | 0xD1 | Ń | U 0143 | 0xF1 | ń | U 0144 |
0x92 | ŘZ | U 0092 | 0xB2 | ˛ | U 02DB | 0xD2 | Ň | U 0147 | 0xF2 | ň | U 0148 |
0x93 | ŘZ | U 0093 | 0xB3 | ł | U 0142 | 0xD3 | Ó | U 00D3 | 0xF3 | ó | U 00F3 |
0x94 | ŘZ | U 0094 | 0xB4 | ´ | U 00B4 | 0xD4 | Ô | U 00D4 | 0xF4 | ô | U 00F4 |
0x95 | ŘZ | U 0095 | 0xB5 | ľ | U 013E | 0xD5 | Ő | U 0150 | 0xF5 | ő | U 0151 |
0x96 | ŘZ | U 0096 | 0xB6 | ś | U 015B | 0xD6 | Ö | U 00D6 | 0xF6 | ö | U 00F6 |
0x97 | ŘZ | U 0097 | 0xB7 | ˇ | U 02C7 | 0xD7 | × | U 00D7 | 0xF7 | ÷ | U 00F7 |
0x98 | ŘZ | U 0098 | 0xB8 | ¸ | U 00B8 | 0xD8 | Ř | U 0158 | 0xF8 | ř | U 0159 |
0x99 | ŘZ | U 0099 | 0xB9 | š | U 0161 | 0xD9 | Ů | U 016E | 0xF9 | ů | U 016F |
0x9A | ŘZ | U 009A | 0xBA | ş | U 015F | 0xDA | Ú | U 00DA | 0xFA | ú | U 00FA |
0x9B | ŘZ | U 009B | 0xBB | ť | U 0165 | 0xDB | Ű | U 0170 | 0xFB | ű | U 0171 |
0x9C | ŘZ | U 009C | 0xBC | ź | U 017A | 0xDC | Ü | U 00DC | 0xFC | ü | U 00FC |
0x9D | ŘZ | U 009D | 0xBD | ˝ | U 02DD | 0xDD | Ý | U 00DD | 0xFD | ý | U 00FD |
0x9E | ŘZ | U 009E | 0xBE | ž | U 017E | 0xDE | Ţ | U 0162 | 0xFE | ţ | U 0163 |
0x9F | ŘZ | U 009F | 0xBF | ż | U 017C | 0xDF | ß | U 00DF | 0xFF | ˙ | U 02D9 |
Kde „ŘZ“ označuje řídící znak.
Externí odkazy
[editovat | editovat zdroj]- ISO 8859-2:1999
- Standard ECMA-94: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
- ISO-IR 101 Right-Hand Part of Latin Alphabet No.2 (February 1, 1986)