КОИ-8
КОИ-8 (код обмена информацией, 8 бит), KOI8 — восьмибитовая кодовая страница, совместимая с ASCII. Разработана для кодирования букв кириллических алфавитов. Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако ближе к 2010 году, с распространением Юникода, постепенно выходит из употребления.
Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74. Они восходят к двоичной кодировке ДКОИ для ЕС ЭВМ, а та, в свою очередь, основана на кодировке телеграфа.
Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, для каждого символа убрать по одному биту слева, то получится относительно читаемый текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.
Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющих определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U, таджикский — в KOI8-T.
В 1990-х годах KOI8-R стал фактически стандартом для кодирования русской кириллицы в UNIX-подобных операционных системах и электронной почте. Автор данной кодировки (RFC 1489) Андрей Чернов в начале 1990-х годов работал в компании Демос (сеть Релком) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами. КОИ-8 стала первой русской стандартизированной кодировкой в интернете.
IETF утвердил несколько RFC по вариантам кодировки KOI-8:
- RFC 1489 — KOI8-R (буквы русского алфавита);
- RFC 2319 — KOI8-U (буквы украинского алфавита);
- RFC 1345 — ISO-IR-111 (с ошибкой в определении основного диапазона).
IANA зарегистрировала кодировки в своём списке.
Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако, это требование выполняется довольно редко.
В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.
Начало таблицы кодировки (латиница) полностью соответствует кодировке ASCII.
В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.
Кодировка KOI8-R (русская). Числа под буквами — шестнадцатеричный код буквы в Юникоде.
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9. | ░ 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √ 221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | A0 | ⌡ 2321 | ° B0 | ² B2 | · B7 | ÷ F7 |
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | ╓ 2553 | ╔ 2554 | ╕ 2555 | ╖ 2556 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ╜ 255C | ╝ 255D | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | ╢ 2562 | ╣ 2563 | ╤ 2564 | ╥ 2565 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | ╫ 256B | ╬ 256C | © A9 |
C. | ю 44E | а 430 | б 431 | ц 446 | д 434 | е 435 | ф 444 | г 433 | х 445 | и 438 | й 439 | к 43A | л 43B | м 43C | н 43D | о 43E |
D. | п 43F | я 44F | р 440 | с 441 | т 442 | у 443 | ж 436 | в 432 | ь 44C | ы 44B | з 437 | ш 448 | э 44D | щ 449 | ч 447 | ъ 44A |
E. | Ю 42E | А 410 | Б 411 | Ц 426 | Д 414 | Е 415 | Ф 424 | Г 413 | Х 425 | И 418 | Й 419 | К 41A | Л 41B | М 41C | Н 41D | О 41E |
F. | П 41F | Я 42F | Р 420 | С 421 | Т 422 | У 423 | Ж 416 | В 412 | Ь 42C | Ы 42B | З 417 | Ш 428 | Э 42D | Щ 429 | Ч 427 | Ъ 42A |
Другие варианты
Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.
Кодировка KOI8-U (русско-украинская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ╝ 255D | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | ╬ 256C | © A9 |
Кодировка KOI8-RU (русско-белорусско-украинская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ў 45E | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | Ў 40E | © A9 |
Кодировка KOI8-C (Центральная Азия)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ғ 493 | җ 497 | қ 49B | ҝ 49D | ң 4A3 | ү 4AF | ұ 4B1 | ҳ 4B3 | ҷ 4B7 | ҹ 4B9 | һ 4BB | ▀ 2580 | ә 4D9 | ӣ 4E3 | ө 4E9 | ӯ 4EF |
9. | Ғ 492 | Җ 496 | Қ 49A | Ҝ 49C | Ң 4A2 | Ү 4AE | Ұ 4B0 | Ҳ 4B2 | Ҷ 4B6 | Ҹ 4B8 | Һ 4BA | ⌡ 2321 | Ә 4D8 | Ӣ 4E2 | Ө 4E8 | Ӯ 4EE |
A. | A0 | ђ 452 | ѓ 453 | ё 451 | є 454 | ѕ 455 | і 456 | ї 457 | ј 458 | љ 459 | њ 45A | ћ 45B | ќ 45C | ґ 491 | ў 45E | џ 45F |
B. | № 2116 | Ђ 402 | Ѓ 403 | Ё 401 | Є 404 | Ѕ 405 | І 406 | Ї 407 | Ј 408 | Љ 409 | Њ 40A | Ћ 40B | Ќ 40C | Ґ 490 | Ў 40E | Џ 40F |
Кодировка KOI8-T (таджикская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | қ 49B | ғ 493 | ‚ 201A | Ғ 492 | „ 201E | … 2026 | † 2020 | ‡ 2021 | ‰ 2030 | ҳ 4B3 | ‹ 2039 | Ҳ 4B2 | ҷ 4B7 | Ҷ 4B6 | ||
9. | Қ 49A | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | ™ 2122 | › 203A | ||||||
A. | ӯ 4EF | Ӯ 4EE | ё 451 | ¤ A4 | ӣ 4E3 | ¦ A6 | § A7 | « AB | ¬ AC | AD | ® AE | |||||
B. | ° B0 | ± B1 | ² B2 | Ё 401 | Ӣ 4E2 | ¶ B6 | · B7 | № 2116 | » BB | © A9 |
Кодировка KOI8-O, KOI8-S (славянская, старая орфография)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | Ђ 0402 | Ѓ 0403 | ¸ 00B8 | ѓ 0453 | „ 201E | … 2026 | † 2020 | § 00A7 | € 20AC | ¨ 00A8 | Љ 0409 | ‹ 2039 | Њ 040A | Ќ 040C | Ћ 040B | Џ 040F |
9. | ђ 0452 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | £ 00A3 | · 00B7 | љ 0459 | › 203A | њ 045A | ќ 045C | ћ 045B | џ 045F |
A. | 00A0 | ѵ 0475 | ѣ 0463 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | ® 00AE | ™ 2122 | « 00AB | ѳ 0473 | ґ 0491 | ў 045E | ´ 00B4 |
B. | ° 00B0 | Ѵ 0474 | Ѣ 0462 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | № 2116 | ¢ 00A2 | » 00BB | Ѳ 0472 | Ґ 0490 | Ў 040E | © 00A9 |
Кодировка ISO-IR-111, KOI8-E
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | 00AD | ў 045E | џ 045F |
B. | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | ¤ 00A4 | Ў 040E | Џ 040F |
Кодировка KOI8-Unified, KOI8-F
Кодировка KOI8-Unified (KOI8-F) предложена компанией «Fingertip Software»[1].
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9. | ░ 2591 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | © 00A9 | ™ 2122 | 00A0 | » 00BB | ® 00AE | « 00AB | · 00B7 | ¤ 00A4 |
A. | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | ґ 0491 | ў 045E | џ 045F |
B. | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | Ґ 0490 | Ў 040E | Џ 040F |
Кодировка KOI8-M
Кодировка KOI8-M представляла собой смесь кодировок KOI8-R и Alt (Альтернативная кодировка CP866 согласно ГОСТ 19768-87).
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ░ 2591 | ▒ 2592 | ▓ 2593 | │ 2502 | ┤ 2524 | ╡ 2561 | ╢ 2562 | ╖ 2556 | ╕ 2555 | ╣ 2563 | ║ 2551 | ╗ 2557 | ╝ 255D | ╜ 255C | ╛ 255B | ┐ 2510 |
9. | └ 2514 | ┴ 2534 | ┬ 252C | ├ 251C | ─ 2500 | ┼ 253C | ╞ 255E | ╟ 255F | ╚ 255A | ╔ 2554 | ╩ 2569 | ╦ 2566 | ╠ 2560 | ═ 2550 | ╬ 256C | ╧ 2567 |
A. | ╨ 2568 | ╤ 2564 | ╥ 2565 | ╙ 2559 | ╘ 2558 | ╒ 2552 | ╓ 2553 | ╫ 256B | ╪ 256A | ┘ 2518 | ┌ 250C | █ 2588 | ▄ 2584 | ▌ 258C | ▐ 2590 | ▀ 2580 |
B. | Ё 0401 | ё 0451 | 🮣 1FBA3 | 🮢 1FBA2 | 🮠 1FBA0 | 🮡 1FBA1 | → 2192 | ← 2190 | ↑ 2191 | ↓ 2193 | ÷ 00F7 | ± 00B1 | № 2116 | ¤ 00A4 | ■ 25A0 | 00A0 |
Некириллические варианты КОИ-8
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным.
Примечания
- ↑ KOI8 Unified // Fingertip Software site