Юнико́д — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является преобладающим в Интернете.
КОИ-8, KOI8 — восьмибитовая кодовая страница, совместимая с ASCII. Разработана для кодирования букв кириллических алфавитов. Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако ближе к 2010 году, с распространением Юникода, постепенно выходит из употребления.
UTF-8 — распространённый стандарт кодирования символов, позволяющий более компактно хранить и передавать символы Юникода, используя переменное количество байт, и обеспечивающий полную обратную совместимость с 7-битной кодировкой ASCII. Стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D.
Ара́бский алфави́т — алфавит, используемый для записи арабского языка и, чаще всего в изменённом виде, некоторых других: в частности, для записи персидского, пушту, урду, некоторых курдских диалектов, уйгурского, узбекского, казахского, киргизского в XIX веке и начале XX века и др.
Ка́ннада — дравидийский язык, распространённый в юго-западной Индии, преимущественно в штате Карнатака. Родной язык представителей народа каннара и официальный язык индийского штата Карнатака.
Диакрити́ческие зна́ки :
- в лингвистике — различные надстрочные, подстрочные, реже внутристрочные знаки, применяемые в буквенных и слоговых системах письма не как самостоятельные обозначения звуков, а для изменения или уточнения значения других знаков;
- в типографике — элементы письменности, модифицирующие начертание знаков и обычно набираемые отдельно.
Талакатту — надстрочный контактный диакритический знак письменности телугу являющийся нестрочным графом буквы акараму అ, в комбинации со знаком комму является нестрочным графом буквы укараму. Графически талакатту близок к гачеку и наро. В близком к телугу языке каннада словом талекатту обозначается надстрочная часть буквы.
- Долгий звук «А» обозначается на письме знаком диргхаму.
Джакараму или дзакараму — джа или дза, 24-я согласная буква слогового алфавита телугу. В названии కారం (cāram) означает буквально «буква». Относится к десяти согласным, в которых короткая гласная «а» слышится, но никогда не записывается, и потому надстрочный знак для «а» талакатту здесь не используется. В близком к телугу языке каннада талакатту используется всегда. При необходимости добавить диргхаму пишут జా, при необходимости оглушить "а" пишут జ్.
Кхакараму — кха, 15-я согласная буква слогового алфавита телугу, обозначает придыхательный глухой велярный взрывной согласный. В названии కారం (cāram) означает буквально «буква». Относится к десяти согласным, в которых короткая гласная «а» слышится, но никогда не записывается, и потому надстрочный знак для «а» талакатту здесь не используется. В близком к телугу языке каннада талакатту используется всегда. Подстрочный знак обозначает придыхание (ఒత్తు) и называется జడ (jada), ఒత్తు (ottu) или వొత్తు (vottu). В английском знак называют вертикальным мазком или чертой. В букве кха данный знак не является необходимым, поскольку она по начертанию отлична от క (ка), однако все остальные буквы, обозначающие придыхательные звуки требуют соответствующей маркировки. Акшара-санкхья — 2 (два). Символ юникода — U+0C16
Чхакараву — чха, буква алфавита каннада из группы чаварга, придыхательная глухая постальвеолярная аффриката. Произносится аналогично ಚ, но с сильным придыханием, в современном языке произносится с придыханием, в отличие от согласных со слабым придыханием, которые в современном языке произносятся просто без придыхания. Символ юникода — U+0C9B.
Джакараву — ಜ, джа, буква слогового алфавита каннада, звонкая постальвеолярная аффриката [ʤ]. Символ юникода — U+0C9С. Для передачи звука [z] в заимствованных словах применяется буква джакараву с двумя точками снизу - ಜ಼. ಅಕಾರ (akāra) обозначает графическую форму, символ буквы, в данном случае буквы джа (ಜಕಾರ). ವು (-ву) является окончанием именительного падежа. Буква имеет надстрочный символ талакатту, графически отличающий ее от букв «Ба» и «О»: ಬ - ಒ - ಜ и обозначающий короткую гласную «а» - ಅ. Для записи звука «дж» без «а» используется ಜ್ с добавлением символа вирама — ್, символ юникода — U+0CCD. Соответственно лигатуры с другими гласными включают в себя знак вирамы:
Тхакараву — тха, буква слогового алфавита каннада, обозначает придыхательный ретрофлексный переднеязычный глухой взрывной согласный [ṭh], который без гласного а записывается с помощью диакритического знака ್: ಠ + ್ = ಠ್. Сочетания с другими гласными:
Дхакараву — дха, четвёртая буква третьей варги алфавита каннада, обозначает придыхательный ретрофлексный звонкий альвеолярный взрывной согласный [ḍh]. Аспирированный вариант буквы ಡ. Символ юникода – U+0CA2.
Бхакараву — бха, буква алфавита каннада, обозначает придыхательный звонкий губно-губной взрывной согласный /bh/.
Макараву — ма, буква алфавита каннада, обозначает губно-губной носовой согласный /m/.
Някараву — ньа, буква алфавита каннада, ообозначает палатальный носовой согласный. Слов, начинающихся на эту букву нет, буква встречается в подстрочной форме в лигатуре «джня» — ಜ್ಞ. Символ юникода — U+0C9E.
Мурдханья накараву — ಣ, на, буква слогового алфавита каннада, обозначает ретрофлексный носовой согласный /ṇ/. Символ юникода — U+0CA3. ಮೂರ್ಧಯ (mūrdhanya) означает ретрофлексный, в отличие от переднеязычной буквы накараву ನ. ಅಕಾರ (akāra) обозначает графическую форму, символ буквы, в данном случае буквы на (ಣಕಾರ). ವು (-ву) является окончанием именительного падежа. Накараву относится к группе из десяти согласных, в которых надстрочный символ талакатту считается инкорпорированным в саму букву и потому не пишется. Буква используется для транслитерации английского n, хотя более точным фонетическим соответствием обладает звук, передаваемый буквой ನ.
Ланна, также известное как тай тхам — письмо, используемое тремя языками: юан, лы и кхынский.
Каннада — двадцать восьмой блок стандарта Юникод. Содержит символы письменности каннада для записи языков каннада и тулу.
Джхакараву — ಝ, джха, буква слогового алфавита каннада из второй варги, придыхательная звонкая постальвеолярная аффриката /ʤh/. Произносится аналогично букве ಜ, джа, но с придыханием; исторически относится к группе согласных с сильным придыханием, но в современном языке произносится просто с придыханием, в отличие от согласных со слабым придыханием, которые в современном языке произносятся без придыхания. Символ юникода — U+0C9D.