ZX Spectrum — 8-разрядный домашний компьютер, созданный британской компанией «Sinclair Research Ltd» на основе микропроцессора Zilog Z80. В ходе разработки компьютер назывался «ZX81 Colour» и «ZX82», название «ZX Spectrum» должно было подчеркнуть одно из главных отличий от его предшественника ZX81 — цветное изображение. Почитатели этого компьютера часто называют его «Спекки».
Автоматизи́рованный перево́д — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством. CAT-программы предлагают доступ к словарям, глоссариям, запоминают выбор переводчика и в следующих схожих файлах автоматически подставляют перевод ранее переведенных слова. Данные программы помогают сократить время работы переводчиков над однотипными текстами, а также сокращают процент грамматических, пунктуационных и орфографических ошибок.
Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники.
Электро́нная кни́га — версия книги, хранящаяся в электронном виде, и показываемая на экране, в цифровом формате.
Виртуальный собеседник, программа-собеседник, чат-бот — программа, которая выясняет потребности пользователей, а затем помогает удовлетворить их. Автоматическое общение с пользователем ведется с помощью текста или голоса. Чат бот ведет коммуникацию от лица компании или бренда с целью упростить онлайн-общение, используется как альтернатива переписке с живым оператором или звонку менеджеру компании.
Вопросно-ответная система — информационная система, способная принимать вопросы и отвечать на них на естественном языке, другими словами, это система с естественно-языковым интерфейсом.
PAQ — серия свободных архиваторов с текстовым интерфейсом, которые общими усилиями разработчиков поднялись в первые места рейтингов многих тестов сжатия данных. Лучший результат в этой серии на большинстве тестов был получен архиватором PAQ8JD, созданным совместными усилиями Мэтта Махони, Александра Ратушняка, Сергея Оснача, Пшемыслава Скибиньского и Билла Петтиса, и выпущенным 30 декабря 2006 года. Однако в некоторых тестах он отстаёт от WinRK в режиме PWCM. PWCM — сторонняя проприетарная реализация алгоритма PAQ. Специально настроенные версии алгоритма PAQ выиграли призы в конкурсах Приз Хаттера и Калгари Корпус Челлендж.
В вычислительной технике diff — утилита сравнения файлов, выводящая разницу между двумя файлами. Эта программа выводит построчно изменения, сделанные в файле. Современные реализации поддерживают также двоичные файлы. Вывод утилиты называется «diff», или, что более распространено, патч, так как он может быть применён с программой patch. Вывод других утилит сравнения файлов также часто называется «diff».
Разрешение лексической многозначности — это неразрешенная проблема обработки естественного языка, которая заключается в задаче выбора значения многозначного слова или словосочетания в зависимости от контекста, в котором оно находится. Данная задача возникает в дискурсивном анализе, при оптимизации релевантности результатов поисковыми системами, при разрешении анафорических отсылок, в исследовании лингвистической когерентности текста, при анализе умозаключений.
RJ TextEd — это бесплатный текстовый редактор для операционной системы Microsoft Windows. Текстовый редактор был создан Рикардом Йоханссоном в 2004 году и написан на Object Pascal.
Микротипографика — это совокупность методов улучшения читаемости и внешнего вида текстов, особенно выровненных по ширине. Посредством этих методов уменьшается количество слишком широких расстояний между словами и сдвигаются некоторые строки для более равномерного распределения текста по странице.
Компью́терная лексикогра́фия — прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей. Это временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям.
Sublime Text — проприетарный текстовый редактор. Поддерживает плагины на языке программирования Python.
Корпус современного американского английского — электронный корпус текстов, созданный профессором корпусной лингвистики Марком Дэвисом из Brigham Young University в 2000—2003 годах на основе текстов журнала Time, написанных с 1923 года.
MetaTexis — система автоматизированного перевода, разработанная в 2002 году немецкой компанией MetaTexis Software and Services.
Org-mode это режим редактирования и организации заметок, планирования, и разработки в свободном текстовом редакторе Emacs. Название используется для обозначения текстовых файлов («org-файлов»), которые включают в себя простые метки для обозначения уровней иерархии, и редактор с функциями, который может читать разметку и манипулировать иерархией элементов.
Гомоикони́чность — свойство некоторых языков программирования, в которых структура программы похожа на его синтаксис, и поэтому внутреннее представление программы можно определить, прочитав текстовую разметку. Если язык гомоиконичен, это означает, что текст программы имеет такую же структуру, как её абстрактное синтаксическое дерево. Это позволяет всему коду на языке быть доступным и обработанным в качестве данных, используя одно и то же представление.
Wordfast — семейство программ, выполняющих автоматизированный перевод, поддерживающих память переводов. Подобно другим программам этого класса, например, SDL Trados, MemoQ, Déjà Vu, OmegaT позволяет выполнять сегментацию исходного текста на основе регулярных выражений, использовать точные и неточные соответствия с уже переведёнными фрагментами, создавать и использовать глоссарии терминов, выравнивать ранее выполненные переводы с загрузкой в базу данных переводов, искать контексты в базах данных переводов, работать с ключевыми словами и т.д.
Коранический корпус арабского языка — доступный для поиска электронный онлайн-корпус текстов Корана, включающий 77 430 арабских слов. Целью проекта является предоставление морфологических и синтаксических данных для исследователей, желающих изучить классический арабский язык.
Ключ 125 — ключ Канси со значением «старый»; один из 29, состоящих из шести штрихов.