Автоматизи́рованный перево́д — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством. CAT-программы предлагают доступ к словарям, глоссариям, запоминают выбор переводчика и в следующих схожих файлах автоматически подставляют перевод ранее переведенных слова. Данные программы помогают сократить время работы переводчиков над однотипными текстами, а также сокращают процент грамматических, пунктуационных и орфографических ошибок.
Позволяет быстро найти нужное слово, часто с учётом морфологии и возможностью поиска словосочетаний, а также с возможностью изменения направления перевода.
Дзонг-кэ — официальный язык Королевства Бутан, относящийся к сино-тибетской языковой семье и по своей структуре наиболее близкий тибетскому; очень близким к дзонг-кэ является также сиккимский язык.
Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста. Большие собрания параллельных текстов называются «параллельным корпусом». Выравнивание параллельного корпуса на уровне предложений является необходимой предпосылкой для различных аспектов лингвистических исследований. В процессе перевода предложения могут разделяться, сливаться, удаляться, вставляться или менять последовательность. В связи с этим выравнивание часто становится сложной задачей.
Клонирование голоса — это технология, реализующая изменение голоса человека, производимая с помощью программно-аппаратных средств, в режиме как реального времени, так и в отложенном пакетном режиме.

Разрешение лексической многозначности — это неразрешенная проблема обработки естественного языка, которая заключается в задаче выбора значения многозначного слова или словосочетания в зависимости от контекста, в котором оно находится. Данная задача возникает в дискурсивном анализе, при оптимизации релевантности результатов поисковыми системами, при разрешении анафорических отсылок, в исследовании лингвистической когерентности текста, при анализе умозаключений.
Если методы обучения без учителя в проблеме разрешения многозначности полагаются на неаннотированный (неразмеченный) корпус, то обучение с учителем коренным образом зависят от размеченного корпуса тестов. Проблема получения достаточного количества знаний является одной из самых главных преград в реализации высокоэффективных алгоритмов обучения. Однако, если алгоритм реализуется не такими крупными с точки зрения ресурсов мероприятиями, как Senseval, а более мелкая, то в подобных случаях получение качественно размеченного корпуса не представляется возможным из-за огромных трудозатрат, которые необходимы для осуществления этого процесса вручную. Поэтому перед исследователями, нуждающимися в подобных корпусах, встала задача получения размеченного корпуса автоматически.
Шотландский английский включает в себя варианты английского языка, на которых говорят в Шотландии. Некоторые исследователи считают эти варианты диалектами скотс, но все сходятся в том, что шотландский английский ни в коей мере не является вариантом гэльского. Основной вариант шотландского английского называется «шотландский стандартный английский» или «стандартный шотландский английский». Эти названия часто обозначаются аббревиатурой SSE.
N-грамма — последовательность из n элементов. С семантической точки зрения это может быть последовательность звуков, слогов, слов или букв. На практике чаще встречается N-грамма как ряд слов, устойчивые словосочетания называют коллокацией. Последовательность из двух последовательных элементов часто называют биграмма, последовательность из трёх элементов называется - триграмма. Не менее четырёх и выше элементов обозначается как N-грамма, N заменяется на количество последовательных элементов.
Синхронный автоматический перевод — «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Мобильный перевод — сервис, предлагающий синхронный машинный перевод речи, с одного естественного языка на другой, который доступен на мобильных устройствах.

General Architecture for Text Engineering — система обработки естественного языка с открытым исходным кодом, использующая наборы компонентов на языке Java. Система изначально была разработана в Университете Шеффилда и развивается с 1995 г.
Мангеймский корпус немецкого языка — это коллекция современных немецкоязычных текстов, поддерживаемая Институтом немецкого языка в городе Маннгейм (Германия). В корпусе представлены различные типы текстов: научная и научно-популярная литература, большое количество газетных текстов, художественная проза, и др. Представляя собой самое большое в мире электронное собрание современных немецкоязычных текстов, является инструментом корпусной лингвистики.
Корпус современного американского английского — электронный корпус текстов, созданный профессором корпусной лингвистики Марком Дэвисом из Brigham Young University в 2000—2003 годах на основе текстов журнала Time, написанных с 1923 года.
Брита́нский национа́льный ко́рпус — это корпус текстов из 100 миллионов слов, содержащий образцы письменного и разговорного британского английского языка из широкого круга источников. Корпус охватывает британский английский конца XX века, представленный широким разнообразием жанров, и задуман как образец типичного разговорного и письменного британского английского языка того времени.

Джон Кристофер Уэллс — британский лингвист, фонетист, преподаватель эсперанто. Почётный профессор Университетского колледжа Лондона.

Коранический корпус арабского языка — доступный для поиска электронный онлайн-корпус текстов Корана, включающий 77 430 арабских слов. Целью проекта является предоставление морфологических и синтаксических данных для исследователей, желающих изучить классический арабский язык.
Национальный корпус американского английского — корпус текстов американского английского языка, содержащий 22 миллиона слов из письменных и устных источников, вышедших с 1990 года. ANC включает в себя ряд текстов из новых источников, включая такие как электронная почта, твиты и тексты с веб-страниц, которые не включены в более ранние корпуса английского языка, такие как Британский национальный корпус. В нём осуществлён частеречный конкорданс с лемматизацией, включая имена собственные, и поверхностный синтаксический анализ.

Балаболка — бесплатная программа с закрытым исходным кодом для озвучивания текстов при помощи синтезаторов речи (text-to-speech). Программа разработана российским программистом И.В. Морозовым. Среда функционирования — операционные системы семейства Microsoft Windows.
Вера Исааковна Подлесская — российский лингвист, японист, доктор филологических наук, профессор Российского государственного гуманитарного университета, главный научный сотрудник Института языкознания РАН.