
Компью́терная лингви́стика — научное направление в области математического и компьютерного моделирования интеллектуальных процессов у человека и животных при создании систем искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.
Маши́нный перево́д — процесс автоматического перевода текста или речи с одного естественного языка на другой, осуществляемый искусственным интеллектом без участия человека. Ранние попытки использовать компьютеры для перевода строились на основе запрограммированных словарей и лингвистических правил, более современные строятся на основе вероятностного подхода — это статистический и нейронный машинный перевод.
Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники.

Типология — раздел лингвистики, занимающийся выяснением наиболее общих закономерностей различных языков, не обязательно связанных между собой общим происхождением или взаимным влиянием. Типология стремится выявить наиболее вероятные явления в различных языках. В случае если некоторое явление выявляется в представительной группе языков, оно может считаться типологической закономерностью, применимой к языку как таковому.
Статистика запросов — информация об обращениях пользователей к поисковой системе по «ключевым словам». В большинстве случаев при работе с сервисом статистики имеется возможность отсеивать результаты по географии или даже по отдельно взятому языку, а иногда и по месяцам. При этом, обычно, сервис показывает не только данные об искомом запросе, но также и о словосочетаниях, синонимах и близких темах.
Часто́тный слова́рь — набор слов данного языка вместе с информацией об их частотности. Словарь может быть отсортирован по частотности, по алфавиту, по группам слов, по типичности, и т. д. Частотные списки используются для преподавания языка, создания новых словарей, приложений компьютерной лингвистики, исследований в области лингвистической типологии, и т. д.
Сте́мминг — это процесс нахождения основы слова для заданного исходного слова. Основа слова не обязательно совпадает с морфологическим корнем слова.
«Диало́г» — главная российская конференция по компьютерной лингвистике с международным участием.
Инвертированный индекс — структура данных, в которой для каждого слова коллекции документов в соответствующем списке перечислены все документы в коллекции, в которых оно встретилось. Инвертированный индекс используется для поиска по текстам.

Пи́сьменный ко́рпус тата́рского языка́ — электронный корпус татарского языка, доступный для онлайн пользования. Корпус предназначен интересующимся системой, состоянием и перспективой татарского языка. Он необходим лингвистам, изучающим татарский язык в рамках корпусной лингвистики.
Сайт открыт 15 марта 2012 года. Текущий адрес http://corpus.tatar.
Доступен на татарском, русском и английском языках.
Корпус современного американского английского — электронный корпус текстов, созданный профессором корпусной лингвистики Марком Дэвисом из Brigham Young University в 2000—2003 годах на основе текстов журнала Time, написанных с 1923 года.
В лингвистике кóрпус — подобранная и обработанная по определённым правилам совокупность текстов, используемых в качестве базы для исследования языка. Они используются для статистического анализа и проверки статистических гипотез, подтверждения лингвистических правил в данном языке. Корпус текстов является предметом исследования корпусной лингвистики.
Дистрибути́вная сема́нтика — это область лингвистики, которая занимается вычислением степени семантической близости между лингвистическими единицами на основании их распределения (дистрибуции) в больших массивах лингвистических данных.
Брита́нский национа́льный ко́рпус — это корпус текстов из 100 миллионов слов, содержащий образцы письменного и разговорного британского английского языка из широкого круга источников. Корпус охватывает британский английский конца XX века, представленный широким разнообразием жанров, и задуман как образец типичного разговорного и письменного британского английского языка того времени.
Семантический поиск — способ и технология поиска информации, основанная на использовании контекстного (смыслового) значения запрашиваемых фраз, вместо словарных значений отдельных слов или выражений при поисковом запросе. Улучшение результатов поиска при обработке запросов достигается за счет более точной интерпретации поисковых намерений пользователя.
Национальный корпус американского английского — корпус текстов американского английского языка, содержащий 22 миллиона слов из письменных и устных источников, вышедших с 1990 года. ANC включает в себя ряд текстов из новых источников, включая такие как электронная почта, твиты и тексты с веб-страниц, которые не включены в более ранние корпуса английского языка, такие как Британский национальный корпус. В нём осуществлён частеречный конкорданс с лемматизацией, включая имена собственные, и поверхностный синтаксический анализ.
СинТагРус — глубоко аннотированный корпус текстов русского языка, первый корпус русских текстов с синтаксической разметкой. Разрабатывается с 1998 года Лабораторией компьютерной лингвистики ИППИ РАН в сотрудничестве с Сектором теоретической семантики ИРЯ РАН. Корпус состоит из текстов различных жанров; общее количество словоупотреблений составляет более 1,5 миллионов.
Никола́й Ви́кторович Перцо́в — советский и российский лингвист, литературовед. Один из участников разработки лингвистической теории «Смысл ↔ Текст» Игоря Мельчука. Доктор филологических наук, ведущий научный сотрудник Института русского языка имени В. В. Виноградова Российской академии наук.
Герольд Георгиевич Белоногов — известный советский и российский ученый в области информатики, компьютерной лингвистики, автоматической обработки текстов, доктор технических наук (1968), профессор, академик Международной академии информационных процессов и технологий. Он был одним из основоположников отечественной информатики, признанный как у нас в стране, так и за рубежом. В 1994—95 годах состоял членом ASIS. В 1996 году Международный биографический центр присвоил ему звание «Международный человек года» за выдающиеся успехи в области машинного перевода и наградил памятной медалью.
Конкордансер — компьютерная программа для автоматического составления конкорданса, то есть списка примеров употребления слова в минимальном контексте, или перечня всех контекстов, в которых слово или словосочетание встречается в исследуемом тексте. Конкордансеры используют для обработки информации в текстовом корпусе, они позволяют осуществлять поиск в тексте подобно тому, как поисковые системы ищут информацию в Сети.