Паде́ж в языках флективного (синтетического) или агглютинативного строя — словоизменительная грамматическая категория именных и местоименных частей речи и близких к ним гибридных частей речи, выражающая их синтаксическую и/или семантическую роль в предложении. Падеж является одним из средств выражения синтаксической зависимости имени, выражаемым при подчиненном имени. Другими средствами выражения синтаксической зависимости и семантической роли являются предлоги и послелоги, порядок слов, контактное расположение синтаксических групп. В конкретных языках мира обычно наблюдается своя сбалансированная конфигурация средств выражения синтаксических зависимостей.
Перево́д — деятельность по интерпретации смысла текста на одном языке и созданию нового эквивалентного ему текста на другом языке . Изначально существовал только ручной перевод. С XX в. существуют попытки автоматизировать перевод на естественных языках или использовать компьютеры в качестве вспомогательных средств при переводе (автоматизированный перевод.

Викислова́рь — свободно пополняемый многофункциональный многоязычный словарь и тезаурус, основанный на вики-движке. Один из проектов фонда «Викимедиа». Изначально появился на английском языке 12 декабря 2002 года.
Маши́нный перево́д — процесс автоматического перевода текста или речи с одного естественного языка на другой, осуществляемый искусственным интеллектом без участия человека. Ранние попытки использовать компьютеры для перевода строились на основе запрограммированных словарей и лингвистических правил, более современные строятся на основе вероятностного подхода — это статистический и нейронный машинный перевод.
Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники.
Теория «Смысл — Текст» — лингвистическая концепция, созданная И. А. Мельчуком и представляющая язык как многоуровневую модель преобразований смысла в текст и обратно ; отличительной особенностью этой теории является также использование синтаксиса зависимостей. Значительна роль, отводимая лексическому компоненту модели — Толково-комбинаторному словарю.
PROMT — российская компания, разработчик систем машинного перевода; занимается исследованиями и разработками в области искусственного интеллекта. Основные направления работы — разработка решений для машинного (автоматического) перевода и технологий для анализа текстовых неструктурированных данных на русском и иностранных языках.
Парсер, или синтаксический анализатор, — часть программы, преобразующей входные данные в структурированный формат. Парсер выполняет синтаксический анализ текста.
Зоя Михайловна Шаляпина — российский лингвист и педагог. Заведующий Отделом языков народов Азии и Африки Института востоковедения РАН, кандидат филологических наук. Имеет более 150 научных публикаций.
Синхронный автоматический перевод — «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Гибридный машинный перевод — интеграция разных подходов машинного перевода из возможных вариантов МП:
- Rule-based machine translation (RBMT) — Машинный перевод на основе правил.
- Corpus-based machine translation (CBMT) — Машинный перевод на корпусах текстов.
- Example-based machine translation (EBMT) Машинный перевод на примерах.
- Statistical machine translation (SMT) — Статистический машинный перевод.
В лингвистике кóрпус — подобранная и обработанная по определённым правилам совокупность текстов, используемых в качестве базы для исследования языка. Они используются для статистического анализа и проверки статистических гипотез, подтверждения лингвистических правил в данном языке. Корпус текстов является предметом исследования корпусной лингвистики.
Ле́йпцигские пра́вила глосси́рования — предложенный для унифицированного использования при представлении языковых примеров в лингвистических работах набор правил глоссирования. Включает как собственно правила оформления интерлинеарных глосс, так и список рекомендуемых сокращений, используемых для обозначения грамматических категорий.
Нейронный машинный перевод — это подход к машинному переводу, в котором используется большая искусственная нейронная сеть. Он отличается от методов машинного перевода, основанных на статистике фраз, которые используют отдельно разработанные подкомпоненты.
Досло́вный перево́д — вид перевода с одного языка на другой, при котором в тексте на переводящем языке максимально точно сохраняется синтаксическая структура и порядок слов и словоформ исходного языка.
Машинный перевод на основе примеров — это метод машинного перевода, который часто характеризуется использованием двуязычного корпуса с параллельными текстами в качестве основной базы знаний во время выполнения перевода. По сути, это перевод по аналогии, который может рассматриваться как применение метода рассуждений на основе прецедентов к машинному обучению.
Машинный перевод на основе трансформации является разновидностью машинного перевода (MП). В настоящее время это один из наиболее распространённых методов машинного перевода. В отличие от более простой модели прямого MП, MП на основе трансформации разделяет процесс перевод на три этапа: анализ текста на исходном языке для определения его грамматической структуры, перевод результирующей структуры в структуру, подходящую для производства текста на языке перевода, и генерацию текста. Таким образом, системы МП на основе трансформации способны использовать знания исходного языка и языка перевода.
Индукция грамматики — процедура машинного обучения, которая восстанавливает формальную грамматику языка на основе набора наблюдений (примеров) с известной принадлежностью этому языку. В результате процедуры строится модель наблюдаемых объектов в виде набора правил вывода или порождающих правил, конечного автомата или автомата другого вида. В более общем смысле, грамматический вывод — это одно из направлений машинного обучения, в котором пространство примеров состоит из дискретных комбинаторных объектов, таких как строки, деревья, графы.
СинТагРус — глубоко аннотированный корпус текстов русского языка, первый корпус русских текстов с синтаксической разметкой. Разрабатывается с 1998 года Лабораторией компьютерной лингвистики ИППИ РАН в сотрудничестве с Сектором теоретической семантики ИРЯ РАН. Корпус состоит из текстов различных жанров; общее количество словоупотреблений составляет более 1,5 миллионов.
Герольд Георгиевич Белоногов — известный советский и российский ученый в области информатики, компьютерной лингвистики, автоматической обработки текстов, доктор технических наук (1968), профессор, академик Международной академии информационных процессов и технологий. Он был одним из основоположников отечественной информатики, признанный как у нас в стране, так и за рубежом. В 1994—95 годах состоял членом ASIS. В 1996 году Международный биографический центр присвоил ему звание «Международный человек года» за выдающиеся успехи в области машинного перевода и наградил памятной медалью.