Лингви́стика, языкозна́ние, языкове́дение — наука, изучающая язык. Это наука о естественном человеческом языке вообще и обо всех языках мира как его индивидуализированных представителях.
Фоне́ма — минимальная смыслоразличительная единица языка. Фонема не имеет самостоятельного лексического или грамматического значения, но служит для различения и отождествления значимых единиц языка :
- при замене одной фонемы на другую получится другое слово ;
- при изменении порядка следования фонем также получится другое слово ;
- при удалении фонемы также получится другое слово.
Фоне́тика — раздел лингвистики, изучающий явления языкового процесса, связанные с производством и восприятием звуков, движением артикуляционных органов и процессами в слуховом аппарате, либо аналогичными моторно-зрительными явлениями, применительно к жестовым языкам.
Фоноло́гия — раздел лингвистики, изучающий структуру звукового строя языка и функционирование звуков в языковой системе. Основной единицей фонологии является фонема, основным объектом исследования — противопоставления (оппозиции) фонем, образующие в совокупности фонологическую систему языка.
Речево́й звук — звук, образуемый произносительным аппаратом человека с целью языкового общения.
Си́нтез ре́чи — в широком смысле — восстановление формы речевого сигнала по его параметрам; в узком смысле — формирование речевого сигнала по печатному[уточнить] тексту. Часть искусственного интеллекта.
Артикуляционные жесты — двигательные акты, с помощью которых реализуется в речи целевая артикуляция. Они являются комплексными и включают в себя координированное движение всех речевых органов, которые участвуют в артикуляции.
Грамма́тика как наука является разделом языкознания (лингвистики), который изучает грамматический строй языка, закономерности построения правильных, осмысленных речевых отрезков на этом языке. Эти закономерности грамматика формулирует в виде общих грамматических правил.
Оптическое распознавание символов — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере. Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.
Распознавание речи — автоматический процесс преобразования речевого сигнала в цифровую информацию. Обратной задачей является синтез речи.
Голосовое управление — способ взаимодействия с устройством при помощи голоса. В отличие от распознавания речи, голосовое управление предназначено для ввода управляющих команд — например, «открыть файл», «показать погоду на завтра», «выключить звук». И хотя с помощью системы голосового управления можно вводить и контент, такой ввод будет крайне некомфортным, поскольку оператору придётся делать четкие паузы между отдельными словами.
eSpeak это компактный свободный программный синтезатор речи, поддерживающий Speech Synthesis Markup Language (SSML). В настоящее время исходный проект находится в неактивном состоянии в связи с исчезновением его автора Джонатана Даддингтона. Сообществом разрабатывается его форк eSpeakNG
Интерфейс безмолвного доступа — системы обработки речи, базирующиеся на получении и обработке речевых сигналов на ранней стадии артикулирования.
Ленингра́дская (Петербу́ргская) фонологи́ческая шко́ла (ЛФШ) — одно из направлений в современной фонологии, возникших на основе учения И. А. Бодуэна де Куртенэ о фонеме. Основателем школы является Л. В. Щерба. Среди других её представителей — Л. Р. Зиндер, Л. В. Бондарко, М. И. Матусевич.
Голосовой поиск — технология распознавания речи, позволяющая осуществлять перевод речевого запроса пользователя в текстовый вид, который затем передается в стандартную систему поиска по базе данных.
VoiceXML — один из открытых стандартов W3C на основе XML-языка, протокол, диалоговый язык разметки.
Синхронный автоматический перевод — «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Halcyon — домашняя игровая система, разработанная RDI Video Systems. Предполагалось, что система будет выпущена в январе 1985 года. Начальная розничная цена должна была составить $2500, что по меркам того времени было очень дорого. Было выпущено всего несколько прототипов для демонстрации её возможностей, готовая система так и не поступила в продажу из-за отсутствия доступных проигрывателей лазерных дисков. В дальнейшем финансирование со стороны инвесторов было прекращено.
Yandex SpeechKit — технология распознавания речи и синтеза речи от российской компании Яндекс.
Бори́с Мефодьевич Лоба́нов — советский и белорусский учёный в области технической кибернетики. Разработал теоретические основы и методы анализа, синтеза и распознавания речи. Разработал первые в СССР устройства для синтеза русской и белорусской речи. Автор более 300 научных работ по проблемам анализа, распознавания и синтеза речи. Автор трёх глав первого справочника по искусственному интеллекту, изданного в СССР, посвящённых системам речевого общения. Совершил ряд изобретений в данной сфере.