
Джи́ттер или фазовое дрожание цифрового сигнала данных — нежелательные фазовые или частотные отклонения передаваемого сигнала. Возникают вследствие нестабильности задающего генератора, изменений параметров линии передачи во времени и различной скорости распространения частотных составляющих одного и того же сигнала.
IP-телефони́я — телефонная связь по протоколу IP. Под IP-телефонией подразумевается набор коммуникационных протоколов, технологий и методов, обеспечивающих традиционные для телефонии набор номера, дозвон и двустороннее голосовое общение, а также видеообщение по сети Интернет или любым другим IP-сетям. Сигнал по каналу связи передаётся в цифровом виде и, как правило, перед передачей преобразовывается (сжимается), чтобы удалить избыточность информации и снизить нагрузку на сеть передачи данных.

Шумопонижение — процесс устранения шумов из полезного сигнала с целью повышения его субъективного качества или для уменьшения уровня ошибок в каналах передачи и системах хранения цифровых данных. Методы шумоподавления концептуально очень похожи независимо от обрабатываемого сигнала, однако предварительное знание характеристик передаваемого сигнала может значительно повлиять на реализацию этих методов в зависимости от типа сигнала.
T.38 — стандарт Международного союза электросвязи для передачи факсимильных сообщений в реальном времени по IP-сетям.
IAX2 — Inter-Asterisk eXchange protocol — протокол обмена VoIP данными между IP-PBX Asterisk. Наиболее приспособлен к трансляции сетевых адресов NAT, в отличие от SIP и H.323 использует только один порт 4569 протокола UDP для сигнализации и медиапотока, тогда как последние используют для этих целей разные порты. Данный протокол позволяет существенно экономить сетевой трафик по сравнению с протоколом SIP, что объясняется передачей сигнальной информации в битовых полях, а не текстом. Так же протокол позволяет совмещать множество голосовых потоков и передавать их внутри единого транка, уменьшая накладные расходы, связанные с передачей заголовков IP-пакетов.

Воко́дер — устройство синтеза речи на основе произвольного сигнала с богатым спектром. Изначально вокодеры были разработаны в целях экономии частотных ресурсов радиолинии системы связи при передаче речевых сообщений. Экономия достигается за счёт того, что вместо собственно речевого сигнала передают только значения его определённых параметров, которые на приёмной стороне управляют синтезатором речи. Основу синтезатора речи составляют три элемента:
- генератор тонального сигнала для формирования гласных звуков;
- генератор шума для формирования согласных;
- и система формантных фильтров для воссоздания индивидуальных особенностей голоса.
G.723.1 — один из базовых кодеков для приложений IP-телефонии. Утверждён ITU-T в рекомендации G.723.1 в ноябре 1995 года. Выбран форумом IMTC как базовый для приложений IP-телефонии.

Speex — свободный кодек для сжатия речевого сигнала, который может использоваться в приложениях «голос-через-интернет» (VoIP). С высокой вероятностью он не имеет никаких патентных ограничений и лицензирован под последней версией лицензии BSD. Сжатые кодеком Speex данные можно хранить либо в формате хранения звуковых данных Ogg, либо передавать напрямую с помощью пакетов UDP/RTP.
G.729А, он же G.729 Annex A — алгоритм сжатия звука преимущественно для передачи голоса. За счёт отказа от операций с плавающей запятой алгоритм работает быстрее, чем G.729, однако при этом незначительно ухудшается качество декодированных аудиоданных.
Распознавание речи — автоматический процесс преобразования речевого сигнала в цифровую информацию. Обратной задачей является синтез речи.
Интерфейс безмолвного доступа — системы обработки речи, базирующиеся на получении и обработке речевых сигналов на ранней стадии артикулирования.
DTX — прерывистая передача, выключение передатчика на время пауз в разговоре. Оптимизирует полную эффективность беспроводного голосового канала. В типичной двухсторонней беседе за всё время разговора каждый собеседник говорит в среднем около 35..40 % времени. Наиболее важной компонентой DTX является VAD. Если сигнал передатчика включен только во время периодов реплик, рабочий цикл передатчика может быть сокращен более чем на 50%. Преимущества DTX: экономия электроэнергии/сохранение заряда батареи, ослабление рабочей нагрузки компонентов в усилителях передатчика и уменьшение интерференции.
Комфортный шум — искусственно создаваемый фоновый шум, используемый при голосовых телекоммуникациях с целью заполнить молчание в передаче. Отключение комфортного шума раздражает абонента и снижает разборчивость речи. Комфортный шум также сигнализирует о том, что сеанс связи не окончен.
Клонирование голоса — это технология, реализующая изменение голоса человека, производимая с помощью программно-аппаратных средств, в режиме как реального времени, так и в отложенном пакетном режиме.
Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.
Эхоподавление — термин используется в телефонии. Представляет собой процесс удаления эха из передаваемых звуков для повышения качества передачи голоса по телефону. В дополнение к улучшению субъективного качества, эхоподавление увеличивает пропускную способность канала связи за счет подавления пауз, предотвращая распространение эха по сети.
2G — аббревиатура для обозначения второго поколения беспроводной телефонной технологии.

Крик — психомоторная активность, направленная на создание громкого голосового сигнала.
Линейное предсказание со смешанным возбуждением — стандарт кодирования речи Министерства обороны США, используемый в военных целях, в спутниковой связи и радиозащищённых устройствах. Его стандартизация и последующая разработка были поддержаны Агентством национальной безопасности США и НАТО.

Эффект Ломба́рда — непроизвольное повышение уровня голоса у человека и других животных, использующих звук для общения, в условиях громкого шума. Изменениям подвергается не только громкость, но и высота голоса, продолжительность отдельных слогов. Благодаря эффекту повышается разборчивость речи в условиях шума.