Текст — зафиксированная на каком-либо материальном носителе человеческая мысль; в общем плане связная и полная последовательность символов.
Компиля́тор — программа, переводящая написанный на языке программирования текст в набор машинных кодов.
Си́нтаксис — раздел лингвистики, в котором изучаются номинативные и коммуникативные языковые единицы: предложение и словосочетание. Синтаксис в буквальном переводе означает не только составление, но и упорядочивание, координирование, соединение слов в связный текст. Этот раздел науки о языке изучает лексическое и грамматическое значение словосочетаний, а также виды синтаксической связи.
Докуме́нт — это зафиксированная на материальном носителе информация в виде текста, звукозаписи или изображения с реквизитами, позволяющими её идентифицировать.
Тео́рия госуда́рства и пра́ва — фундаментальная юридическая наука, изучающая сущность, наиболее общие закономерности и тенденции происхождения, развития и функционирования государства и права в их постоянном взаимодействии, формирующая общие для всех юридических наук понятия и категории. Научное исследование в теории государства и права ведётся не по отдельно взятой стране и исторической эпохе, а с ориентацией на наиболее развитые в настоящий момент формы права и государственности.
Перево́д — деятельность по интерпретации смысла текста на одном языке и созданию нового эквивалентного ему текста на другом языке . Изначально существовал только ручной перевод. С XX в. существуют попытки автоматизировать перевод на естественных языках или использовать компьютеры в качестве вспомогательных средств при переводе (автоматизированный перевод.
Зна́ки препина́ния — элементы письменности, выполняющие вспомогательные функции разделения (выделения) смысловых отрезков текста, предложений, словосочетаний, слов, частей слова, указания на грамматические и логические отношения между словами, указания на коммуникативный тип предложения, его эмоциональную окраску, законченность, а также некоторые иные функции.
Нау́чный стиль — функциональный стиль речи литературного языка, которому присущ ряд особенностей: предварительное обдумывание высказывания, монологический характер, строгий отбор языковых средств, тяготение к нормированной речи.
Технический перевод — перевод, используемый для обмена специальной научно-технической информацией между людьми, говорящими на разных языках. При упрощенном подходе под техническим переводом понимают перевод технических текстов.
Трансдукция — один из видов языковой трансформации, при котором происходит перекодирование исходного текста на одном языке и генерирование вторичного текста на другом языке, которые, в отличие от традиционного перевода, производятся при условии отхода от сигнификативного прагматического значения исходного текста и сохранения денотативного значения всей информации. Трансдукция лежит в основе реферативного перевода.
Обработка текстов на естественном языке — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза текстов на естественных языках. Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста.
Рера́йтинг — обработка исходных текстовых материалов в целях их дальнейшего использования. В отличие от копирайтинга, за основу берётся уже написанный текст, который переписывается своими словами с сохранением смысла. Специалистов по лексическому изменению оригинальных текстов называют рерайтерами.
Интона́ция — совокупность просодических характеристик предложения: тона, громкости, темпа речи и её отдельных отрезков, ритмики, особенностей фонации.
Досло́вный перево́д — вид перевода с одного языка на другой, при котором в тексте на переводящем языке максимально точно сохраняется синтаксическая структура и порядок слов и словоформ исходного языка.
Машинный перевод на основе примеров — это метод машинного перевода, который часто характеризуется использованием двуязычного корпуса с параллельными текстами в качестве основной базы знаний во время выполнения перевода. По сути, это перевод по аналогии, который может рассматриваться как применение метода рассуждений на основе прецедентов к машинному обучению.
Машинный перевод на основе трансформации является разновидностью машинного перевода (MП). В настоящее время это один из наиболее распространённых методов машинного перевода. В отличие от более простой модели прямого MП, MП на основе трансформации разделяет процесс перевод на три этапа: анализ текста на исходном языке для определения его грамматической структуры, перевод результирующей структуры в структуру, подходящую для производства текста на языке перевода, и генерацию текста. Таким образом, системы МП на основе трансформации способны использовать знания исходного языка и языка перевода.
Коге́зия — в лингвистике грамматическая и лексическая связность текста или предложения, которая соединяет их в единое целое и придаёт им смысл; одна из определяющих характеристик текста/дискурса и одно из необходимых условий текстуальности. Одно из основных понятий теории лингвистики текста. В современной лингвистике текста принимают во внимание текстообразующие потенции когезии в области формирования не только структурной, но и смысловой (содержательной) целостности речевого произведения. В российской лингвистике, помимо термина «когезия», традиционно используется также термин «связность» (текста). Когезию называют также структурной связностью текста.
Герольд Георгиевич Белоногов — известный советский и российский ученый в области информатики, компьютерной лингвистики, автоматической обработки текстов, доктор технических наук (1968), профессор, академик Международной академии информационных процессов и технологий. Он был одним из основоположников отечественной информатики, признанный как у нас в стране, так и за рубежом. В 1994—95 годах состоял членом ASIS. В 1996 году Международный биографический центр присвоил ему звание «Международный человек года» за выдающиеся успехи в области машинного перевода и наградил памятной медалью.
Автомати́ческое рефери́рование, анноти́рование или суммариза́ция — создание краткой версии текстового документа с помощью компьютерной программы.
Аннотирование — это процесс аналитико-синтетической переработки информации первичного документа, целью которого является получение обобщенной характеристики документа, раскрывающей его логическую структуру, наиболее существенные стороны содержания и достоинства.