Генети́ческий код — совокупность правил, согласно которым в живых клетках последовательность кодонов переводится в последовательность аминокислот (белков). Собственно перевод (трансляцию) осуществляет рибосома, которая соединяет аминокислоты в цепочку согласно инструкции, записанной в кодонах мРНК. Соответствующие аминокислоты доставляются в рибосому молекулами тРНК. Генетический код всех живых организмов Земли един, что свидетельствует о наличии общего предка.
Кодо́н — единица генетического кода, тройка нуклеотидных остатков (триплет) в ДНК или РНК, обычно кодирующих включение одной аминокислоты. Последовательность кодонов в гене определяет последовательность аминокислот в полипептидной цепи белка, кодируемого этим геном.
Митохондриа́льная ДНК (мтДНК) — ДНК, находящаяся в митохондриях, органеллах эукариотических клеток.
Открытая рамка считывания — последовательность нуклеотидов в составе ДНК или РНК, потенциально способная кодировать белок. Основным признаком наличия ORF служит отсутствие стоп-кодонов на достаточно длинном участке последовательности после стартового кодона. Поскольку в некоторых случаях стартовый и терминирующие кодоны отличаются от канонических, а также ввиду возможности супрессии стоп-кодонов при трансляции у некоторых организмов, при определении рамки считывания применяются алгоритмы, которые учитывают эти различия.
Ма́тричная рибонуклеи́новая кислота́ — РНК, содержащая информацию о первичной структуре белков. мРНК синтезируется на основе ДНК в ходе транскрипции, после чего, в свою очередь, используется в ходе трансляции как матрица для синтеза белков. Тем самым мРНК играет важную роль в «проявлении» (экспрессии) генов.
CDS, в генетике — кодирующая область, или кодирующая последовательность.
Консе́нсусная после́довательность Ко́зак — последовательность нуклеотидов в составе молекулы мРНК эукариот, окружающая старт-кодон и важная для инициации трансляции. Консенсусная последовательность была впервые описана Мэрилин Козак в 1986 году.
FASTA — текстовый формат для нуклеотидных или полипептидных последовательностей, в котором нуклеотиды или аминокислоты обозначаются при помощи однобуквенных кодов. Из-за своей простоты и практичности в настоящее время используется большинством программ работы с биологическими последовательностями. Файлы данного формата могут содержать названия последовательностей, их идентификаторы в базах данных и комментарии. В зависимости от природы содержащихся в нем биологических последовательностей файл формата FASTA может иметь различные расширения.
Триптофа́новый оперо́н — оперон, содержащий гены ферментов, задействованных в биосинтезе аминокислоты триптофан. Триптофановый оперон имеется у многих бактерий, впервые был описан у Escherichia coli. Триптофановый оперон является важной экспериментальной моделью для изучения регуляции экспрессии генов.
Фратаксин — белок, играющий важную роль в работе митохондрий, в частности, в выведении железа из около-митохондриального пространства. В отсутствие фратаксина избыток железа вызывает образование свободных радикалов и повреждения. Кодируется геном FXN, который локализуется на 9-ой хромосоме длинного плеча (q-плеча). Белок состоит из последовательности 210 аминокислотных остатков и имеет молекулярную массу 23135 Да.
SECIS-элеме́нт — участок РНК длиной около 60 нуклеотидов, формирующий шпилькообразную структуру. Этот структурный мотив заставляет стоп-кодон UGA кодировать селеноцистеин. Поэтому элемент SECIS является неотъемлемым элементом мРНК, кодирующих селенопротеины.
UniProt — открытая база данных последовательностей белков. Консорциум UniProt действует с 2003 года. Единая база данных UniProt была создана путём объединения нескольких баз. UniProt состоит из четырёх крупных баз данных и охватывает различные аспекты анализа белковых последовательностей. Многие из последовательностей стали известны в результате реализации проектов секвенирования геномов последних лет. Кроме того, база данных UniProt содержит большое количество информации о биологических функциях белков, полученной из научной литературы.
Нетрансли́руемые о́бласти — особые участки мРНК, не выступающие в качестве матрицы для синтеза белка и прилегающие с обеих сторон к транслируемой области. Таких области две: 5'-нетранслируемая область, или 5'-НТО и 3'-нетранслируемая область, или 3'-НТО, располагающиеся на 5'- и 3'-конце мРНК соответственно. Такое же название имеют участки ДНК, соответствующие 5'-НТО и 3'-НТО транскрипта.
GFF — формат файлов, используемый для хранения разметки генов и других элементов последовательностей ДНК, РНК и белков. Используемое для такого типа файлов расширение обозначается как .GFF
. Формат был предложен исследователями из Института Сенгера, его версия GFF2 вышла в 1998 году.
5′-Нетранслируемая область, или лидерная последовательность — некодирующий участок мРНК, располагающийся сразу после кэпа, но перед кодирующей областью. Такое же название имеет участок ДНК, соответствующий 5′-НТО транскрипта. В 5′-НТО располагаются различные элементы, принимающие участие в регуляции эффективности трансляции.
Коро́ткие откры́тые ра́мки счи́тывания — открытые рамки считывания, расположенные внутри 5′-нетранслируемой области (5'-UTR) эукариотических и некоторых вирусных мРНК. uORF участвуют в регуляции экспрессии генов у эукариот и вирусов и обычно подавляют трансляцию основной рамки считывания, хотя их действие может сопровождаться различными эффектами.
Pfam — база данных семейств белковых доменов. Каждое семейство в ней представлено множественным выравниванием фрагментов белковых последовательностей и скрытой марковской моделью (HMM). На март 2021 года в Pfam содержалось 19 179 записей (семейств), объединённых в 645 кланов.
Переходный ядерный белок сперматид номер один — белок, который у человека кодируется геном TNP1. Данный белок имеет центральное значение в сперматогенезе. Мутации в этом гене могут вызывать нарушения образования сперматозоидов, тем самым приводя к бесплодию. Белок TNP1 состоит из 54 остатков аминокислот с общей молекулярной массой 6,2 кДа. Аминокислоты аргинин и лизин распределены равномерно и составляют около 40% белка. Цистеин отсутствует. Исследования in vitro показали, что белок TNP1 снижает температуру плавления ДНК, высвобождая ее из нуклеосом. В удлиняющихся сперматозоидах млекопитающих участвует в замене гистонов на протамин.
Старт-кодон или инициаторный кодон — первый кодон матричной РНК, c которого начинается трансляция белка в рибосоме. У эукариот и архей старт-кодон всегда кодирует метионин, а у прокариот— модифицированный метионин (N-формилметионин). В большинстве случаев роль инициаторного кодона играет триплет AUG. Старт-кодону предшествует 5′-нетранслируемая область (5'-UTR). В 5'-UTR бактерий локализована последовательность Шайна — Дальгарно (AGGAGG), которая служит для связывания рибосомы и отделёна спейсером от старт-кодона.
Cинонимичная мутация, или синонимичная замена — мутация замены нуклеотида в кодирующей части гена, при которой вследствие вырожденности генетического кода последовательность аминокислот в белке, кодируемом этим геном, не изменяется. Синонимичная мутация относится к точечным мутациям. Термин «синонимичная мутация» нельзя отнести к некодирующим участкам генома.