Протео́мика — область молекулярной биологии, посвящённая идентификации и количественному анализу белков. Термин «протеомика» был предложен в 1997 году. Совокупность всех белков клетки называют протеомом.
Протеом — совокупность белков организма, производимых клеткой, тканью или организмом в определённый период времени. Или, более строго, это совокупность экспрессированных белков в данном типе клеток или в организме, в данный период времени при данных условиях. Термин является производным слова «протеин» (белок), аналогичным по происхождению слову «геном».
Биоинформа́тика — междисциплинарная область, объединяющая общую биологию, молекулярную биологию, кибернетику, генетику, химию, компьютерные науки, математику и статистику. Крупномасштабные биологические проблемы, требующие анализа больших объёмов данных, решаются биоинформатикой с вычислительной точки зрения. Биоинформатика главным образом включает в себя изучение и разработку компьютерных методов и направлена на получение, анализ, хранение, организацию и визуализацию биологических данных.
Белки́ — высокомолекулярные органические вещества, состоящие из альфа-аминокислот, соединённых в цепочку пептидной связью. В живых организмах аминокислотный состав белков определяется генетическим кодом, при синтезе в большинстве случаев используется 20 стандартных аминокислот. Множество их комбинаций определяет большое разнообразие свойств молекул белков. Кроме того, аминокислотные остатки в составе белка часто подвергаются посттрансляционным модификациям, которые могут возникать и до того, как белок начинает выполнять свою функцию, и во время его «работы» в клетке. Часто в живых организмах несколько молекул разных белков образуют сложные комплексы, например фотосинтетический комплекс и другие комплексы.
Rosetta@Home — проект добровольных вычислений, направленный на решение одной из самых больших проблем в молекулярной биологии — вычисление третичной структуры белков из их аминокислотных последовательностей. Благодаря недавно завершённому проекту «Геном человека» известны аминокислотные последовательности всех белков в человеческом организме. Исследования по данному проекту также помогут в проектировании новых, несуществующих белков. Хотя большая часть проекта ориентируется на фундаментальные исследования в области улучшения точности и надежности методов протеомики, Rosetta@home также способствует прикладным исследованиям для борьбы с такими болезнями как рак, малярия, болезнь Альцгеймера, сибирская язва и другими генетическими и вирусными заболеваниями. Foldit — это видеоигра от Rosetta@Home, которая стремится достичь целей проекта с краудсорсинг подходом.
Однонуклеотидный полиморфизм — отличия последовательности ДНК размером в один нуклеотид в геноме представителей одного вида или между гомологичными участками гомологичных хромосом. Применяется в качестве генетических ма́ркеров для изучения неравновесного сцепления локусов и полногеномного поиска ассоциаций.
Посттрансляционная модификация — это ковалентная химическая модификация белка после его синтеза на рибосоме. Для многих белков посттрансляционная модификация оказывается завершающим этапом биосинтеза, который является частью процесса экспрессии генов. Наряду с альтернативным сплайсингом посттрансляционные модификации увеличивают разнообразие белков в клетке.
Сплайсинг — процесс вырезания определённых нуклеотидных последовательностей из молекул РНК и соединения последовательностей, сохраняющихся в «зрелой» молекуле, в ходе процессинга РНК. Наиболее часто этот процесс встречается при созревании матричной, или информационной, РНК (мРНК) у эукариот, при этом путём биохимических реакций с участием РНК и белков из мРНК удаляются участки, не кодирующие белок (интроны) и соединяются друг с другом кодирующие аминокислотную последовательность участки — экзоны. Таким образом незрелая пре-мРНК превращается в зрелую мРНК, с которой считываются (транслируются) белки клетки. Большинство генов прокариот, кодирующих белки, не имеют интронов, поэтому у них сплайсинг пре-мРНК встречается редко. У представителей эукариот, бактерий и архей встречается также сплайсинг транспортных РНК (тРНК) и других некодирующих РНК.
В биохимии и молекулярной биологии фо́лдингом белка называют процесс спонтанного сворачивания полипептидной цепи в уникальную нативную пространственную структуру.
p53 — это транскрипционный фактор, регулирующий клеточный цикл. p53 выполняет функцию супрессора образования злокачественных опухолей, соответственно ген TP53 является антионкогеном. Мутации гена TP53 обнаруживаются в клетках около 50 % раковых опухолей. Зачастую его называют «стражем генома».
Экспрессия генов — процесс, в ходе которого наследственная информация от гена преобразуется в функциональный продукт — РНК или белок. Некоторые этапы экспрессии генов могут регулироваться: это транскрипция, трансляция, сплайсинг РНК и стадия посттрансляционных модификаций белков. Процесс активации экспрессии генов короткими двухцепочечными РНК называется активацией РНК.
Альтернати́вный спла́йсинг — вариант сплайсинга матричных РНК (мРНК), при котором в ходе экспрессии гена на основе одного и того же первичного транскрипта (пре-мРНК) происходит образование нескольких зрелых мРНК. Структурные и функциональные различия образовавшихся транскриптов могут быть вызваны как выборочным включением в зрелую мРНК экзонов первичного транскрипта, так и сохранением в ней частей интронов. Наиболее распространённая разновидность альтернативного сплайсинга предусматривает пропуск экзона: отдельные экзоны транскрипта при определённых условиях могут быть как включены в зрелую мРНК, так и пропущены.
Изоформа белка — любая из нескольких разных форм одного и того же белка, происходящих из одного гена или семейства генов.
UniProt — открытая база данных последовательностей белков. Консорциум UniProt действует с 2003 года. Единая база данных UniProt была создана путём объединения нескольких баз. UniProt состоит из четырёх крупных баз данных и охватывает различные аспекты анализа белковых последовательностей. Многие из последовательностей стали известны в результате реализации проектов секвенирования геномов последних лет. Кроме того, база данных UniProt содержит большое количество информации о биологических функциях белков, полученной из научной литературы.
STRING — база данных и веб-ресурс для поиска информации об известных и предсказанных белок-белковых взаимодействиях.
«Протеом человека» — международный проект по созданию протеомной карты, включающей все белки, кодируемые геномом человека. Первоочередной задачей проекта является составление протеомных карт основных белков плазмы крови, печени, головного мозга.
Интерактомика — это дисциплина, находящаяся на стыке биоинформатики и биохимии, которая занимается экспериментальными и биоинформатическими исследованиями белок-белковых взаимодействий и последствий этих взаимодействий между белками и другими молекулами внутри клетки. Целью интерактомики является изучение функции белков в живых системах, определение корреляций между молекулами на основе анализа больших наборов полногеномных и протеомных данных. Интерактомика является примером науки, которая позволяет взглянуть на организм или биосистему в целом. Например, посредством сравнения сетей взаимодействий у различных видов, тем самым определяя консервативные и вариабельные участки таких сетей. Изучение взаимодействий между белками и другими молекулами и последствий этих взаимодействий позволяет формулировать новые гипотезы об ответных реакциях этих молекул, которые могут быть проверены в новых экспериментах.
Я́дерные спе́клы, или спе́клы, или B-снурпосо́мы, или компа́ртменты фа́кторов спла́йсинга, или доме́ны SC-35, или кла́стеры интерхромати́новых гра́нул — ядерные тельца, регулирующие сплайсинг. В ядерных спеклах находятся факторы сплайсинга и малые ядерные рибонуклеопротеины. Изменения в белковом составе и функционировании ядерных спекл приводят к изменениям в альтернативном сплайсинге пре-мРНК, поэтому считается, что ключевой функцией ядерных спекл является регуляция доступности факторов сплайсинга в сайтах транскрипции. Недавние исследования показали, что в ядерных спеклах также находятся белки, задействованные в регуляции локализации хромосом, модификации хроматина, транскрипции, процессинге 3'-концов транскриптов, модификации мРНК, белки, полностью покрывающие мРНК, и мРНК-рибонуклеопротеины, поэтому ядерные спеклы рассматриваются как крупнейшие центры регуляции всех этапов экспрессии ядерных генов.
Протеогеномика — это область биологических исследований, в которой используется сочетание протеомики, геномики и транскриптомики, с целью обнаружения и идентификации пептидов. Протеогеномика применяется для идентификации новых пептидов путем сравнения спектров МС/МС с базой данных белков, которая была получена из геномной и транскриптомной информации. Протеогеномика часто относится к исследованиям, использующим протеомную информацию, полученную, например, методом масс-спектрометрии, для улучшения аннотаций генома. Геномика изучает ДНК и генетический код целых организмов, в то время как транскриптомика имеет дело с последовательностями РНК и транскриптов. Протеомика использует тандемную масс-спектрометрию и жидкостную хроматографию для определения и изучения функций белков. Протеомика используется для обнаружения всех белков, экспрессируемых в организме, известных как его протеом. Нерешённая проблема протеомики заключается в том, что она основывается на предположении, что современные модели генов верны и что правильные последовательности белка можно найти с помощью базы данных эталонных последовательностей; Однако это не всегда так, поскольку некоторые пептиды не могут быть найдены в базах данных. Кроме того, новые белковые последовательности могут возникать в результате мутаций. Данная проблема может быть решена с использованием протеомных, геномных и транскриптомных данных. Совместное использование методов протеомики и геномики привело к появлению протеогеномики, которая выделилась в самостоятельную область в 2004 году.