Кодон — единица генетического кода, три последовательно расположенные нуклеотидные остатки в ДНК или РНК, кодирующих включение одной аминокислоты. Последовательность кодонов в гене определяет последовательность аминокислот в полипептидной цепи белка, кодируемого этим геном. Тогда как все организмы пользуются генетическим кодом, построенным по одним принципам, не все они имеют такую ​​же соответствие между кодонами и аминокислотами. Большинство генов большинства организмов закодированы с помощью так называемого «стандартного кода», но сейчас определены еще несколько «альтернативных» «таблиц трансляции».

Классификация кодонов

Поскольку существует 4 разных нуклеотиды, то общее число возможных кодонов равна 64, из которых в стандартном коде 61 кодируют определенные аминокислоты, а 3 кодона, оставшиеся (UGA, UAG и UAA в мРНК) сигнализируют об остановке трансляции полипептидной цепочки и называются стоп-кодонами . Кодон UAG в мРНК также носит название амбер-кодон, UGA — опал, а UAA — охра.

Под стартовым кодоном обычно подразумевается кодон AUG, что также кодирует метионин, с которого начинается образование полипептидной цепи в процессе трансляции, хотя кодоны GUG, CUG и UUG (в мРНК) также могут быть стартовыми для отдельных генов. У прокариот, хотя эффективным стартовым кодоном также AUG, часто используются кодоны GUG и AUU. Поскольку в процессе биосинтеза белка в полипептидную цепочку участвует всего 20 аминокислот, то разные кодоны могут кодировать одинаковые аминокислоты, такие кодоны принято называть изоакцепторные рубежом. Кроме того, кодоны, на которых не происходит включение аминокислоты в белок, называют бессмысленными кодонами или нонсенс-кодонами, такими кодонами являются стоп-кодоны.

Таблица кодонов стандартного кода

Таблица, отражающая 64 кодона и аминокислоты, соответствующие Каждые из них.
Первый нуклеотид 2-й нуклеотид
U C A G
U

UUU (Phe / F) Фенилаланин UUC (Phe / F) Фенилаланин UUA (Leu / L) Лейцин UUG (Leu / L) лейцин, старт 1

UCU (Ser / S) Серин UCC (Ser / S) Серин UCA (Ser / S) Серин UCG (Ser / S) Серин

UAU (Tyr / Y) тирозин UAC (Tyr / Y) тирозин UAA Стоп-кодон UAG Стоп-кодон

UGU (Cys / C) Цистеин UGC (Cys / C) Цистеин UGA Стоп-кодон UGG (Trp / W) Триптофан

C

CUU (Leu / L) Лейцин CUC (Leu / L) Лейцин CUA (Leu / L) Лейцин CUG (Leu / L) лейцин, старт 1

CCU (Pro / P) Пролин CCC (Pro / P) Пролин CCA (Pro / P) Пролин CCG (Pro / P) Пролин

CAU (His / H) Гистидин CAC (His / H) Гистидин CAA (Gln / Q) Глутамин CAG (Gln / Q) Глутамин

CGU (Arg / R) Аргинин CGC (Arg / R) Аргинин CGA (Arg / R) Аргинин CGG (Arg / R) Аргинин

A

AUU (Ile / I) изолейцин, старт 2 AUC (Ile / I) изолейцин AUA (Ile / I) изолейцин AUG (Met / M) Метионин, старт

ACU (Thr / T) Треонин ACC (Thr / T) Треонин ACA (Thr / T) Треонин ACG (Thr / T) Треонин

AAU (Asn / N) Аспарагин AAC (Asn / N) Аспарагин AAA (Lys / K) Лизин AAG (Lys / K) Лизин

AGU (Ser / S) Серин AGC (Ser / S) Серин AGA (Arg / R) Аргинин AGG (Arg / R) Аргинин

G

GUU (Val / V) Валин GUC (Val / V) Валин GUA (Val / V) Валин GUG (Val / V) Валин, старт 1,2

GCU (Ala / A) Аланин GCC (Ala / A) Аланин GCA (Ala / A) Аланин GCG (Ala / A) Аланин

GAU (Asp / D) Аспарагиновая кислота GAC (Asp / D) Аспарагиновая кислота GAA (Glu / E) Глутаминовая кислота GAG (Glu / E) Глутаминовая кислота

GGU (Gly / G) Глицин GGC (Gly / G) Глицин GGA (Gly / G) Глицин GGG (Gly / G) Глицин

U — В — Урацил; G — Г — Гуанин; A — А — Аденин; C — Ц — Цитозин. 1 Менее эффективные старт-кодона эукариот 2 Менее эффективные старт-кодона бактерий и архей

Другие варианты значений кодонов

Во многих групп организмов, а также в митохондриях организмов, использующих стандартный код, генетический код отличается от стандартного. Например многие виды зеленых водорослей Acetabularia транслируют стандартные стоп-кодоны UAG (УАГ) и UAA (УАА) в аминокислоту глицин, а гриб Candida интерпретирует кодон CUG не как лейцин, а как серин. В митохондрий пивных дрожжей (Saccharomyces cerevisiae) четыре из шести кодонов, обычно транслируются в лейцин, кодируют треонин (Детальное описание известных вариаций приведен на сайте NCBI Taxonomy). Существование таких вариаций свидетельствует о возможной эволюции генетического кода.

Представители всех трех доменов живых организмов иногда прочитывают стандартный стоп-кодон UGA как двадцать первого аминокислоту селенцистеин, что не относится к 20 стандартных. Селенцистеин образуется при химической модификации серина на стадии, когда последний еще не отсоединился от тРНК в составе рибосомы. Аналогично у представителей двух доменов (архей и бактерий) стоп-кодон UAG прочитывается как двадцать второй аминокислота пирролизин.

История исследования кодонов

Начав изучать кодоны совместно с Джеймсом Уотсоном в 1953 году, Фрэнсис Крик предположил, что только 20 кодонов имеют значение, а другие 44 тринуклеотидних комбинации являются бессмысленными. Код Крика не было знаков препинания (старт-и стоп кодонов), поскольку бессмысленные кодоны были фактически невидимыми для адаптеров, так что знак, указывающий на начало считывания, был не нужен. Эта концепция сразу получила почти безоговорочное признание, но ненадолго, только до тех пор, пока новые данные в начале 60-х годов не обнаружили ее несостоятельность.

Более поздние эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и до 1965 года было установлено значение всех 64 кодонов. Оказалось, что некоторые кодоны попросту лишние, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью комбинациями нуклеотидов. За эту работу Гар Ґобинд Хорана, Роберт В. Холли и Ниренберг получили Нобелевскую премию по физиологии и медицине 1968 года.