Антикодон и кодон 2020

Примеры

Предпочтение кодонов у бактерий

В 2012 году группой учёных был обнаружен один из аспектов кодонного предпочтения в бактериях. С помощью рибосомного профайлинга на бактериях E. coli и B. subtilis было показано, что наличие в теле гена последовательностей, похожих на последовательность Шайна — Дальгарно (ШД), вызывает остановку трансляции. Это задаёт направление для характера предпочтения кодонов: ШД-подобные последовательности в генах избегаются. Остановка объясняется гибридизацией ШД-подобной последовательности с антиШД-последовательностью в составе рибосомы. Несмотря на то, что на пары кодонов, способных к образованию ШД-подобной последовательности, действует отбор, они всё же встречаются в последовательностях. На это можно смотреть с двух разных точек зрения. Во-первых, не для любой пары аминокислот можно подобрать «правильные» кодоны, которые не будут гибридизоваться с рибосомой, то есть действие отбора ограничено аминокислотной последовательностью. Во-вторых, такие участки могут нести регуляторную функцию. Остановки рибосомы могут использоваться для регуляции сопряжённого с трансляцией фолдинга или транскрипции (которая в бактериях также сопряжена с трансляцией).

Предпочтение кодонов у насекомых

В результате исследования 6698 ортологов из 12 видов Drosophila было показано, что во всех видах, кроме одного, существует предпочтение кодонов, заканчивающихся на G или C. У наблюдался сдвиг в сторону кодонов, заканчивающихся на А или Т. В большинстве генов наблюдался положительный отбор на кодоны, заканчивающиеся на G или C; в небольшой части генов сдвиг кодонного состава был вызван мутационным процессом. Наиболее сильный отбор был показан у группы melanogaster.

У пчёл в генах, расположенных в GC-бедных регионах, наблюдается намного большее разнообразие в предпочтении кодонов и аминокислот, чем в генах, расположенных в GC-богатых регионах.

Таблица кодонов РНК

неполярный полярный основный кислотный (стоп-кодон)
Стандартный генетический код
1-еоснование 2-е основание 3-е основание
U C A G
U UUU (Phe/F) Фенилаланин UCU (Ser/S) Серин UAU (Tyr/Y) Тирозин UGU (Cys/C) Цистеин U
UUC UCC UAC UGC C
UUA (Leu/L) Лейцин UCA UAA Стоп (Охра) UGA Стоп (Опал) A
UUG UCG UAG Стоп (Янтарь) UGG (Trp/W) Триптофан     G
C CUU CCU (Pro/P) Пролин CAU (His/H) Гистидин CGU (Arg/R) Аргинин U
CUC CCC CAC CGC C
CUA CCA CAA (Gln/Q) Глутамин CGA A
CUG CCG CAG CGG G
A AUU (Ile/I) Изолейцин ACU (Thr/T) Треонин         AAU (Asn/N) Аспарагин AGU (Ser/S) Серин U
AUC ACC AAC AGC C
AUA ACA AAA (Lys/K) Лизин AGA (Arg/R) Аргинин A
AUG (Met/M) Метионин ACG AAG AGG G
G GUU (Val/V) Валин GCU (Ala/A) Аланин GAU (Asp/D) Аспарагиновая кислота GGU (Gly/G) Глицин U
GUC GCC GAC GGC C
GUA GCA GAA (Glu/E) Глутаминовая кислота GGA A
GUG GCG GAG GGG G
  Кодон AUG кодирует метионин и одновременно является сайтом инициации трансляции: первый кодон AUG в кодирующей области мРНК служит началом синтеза белка.

Расшифровка завершена в 1966 году.

Альтернативные старт-кодоны

Альтернативные старт-кодоны отличаются от стандартного кодона AUG. Такие кодоны встречаются как у прокариот, так и у эукариот. Альтернативные старт-кодоны обычно кодируют метионин, когда они находятся в начале белка (даже если кодон кодирует другую аминокислоту). Так например, кодон GUG кодирует валин в случае, если он находится внутри кодирующей последовательности, и стартовый метионин, если расположен в начале последовательности. Это происходит потому, что для инициации трансляции используется специальная транспортная РНК. Антикодоном инициирующей аминоацил-тРНК всегда является CAU; он полностью комплементарен основному старт-кодону AUG и частично комплементарен более редким кодонам. Кроме частично комплементарных GUG и UUG в исключительных случаях, особенно в клетках бактерий, инициация может начинаться с триплетов AUU, AUA, ACG и CUG. Эти так называемые «слабые» кодоны могут выполнять свою функцию в комбинации с сильными последовательностями Шайна-Дальгарно или другими структурными элементами, способствующими инициации.

Эукариоты

Альтернативные старт-кодоны, отличные от AUG, крайне редки в эукариотических геномах. И всё же, в некоторых мРНК клетки встречаются альтернативные старт-кодоны. В случае семи из девяти возможных однонуклеотидных замен в старт-кодоне AUG мРНК дигидрофолатредуктазы, полученные РНК оставались функциональными и обеспечивали трансляцию этого фермента в клетках млекопитающих. В дополнение к каноническому пути через метионил-тРНК и кодон AUG, в клетках млекопитающих трансляция может начинаться с лейцина с использованием лейцил-тРНК, которая комплементарна кодону CUG.

Митохондрии (и прокариоты) значительно чаще, чем эукариоты, используют альтернативные старт-кодоны (AUA и AUU у человека и преимущественно GUG и UUG у прокариот).

Прокариоты

У E. coli в 83 % случаев трансляция начинается с AUG (3542/4284), в 14 % (612) с GUG, в 3 % (103) с UUG и в одном-двух случаях с других кодонов (например, AUU и возможно CUG).

К широко известным генам, в которых нет старт-кодона AUG, относятся lacI (GUG) и lacA (UUG) из lac-оперона E. coli.

Биотехнологическое значение

Экспрессия функциональных белков в модельных организмах (таких, как бактерии) повсеместно используется в биотехнологии. Такие технологии часто сталкиваются с трудностями, связанными с экспрессией белка вне родного организма. Для оптимизации синтеза применяется редизайн последовательности гена, направленный на модификацию зоны инициации трансляции, изменение структурных элементов мРНК и изменение паттерна предпочтения кодонов, чтобы получившаяся последовательность была максимально похожа на последовательности используемого организма. Для модификации целевого гена применяют как , так и ресинтез всего гена. Помимо этого может подвергаться модификации и сам используемый организм, например, в нём могут быть так изменены уровни экспрессии генов тРНК, чтобы состав пула тРНК соответствовал кодонным предпочтениям целевого гена.

Тем не менее, подобных оптимизаций может быть недостаточно, либо они могут приводить к тому, что функциональный продукт синтезироваться не будет. Стратегия оптимизации кодонов основывается на трех предположениях:

  1. Минорные кодоны уменьшают скорость синтеза пептидов.
  2. Синонимичные замены не влияют на структуру и функции белка.
  3. Замена минорных кодонов на синонимичные мажорные приводит к увеличению скорости синтеза пептидов.

Поскольку не у всех организмов и не во всех генах кодонный состав коррелирует с уровнем экспрессии, предположения 1 и 3 выполняются не всегда. Предположение 2 также выполняется не всегда: первичная последовательность влияет на ритм движения рибосомального комплекса по мРНК, что, в свою очередь, влияет на правильность сворачивания полипептидной цепи в пространственную структуру. Более того, первичная последовательность участвует в комплементарных взаимодействиях — формировании вторичной структуры мРНК, а также взаимодействии и рибосомальными и различными малыми РНК. Все это может повлиять на инициацию, элонгацию, паузы и терминацию транскрипции, а также реинициацию, фреймшифты и стабильность мРНК.

Что такое

Последовательность генов, кодируемая в ДНК и транскрибированная в мРНК, состоит из тринуклеотидных единиц, называемых кодонами, каждый из которых кодирует аминокислоту. Каждый нуклеотид состоит из фосфата, сахаридной дезоксирибозы и одного из четырех азотистых оснований, поэтому имеется в общей сложности 64 (43) возможных кодонов.

Из всех 64 кодонов 61 кодируют аминокислоту. Другие три, UGA, UAG и UAA не кодируют аминокислоту, а служат сигналами для прекращения синтеза белка и называются стоп-кодонами. Метиониновый кодон AUG служит сигналом инициации трансляции и называется стартовым кодоном. Это означает, что все белки начинаются с метионина, хотя иногда эта аминокислота удаляется.

Поскольку число кодонов больше количества аминокислот, многие кодоны являются «избыточными», то есть одна и та же аминокислота может кодироваться двумя или более кодонами. Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним кодоном. Избыточные кодоны обычно отличаются в своей третьей позиции. Резервирование необходимо для обеспечения достаточного количества разных кодонов, кодирующих 20 аминокислот, и стоп и начало кодонов, и делает генетический код более устойчивым к точечным мутациям.

Кодон полностью определяется выбранной исходной позицией. Каждая последовательность ДНК может быть прочитана в трех «кадрах считывания», каждая из которых даст совершенно другую последовательность аминокислот в зависимости от исходного положения. На практике, при синтезе белка, только одна из этих рамок имеет значимую информацию о синтезе белка; два других кадра обычно приводят к стоп-кодонам, которые препятствуют их использованию для прямого синтеза белка. Кадр, в котором фактически транслируется последовательность белка, определяется стартовым кодоном, обычно первым встреченным АВГ в последовательности РНК. В отличие от стоп-кодонов, для запуска процесса недостаточно одного стартового кодона. Соседние праймеры также необходимы для индукции транскрипции мРНК и связывания рибосом.

Первоначально предполагалось, что генетический код универсален и что все организмы интерпретируют кодон как одну и ту же аминокислоту. Хотя это в общем случае, некоторые редкие различия в генетическом коде были идентифицированы. Например, в митохондриях UGA, который обычно является стоп-кодоном, кодирует триптофан, тогда как AGA и AGG, которые обычно кодируют триптофан, являются стоп-кодонами. Другие примеры необычных кодонов были обнаружены у протозоян.

Эволюционные механизмы

Существуют две гипотезы, объясняющие явление предпочтения кодонов. Мутационная (нейтральная) гипотеза предполагает, что предпочтение кодонов существует из-за различных мутационных паттернов — некоторые кодоны в большей степени подвержены мутациям и поэтому встречаются реже. Гипотеза отбора объясняет существование кодонного предпочтения действием естественного отбора — предпочтение кодонов влияет на эффективность и точность экспрессии генов и, таким образом, создаётся и поддерживается отбором.

Мутационная гипотеза

Мутационная гипотеза основана на том, что мутационные паттерны различаются у разных организмов и в разных частях одного генома. В результате этого различные кодоны мутируют с различной частотой, что может быть причиной различных предпочтений кодонов. Например, одним из наиболее значимых параметров, объясняющих различные предпочтения кодонов в разных организмах, является GC-состав.

Гипотеза естественного отбора

Существуют доказательства и в пользу влияния естественного отбора. Мутационная гипотеза не может объяснить, почему наиболее частыми кодонами являются те, которые узнаются наиболее встречаемыми тРНК. Также, помимо GC-состава, предпочтение кодонов очень сильно коррелирует с уровнем экспрессии гена. Часто функционально связанные гены, с большой вероятностью экспрессирующиеся на одном уровне, имеют одинаковые кодонные предпочтения. В принципе, уровень экспрессии гена может влиять на мутационные паттерны и, именно таким образом, на предпочтение кодонов. Однако было показано, что предпочтения кодонов в экзонах и тринуклеотидов в интронах могут различаться, из чего следует, что кодонные предпочтения генов не могут быть объяснены только влиянием экспрессии на мутационный процесс (то есть может быть вовлечен и естественный отбор).

Модель баланса действующих сил

Точные причины выбора предпочтительных кодонов остаются неясными. Однако, учитывая существование свидетельств в пользу и естественного отбора, и мутационного процесса, была сформирована модель предпочтения мажорных кодонов, или модель баланса мутационного процесса, естественного отбора и генетического дрейфа. В рамках этой модели естественный отбор поддерживает некоторые кодоны (предпочтительные, или мажорные) на более высоких частотах, в то время как мутационный процесс и генетический дрейф позволяют существовать минорным кодонам. Уровень экспрессии, функциональные связи, скорость рекомбинации и другие факторы могут обеспечивать разную степень выраженности предпочтения кодонов в разных генах.

Модель предпочтения мажорных кодонов пытались проверить количественно. Поначалу существование и направление естественного отбора и мутационного процесса пытались оценить для разных видов Drosophila. Результаты несколько менялись с появлением новых данных, однако в целом было показано, что в разных генах обычно либо наблюдается слабый положительный отбор в пользу мажорных кодонов, либо отбор не наблюдается. Это в общем не противоречит модели предпочтения мажорных кодонов и тому факту, что в разных генах степень выраженности предпочтения кодонов различается. Однако для некоторых генов был показан слабый положительный отбор в пользу минорных кодонов, что свидетельствует о том, что естественный отбор не всегда поддерживает кодоны, обеспечивающие эффективность и точность экспрессии.

Методы детекции и количественного измерения

Предложено несколько способов измерения степени выраженности кодонного предпочтения.

Наиболее известная мера предложена Shapr & Li в 1986 году. Индекс отношения использования синонимичных кодонов (relative synonymous codon usage) отражает то, насколько отклоняется частота использования конкретного кодона от ожидаемой частоты при равномерном распределении синонимичных кодонов:

RSCUij=Xij(1ni)∑j=1niXij{\displaystyle RSCU_{ij}={\frac {X_{ij}}{({\frac {1}{n_{i}}})\sum _{j=1}^{n_{i}}X_{ij}}}} , где Xij{\displaystyle {X_{ij}}} — число j-х кодонов, кодирующих i-ую аминокислоту, n — число синонимичных кодонов для i-й аминокислоты.

Авторами RSCU был также предложен индекс адаптации кодонов — мера адаптации гена к кодонному предпочтению. Эта мера определяется как среднее геометрическое значений относительной адаптивности для всех кодонов в гене:

CAI(g)=(∏k=1Lwk)1L{\displaystyle CAI(g)={\left(\prod _{k=1}^{L}w_{k}\right)}^{\frac {1}{L}}}, где g{\displaystyle g} — ген, L{\displaystyle L} — число кодонов в гене, wk{\displaystyle w_{k}} — относительная адаптивность k{\displaystyle k}-го кодона в гене. Относительная адаптивность кодона рассчитывается следующим образом:

wi,j=xi,jyj{\displaystyle w_{i,j}={\frac {x_{i,j}}{y_{j}}}}, где xi,j{\displaystyle x_{i,j}} — количество в гене i{\displaystyle i}-ых кодонов, соответствующих j{\displaystyle j}-ой аминокислоте, yj{\displaystyle y_{j}} — количество в гене кодонов наиболее представленного типа (среди всех кодонов, соответствующих j{\displaystyle j}-ой аминокислоте).

Другой подход к оценке кодонного предпочтения основан на использовании энтропии Шеннона. Этот подход нашёл применение в ряде статистик (например, SCUO).

Также существуют методы для оценки различий кодонного предпочтения в разных генах. В их основе могут лежать метод главных компонент, метод k средних, метод максимального правдоподобия.
Многие из них реализованы в виде отдельных программ.

Что такое кодон

Кодон представляет собой последовательность из трех нуклеотидов, которая указывает одну аминокислоту в полипептидной цепи. Каждый ген, который кодирует конкретный белок, состоит из последовательности нуклеотидов, которые представляют аминокислотную последовательность этого конкретного белка. Гены используют универсальный язык, генетический код, чтобы хранить аминокислотные последовательности белков. Генетический код состоит из нуклеотидных триплетов, которые называются кодонами. Например, кодон TCT представляет собой аминокислоту серин. Шестьдесят один кодон может быть идентифицирован, чтобы указать двадцать незаменимых аминокислот, необходимых для трансляции.

Рамка для чтения

Конкретная нуклеотидная последовательность в молекуле одноцепочечной ДНК состоит из трех рамок считывания в направлении от 5 ‘до 3’ цепи. Учитывая нуклеотидную последовательность в Рисунок 1первая рамка считывания начинается с первого нуклеотида А. Первая рамка считывания отображается синим цветом. Он содержит кодоны AGG TGA CAC CGC AAG CCT TAT ATT AGC. Вторая рамка считывания начинается со второго нуклеотида G, который показан красным цветом. Содержит кодоны GGT GAC ACC GCA AGC CTT ATA TTA. Третья рамка считывания начинается с третьего нуклеотида G, который показан зеленым цветом. Содержит кодоны GTG ACA CCG CAA GCC TTA TAT TAG.

Рисунок 1: Чтение Фреймов

Поскольку ДНК представляет собой двухцепочечную молекулу, в двух цепях можно найти шесть рамок считывания. Но только одна рамка для чтения может быть переведена. Эта рамка считывания называется открытой рамкой считывания. Кодон может быть идентифицирован только с открытой рамкой считывания.

Старт / Стоп Кодон

Открытая рамка считывания определяется в основном наличием стартового кодона, кодируемого мРНК. Универсальным стартовым кодоном является AUG, который кодирует аминокислоту метионин в эукариотах. У прокариот AUG кодирует формилметионин. Эукариотические открытые рамки считывания прерываются наличием интронов в середине рамки. Трансляция останавливается на стоп-кодоне в открытой рамке считывания. На мРНК обнаружены три универсальных стоп-кодона: UAG, UGA и UAA. Серия кодонов на фрагменте мРНК показана в фигура 2.

Рисунок 2: Серия кодонов на мРНК

Влияние мутаций

Ошибки возникают в процессе репликации, который вносит изменения в нуклеотидную цепь. Эти изменения называются мутациями. Мутации могут изменить аминокислотную последовательность полипептидной цепи. Два типа точечных мутаций — бессмысленные мутации и бессмысленные мутации. Миссенс-мутации изменяют свойства полипептидной цепи, изменяя аминокислотный остаток, и могут вызывать такие заболевания, как серповидноклеточная анемия. Нонсенс-мутации изменяют нуклеотидную последовательность стоп-кодона и могут вызывать талассемию.

вырождение

Избыточность, возникающая в генетическом коде, называется вырождением. Например, кодоны UUU и UUC оба указывают аминокислоту фенилаланин. Таблица кодонов РНК показана в рисунок 3.

Рисунок 3: РНК-кодон

Смещение использования кодонов

Частота встречаемости конкретного кодона в геноме называется смещением использования кодона. Например, частота встречаемости кодона UUU составляет 17,6% в геноме человека.

вариации

Некоторые вариации могут быть обнаружены в стандартном генетическом коде при рассмотрении человеческого митохондриального генома. Немного Mycolasma виды также указывают кодон UGA как триптофан, а не стоп-кодон. Немного Кандида виды указывают кодон, UCG как серин.

Неканонические значения кодонов

По крайней мере у 16 типов организмов генетический код отличается от канонического. Например многие виды зелёных водорослей Acetabularia транслируют стандартные стоп-кодоны UAG и UAA в аминокислоту глицин, а гриб Candida интерпретирует РНК-кодон CUG не как лейцин, а как серин. А у митохондрий пекарских дрожжей (Saccharomyces cerevisiae) четыре из шести кодонов, обычно транслирующихся в лейцин, кодируют треонин.

Существование таких вариаций свидетельствует о возможной эволюции генетического кода.

Представители всех трёх доменов живых организмов иногда прочитывают стандартный стоп-кодон UGA как 21-ю аминокислоту селеноцистеин, не относящуюся к 20 стандартным. Селеноцистеин образуется при химической модификации серина на стадии, когда последний ещё не отсоединился от тРНК в составе рибосомы.

Аналогично у представителей двух доменов (архебактерий и бактерий) стоп-кодон UAG прочитывается как 22-я аминокислота пирролизин.

Отличия от универсального кода имеются и в митохондриальной ДНК (см. раздел ).

Михаил Фирсов
Оцените автора
( Пока оценок нет )
Добавить комментарий