избыточность вырожденность генетического кода означает
32. Клетка как биологическая система
Читать 0 мин.
32.275. Генетический код и его свойства
Ранее мы подчёркивали, что нуклеотиды имеют важную для формирования жизни на Земле особенность ― при наличии в растворе одной полинуклеотидной цепочки спонтанно происходит процесс образования второй (параллельной) цепочки на основании комплементарного соединения родственных нуклеотидов. Одинаковое число нуклеотидов, в обоих цепочках и их химическое родство, является непременным условием для осуществления такого рода реакций. Однако при синтезе белка, когда информация с иРНК реализуется в структуру белка никакой речи о соблюдении принципа комплементарности идти не может. Это связано с тем, что в иРНК, и в синтезированном белке различно не только число мономеров, но и, что особенно важно, отсутствует структурное сходство между ними (с одной стороны нуклеотиды, с другой аминокислоты). Понятно, что в этом случае возникает необходимость создания нового принципа точного перевода информации с полинуклеотида в структуру полипептида. В эволюции такой принцип был создан и в его основу был заложен генетический код.
Генетический код ― это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке.
Генетический код имеет несколько свойств:
Следует отметить, что некоторые авторы предлагают ещё и другие свойства кода, связанные с химическими особенностями входящих в код нуклеотидов или с частотой встречаемости отдельных аминокислот в белках организма и т.д. Однако эти свойство вытекают из вышеперечисленных, поэтому там мы их и рассмотрим.
Генетический код, как и многое сложно организованные система имеет наименьшую структурную и наименьшую функциональную единицу. Триплет ― наименьшая структурная единица генетического кода. Состоит она из трёх нуклеотидов. Кодон ― наименьшая функциональная единица генетического кода. Как правило, кодонами называют триплеты иРНК. В генетическом коде кодон выполняет несколько функций. Во-первых, главная его функция заключается в том, что он кодирует одну аминокислоту. Во-вторых, кодон может не кодировать аминокислоту, но, в этом случае, он выполняет другую функцию (см. далее). Как видно из определения, триплет ― это понятие, которое характеризует элементарную структурную единицу генетического кода (три нуклеотидов). Кодон ― характеризует элементарную смысловую единицу генома ― три нуклеотида определяют присоединение к полипептидной цепочки одной аминокислоты.
Элементарную структурную единицу вначале расшифровали теоретически, а затем её существование подтвердили экспериментально. И действительно, 20 аминокислот невозможно закодировать одним или двумя нуклеотидом т.к. последних всего 4. Три нуклеотида из четырёх дают 43 = 64 варианта, что с избытком перекрывает число имеющихся у живых организмах аминокислот (см.табл. 1).
Представленные в таблице 64 сочетания нуклеотидов имеют две особенности. Во-первых, из 64 вариантов триплетов только 61 являются кодонами и кодируют какую-либо аминокислоту, их называют смысловые кодоны. Три триплета не кодируют.
Таблица 1.
Кодоны информационной РНК и соответствующие им аминокислотыявляются стоп-сигналами, обозначающие конец трансляции. Таких триплетов три ― УАА, УАГ, УГА, их ещё называют «бессмысленные» (нонсенс кодоны). В результате мутации, которая связана с заменой в триплете одного нуклеотида на другой, из смыслового кодона может возникнуть бессмысленный кодон. Такой тип мутации называют нонсенс-мутация. Если такой стоп-сигнал сформировался внутри гена (в его информационной части), то при синтезе белка в этом месте процесс будет постоянно прерываться ― синтезироваться будет только первая (до стоп-сигнала) часть белка. У человека с такой патологией будет ощущаться нехватка белка и возникнут симптомы, связанные с этой нехваткой. Например, такого рода мутация выявлена в гене, кодирующем бета-цепь гемоглобина. Синтезируется укороченная неактивная цепь гемоглобина, которая быстро разрушается. В результате формируется молекула гемоглобина, лишённая бета-цепи. Понятно, что такая молекула вряд ли будет полноценно выполнять свои обязанности. Возникает тяжёлое заболевания, развивающееся по типу гемолитической анемии (бета-ноль талассемия, от греческого слова «Таласа» ― Средиземное море, где эта болезнь впервые обнаружена).
Механизм действия стоп-кодонов отличается от механизма действия смысловых кодонов. Это следует из того, что для всех кодоны, кодирующие аминокислоты, найдены соответствующие тРНК. Для нонсенс-кодонов тРНК не найдены. Следовательно, в процессе остановки синтеза белка тРНК не принимает участие.
Кодон АУГ (у бактерий иногда ГУГ) не только кодируют аминокислоту метионин и валин, но и является инициатором трансляции.
61 из 64 триплетов кодируют 20 аминокислот. Такое трёхразовое превышение числа триплетов над количеством аминокислот позволяет предположить, что в переносе информации могут быть использованы два варианта кодирования. Во-первых, не все 64 кодона могут быть задействованы в кодировании 20 аминокислот, а только 20 и, во-вторых, аминокислоты могут кодироваться несколькими кодонами. Исследования показали, что природа использовала последний вариант.
Код, при котором одна аминокислота кодируется несколькими триплетами, называется вырожденным или избыточным. Почти каждой аминокислоте соответствует несколько кодонов. Так, аминокислота лейцин может кодироваться шестью триплетами — УУА, УУГ, ЦУУ, ЦУЦ, ЦУА, ЦУГ. Валин кодируется четырьмя триплетами, фенилаланин — двумя и только триптофан и метионин кодируются одним кодоном. Свойство, которое связано с записью одной и той же информации разными символами носит название вырожденность.
Число кодонов, предназначенных для одной аминокислоты, хорошо коррелируется с частотой встречаемости аминокислоты в белках. И это, скорее всего, не случайно. Чем больше частота встречаемости аминокислоты в белке, тем чаще представлен кодон этой аминокислоты в геноме, тем выше вероятность его повреждения мутагенными факторами. Поэтому понятно, что мутированный кодон имеет больше шансов кодировать туже аминокислоту при высокой его вырожденности. С этих позиций вырожденность генетического кода является механизмом защищающим геном человека от повреждений.
Необходимо отметить, что термин вырожденность используется в молекулярной генетики и в другом смысле. Так основная часть информации в кодоне приходится на первые два нуклеотида, основание в третьем положении кодона оказывается малосущественным. Этот феномен называют “вырожденностью третьего основания”. Последняя особенность сводит до минимума эффект мутаций. Например, известно, что основной функцией эритроцитов крови является перенос кислорода от легких к тканям и углекислого газа от тканей к легким. Осуществляет эту функцию дыхательный пигмент — гемоглобин, который заполняет всю цитоплазму эритроцита. Состоит он из белковой части ― глобина, который кодируется соответствующим геном. Кроме белка в молекулу гемоглобина входит ген, содержащий железо. Мутации в глобиновых генах приводят к появлению различных вариантов гемоглобинов. Чаще всего мутации связаны с заменой одного нуклеотида на другой и появлением в гене нового кодона, который может кодировать новую аминокислоту в полипептидной цепи гемоглобина. В триплете, в результате мутации может быть заменён любой нуклеотид ― первый, второй или третий.
Известно несколько сотен мутаций, затрагивающих целостность генов глобина. Около 400 из них связаны с заменой единичных нуклеотидов в гене и соответствующей аминокислотной заменой в полипептиде. Из них только 100 замен приводят к нестабильности гемоглобина и различного рода заболеваниям от легких до очень тяжелых. 300 (примерно 64%) мутаций-замен не влияют на функцию гемоглобина и не приводят к патологии. Одной из причин этого является упомянутая выше “вырожденность третьего основания”, когда замена третьего нуклеотида в триплете, кодирующем серин, лейцин, пролин, аргинин и некоторые другие аминокислоты приводит к появлению кодона-синонима, кодирующего ту же аминокислоту. Фенотипически такая мутация не проявится. В отличие от этого любая замена первого или второго нуклеотида в триплете в 100 % случаях приводит к появлению нового варианта гемоглобина. Но и в этом случае тяжёлых фенотипических нарушений может и не быть. Причиной этому является замена аминокислоты в гемоглобине на другую сходную с первой по физико-химическим свойствам. Например, если аминокислота, обладающая гидрофильными свойствами, заменена на другую аминокислоту, но с такими же свойствами.
Гемоглобин состоит из железопорфириновой группы гема (к ней и присоединяются молекулы кислорода и углекислоты) и белка — глобина. Гемоглобин взрослого человека (НвА) содержит две идентичные a-цепи и две b-цепи. Замена в гене, кодирующем b-цепь гемоглобина первого или второго нуклеотида практически всегда приводит к появлению в белка новых аминокислот, нарушению функций гемоглобина и тяжёлым последствия для больного. Например, замена “Ц” в одном из триплетов ЦАУ (гистидин) на “У” — приведет к появлению нового триплета УАУ, кодирующего другую аминокислоту — тирозин. Фенотипически это проявится в тяжёлом заболевании. Аналогичная замена в 63 положении b-цепи полипептида гистидина на тирозин приведет к дестабилизации гемоглобина. Развивается заболевание метгемоглобинемия. Замена, в результате мутации, глутаминовой кислоты на валин в 6-м положении b-цепи является причиной тяжелейшего заболевания — серповидно-клеточной анемии. Не будем продолжать печальный список. Отметим только, что при замене первых двух нуклеотидов может появится аминокислота по физико-химическим свойствам похожая на прежнюю. Так, замена 2-го нуклеотида в одном из триплетов, кодирующего глутаминовую кислоту (ГАА) в b-цепи на “У” приводит к появлению нового триплета (ГУА), кодирующего валин, а замена первого нуклеотида на “А” формирует триплет ААА, кодирующий аминокислоту лизин. Глутаминовая кислота и лизин сходны по физико-химическим свойствам — они обе гидрофильны. Валин — гидрофобная аминокислота. Поэтому, замена гидрофильной глютаминовой кислоты на гидрофобный валин, значительно меняет свойства гемоглобина, что, в конечном итоге, приводит к развитию серповидноклеточной анемии, замена же гидрофильной глютаминовой кислоты на гидрофильный лизин в меньшей степени меняет функцию гемоглобина — у больных возникает легкая форма малокровия. В результате замены третьего основания новый триплет может кодировать туже аминокислоты, что и прежней. Например, если в триплете ЦАУ урацил был заменён на цитозин и возник триплет ЦАЦ, то практически никаких фенотипических изменений у человека выявлено не будет. Это понятно, т.к. оба триплета кодируют одну и туже аминокислоту ― гистидин.
В заключении уместно подчеркнуть, что вырожденность генетического кода и вырожденность третьего основания с общебиологических позиция являются защитными механизмами, которые заложены в эволюции в уникальной структуре ДНК и РНК.
Каждый триплет (кроме бессмысленных) кодирует только одну аминокислоту. Таким образом, в направлении кодон ― аминокислота генетический код однозначен, в направлении аминокислота ― кодон ― неоднозначен (вырожденный).
И в этом случае необходимость однозначности в генетическом коде очевидна. При другом варианте при трансляции одного и того же кодона в белковую цепочку встраивались бы разные аминокислоты и в итоге формировались белков с различной первичной структурой и разной функцией. Метаболизм клетки перешёл бы в режим работы «один ген ― несколько поипептидов». Понятно, что в такой ситуации регулирующая функция генов была бы полностью утрачена.
Считывание информации с ДНК и с иРНК происходит только в одном направлении. Полярность имеет важное значение для определения структур высшего порядка (вторичной, третичной и т.д.). Ранее мы говорили о том, что структуры низшего порядка определяют структуры более высшего порядка. Третичная структура и структуры более высокого порядка у белков, формируются сразу же как только синтезированная цепочка РНК отходит от молекулы ДНК или цепочка полипептида отходит от рибосомы. В то время, когда свободный конец РНК или полипептида приобретает третичную структуру, другой конец цепочки ещё продолжает синтезироваться на ДНК (если транскрибируется РНК) или рибосоме (если транскрибируется полипептид).
Поэтому однонаправленный процесс считывания информации (при синтезе РНК и белка) имеет существенное значение не только для определения последовательности нуклеотидов или аминокислот в синтезируемом веществе, но для жёсткой детерминации вторичной, третичной и т.д. структур.
Код может быть перекрывающимся и не перекрывающимся. У большинства организмов код не перекрывающийся. Перекрывающийся код найден у некоторых фагов.
Сущность не перекрывающего кода заключается в том, что нуклеотид одного кодона не может быть одновременно нуклеотидом другого кодона. Если бы код был перекрывающим, то последовательность из семи нуклеотидов (ГЦУГЦУГ) могла кодировать не две аминокислоты (аланин-аланин) (рис.33, А) как в случае с не перекрывающимся кодом, а три (если общим является один нуклеотид) (рис. 33, Б) или пять (если общими являются два нуклеотида) (см. рис. 33, В). В последних двух случаях мутация любого нуклеотида привела бы к нарушению в последовательности двух, трёх и т.д. аминокислот.
Однако установлено, что мутация одного нуклеотида всегда нарушает включение в полипептид одной аминокислоты. Это существенный довод в пользу того, что код является не перекрывающимся. Неперекрываемость генетического кода связана с ещё одним свойством ― считывание информации начинается с определённой точки ― сигнала инициации. Таким сигналом инициации в иРНК является кодон, кодирующий метионин АУГ. Следует отметить, что у человека всё-таки имеется небольшое число генов, которые отступают от общего правила и перекрываются.
Между кодонами нет знаков препинания. Иными словами триплеты не отделены друг от друга, например, одним ничего не значащим нуклеотидом. Отсутствие в генетической коде «знаков препинания» было доказано в экспериментах.
Код един для всех организмов, живущих на Земле. Прямое доказательство универсальности генетического кода было получено при сравнении последовательностей ДНК с соответствующими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используется одни и те же наборы кодовых значений. Есть и исключения, но их не много.
Первые исключения из универсальности генетического кода были обнаружены в митохондриях некоторых видов животных. Это касалось кодона терминатора УГА, который читался так же как кодон УГГ, кодирующий аминокислоту триптофан. Были найдены и другие более редкие отклонения от универсальности.
Для повторения:
Генетический код ― это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке. Генетический код имеет несколько свойств.
1. Триплетность. Триплет состоит из трёх нуклеотидов. 61 кодон ― смысловые, т.е. кодируют какую-либо аминокислоту, три ― бессмысленные, т.е. не кодируют аминокислоты.
2. Вырожденность или избыточность. Одна аминокислота может кодироваться несколькими кодонами.
3. Однозначность. Один кодон кодирует только одну аминокислоту.
4. Полярность. Считывание информации с ДНК и с иРНК происходит только в одном направлении.
5. Неперекрываемость. Генетический код является не перекрывающимся.
6. Компактность. Между кодонами нет знаков препинания.
7. Универсальность. Код един для всех живущих на земле организмов.
Биология клетки/Часть 1. Клетка как она есть/3/4
Содержание
Дезоксирибонуклеи́новая кислота́ (ДНК) представляет собой полимерную молекулу сложной структуры длиной от нескольких тысяч пар нуклеотидов (пн) до нескольких миллионов пар нуклеотидов.
1 метр), длина всех 23 молекул ДНК гаплоидного набора хромосом)
В ДНК зашифрована информация о первичной структуре белков посредством комбинации нуклеотидов. Процесс «переписывания» этого кода с ДНК в молекулы РНК называется транскрипцией, а синтез белка в рибосомах по матрице иРНК, в ходе которого происходит «перевод» нуклеотидного кода в последовательность аминокислот — трансляцией.
Генетический код ДНК состоит из триплетов, то есть из тройных комбинаций нуклеотидов. При транскрипции генетический код «переписывается» в последовательность нуклеотидов иРНК. Тройки нуклеотидов иРНК, кодирующие аминокислоты, называются кодонами. Из 64 возможных триплетов (4³) 61 являются смысловым кодонами, то есть кодируют аминокислоты. Все кодоны триплетны, неразрывны и не перекрываются в тексте (как считалось по одной из гипотез), а также не разделены межкодонными знаками. Все кодоны однозначны, то есть каждый кодон кодирует единственную аминокислоту.
Генетический код содержит в себе также знаки пунктуации (начала и конца трансляции). Кодоны AUG, GUG и UUG у прокариот помимо кодирования аминокислот кодируют ещё и команду начала трансляции. Однако однозначность генетического кода при этом не нарушается, так как инициирующие знаки располагаются в определенном окружении (контексте), способном образовывать самокомплементарные субъединицы. У эукариот инициирующими триплетами являются AUG, UUG, AUA и ACG. Три кодона из 64 (UGA, UAG, UAA) не кодируют аминокислот, а служат знаками окончания трансляции (стоп-кодоны). Обычно ими заканчиваются все транслируемые гены. Возникновение в результате мутации нонсенс-кодонов внутри гена приводит к преждевременной терминации трансляции и прекращению синтеза белка.
В1953 году Фрэнсис Крик совместно с Джеймсом Уотсоном сделал предположение, что только 20 кодонов генетического кода имеют значение, а остальные 44 триплета являются бессмысленными. В 1961 Ф. Крик с сотрудниками получил подтверждение гипотезы триплетного неперекрывающегося кода без запятых.
Расшифровать генетический код удалось in vitro, благодаря технике белкового синтеза в бесклеточных системах, то есть в клеточных экстрактах, содержащих все необходимые компоненты аппарата трансляции (тРНК, иРНК, рибосомы, аминокислоты, ферменты, источник энергии (АТФ и ГТФ), а также вспомогательные компоненты), за исключением только принадлежащий клетке мРНК. Вводя в такие экстракты искусственно синтезированные мРНК, можно было изучать включения меченых аминокислот в строящиеся белки. М. Ниренберг и Ф. Ледер провели опыт по помещению в бесклеточную систему трансляции различных олигорибонуклеотидов и выявили, что конкретные тририбонуклеотиды, ассоциированные с рибосомами, связывают только определенные фракции тРНК, с определенными мечеными аминокислотами. Например, олигорибонуклеотид УУУ связывает тРНК, имеющую антикодон ААА и несущую аминокислоту фенилаланин. Следовательно, кодон мРНК УУУ кодирует аминокислоту фенилаланин. С помощью такого метода к 1965 году генетический код был расшифрован полностью.
Летом 1966 года на симпозиуме по количественной биологии в Колд-Спринг-Харборе (США) все полученные данные были систематизированы Ф. Криком. Расшифрованный генетический код E. coli, исследованный методом in vitro, полностью согласовывался также с другими независимыми данными, полученными методом in vivo для других видов.
Генетический код — способ кодирования последовательностью нуклеотидов в ДНК аминокислотной последовательности белков. Для генетического кода характерны следующие свойства (см. следующие разделы):
подряд, без пропусков
Генные знаки препинания Участок ДНК, кодирующий одну полипептидную цепь или одну молекулу РНК, называется геном. После каждого кодирующего белок участка гена находится стоп-кодон, регулирующий трансляцию. К таким «знакам препинания» относятся и стоп-кодоны UAA, UAG и UGA. Эти сигналы опознаёт рибосома, но не РНК_полимераза — для неё на ДНК есть свои «стоп-сигналы», состоящие более чем из трех нуклеотидов.
Кодон AUG (первый после лидерной последовательности) выполняет роль «заглавной буквы», то есть кодирует метионин (у эукариот) или формилметионин (у прокариот), с которого начинается образование полипептидной цепи в процессе трансляции.
Кодоны UAA (охра, или Ochre), UAG (амбер-кодон, или Amber) и UGA (опал, или Opal) являются терминаторными кодонами и кодируют прекращение (терминацию) синтеза полипептиднойцепи трансляции.
Если AUG — «заглавная буква», стоп-кодоны — «точки», то с «абзацем» можно сравнить оперон и комплементарная ему мРНК, присутствующие только в прокариотической клетке. Оперон — участок ДНК бактерии, отвечающий за отдельный участок метаболического пути. Он кодирует совместно или последовательно работающие белки, объединенные под одним (или несколькими) промоторами.
У эукариот внутригенные стоп-кодоны и иные «знаки препинания» отсутствуют, что было экспериментально доказано Сеймуром Бензером и Фрэнсисом Криком в 1961 году. У прокариот с оперона часто считывается одна молекула полицистронной мРНК. В её нуклеотидной последовательности есть несколько стоп-кодонов, а между ними — рамки считывания для нескольких полипептидных цепочек. При трансляции прокариотическая рибосома «перепрыгивает» стоп-кодоны и продолжает синтез следующего белка, а синтезированная полипептидная цепь при этом отделяется от рибосомы.
В 1956 году американский ученый Джордж Гамов высказал предположение о перекрываемости генетического кода. Оно заключается в следующем: предположим, у нас есть следующая последовательность нуклеотидов: УУАГУААЦГУАА
В этой последовательности могут действовать кодоны
Плюс перекрываемого кода — компактность (недаром это свойство обнаружено у некоторых генов вирусов). Минус — явная зависимость структуры белка от замены нуклеотида.
После расшифровки генетического кода было показано, что он неперыкрывающийся, то есть в последовательности нуклеотидов УУАГУААЦГУАА действуют только кодоны УУА ГУА АЦГ УАА.
Как правило, для каждого гена существует одна открытая рамка считывания.
У бактерий многие иРНК полицистронные. Они кодируют несколько полипептидных цепей, и кодирующие их последовательности разделены стоп-кодонами. При трансляции бактериальная рибосома «перескакивает» стоп-кодоны, сразу же начиная синтез следующей полипептидной цепи; белок, синтез которого закончился, при этом отделяется от рибосомы.
В 1954 году американский ученый Джордж Гамов высказал предположение о кодировании одним кодоном одной аминокислоты, но это предположение оказалось неверным. Так как триплет состоит из трёх последовательных нуклеотидов, а всего этих нуклеотидов четыре различных, возможных триплетов может быть 4 ³=64 (кроме стоп-кодонов UAA, UAG и UGA, так что не 64, а 61), что превышает количество существующих аминокислот. В связи с этим было высказано предположение, подтвердившееся в дальнейшем, о так называемой вырожденности генетического кода — одну аминокислоту кодирует больше одного триплета, за исключением метионина и триптофана.
Отдельные аминокислоты кодируются группами (сериями) кодонов-синонимов. 18 серий из 20 содержат от двух до шести кодонов, две серии (для аминокислот метионина и триптофана) не вырождены и содержат по одному кодону. Средняя вырожденность генетического кода приблизительно равна трём кодонам на серию.
Вырожденность называется систематической, если синонимичные кодоны различаются либо пуринами, либо пиримидинами, либо вообще любыми из четырех своих нуклеотидов. Этим принципам удовлетворяют только 30 пар кодонов из 32 возможных, а также только восемь тетрад из 16. Остальные же варианты вырожденности называются несистематическими. Они относятся, как правило, к большим сериям: лейцин и аргинин — связные серии, серин — несвязная серия, изолейцин, кодируемый в три кодона — полносвязная серия.
Единственный известный на сегодняшний день пример, когда это свойство нарушается — использование кодона UGA у инфузории Euplotes crassus. В зависимости от окружения он кодирует две аминокислоты — цистеин и селеноцистеин [1].
Универсальность генетического кода означает использование всеми живыми организмами одного генетического кода, то есть все живые существа используют одинаковые наборы кодонов для кодирования одних и тех же аминокислот.
Генетический код клетки
Ранее мы подчёркивали, что нуклеотиды имеют важную для формирования жизни на Земле особенность ― при наличии в растворе одной полинуклеотидной цепочки спонтанно происходит процесс образования второй (параллельной) цепочки на основании комплементарного соединения родственных нуклеотидов. Одинаковое число нуклеотидов, в обоих цепочках и их химическое родство, является непременным условием для осуществления такого рода реакций.
Однако при синтезе белка, когда информация с иРНК реализуется в структуру белка никакой речи о соблюдении принципа комплементарности идти не может. Это связано с тем, что в иРНК, и в синтезированном белке различно не только число мономеров, но и, что особенно важно, отсутствует структурное сходство между ними (с одной стороны нуклеотиды, с другой аминокислоты). Понятно, что в этом случае возникает необходимость создания нового принципа точного перевода информации с полинуклеотида в структуру полипептида. В эволюции такой принцип был создан и в его основу был заложен генетический код.
Генетический код ― это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке.
Свойства генетического кода
Генетический код имеет несколько свойств:
Следует отметить, что некоторые авторы предлагают ещё и другие свойства кода, связанные с химическими особенностями входящих в код нуклеотидов или с частотой встречаемости отдельных аминокислот в белках организма и т.д. Однако эти свойство вытекают из вышеперечисленных, поэтому там мы их и рассмотрим.
Триплетность
Генетический код, как и многое сложно организованные система имеет наименьшую структурную и наименьшую функциональную единицу. Триплет ― наименьшая структурная единица генетического кода. Состоит она из трёх нуклеотидов. Кодон ― наименьшая функциональная единица генетического кода. Как правило, кодонами называют триплеты иРНК. В генетическом коде кодон выполняет несколько функций. Во-первых, главная его функция заключается в том, что он кодирует одну аминокислоту. Во-вторых, кодон может не кодировать аминокислоту, но, в этом случае, он выполняет другую функцию (см. далее). Как видно из определения, триплет ― это понятие, которое характеризует элементарную структурную единицу генетического кода (три нуклеотидов). Кодон ― характеризует элементарную смысловую единицу генома ― три нуклеотида определяют присоединение к полипептидной цепочки одной аминокислоты.
Элементарную структурную единицу вначале расшифровали теоретически, а затем её существование подтвердили экспериментально. И действительно, 20 аминокислот невозможно закодировать одним или двумя нуклеотидом т.к. последних всего 4. Три нуклеотида из четырёх дают 43 = 64 варианта, что с избытком перекрывает число имеющихся у живых организмах аминокислот (см.табл. 1).
Представленные в таблице 64 сочетания нуклеотидов имеют две особенности. Во-первых, из 64 вариантов триплетов только 61 являются кодонами и кодируют какую-либо аминокислоту, их называют смысловые кодоны. Три триплета не кодируют.
Таблица 1.
Как пользоваться этой таблицей, смотрите в этом видео:
Стоп-кодоны
Кодоны информационной РНК и соответствующие им аминокислоты являются стоп-сигналами, обозначающие конец трансляции. Таких триплетов три ― УАА, УАГ, УГА, их ещё называют «бессмысленные» (нонсенс кодоны). В результате мутации, которая связана с заменой в триплете одного нуклеотида на другой, из смыслового кодона может возникнуть бессмысленный кодон. Такой тип мутации называют нонсенс-мутация. Если такой стоп-сигнал сформировался внутри гена (в его информационной части), то при синтезе белка в этом месте процесс будет постоянно прерываться ― синтезироваться будет только первая (до стоп-сигнала) часть белка. У человека с такой патологией будет ощущаться нехватка белка и возникнут симптомы, связанные с этой нехваткой. Например, такого рода мутация выявлена в гене, кодирующем бета-цепь гемоглобина. Синтезируется укороченная неактивная цепь гемоглобина, которая быстро разрушается. В результате формируется молекула гемоглобина, лишённая бета-цепи. Понятно, что такая молекула вряд ли будет полноценно выполнять свои обязанности. Возникает тяжёлое заболевания, развивающееся по типу гемолитической анемии (бета-ноль талассемия, от греческого слова «Таласа» ― Средиземное море, где эта болезнь впервые обнаружена).
Механизм действия стоп-кодонов отличается от механизма действия смысловых кодонов. Это следует из того, что для всех кодоны, кодирующие аминокислоты, найдены соответствующие тРНК. Для нонсенс-кодонов тРНК не найдены. Следовательно, в процессе остановки синтеза белка тРНК не принимает участие.
Кодон АУГ (у бактерий иногда ГУГ) не только кодируют аминокислоту метионин и валин, но и является инициатором трансляции.
Неканонические значения кодонов
По крайней мере у 16 типов организмов генетический код отличается от канонического. Например многие виды зелёных водорослей Acetabularia транслируют стандартные стоп-кодоны UAG и UAA в аминокислоту глицин, а гриб Candida интерпретирует РНК-кодон CUG не как лейцин, а как серин. А у митохондрий пекарских дрожжей (Saccharomyces cerevisiae) четыре из шести кодонов, обычно транслирующихся в лейцин, кодируют треонин.
Существование таких вариаций свидетельствует о возможной эволюции генетического кода.
Представители всех трёх доменов живых организмов иногда прочитывают стандартный стоп-кодон UGA как 21-ю аминокислоту селеноцистеин, не относящуюся к 20 стандартным. Селеноцистеин образуется при химической модификации серина на стадии, когда последний ещё не отсоединился от тРНК в составе рибосомы.
Аналогично у представителей двух доменов (архебактерий и бактерий) стоп-кодон UAG прочитывается как 22-я аминокислота пирролизин.
Вырожденность, или избыточность
61 из 64 триплетов кодируют 20 аминокислот. Такое трёхразовое превышение числа триплетов над количеством аминокислот позволяет предположить, что в переносе информации могут быть использованы два варианта кодирования. Во-первых, не все 64 кодона могут быть задействованы в кодировании 20 аминокислот, а только 20 и, во-вторых, аминокислоты могут кодироваться несколькими кодонами. Исследования показали, что природа использовала последний вариант.
Код, при котором одна аминокислота кодируется несколькими триплетами, называется вырожденным или избыточным. Почти каждой аминокислоте соответствует несколько кодонов. Так, аминокислота лейцин может кодироваться шестью триплетами — УУА, УУГ, ЦУУ, ЦУЦ, ЦУА, ЦУГ. Валин кодируется четырьмя триплетами, фенилаланин — двумя и только триптофан и метионин кодируются одним кодоном. Свойство, которое связано с записью одной и той же информации разными символами носит название вырожденность.
Число кодонов, предназначенных для одной аминокислоты, хорошо коррелируется с частотой встречаемости аминокислоты в белках. И это, скорее всего, не случайно. Чем больше частота встречаемости аминокислоты в белке, тем чаще представлен кодон этой аминокислоты в геноме, тем выше вероятность его повреждения мутагенными факторами. Поэтому понятно, что мутированный кодон имеет больше шансов кодировать туже аминокислоту при высокой его вырожденности. С этих позиций вырожденность генетического кода является механизмом защищающим геном человека от повреждений.
Необходимо отметить, что термин вырожденность используется в молекулярной генетике и в другом смысле. Так основная часть информации в кодоне приходится на первые два нуклеотида, основание в третьем положении кодона оказывается малосущественным. Этот феномен называют «вырожденностью третьего основания». Последняя особенность сводит до минимума эффект мутаций. Например, известно, что основной функцией эритроцитов крови является перенос кислорода от легких к тканям и углекислого газа от тканей к легким. Осуществляет эту функцию дыхательный пигмент — гемоглобин, который заполняет всю цитоплазму эритроцита. Состоит он из белковой части ― глобина, который кодируется соответствующим геном. Кроме белка в молекулу гемоглобина входит ген, содержащий железо. Мутации в глобиновых генах приводят к появлению различных вариантов гемоглобинов. Чаще всего мутации связаны с заменой одного нуклеотида на другой и появлением в гене нового кодона, который может кодировать новую аминокислоту в полипептидной цепи гемоглобина. В триплете, в результате мутации может быть заменён любой нуклеотид ― первый, второй или третий.
Мутации в гемоглобине
Известно несколько сотен мутаций, затрагивающих целостность генов глобина. Около 400 из них связаны с заменой единичных нуклеотидов в гене и соответствующей аминокислотной заменой в полипептиде. Из них только 100 замен приводят к нестабильности гемоглобина и различного рода заболеваниям от легких до очень тяжелых. 300 (примерно 64%) мутаций-замен не влияют на функцию гемоглобина и не приводят к патологии. Одной из причин этого является упомянутая выше «вырожденность третьего основания», когда замена третьего нуклеотида в триплете, кодирующем серин, лейцин, пролин, аргинин и некоторые другие аминокислоты приводит к появлению кодона-синонима, кодирующего ту же аминокислоту. Фенотипически такая мутация не проявится. В отличие от этого любая замена первого или второго нуклеотида в триплете в 100 % случаях приводит к появлению нового варианта гемоглобина. Но и в этом случае тяжёлых фенотипических нарушений может и не быть. Причиной этому является замена аминокислоты в гемоглобине на другую сходную с первой по физико-химическим свойствам. Например, если аминокислота, обладающая гидрофильными свойствами, заменена на другую аминокислоту, но с такими же свойствами.
Гемоглобин состоит из железопорфириновой группы гема (к ней и присоединяются молекулы кислорода и углекислоты) и белка — глобина. Гемоглобин взрослого человека (НвА) содержит две идентичные a-цепи и две b-цепи. Замена в гене, кодирующем b-цепь гемоглобина первого или второго нуклеотида практически всегда приводит к появлению в белка новых аминокислот, нарушению функций гемоглобина и тяжёлым последствия для больного. Например, замена “Ц” в одном из триплетов ЦАУ (гистидин) на “У” — приведет к появлению нового триплета УАУ, кодирующего другую аминокислоту — тирозин. Фенотипически это проявится в тяжёлом заболевании.
Гистидин, тирозин
Аналогичная замена в 63 положении b-цепи полипептида гистидина на тирозин приведет к дестабилизации гемоглобина. Развивается заболевание метгемоглобинемия. Замена, в результате мутации, глутаминовой кислоты на валин в 6-м положении b-цепи является причиной тяжелейшего заболевания — серповидно-клеточной анемии. Не будем продолжать печальный список.
Глутаминовая кислота и лизин
Отметим только, что при замене первых двух нуклеотидов может появится аминокислота по физико-химическим свойствам похожая на прежнюю. Так, замена 2-го нуклеотида в одном из триплетов, кодирующего глутаминовую кислоту (ГАА) в b-цепи на “У” приводит к появлению нового триплета (ГУА), кодирующего валин, а замена первого нуклеотида на “А” формирует триплет ААА, кодирующий аминокислоту лизин. Глутаминовая кислота и лизин сходны по физико-химическим свойствам — они обе гидрофильны. Валин — гидрофобная аминокислота. Поэтому, замена гидрофильной глутаминовой кислоты на гидрофобный валин, значительно меняет свойства гемоглобина, что, в конечном итоге, приводит к развитию серповидноклеточной анемии, замена же гидрофильной глутаминовой кислоты на гидрофильный лизин в меньшей степени меняет функцию гемоглобина — у больных возникает легкая форма малокровия.
Урацил и цитозин
В результате замены третьего основания новый триплет может кодировать туже аминокислоты, что и прежней. Например, если в триплете ЦАУ урацил был заменён на цитозин и возник триплет ЦАЦ, то практически никаких фенотипических изменений у человека выявлено не будет. Это понятно, т.к. оба триплета кодируют одну и туже аминокислоту ― гистидин.
В заключении уместно подчеркнуть, что вырожденность генетического кода и вырожденность третьего основания с общебиологических позиция являются защитными механизмами, которые заложены в эволюции в уникальной структуре ДНК и РНК.
Однозначность
Каждый триплет (кроме бессмысленных) кодирует только одну аминокислоту. Таким образом, в направлении кодон ― аминокислота генетический код однозначен, в направлении аминокислота ― кодон ― неоднозначен (вырожденный).
И в этом случае необходимость однозначности в генетическом коде очевидна. При другом варианте при трансляции одного и того же кодона в белковую цепочку встраивались бы разные аминокислоты и в итоге формировались белков с различной первичной структурой и разной функцией. Метаболизм клетки перешёл бы в режим работы «один ген ― несколько полипептидов». Понятно, что в такой ситуации регулирующая функция генов была бы полностью утрачена.
Полярность
Считывание информации с ДНК и с иРНК происходит только в одном направлении. Полярность имеет важное значение для определения структур высшего порядка (вторичной, третичной и т.д.). Ранее мы говорили о том, что структуры низшего порядка определяют структуры более высшего порядка. Третичная структура и структуры более высокого порядка у белков, формируются сразу же как только синтезированная цепочка РНК отходит от молекулы ДНК или цепочка полипептида отходит от рибосомы. В то время, когда свободный конец РНК или полипептида приобретает третичную структуру, другой конец цепочки ещё продолжает синтезироваться на ДНК (если транскрибируется РНК) или рибосоме (если транскрибируется полипептид).
Поэтому однонаправленный процесс считывания информации (при синтезе РНК и белка) имеет существенное значение не только для определения последовательности нуклеотидов или аминокислот в синтезируемом веществе, но для жёсткой детерминации вторичной, третичной и т.д. структур.
Неперекрываемость
Код может быть перекрывающимся и не перекрывающимся. У большинства организмов код не перекрывающийся. Перекрывающийся код найден у некоторых фагов.
Сущность не перекрывающего кода заключается в том, что нуклеотид одного кодона не может быть одновременно нуклеотидом другого кодона. Если бы код был перекрывающим, то последовательность из семи нуклеотидов (ГЦУГЦУГ) могла кодировать не две аминокислоты (аланин-аланин) как в случае с не перекрывающимся кодом, а три (если общим является один нуклеотид) или пять (если общими являются два нуклеотида). В последних двух случаях мутация любого нуклеотида привела бы к нарушению в последовательности двух, трёх и т.д. аминокислот.
Однако установлено, что мутация одного нуклеотида всегда нарушает включение в полипептид одной аминокислоты. Это существенный довод в пользу того, что код является не перекрывающимся. Неперекрываемость генетического кода связана с ещё одним свойством ― считывание информации начинается с определённой точки ― сигнала инициации. Таким сигналом инициации в иРНК является кодон, кодирующий метионин АУГ. Следует отметить, что у человека всё-таки имеется небольшое число генов, которые отступают от общего правила и перекрываются.
Компактность
Между кодонами нет знаков препинания. Иными словами триплеты не отделены друг от друга, например, одним ничего не значащим нуклеотидом. Отсутствие в генетической коде «знаков препинания» было доказано в экспериментах.
Универсальность
Код един для всех организмов, живущих на Земле. Прямое доказательство универсальности генетического кода было получено при сравнении последовательностей ДНК с соответствующими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используется одни и те же наборы кодовых значений. Есть и исключения, но их не много.
Первые исключения из универсальности генетического кода были обнаружены в митохондриях некоторых видов животных. Это касалось кодона терминатора УГА, который читался так же как кодон УГГ, кодирующий аминокислоту триптофан. Были найдены и другие более редкие отклонения от универсальности.
Краткие сведения
Генетический код ― это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке. Генетический код имеет несколько свойств.