Исследование показывает, что первые живые организмы отдавали предпочтение коротким аминокислотам и комплексным соединениям серы гораздо раньше, чем считалось ранее. Это открытие ставит под сомнение классическую гипотезу эволюции генетического кода и предполагает существование вымерших генетических кодов, предшествовавших современной ДНК.
Несмотря на невероятное разнообразие, все формы жизни на Земле имеют один и тот же генетический код, состоящий из одних и тех же аминокислот. Согласно общепринятой гипотезе, этот генетический код был собран из ранних аминокислот, присутствовавших на планете еще до возникновения жизни. Затем из этих ранних аминокислот возникли бы так называемые «поздние» аминокислоты, требующие биотического синтеза.
Эксперимент Урея-Миллера 1952 года, ставший основой большинства гипотез об эволюции генетического кода, показал, что инертная материя может порождать строительные блоки жизни посредством простых химических реакций. Эксперимент установил относительно точный порядок набора аминокислот для формирования генетического кода первых живых организмов.
На основе этого эксперимента исследователи выдвинули гипотезу, что первыми аминокислотами для формирования генетического кода были те, которые наиболее полезны для структуры клеточных мембран. Затем были набраны аминокислоты, полезные для процессов сворачивания, за ними последовали аминокислоты с металлическими связями и аминокислоты с антиоксидантными свойствами.
Однако точный момент возникновения современного генетического кода до сих пор остается предметом споров. В частности, в ходе эксперимента Урея-Миллера не было получено ни одной серосодержащей аминокислоты. Поэтому принято считать, что серосодержащие аминокислоты были включены в генетический код гораздо позже.
Тем не менее сера была одним из самых распространенных элементов на первобытной Земле. С другой стороны, неудивительно, что в эксперименте Урея-Миллера не было получено сернистых аминокислот, поскольку сера не входила в число используемых реагентов. В результате истинная причастность знаменитого эксперимента к эволюции генетического кода недавно была поставлена под сомнение.
Исследователи из Университета Аризоны и Университета Альберты считают, что эволюция генетического кода плохо изучена, поскольку основана в основном на лабораторных экспериментах, а не на эволюционных данных. Результаты их исследования, основанного на анализе древних белковых последовательностей, свидетельствуют о новых фактах, противоречащих общепринятой гипотезе.
«Генетический код — это удивительная вещь, в которой строка ДНК или РНК, содержащая последовательности из четырех нуклеотидов, преобразуется в белковые последовательности с использованием 20 различных аминокислот», — объясняет Джоанна Масел из Университета Альберты, один из ведущих авторов исследования, в блоге Университета Аризоны. «Это невероятно сложный процесс, и наш код удивительно эффективен. Он почти оптимален для целого ряда вещей, и ему пришлось эволюционировать поэтапно», — утверждает она.
Короткие аминокислоты первыми интегрируются в генетический код
Исследовательская группа использовала метод секвенирования, анализирующий аминокислотные последовательности, восходящие к протеому последнего универсального общего предка (или LUCA). Это гипотетическая популяция организмов, живших 4 миллиарда лет назад и представлявших собой общего предка всего живого на Земле. Считается, что она является ключом к возникновению биологического катализа.
В отличие от предыдущих исследований, в которых анализировались полные последовательности белков, ученые сосредоточились на более коротких сегментах аминокислот, называемых «белковыми доменами». «Если представить себе белок как автомобиль, то домен — это как колесо», — объясняет Савсан Вехби из Университета Аризоны, ведущий автор исследования, подробно описанного в журнале PNAS. «Это деталь, которая может быть использована в разных автомобилях, а колеса существуют гораздо дольше, чем автомобили».
Чтобы определить, когда конкретные аминокислоты были добавлены в генетический код, исследователи использовали инструмент статистического анализа данных. С его помощью сравнивалась скорость включения отдельных аминокислот с течением времени на уровне последовательностей, восходящих к LUCA.
Если аминокислота появляется преимущественно в более старых последовательностях, это говорит о том, что она была набрана очень рано. С другой стороны, аминокислоты, появившиеся позже, не были обнаружены в самых старых последовательностях, восходящих к LUCA.
Результаты показали, что короткие аминокислоты были набраны первыми, а более длинные и сложные были включены позже. Кроме того, серосодержащие аминокислоты и аминокислоты с металлическими связями появились гораздо раньше, чем предполагалось ранее.
Кроме того, исследователи выявили более 400 семейств последовательностей, восходящих к LUCA. Более сотни из них должны были появиться еще раньше и диверсифицироваться еще до LUCA. Они содержали аминокислоты с кольцеобразной ароматической структурой, такие как триптофан и тирозин.
Команда пришла к выводу, что современный генетический код, вероятно, появился после других кодов, которые сейчас вымерли. По словам Масела, эти результаты «дают нам подсказки о других генетических кодах, которые предшествовали нашему и с тех пор исчезли в пучине геологического времени».
Потенциальные новые биосигнатуры для астробиологии
По мнению исследователей, эти результаты могут иметь важные последствия для астробиологии. Богатая серой природа первых аминокислот-предшественников жизни может открыть путь к идентификации новых биосигнатур. Кроме того, планетарные тела, считающиеся наиболее перспективными для поиска внеземной жизни (такие как Марс, Энцелад, Европа и т.д.), содержат большое количество соединений серы.
«Такая информация может уточнить то, что мы ищем в биосигнатурах, и облегчить обнаружение форм жизни, процветающих в богатых серой или схожих по химическому составу средах за пределами Земли», — заключает Данте Лауретта из Университета Альберты, также являющийся соавтором исследования.