Логика случая. О природе и происхождении биологической эволюции
Шрифт:
Все очень маленькие (менее 1 Мб) геномы бактерий и архей принадлежат бактериям-паразитам и внутриклеточным симбионтам эукариот и единственной известной архее-паразиту (или симбионту) Nanoarchaeum equitans, которая живет за счет другой археи, Ignicoccus hospitalis. Таким образом, кажется все более вероятным, что минимальный размер генома свободно живущего прокариота, по крайней мере автотрофа, который не зависит от других форм жизни для добывания пищи, немного превышает 1 Мб. Текущий рекорд редукции генома среди свободно живущих клеток, около 1,3 Мб, принадлежит фотосинтезирующей морской альфа-протеобактерии Pelagibacter ubique (SAR11), которая также является наиболее распространенной из известных клеточных форм жизни на Земле (Giovannoni et al., 2005). (Связь между размером популяции и размером генома потенциально важна, мы вернемся к этому вопросу в гл. 8.)
Рис. 5–1. Распределение
Как мы уже обсуждали в главе 3, бактериальные и архейные геномы характеризуются высокой плотностью белок-кодирующих генов, которые занимают большую часть ДНК. Бактериальные и архейные геномы демонстрируют одномодальное и довольно острое распределение плотности генов, большей частью 0,8–1,2 гена на Кб геномной ДНК (отсюда предельно простое эмпирическое правило: 1 ген на 1000 пар нуклеотидов). Архейное распределение по сравнению с бактериальным сдвинуто в сторону более высоких плотностей, таким образом, в среднем архейные геномы даже более компактны, чем бактериальные. Похоже, что как кодирующие, так и межгенные области у архей немного короче по сравнению с бактериями.
Таким образом, археи и бактерии весьма похожи в смысле характерных размеров и общей архитектуры геномов, но резко отличаются от эукариот, которые охватывают много больший интервал размеров генома, имеют белок-кодирующие гены, часто прерываемые интронами, и более длинные межгенные промежутки (см. гл. 8). Эти общие признаки бактерий и архей подтверждают концепцию «прокариотного принципа организации генома» (см. более подробно ниже).
Пространство-время прокариот и его эволюция
Фрактальное пространство-время генома, пангеномы и кластеризация прокариот
В главе 3 мы сосредоточились на трехкомпонентной структуре прокариотического геномного пространства, состоящего из ядра, оболочки и облака, и показали, что эта структура фрактальна. Одни и те же три компонента, а именно небольшое ядро, оболочка большего размера и огромное по сравнению с ними «облако», проявляются на любом уровне разбиения генного пространства, от мира прокариот в целом до совсем небольших групп бактерий (см. рис. 3-14). Непосредственным следствием этой фрактальности является важность «пангеномов» – всей общности генов, представляющих геномы, принадлежащие к кластеру архей или бактерий на данном уровне. Читатель может (и должен) немедленно спросить, что определяет кластеры и откуда берутся уровни. Пока предположим, что дерево рРНК Карла Вёзе (см. рис. 2–3) разумно описывает организацию пространства-времени мира прокариот и является по крайней мере одним из источников для кластеризации. В главе 6 мы обсудим применимость и смысл концепции древа жизни более глубоко и покажем, что дерево рРНК, хотя ни в коем случае и не является полным представлением истории эволюции прокариот, тем не менее вполне осмысленно.
Огромное множество архейных и бактериальных генов кодируют белки, которые не имеют никакого измеримого сходства с какими-либо другими доступными последовательностями белков. Эти гены часто обозначают как одинокие рамки считывания (ОРС) [50] (Daubin and Ochman, 2004). Обычно в архейных и бактериальных геномах ОРС составляют 10–15 процентов от всех предсказанных генов. Многие ОРС – очень короткие, и некоторые из них могут быть не реальными генами, а результатом ошибочного предсказания при анализе генома (Ochman, 2002). Кроме того, высказывается предположение, что большинство ОРС, являющихся полноценными генами, произошли от генов бактериофагов и, соответственно, характеризуются высокой горизонтальной мобильностью, хотя в некоторых случаях они могут быть задействованы для клеточных функций и, соответственно, фиксируются в бактериальных и архейных геномах. Последние оценки, следующие из метагеномных исследований бактериофагов, предполагают, что разнообразие фаговых последовательностей очень велико и остается по большей части неизученным (Edwards and Rohwer, 2005). Таким образом, кажется привлекательной идея, что большая часть бактериальных и архейных ОРС произошла из этого огромного резервуара генов. В трехкомпонентной структуре вселенной прокариотических генов, с которой мы теперь знакомы, ОРС естественным образом объединяются с «облаком» редких генов, которые количественно доминируют в генном пространстве, но не в индивидуальных геномах, как обсуждалось в главе 3.
50
Здесь непереводимая игра слов: по-английски такие гены называют ORFans. Это обозначение происходит, с одной стороны, от ORF, Open Reading Frame (открытая рамка считывания), a с другой стороны, от Orphans (сироты – то есть гены, у которых нет известных родственников).
Насколько велико все геномное пространство прокариот? Сколько генов в общей сложности оно содержит? Надежная экстраполяция расширения геномного пространства в результате продолжающегося секвенирования бактериальных и архейных геномов и достоверная оценка реального размера этого пространства трудноосуществимы. Однако с учетом большого разнообразия микробных виромов, которые являются основным резервуаром генов и их переносчиком (см. также гл. 10), наиболее вероятно, что число элементов прокариотического геномного пространства увеличится на порядки величины, в основном, если не исключительно, за счет расширения «облака» (Koonin and Wolf, 2008b; Lapierre and Gogarten, 2009).
Эволюционная динамика архитектуры генома прокариот: опероны, суперопероны и сети соседствующих генов
Как уже отмечалось в главе 3, практически сразу же, как только были опубликованы первые полные
Рис. 5–2. Расхождение порядка следования генов между геномами бактерий: а – Borrelia afzelii PKo по сравнению с Borrelia burgdorferi B31; б – Shewanella oneidensis MR-1 по сравнению с Shewanella sp. ANA-3; в – Pseudomonas fluorescens PfO-1 по сравнению с Pseudomonas fluorescens Pf-5; г – Pseudomonas fluorescens Pf-5 по сравнению с Pseudomonas syringae pv. tomato str. DC3000. Каждая точка представляет пару ортологичных генов, идентифицированных с использованием метода наилучшего сходства при двунаправленном сравнении (см. табл. 3–1). Яркие точки показывают пары ортологичных генов, принадлежащих консервативным массивам генов; бледные точки показывают изолированные ортологи. DY – расстояние между сравниваемыми геномами в терминах порядка следования генов, как описано в Novichkov et al., 2009. DN – медианное расстояние между последовательностями несинонимических сайтов в белок-кодирующих генах.
Одной из наиболее ранних фундаментальных концепций бактериальной генетики является оперон, то есть группа совместно транскрибируемых и регулируемых генов (Jacob and Monod, 1961). Гипотеза оперона – выдающийся концептуальный прорыв Франсуа Жакоба и Жака Моно. Хотя за 50 лет, прошедших с момента ее первой публикации, было открыто огромное количество вариаций простой схемы регуляции лактозного оперона Lac репрессором, оперон выдержал проверку сравнительной геномикой как главный организационный принцип бактериальных и архейных геномов. В процессе эволюции опероны сохраняются гораздо лучше, чем протяженные синтении. Тем не менее сравнительный анализ порядка следования генов в бактериях и археях выявил небольшое количество оперонов, общих для широкого многообразия организмов. Как уже было отмечено ранее, высококонсервативные опероны, как правило, кодируют физически взаимодействующие белки, тенденция, легко объяснимая отбором, направленным против вредных эффектов дисбаланса между субъединицами сложных белковых комплексов. Наиболее эффектной иллюстрацией этой тенденции является рибосомный супероперон, включающий более 50 генов рибосомных белков, который встречается в различных комбинациях и локализациях во всех секвенированных архейных и бактериальных геномах. Анализ рибосомного супероперона и других частично сохраняющихся групп оперонов меньшего размера привел к идее сверхоперона (Lathe et al., 2000), или консервативного окружения гена (Rogozin et al., 2002), как некоего множества перекрывающихся, частично консервативных цепочек генов (известных или предсказанных оперонов; см. рис. 5–3). В дополнение к рибосомному супероперону, яркими примерами консервативного окружения являются предсказанная группа перекрывающихся оперонов, которая кодирует субъединицы экзосомного комплекса архей, и cas– гены, из которых состоит антивирусная система защиты (см. также гл. 9 и 10).
Большинство генов в каждом консервативном окружении кодируют белки, вовлеченные в один и тот же процесс или комплекс, но существуют и высококонсервативные участки, которые включают гены с функциями, как кажется, несвязанными. Яркий пример – частое присутствие гена енолазы в рибосомном окружении или генов субъединиц протеасомы в экзосомном окружении архей. Присутствие этих генов, на первый взгляд кажущихся неуместными в консервативном генном окружении, может объясняться скрытой функциональной связью, плейотропией (множественностью функций соответствующих белков), или «геномным автостопом», когда оперон объединяет гены функционально не связанные, но экспрессируемые в одинаковых условиях (Rogozin et al., 2002).