Логика случая. О природе и происхождении биологической эволюции
Шрифт:
Рис. 4–8. Модель рождения, смерти и инновации в применении к эволюции генных семейств. Под рождением подразумевается генная дупликация или приобретение псевдопаралогичного гена путем горизонтального переноса с последующим расширением паралогичного семейства, смертью называется утрата гена (независимо от способа утраты), а инновацией считается приобретение нового гена, который становится родоначальником нового семейства (Karev et al., 2002)
Структура и эволюция сетей: всеобщность степенного закона и стоящие за ним фундаментальные процессы
Сеть (network) – популярнейшее понятие системной биологии, повсеместно пронизывающее современную культуру, не только в рамках биологии или науки в целом [41] . В самом деле, трудно придумать более естественный способ представления связей между многочисленными объектами, чем сеть (в математике рассматриваемую как ориентированный или неориентированный граф). В биологическом контексте узлами (или иначе – вершинами) сети часто представляют гены или белки, а ребрами (связями между узлами) обозначают их взаимодействия, которые могут быть физическими, генетическими или регуляторными (Barabasi and Oltvai, 2004). К настоящему времени разработано
41
Многие читатели вспомнят теорию шести рукопожатий. Еще более знакомая иллюстрация встречается в журналах, бесплатно предоставляемых во время рейса большинством авиалиний. В следующий раз во время перелета взгляните на неизменно печатаемую на тыльной стороне журнала сеть авиатрасс – это прекрасный пример масштабно-инвариантной сети, с авиационными хабами в Атланте, Чикаго или Денвере. И конечно, Интернет – это тоже масштабно-инвариантная сеть. Увлекательное, и достаточно точное теоретически, рассмотрение сетей во всех сферах жизни можно найти в популярных книгах Альберта-Ласло Барабаши, одного из пионеров сетевой биологии (Linked. The New Science of Networks. New York: Perseus Press, 2002), и Дункана Ваттса (Six Degrees: The Science of a Connected Age. New York: W.W. Norton & Co., 2004).
Таблица 4–1. Случайные и масштабно-инвариантные сети.
Рис. 4–9. Предпочтительное присоединение в эволюции биологических сетей: а – фрагмент сети и новый добавляемый элемент; б – результат включения новой вершины в сеть. Ki = степень i– й вершины, pi = вероятность присоединения новой вершины к вершине i (см. табл. 4–1)
Примечательно, что степенная функция распределения степеней вершин, по всей видимости, является неотъемлемым свойством эволюционирующих сетей (включая Интернет) и не обязательно имеет биологическое происхождение. Все типы биологических сетей, как описывающих физические взаимодействия между белками, так и отражающих взаимную регуляцию генов, несомненно, появились в результате эволюции и обладают указанным типом распределения (другими словами, являются масштабно-инвариантными). Для объяснения универсального степенного закона распределения Барабаши с коллегами предложили принцип предпочтительного присоединения (preferential attachment) новых вершин, что на простом циничном языке означает, что в процессе эволюции сети «богатые делаются еще богаче» (Barabasi, 2002). Предпочтительное присоединение представляет собой стохастический, неадаптивный процесс. В самом деле, когда создается новый сайт в Интернете и случайно связывается с другими сайтами, с большей вероятностью он окажется связанным с хабом, чем с изолированным сайтом, просто потому что очень многие различные пути в сети ведут к хабам (табл. 4–1). Этот режим эволюции по своей природе консервативен – сеть сохраняет свою структуру в процессе роста. Является ли предпочтительное присоединение главным принципом эволюции биологических сетей? По этому вопросу еще не достигнуто согласия. В случае если этот принцип существен для биологических сетей, должны обнаружиться некоторые специфические биологические механизмы, обеспечивающие его выполнение (рис. 4–9). Высокая интерактивность хабов, представленная «липкостью» некоторых белков, склонных к взаимодействиям, не обязательно функционально значимым, со многими другими белками, могла бы быть одним из таких механизмов. Еще более важный вклад в формирование сетей осуществляется посредством важнейшего механизма эволюции – генной дупликации. Когда ген удваивается, все имеющиеся его связи с другими генами также удваиваются, а потом начинают постепенно расходиться в процессе последующей эволюции. В простейшей модели эволюции (такой как сбалансированная модель рождения, смерти и обновления), если частота генной дупликации пропорциональна размеру семейства, структура сети (то есть распределение степеней вершин) будет сохраняться даже при отсутствии давления отбора (Koonin et al., 2002; Lynch, 2007a).
Разбиение генома по биологическим функциям: универсальный степенной закон
До сих пор в нашем обсуждении универсальных количественных закономерностей в геномной эволюции мы преднамеренно обходили стороной вопрос биологических функций. Конечно, это абстракция: геном ни в коем случае не сумма безликих «молекул», а ансамбль генов, каждый из которых кодирует определенную биологическую функцию [42] . Сначала может показаться неожиданным, что способ рассуждения, позаимствованный из статистической физики, может быть применен и к биологическим функциям. Для применения такого подхода необходимо разделить гены на большие функциональные классы, о которых можно думать как о разных типах «молекул» и которые пригодны для статистического анализа, если они включают достаточно много генов.
42
Точнее, конечно, будет сказать, что каждый ген вносит вклад в разные биологические функции, поскольку все гены обладают той или иной степенью плейотропии.
Как показывается в серии доскональных исследований Эрика Ван Нимвегена [43] , различные функциональные классы генов по-разному соотносятся с общим числом генов в геноме (Molina and van Nimwegen, 2009; van Nimwegen, 2003). Не учитывая некоторые отклонения, для прокариот можно указать три основных показателя степени, описывающие эти соотношения: 0, 1 и 2. Генам белков, участвующих в информационных процессах (трансляции, транскрипции и репликации), соответствует показатель степени 0 – число таких генов достигает некоторого константного значения уже в минимальных геномах и в принципе не зависит от сложности генома. Число метаболических ферментов и транспортных белков примерно прямо пропорционально общему числу генов (показатель степени 1). Регуляторные гены и компоненты систем передачи сигналов
43
У каждого важного открытия есть свои предшественники – нужно только повнимательнее поискать. Я думаю, это один из «универсальных законов» истории науки. Похоже на то, что «закон Ван Нимвегена» был впервые описан в статье о геноме синегнойной палочки, но без акцента на нем и без сколько-нибудь серьезного анализа (C. K. Stover, X. Q. Pham, A. L. Erwin, S. D. Mizoguchi, P. Warrener, M. J. Hickey, F. S. Brinkman, W. O. Hufnagle, D. J. Kowalik, M. Lagrou, R. L. Garber, L. Goltry, E. Tolentino, S. Westbrock-Wadman, Y. Yuan, L. L. Brody, S. N. Coulter, K. R. Folger, A. Kas, K. Larbig, R. Lim, K. Smith, D. Spencer, G. K. Wong, Z. Wu, I. T. Paulsen, J. Reizer, M. H. Saier, R. E. Hancock, S. Lory, and M. V. Olson. Complete Genome Sequence of Pseudomonas Aeruginosa PAO1, an Opportunistic Pathogen // Nature 406 (2000): 959–964).
Фундаментальные причины существования различных соотношений для различных функциональных классов генов еще не выяснены. Привлекательно простая модель эволюции метаболических сетей прокариот как «ящика с инструментами», предложенная Сергеем Масловым и коллегами, может быть первым шагом на пути объяснения квадратичной зависимости, характерной для регуляторных генов (Maslov et al., 2009). В этой модели ферменты, необходимые для утилизации новых метаболитов, добавляются вместе с соответствующими им регуляторами (в первую очередь посредством горизонтального переноса генов, гл. 5) во все более развитую сеть реакций. В результате усложнения сети, обеспечивающей все большее разнообразие ферментов промежуточных реакций, увеличивается отношение числа регуляторных генов к регулируемым. В какой-то момент, и его наступление можно точно предсказать, цена добавления новых регуляторов неизбежно станет слишком невыгодной («разрастающаяся бюрократия») и будет ограничивать рост сложности генома.
Гипотеза «бюрократического потолка» для верхней границы сложности генома выглядит особенно правдоподобно в свете почти полного отсутствия роста числа генов в геномах позвоночных, особенно млекопитающих (и в наших геномах тоже), для которых связь между числом генов и размером генома очевидно нарушена (см. гл. 3 и 8). В принципе число генов могло бы быть напрямую ограничено ценой репликации ДНК, но для огромных геномов позвоночных этот фактор можно смело исключить как главное ограничение. Соответственно, цена регуляции, возможно совместно с ценой экспрессии, выглядит наиболее вероятным кандидатом на роль основного фактора, ограничивающего рост числа генов. Поэтому не случайно позвоночные (и в меньшей степени другие многоклеточные эукариоты) выработали новые, замысловатые способы увеличения сложности протеома, такие как широко распространенный альтернативный сплайсинг, альтернативная трансляция и сложная регуляция (в особенности обширный, все еще слабо изученный набор регуляторных РНК). Такие формы сложности не вызывают инфляционный рост числа белок-кодирующих генов и, таким образом, снижают по крайней мере некоторые издержки, особенно издержки трансляции (см. гл. 8).
Рис. 4-10. Четко различающиеся соотношения между различными функциональными классами генов и размером генома (общим числом белок-кодирующих генов) прокариот. Использована информация из базы данных COG (Tatusov et al., 2003). График построен в двойных логарифмических координатах.
Универсальная зависимость численности функциональных классов генов от размера генома находится в обратной зависимости с ранее описанным степенным законом распределения численности семейств генов. Чем больше положительный показатель степени функции зависимости от размера генома для функционального класса генов (рис. 4-10), тем меньше отрицательный показатель степени функции распределения численности семейств в этом классе (рис. 4–7). Кажется интуитивно правдоподобным, что функциональные классы с сильной зависимостью от размера генома должны содержать много больших семейств паралогичных генов. Обратная зависимость этих двух универсалий генома была выведена в рамках простой эволюционной модели, в которой используются правила пропорциональных вычислений для функциональной композиции генома, например «добавить два регулятора на каждый метаболический фермент» (Grilli et al., 2011). Предсказания этой модели подтверждаются эмпирическими данными для многих геномов бактерий и архей.
Стохастичность, нейтральность и отбор в эволюции
В предыдущих разделах этой главы мы ознакомились со многими количественными универсалиями, отражающими важнейшие аспекты эволюции и функционирования генома. Среди этих универсалий мы рассматривали вездесущий степенной закон распределения, который описывает как структуру всех биологических сетей, так и семейства паралогичных генов в разнообразных геномах, близкое к логарифмически нормальному распределение скоростей эволюции генов и универсальные корреляции, такие как отрицательная корреляция между генной экспрессией и скоростью эволюции. Какова природа этих универсалий? Отражают ли они какие-то глубокие свойства эволюции или это просто статистические эффекты, не имеющие отношения к пониманию биологических явлений? Здесь и далее в этой книге (гл. 13) будет отстаиваться точка зрения на эти универсалии как на нетривиальные, характерные и биологически значимые тенденции, хотя они отражают только одну из двух (а возможно, и большего числа) дополнительных (в смысле принципа дополнительности Бора) составляющих эволюции жизни [44] .
44
По-видимому, многие из этих универсалий, во всяком случае те, которые математически представляются характерными функциями распределения, можно вывести из единого, чрезвычайно общего физического принципа, известного как принцип максимальной энтропии или принцип минимального производства информации (Jaynes, T. Probability Theory: The Logic of Science. Cambridge Univ Press, 2003). Вкратце и упрощая, можно сформулировать этот принцип так: любая макроскопическая величина, определяемая совокупностью многочисленных микроскопических процессов, принимает, с учетом необходимых ограничений, распределение с максимальной энтропией (то есть такое распределение, для получения которого требуется минимальная информация). Легко понять, что принцип максимальной энтропии тесно связан со вторым началом термодинамики. Применение этого принципа к биологической эволюции – глубокая и интересная тема, которую здесь, конечно, не раскрыть. Чрезвычайно содержательное обсуждение этих вопросов можно найти в статье Стивена Франка, с которой автор, к сожалению, познакомился уже после публикации оригинала этой книги (Frank SA. The common patterns of nature // J Evol Biol. 2009 Aug;22(8):1563-85).
Сердце Забытых Земель
9. Мир Вальдиры: ГКР
Фантастика:
фэнтези
рейтинг книги
Попаданка в деле, или Ваш любимый доктор
1. Попаданка в деле, или Ваш любимый доктор
Фантастика:
фэнтези
рейтинг книги
Ищу жену с прицепом
2. Спасатели
Любовные романы:
современные любовные романы
рейтинг книги
Камень. Книга восьмая
8. Камень
Фантастика:
фэнтези
боевая фантастика
рейтинг книги
Хозяин Теней 4
4. Безбожник
Фантастика:
попаданцы
аниме
фэнтези
рейтинг книги
Ефрейтор. Назад в СССР. Книга 2
2. Второй шанс
Фантастика:
попаданцы
альтернативная история
рейтинг книги
Огненный наследник
10. Десять Принцев Российской Империи
Фантастика:
попаданцы
аниме
фэнтези
рейтинг книги
