Чтение онлайн

на главную - закладки

Жанры

Шрифт:

Значит, им нужно сначала подсчитать число символов на страницу текста книги данного формата и умножить на число страниц. Но все эти подсчеты будут сугубо приближенные: и в случае с ДНК два бита/символ — недостижимый максимум.

Кроме того, надо учесть одно обстоятельство: чтобы превратиться в признаки и свойства организма, генетическая информация перекодируется, проходя по каналу:

ДНК -> РНК -> белок

Передатчик этой информации — хромосома, приемник — цитоплазма клетки, в которой синтезируется белок. А уж от набора белковых молекул и их количества зависит дальнейшая судьба клетки и всего организма.

Первый этап перекодировки

ДНК -> РНК не изменяет информационной емкости сигнала. Ведь нуклеотидный текст остается без изменения, только тимин заменяется на урацил. А это тот же тимин, только неметилированный (без группы СН3). Зато перекодировка нуклеотидного текста информационной РНК в аминокислотную последовательность белка весьма существенна.

Сейчас и в школе учат, что одна аминокислота, точнее, один аминокислотный остаток в полипептидной цепи, образующей белок, соответствует трем нуклеотидам в информационной РНК. Возможное число сочетаний из 4 по 3 — это 43, т. е. 64 символа. Если бы в наших белках было 64 аминокислоты, то энтропия на символ равнялась бы:

H = -64(1/64 log2 1/64) = 6,1 бит

Но три символа (тройки нуклеотидов, триплеты, кодоны) — бессмысленны, они аминокислот не кодируют. На них синтез полипептидной цепи обрывается, они соответствуют пробелам между словами в печатной речи и паузам — в устной. А аминокислот в белковом тексте всего 20, причем, каждая из них кодируется разным числом триплетов. Лейцин, серии, аргинин — эти буквы белкового текста кодируются каждый шестью триплетами, а метионин и триптофан — только одним триплетом каждый. Такой код называется вырожденным.

Аналогию можно найти и в человеческих языках. В старой русской орфографии звук «эф» выражался двумя символами — Ф и (ферт и фита), звук «и» — тремя: и, i, (ижица). И в орфографиях других языков встречается вырожденность кода: например, англичане звук «и» выражают через i (в начале слов, заимствованных из других языков), через е (the evening, вечер), через дифтонг ее (the speed, скорость), через еа (dean, декан), через у (prosperity). Я не останавливаюсь здесь на делении гласных на краткие и долгие; для нас это сейчас не имеет значения. Как возникла в процессе эволюции вырожденность генетического кода — неясно. Может быть, на заре жизни аминокислот в белках было больше, чем сейчас? Впоследствии часть из них выпала, а их кодоны захватили другие аминокислоты, близкие по свойствам. Но это только гипотеза, если не спекуляция.

Вернемся, однако, к энтропии на символ для белкового текста. С учетом вырожденности кода эта величина, по моим давним подсчетам, равна 4,21 бит/аминокислотный остаток. Но это опять же с допущением, что все остатки в белке встречаются с одинаковой частотой. А это далеко не так. Если учтем данные по аминокислотному составу белков, получается величина примерно в два раза меньшая — у меня получалось 2,17-2,38 бит. Разумнее все же считать эту цифру завышенной, так как я исходил из того, что, например, все шесть кодонов для аргинина встречаются с одинаковой частотой. Два бита на символ — величина, наиболее подходящая для белка.

А сколько белков может синтезировать наш организм? Решая эту проблему, исследователи столкнулись с парадоксом, получившим название «парадокса лишней ДНК» (она же «эгоистичная, паразитическая, избыточная и мусорная»). О ней-то сейчас и пойдет речь.

О преимуществе вируса перед человеком. Два обстоятельства, на мой взгляд, привели к тому, что значительная часть

исследователей по сие время теряет время в пустых вычислениях и бессмысленных спорах.

Первое — то, что мы привыкли считать: ген — это та последовательность нуклеотидов в ДНК, которая кодирует белок. Отсюда стандартное изречение: один ген — один белок.

Второе — то, что по чисто техническим причинам изучение генетических программ и их перекодировки началось с простейших (бактерии) и сверхпростейших, упрощенных организмов (вирусы). А проще — с кишечной палочки и паразитирующих в ней бактериофагов и вируса табачной мозаики.

Исследование этих объектов вроде бы подтверждало прежнюю истину («один ген — один белок»). Правда, нашлись и исключения. Некоторые белки складывались из нескольких полипептидных цепей и кодировались, соответственно, несколькими генами. Другие гены кодировали не белки, а нужные для работы клетки нуклеиновые кислоты — РНК рибосомные и транспортные. Но это все было мелочью, и до сих пор многие полагают, что гены — это та ДНК, которая кодирует белки, а если она их не кодирует, то это не гены. А что же это тогда? Какую функцию выполняет ДНК, не находящая отражения в аминокислотных последовательностях белков?

Пока изучали простейшие объекты, от этой ДНК можно было отмахнуться. Геномы бактерий и фагов построены очень экономно. Там действительно почти каждая нуклеотидная последовательность находит отражение в аминокислотной последовательности белка. Более того, экономия генетического материала у вирусов доходит до того, что один ген может кодировать два, а то и три белка. Как это может получиться? Возьмем для примера кусочек последовательности информационной РНК, кодирующий всего три аминокислотных остатка:

— УЦЦАЦГГАУ —

Это соответствует последовательности в белке:

— сер-тре-асп —

То есть, серин-треонин-аспарагиновая кислота. Тот же ген может быть прочитан со сдвигом на один нуклеотид вправо. Тогда получится совсем другой белок, в нашем примере эта часть будет означать про-арг-иле (пролин-аргинин-изолейцин). Код вирусов перекрывается, одна последовательность нуклеотидов читается по-разному в зависимости от начала считывания. У некоторых фагов отмечено даже тройное перекрытие. Гены высших организмов так экономно не построены, достоверных данных о перекрытии в них нет. Впрочем, геномы ретровирусов, к которым относится печально известный вирус СПИДа, способны к перекрыванию, а во многих геномах высших организмов имеются очень похожие на них последовательности.

Но это все-таки исключение из правила. В целом уже первые исследования показали, что наши геномы построены, по крайней мере на первый взгляд, чрезвычайно неэкономично. Как говорят, у них низкая плотность кодирования генетической информации. Образно выражаясь, геном вируса — речь спешащего спартанца, геном человека — речь заикающегося зануды.

Доказать это очень просто. Сколько белков может синтезировать организм человека? Около 50 тыс. (конечно, в самом грубом приближении). Нуклеотидов в геноме человека 3,2 млрд. Зная молекулярную массу «среднего» белка, нетрудно прикинуть, из скольких аминокислотных остатков он состоит, сколькими кодонами кодируется. Помножив на 50 тыс., мы придем к выводу, что не меньше 95% ДНК в геноме лишние. Более того, теперь мы уже точно знаем, что большая часть ДНК в наших геномах никаких белков не кодирует, с нее не считывается в обычных условиях информационная РНК, а если и считывается, то не находит отражения в аминокислотных последовательностях. Что же делает эта ДНК, какова ее функция?

Поделиться:
Популярные книги

Жена на пробу, или Хозяйка проклятого замка

Васина Илана
Фантастика:
попаданцы
фэнтези
5.00
рейтинг книги
Жена на пробу, или Хозяйка проклятого замка

Война

Валериев Игорь
7. Ермак
Фантастика:
боевая фантастика
альтернативная история
5.25
рейтинг книги
Война

Ни слова, господин министр!

Варварова Наталья
1. Директрисы
Фантастика:
фэнтези
5.00
рейтинг книги
Ни слова, господин министр!

Газлайтер. Том 9

Володин Григорий
9. История Телепата
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
Газлайтер. Том 9

Убивать, чтобы жить

Бор Жорж
1. УЧЖ
Фантастика:
героическая фантастика
боевая фантастика
рпг
5.00
рейтинг книги
Убивать, чтобы жить

Адвокат вольного города 7

Кулабухов Тимофей
7. Адвокат
Фантастика:
городское фэнтези
альтернативная история
аниме
фантастика: прочее
5.00
рейтинг книги
Адвокат вольного города 7

Свадьба по приказу, или Моя непокорная княжна

Чернованова Валерия Михайловна
Любовные романы:
любовно-фантастические романы
5.57
рейтинг книги
Свадьба по приказу, или Моя непокорная княжна

Проданная Истинная. Месть по-драконьи

Белова Екатерина
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Проданная Истинная. Месть по-драконьи

Воин

Бубела Олег Николаевич
2. Совсем не герой
Фантастика:
фэнтези
попаданцы
9.25
рейтинг книги
Воин

Шесть принцев для мисс Недотроги

Суббота Светлана
3. Мисс Недотрога
Фантастика:
фэнтези
7.92
рейтинг книги
Шесть принцев для мисс Недотроги

Идеальный мир для Лекаря 28

Сапфир Олег
28. Лекарь
Фантастика:
юмористическое фэнтези
аниме
фэнтези
5.00
рейтинг книги
Идеальный мир для Лекаря 28

Неудержимый. Книга XI

Боярский Андрей
11. Неудержимый
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Неудержимый. Книга XI

Назад в ссср 6

Дамиров Рафаэль
6. Курсант
Фантастика:
попаданцы
альтернативная история
6.00
рейтинг книги
Назад в ссср 6

Адвокат империи

Карелин Сергей Витальевич
1. Адвокат империи
Фантастика:
городское фэнтези
попаданцы
фэнтези
5.75
рейтинг книги
Адвокат империи