Жизнь на скорости света. От двойной спирали к рождению цифровой биологии
Шрифт:
Броуновское движение оказалось важным, когда дело дошло до понимания работы живых клеток. Многие жизненно важные компоненты клеток, такие как ДНК, намного больше отдельных атомов, но все же достаточно малы, чтобы их двигали постоянные удары окружающего моря атомов и молекул. Так что, хотя ДНК действительно имеет форму двойной спирали, благодаря силам хаотического броуновского движения это извивающаяся, сгибающаяся, кружащаяся спираль. Белковые роботы живых клеток способны складываться в свои правильные формы лишь потому, что их компоненты – это подвижные цепочки, пластинки и спирали, которые постоянно толкутся внутри защитной клеточной мембраны. Жизнь движется броуновским движением, начиная с кинезиновых грузовичков, которые тянут маленькие мешочки с веществами вдоль микротрубочек к вращающейся АТФ-синтетазе {73} . Критически важно, что броуновское движение зависит от температуры: слишком низкая – и движения не хватает; слишком высокая – и все структуры идут вразнос от бешеного движения. Поэтому жизнь может существовать только в узком спектре температур.
73
Oster, George, and Hongyun Wang. “How Protein Motors Convert Chemical Energy into Mechanical Work” (2003). In Molecular Motors, edited by M. Schliwa (Wiley-VCH). http://users.soe.ucsc.edu/~hongwang/publications/Schliwa_08.pdf
Внутри
74
Oster, George, and Hongyun Wang. “How Protein Motors Convert Chemical Energy into Mechanical Work” (2003). In Molecular Motors, edited by M. Schliwa (Wiley-VCH). http://users.soe.ucsc.edu/~hongwang/publications/Schliwa_08.pdf
Теперь, когда мы знаем, что линейный текст ДНК определяет строение белковых роботов и РНК, которые управляют нашими клетками, а их строение, в свою очередь, определяет их функции, следующий вопрос очевиден: как нам читать и понимать этот текст, чтобы мы могли понять программу жизни?
Глава 4. Оцифровка жизни
Первые дни молекулярной биологии были отмечены тем, что многим показалось самонадеянным отщеплением новой науки от биохимии. Однако наш спор не касался методов биохимии, но лишь их слепого игнорирования новой области химии информации.
75
Brenner, Sydney. “Biochemistry Strikes Back.” In The Inside Story, edited by Jan Witkowski, 2005, стр. 367.
Настала эра цифровой биологии, в которой белки и другие взаимодействующие молекулы в клетке можно рассматривать как компьютерное «железо», а информацию, закодированную в ДНК, – как клеточный «софт», то есть программы. Вся информация, нужная для создания живой самовоспроизводящейся клетки, заключена в цепочках двойной спирали ДНК. По мере чтения и истолкования этого текста мы в конце концов сможем полностью понять, как работают клетки, а затем изменять и улучшать их путем написания новых клеточных программ. Но, конечно, это легче сказать, чем выполнить: изучение этих программ – ДНК – показывает, что они значительно сложнее, чем мы думали даже лет десять назад.
В то время как первая линейная последовательность аминокислот в белке (инсулине) была установлена Фредом Сэнгером в 1949 году, разработка методов чтения ДНК оказалась делом долгим. В 1960-х и 1970-х продвижение было медленным и секвенирование измерялось в нескольких парах оснований в месяц или даже в год. Например, в 1973 году Аллан Максэм и Уолтер Гилберт из Гарвардского университета опубликовали статью, описывающую, как с помощью их нового метода секвенирования {76} были установлены двадцать четыре пары оснований. Одновременно шло и секвенирование РНК, продвигавшееся несколько быстрее. И все же по сравнению с возможностями современных технологий даже для чтения нескольких букв кодированного текста в ту пору требовались поистине героические усилия.
76
Gilbert, Walter, and Allan Maxam. “The Nucleotide Sequence of the lac Operator.” Proc. Nat. Acad. Sci. USA, Vol. 70, № 12, Part I, стр. 3581–3584, 1973.
Большинство людей узнали о геномике при первой расшифровке человеческого генома, которая увенчалась моим появлением в Белом доме в 2000 году рядом с моими коллегами-соперниками и президентом Клинтоном, где мы торжественно объявили об открытии последовательности человеческого генома. На самом деле первые идеи о расшифровке ДНК относятся к временам полувековой давности, когда Уотсон и Крик предложили модель ее атомной структуры. Большой скачок в нашем познании случился, когда в 1965-м группа под руководством Роберта Холли из Корнеллского университета опубликовала последовательность из семидесяти семи рибонуклеотидов аланиновой транспортной РНК (тРНК) из клетки дрожжей Saccharomyces cerevisiae {77} как часть работы по выявлению того, как тРНК помогает собирать аминокислоты в белки. Секвенирование РНК продолжало лидировать, когда в 1967 году группа Фреда Сэнгера установила последовательность нуклеотидов рибосомальной 5S-РНК E. coli, короткой молекулы из 120 нуклеотидов {78} . Первый реальный геном, который был успешно расшифрован, был вирусной РНК: в 1976 году лабораторией Вальтера Фирса в Гентском университете в Бельгии был секвенирован бактериофаг MS2. Фирс изучал бактериофаги (которые захватывают для своего размножения бактерии) совместно с Робертом Л. Синшаймером из Калтеха, а потом с Харом Гобиндом Кораной в Мэдисоне (Висконсин).
77
Holley, R. W., G. A. Everett, J. T. Madison, A. Zamir (май 1965). “Nucleotide Sequences In The Yeast Alanine Transfer Ribonucleic Acid.” J. Biol. Chem. 240 (5),
78
Brownlee, G. G.; F. Sanger, B. G. Barrell (1967). “Nucleotide sequence of 5S-ribosomal RNA from Escherichia coli.” Nature 215 (5102), стр. 735–736.
Технология секвенирования ДНК, которая дала мне возможность секвенировать человеческий геном, зародилась в середине 1970-х, когда группа Фреда Сэнгера в Кембридже разработала новую технику – первую, которую можно было назвать «более-менее секвенированием». За ней последовала методика, которую Сэнгер назвал дидезокси-секвенированием ДНК, но которая в его честь теперь называется «секвенированием по Сэнгеру». В нем применяются дидезоксинуклеотиды, или нуклеотиды-терминаторы, которые останавливают ДНК-полимеразу, не давая ей добавлять нуклеотиды к растущей цепочке ДНК. У дидезоксинуклеотидов нет гидроксильной группы (–ОН), что означает, что после того, как ДНК-полимераза прицепит их к растущей нуклеотидной цепочке, дальше нельзя добавить никаких нуклеотидов. Прикрепив радиоактивный фосфат к одному из четырех нуклеотидов, чтобы пометить фрагменты, стало возможным прочесть порядок А, Т, Ц и Г, прикладывая гель, использованный для разделения оснований, к рентгеновской пленке [7] .
7
В опытах Сэнгера синтез ДНК с одинаковых матриц шел параллельно в четырех пробирках, в каждой из которых часть нуклеотидов одного из типов (А, Т, Ц или Г) была представлена дидезоксинуклеотидами, меченными радиоактивным фосфором. Присоединение такого нуклеотида обрывало дальнейший синтез. В результате в каждой пробирке получался набор фрагментов ДНК, оборванных в случайном месте (но всегда – по одному и тому же нуклеотиду). Затем все четыре набора подвергались электрофорезу в акриламидном геле, в ходе которого фрагменты распределялись в соответствии со своей длиной: чем короче фрагмент, тем дальше он успевал продвинуться в геле под действием электрического поля. Наконец, все четыре полоски геля выкладывались рядком на рентгеновскую пленку, и по картине распределения меток восстанавливалась последовательность нуклеотидов во всей цепочке. Скажем, самая дальняя метка на пленке оставлена полоской с меченым А – значит, первый нуклеотид в последовательности – А. Следующая по дальности метка оставлена полоской с меченым Ц – значит, второй нуклеотид – Ц. И так до полной расшифровки последовательности.
Группа Сэнгера использовала его новые инструменты секвенирования для установления первой последовательности генома ДНК-вируса, принадлежащего бактериофагу phi X 174 {79} ; эта последовательность была опубликована в Nature в 1977 году. Клайд Хатчинсон (ныне сотрудник Института Вентера) стажировался в лаборатории Сэнгера (от Университета Северной Каролины, где он с 1968 года был штатным преподавателем) и внес свой вклад в секвенирование генома phi X 174. В 1950-х Синшаймер, использовав рассеяние света, оценил размер генома phi X 174 примерно в 5400 оснований и был удовлетворен, когда Сэнгер выяснил, что точное количество – 5386 {80} .
79
Sanger, F., G. M. Air, B. G. Barrell, N. L. Brown, A. R. Coulson, C. A. Fiddes, C. A. Hutchinson, P. M. Slocombe, et al. (1977). “Nucleotide sequence of bacteriophage X174 DNA.” Nature 265 (5596), стр. 687–695.
80
http://oralhistories.library.caltech.edu/33/0/OH_Sinsheimer.pdf
За два года до появления статьи Сэнгера я закончил свою диссертацию в Калифорнийском университете в Сан-Диего (UCSD) и успел перейти в Университет штата Нью-Йорк в Баффало, чтобы начать собственную научную и преподавательскую карьеру. Я пропустил публикацию Сэнгера, потому что она вышла в самый разгар Бурана-77 [8] , к тому же спустя две недели после публикации у меня родился сын {81} . Моя лаборатория в это время работала над выделением и описанием рецепторов для нейромедиаторов – белков, обеспечивающих передачу сигналов между нервными клетками.
8
Буран-77 – катастрофическая снежная буря на северо-западе штата Нью-Йорк (где расположен город Баффало) 28 января – 1 февраля 1977 года. Скорость ветра достигала 111 км/час, температура опускалась до –57 °C, толщина снежного покрова местами превышала 2,5 м. Буран парализовал транспортное сообщение и работу электросетей.
81
Venter, J. Craig (18.10.2007). A Life Decoded: My Genome: My Life. Penguin. E-book.
За десять лет, последовавших за работой над геномом phi X 174, секвенирование ДНК постепенно прогрессировало. Хотя секвенирование по Сэнгеру стало мировым стандартом, оно было медленным, очень трудоемким и требовало заметных количеств радиоактивного фосфора, у которого период полураспада – всего пара недель. Кроме того, чтение гелей с последовательностями было скорее искусством, чем наукой. В своей второй Нобелевской лекции Сэнгер описывал утомительные усилия, которых требовало раннее секвенирование ДНК, и заключал: «Судя по всему, для секвенирования генетического материала был весьма желателен новый подход» {82} .
82
Sanger, Frederick, Nobel lecture, 8 декабря 1980.