Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:
Пятого августа 2019 г. команда, в которую, помимо Чжэна, входили специалисты из исследовательской группы Connectomics компании Google, а также их коллеги из Медицинского института Говарда Хьюза (HHMI) и Кембриджского университета, опубликовала основанную на собранных годом ранее данных работу «Автоматическая реконструкция мозга дрозофилы на базе электронной микроскопии последовательных сечений с помощью закрашивающих сетей и локальной коррекции выравнивания» (Automated Reconstruction of a Serial-Section EM Drosophila Brain with Flood-Filling Networks and Local Realignment), в которой демонстрируется метод, способный с использованием нейросетевой модели автоматически воссоздавать объёмную карту связей нейронов [1080] . Запись в блоге Google AI, опубликованная за год до выхода статьи, посвящённой реконструкции мозга дрозофилы, показывает работу алгоритма на примере мозга зебровой амадины (Taeniopygia guttata) [1081] , которая по-английски называется Zebra finch. Быть может, какой-то стажёр из Google перепутал Zebrafish с Zebra finch, а в эти минуты уже подкрадывается с микротомом к кубинскому щелезубу, перепутав его с карликовой многозубкой?
1080
Li P. H., Lindsey L. F., Januszewski M., Zheng Z., Bates A. S., Taisz I., Tyka M., Nichols M., Li F., Perlman E., Maitin-Shepard J., Blakely T., Leavitt L., Jefferis G. S. X. E., Bock D., Jain V. (2019). Automated Reconstruction of a Serial-Section EM Drosophila Brain with Flood-Filling Networks and Local Realignment // https://doi.org/10.1101/605634
1081
Jain V., Januszewski M. (2018). Improving Connectomics by an Order of Magnitude / Google AI Blog, July 16, 2018 // https://ai.googleblog.com/2018/07/improving-connectomics-by-order-of.html
В апреле 2019 г. сотрудники Алленовского института головного мозга в Сиэтле отпраздновали преодоление последнего рубежа в проекте по картированию одного кубического миллиметра мозга мыши с его 100 000 нейронов и одним миллиардом связей между ними. Чтобы обработать образец размером с горчичное зёрнышко, микроскопы работали непрерывно в течение пяти месяцев, собрав более 100 млн изображений 25 000 срезов зрительной коры. Затем программному обеспечению, разработанному учёными института, потребовалось около трёх месяцев, чтобы объединить изображения в единый трёхмерный массив объёмом 2 петабайта (т. е. 2 млн гигабайт). Все собранные более чем за тридцать лет миссиями Landsat снимки нашей планеты занимают всего около 1,3 петабайта, что делает сканы мозга мыши практически «целым миром в песчинке», говорит нейробиолог Клэй Рэйд, обыгрывая слова английского поэта Уильяма Блейка [To see a World in a Grain of Sand].
Первого июня 2021 г. в исследовательском блоге компании Google появилось сообщение [1082] , что её исследователи совместно с коллегами из Лаборатории Лихтмана (Lichtman Laboratory) в Гарвардском университете опубликовали датасет под названием H01. Этот набор данных объёмом 1,4 петабайта содержит информацию о небольшом фрагменте коры головного мозга человека. Ряд технических подробностей можно узнать из сопроводительной статьи под названием «Коннектомное исследование петамасштабного фрагмента коры мозга человека» (A connectomic study of a petascale fragment of human cerebral cortex) [1083] , вышедшей днём ранее на сайте препринтов bioRxiv.
1082
Blakely T. (2021). A Browsable Petascale Reconstruction of the Human Cortex / Google AI Blog, June 1, 2021 // https://ai.googleblog.com/2021/06/a-browsable-petascale-reconstruction-of.html
1083
Shapson-Coe A., Januszewski M., Berger D. R., Pope A., Wu Y., Blakely T., Schalek R. L., Li P., Wang S., Maitin-Shepard J., Karlupia N., Dorkenwald S., Sjostedt E., Leavitt L., Lee D., Bailey L., Fitzmaurice A., Kar R., Field B., Wu H., Wagner-Carena J., Aley D., Lau J., Lin Z., Wei D., Pfister H., Peleg A., Jain V., Lichtman J. W. (2021). A connectomic study of a petascale fragment of human cerebral cortex // https://doi.org/10.1101/2021.05.29.446289
В ходе хирургической операции из височной доли коры головного мозга 45-летней пациентки, страдающей от устойчивой к медикаментам эпилепсии, был извлечён положенный в основу исследования фрагмент ткани объёмом около кубического миллиметра. При помощи микротома этот фрагмент был разделён более чем на 5000 срезов толщиной 30 нм, а затем обработан многолучевым сканирующим электронным микроскопом с разрешением 4 x 4 нм. После этого полученные данные были превращены в трёхмерную модель при помощи уже ранее знакомых нам закрашивающих сетей (Flood-Filling Networks, FFNs) и вспомогательных вычислительных моделей. Полученный датасет содержит детальные сведения о 50 000 клеток, сотнях миллионов их отростков (авторы статьи употребляют термин «нейриты» — собирательное понятие для аксонов и дендритов) и примерно 130 млн синапсов. На сегодняшний день H01 является крупнейшим размеченным набором данных, описывающим образец мозговой ткани человека.
Ознакомиться с данными можно в обычном браузере при помощи специального интерфейса, получившего название Neuroglancer (дословно: нейронаблюдатель) [1084] .
Ещё одним важным результатом, полученным в последнее десятилетие, стало создание трёхмерной модели синапса в атомарном разрешении, включающей около 300 000 молекул, принадлежащих к 60 различным белкам [1085] , [1086] .
1084
Explore H01: One cubic millimeter of the human cerebral cortex (2021) // https://h01-release.storage.googleapis.com/explore.html
1085
Wilhelm B. G., Mandad S., Truckenbrodt S., Krohnert K., Schafer C., Rammner B., Koo S. J., Classen G. A., Krauss M., Haucke V., Urlaub H., Rizzoli S. O. (2014). Composition of isolated synaptic boutons reveals the amounts of vesicle trafficking proteins. / Science, Vol. 344, Iss. 6187, pp. 1023—1028 // https://doi.org/10.1126/science.1252884
1086
Doerr A. (2014). Modeling the synapse / Nature Methods, Vol. 11, pp. 788–789 // https://doi.org/10.1038/nmeth.3057
Хотя в ходе упомянутых исследований и достигнут несомненный прогресс, конечная цель — наноразмерный коннектом человеческого мозга — пока ещё далеко. Число нейронов в нём сопоставимо с количеством звёзд в Млечном Пути (порядка 1011). При использовании современной технологии обработки изображений потребуются десятки микроскопов, работающих круглосуточно на протяжении тысячи лет, чтобы собрать данные, необходимые для достижения конечной цели.
Удивительно, что лишь недавно удалось обнаружить некоторые новые типы клеток мозга, а также уточнить функции известных ранее клеток. Например, в 2015 г. учёные из Федеральной политехнической школы Лозанны (Ecole Polytechnique Federale de Lausanne) разработали количественную модель ранее неизвестной взаимосвязи
1087
* Астроцит (от греч. ?????? — звезда и ????? — клетка) — тип нейроглиальной клетки звёздчатой формы с многочисленными отростками.
1088
Jolivet R., Coggan J. S., Allaman I., Magistretti P. J. (2015). Multi-timescale Modeling of Activity-Dependent Metabolic Coupling in the Neuron-Glia-Vasculature Ensemble / PLOS Computational Biology, February 26, 2015. // https://doi.org/10.1371/journal.pcbi.1004036
1089
de Ceglia R., Ledonne A., Litvin D. G., Lind B. L., Carriero G., Latagliata E. C., Bindocci E., Di Castro M. A., Savtchouk I., Vitali I., Ranjak A., Congiu M., Canonica T., Wisden W., Harris K., Mameli M., Mercuri N., Telley L., Volterra A. (2023). Specialized astrocytes mediate glutamatergic gliotransmission in the CNS. / Nature, Vol. 262, 06 September 2023. // https://doi.org/10.1038/s41586-023-06502-w
Но достижения в области микроскопии, а также разработка более мощных компьютеров и алгоритмов для анализа изображений продвинули область коннектомики вперёд столь быстро, что это удивляет и самих исследователей. «Пять лет назад было слишком амбициозно думать о кубическом миллиметре», — говорил Рэйд в 2019 г. Сегодня многие исследователи считают, что полное картирование мозга мыши, объём которого составляет около 500 кубических миллиметров, станет возможным уже в этом десятилетии. «Сегодня картирование человеческого мозга на синаптическом уровне может показаться невероятным. Но если прогресс в вычислительных мощностях и в научных методах будет идти вперёд теми же темпами, ещё одно тысячекратное увеличение возможностей уже не кажется нам немыслимым» [1090] .
1090
DeWeerdt S. (2019). How to map the brain / Nature, Vol. 571, S6-S8, 24 July 2019 // https://www.nature.com/articles/d41586-019-02208-0
BRAIN Initiative — не единственная масштабная программа в этой области. Созданием функциональной модели мозга крысы (с прицелом на мозг человека) заняты и учёные из проектов Blue Brain Project и Human Brain Project. Не стоит на месте и China Brain Project. Пожалуй, при взгляде со стороны сегодняшние усилия в области моделирования мозга напоминают космическую гонку середины XX в.
4.3 История первой модели искусственного нейрона: Мак-Каллок и Питтс
— Да, видите, папенька, — сказал Миша, протирая глазки, — мне всё хотелось узнать, отчего музыка в табакерке играет; вот я принялся на неё прилежно смотреть и разбирать, что в ней движется и отчего движется; думал-думал и стал уже добираться, как вдруг, смотрю, дверца в табакерке растворилась…
Но вернёмся в суровую действительность первой половины XX в. Учёные, ставившие перед собой цель создать системы для автоматизации решения интеллектуальных задач, не могли ждать появления биологически достоверных моделей мозга. Только сегодня мы располагаем достаточными знаниями и вычислительными мощностями для того, чтобы попытаться на клеточном уровне симулировать работу нервной системы сравнительно простых живых организмов, таких как, например, нематоды C. elegans (в проектах OpenWorm [1091] и Worminator [1092] ) или головастика [1093] , [1094] . Если бы пионеры авиации ждали появления биологически достоверных моделей птиц, самолёты и сегодня оставались бы лишь мечтой.
1091
OpenWorm foundation (2022). OpenWorm // https://openworm.org/
1092
Haspel G., Boyden E. S., Brown J., Church G., Cohen N., Fang-Yen C., Flavell S., Goodman M. B., Hart A. C., Hobert O., Kagias K., Lockery S., Lu Y., Marblestone A., Matelsky J., Pfister H., Rotstein H. G., Scholz M., Shlizerman E., Simeon Q., Skuhersky M. A., Venkatachalam V., Yang G. R., Yemini E., Zimmer M., Kording K. P. (2023). To reverse engineer an entire nervous system // https://arxiv.org/abs/2308.06578
1093
Сегеда Г. (2022). Цифровой двойник головастика — ещё один шаг на пути к искусственному разуму? / Наука в Сибири, 31 янв. // https://sbras.info/articles/nauka-dlya-obschestva/cifrovoy-dvoynik-golovastika-esche-odin-shag-na-puti-k
1094
Ferrario A., Palyanov A., Koutsikou S., Li W., Soffe S., Roberts A., Borisyuk R. (2021). From decision to action: Detailed modelling of frog tadpoles reveals neuronal mechanisms of decision-making and reproduces unpredictable swimming movements in response to sensory signals / PLOS Computational Biology, December 13, 2021 // https://doi.org/10.1371/journal.pcbi.1009654
Поиск разумного компромисса между биологической достоверностью моделей и их практической применимостью начался параллельно с созданием первых электронно-вычислительных машин. Истоком исследовательского направления, связанного с применением искусственных нейронных (или, как выражались сами авторы, «нервных») сетей, стала пионерская работа [1095] Уоррена Мак-Каллока и Уолтера Питтса, написанная ими в 1943 г. (эту статью под заголовком «Логическое исчисление идей, имманентных нервной деятельности» (A Logical Calculus of the Ideas Immanent in Nervous Activity), вышедшую в «Бюллетене математической биофизики» (Bulletin of Mathematical Biophysics), я буду далее по тексту называть просто «статьёй Мак-Каллока и Питтса 1943 г.»). Но, как и в случае с другими трудами, закладывающими основы того или иного направления, работа Мак-Каллока и Питтса появилась не на ровном месте, что становится ясно после знакомства со средой, в которой работали авторы. А история их жизни и творчества весьма поучительна.
1095
McCulloch W. S., Pitts W. (1943). A logical calculus of the ideas immanent in nervous activity / Bulletin of Mathematical Biophysics, 5: 115 // https://doi.org/10.1007/BF02478259