Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:
В наши дни продолжается активное изучение биологических механизмов, лежащих в основе ДВП и ДВД. В частности, учёные вырабатывают подходы, позволяющие рассчитывать эффективность каждого отдельно взятого синапса на основе данных микроскопии [1637] , [1638] , [1639] .
Важной вехой в истории изучения механизмов ДВП и ДВД стало выступление Генри Маркрама на ежегодном собрании Общества нейронаук (Society for Neuroscience) в 1995 г. В ходе этого выступления Маркрам рассказал научной общественности о первом экспериментальном исследовании [1640] , показавшем, что ДВП и ДВД зависят от разницы во времени возникновения одиночных импульсов, испускаемых пре- и постсинаптическими нейронами в моносинаптических связях между парами нейронов неокортекса. Водораздел, задаваемый относительной синхронизацией отдельных импульсов на временном масштабе в несколько десятков миллисекунд, определял направление (потенциация или депрессия) и степень изменения эффективности синаптической связи. Именно это выступление Маркрама (ныне директора Blue Brain Project и основателя Human Brain Project) стало моментом окончательного оформления STDP в качестве модели синаптической пластичности биологических нейронов и одновременно как алгоритма обучения импульсных нейронных сетей [1641] , хотя сам термин STDP появился только в 2000 г. в работе [1642] Сена Сонга, Кеннета Миллера и Ларри Эбботта. Таким образом, спустя полстолетия после основополагающей
1637
Verstraelen P., Van Dyck M., Verschuuren M., Kashikar N. D., Nuydens R., Timmermans J.-P., De Vos W. H. (2018). Image-Based Profiling of Synaptic Connectivity in Primary Neuronal Cell Culture / Frontiers in Neuroscience, 26 June 2018 // https://doi.org/10.3389/fnins.2018.00389
1638
Danielson E., Lee S. H. (2014). SynPAnal: Software for Rapid Quantification of the Density and Intensity of Protein Puncta from Fluorescence Microscopy Images of Neurons / PLoS One, Vol. 9 (12), e115298 // https://doi.org/10.1371/journal.pone.0115298
1639
Kashiwagi Y., Higashi T., Obashi K., Sato Y., Komiyama N. H., Grant S. G. N., Okabe S. (2019). Computational geometry analysis of dendritic spines by structured illumination microscopy / Nature Communications, Vol. 10, Article number: 1285 // https://doi.org/10.1038/s41467-019-09337-0
1640
Markram H., Sakmann B. (1995). Action potentials propogating back into dendrites triggers changes in efficacy of single-axon synapses between layer V pyramidal cells / Society for Neuroscience abstracts, Vol. 21.
1641
Markram H., Gerstner W., Sjostrom P. J. (2011). A history of spike-timing-dependent plasticity / Frontiers in synaptic neuroscience, 3, 4 // https://doi.org/10.3389/fnsyn.2011.00004
1642
Song S., Miller K. D., Abbott L. F. (2000). Competitive Hebbian learning through spike-timing-dependent synaptic plasticity / Nature Neuroscience. Vol. 3, pp. 919—926 // https://doi.org/10.1038/78829
1643
Markram H., Gerstner W., Sjostrom P. J. (2011). A history of spike-timing-dependent plasticity / Frontiers in synaptic neuroscience, 3, 4 // https://doi.org/10.3389/fnsyn.2011.00004
Важными параметрами STDP являются конкретные значения временных интервалов синхронизации импульсов. В ходе экспериментов по обучению больших импульсных сетей для решения прикладных задач были созданы такие методы, как R-STDP (версия STDP, в которой обучение модулируется при помощи внешнего подкрепления, основанного на фазовой активности дофаминовых нейронов) [1644] , TD-STDP (версия STDP, использующая метод временных разниц [temporal difference]) [1645] и даже BP-STDP, а также другие похожие методы, эмулирующие работу метода обратного распространения ошибки за счёт особого подбора параметров STDP [1646] , [1647] , [1648] . Эти методы для ряда задач демонстрируют эффективность, сходную с эффективностью метода обратного распространения ошибки [1649] , [1650] , [1651] .
1644
Izhikevich E. M. (2007). Solving the distal reward problem through linkage of STDP and dopamine signaling / Cerebral Cortex, Vol. 17, pp. 2443—2452 // https://doi.org/10.1093/cercor/bhl152
1645
Fremaux N., Gerstner W. (2016). Neuromodulated spike-timing-dependent plasticity, and theory of three-factor learning rules / Frontiers in Neural Circuits, Vol. 9 // https://doi.org/10.3389/fncir.2015.00085
1646
Tavanaei A., Maida A. (2019). BP-STDP: Approximating backpropagation using spike timing dependent plasticity / Neurocomputing, Vol. 330, pp. 39—47 // https://doi.org/10.1016/j.neucom.2018.11.014
1647
Bengio Y., Mesnard T., Fischer A., Zhang S., Wu Y. (2017). STDP-compatible approximation of backpropagation in an energy-based model / Neural computation, Vol. 29, Iss. 3, pp. 555—577 // https://doi.org/10.1162/NECO_a_00934
1648
Millidge B., Tschantz A., Buckley C. L. (2020). Predictive coding approximates backprop along arbitrary computation graphs // https://arxiv.org/abs/2006.04182
1649
Mozafari M., Ganjtabesh M., Nowzari-Dalini A., Thorpe S. J., Masquelier T. (2019). Bio-Inspired Digit Recognition UsingSpike-Timing-Dependent Plasticity (STDP) and Reward-Modulated STDP in Deep Convolutional Networks / Pattern Recognition, Vol. 94, pp. 87—95 // https://doi.org/10.1016/j.patcog.2019.05.015
1650
Lee C., Panda P., Srinivasan G., Roy K. (2018). Training Deep Spiking Convolutional Neural Networks With STDP-Based Unsupervised Pre-training Followed by Supervised Fine-Tuning / Frontiers in Neuroscience, Vol. 12, 2018 // https://doi.org/10.3389/fnins.2018.00435
1651
Mozafari M., Kheradpisheh S. R., Masquelier T., Nowzari-Dalini A., Ganjtabesh M. (2018). First-Spike-Based Visual Categorization Using Reward-Modulated STDP / IEEE Transactions on Neural Networks and Learning Systems, Vol. 29, No. 12, pp. 6178—6190 // https://doi.org/10.1109/TNNLS.2018.2826721
5.3.7 Нейроморфные системы типа I. Перспективы
Одним из потенциальных преимуществ импульсных нейронных сетей является, по всей видимости, то, что они меньше подвержены так называемой проблеме катастрофической интерференции [catastrophic interference] или, как её ещё называют, проблеме катастрофического забывания [catastrophic forgetting] [1652] .
Суть этой проблемы заключается в том, что искусственные нейронные сети, обученные на некоторой выборке, имеют склонность внезапно полностью забывать ранее изученную информацию при попытке «доучить» их на другой выборке, содержащей прецеденты, с точки зрения человека отличающиеся от прецедентов в оригинальной выборке. Это существенно осложняет перенос обучения (знаний) [transfer learning] между близкими областями и создаёт проблемы при дообучении моделей [fine-tuning, дословно — тонкая настройка]. Впрочем, для классических нейронных сетей в настоящее время существует несколько рабочих рецептов, предназначенных для борьбы с этой проблемой (мы поговорим о них позже).
1652
Vaila R., Chiasson J., Saxena V. (2019). Deep Convolutional Spiking Neural Networks for Image Classification // https://arxiv.org/abs/1903.12272
Учитывая тот факт, что Генри Маркрам был основным идеологом Human Brain Project на его старте, было бы удивительно, если бы разработчики BrainScaleS не заложили бы в созданную ими аппаратную архитектуру, помимо краткосрочной синаптической пластичности, поддержку STDP. Причём прототип второй версии BrainScaleS позволяет реализовать принцип R-STDP, что делает возможным моделирование таких сложных явлений, как, например, формирование павловского условного рефлекса [1653] .
1653
Wunderlich T., Kungl A. F., Muller E., Hartel A., Stradmann Y., Aamir S. A., Grubl A., Heimbrecht A., Schreiber K., Stockel D., Pehle C., Billaudelle S., Kiene G., Mauch C., Schemmel J., Meier K., Petrovici M. A. (2019). Demonstrating Advantages of Neuromorphic Computation: A Pilot Study / Frontiers in Neuroscience: Neuromorphic Engineering, 26-Mar-2019 // https://doi.org/10.3389/fnins.2019.00260
Вторая
Вся эта монструозная конструкция, потребляющая около 100 кВт, размещена в десяти 19-дюймовых стойках, каждая из которых содержит более 100 000 вычислительных ядер, а каждое ядро способно эмулировать работу 1000 нейронов. Конечной целью системы является моделирование в реальном времени импульсных нейронных сетей, содержащих до миллиарда нейронов [1654] , [1655] .
1654
SpiNNaker Project — Architectural Overview / The University of Manchester: APT Advanced Processor Technologies Research Group // http://apt.cs.manchester.ac.uk/projects/SpiNNaker/architecture/
1655
SpiNNaker Project — Boards and Machines / The University of Manchester: APT Advanced Processor Technologies Research Group // http://apt.cs.manchester.ac.uk/projects/SpiNNaker/hardware/
В сентябре 2019 г. было принято решение о том, что новый грант в размере 8 млн евро для финансирования строительства машины SpiNNaker второго поколения (названной SpiNNcloud) получит Технический университет Дрездена (Technische Universitat Dresden) [1656] .
Полномасштабный SpiNNcloud будет состоять из десяти серверных стоек с пятью шасси, в каждом из которых будет установлено по 25 плат, на каждой из которых, в свою очередь, размещено по 56 процессоров. Каждый из процессоров модели SpiNNaker 2 содержит 144 ядра ARM A4F, выполненных по технологии 22-нм FDSOI. Итого SpiNNcloud будет содержать 10 080 000 вычислительных ядер. При этом каждое из этих новых ядер будет способно симулировать в пять раз больше нейронов, чем старое, что в итоге позволит полномасштабной системе в сборке симулировать в реальном времени работу биологических нейронных сетей, состоящих из приблизительно 50 млрд нейронов [1657] , [1658] . Напомним, что мозг человека содержит около 86 млрд нейронов.
1656
Saxon Science Ministry delivers 8 Mio Euro to TU Dresden for second generation SpiNNaker machine (2019) / Human Brain Project // https://www.humanbrainproject.eu/en/follow-hbp/news/second-generation-spinnaker-neurorphic-supercomputer-to-be-built-at-tu-dresden/
1657
Mayr С., Hoppner S., Furber S. (2019). SpiNNaker 2: A 10 Million Core Processor System for Brain Simulation and Machine Learning // https://arxiv.org/abs/1911.02385
1658
Hoppner S., Mayr C. (2018). SpiNNaker2 — Towards Extremely Efficient Digital Neuromorphics and Multi-scale Brain Emulation / NICE Workshop, 2018 // https://niceworkshop.org/wp-content/uploads/2018/05/2-27-SHoppner-SpiNNaker2.pdf
При перечислении всех этих чисел создаётся впечатление об огромном масштабе проекта, сопоставимом чуть ли не с ядерной и космической программами. В действительности 8 млн евро — это сумма, составляющая менее одной десятой части рыночной цены самой дорогой московской квартиры [1659] . Сумма двухлетнего (с апреля 2018 г. по март 2020 г.) финансирования Human Brain Project со стороны Европейского союза составляет 88 млн евро [1660] , что всё ещё меньше цены шикарного пятиуровневого пентхауса в Неопалимовском переулке. Расходы на Human Brain Project в год немного превышают две миллионные доли от мировых военных расходов [1661] . Самый богатый в мире проект по исследованию мозга (Brain Initiative), бюджет которого десятикратно превышает бюджет Human Brain Project [1662] , выглядит в подобном сравнении едва заметной букашкой.
1659
Мамаева О. (2018). Самую дорогую квартиру в Москве оценили в 7 млрд рублей / РБК, 19 сентября 2018 // https://realty.rbc.ru/news/5ba225279a7947b0b1ce8985
1660
Human Brain Project, Framework Partnership Agreement // https://sos-ch-dk-2.exo.io/public-website-production/filer_public/0d/95/0d95ec21-276a-478d-a2a9-d0c5922fb83a/fpa_annex_1_part_b.pdf
1661
Defense Spending by Country: Total annual defense spending by nation (2020) / www.GlobalFirepower.com // https://www.globalfirepower.com/defense-spending-budget.asp
1662
Cleared Initiatives (2019) / NIH: The BrainInitiative® // https://braininitiative.nih.gov/funding/cleared-initiatives
5.3.8 Нейроморфные системы типа II. Начало
Пока научные коллаборации заняты развитием нейроморфных систем типа I, моделируя биологические процессы, параллельно происходит развитие систем типа II, дающее осторожные надежды на то, что нейроморфное «железо» вскоре может стать частью массовых пользовательских устройств. В первую очередь оно может быть востребовано там, где особенно важно повысить мобильность машин — в носимых устройствах (например, смартфонах или фитнес-трекерах), в бионических протезах (здесь применение импульсных нейронных сетей может быть особенно полезным, поскольку такая сеть способна «общаться» с нервной системой «на одном языке»), на борту дронов и других автономных или полуавтономных устройств (например, пользовательских роботов). Серьёзный интерес проявляют к нейроморфным системам типа II и военные. Во всяком случае, наиболее заметный проект 2010-х гг. в этой области — нейроморфный чип от IBM под названием TrueNorth — был создан в рамках военной программы DARPA SyNAPSE (Systems of Neuromorphic Adaptive Plastic Scalable Electronics, Системы нейроморфной адаптивной пластичной масштабируемой электроники).
Сложно сказать, какой именно проект нейроморфной системы типа II можно считать первым. В конце концов своё применение в технике нашли и триггеры Шмитта, да и контуры памяти первых ЭВМ, как мы знаем из «Первого проекта отчёта об EDVAC», создавались под влиянием исследований Мак-Каллока и Питтса. Как мы уже заметили ранее, граница, разделяющая нейроморфные системы и классические, во многом размыта. Если за неё принять использование импульсных нейронных сетей в качестве математической модели, лежащей в основе вычислительного устройства, то отсчёт, видимо, следует начать с американо-польского проекта Бялко, Ньюкомба и Деклариса. Эта практика создания устройств на основе импульсных нейронных сетей получила своё развитие в 1980-е гг. Например, ряд публикаций конца 1980-х — начала 1990-х гг. за авторством классика нейроморфной инженерии Алана Мюррея и его коллег описывает создание импульсных нейронных сетей на основе СБИС.
Продолжал работу в этой области и Ньюкомб. Например, в 1992 г. в его статье [1663] , написанной в соавторстве с Гью Муном и Моной Заглул, описывается СБИС-реализация синаптических весов и суммирования в импульсных нейронах. Одним из важных этапов работы группы Ньюкомба стала публикация в 1994 г. книги [1664] под названием «Исполнение импульсно связанных нейронных сетей в кремнии» (Silicon Implementation of Pulse Coded Neural Networks). Исследования Ньюкомба и его коллег заложили фундамент для будущих инженерных проектов нейроморфных вычислений.
1663
Moon G., Zaghloul M. E., Newcomb R. W. (1992). VLSI implementation of synaptic weighting and summing in pulse coded neural-type cells / IEEE Transactions on Neural Networks, Vol. 3, Iss. 3 // https://doi.org/10.1109/72.129412
1664
Zaghloul M., Meador J. L., Newcomb R. W. (1994). Silicon Implementation of Pulse Coded Neural Networks. Volume 266 of The Springer International Series in Engineering and Computer Science. Springer US // https://books.google.ru/books?id=MqdQAAAAMAAJ