Компьютерра PDA N137 (24.09.2011-30.09.2011)
Шрифт:
Сведя воедино несколько продвинутых инфотехнологий, включая томографическое сканирование мозга и мощный компьютерный видеосимулятор, учёные калифорнийского университета Беркли продемонстрировали, что по активности нейронов коры уже становится возможным в общих чертах восстанавливать вид визуальных картин в голове человека. Пока что, правда, речь идёт о весьма конкретных условиях специфического опыта. Однако для первых шагов даже этот результат выглядит чрезвычайно впечатляюще.
Учёные использовали известные возможности технологии функциональной магнитно-резонансной томографии (ФМРТ), а также вычислительные модели
Чтобы огромная техническая сложность решаемой задачи стала понятнее, надо дать некоторые пояснения. Сама идея о том, что по результатам декодирования сканов ФМРТ в области зрительной коры можно воссоздавать визуальные картины, обрабатываемые мозгом, выдвинута и исследуется учёными довольно давно. Более того, с середины двухтысячных годов из разных лабораторий стали поступать результаты, свидетельствующие, что действительно возможно восстанавливать по сканам томографа те картинки, что разглядывает при сканировании человек. Но надо подчеркнуть, что это исключительно статичные картинки - символы, цифры, естественные чёрно-белые фотографии и так далее.
Восстанавливать динамичные картины принципиально сложнее - метод ФМРТ физически регистрирует активность мозга по сигналам, зависящим от уровня кислорода в крови. То есть динамика снимаемой картины непосредственно связана со скоростью тока крови через мозг, а эта скорость несравнимо медленнее скорости нейросигналов, кодирующих динамическую информацию в зрительной коре. Иначе говоря, учёные полагают, что переход от декодирования статичных картин к адекватному декодированию динамики - это тот самый критически важный шаг, что должен помочь в получении реконструкций таких внутренних состояний сознания, как воображение, сны и тому подобные процессы.
Именно в этом направлении и удалось ныне заметно продвинуться исследователям лаборатории университета Беркли, возглавляемой Джеком Гэлантом.
В своих предыдущих исследованиях Гэлант и его коллеги уже построили достаточно мощную вычислительную модель для декодирования статичных фотографий. Этот алгоритм позволял им по ФМРТ-сканам мозга с высокой точностью воссоздавать статические изображения. Для декодирования сигналов мозга при наблюдении движущихся картинок была разработана новая, двухэтапная вычислительная модель. Суть её сводится к раздельному моделированию лежащих в основе процессов: работы нейропопуляций и гемодинамики, то есть сигналов тока крови (коль скоро они функционируют с существенно различными скоростями).
В компьютере, обрабатывающем изображения-сканы томографа, мозг поделён на крошечные трёхмерные кубики, именуемые объёмными пикселями, или, кратко, "вокселями". Конкретно в данном эксперименте один воксель соответствует объёму ткани мозга размером 2х2х2,5 мм. Физически каждый такой воксель представляет собой совокупную активность сотен тысяч нейронов. И для каждого вокселя исследователи построили модель, которая
Эта модель описывает быструю визуальную информацию и медленную гемодинамику с помощью раздельных компонентов. Сначала записывались сигналы тока крови в зрительной коре испытуемых, которые смотрели обычные кинофильмы, а затем шло подстраивание алгоритма раздельно к индивидуальным вокселям. Чтобы наглядно продемонстрировать эффективность избранного подхода, исследователи сконструировали на его основе "байесовский декодер", скомбинировав модели оценочного кодирования с образцами предварительно просмотренных человеком кинофильмов.
Поясняя, почему для анализа был выбран именно просмотр кинофильмов, Синдзи Нисимото (ведущий автор исследования в лаборатории Гэланта) говорит следующее: "Наш естественный визуальный опыт напоминает просмотр кинофильма. Для того чтобы разрабатываемая технология нашла широкое применение, мы должны понять, каким образом наш мозг обрабатывает такого рода динамический визуальный опыт".
Сам Нисимото и ещё двое других исследователей команды служили в качестве испытуемых в продолжительной серии экспериментов. Главным образом это было сделано потому, что процедура сканирования каждый раз требует от добровольцев тихо и неподвижно лежать внутри магнита ФМРТ на протяжении нескольких часов. А процедур таких требовалось довольно много, потому что для формирования большой библиотеки образов, необходимой для обучения программы, было просмотрено в общей сложности восемнадцать миллионов секунд скачанных с Youtube видеотрейлеров к голливудским кинофильмам.
Образцы мозговой активности снимались один раз в секунду. Набранные таким способом данные легли в основу для разработки вычислительных моделей, которые способны предсказывать паттерны мозговой активности, порождаемые при просмотре уже совершенно произвольных фильмов (то есть не входивших в начальный набор клипов, использованных для построения модели).
Следом ФМРТ использовали для измерения мозговой активности, порождаемой другим набором клипов - тоже трейлеров, но уже других фильмов.
Слева на картинке - кадр из фильма, который человек смотрел, находясь внутри магнита. Справа - реконструкция этого фрагмента по мозговой активности, зарегистрированной с помощью ФМРТ. Как и в первой фазе экспериментов, образцы мозговой активности снимались раз в секунду; каждая секундная секция просматриваемого фильма восстанавливалась по отдельности. Восстановление производилось путём смешивания и усреднения примерно ста наиболее вероятных фрагментов из общих накоплений в библиотеке реконструкции.
В целом результаты декодирования показали, что восстановленное динамическое изображение оказывается весьма цельным. Качество картинки оказалось заметно зависимым от конкретного вида мозговой активности каждого из тестируемых людей. Но как бы там ни было, работа исследователей в Беркли стала первой наглядной демонстрацией того, что динамический визуальный опыт человека в принципе может быть восстановлен даже на основе той очень медленной мозговой активности, что регистрируется с помощью ФМРТ.