Об ИИ без мифов. Путеводитель по истории Искусственного Интеллекта
Шрифт:
Генеративно-состязательные сети
В конце октября 2018 года на аукционе Кристи за 432 тысячи долларов был продан живописный портрет вымышленного художника Эдмона Белами из серии «Семейство Белами». Но кисть мастера этого холста не касалась, он представлял собой распечатку, созданную средствами AI. Этот успех подтвердил описанный в главе 1 Эффект AI: «Любое поражающее воображение достижение из области AI, при ближайшем рассмотрении оказывается рутинным результатом трудов математиков, инженеров и других специалистов, лишенным какого-либо собственного разума». Творцами портрета оказалась трое французов, составляющие группу Obvious, название которой переводится как «очевидно» и даже «тривиально», а их инструментом креативно-состязательная сеть (Creative Adversarial Network, CAN). Такая сеть способна создавать изображения,
Сети CAN служат дальнейшим развитием генеративно-состязательных сетей (Generative adversarial network, GAN), о них говорят, что CAN – это GAN, способные мыслить креативно. Однако участники Obvious не склонны наделять их разумом, на их сайте мы находим: «… мы используем машинное обучение с тем, чтобы воспроизводить действия человека алгоритмами, основанными на статистических методах. Мы используем эти алгоритмы либо для оптимизации, выполняя сложные вычисления, либо для масштабирования, например, в чатботах, либо то и другое совместно. Алгоритмы могут быть обучены посредством идентификации общих свойств, присущих данным, со скоростью, превышающей человеческие возможности. Мы называем это Augmented Intelligence (AuI) и это совсем не похоже на то, что представляется в фантазиях».
GAN придумал в 2014 Ян Гудфеллоу будучи аспирантом, после чего моментально превратился в культовую фигуру AI (AI celebrity), теперь его именуют не иначе как GANfather (отец GAN). Ключевая мысль, заложенная Гудфеллоу в GAN, заключается в том, что в них не одна, как принято, а сразу две сети тренируются на одном и том же наборе данных. Первую называют генератором, она создает по возможности реалистичные изображения, в то время как вторая – дискриминатор – сравнивает их с исходными и фильтрует неудачные. Полученные дискриминатором результаты далее используются для обучения генератора. Очень важно, чтобы усилия обеих сетей были сбалансированы. Такое единство креативного и критического начала очень типично для творческих партнеров, например, автора и редактора, художника и критика. Можно сказать, что GAN добавила к распознавательным способностям машин еще способность, условно говоря, к воображению. Сети GAN переводят машинное обучение на новый уровень, сегодня сети обучаются с учителем (supervised learning) на колоссальном объеме учебных данных, а создание GAN стало серьезным шагом к обучению без учителя (unsupervised learning).
Уже сегодня GAN используют в крупнейших ядерных центрах для прогнозирования поведения частиц. Есть еще множество иных серьезных направлений, но на данный начальный момент популярны два: улучшение качества изображений, что критично в тех случаях, когда сложно получить требуемое качество в процессе съемки, например, в медицине (Photo-Realistic Single Image Super-Resolution), и создание изображений по текстовым описаниям (Text to Image Synthesis).
Глава 7 Роботы и умные машины
Самое старое изображение механического воина-андроида удалось обнаружить в 1935 году через 800 лет после его создания, это случилось при исследовании альбома архитектора Виллара де Оннекура (Villard de Honnecourt, 1195–1266). В XIII веке в Европе наметился подъем интереса к механике и даже к идее вечного двигателя, не случайно в этом же альбоме еще есть эскиз такого механизма. Самый известный из подобных рабочих альбомов, принадлежавших художникам и архитекторам, конечно же «Атлантический кодекс» Леонардо да Винчи, и в нем тоже среди тысяч рисунков. создававшихся на протяжении 40 лет, есть наброски двух автоматизированных устройств: повозки, датируемый 1478 годом, и рыцаря, относящийся к 1495.
Свою конструкцию робота-воина да Винчи разделил, как бы мы сегодня сказали, на две подсистемы: в одну входила нижняя часть тела – щиколотки, голени, колени и бедра, а в другую руки и плечи. Для управления первой подсистемой Леонардо предполагал внешний программатор, а механизм управления второй разместил непосредственно в грудной клетке. Воссозданная недавно реплика этого рыцаря находится во флорентийском музее Леонардо, а его именем названа одна из самых совершенных роботизированных хирургических систем da Vinci Surgical System. Это тоже робот, но он отнюдь не похож на андроида – робот-хирург многорук как Шива,
Таков зримый результат изменения представления о роботах за прошедшие 500 лет – от мечты о железном человеке до робота-ассистента, узкоспециализированного на определенном приложении. Иногда, когда встречаются рекламы фильмов про андроидов типа «Терминатор», сознается впечатление, что их создатели и зрители отстали в своем развитии на полтысячи лет.
Роботы-автоматоны XX века
Андроиды – это частный случай автоматонов, относительно несложных механизмов, способны к воспроизведению различного рода действий, внешне они могут быть похожи на движения человека или животного, чем создается иллюзия их самостоятельного действия. Это наиболее древний вид псевдо-роботов, к ним относятся популярные сегодня выставочные и развлекательные человекоподобные устройства – они ушли недалеко от древних автоматонов, по сути своей они так же воспроизводят механические действия, как делалось в старину, но с поправкой на использование современных технологий и материалов. Столетиями до середины XIX века искусные механики радовали венценосных особ созданными ими развлекательными автоматами, которые за их изящество стоит в большей мере рассматривать как произведения искусства. Не случайно развлекательные роботы чаще можно увидеть в художественных музеях, например, в Эрмитаже, чем в музеях науки и техники.
Промышленная революция разбудила гений изобретательства, наряду с другими новациями началось строительство огромного числа механизмов, которые можно было назвать роботами, после того, как это слово вошло в оборот. Общество проявляло к ним живой интерес, в газетах и журналах того времени можно найти изрядное количество статей на тему механических существ. Различающиеся внешне, они утроены единообразно – включают в себя простейшие датчики и незатейливые сервомеханизмы, устройства для воспроизведения звуков, несложные механизмы перемещения и в редких случаях радиоуправления. Особым разнообразием отличались движители, от простых колес до нетривиальных колесных конструкций, допускающих перемещение по сложным траекториям и разного рода шагающих сооружений.
Такие роботы строились до последнего времени и даже сейчас создаются разного рода человекоподобные игрушки. О том насколько несовершенны были создания, называвшиеся роботами, свидетельствует тот факт, что в отечественную прессу попадали хваленые материалы о человекоподобных устройствах, собранных из лампочек и реле на существовавших в СССР станциях юных техников, ими были заполнены научно-популярные издания 60–70-х годов.
Среди современных автоматонов встречаются удивительно интересные конструкции, они и правда проявляют внешне почти разумное поведение. Вероятно, первым из таких роботов был FRED (Friendly Robotic Educational Device, 1984), рассчитанный на общение с подростками. Его конкурентом стал робот Topo, но это скорее исполнительный механизм, подключаемый к IBM PC или Apple Mac. Его создатели руководствовались, казалось бы, разумной идеей – обучать ребенка в процессе игры с роботом, но она провалилась. Наследником FRED в 2018 году стал социальный робот Musio, разработанный малоизвестными компаниями KDDI (Япония) и AKA (США). О нем известно, что робот обладает некоторыми способностями к распознаванию речи и изображений.
С появлением необходимых технологий возникала целая индустрия развлекательных роботов. Невероятной удачей оказался робот-игрушка Furby, похожий на Чебурашку, нарисованного выдающимся художником-мультипликатором Леонидом Шварцманом. С 1998 по 2016 год было выпущено более 40 миллионов Furby, в первой версии он снабжался простейшим магнитофоном, микрофоном и динамиком, поэтому мог «обучаться» английскому, распознавать сказанное ему и произносить несколько десятков фраз. Позже, по мере миниатюризации и усложнения электроники, его функциональность возрастала, он «научился» другим языкам, мимике и т. д. После того, как было создано мобильное приложение Furby BOOM! спрос на «живого» Furby резко упал.