Душа машины. Радикальный поворот к человекоподобию систем искусственного интеллекта
Шрифт:
Один из посетителей штаб-квартиры Covariant описал технологию в действии: «Я наблюдал, как три разных робота мастерски собирают заказ из всевозможных товаров. За считаные секунды алгоритм анализирует положение предметов, рассчитывает угол атаки и последовательность движений, а затем вытягивает руку, чтобы захватить товар с помощью присоски. Он движется уверенно и точно, меняя скорость в зависимости от хрупкости покупки» [22] .
В роботах используются готовый промышленный манипулятор, захват с присоской и система технического зрения. Система технического зрения соединена с захватом с помощью Covariant Brain – программной платформы, не зависящей от аппаратного обеспечения. Она призвана стать универсальным искусственным интеллектом для роботов в любой клиентской среде – единой нейросетью, способной адаптироваться к разнообразным условиям.
22
Karen Hao, “AI-Powered Robot Warehouse Pickers Are Now Ready to Go to Work”, MIT Technology Review, January 29, 2020, https://www.technologyreview.com/s/615109/ai-powered-robot-warehouse-pickers-are-now-ready-to-go-to-work/.
«Наша
23
Evan Ackerman, “Covariant Uses Simple Robot and Gigantic Neural Net to Automate Warehouse Picking”, IEEE Spectrum, January 29, 2020, https://spectrum.ieee.org/automaton/robotics/industrial-robots/covariant-ai-gigantic-neural-network-o-automate-warehouse-picking.
Назвать эту систему гибридной вряд ли справедливо по отношению ко всем техникам, которые использовались для наделения ее способностью к обобщению. Covariant использует широкий спектр методов, включая имитационное обучение и обучение с подкреплением.
Например, чтобы обучить робота взаимодействовать с новым набором предметов, их раскладывают перед ним и смотрят, сумеет ли он правильно сориентироваться. В случае неудачи робот может обновить свое представление о том, что он видит, и попробовать другие подходы. Добиваясь успеха, он получает вознаграждающий сигнал, который подкрепляет обучение.
Когда набор артикулов совсем ни на что не похож, Covariant вынужден вернуться к обучению с учителем – сбору и маркировке большого количества новых обучающих данных, как в системах глубокого обучения.
Чтобы добиться успеха в коммерческой среде, роботы должны работать на очень высоком уровне. Ранее роботы-сборщики KNAPP надежно обрабатывали около 15 % объектов; теперь же, оснащенные технологией Covariant, они справляются с 95 % объектов [24] . За час робот собирает около 600 объектов, а человек – 450. И тем не менее в компании Obeta не сократили ни одного сотрудника.
24
Daniela Hernandez and Parmy Olson, “Smarter Delivery Hinges on Smarter Robots”, Wall Street Journal, January 29, 2020, https://www.wsj.com/articles/smarter-delivery-hinges-on-smarter-robots-11580288408.
По словам Питера Пухвайна, вице-президента по инновациям компании KNAPP, персонал прошел переподготовку, чтобы лучше разбираться в робототехнике и компьютерах [25] . Тем временем компания Covariant собирается развивать платформу Brain, чтобы использовать роботов в производстве, сельском хозяйстве, гостиничном бизнесе, на промышленных кухнях и в конечном счете в домах людей.
Нерелевантные результаты поиска – вечная головная боль для интернет-магазинов вроде Zappos. Запросы могут иметь несколько разных значений для поисковой системы сайта, поэтому получить точные результаты порой непросто. Потенциальные клиенты, подбирающие туфли к платью определенного стиля и получающие платья вместо туфель, вскоре от этого устанут и перейдут к конкурентам. Чтобы решить эту проблему, Zappos сталкивает алгоритмы друг с другом в цифровой игре «Выживший».
25
Hernandez and Olson, “Smarter Delivery Hinges on Smarter Robots”.
Эти так называемые генетические алгоритмы, по сути, являются алгоритмами рандомизированного поиска, имитирующими механику естественного отбора. В этом процессе человек, наткнувшись на полезные результаты, использует их, – например,
Генетические алгоритмы были впервые представлены в 1960 году Джоном Холландом, крупным ученым в области психологии, электротехники и информатики, но применять их стали лишь недавно: раньше не хватало вычислительных мощностей. Компания Zappos начала экспериментировать с генетическими алгоритмами в 2017 году.
В то время на сайте компании ежемесячно появлялось около миллиона уникальных поисковых запросов. Поисковая система должна была сопоставить эти запросы с более чем 100 000 позиций в каталоге [26] . Генетические алгоритмы моделируют процесс естественного отбора – по Дарвину. Система Zappos, например, создает алгоритмы, которые определяют смысл поисковой фразы.
Один алгоритм рассматривает в определенной фразе как сильный сигнал слово «платье». Конкурирующий алгоритм в этом же запросе уделяет больше внимания другим словам. «Тест на релевантность», имитирующий поведение пользователей, вознаграждает победителя и передает его черты следующему поколению. Алгоритм, который лучше всех справился с поставленной задачей, и начинает работать на сайте, пока его не заменят более эффективным. Таким образом, поисковая система постоянно совершенствуется.
26
Jared Council, “At Zappos, Algorithms Teach Themselves,” Wall Street Journal, July 8, 2019, https://www.wsj.com/articles/at-Zappos-lgorithms-teach-themselves-11562578200.
Менее чем через год использования технологии генетических алгоритмов компания обнаружила, что клиенты быстрее совершают покупки и применяют меньше фильтров: покупателям не приходится постоянно переформулировать запросы для уточнения поиска. По словам Амина Казеруни, ведущего специалиста по обработке данных в Zappos, «в конце концов, это не постоянные расходы: подключил – и работает» [27] .
Люди регулярно и часто без особых усилий перебирают вероятности и, даже имея относительно небольшой опыт, действуют в соответствии с наиболее возможными из них. Сейчас специалисты обучают машины подражать рассуждениям с помощью вероятностных моделей, основанных на гауссовских процессах; такие модели позволяют действовать в условиях значительной неопределенности, работают с разреженными данными и обучаются на опыте.
27
Hilary Milnes, “How Zappos Used AI to Rebuild its Search Engine,” Modern Retail, August 2, 2019, 2019, https://www.modernretail.co/retailers/how-Zappos-used-ai-to-rebuild-its-search-engine.
Около десяти лет назад компания Alphabet, материнская компания Google, запустила в регионах мира, слабо охваченных интернетом, проект Loon. Это было сделано с помощью системы гигантских аэростатов, размещенных в стратосфере [28] . Их навигационные системы использовали гауссовские процессы для определения траектории оптимального движения среди разных слоев порывистых и изменчивых воздушных потоков. Каждый шар перемещался в воздушный поток нужного направления, таким образом из аэростатов формировалась большая коммуникационная сеть.
28
Cade Metz, “Machine Learning Invades the Real World on Internet Balloons,” Wired, February 17, 2017, https://www.wired.com/2017/02/machine-learning-drifting-real-world-internet-balloons/.
Воздушные шары могли не только делать достаточно точные прогнозы на основе прошлых полетов, но и анализировать новые данные прямо в воздухе, корректируя с их учетом свежие прогнозы.
Компания Alphabet завершила эксперимент в начале 2021 года, однако использование гауссовских процессов имеет большие перспективы. Стартап Secondmind разработал продукт Decision Engine, основанный на вероятностном моделировании с помощью гауссовских процессов. С помощью этой платформы японский автоконцерн Mazda смог улучшить настройку двигателя, используя в тысячу раз меньше данных, чем требуется обычным современным системам [29] .
29
Tony Quested, “Great Decision as Secondmind Blooms from PROWLER.io”, BusinessWeekly, September 29, 2020, https://www.businessweekly.co.uk/news/hi-tech/great-decision-secondmind-blooms-prowlerio.