Искусственный интеллект. Что стоит знать о наступающей эпохе разумных машин
Шрифт:
Исследователи также отказались от предположения о том, что ИИ позволит лучше понять наш собственный интеллект. Попытайтесь узнать из алгоритмов, как именно люди выполняют разные задачи, и вы гарантированно потратите время впустую: интеллект – это набор данных, а не алгоритм.
Область ИИ прошла через смену парадигмы и вступила в новую эру искусственного интеллекта на основе больших данных, или data-driven ИИ. Новым основополагающим методом стало машинное обучение, а язык сместился с логики на статистические данные.
Представьте себе спам-фильтр в электронной почте,
Когда данные идеи применяются в колоссальном масштабе, происходит нечто удивительное: машины начинают делать то, что было бы крайне трудно запрограммировать напрямую, например завершать предложения, предсказывать наш следующий клик или рекомендовать какой-то товар. Данный подход продемонстрировал отличные результаты в языковом переводе, распознавании рукописного ввода, распознавании лиц и многом другом. Вопреки предположениям 60-летней давности, нам не обязательно задавать точное описание интеллектуальных качеств для воссоздания их в машине.
Несмотря на явную простоту этих механизмов – их даже можно назвать статистическими подсказками, – при внедрении нескольких таких алгоритмов в сложную программу и снабжении ее миллионами примеров результат может выглядеть как высокоадаптивное поведение, которое мы склонны называть «разумным». При этом обработчик данных не имеет внутреннего представления о том, что он делает и почему.
Полученные таким образом экспериментальные результаты иногда называют «необоснованной эффективностью данных». Для исследователей ИИ это был очень важный и поучительный урок: простые статистические приемы в сочетании с огромным количеством данных позволили добиться такого поведения, которое на протяжении десятилетий казалось недостижимым для лучших теоретиков отрасли.
Благодаря машинному обучению и доступности больших наборов данных ИИ смог наконец-то создать приемлемые вопросно-ответные системы, а также системы видения, речи и перевода. Интеграция в более крупные системы позволит укрепить мощность таких продуктов и сервисов, как Siri (Apple), онлайн-магазин Amazon, беспилотные автомобили от Google и т. д.
Хомский против Google
Должны ли мы понимать искусственный интеллект, который сами же и создаем? Этот вопрос породил неожиданный спор между двумя интеллектуальными гениями из совершенно разных научных областей.
На праздновании 150-летия Массачусетского технологического института Ноаму Хомскому, отцу современной лингвистики, предложили прокомментировать успех статистических методов в создании ИИ. Оказалось, что Хомский не входит в ряды поклонников ИИ.
Работы Хомского в лингвистике повлияли на многих специалистов,
Сторонники статистических методов в глазах Хомского подобны ученым, которые изучают танцы пчел и моделируют движения этих насекомых, не задаваясь вопросом, почему пчелы делают это именно так. По мнению Хомского, статистические методы дают нам предположение, но не понимание. «Это новое определение успеха. Ничего подобного в истории науки я не встречал», – сказал он.
Питер Норвиг, директор по исследованиям в Google, ответил Хомскому в эссе на своем сайте. Огромное негодование у него вызвал комментарий Хомского о том, что статистический подход имел «ограниченный успех». Как утверждал Норвиг, сейчас статистический подход, наоборот, является доминирующей парадигмой. Которая, кстати, приносит по несколько триллионов долларов в год. В академическом эквиваленте грубого оскорбления он сравнил взгляды Хомского с мистицизмом.
И все же основное разногласие между двумя исследователями было более фундаментальным. Норвиг утверждал, что ученые, подобные Хомскому, которые стремятся создавать более простые и изящные модели для объяснения мира, уже устарели. «Не факт, что природу черного ящика получится описать простой моделью», – говорит он. Норвиг считает, что подход Хомского создает иллюзию понимания, но не имеет ничего общего с реальностью.
То, что началось с разногласия об ИИ, похоже, переросло в спор о природе самого знания.
Пища для размышлений: подход, основанный на данных
Внимание исследователей теперь переключилось на то, что питает «двигатель» интеллектуальных машин – данные. Где же их можно найти? И как максимизировать использование этого ресурса?
Важным шагом стало признание того, что ценные данные легко находятся «в естественных условиях» и генерируются как побочный продукт различных видов деятельности. Некоторые из них появляются в результате рутинных действий (например, обмен твитами или поиск информации в Интернете).
Кроме того, инженеры и предприниматели придумали множество способов по извлечению и сбору дополнительных данных: предложение пользователям принять cookie, отметить друзей на фотографиях, оценить продукт или сыграть в игру с определением местоположения, в которой нужно ловить монстров на улице. Данные стали новым «топливом».
Пока ИИ пытался определить путь собственного развития, мы успели разработать беспрецедентную инфраструктуру глобальных данных. Вы взаимодействуете с этой инфраструктурой каждый раз, когда заходите в сеть прочитать новости, сыграть в игру, проверить почту или баланс счета или пролистать ленту в соцсетях. Это не просто некий физический объект в виде компьютера и проводов, но еще и целая программа, включающая в себя социальные сети и сайты микроблогов.