Искусственный интеллект. Что стоит знать о наступающей эпохе разумных машин, Хэвен Дуглас

Искусственный интеллект. Что стоит знать о наступающей эпохе разумных машин

на обложку

Хэвен Дуглас

Шрифт:

Исследователи также отказались от предположения о том, что ИИ позволит лучше понять наш собственный интеллект. Попытайтесь узнать из алгоритмов, как именно люди выполняют разные задачи, и вы гарантированно потратите время впустую: интеллект – это набор данных, а не алгоритм.

Область ИИ прошла через смену парадигмы и вступила в новую эру искусственного интеллекта на основе больших данных, или data-driven ИИ. Новым основополагающим методом стало машинное обучение, а язык сместился с логики на статистические данные.

Представьте себе спам-фильтр в электронной почте,

который решает выборочно изолировать определенные письма на основе их содержимого. Каждый раз, когда вы перемещаете письмо в «Спам», вы позволяете этому фильтру считать сообщения от данного отправителя или письма, содержащие определенное слово, спамом. Использование этой информации для всех слов в сообщении позволяет спам-фильтру выстроить эмпирические предположения о новых письмах. Глубоких знаний здесь не требуется – вся процедура ограничивается подсчетом частоты использования слов.

Когда данные идеи применяются в колоссальном масштабе, происходит нечто удивительное: машины начинают делать то, что было бы крайне трудно запрограммировать напрямую, например завершать предложения, предсказывать наш следующий клик или рекомендовать какой-то товар. Данный подход продемонстрировал отличные результаты в языковом переводе, распознавании рукописного ввода, распознавании лиц и многом другом. Вопреки предположениям 60-летней давности, нам не обязательно задавать точное описание интеллектуальных качеств для воссоздания их в машине.

Несмотря на явную простоту этих механизмов – их даже можно назвать статистическими подсказками, – при внедрении нескольких таких алгоритмов в сложную программу и снабжении ее миллионами примеров результат может выглядеть как высокоадаптивное поведение, которое мы склонны называть «разумным». При этом обработчик данных не имеет внутреннего представления о том, что он делает и почему.

Полученные таким образом экспериментальные результаты иногда называют «необоснованной эффективностью данных». Для исследователей ИИ это был очень важный и поучительный урок: простые статистические приемы в сочетании с огромным количеством данных позволили добиться такого поведения, которое на протяжении десятилетий казалось недостижимым для лучших теоретиков отрасли.

Благодаря машинному обучению и доступности больших наборов данных ИИ смог наконец-то создать приемлемые вопросно-ответные системы, а также системы видения, речи и перевода. Интеграция в более крупные системы позволит укрепить мощность таких продуктов и сервисов, как Siri (Apple), онлайн-магазин Amazon, беспилотные автомобили от Google и т. д.

Хомский против Google

Должны ли мы понимать искусственный интеллект, который сами же и создаем? Этот вопрос породил неожиданный спор между двумя интеллектуальными гениями из совершенно разных научных областей.

На праздновании 150-летия Массачусетского технологического института Ноаму Хомскому, отцу современной лингвистики, предложили прокомментировать успех статистических методов в создании ИИ. Оказалось, что Хомский не входит в ряды поклонников ИИ.

Работы Хомского в лингвистике повлияли на многих специалистов,

изучающих человеческий интеллект. В основе его теорий лежит идея о том, что в нашем мозге существуют четко прописанные и фиксированные правила. Возможно, этим и объясняется его неодобрение современного подхода к ИИ, при котором правила заменяются статистическими корреляциями. Иначе говоря, мы не можем объяснить, почему эти ИИ считаются разумными; они просто таковыми являются.

Сторонники статистических методов в глазах Хомского подобны ученым, которые изучают танцы пчел и моделируют движения этих насекомых, не задаваясь вопросом, почему пчелы делают это именно так. По мнению Хомского, статистические методы дают нам предположение, но не понимание. «Это новое определение успеха. Ничего подобного в истории науки я не встречал», – сказал он.

Питер Норвиг, директор по исследованиям в Google, ответил Хомскому в эссе на своем сайте. Огромное негодование у него вызвал комментарий Хомского о том, что статистический подход имел «ограниченный успех». Как утверждал Норвиг, сейчас статистический подход, наоборот, является доминирующей парадигмой. Которая, кстати, приносит по несколько триллионов долларов в год. В академическом эквиваленте грубого оскорбления он сравнил взгляды Хомского с мистицизмом.

И все же основное разногласие между двумя исследователями было более фундаментальным. Норвиг утверждал, что ученые, подобные Хомскому, которые стремятся создавать более простые и изящные модели для объяснения мира, уже устарели. «Не факт, что природу черного ящика получится описать простой моделью», – говорит он. Норвиг считает, что подход Хомского создает иллюзию понимания, но не имеет ничего общего с реальностью.

То, что началось с разногласия об ИИ, похоже, переросло в спор о природе самого знания.

Пища для размышлений: подход, основанный на данных

Внимание исследователей теперь переключилось на то, что питает «двигатель» интеллектуальных машин – данные. Где же их можно найти? И как максимизировать использование этого ресурса?

Важным шагом стало признание того, что ценные данные легко находятся «в естественных условиях» и генерируются как побочный продукт различных видов деятельности. Некоторые из них появляются в результате рутинных действий (например, обмен твитами или поиск информации в Интернете).

Кроме того, инженеры и предприниматели придумали множество способов по извлечению и сбору дополнительных данных: предложение пользователям принять cookie, отметить друзей на фотографиях, оценить продукт или сыграть в игру с определением местоположения, в которой нужно ловить монстров на улице. Данные стали новым «топливом».

Пока ИИ пытался определить путь собственного развития, мы успели разработать беспрецедентную инфраструктуру глобальных данных. Вы взаимодействуете с этой инфраструктурой каждый раз, когда заходите в сеть прочитать новости, сыграть в игру, проверить почту или баланс счета или пролистать ленту в соцсетях. Это не просто некий физический объект в виде компьютера и проводов, но еще и целая программа, включающая в себя социальные сети и сайты микроблогов.