Охота на электроовец. Большая книга искусственного интеллекта, Марков Сергей Николаевич

Охота на электроовец. Большая книга искусственного интеллекта

на обложку

Марков Сергей Николаевич

Шрифт:

Фань так охарактеризовал программу: «Я знаю, что AlphaGo — это компьютер, но если бы мне никто этого не сказал, то я бы, возможно, подумал, что мой соперник был немного странным, но очень сильным игроком, реально существующим человеком» [1945] .

В матче с Фань Хуэем использовалась распределённая версия AlphaGo с 40 потоками перебора и использовавшая 1202 CPU и 176 GPU. Во время основного матча AlphaGo и Фань Хуэй сыграли также пять неформальных игр с более коротким временным контролем (у каждого игрока было только 30 секунд на ход без накопления с тремя дополнительными полуминутами на всю игру), в этих партиях AlphaGo победила Фаня со счётом 3 : 2. Фань Хуэй отметил, что игра с AlphaGo помогла ему улучшить собственный уровень игры и научила видеть вещи, которые раньше он не замечал. Журналисты издания Wired подтвердили

это заявление Хуэя — к марту 2016 г. он переместился в мировом рейтинге го: с 633-го места вошёл в топ-300 [1946] .

1945

Gibney E. (2016). Go players react to computer defeat / Nature // https://doi.org/10.1038/nature.2016.19255

1946

Mets C. (2016). The Sadness and Beauty of Watching Google's AI Play Go / Wired, 11.03.2016 // https://www.wired.com/2016/03/sadness-beauty-watching-googles-ai-play-go/

Реакция профессионалов го была весьма бурной и пропитанной духом отрицания. Ли Седоль, один из сильнейших игроков в го, отметил, что AlphaGo достигла высшего любительского, но не профессионального уровня и что он мог бы дать AlphaGo фору в один или два камня. Ке Цзе и Ми Ютинг были более осторожны, оценив силу игры AlphaGo в этом матче как примерно соответствующую силе кандидата в профессионалы го и чрезвычайно близкую к профессиональному уровню. Ши Юэ и вовсе признал, что AlphaGo уже достигла профессионального уровня. Комментируя успех AlphaGo, Ке Цзе написал у себя в блоге: «Ошеломительно! Хотя уровень игры AlphaGo и был ограничен… Опасно, что он ещё не был завершён и при этом может эволюционировать (развиваться) и дальше». Прокомментировали полученный результат и представители компьютерного сообщества. Создатель уже упоминаемой в книге шашечной программы Chinook Джонатан Шеффер сравнил AlphaGo с «вундеркиндом», которому пока не хватает опыта. По мнению Шеффера, матч с Фань Хуэем ещё не являлся «моментом Deep Blue» и настоящим достижением станет момент, «когда программа обыграет игрока, бесспорно принадлежащего к высшему эшелону».

Впрочем, это понимали все: и создатели AlphaGo, и представители элиты мирового го, поэтому матч соответствующего уровня был организован в кратчайшие сроки. Противником AlphaGo суждено было стать Ли Седолю — профессиональному игроку в го и обладателю девятого дана. Седоль был, вне всякого сомнения, одним из сильнейших игроков в истории го. Он начал карьеру ещё в 1996 г., получив уже в 12 лет первый профессиональный дан, и выиграл с тех пор 18 чемпионатов мира.

Некоторые СМИ называли Ли Седоля чемпионом мира, но это было не вполне корректно, поскольку в го просто не существует титула абсолютного чемпиона мира — различные ассоциации проводят множество турниров по разным правилам, присуждая победителям различные международные титулы. На момент начала матча с AlphaGo Ли Седоль занимал второе место в мире по числу международных титулов, уступая только Каменному Будде — Ли Чхан Хо, к тому моменту уже завершившему игровую карьеру.

В мире го Седоль пользовался огромным уважением благодаря своему неортодоксальному и творческому стилю, а в родной Южной Корее он был настоящим национальным героем.

Ли Седоль считал, что без труда одолеет AlphaGo, о чём открыто говорил в предматчевых интервью. Впрочем, это было неудивительно — он находился на пике своей карьеры. Всего за несколько недель до начала матча с AlphaGo Седоль завоевал корейский титул мёнина, одержав победу в одном из наиболее престижных чемпионатов.

Эксперты, внимательно изучившие игры AlphaGo против Фань Хуэя, обнаружили несколько ошибок, допущенных программой, что придавало уверенности болельщикам Ли Седоля и ему самому. Однако до первой игры матча было неизвестно, насколько сила игры программы улучшилась со времени октябрьского матча.

Матч из пяти партий изначально планировался как грандиозное шоу, по масштабу не уступающее матчу Каспарова с Deep Blue. Совпадал даже размер призового фонда, который составил ровно миллион долларов. В качестве места проведения матча был выбран отель Four Seasons в Сеуле. Все игры транслировались в прямом эфире с комментариями профессионала го девятого дана Майкла Редмонда и управляющего редактора электронного журнала «Американское го» Криса Гарлока. Обзор первой партии матча, выполненный на китайском языке Ке Цзе и ещё одним профессионалом девятого дана — сильнейшим игроком Китая Гу Ли, посмотрело около 60 млн зрителей.

Программный код AlphaGo работал на серверах Google Cloud Platform в Соединённых Штатах, а ходы игроков пересылались через всемирную сеть. Каждому из участников было отведено два часа на партию, потом 60 секунд на ход без накопления времени, но с тремя дополнительными минутами на игру.

Перед

началом матча давались самые разные прогнозы, причём нельзя сказать, что специалисты по ИИ и эксперты по го были склонны делать ставки на представителей собственного лагеря. Например, Шеффер считал, что победу в матче одержит Седоль, в то время как Ли Хаджин, профессиональный игрок и генеральный секретарь Международной федерации го, считала, что оба игрока имеют равные шансы на победу.

В первой партии матча, состоявшейся 9 марта 2016 г., корейский мастер сдался в безнадёжной позиции после 186-го хода, и всему миру стало ясно: со времени матча с Фань Хуэем команда AlphaGo (к которой присоединился и сам Фань Хуэй) не теряла времени даром. Но если после первой партии у кого-то ещё оставались иллюзии по поводу уровня игры программы, то они развеялись после второй и третьей партий матча. Доведя счёт до 3 : 0, AlphaGo досрочно стала победителем, однако матч был доигран: в четвёртой партии Ли Седолю удалось в упорной борьбе размочить счёт, но в последней игре машина вновь одержала победу. Итоговый счёт матча 4 : 1 стал для многих полной неожиданностью. Подспудно многие болельщики ожидали, что противостояние человека и машины в такой традиционно сложной для машин игре, как го, растянется как минимум на несколько лет. Путь к победе команд Шеффера в шашках и Фэнсюна Сюя в шахматах занял много лет и был полон трудностей и временных неудач, в то время как DeepMind преодолела его, казалось, играючи.

Стартап DeepMind Technologies был основан Демисом Хассабисом, Шейном Леггом и Мустафой Сулейманом в 2010 г. Хассабис и Легг познакомились в подразделении вычислительной нейробиологии Гэтсби (Gatsby Computational Neuroscience Unit) Университетского колледжа Лондона (University College London, UCL). Первой пробой пера для DeepMind стало создание систем ИИ, способных играть в старинные компьютерные аркады, такие как Breakout, Pong и Space Invaders. Специалисты компании стремились создать системы, способные овладеть игрой без предварительного знания её правил. В числе инвесторов DeepMind были крупные венчурные компании, такие как Horizons Ventures и Founders Fund, а также частные предприниматели, такие как Скотт Банистер, Питер Тиль, Яан Таллинн и Илон Маск. В январе 2014 г. Google приобрела DeepMind за 500 млн долларов, обойдя на повороте другого потенциального покупателя — Facebook. В 2014 г. DeepMind получила награду «Компания года» от Кембриджской компьютерной лаборатории (Cambridge Computer Laboratory).

Ли Седоль принёс публичные извинения за своё поражение, заявив после третьей игры, что «неправильно оценил возможности AlphaGo и чувствовал себя бессильным». Он подчеркнул, что поражение было «поражением Ли Седоля», а не «поражением человечества». Также он не преминул заметить, что «роботы никогда не поймут всю прелесть игры так, как мы, люди», и назвал свой результат в четвёртой партии бесценной победой, которую он не обменял бы ни на что.

Мюррей Кэмпбелл из команды Deep Blue назвал победу AlphaGo «концом эпохи» и заявил, что с настольными играми удалось более или менее разобраться и что пришло время двигаться дальше.

После окончания матча, 17 марта 2016 г. правительство Южной Кореи объявило, что в течение следующих пяти лет инвестирует 1 трлн вон (около 860 млн долларов) в исследования в области ИИ [1947] .

За выдающиеся достижения в области искусственного интеллекта команда AlphaGo получила медаль Марвина Минского от Международных объединённых конференций по ИИ (International Joint Conferences on Artificial Intelligence, IJCAI). «AlphaGo — это замечательное достижение, прекрасный пример того, ради чего была учреждена медаль Минского», — сказал профессор Майкл Вулдридж, председатель комитета по наградам IJCAI. «Что особенно впечатлило IJCAI, так это то, что AlphaGo достигла своего результата благодаря блестящему сочетанию классических методов ИИ и современных технологий машинного обучения, тесно связанных с DeepMind. Это потрясающая демонстрация современного искусственного интеллекта, и мы рады возможности отметить его с помощью этой награды» [1948] .

1947

Zastrow M. (2016). South Korea trumpets $860-million AI fund after AlphaGo 'shock' / Nature // https://doi.org/10.1038/nature.2016.19595

1948

International Joint Conferences on Artificial Intelligence Organization (2017). Deepmind Alphago Team Receives Inaugural Ijcai Marvin Minsky Medal For Outstanding Achievements in AI / Communications of the ACM, October 20, 2017 // https://cacm.acm.org/news/222067-deepmind-alphago-team-receives-inaugural-ijcai-marvin-minsky-medal-for-outstanding-achievements-in-ai/fulltext