Чтение онлайн

на главную - закладки

Жанры

Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:

Авторы аналитического отчёта от другого участника «большой четвёрки» — Deloitte — выносят в заголовок одного из разделов важную мысль: «Поддержка развития ИИ не является игрой с нулевой суммой» (AI advantage is not a zero-sum game) [1810] . Благодаря развитию систем для автоматизации решения интеллектуальных задач возникают принципиально новые направления в экономике, новые рынки, новые профессии. Индустрия компьютерных игр создала куда больше рабочих мест, чем ликвидировал калькулятор.

1810

Deloitte.Insights (2019). Future in the balance? How countries are pursuing an AI advantage. Insights from Deloitte’s State of AI in the Enterprise, 2nd Edition survey // https://www2.deloitte.com/content/dam/Deloitte/lu/Documents/public-sector/lu-global-ai-survey.pdf

Третий раздел другого исследования Deloitte, отражающий один из основных трендов индустрии, называется «Организации, движимые ИИ» (AI-fueled organizations) и посвящён организациям, источником развития которых является систематическое внедрение в бизнес-процессы технологий ИИ: «Чтобы стать настоящей организацией, движимой ИИ, компании, возможно,

потребуется фундаментально переосмыслить способ взаимодействия людей и машин в рабочей среде. Руководителям также следует рассмотреть возможность систематического внедрения машинного обучения и других когнитивных инструментов во все основные бизнес-процессы и операции предприятия для поддержки принятия решений на основе данных». Далее аналитики Deloitte делают ещё более сильное утверждение: «Превращение в движимую ИИ организацию может стать не просто стратегией успеха, а залогом выживания» [1811] .

1811

Deloitte.Insights (2019). Tech Trends 2019: Beyond the digital frontier // https://www2.deloitte.com/content/dam/Deloitte/br/Documents/technology/DI_TechTrends2019.pdf

Специалисты PwC считают, что благодаря развитию технологий ИИ будет происходить персонализация продуктов и сервисов [1812] (представьте, например, музыку, сочинённую специально для вас и вашего текущего настроения), а также будут возникать новые товары и услуги [1813] (например, виртуальный ассистент, способный по вашему поручению заказать столик в ресторане или записать вас в поликлинику).

Согласны с ними и аналитики международной консалтинговой компании McKinsey & Company. Авторы аналитического доклада, подготовленного этой фирмой, лишь немного расходятся с аналитиками PwC в оценке степени вероятного влияния ИИ на экономику 2030 г., оценивая вероятный вклад ИИ в 13 трлн долларов [1814] (напомним, что оценка PwC составляет 15,7 трлн долларов). Оценка Международного телекоммуникационного союза (International Telecommunication Union, ITU) составляет 15 трлн долларов (правда, они оценивают в 7 трлн долларов негативные экстерналии [1815] и транзакционные издержки от этого; в основном к их числу относятся расходы на переобучение людей) [1816] . В общем, аналитики демонстрируют в своих прогнозах завидное единодушие. Но что ещё более важно, они сходятся в характеристике текущего вклада технологий ИИ в мировую экономику, оценивая его в 1,5–2 трлн долларов. Реальные плоды технологий ИИ наблюдает сегодня каждый из нас.

1812

Sizing the prize. PwC’s Global Artificial Intelligence Study: Exploiting the AI Revolution. What’s the real value of AI for your business and how can you capitalise? (2017) // https://www.pwc.com/gx/en/issues/data-and-analytics/publications/artificial-intelligence-study.html

1813

Sizing the prize. PwC’s Global Artificial Intelligence Study: Exploiting the AI Revolution. What’s the real value of AI for your business and how can you capitalise? (2017) // https://www.pwc.com/gx/en/issues/data-and-analytics/publications/artificial-intelligence-study.html

1814

Bughin J., Seong J., Manyika J., Chui M., Joshi R. (2018). Notes from the ai frontier modeling the impact of ai on the world economy. Discussion paper / McKinsey&Company. McKinsey Global Institute // https://www.mckinsey.com/~/media/McKinsey/Featured%20Insights/Artificial%20Intelligence/Notes%20from%20the%20frontier%20Modeling%20the%20impact%20of%20AI%20on%20the%20world%20economy/MGI-Notes-from-the-AI-frontier-Modeling-the-impact-of-AI-on-the-world-economy-September-2018.ashx

1815

* Экстерналия (англ. externality), или внешний эффект, в экономической теории — воздействие рыночной транзакции на третьих лиц, не опосредованное рынком. Например, загрязнение окружающей среды в результате деятельности некой компании является отрицательной экстерналией.

1816

ITUTrends (2018). Assessing the Economic Impact of Artificial Intelligence / Emerging trends in ICTs, Iss. Paper No. 1, September 2018 // https://www.itu.int/dms_pub/itu-s/opb/gen/S-GEN-ISSUEPAPER-2018-1-PDF-E.pdf

Давайте подробнее рассмотрим прогресс, достигнутый в различных отраслях в ходе новой весны искусственного интеллекта.

6.2 Машина распознаёт образы

Гляжу с обычным умиленьем

На ваши кроткие черты,

И сердце светлым вдохновеньем

Наполнил образ красоты.

Какой обмен несправедливый!

Вдруг получить издалека

Вам, юной, свежей и красивой,

Печальный образ старика!

Афанасий Фет. Л. И. Офросимовой при посылке портрета

Распознавание образов [pattern recognition] — это отрасль ИИ, которая занимается автоматическим обнаружением закономерностей в данных и решением задач классификации и регрессии найденных закономерностей.

Распознавание образов часто понимается как распознавание только изображений, но на самом деле это не так: дело в том, что слово «образ» в русском языке не совсем точно соответствует английскому pattern. У этого слова довольно много значений — «узор», «шаблон», «образец», «структура», но так уж вышло, что в отечественной научной традиции принято говорить именно о распознавании образов, а само направление называть теорией распознавания образов.

Данные, в которых имеются те или иные закономерности, могут иметь самую разную природу: это могут быть оцифрованные изображения, звуки, видео, тексты, сигналы различных датчиков (температуры, давления, перемещения и т. д.) — словом, что угодно, что может быть подано на вход машины. Одно лишь перечисление задач, относящихся к области распознавания образов, заняло бы наверняка не одну сотню страниц. Поэтому здесь мы рассмотрим лишь некоторые типичные задачи, по прогрессу в решении которых принято судить об успехах всей области. Хотя предположение о том, что прогресс в решении отдельных задач распознавания должен сопровождаться прогрессом в решении других задач, выглядит вполне разумным, однако на деле всё может оказаться не так просто. Мы знаем, например, что машины довольно быстро научились идеально играть в крестики-нолики, но безупречный автоматический игрок в шашки появился лишь спустя полвека. Возможность применения для распознавания образов тех или иных алгоритмов и моделей во многом зависит от характеристик данных, и прежде всего от их размерности. Одно дело отличить крестик от нолика на монохромной картинке размером 3 x 3 пикселя (здесь вполне можно обойтись набором составленных вручную правил), и совсем другое — распознать котика на цветной 10-мегапиксельной фотографии. Важным достижением новой весны ИИ стал существенный прогресс в ряде задач, относящихся к реальному миру, то есть таких задач, которые приходится решать людям

в ходе различных производственных процессов. При этом нередко системам искусственного интеллекта удавалось превзойти людей. Это особенно важно в силу того, что в итоге была открыта дорога к автоматизации решения многих задач, решаемых людьми в повседневной жизни.

Для оценки прогресса в решении подобных задач специалисты в области ИИ обычно создают публичные стандартизованные наборы данных, которые позволяют оценивать точность работы различных моделей, а также точность выполнения задач людьми. Мы уже упоминали MNIST — один из подобных наборов, содержащий множество пиксельных образов рукописных цифр. Задача распознавания цифр из этого набора стала тривиальной на границе тысячелетий, поэтому сегодня для оценки прогресса в области распознавания изображений принято использовать более сложные наборы данных. Сегодня, благодаря усилиям сообщества, разработчикам моделей распознавания образов доступны сотни, если не тысячи наборов данных, содержащих изображения, аудио- и видеозаписи, тексты, различные мультимодальные данные (например, наборы изображений, снабжённых текстовыми описаниями, и т. п.) [1817] , [1818] , [1819] и так далее. Более того, регулярно проводятся соревнования по решению различных задач в области распознавания образов, в том числе онлайн — на таких сервисах, как Kaggle, Driven Data, CrowdANALYTIX и др. Причём благодаря появлению облачных платформ, предоставляющих доступ к высокопроизводительным тензорным процессорам (Google Colab, Amazon AWS или отечественный «Кристофари» от Сбербанка), участникам соревнований необязательно даже иметь в собственности дорогое оборудование для обучения моделей. Словом, по сравнению с 1990-ми гг. решительно изменились почти все элементы инфраструктуры, задействованные в сфере распознавания образов, и плоды этих изменений не заставили себя ждать.

1817

* Вообще говоря, термин модальность (от лат. modus — способ) пришёл в информатику из психологии, в которой понятия «модальность раздражителя» [stimulus modality] и «сенсорная модальность» [sensory modality] используются для того, чтобы указать на восприятие раздражителя определённой сенсорной системой: визуальной (зрительной), аудиальной (слуховой) и так далее. Однако использование этого термина в области информатики приобрело весьма вольный характер. Например, нередко говорят о «текстовой модальности» [text modality], но ведь у человека отсутствуют специальные сенсоры для восприятия текста — мы воспринимаем текст опосредованно, например через зрительную или слуховую систему. Фактически в данном случае термин «модальность» смешивается со способом представления данных [data representation]. Кроме того, очевидно, что машины вовсе не обязаны иметь тот же набор сенсорных систем, что и люди. Увы, связанная с этим путаница в наши дни приобрела уже всеобщий масштаб, и фарш уже вряд ли получится прокрутить в обратном направлении. Но, быть может, ещё не поздно при необходимости использовать для различения смешавшихся понятий составные термины, например «сенсорная модальность» и «модальность представления» [representation modality].

1818

Portes Q., Carvalho J. M., Pinquier J., Lerasle F. (2021). Multimodal Neural Network for Sentiment Analysis in Embedded Systems // https://www.scitepress.org/Papers/2021/102247/102247.pdf

1819

Baltrusaitis T., Ahuja C., Morency L.-P. (2018). Multimodal Machine Learning: A Survey and Taxonomy // https://arxiv.org/abs/1705.09406

6.2.1 Распознавание изображений

Любите живопись, поэты!

Лишь ей, единственной, дано

Души изменчивой приметы

Переносить на полотно.

Николай Заболоцкий. Портрет

30 сентября 2012 г. свёрточная нейронная сеть, известная сегодня под названием AlexNet, с существенным отрывом заняла первое место в конкурсе ILSVRC 2012 (ImageNet Large Scale Visual Recognition Challenge, Соревнования по широкомасштабному распознаванию изображений ImageNet). Считается, что именно это событие стало отправной точкой для очередного витка общественного интереса к сфере ИИ. Авторы The Economist в статье под названием «От бездействия к действию нейронных сетей» (From not working to neural networking, содержит игру слов not working/networking) так охарактеризовали общественную реакцию на это событие: «внезапно было привлечено внимание людей не только из ИИ-сообщества, но и из технологической отрасли вообще» [1820] .

1820

From not working to neural networking: The artificial-intelligence boom is based on an old idea, but with a modern twist (2016) / The Economist // https://www.economist.com/special-report/2016/06/23/from-not-working-to-neural-networking

Ежегодные соревнования ILSVRC начали проводиться с 2010 г., однако в 2010 и 2011 гг. нейросетевые модели не участвовали в соревнованиях, а первые места доставались моделям на базе метода опорных векторов (SVM) с различными трюками вроде фишеровских векторов [1821] , [1822] , [1823] . Таким образом, 30 сентября 2012 г. можно выбрать в качестве даты начала новой весны ИИ, хотя её наступлению предшествовало множество других важных событий. В первую очередь речь идёт о создании самого датасета ImageNet, что было непростой задачей, учитывая тот факт, что по размеру он многократно превосходил все созданные ранее датасеты, а также его многоуровневую систему аннотаций.

1821

Sanchez J., Perronnin F., Mensink T. (2010). Improved Fisher Vector for Large Scale Image Classification XRCE's participation for ILSVRC // http://image-net.org/challenges/LSVRC/2010/ILSVRC2010_XRCE.pdf

1822

Lin Y., Lv F., Zhu S., Yang M., Cour T., Yu K., Cao L., Li Z., Tsai M., Zhou X., Huang T., Zhang T. (2010). ImageNet classification: fast descriptor coding and large-scale SVM training // http://image-net.org/challenges/LSVRC/2010/ILSVRC2010_NEC-UIUC.pdf

1823

Perronnin F., Sanchez J. (2011). XRCE@ILSVRC2011: Compressed Fisher vectors for LSVR // http://image-net.org/challenges/LSVRC/2011/ilsvrc11.pdf

В современных популярных статьях по истории нейронных сетей, по всей видимости в силу особенностей самого формата, картина обычно выглядит следующим образом: жил-был Ян Лекун, который изобрёл свёрточные нейронные сети и в 1998 г. показал их эффективность на датасете MNIST. Спустя 12 лет как чёртик из табакерки или, будет правильнее сказать, как фея из сказки появляется Фей-Фей Ли из Стэнфорда, создаёт базу изображений ImageNet, а спустя ещё два года немного доработанная архитектура Лекуна в виде программы AlexNet, благодаря использованию при обучении GPU от Nvidia, рвёт в клочья все богомерзкие SVM’ы — и наступает эра глубокого обучения.

Поделиться:
Популярные книги

Корпорация «Исполнение желаний»

Мелан Вероника
2. Город
Приключения:
прочие приключения
8.42
рейтинг книги
Корпорация «Исполнение желаний»

Ваше Сиятельство

Моури Эрли
1. Ваше Сиятельство
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
Ваше Сиятельство

Мастер 6

Чащин Валерий
6. Мастер
Фантастика:
боевая фантастика
попаданцы
аниме
5.00
рейтинг книги
Мастер 6

Проводник

Кораблев Родион
2. Другая сторона
Фантастика:
боевая фантастика
рпг
7.41
рейтинг книги
Проводник

Стражи душ

Кас Маркус
4. Артефактор
Фантастика:
городское фэнтези
попаданцы
аниме
5.00
рейтинг книги
Стражи душ

Фиктивный брак

Завгородняя Анна Александровна
Фантастика:
фэнтези
6.71
рейтинг книги
Фиктивный брак

Вкус ледяного поцелуя

Полякова Татьяна Викторовна
2. Ольга Рязанцева
Детективы:
криминальные детективы
9.08
рейтинг книги
Вкус ледяного поцелуя

Барин-Шабарин

Гуров Валерий Александрович
1. Барин-Шабарин
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Барин-Шабарин

Ты - наша

Зайцева Мария
1. Наша
Любовные романы:
современные любовные романы
эро литература
5.00
рейтинг книги
Ты - наша

Студент из прошлого тысячелетия

Еслер Андрей
2. Соприкосновение миров
Фантастика:
героическая фантастика
попаданцы
аниме
5.00
рейтинг книги
Студент из прошлого тысячелетия

На границе империй. Том 9. Часть 5

INDIGO
18. Фортуна дама переменчивая
Фантастика:
космическая фантастика
попаданцы
5.00
рейтинг книги
На границе империй. Том 9. Часть 5

Попаданка 3

Ахминеева Нина
3. Двойная звезда
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Попаданка 3

Седьмая жена короля

Шёпот Светлана
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Седьмая жена короля

Многорукий бог Далайна. Свет в окошке

Логинов Святослав Владимирович
Шедевры отечественной фантастики
Фантастика:
научная фантастика
8.00
рейтинг книги
Многорукий бог Далайна. Свет в окошке