Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:
Всего в эксперименте каждый из восьми психиатров провёл по два интервью: с пациентом-человеком и с PARRY, причём в половине случаев интервью психиатра было вначале с человеком, а потом — с PARRY, а во второй половине случаев — наоборот. В тестах использовались две версии бота («слабая» и «сильная»), различающиеся разными настройками. «Сильная» версия демонстрировала более выраженные параноидные симптомы и структурированный бред, в то время как симптомы «слабой» версии проявлялись в меньшей степени, она выказывала подозрительность, но обходилась без бреда.
Пациенты (их было трое, при этом один из них участвовал в интервью шесть раз) получили свой диагноз от штатных психиатров соседней психиатрической больницы и были отобраны для участия в эксперименте главой отделения.
Каждое интервью длилось 30–40 минут. В эксперименте участвовали три группы психиатров: первая группа из восьми человек проводила собеседования, а вторая и третья только анализировали полученные диалоги.
После завершения интервью участникам первой группы сообщили, что существует четыре возможности: 1) оба интервью проводились с пациентами; 2) первое интервью было с пациентом, а второе — с компьютерной программой; 3) первое интервью было с компьютерной программой, а второе — с пациентом и, наконец, 4) оба интервью проводились с компьютерной программой. При этом шесть из восьми участников дали неправильный ответ.
Далее, ста психиатрам, отобранным случайным образом по спискам Американской психиатрической ассоциации (American Psychiatric Association), были отправлены протоколы двух интервью с указанием, что в одном из них вместо пациента участвовала компьютерная программа, и было предложено определить, в каком именно. Ответы прислали 40 человек (третья группа психиатров), и из 40 полученных ответов правильных было 21 (52%), а неправильных 19 (48%) — именно так, а не наоборот [2021] ; путаница возникла, по всей видимости, в работе «Тест Тьюринга: 50 лет спустя» (Turing Test: 50 Years Later) [2022] , на которую ссылаются [2023] более поздние авторы.
2021
Colby K. M., Hilf F. D., Weber S., Kraemer H. C. (1972). Turing-like indistinguishability tests for the validation of a computer simulation of paranoid processes / Artificial Intelligence, Vol., 1972, pp. 199—221 //90049-5
2022
Saygin A. P., Cicekli I., Akman V. (2003). Turing Test: 50 Years Later / Moor J. H. (2003). The Turing Test. The Elusive Standard of Artificial Intelligence. Studies in Cognitive Systems, Vol. 30, pp. 23–78 // https://doi.org/10.1007/978-94-010-0105-2_2
2023
Luiselli J. K., Fischer A. J. (2016). Computer-Assisted and Web-Based Innovations in Psychology, Special Education, and Health. Academic Press // https://books.google.ru/books?id=NwLSBgAAQBAJ
В общем, так или иначе, результаты не особо отличались от случайного угадывания, однако в защиту психиатров можно сказать две вещи. Во-первых, во время проведения интервью никто из проводивших его специалистов не подозревал о том, что его собеседником могла быть машина, а следовательно, не стремился задавать вопросы, которые могли бы помочь в выявлении электронного собеседника. Во-вторых, поведение людей с диагнозом «параноидная шизофрения» может быть весьма странным по обычным человеческим меркам, поэтому те или иные неестественные элементы в ответах собеседника легко могут быть объяснены наличием данной патологии. В-третьих, можно предположить, что те 60 психиатров, что не стали отвечать на рассылку, были в среднем более загруженными, чем те 40, что ответили. А так как загруженные специалисты обычно являются более востребованными, чем незагруженные, то можно предположить, что третья группа психиатров состояла из специалистов с уровнем востребованности ниже среднего (например, из более молодых и менее опытных), что тоже могло сказаться на результатах.
6.3.1.3 SHRDLU
Ещё одной знаменитой разработкой в области диалоговых систем стала программа SHRDLU, созданная на заре развития отрасли.
Буквы на клавиатурах типографских наборных машин традиционно располагались в порядке убывания частоты букв в целях ускорения работы, поэтому строчные буквы etaoin и shrdlu являлись первыми двумя столбцами на левой стороне клавиатуры. Иногда из-за особенностей типографского процесса эта последовательность символов попадала в печать, таким образом на свет появился Etaoin Shrdlu, дальний родственник нашего соотечественника Йцукенга Фывапролджевича Ячсмитьбю.
Имя Shrdlu
SHRDLU — своеобразный виртуальный ассистент, являющийся хранителем небольшого искусственного мира, состоящего из виртуальной коробки и разноцветных блоков разной формы и размера. Пользователь ведёт общение с SHRDLU, используя предложения на английском языке и задавая различные вопросы об объектах виртуального мира, их параметрах, взаимном расположении и так далее. Также пользователь может попросить SHRDLU переместить те или иные блоки, для чего SHRDLU оснащён виртуальным манипулятором.
SHRDLU был написан на языке программирования Micro-Planner — подмножестве языка PLANNER Карла Хьюита, инкорпорированном в Lisp усилиями Сассмана, Винограда и Юджина Чарняка [2024] . В качестве аппаратной платформы использовался компьютер DEC PDP-6, оснащённый графическим терминалом. Позднее в лаборатории компьютерной графики Университета Юты было разработано дополнение к программе, обеспечивающее трёхмерный рендеринг «мира» SHRDLU.
Вот пример диалога человека со SHRDLU:
2024
Sussman G. J., Winograd T., Charniak E. (1971). Micro-Planner reference manual. Artificial Intelligence Memo No. 203A (Updates 203) // ftp://publications.ai.mit.edu/ai-publications/pdf/AIM-203a.pdf
Человек: Возьми большой красный блок.
SHRDLU: ОК.
Человек: Хватай пирамиду.
SHRDLU: Я не понимаю, какую именно пирамиду вы имеете в виду.
Человек (передумав): Найди блок, который выше, чем тот, который ты держишь, и помести это в коробку.
SHRDLU: Я предполагаю, что под словом «это» вы подразумевали блок, который выше, чем тот, который я держу.
SHRDLU: ОК.
Человек: Что лежит в коробке?
SHRDLU: Голубая пирамида и синий блок.
Человек: Что находится под пирамидой?
SHRDLU: Коробка.
Человек: Сколько блоков не в коробке?
SHRDLU: Четыре.
Человек: По крайней мере один из них уже, чем тот, который я сказал тебе взять?
SHRDLU: Да, красный куб.
Человек: Под ним что-то находится?
SHRDLU: Да, стол.
Даже сейчас такого рода демонстрация выглядит весьма впечатляющей.
В начале 2000-х гг. группа энтузиастов взялась за «воскрешение» SHRDLU [2025] . С одной стороны, система реализована на Lisp (а именно на MACLISP — реализации языка Lisp для операционной системы ITS), языке, который пока что не относится к числу мёртвых языков программирования. Однако всё затрудняло использование Micro-Planner, поскольку его оригинальная версия содержала ряд указателей на состояния ITS (в виде разбросанных по коду числовых констант). Некоторое представление об операционной системе ITS даёт её название, которое расшифровывается как Incompatible Timesharing System [Несовместимая система разделения времени]. ITS была создана в основном усилиями лаборатории Минского в MIT при некоторой помощи специалистов из Проекта MAC. Название являлось пародией на название системы CTSS (Compatible Time-Sharing System, Совместимая система разделения времени), также разработанной в MIT. По прошествии лет проблема несовместимости дала о себе знать, поскольку разбросанные по коду программы указатели утратили свою актуальность по мере изменений, вносимых в код операционной системы. В итоге, по воспоминаниям Вогана Пратта, уже к 1974 г. SHRDLU «стала жертвой серьёзного гниения [rot] программного обеспечения». Проект был основой диссертации Винограда и после успешной защиты оказался на многие годы заброшен. Впрочем, в итоге нелёгкий труд могущественных компьютерных некромантов увенчался успехом, и сегодня пообщаться со SHRDLU (как в виде простого чата, так и с графическим сопровождением) может любой желающий. В общем, как принято шутить у нас в 2021 г.:
2025
SHRDLU resurrection (2019) // http://maf.directory/misc/shrdlu.html