Язык как инстинкт
Шрифт:
Это достижение является менее впечатляющим, чем кажется. Правила связали арбитрам руки: «неестественные хитрости и уловки» — это иное название любой попытки установить, разговариваешь ты с человеком или с машиной, что и является смыслом конкурса! Кроме того, программист-победитель тонко использовал возможность выбирать тему беседы для своей программы. Он выбрал «эксцентричную беседу», которая является сомнительным примером «темы» и сама по себе может быть полна непоследовательностей:
Арбитр: Как долго тянется этот день! Но теперь, мне кажется, я готов немного поразвлечься. Погода сегодня не очень хорошая. Знаешь ли ты какие-нибудь шутки, которые могли бы разогнать облака?
Компьютер: Все говорят о погоде, но, похоже, никто ничего с ней не делает. Почему тебе обязательно нужно было мне сказать, что теперь ты готов немного поразвлечься? О-о-о-ох…
Арбитр:
Компьютер: Не лучше ли сказать, если бы это была неправда, что я пытаемся [97] запутать тебя, да? Я просто объяснил, что готов поразвлечься! Я, следовательно, я вычисляю… Почему ты думаешь, что я пытаюсь запутать тебя, не правда ли?
Арбитр: Не могу сказать, что понимаю вопрос… Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.
Компьютер: Откуда ты знаешь, что не можешь сказать, что понял вопрос… Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.
97
Грамматические и синтаксические ошибки в речи компьютера присутствуют и в оригинальном тексте. — Прим. перев.
По сути программист просто усовершенствовал технологию, изобретенную в 1965 г. ученым-компьютерщиком Джозефом Вейценбаумом. Вейценбаум написал туповатую программу, названную ELIZA в честь героини Бернарда Шоу; эта программа искала несколько ключевых слов во вводимой строке, извлекала фиксированный ответ из списка и вставляла фрагменты вводимой строки в ответ (с некоторыми небольшими изменениями, например «ты» вместо «я»). Таким образом в примитивной форме имитировалась беседа. Один вариант программы под названием Doctor копировал поведение психотерапевта — приверженца философии Карла Роджерса, считавшего, что терапевт должен повторять пациенту его же собственные утверждения для их осмысливания. Эта версия программы позже продавалась как компьютерная игра в магазинах «Рейдио Шэк» [98] , а другая версия поступает в комплекте с моим текстовым редактором GNU Emacs. (В документации сказано: «Если при использовании Emacs что-то не получается, и ни один из указанных выше приемов не решает проблему, Emacs все же может вам помочь. Наберите: „M-x doctor RET“».) Вот типичный диалог:
98
Сеть магазинов, специализирующихся на продаже бытовых товаров радиоэлектроники и компьютеров. — Прим. ред.
Пользователь: В последнее время я чувствую себя порядком подавленным.
Компьютер: Вы часто чувствуете себя подавленным?
Пользователь: Да, почти все время.
Компьютер: Почему вы говорите «да, почти все время»?
Пользователь: Вот сейчас я чувствую, что готов заплакать.
Компьютер: Вы пришли ко мне потому, что сейчас чувствуете, что готовы заплакать?
К ужасу Вейценбаума, однажды он увидел, как его секретарша припала к терминалу и изливает душу программе.
У большинства ученых-компьютерщиков конкурс на премию Лобнера вызывает раздражение. Они считают его не имеющим научной ценности рекламным трюком, задача которого — обвести вокруг пальца непрофессионала, а не научить компьютер речи. (Разработчикам искусственного интеллекта и другим профессионалам, разбирающимся в проблемах языка, не разрешили быть арбитрами, но ни один из них и не рвался участвовать в конкурсе, заявки поступали от любителей.) Этот конкурс примерно так же продуктивен, как будет продуктивна реклама биологических исследований, если на премию выдвинуть создателя искусственного цветка из шелка, самого похожего на естественный; или как будет продуктивна работа над космической программой, где высадка на Луну осуществится на съемочной площадке Голливуда. Была проведена интенсивная работа по созданию компьютерных систем, понимающих язык, но ни у одного серьезного инженера не хватит дерзости утверждать, что система, дублирующая языковые способности человека, появится в недалеком будущем.
В действительности, с точки зрения ученого, люди не имеют права так хорошо понимать предложения, как они это делают. Они не просто решают до абсурда сложную задачу, но еще и делают это быстро.
Понимание процесса понимания имеет и иное практическое применение, помимо создания машин-собеседников. Понимание предложений людьми происходит быстро и эффективно, но не идеально. Оно работает, когда воспринимаемый поток речи или текст определенным образом структурирован. В противном случае процесс может забуксовать, пойти в обратном направлении, и возникнет неправильное понимание. Исследуя понимание языка в этой главе, мы выясним, какие виды предложений могут путаться в сознании человека, воспринимающего речь. Один из практических источников информации — это набор рекомендаций для написания ясной прозы, научное руководство по стилистике, например то, что написано Джозефом Уильямсом в 1990 г., — «Стиль: как добиться ясности и изящества», в нем содержатся многие лингвистические находки, которые мы будем рассматривать.
Другое практическое применение связано с областью права. Судьи часто сталкиваются с тем, что им приходится гадать, как среднестатистический человек воспримет двусмысленный отрывок текста, например, при изучении клиентом контракта, заслушивании инструкций присяжными и чтении представителем общественности потенциально клеветнической характеристики. Многие из человеческих привычек толкования текста были определены благодаря лабораторным исследованиям, а лингвист и юрист Лоренс Солэн объяснил связь между языком и правом в своей интересной книге 1993 г. «Язык судей», к которой мы еще обратимся.
Как происходит понимание предложения? Первый этап — это синтаксический разбор. Он не имеет отношения к тем упражнениям, которые вы, стиснув зубы, делали в начальной школе, и о которых у Дейва Барри, ведущего газетной рубрики «Спроси у Господина Языка», осталось такое воспоминание:
Вопрос: Пожалуйста, объясните, как составить схему предложения.
Ответ: Прежде всего расположите предложение на чистой ровной поверхности, например, на гладильной доске. Затем, используя остро отточенный карандаш или скальпель, вычлените «сказуемое», которое показывает, где произошло действие, и обычно расположено прямо за жабрами. Например, в предложении «ЛаМонт никогда не привести в порядок лесникам» действие, очевидно, происходит в лесу. Таким образом, ваша схема будет напоминать по форме деревце, с ветвями, выпирающими из него, чтобы указать на расположение различных частиц речи, таких как ваши герундии, провербы, второстепенности и т.д.
Но понимание действительно включает сходный с этим процесс нахождения подлежащего, сказуемого, дополнения и т.д., который происходит бессознательно. Если только вы не Вуди Аллен, в ускоренном темпе читающий «Войну и Мир», вам нужно сгруппировать слова в синтаксические группы, определить, что является группой подлежащего при каком сказуемом, и так далее. Например, чтобы понять предложение The cat in the hat came back ‘Кошка в шляпе вернулась’ нужно объединить в одну группу слова the cat in the hat ‘кошка в шляпе’, чтобы понять, что это кошка вернулась, а не шляпа. Чтобы отличить предложение Dog bites man ‘Собака кусает человека’ от Man bites dog ‘Человек кусает собаку’ нужно найти подлежащее и объект. А чтобы различить предложения Man bites dog ‘Человек кусает собаку’, Man is bitten by dog ‘Человек искусан собакой’ и Man suffers dog bite ‘Человек перенес укус собаки’, нужно обратиться к словарным статьям упомянутых глаголов в ментальном словаре, чтобы определить, что происходит с подлежащим человек.
Сама грамматика является просто кодом или протоколом, статичной базой данных, определяющей, какие виды звуков соответствуют каким видам значения в определенном языке. Это не рецепт и не программа для говорения и понимания. Говорение и понимание основаны на одной и той же базе данных (язык, на котором мы говорим, это тот же язык, который мы понимаем), но им также необходимы процедуры, которые бы четко, шаг за шагом, обозначили, что необходимо делать сознанию, когда становятся слышимыми слова, или когда сам собираешься начать говорить. Ментальная программа, анализирующая структуру предложения во время восприятия речи, называется «синтаксическим анализатором» («parser»).