Чтение онлайн

на главную - закладки

Жанры

Язык как инстинкт
Шрифт:

Давайте назовем это «генератор цепочек слов» (технический термин — «модель языка с конечным числом состояний», или «модель Маркова»). Генератор цепочек слов — это комплект из списков слов или заготовок для предложений и набор указаний для следования от списка к списку. Генератор строит предложение, выбирая слово из одного списка, затем — из другого и так далее. (Чтобы узнать сказанное кем-то предложение, нужно просто просмотреть одно за другим слова в каждом списке.) Системы для составления цепочек слов часто используются в сатирах типа упомянутого романа Фрейна, как рецепты типа «сделай сам» для сочинения подобных образцов словоблудия. Например, вот Генератор Общественнонаучного жаргона, которым читатель может воспользоваться следующим образом: выбрать наугад слово из первой колонки, затем — слово из второй, затем — из третьей и выстроить их друг за другом для создания весомо звучащего термина, например: inductive aggregating interdependence ‘индуктивная дополняющая взаимозависимость’.

диалектический — совместный — взаимозависимость

обессмысленный — дегенеративный — рассеивание

позитивистский — совокупный — периодичность

предикативный — носящий

характер присвоения — синтез

многосторонний — симулированный — достаточность

количественный — однородный — равноценность

дивергентный — преобразующий — ожидаемость

синхронный — варьирующий — пластичность

дифференцированный — объединенный — эпигенез

индуктивный — прогрессивный — конструктивизм

объединенный — дополнительный — деформация

дистрибутивный — выделительный — отверделость

Недавно я видел генератор цепочек слов, который составляет захватывающие аннотации на книжных обложках, и другой такой прибор, составляющий тексты песен Боба Дилана.

Генератор цепочек слов — это простейший образчик дискретной комбинаторной системы, поскольку он способен создать неограниченное количество различных комбинаций из ограниченного количества элементов. Невзирая на пародии, генератор цепочек слов способен составить неограниченное количество наборов грамматически правильных английских предложений. Например, донельзя простая схема

позволяет составить много предложений, таких как: A girl eats ice-cream ‘Какая-то девочка ест мороженое’ или The happy dog eats candy ‘Эта радостная собака ест конфеты’. Эта схема позволяет составить неограниченное количество предложений благодаря петле наверху, которая может направить генератор от списка, представленного словом happy ‘радостный’, снова к этому же списку любое количество раз: The happy dog eats ice-cream ‘Эта радостная собака ест мороженое’, The happy happy dog eats ice-cream ‘Эта радостная радостная собака ест мороженое’, и т.д.

Когда инженеру требуется придумать систему для сочетания слов в определенном порядке, генератор цепочек слов — это первое решение, которое приходит в голову. Запись голоса, сообщающего вам телефонный номер, когда вы звоните в справочную — хороший тому пример. Там имеется запись произнесенных человеком десяти цифр, каждая из которых записана в семи различных интонационных моделях (одна соответствует первой цифре номера, одна — второй и т.д.). Имея всего семьдесят этих записей можно составить десять миллионов телефонных номеров; имея еще тридцать записей для трехзначных кодов областей, возможно составление десяти миллиардов номеров (на практике многие из них никогда не используются из-за налагаемых ограничений, например — на присутствие 0 или 1 в начале телефонного номера). В действительности, были сделаны серьезные попытки представить английский язык как одну большую цепочку слов. Чтобы сделать это по возможности реалистичным, переходы от одного списка слов к другому должны отражать действительную вероятность того, что такие типы слов могут следовать друг за другом в английском языке (например, существует большая вероятность того, что за словом that ‘это’ последует is ‘есть’, а не indicates ‘указывает’). Были составлены колоссальные базы данных этих «вероятностей последующего слова»; это делалось путем компьютерного анализа корпуса текстов на английском языке или опроса добровольцев, которым предлагалось назвать первые слова, пришедшие в голову после того, как они услышат данное слово или ряды слов. Некоторые психологи предполагали, что человеческий язык основан на громадной цепи слов, хранящейся в мозгу. Эта идея созвучна теориям реакции на раздражение: некое раздражение вызывает в качестве реакции произносимое слово, затем говорящий получает вызванную им самим реакцию, которая служит как дальнейший раздражитель, вызывая одно из нескольких слов в качестве очередной реакции и т.д.

Но вызывает подозрения тот факт, что генератор цепочки слов кажется прямо-таки созданным для пародирования, как, например, в романе Фрейна. Суть этих разнообразных пародий в том, что литературный жанр, являющийся объектом иронии, настолько бессмыслен и заезжен, что простой механический метод позволяет наплодить неограниченное количество образчиков этого жанра, которые почти без натяжки могут сойти за истинное произведение. Юмор заключается в следующем несоответствии: по всеобщему признанию, люди (даже социологи и журналисты) не могут на самом деле быть генераторами цепочек слов; они только кажутся таковыми.

Современные грамматические исследования начались тогда, когда Хомский продемонстрировал, что генераторы цепочек слов не просто слегка подозрительны; принцип их работы в корне отличен от принципа работы человеческого языка. Они являются дискретными комбинаторными системами, но не того типа. Возникают три проблемы, каждая из которых освещает один из реальных аспектов работы языка.

Во-первых, предложение на английском языке полностью отличается от

цепочки слов, соединенных вместе в соответствии с вероятностью последующего слова, характерной для английского языка. Вспомните предложение Хомского: Бесцветные зеленые мысли спят яростно. Он сочинил его, чтобы показать, что грамматически правильной может быть не только бессмыслица, но и невероятная последовательность слов. Вероятность того, что в английском тексте за словом бесцветные последует слово зеленые, естественно, равна нулю. Нулевой является и вероятность того, что за словом зеленые последует слово мысли, за словом мысли — спать, а за спать — яростно. Тем не менее, данная цепочка слов — это правильно построенное английское предложение. В противоположность этому, если действительно составлять цепочки слов, пользуясь таблицами вероятности последующего слова, получающиеся в итоге цепочки слов далеки от того, чтобы называться правильно построенными предложениями. Например, вы подбираете ряд слов, которые с наибольшей вероятностью могут последовать за каждой последовательностью из четырех слов, и используете эти подборки, чтобы слово за словом нарастить цепочку слов. При этом вы всегда смотрите на последние четыре слова, чтобы они определили следующее. Цепочка получится извращенно «английсковатой», но не английской, например: House to ask for is to earn our living by working towards a goal for his team in old New-York was a wonderful place wasn’t it even pleasant to talk about and laugh hard when he tells lies he should not tell me the reason why you are is evident ‘Дом для сдачи внаем должен зарабатывать нам на жизнь, работая над задачей, требующей коллективного решения в старом Нью-Йорке, был чудесным местом, не так ли, даже приятным для обсуждения и громкого смеха, когда он лжет, он не должен говорить мне причину, почему ты являешься очевидным’.

Несоответствие между английскими предложениями и цепочками слов на английском заставляет прийти к двум выводам. Когда люди усваивают язык, они усваивают его, запоминая не то, какое слово должно следовать за каким. Они усваивают его, запоминая, какая часть речи — существительное, глагол и т.д. следует за какой. Таким образом, мы можем признать бесцветные зеленые мысли, поскольку там точно такой же порядок существительных и прилагательных, который мы усвоили на примере более привычных предложений, например, strapless black dresses ‘декольтированные черные платья’. Второй вывод будет о том, что существительные, глаголы и прилагательные не просто механически соединены в одну длинную цепочку; для предложений существует некая всеобъемлющая схема, или план, согласно которому каждое слово занимает определенное гнездо.

Если генератор цепочек слов достаточно умно сконструирован, он может справиться с этими проблемами. Но Хомский изначально отвергал саму идею о том, что человеческий язык является цепочкой слов. Он доказал, что некоторые типы английских предложений даже в принципе не могут быть составлены генератором цепочек слов, каким бы большим он ни был, и как точно бы он ни соответствовал таблицам вероятности. Рассмотрим следующие предложения:

Either the girl eats ice-cream, or the girl eats candy ‘Или эта девочка ест мороженое, или эта девочка ест конфеты’.

If the girl eats ice-cream, then the boy eats hot dogs ‘Если эта девочка ест мороженое, то этот мальчик ест сосиски’.

На первый взгляд кажется, что уместить эти предложения в схему просто:

Но этот генератор не работает. За either ‘или’ дальше в предложении должно последовать or ‘или’; никто не говорит: Either the girl eats ice-cream, then the girl likes candy ‘Или эта девочка ест мороженое, то эта девочка любит конфеты’. Аналогично, if ‘если’ требует then ‘то’; никто не говорит: If the girl eats ice-cream, or the girl likes candy ‘Если эта девочка ест мороженое, или эта девочка любит конфеты’. Но чтобы удовлетворить потребность слова, стоящего в начале предложения, в каком-то другом слове, стоящем в конце предложения, генератор должен помнить слово, стоящее в начале, все то время, что он продуцирует все слова, расположенные между началом и концом. В этом-то и состоит проблема: генератор цепочек слов подвержен амнезии, запоминая только то, из какого списка он выбрал самое последнее слово, и не помня ничего, что этому предшествовало. К тому моменту, как он достигает списка or ‘или’ / then ‘то’, он не может вспомнить, что было сказано в начале: either ‘или’ либо if ‘если’. Имея счастливую возможность оглядеть весь пройденный путь с высоты, мы можем вспомнить, какой выбор сделал генератор на первой развилке, но сам генератор, перебегая, как муравей, от списка к списку, запоминать не способен.

Поделиться:
Популярные книги

Неудержимый. Книга VIII

Боярский Андрей
8. Неудержимый
Фантастика:
фэнтези
попаданцы
аниме
6.00
рейтинг книги
Неудержимый. Книга VIII

Законы Рода. Том 6

Flow Ascold
6. Граф Берестьев
Фантастика:
юмористическое фэнтези
аниме
5.00
рейтинг книги
Законы Рода. Том 6

Восход. Солнцев. Книга I

Скабер Артемий
1. Голос Бога
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Восход. Солнцев. Книга I

Попаданка

Ахминеева Нина
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Попаданка

Возлюби болезнь свою

Синельников Валерий Владимирович
Научно-образовательная:
психология
7.71
рейтинг книги
Возлюби болезнь свою

Кодекс Крови. Книга III

Борзых М.
3. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга III

Ротмистр Гордеев 2

Дашко Дмитрий
2. Ротмистр Гордеев
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Ротмистр Гордеев 2

Идеальный мир для Лекаря 5

Сапфир Олег
5. Лекарь
Фантастика:
фэнтези
юмористическая фантастика
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 5

Адвокат Империи 3

Карелин Сергей Витальевич
3. Адвокат империи
Фантастика:
городское фэнтези
попаданцы
аниме
фэнтези
фантастика: прочее
5.00
рейтинг книги
Адвокат Империи 3

Жребий некроманта 3

Решетов Евгений Валерьевич
3. Жребий некроманта
Фантастика:
боевая фантастика
5.56
рейтинг книги
Жребий некроманта 3

Город драконов

Звездная Елена
1. Город драконов
Фантастика:
фэнтези
6.80
рейтинг книги
Город драконов

Убивать, чтобы жить

Бор Жорж
1. УЧЖ
Фантастика:
героическая фантастика
боевая фантастика
рпг
5.00
рейтинг книги
Убивать, чтобы жить

Инквизитор Тьмы 2

Шмаков Алексей Семенович
2. Инквизитор Тьмы
Фантастика:
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Инквизитор Тьмы 2

Беглец

Бубела Олег Николаевич
1. Совсем не герой
Фантастика:
фэнтези
попаданцы
8.94
рейтинг книги
Беглец