Чтение онлайн

на главную - закладки

Жанры

Компьютерная лингвистика для всех - Мифы, Алгоритмы, Язык
Шрифт:

МОДЕЛЬ МИРА

Компьютеры вошли в жизнь человека - он все больше и больше полагается на них. Компьютеры печатают документы, управляют сложными технологическими процессами, проектируют технические объекты,

=====================================================

(103) См.: Анисимов А. В. Рекурсивные преобразователи информации //Дискретная математика - 1989.- Э 3.- С. 3 - 18.

=====================================================

развлекают детей и взрослых. Естественно стремение человека как можно полнее выразить себя в алгоритмических устройствах, преодолеть языковый барьер, разделявший два разных мира. Как уже неоднократно отмечалось, язык, человек и реальность неразрывно связаны между собой. Поэтому обучение компьютера естественному языку - задача чрезвычайно сложная, связанная с глубоким проникновением в законы мышления и языка. Научить компьютер понимать естественный язык - это то же, что научить его чувствовать мир. Многие ученые считают решение этой задачи принципиально невозможным. Но так или иначе процесс сближения человека и его электронного детища начался, и кто знает, чем он закончится. Во всяком случае, человек, пытаясь моделировать

задачу языкового общения, начинает понимать себя гораздо полнее. Существуют отдельные программы, имитирующие генерацию осмысленного текста. Например, программа Mark Chainy, созданная американскими программистами Б. Эллисом и Д. Митчелом, анализирует заданный текст и для каждой пары соседних слов вычисляет вероятность появления третьего слова, если эта пара уже появилась. Затем, используя зти вероятности и датчик псевдослучайных чисел для "случайного" выбора символов, генерируют сам текст. Название программы отражает связь с цепями Маркова. Такие игры с вероятностью порождают интересные тексты, напоминающие речь шизофреника, и иногда сбивают с толку компьютерных собеседников. Прочитав учебник по математике, программа может сказать: "Зачем они начали отсчитывать четвертями. Огромная бутыль, вмещающая четыре четверти - это уже трехзначное число..." Эллис подключил свою программу к многопользовательской сети ЭВМ. Программа обрабатывала имеющиеся в сети сообщения и выдавала сумбурные тексты. Некоторые пользователи требовали убрать программу с ее чудовищным бредом, другие чувствовали в ней родственную душу, и им нравилась подобная болтовня. Такие попытки нельзя использовать для серьезных научных разработок - нет и намека на понимание языка. Правильный подход должен начинаться с моделирования мира. Любое языковое сообщение проявляет двойственную сущность. С одной стороны, это отражение фрагмента реальности с одновременными изменениями и взаимодействиями многих величин. С другой текст разворачивается в виде последовательной линейной цепочки символов, задающей запись текста и его восприятие.

"Если бы ум был способен выражать идеи так, "как он их воспринимает", то, без всякого сомнения, он "выражал бы их все сразу". Но это совершенно невозможно, так как если "мысль - простое действие", то "ее высказывание последовательное действие". этом состоит специфика языка, отличающая его и от представления (представлением которого он, однако, в свою очередь является), и от знаков (к которым он принадлежит на равных правах). Язык не противостоит мышлению как внешнее - внутреннему, или как экспрессия рефлексии. Он не противостоит другим знакам - жестам, пантомимам, переводам, изображениям, эмблемам, как произвольное или коллективное - естественному или единичному. Но он противостоит им всем как последовательное одновременному. По отношению к мышлению и знакам он то же самое, что и алгебра по отношению к геометрии: одновременное сравнение частей (или величин) он заменяет таким порядком, степени которого должны быть пройдены последовательно, одна за другой. Именно в этом строгом смысле язык оказывается анализом мысли: не простым расчленением, но основополагающим утверждением порядка в пространстве" (104).

Таким образом, в представлении разума текст возникает как динамический параллельный процесс, определяющий активности и взаимодействия одновременных алгоритмических структур, и выражается интерпретацией такого представления в виде линейной последовательности символов. Для того чтобы уметь автоматически генерировать тексты, необходимо прежде всего описать взаимодействующую модель мира, затем научиться строить последовательную интерпретацию модели на уровнях отдельных фрагментов и предложений (рис. 14). Язык появился как особое отражение параллельной реальности. Компьютеры исторически возникали в обратном порядке. Сначала осваивались последовательные ЭВМ, затем начался активный переход к параллельным вычислительным комплексам. Поэтому программисты сначала обжились в мире последовательных языков программирования, а сейчас перешли к параллельным языкам. В любом литературном произведении выделяются герои, объединяемые между собой сильными ассоциативными связями. Например, в романе Л. Н. Толстого "Анна Каренина" Анна связана с Вронским, Кити с

=====================================================

(104) Фуко М. Слова и вещи.
– С. 136-137.

=====================================================

* Рис. 14. Модель языка

Левиным, в "Мастере и Маргарите" М. А. Булгакова Мастер связан с Маргаритой, Иешуа с Пилатом, Воланд со своей темной веселой компанией. Такое неразрывное объединение объектов в одну действующую стрктурную единицу в программировании называется процедурой или процессом. В случае параллельного программирования, когда разрешаются одновременные действия разных объектов, обычно говорят о процессах. Так как литературное произведение описывает фрагмент реальности с возможными одновременными событиями, то, следуя устоявшейся в программировании традиции, мы тоже будем рассматривать в литературных текстах процессы. Итак, Анна Каренина и Вронский, Кити и Левин, Мастер и Маргарита, Иешуа и Пилат, Воланд и компания представляют собой отдельные замкнутые главные процессы. Процессы взаимодействуют между собой, изменяя значения собственных параметров. В свою очередь, каждая единица такого процесса также может содержать подчиненные взаимодействующие процессы. Так, у Маргариты есть домработница Наташа, тоже участвующая в событиях, у Пилата - воины, начальник тайной службы, Иешуа имеет ученика Левия Матвея и оказался в одной компании с двумя разбойниками. Все они могут в определенной степени существовать и действовать самостоятельно. Неделимый элементарный процесс - это структурная единица текста с элементами собственного независмого развития, но уже без таковых подчиненных объектов. Нос майора Ковалева из повести Н. В. Гоголя образует главный процесс, нос Буратино - просто константа, входящая в процесс Буратино. Состояния героев внутри процессов

описываются глобальными и локальными переменными. Значения глобальных переменных известных другим процессам, могут изменяться в моменты взаимодействия процессов, значения локальных изменяются только внутри процесса, которому они принадлежат. В настоящее время программисты заняты активными поисками выразительных, удобных языковых средств для описания параллельных взаимодействующих процессов. Такие языки уже существуют и реализованы на параллельных ЭВМ. В США по заказу министерства обороны разработан язык АДА, по-видимому, сдающий свои позиции, в Европе доминирует язык ОККАМ, созданный английской фирмой INMOS для транспьютерных систем. ОККАМУ, кажется, сопутствует звезда удачи. Автор этой книги участвует в разработке ПАРУС-технологии программирования (ПАРУС расшифровывается как Параллельные Асинхронные Рекурсивные Управляемые Системы). ПАРУС-системы программирования дают возможность расширять любые языки развитыми средствами параллельного взаимодействия и рекурсивного подчинения объектов друг другу. ПАРУС удачно описывает процессы лингвистической обработки информации. ОККАМ вписывается в ПАРУС как частный, но реализованный практически на транспьютерах случай. Анализ литературных текстов с позиций алгоритмических процессов позволяет выявить закономерности и приемы, применяемые разными авторами при построении литературных форм. С другой стороны - и это то, к чему мы стремимся, создавая параллельные программы, генерирующие текст, и пропуская их через последовательную моделирующую программу, - можно надеяться на создание автоматических генераторов текстов.

ДИАЛОГИ

Взаимодействия литературных текстовых процессов обычно описываются диалогом. Происходит информационный обмен, иногда передаются объекты из разных процессов.

" - Я, игемон, никого не призывал к подобным действиям, повторяю. Разве я похож на слабоумного?
– О да, ты не похож на слабоумного,- тихо ответил прокуратор и улыбнулся какой-то страшной улыбкой, - так поклянись, что этого не было.
– Чем хочешь ты, чтобы я поклялся?
– спросил, очень оживившись, развязанный.
– Ну, хотя бы жизнью твоею,- ответил прокуратор,- ею клясться самое время, так как она висит на волоске, знай это!
– Не думаешь ли ты, что ты ее подвесил, игемон?
– спросил арестант.- Если это так, ты очень ошибаешься. Пилат вздрогнул и ответил сквозь зубы: - Я могу перерезать этот волосок.
– И в этом ты ошибаешься,- светло улыбаясь и заслоняясь рукой от солнца, возразил арестант,- согласись, что перерезать волосок уж наверно может лишь тот, кто подвесил?" (105). Передаются объекты-слова из одного процесса в другой и возбуждают ассоциативные связи в семантической сети каждого процесса. Даже явно повторяются ключевые слова при каждом обмене. Как бы выполняется подтверждение принятия ключевой информации. Иногда при диалогическом обмене управляющий процесс может получать информацию о состояниях другого процесса, изменять ее и возвращать с новыми значениями.

"И тут прокуратор подумал: "О, боги мои! Я спрашиваю его о чем-то ненужном на суде... Мой ум не служит мне больше..." И опять померещилась ему чаша с темной жидкостью. "Яду мне, яду!" И вновь он услышал голос: - Истина прежде всего в том, что у тебя болит голова, и болит так сильно, что ты малодушно помышляешь о смерти. Ты не только не в силах говорить со мной, но тебе трудно даже глядеть на меня. И сейчас я невольно являюсь твоим палачом, что меня огорчает. Ты не можешь даже и думать о чем-нибудь и мечтаешь только о том, чтобы пришла твоя собака, единствен

=====================================================

(105) Булгаков М. А. Мастер и Маргарита,- М,: Современник, 1986.- С. 22.

=====================================================

ное, по-видимому, существо, к которому ты привязан. Но мучения твои сейчас кончатся, голова пройдет" (106).

Иешуа в процессе диалогического взаимодействия получил имя глобальной переменной из процесса Пилат, характеризующей физическое состояние прокуратора - головная боль. Иешуа изменил значение этой переменнои и передал его обратно в процесс Пилат. На языке взаимодействующих параллельных процессов это записывается так:

Процесс Иешуа ПРИНЯТЬ х из процесса Пилат; ГЕНЕРИРОВАТЬ текст приемки;

ИЗМЕНИТЬ х; ГЕНЕРИРОВАТЬ текст передачи; ПЕРЕДАТЬ х в процессе Пилат;

Процесс Пилат ГЕНЕРИРОВАТЬ текст передачи; ПЕРЕДАТЬ у в процесс Иешуа; ПРИНЯТЬ у из процесса Иешуа; ГЕНЕРИРОВАТЬ текст приемки;

Команды ПРИНЯТЬ и ПЕРЕДАТЬ - это парные команды, которые срабатывают одовременно, когда оба процесса приходят к выполнению этих команд; переменная х - принимающая переменная процесса Иешуа; у - переменная, характеризующая состояние прокуратора. Иешуа - управляющий процесс, так как он вносит изменения в процесс Пилат.

Как видим, для задания движения текста в диалоге достаточно после каждого получения информации возбуждать соответствующую семантическую сеть, извлекать из нее необходимые образы, оформлять их в виде предложений и передавать их обратно.

Интересны диалоги с программой, пишущей стихи Летящие слова. Возможен такой диалог.

– Тебе нравятся рыжие георгины?
– Рыжие георгины, Очень. Ад. Грех. Героин, Героиня. Убийство. Крик. Смех.
– Хватит, Ты мыслишь интересно, но ушла от ответа.
– А что ты знаешь про любовь?
– Любовь. Тревожные колокола. Дыханье, Смещенье. Кровь. Убийство Поэт. Талант. Любовь. Ошеломление. Боль. Мятежная кровь. Вода. Слезы. Смех. Лица. Пустота, Ложь. Любовь...
– Хватит, хватит. Не продолжай.
– Продолжение. Борьба. Итог - самосожжение.
– Молодец. Извини, но я спешу.

=====================================================

(105) Там же-С. 20

=====================================================

И так далее (но если это кому-то нужно напишите мне yankosdol.ru)

В ЭТИХ ГРУСТНЫХ КРАЯХ...

ПСИХОЛИНГВИСТИКА рекурсии

Рекурсия вызывает определенный психолингвистичеческий эффект. Ее восприятие человеком всегда сопрождается чувством тревоги и даже, в отдельных случаях, страха и ужаса. Чем больше глубина рекурсивной вложенности, тем сильнее тревога.

Поделиться:
Популярные книги

Черный маг императора 3

Герда Александр
3. Черный маг императора
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Черный маг императора 3

Повелитель механического легиона. Том VIII

Лисицин Евгений
8. Повелитель механического легиона
Фантастика:
технофэнтези
аниме
фэнтези
5.00
рейтинг книги
Повелитель механического легиона. Том VIII

Пипец Котенку! 3

Майерс Александр
3. РОС: Пипец Котенку!
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Пипец Котенку! 3

Разбуди меня

Рам Янка
7. Серьёзные мальчики в форме
Любовные романы:
современные любовные романы
остросюжетные любовные романы
5.00
рейтинг книги
Разбуди меня

Боги, пиво и дурак. Том 6

Горина Юлия Николаевна
6. Боги, пиво и дурак
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
Боги, пиво и дурак. Том 6

Болотник 2

Панченко Андрей Алексеевич
2. Болотник
Фантастика:
попаданцы
альтернативная история
6.25
рейтинг книги
Болотник 2

Ты всё ещё моя

Тодорова Елена
4. Под запретом
Любовные романы:
современные любовные романы
7.00
рейтинг книги
Ты всё ещё моя

S-T-I-K-S. Пройти через туман

Елисеев Алексей Станиславович
Вселенная S-T-I-K-S
Фантастика:
боевая фантастика
7.00
рейтинг книги
S-T-I-K-S. Пройти через туман

Имя нам Легион. Том 4

Дорничев Дмитрий
4. Меж двух миров
Фантастика:
боевая фантастика
рпг
аниме
5.00
рейтинг книги
Имя нам Легион. Том 4

Сводный гад

Рам Янка
2. Самбисты
Любовные романы:
современные любовные романы
эро литература
5.00
рейтинг книги
Сводный гад

Я князь. Книга XVIII

Дрейк Сириус
18. Дорогой барон!
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Я князь. Книга XVIII

Королевская Академия Магии. Неестественный Отбор

Самсонова Наталья
Любовные романы:
любовно-фантастические романы
8.22
рейтинг книги
Королевская Академия Магии. Неестественный Отбор

Последняя Арена 6

Греков Сергей
6. Последняя Арена
Фантастика:
рпг
постапокалипсис
5.00
рейтинг книги
Последняя Арена 6

Жребий некроманта. Надежда рода

Решетов Евгений Валерьевич
1. Жребий некроманта
Фантастика:
фэнтези
попаданцы
6.50
рейтинг книги
Жребий некроманта. Надежда рода