Компьютерная лингвистика для всех - Мифы, Алгоритмы, Язык
Шрифт:
МОДЕЛЬ МИРА
Компьютеры вошли в жизнь человека - он все больше и больше полагается на них. Компьютеры печатают документы, управляют сложными технологическими процессами, проектируют технические объекты,
=====================================================
(103) См.: Анисимов А. В. Рекурсивные преобразователи информации //Дискретная математика - 1989.- Э 3.- С. 3 - 18.
=====================================================
развлекают детей и взрослых. Естественно стремение человека как можно полнее выразить себя в алгоритмических устройствах, преодолеть языковый барьер, разделявший два разных мира. Как уже неоднократно отмечалось, язык, человек и реальность неразрывно связаны между собой. Поэтому обучение компьютера естественному языку - задача чрезвычайно сложная, связанная с глубоким проникновением в законы мышления и языка. Научить компьютер понимать естественный язык - это то же, что научить его чувствовать мир. Многие ученые считают решение этой задачи принципиально невозможным. Но так или иначе процесс сближения человека и его электронного детища начался, и кто знает, чем он закончится. Во всяком случае, человек, пытаясь моделировать
"Если бы ум был способен выражать идеи так, "как он их воспринимает", то, без всякого сомнения, он "выражал бы их все сразу". Но это совершенно невозможно, так как если "мысль - простое действие", то "ее высказывание последовательное действие". этом состоит специфика языка, отличающая его и от представления (представлением которого он, однако, в свою очередь является), и от знаков (к которым он принадлежит на равных правах). Язык не противостоит мышлению как внешнее - внутреннему, или как экспрессия рефлексии. Он не противостоит другим знакам - жестам, пантомимам, переводам, изображениям, эмблемам, как произвольное или коллективное - естественному или единичному. Но он противостоит им всем как последовательное одновременному. По отношению к мышлению и знакам он то же самое, что и алгебра по отношению к геометрии: одновременное сравнение частей (или величин) он заменяет таким порядком, степени которого должны быть пройдены последовательно, одна за другой. Именно в этом строгом смысле язык оказывается анализом мысли: не простым расчленением, но основополагающим утверждением порядка в пространстве" (104).
Таким образом, в представлении разума текст возникает как динамический параллельный процесс, определяющий активности и взаимодействия одновременных алгоритмических структур, и выражается интерпретацией такого представления в виде линейной последовательности символов. Для того чтобы уметь автоматически генерировать тексты, необходимо прежде всего описать взаимодействующую модель мира, затем научиться строить последовательную интерпретацию модели на уровнях отдельных фрагментов и предложений (рис. 14). Язык появился как особое отражение параллельной реальности. Компьютеры исторически возникали в обратном порядке. Сначала осваивались последовательные ЭВМ, затем начался активный переход к параллельным вычислительным комплексам. Поэтому программисты сначала обжились в мире последовательных языков программирования, а сейчас перешли к параллельным языкам. В любом литературном произведении выделяются герои, объединяемые между собой сильными ассоциативными связями. Например, в романе Л. Н. Толстого "Анна Каренина" Анна связана с Вронским, Кити с
=====================================================
(104) Фуко М. Слова и вещи.
– С. 136-137.
=====================================================
* Рис. 14. Модель языка
Левиным, в "Мастере и Маргарите" М. А. Булгакова Мастер связан с Маргаритой, Иешуа с Пилатом, Воланд со своей темной веселой компанией. Такое неразрывное объединение объектов в одну действующую стрктурную единицу в программировании называется процедурой или процессом. В случае параллельного программирования, когда разрешаются одновременные действия разных объектов, обычно говорят о процессах. Так как литературное произведение описывает фрагмент реальности с возможными одновременными событиями, то, следуя устоявшейся в программировании традиции, мы тоже будем рассматривать в литературных текстах процессы. Итак, Анна Каренина и Вронский, Кити и Левин, Мастер и Маргарита, Иешуа и Пилат, Воланд и компания представляют собой отдельные замкнутые главные процессы. Процессы взаимодействуют между собой, изменяя значения собственных параметров. В свою очередь, каждая единица такого процесса также может содержать подчиненные взаимодействующие процессы. Так, у Маргариты есть домработница Наташа, тоже участвующая в событиях, у Пилата - воины, начальник тайной службы, Иешуа имеет ученика Левия Матвея и оказался в одной компании с двумя разбойниками. Все они могут в определенной степени существовать и действовать самостоятельно. Неделимый элементарный процесс - это структурная единица текста с элементами собственного независмого развития, но уже без таковых подчиненных объектов. Нос майора Ковалева из повести Н. В. Гоголя образует главный процесс, нос Буратино - просто константа, входящая в процесс Буратино. Состояния героев внутри процессов
ДИАЛОГИ
Взаимодействия литературных текстовых процессов обычно описываются диалогом. Происходит информационный обмен, иногда передаются объекты из разных процессов.
" - Я, игемон, никого не призывал к подобным действиям, повторяю. Разве я похож на слабоумного?
– О да, ты не похож на слабоумного,- тихо ответил прокуратор и улыбнулся какой-то страшной улыбкой, - так поклянись, что этого не было.
– Чем хочешь ты, чтобы я поклялся?
– спросил, очень оживившись, развязанный.
– Ну, хотя бы жизнью твоею,- ответил прокуратор,- ею клясться самое время, так как она висит на волоске, знай это!
– Не думаешь ли ты, что ты ее подвесил, игемон?
– спросил арестант.- Если это так, ты очень ошибаешься. Пилат вздрогнул и ответил сквозь зубы: - Я могу перерезать этот волосок.
– И в этом ты ошибаешься,- светло улыбаясь и заслоняясь рукой от солнца, возразил арестант,- согласись, что перерезать волосок уж наверно может лишь тот, кто подвесил?" (105). Передаются объекты-слова из одного процесса в другой и возбуждают ассоциативные связи в семантической сети каждого процесса. Даже явно повторяются ключевые слова при каждом обмене. Как бы выполняется подтверждение принятия ключевой информации. Иногда при диалогическом обмене управляющий процесс может получать информацию о состояниях другого процесса, изменять ее и возвращать с новыми значениями.
"И тут прокуратор подумал: "О, боги мои! Я спрашиваю его о чем-то ненужном на суде... Мой ум не служит мне больше..." И опять померещилась ему чаша с темной жидкостью. "Яду мне, яду!" И вновь он услышал голос: - Истина прежде всего в том, что у тебя болит голова, и болит так сильно, что ты малодушно помышляешь о смерти. Ты не только не в силах говорить со мной, но тебе трудно даже глядеть на меня. И сейчас я невольно являюсь твоим палачом, что меня огорчает. Ты не можешь даже и думать о чем-нибудь и мечтаешь только о том, чтобы пришла твоя собака, единствен
=====================================================
(105) Булгаков М. А. Мастер и Маргарита,- М,: Современник, 1986.- С. 22.
=====================================================
ное, по-видимому, существо, к которому ты привязан. Но мучения твои сейчас кончатся, голова пройдет" (106).
Иешуа в процессе диалогического взаимодействия получил имя глобальной переменной из процесса Пилат, характеризующей физическое состояние прокуратора - головная боль. Иешуа изменил значение этой переменнои и передал его обратно в процесс Пилат. На языке взаимодействующих параллельных процессов это записывается так:
Процесс Иешуа ПРИНЯТЬ х из процесса Пилат; ГЕНЕРИРОВАТЬ текст приемки;
ИЗМЕНИТЬ х; ГЕНЕРИРОВАТЬ текст передачи; ПЕРЕДАТЬ х в процессе Пилат;
Процесс Пилат ГЕНЕРИРОВАТЬ текст передачи; ПЕРЕДАТЬ у в процесс Иешуа; ПРИНЯТЬ у из процесса Иешуа; ГЕНЕРИРОВАТЬ текст приемки;
Команды ПРИНЯТЬ и ПЕРЕДАТЬ - это парные команды, которые срабатывают одовременно, когда оба процесса приходят к выполнению этих команд; переменная х - принимающая переменная процесса Иешуа; у - переменная, характеризующая состояние прокуратора. Иешуа - управляющий процесс, так как он вносит изменения в процесс Пилат.
Как видим, для задания движения текста в диалоге достаточно после каждого получения информации возбуждать соответствующую семантическую сеть, извлекать из нее необходимые образы, оформлять их в виде предложений и передавать их обратно.
Интересны диалоги с программой, пишущей стихи Летящие слова. Возможен такой диалог.
– Тебе нравятся рыжие георгины?
– Рыжие георгины, Очень. Ад. Грех. Героин, Героиня. Убийство. Крик. Смех.
– Хватит, Ты мыслишь интересно, но ушла от ответа.
– А что ты знаешь про любовь?
– Любовь. Тревожные колокола. Дыханье, Смещенье. Кровь. Убийство Поэт. Талант. Любовь. Ошеломление. Боль. Мятежная кровь. Вода. Слезы. Смех. Лица. Пустота, Ложь. Любовь...
– Хватит, хватит. Не продолжай.
– Продолжение. Борьба. Итог - самосожжение.
– Молодец. Извини, но я спешу.
=====================================================
(105) Там же-С. 20
=====================================================
И так далее (но если это кому-то нужно напишите мне yankosdol.ru)
В ЭТИХ ГРУСТНЫХ КРАЯХ...
ПСИХОЛИНГВИСТИКА рекурсии
Рекурсия вызывает определенный психолингвистичеческий эффект. Ее восприятие человеком всегда сопрождается чувством тревоги и даже, в отдельных случаях, страха и ужаса. Чем больше глубина рекурсивной вложенности, тем сильнее тревога.