Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:
Конечно, критика со стороны ALPAC была во многом справедливой. Системы машинного перевода, созданные на момент выхода отчёта, были весьма примитивными по сегодняшним меркам, а качество выполняемого ими перевода даже для текстов сравнительно узкой тематики оставляло желать лучшего. Тщательно подготовленные демонстрации, производившиеся на заре машинного перевода, создавали у зрителей обманчивое ощущение того, что задача машинного перевода если уже не решена, то будет решена в ближайшие годы. Однако эти иллюзии не выдержали столкновения с суровой действительностью, что могло вызвать обиду и разочарование, в том числе и у лиц, причастных к распределению государственных фондов.
6.3.2.5 Подходы к машинному переводу и его дальнейшее развитие
Подход, положенный в основу большинства систем машинного перевода, созданных до 1960-х гг., иногда называют прямым переводом. Системы разрабатывались обычно для конкретной пары языков. Синтаксис и семантика языка анализировались в таких системах лишь до той степени, в которой это было необходимо для разрешения неоднозначностей,
Типичным примером была система Джорджтаунского университета, которая в итоге оказалась одной из наиболее успешных систем, основанных на прямом переводе. Исследовательская группа из Джорджтауна использовала технику, которую Гарвин позже назвал методом грубой силы [brute force]: программа разрабатывалась на основе некоторого корпуса текстов, затем проверялась на другом корпусе, исправлялась и улучшалась, затем тестировалась на ещё большем корпусе, улучшалась вновь и так далее. Результатом стала монолитная программа с запутанной структурой, без чёткого разделения частей, отвечающих за анализ исходного и синтез результирующего текста. Синтаксический анализ был реализован лишь в зачаточной форме, отсутствовали понятия грамматических правил и синтаксических структур. Разумеется, в таких условиях трудно было рассуждать о теории языка или перевода [2047] . Информация о грамматике языка была включена в исходный код программы, что затрудняло возможности дальнейшего развития системы из-за приближения к пределу управления сложностью.
2047
Hutchins W. J. (1982). The evolution of machine translation systems / Lawson V. (1982). Practical experience of machine translation // http://www.mt-archive.info/Aslib-1981-Hutchins-1.pdf
Впрочем, даже в таких условиях находилось пространство для теоретических споров. В Советском Союзе эти споры приобрели традиционно наиболее ожесточённый характер, их отголоски даже вылились на страницы научно-фантастической литературы. В повести братьев Стругацких «Попытка к бегству», написанной в 1962 г., один из персонажей назван структурным (и даже «структуральнейшим») лингвистом, а рассуждения о языке, а также работа лингвиста XXII в. с инопланетным языком являются одной из заметных составляющих сюжета. В рассуждении персонажей Стругацких можно найти множество отсылок к дискуссиям 1950–1960-х гг. Спор о структурализме в СССР в 1950-е гг. во многом вращался вокруг основного на тот момент вопроса машинного перевода — о принципиальной возможности автоматизации лингвистики. Можно ли в принципе при помощи формальных структур описать закономерности, существующие в живых, развивающихся языках? [2048]
2048
Вельмезова Е. (2015). Снова об универсалиях «лингвистическо-литературных»: «Структуральнейшая лингвистика» в повести А. и Б. Стругацких «Попытка к бегству» / Фаустов А. (2015). Универсалии русской литературы. Т. 6. — Воронеж: Издательско-полиграфический центр «Научная книга» // http://www.rusf.ru/abs/rec/velmez01.htm
В 1960 г., за два года до выхода повести Стругацких, на филологическом факультете МГУ было создано Отделение теоретической и прикладной лингвистики (вскоре переименованное в Отделение структурной и прикладной лингвистики, ОСиПЛ; ныне — Отделение теоретической и прикладной лингвистики, ОТиПЛ), объединившее ведущих советских специалистов в области обработки естественного языка. Современным лингвистам хорошо знакомы имена многих из этих исследователей. В их числе были уже упоминавшийся нами Владимир Успенский, Александр Кибрик, Юрий Апресян и Андрей Зализняк. Эти учёные стали создателями новых теоретических концепций в области лингвистики и даже целых научных направлений.
Трудно дать однозначный ответ на вопрос о том, повлиял ли и в какой мере повлиял отчёт ALPAC на развитие машинного перевода в Советском Союзе. Работы в этом направлении продолжались, однако область машинного перевода, по всей видимости, уже не рассматривалась государством в качестве приоритетной. Энтузиасты продолжали работу над системами машинного перевода, и, хотя эта работа велась вне фокуса пристального внимания общества, она начала постепенно принимать более структурированный характер. Важной вехой стало появление теории «Смысл <=> Текст» (ТСТ), предложенной Мельчуком и развитой при деятельном участии других советских лингвистов, среди которых отдельно следует упомянуть Александра Жолковского, а также Юрия Апресяна. ТСТ представляет язык как многоуровневую модель преобразований смысла в текст и обратно. Создатели теории формулируют ключевой постулат ТСТ следующим образом: «Естественный язык есть система, устанавливающая соответствия между любым заданным смыслом и всеми выражающими его текстами; соответственно, лингвистическое описание некоторого языка должно представлять собой множество правил, ставящих в соответствие всякому смыслу все тексты данного языка, несущие этот смысл».
Также среди важных особенностей этой теории можно назвать использование синтаксиса
2049
Мельчук И. А. (1984). Русский язык в модели смысл-текст / Russian Language Journal, Vol. 38, Iss. 129/130, pp. 189—198 // https://codenlp.ru/knigi/russkiy-yazyik-v-modeli-smyisl-tekst-melchuk.html
Эта концепция обычно ассоциируется с именем американского лингвиста Ноама Хомского, в трудах которого она получила окончательное оформление. Однако, несмотря на большой авторитет Хомского в среде вычислительных лингвистов, неверно было бы полагать, что хомскианская лингвистика появилась на свет подобно Минерве из головы Юпитера.
Сам Хомский называл источником своих идей рационалистическую философию Рене Декарта и созданные под её влиянием так называемые картезианские грамматики, например знаменитую «Грамматику Пор-Рояля» — книгу, изданную в 1660 г. аббатами монастыря Пор-Рояль Антуаном Арно и Клодом Лансло. Мыслители XVII столетия занимались активными поисками универсальных свойств языка: под влиянием расширения межгосударственных связей и трудностей, связанных с процессом перевода, обрела популярность идея создания «всемирного языка», для чего, в свою очередь, нужно было выявить свойства, которыми обладают реальные языки. Хотя Хомский и использует термин «картезианские грамматики», картезианские идеи присутствуют ещё в работах ряда предшественников Декарта.
Именно в «Грамматике Пор-Рояля» Хомский находит в зачаточной форме один из наиболее фундаментальных принципов своей концепции, заключающейся в разграничении поверхностной и глубинной структур языка. Поверхностная структура соответствует только материальному аспекту (фонетике и грамматике), а глубинная — значению (семантике). Хомский пишет: «Глубинная структура соотносится с поверхностной структурой посредством некоторых мыслительных операций, в современной терминологии — посредством грамматических трансформаций».
Помимо картезианских грамматик, идейно концепция Хомского (как и некоторые другие течения в структурной лингвистике, например функционализм [2050] , [2051] , [2052] ) восходит к трудам отца-основателя структурной лингвистики Фердинанда де Соссюра [2053] .
Соссюр (кстати говоря, мы знакомы с его идеями только по отдельным статьям, единственной книге, законченной автором в возрасте 21 года и посвящённой первоначальной системе гласных в индоевропейских языках, а также текстам лекций, восстановленным позднее по конспектам студентов, — сам учёный считал, что представления его оформились недостаточно и нельзя даже помышлять об издании книги по интересующему его направлению [2054] ) рассматривал лингвистику как часть более общей дисциплины, которую он предложил назвать семиологией. По его замыслу, семиология должна была стать наукой, изучающей жизнь знаков в обществе, являясь, в свою очередь, разделом социальной и, следовательно, общей психологии. Соссюр утверждал, что законы, которые откроет семиология, будут применимы и к лингвистике.
2050
* Функционализм (функциональный структурализм, функциональная лингвистика) — совокупность школ и направлений, возникших как одно из ответвлений структурной лингвистики; характеризуется фокусом на функционировании языка как средства общения. Изначальный импульс развития функционализм получил в «Тезисах Пражского лингвистического кружка» (1929), а затем был развит в работах представителей Пражской лингвистической школы.
2051
Алпатов В. М. (2005). История лингвистических учений. Учебное пособие / 4-е изд., исправ. и доп. — М.: Языки славянской культуры // http://genling.spbu.ru/hl/085.pdf
2052
Ярцева В. Н. (1990). Лингвистический энциклопедический словарь. — М.: Советская энциклопедия // http://tapemark.narod.ru/les/index.html
2053
Алпатов В. М. (2005). История лингвистических учений / 4-е изд., исправ. и доп. — М.: Языки славянской культуры // http://genling.spbu.ru/hl/085.pdf
2054
Алпатов В. М. (2005). История лингвистических учений / 4-е изд., исправ. и доп. — М.: Языки славянской культуры // http://genling.spbu.ru/hl/085.pdf
Адептус Астартес: Омнибус. Том I
Warhammer 40000
Фантастика:
боевая фантастика
рейтинг книги
