Чтение онлайн

на главную - закладки

Жанры

Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:

Конечно, критика со стороны ALPAC была во многом справедливой. Системы машинного перевода, созданные на момент выхода отчёта, были весьма примитивными по сегодняшним меркам, а качество выполняемого ими перевода даже для текстов сравнительно узкой тематики оставляло желать лучшего. Тщательно подготовленные демонстрации, производившиеся на заре машинного перевода, создавали у зрителей обманчивое ощущение того, что задача машинного перевода если уже не решена, то будет решена в ближайшие годы. Однако эти иллюзии не выдержали столкновения с суровой действительностью, что могло вызвать обиду и разочарование, в том числе и у лиц, причастных к распределению государственных фондов.

6.3.2.5 Подходы к машинному переводу и его дальнейшее развитие

Подход, положенный в основу большинства систем машинного перевода, созданных до 1960-х гг., иногда называют прямым переводом. Системы разрабатывались обычно для конкретной пары языков. Синтаксис и семантика языка анализировались в таких системах лишь до той степени, в которой это было необходимо для разрешения неоднозначностей,

выбора правильных вариантов перевода слов и определения порядка слов в результирующих предложениях.

Типичным примером была система Джорджтаунского университета, которая в итоге оказалась одной из наиболее успешных систем, основанных на прямом переводе. Исследовательская группа из Джорджтауна использовала технику, которую Гарвин позже назвал методом грубой силы [brute force]: программа разрабатывалась на основе некоторого корпуса текстов, затем проверялась на другом корпусе, исправлялась и улучшалась, затем тестировалась на ещё большем корпусе, улучшалась вновь и так далее. Результатом стала монолитная программа с запутанной структурой, без чёткого разделения частей, отвечающих за анализ исходного и синтез результирующего текста. Синтаксический анализ был реализован лишь в зачаточной форме, отсутствовали понятия грамматических правил и синтаксических структур. Разумеется, в таких условиях трудно было рассуждать о теории языка или перевода [2047] . Информация о грамматике языка была включена в исходный код программы, что затрудняло возможности дальнейшего развития системы из-за приближения к пределу управления сложностью.

2047

Hutchins W. J. (1982). The evolution of machine translation systems / Lawson V. (1982). Practical experience of machine translation // http://www.mt-archive.info/Aslib-1981-Hutchins-1.pdf

Впрочем, даже в таких условиях находилось пространство для теоретических споров. В Советском Союзе эти споры приобрели традиционно наиболее ожесточённый характер, их отголоски даже вылились на страницы научно-фантастической литературы. В повести братьев Стругацких «Попытка к бегству», написанной в 1962 г., один из персонажей назван структурным (и даже «структуральнейшим») лингвистом, а рассуждения о языке, а также работа лингвиста XXII в. с инопланетным языком являются одной из заметных составляющих сюжета. В рассуждении персонажей Стругацких можно найти множество отсылок к дискуссиям 1950–1960-х гг. Спор о структурализме в СССР в 1950-е гг. во многом вращался вокруг основного на тот момент вопроса машинного перевода — о принципиальной возможности автоматизации лингвистики. Можно ли в принципе при помощи формальных структур описать закономерности, существующие в живых, развивающихся языках? [2048]

2048

Вельмезова Е. (2015). Снова об универсалиях «лингвистическо-литературных»: «Структуральнейшая лингвистика» в повести А. и Б. Стругацких «Попытка к бегству» / Фаустов А. (2015). Универсалии русской литературы. Т. 6. — Воронеж: Издательско-полиграфический центр «Научная книга» // http://www.rusf.ru/abs/rec/velmez01.htm

В 1960 г., за два года до выхода повести Стругацких, на филологическом факультете МГУ было создано Отделение теоретической и прикладной лингвистики (вскоре переименованное в Отделение структурной и прикладной лингвистики, ОСиПЛ; ныне — Отделение теоретической и прикладной лингвистики, ОТиПЛ), объединившее ведущих советских специалистов в области обработки естественного языка. Современным лингвистам хорошо знакомы имена многих из этих исследователей. В их числе были уже упоминавшийся нами Владимир Успенский, Александр Кибрик, Юрий Апресян и Андрей Зализняк. Эти учёные стали создателями новых теоретических концепций в области лингвистики и даже целых научных направлений.

Трудно дать однозначный ответ на вопрос о том, повлиял ли и в какой мере повлиял отчёт ALPAC на развитие машинного перевода в Советском Союзе. Работы в этом направлении продолжались, однако область машинного перевода, по всей видимости, уже не рассматривалась государством в качестве приоритетной. Энтузиасты продолжали работу над системами машинного перевода, и, хотя эта работа велась вне фокуса пристального внимания общества, она начала постепенно принимать более структурированный характер. Важной вехой стало появление теории «Смысл <=> Текст» (ТСТ), предложенной Мельчуком и развитой при деятельном участии других советских лингвистов, среди которых отдельно следует упомянуть Александра Жолковского, а также Юрия Апресяна. ТСТ представляет язык как многоуровневую модель преобразований смысла в текст и обратно. Создатели теории формулируют ключевой постулат ТСТ следующим образом: «Естественный язык есть система, устанавливающая соответствия между любым заданным смыслом и всеми выражающими его текстами; соответственно, лингвистическое описание некоторого языка должно представлять собой множество правил, ставящих в соответствие всякому смыслу все тексты данного языка, несущие этот смысл».

Также среди важных особенностей этой теории можно назвать использование синтаксиса

зависимостей, то есть такого способа представления предложений, в котором предложение рассматривается как иерархия компонентов, между которыми установлены отношения зависимости. Ещё один столп ТСТ — использование особого вида словаря, толково-комбинаторного, цель которого состоит в явном и исчерпывающем описании всей той информации, которой располагает средний носитель языка относительно отдельно взятого слова [2049] . Во второй половине 1960-х гг. ТСТ стала в нашей стране одной из основ экспериментальной лингвистики, хотя предлагаемые ею принципы расходятся с идеями, положенными в основу популярной во всём мире генеративной лингвистики.

2049

Мельчук И. А. (1984). Русский язык в модели смысл-текст / Russian Language Journal, Vol. 38, Iss. 129/130, pp. 189—198 // https://codenlp.ru/knigi/russkiy-yazyik-v-modeli-smyisl-tekst-melchuk.html

Эта концепция обычно ассоциируется с именем американского лингвиста Ноама Хомского, в трудах которого она получила окончательное оформление. Однако, несмотря на большой авторитет Хомского в среде вычислительных лингвистов, неверно было бы полагать, что хомскианская лингвистика появилась на свет подобно Минерве из головы Юпитера.

Сам Хомский называл источником своих идей рационалистическую философию Рене Декарта и созданные под её влиянием так называемые картезианские грамматики, например знаменитую «Грамматику Пор-Рояля» — книгу, изданную в 1660 г. аббатами монастыря Пор-Рояль Антуаном Арно и Клодом Лансло. Мыслители XVII столетия занимались активными поисками универсальных свойств языка: под влиянием расширения межгосударственных связей и трудностей, связанных с процессом перевода, обрела популярность идея создания «всемирного языка», для чего, в свою очередь, нужно было выявить свойства, которыми обладают реальные языки. Хотя Хомский и использует термин «картезианские грамматики», картезианские идеи присутствуют ещё в работах ряда предшественников Декарта.

Именно в «Грамматике Пор-Рояля» Хомский находит в зачаточной форме один из наиболее фундаментальных принципов своей концепции, заключающейся в разграничении поверхностной и глубинной структур языка. Поверхностная структура соответствует только материальному аспекту (фонетике и грамматике), а глубинная — значению (семантике). Хомский пишет: «Глубинная структура соотносится с поверхностной структурой посредством некоторых мыслительных операций, в современной терминологии — посредством грамматических трансформаций».

Помимо картезианских грамматик, идейно концепция Хомского (как и некоторые другие течения в структурной лингвистике, например функционализм [2050] , [2051] , [2052] ) восходит к трудам отца-основателя структурной лингвистики Фердинанда де Соссюра [2053] .

Соссюр (кстати говоря, мы знакомы с его идеями только по отдельным статьям, единственной книге, законченной автором в возрасте 21 года и посвящённой первоначальной системе гласных в индоевропейских языках, а также текстам лекций, восстановленным позднее по конспектам студентов, — сам учёный считал, что представления его оформились недостаточно и нельзя даже помышлять об издании книги по интересующему его направлению [2054] ) рассматривал лингвистику как часть более общей дисциплины, которую он предложил назвать семиологией. По его замыслу, семиология должна была стать наукой, изучающей жизнь знаков в обществе, являясь, в свою очередь, разделом социальной и, следовательно, общей психологии. Соссюр утверждал, что законы, которые откроет семиология, будут применимы и к лингвистике.

2050

* Функционализм (функциональный структурализм, функциональная лингвистика) — совокупность школ и направлений, возникших как одно из ответвлений структурной лингвистики; характеризуется фокусом на функционировании языка как средства общения. Изначальный импульс развития функционализм получил в «Тезисах Пражского лингвистического кружка» (1929), а затем был развит в работах представителей Пражской лингвистической школы.

2051

Алпатов В. М. (2005). История лингвистических учений. Учебное пособие / 4-е изд., исправ. и доп. — М.: Языки славянской культуры // http://genling.spbu.ru/hl/085.pdf

2052

Ярцева В. Н. (1990). Лингвистический энциклопедический словарь. — М.: Советская энциклопедия // http://tapemark.narod.ru/les/index.html

2053

Алпатов В. М. (2005). История лингвистических учений / 4-е изд., исправ. и доп. — М.: Языки славянской культуры // http://genling.spbu.ru/hl/085.pdf

2054

Алпатов В. М. (2005). История лингвистических учений / 4-е изд., исправ. и доп. — М.: Языки славянской культуры // http://genling.spbu.ru/hl/085.pdf

Поделиться:
Популярные книги

Адептус Астартес: Омнибус. Том I

Коллектив авторов
Warhammer 40000
Фантастика:
боевая фантастика
4.50
рейтинг книги
Адептус Астартес: Омнибус. Том I

Имперский Курьер. Том 2

Бо Вова
2. Запечатанный мир
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Имперский Курьер. Том 2

Никто и звать никак

Ром Полина
Фантастика:
фэнтези
7.18
рейтинг книги
Никто и звать никак

Кодекс Крови. Книга ХIV

Борзых М.
14. РОС: Кодекс Крови
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Кодекс Крови. Книга ХIV

Генерал Скала и ученица

Суббота Светлана
2. Генерал Скала и Лидия
Любовные романы:
любовно-фантастические романы
6.30
рейтинг книги
Генерал Скала и ученица

Возвышение Меркурия. Книга 17

Кронос Александр
17. Меркурий
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Возвышение Меркурия. Книга 17

Игрушка богов. Дилогия

Лосев Владимир
Игрушка богов
Фантастика:
фэнтези
4.50
рейтинг книги
Игрушка богов. Дилогия

Студент из прошлого тысячелетия

Еслер Андрей
2. Соприкосновение миров
Фантастика:
героическая фантастика
попаданцы
аниме
5.00
рейтинг книги
Студент из прошлого тысячелетия

Убивать чтобы жить 6

Бор Жорж
6. УЧЖ
Фантастика:
боевая фантастика
космическая фантастика
рпг
5.00
рейтинг книги
Убивать чтобы жить 6

Законы Рода. Том 10

Андрей Мельник
10. Граф Берестьев
Фантастика:
юмористическая фантастика
аниме
фэнтези
5.00
рейтинг книги
Законы Рода. Том 10

Госпожа Доктор

Каплунова Александра
Фантастика:
попаданцы
фэнтези
5.00
рейтинг книги
Госпожа Доктор

Боярышня Дуняша 2

Меллер Юлия Викторовна
2. Боярышня
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Боярышня Дуняша 2

Интернет-журнал "Домашняя лаборатория", 2007 №7

Журнал «Домашняя лаборатория»
Дом и Семья:
хобби и ремесла
сделай сам
5.00
рейтинг книги
Интернет-журнал Домашняя лаборатория, 2007 №7

Кодекс Крови. Книга II

Борзых М.
2. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга II