Чтение онлайн

на главную - закладки

Жанры

Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:

Системы машинного перевода, созданные в 1950-е — начале 1960-х гг., обычно рассматривали текст как последовательность предложений, каждое из которых обрабатывалось по отдельности. Они использовали большие двуязычные словари и запрограммированные правила для определения порядка слов в переведённом тексте. Этот подход в наши дни часто называют прямым машинным переводом [direct machine translation]. Несмотря на сравнительную простоту используемых алгоритмов, некоторые системы, созданные в это время, были внедрены в промышленную эксплуатацию и активно применялись на практике. Например, Военно-воздушные силы США вплоть до начала 1970-х гг. использовали систему, созданную группой исследователей Вашингтонского университета под руководством Эрвина Райфлера. Райфлер и его коллеги работали над двумя языковыми парами: «английский — немецкий» и «английский — русский». С 1958 г. развитием этой системы занималась команда разработчиков из компании IBM под руководством Гилберта Кинга.

Комиссия

по атомной энергии и Евратом (Европейское сообщество по атомной энергии) в Италии, а также Национальная лаборатория Атомной энергетической комиссии США Oak Ridge использовали системы, ядро которых было разработано в Джорджтаунском университете. Со времён Джорджтаунского эксперимента этот университет стал основным центром исследований машинного перевода в США. Из-за методологических разногласий, возникших среди исследователей, в университете были созданы сразу четыре группы, каждой из которых было предложено представить свои методы для тестирования на открытом конкурсе, в ходе которого необходимо было переводить с русского языка тексты из области химии. Победителем стал прототип, разработанный группой под руководством Майкла Заречнака. Он лёг в основу системы, получившей название GAT (Georgetown Automatic Translation, Джорджтаунский автоматический перевод). Метод, опубликованный командой Заречнака в 1959 г. [2040] , получил название «общий анализ» [general analysis]. В его рамках текст анализировался на трёх уровнях: морфологическом (включая определение идиом), синтагматическом (согласование существительных и прилагательных, управление глаголами и т. д.) и синтаксическом (выделение подлежащих, сказуемых и т. д.).

2040

Zarechnak M. (1959). Three Levels of Linguistic Analysis in Machine Translation / Journal of the ACM, January 1959 // https://doi.org/10.1145/320954.320956

Ещё одним западным центром исследований в области машинного перевода в 1950-е гг. стала корпорация RAND, исследователи которой вели эксперименты по применению в машинном переводе методов статистического анализа текстов [2041] , [2042] .

В целом, несмотря на скудность аппаратных средств, машинный перевод стал в конце 1950-х — начале 1960-х гг. популярным направлением для теоретических и прикладных исследований, и с его развитием было связано множество оптимистических ожиданий.

2041

Hutchins W. J. (2000). Early Years in Machine Translation: Memoirs and biographies of pioneers. John Benjamins Publishing // https://books.google.ru/books?id=3dU5AAAAQBAJ

2042

Hutchins W. J. (1995). Machine translation: a brief history / Koerner E. F. K., Asher R. E. (1995). Concise history of the language sciences: from the Sumerians to the cognitivists. Oxford: Pergamon Press // http://hutchinsweb.me.uk/ConcHistoryLangSci-1995.pdf

6.3.2.4 Отчёт ALPAC, принёсший разочарование

Впрочем, как и в случае многих других начинаний в области ИИ в 1950-е гг., на смену безудержному оптимизму быстро пришло разочарование. Развитие систем машинного перевода быстро столкнулось со сложностью предметной области. Отсутствие видимого прогресса привело к стремительному превращению некоторых оптимистов в пессимистов. Например, Бар-Хиллел заявил, что качественный машинный перевод невозможен в принципе: в некоторых контекстах машина никогда не сможет распознать многозначные слова. Впрочем, природа этого кризиса была, по всей видимости, не столь уж проста. Он разразился на фоне быстрого развития вычислительной техники и расширения сфер её применения. В такие периоды экстенсивного развития технологии обычно наблюдается дефицит специалистов на фоне множества направлений эффективного применения их сил и возникает вопрос: зачем создавать систему, способную ценой гигантских трудозатрат квалифицированных разработчиков немного снизить затраты труда в области перевода, если ценой куда более скромных трудозатрат тех же специалистов можно, например, многократно повысить производительность труда бухгалтеров? Получается, что старый добрый принцип «в первую очередь сорви наиболее низко висящий фрукт» в определённый момент работает против инновационных областей технологии.

В 1964 г. в США для оценки прогресса в области машинного перевода был создан Консультативный комитет по автоматической обработке языка (Automatic Language Processing Advisory Committee, ALPAC), который спустя два года опубликовал отчёт. Общая тональность отчёта была умеренно-пессимистической. И хотя он и не содержал разгромных формулировок и громких

выводов, результатом его публикации стало существенное сокращение финансирования этой тематики со стороны американских и европейских властей. Некоторые источники утверждают, что отчёт ALPAC содержал призыв полностью отказаться от государственного финансирования проектов в области машинного перевода, но, как мы увидим далее, это не соответствует действительности.

Как же получилось, что оценка перспектив машинного перевода оказалась столь пессимистичной? Разберём этот вопрос подробнее.

Общие сведения о комитете изложены в предисловии отчёта: «Министерство обороны, Национальный научный фонд и Центральное разведывательное управление поддерживали проекты по автоматической обработке иностранных языков в течение примерно десяти лет; в основном это были проекты по механическому переводу. В целях создания согласованной федеральной программы исследований и разработок в этой области, эти три агентства создали Объединённую группу автоматической обработки языков (Joint Automatic Language Processing Group, JALPG)».

Именно JALPG стала учредителем ALPAC. В состав комитета вошли представители Bell Labs, RAND Corporation, Корнеллского и Чикагского университетов, Гарварда и Технологического института Карнеги (который в 1967 г., после слияния с Институтом индустриальных исследований Меллона, стал уже упоминаемым ранее Университетом Карнеги — Меллона). Среди семи членов ALPAC были исследователи в области ИИ, в том числе бывшие участники проектов по машинному переводу (но разочаровавшиеся в данном направлении и пессимистично настроенные), лингвисты и один психолог. Впрочем, комитет заслушал свидетельства активных исследователей в области машинного перевода, таких как Пол Гарвин, Джулс Мерсел, Гилберт Кинг и Уинфред Леманн.

Комитет с самого начала настаивал на том, что целью государственного финансирования исследований в области машинного перевода может быть лишь прикладной результат — снижение затрат, существенный рост производительности или удовлетворение оперативных потребностей. Исходя из этих прикладных целей, ALPAC изучил общее состояние дел в области перевода. При этом доклад был сосредоточен исключительно на правительственных и военных потребностях США в анализе русскоязычных документов [2043] .

2043

Hutchins J. (1996). ALPAC: the (in)famous report / MT News International, No. 14, June 1996, pp. 9—12 // http://www.hutchinsweb.me.uk/MTNI-14-1996.pdf

Для понимания контекста ситуации надо отметить важный момент: после запуска советского спутника в 1957 г. и полёта в космос Юрия Гагарина в 1961 г. США предприняли меры, чтобы не допускать отставания от СССР в научно-техническом прогрессе. Наряду c принятием космической программы с планом высадки на Луну и с расширением мест научно-технических специальностей в вузах, было принято решение о резком увеличении перевода советской научно-технической литературы на английский.

В результате выделения средств, найма в качестве переводчиков учёных-профессионалов и быстрого обучения их русскому языку начался, по мнению Майкла Гордина, «самый грандиозный проект научного перевода в мировой истории». Уже в начале 1960-х более 80 советских научных журналов переводилось от корки до корки — каждая страница каждого выпуска, а только одна частная компания Consultants Bureau переводила 34 000 страниц русских научных текстов в год. Понятно, что качество такого перевода было далеко не идеальным, но для общего понимания оно было достаточным [2044] , [2045] .

2044

Shapin S. (2015). Confusion of Tongues: Scientific Babel: The Language of Science from the Fall of Latin to the Rise of English by Michael Gordin / London Review of Books // https://www.lrb.co.uk/the-paper/v37/n23/steven-shapin/confusion-of-tongues

2045

Gordin M. (2015). Scientific Babel: The language of science from the fall of Latin to the rise of English. Profile Books // https://books.google.ru/books?id=2dmiBQAAQBAJ

Исходя из таких масштабов переводов с русского языка, становится понятной важность задачи автоматизации перевода.

Первое, на что следует обратить внимание: отчёт ALPAC озаглавлен «Языки и машины: компьютеры в переводе и лингвистике». Таким образом, доклад не ограничивался одним только машинным переводом и был посвящён более широкой области — компьютерной лингвистике в целом. На деле, конечно, большая часть финансируемых государством исследований в области обработки естественного языка в то время была сосредоточена на полномасштабном машинном переводе.

Поделиться:
Популярные книги

Любовь Носорога

Зайцева Мария
Любовные романы:
современные любовные романы
9.11
рейтинг книги
Любовь Носорога

Север и Юг. Великая сага. Компиляция. Книги 1-3

Джейкс Джон
Приключения:
исторические приключения
5.00
рейтинг книги
Север и Юг. Великая сага. Компиляция. Книги 1-3

Жена на пробу, или Хозяйка проклятого замка

Васина Илана
Фантастика:
попаданцы
фэнтези
5.00
рейтинг книги
Жена на пробу, или Хозяйка проклятого замка

Сын Тишайшего

Яманов Александр
1. Царь Федя
Фантастика:
попаданцы
альтернативная история
фэнтези
5.20
рейтинг книги
Сын Тишайшего

…спасай Россию! Десант в прошлое

Махров Алексей
1. Господин из завтра
Фантастика:
альтернативная история
8.96
рейтинг книги
…спасай Россию! Десант в прошлое

Барон играет по своим правилам

Ренгач Евгений
5. Закон сильного
Фантастика:
попаданцы
аниме
фэнтези
фантастика: прочее
5.00
рейтинг книги
Барон играет по своим правилам

Жена неверного ректора Полицейской академии

Удалова Юлия
Любовные романы:
любовно-фантастические романы
4.25
рейтинг книги
Жена неверного ректора Полицейской академии

Секреты серой Мыши

Страйк Кира
Любовные романы:
любовно-фантастические романы
6.60
рейтинг книги
Секреты серой Мыши

Свадьба по приказу, или Моя непокорная княжна

Чернованова Валерия Михайловна
Любовные романы:
любовно-фантастические романы
5.57
рейтинг книги
Свадьба по приказу, или Моя непокорная княжна

Третий. Том 3

INDIGO
Вселенная EVE Online
Фантастика:
боевая фантастика
космическая фантастика
попаданцы
5.00
рейтинг книги
Третий. Том 3

Лекарь для захватчика

Романова Елена
Фантастика:
попаданцы
историческое фэнтези
фэнтези
5.00
рейтинг книги
Лекарь для захватчика

Золушка по имени Грейс

Ром Полина
Фантастика:
фэнтези
8.63
рейтинг книги
Золушка по имени Грейс

Бастард Императора

Орлов Андрей Юрьевич
1. Бастард Императора
Фантастика:
фэнтези
аниме
5.00
рейтинг книги
Бастард Императора

Карабас и Ко.Т

Айрес Алиса
Фабрика Переработки Миров
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
Карабас и Ко.Т