Чтение онлайн

на главную - закладки

Жанры

Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:

Машины могут с лёгкостью анализировать обширные наборы текстов, подсчитывая частоты отдельных элементов текста и их сочетаний. Они могут запоминать, в каком контексте встречаются различные элементы текста. Эти же приёмы, применяемые в ходе дешифровки сообщений, по мнению Уивера, могли оказаться полезными и в решении задачи автоматического перевода.

Хотя Уиверу и не удалось заинтересовать Винера, идея была воспринята всерьёз другим исследователем. 12 февраля 1948 г. появился меморандум, написанный профессором Эндрю Бутом, занимавшимся проектированием вычислительных машин. Бут писал: «Итоговый пример возможного применения электронного компьютера — перевод с одного языка на другой. Мы довольно подробно проанализировали эту задачу, и выяснилось, что машина такого типа может выполнять эту функцию без каких-либо изменений в её конструкции».

В мае 1948 г. Уивер навестил Бута в его компьютерной лаборатории и

узнал, что Бут и его коллега доктор Ричард Риченс, заместитель директора Бюро селекции растений и генетики, проявляли большой интерес к проблеме машинного перевода. На тот момент они ещё не задумывались над проблемами, связанными с порядком следования слов, их множественными значениями, наличием идиом и так далее, а были сосредоточены на проблеме автоматизации словарного поиска. Впрочем, алгоритм, предлагавшийся Бутом и Риченсом, был чуть более сложным, чем простой поиск точных совпадений слов. Если слово отсутствовало в словаре, он отбрасывал его последнюю букву и повторял попытку поиска. Эта операция повторялась снова и снова до тех пор, пока слово наконец не было найдено. После этого алгоритм проверял наличие отброшенного окончания в специальном «грамматическом приложении» словаря [2032] (этот метод хорошо подходит для английского языка, в котором словообразование часто происходит за счёт добавления разнообразных суффиксов: -ing, -ness, -en, а также других; впрочем, и в русском языке можно найти подобные примеры — например, слово «столик» образовано с помощью добавления суффикса «-ик»).

2032

Nirenburg S., Somers H. L., Wilks Y. (2003). Readings in Machine Translation. MIT Press // https://books.google.ru/books?id=yx3lEVJMBmMC

Конечно, такие простые методы не могли обеспечить решение столь сложной проблемы, как профессиональный перевод текста с одного языка на другой. Выбор правильного значения слова при переводе сильно зависит от контекста, а также от наличия у переводчика знаний об окружающем мире. В противном случае могут возникнуть ситуации, подобные знаменитой байке о том, как в результате машинного перевода на русский язык и обратно библейская фраза The spirit is willing but the flesh is weak [Дух бодр, плоть же немощна] превратилась в The vodka is good but the meat is rotten [Водка хороша, но мясо гнилое] [2033] , [2034] .

2033

Hutchins J. (1995). “The whisky was invisible”, or Persistent myths of MT / MT News International 11 (June 1995), pp. 17—18 // http://www.hutchinsweb.me.uk/MTNI-11-1995.pdf

2034

Russell S. J., Norvig P. (2016). Artificial Intelligence: A Modern Approach. Pearson // https://books.google.ru/books?id=XS9CjwEACAAJ

Впрочем, дело было не только в ограниченности возможностей ранних ЭВМ, но и в том, что задача перевода в ряде случаев крайне сложна и по сути неразрешима даже для человека. Знаменитому писателю и поэту, классику поэзии на иврите Хаиму Бялику приписывают следующую цитату: «Изучение через перевод похоже на поцелуй невесты сквозь платок» (???? ????? ?? ??? ???? ?? ???? ??? ????). Сложность задачи видна даже в этом, на первый взгляд простом изречении, приведённом в критической статье [2035] Макса Зельднера в New York Herald Tribune от 26 июня 1949 г. Слово ???? в английском переводе превратилось в veil (вуаль), я же использовал в русском переводе слово «платок». Но у этого слова есть и другие значения: шарф, пелена, чадра, шаль, кашне. Что именно имел в виду автор и имеет ли данный предмет прямой аналог в нашем обиходе? В качестве перевода для???? Зельднер выбирает слово sweetheart (возлюбленная). Хотя слово «невеста» в данном случае по значению куда ближе к оригиналу, однако его действительный смысл привязан к особенностям брачного обряда, который имеет ряд отличий у разных народов.

2035

Hutchins J. (1997). From First Conception to First Demonstration: the Nascent Years of Machine Translation, 1947–1954. A Chronology / Machine Translation, Vol. 12 (3), pp. 195—252 // https://doi.org/10.1023/a:1007969630568

В

общем, критикам вполне хватало аргументов для того, чтобы объявить задачу не просто сложной, но даже и вовсе неразрешимой. Впрочем, если людям удавалось создавать переводы, имеющие практическую ценность, то почему машины не могли бы добиться того же результата? В конце концов, поцелуй сквозь платок лучше, чем отсутствие поцелуя. Даже примитивный дословный перевод может быть полезным за счёт способности машин быстро обрабатывать большие объёмы текстов. Так, например, массовый перевод технических текстов может принести немалую пользу, даже если он будет недостаточно стилистически элегантным. Конечно, и такие тексты не всегда просты с точки зрения стилистики, но, по крайней мере, проблема множественных значений слов здесь выражена в меньшей мере. Скажем, в статьях по математике, в силу строгости самой дисциплины, скорее всего все термины будут иметь одно-единственное значение.

На границе 1940-х и 1950-х гг. возникает ряд научных коллективов, разрабатывающих проблематику машинного перевода, а уже в 1952 г. в MIT проходит первая международная конференция по этой теме. Инициатором её проведения стал философ, математик и лингвист, ученик и последователь Карнапа Йегошуа Бар-Хиллел. Он, в отличие от Уивера, в большей мере полагался на методы формальной логики, чем на статистический подход. Он предложил использовать для описания синтаксической структуры естественных языков категориальные грамматики, разработанные для формальных языков математики польскими логиками Казимиром Айдукевичем и Станиславом Лесьневским. Идеи Бар-Хиллела легли в основу подхода, который позже получит название «машинный перевод на основе правил» (Rule-Based Machine Translation, RBMT).

На конференции Дункан Харкин из Министерства обороны США заявил, что его ведомство готово финансировать проект в области машинного перевода. Уже знакомый нам Джерри Визнер поддержал эту идею и предложил финансирование от Исследовательской лаборатории электроники IBM.

6.3.2.3 Джорджтаунский эксперимент, принёсший оптимизм

Первая крупная демонстрация результатов состоялась 7 января 1954 г. в Нью-Йорке, в штаб-квартире корпорации IBM, и получила название «Джорджтаунский эксперимент» (его подготовкой, совместно с IBM, занималась группа исследователей из Джорджтаунского университета).

В ходе эксперимента оператор, не знавший русского языка, ввёл в машину более 60 записанных транслитом предложений. Переводы на английский, выполненные машиной, выводились на бумагу при помощи принтера. На перевод одного предложения у машины уходило от 5 до 8 секунд.

Демонстрация возможностей системы на машине IBM 701 завершилась успешно, несмотря на то что она использовала всего шесть грамматических правил и словарь из 250 записей, включавших оригинальное слово и один или два варианта его перевода [2036] .

2036

Macdonald N. (1954). Language translation by machine — a report of the first successful trial / Computers and Automation, Vol. 3 (2), February 1954 // http://mt-archive.info/Macdonald-1954.pdf

Основной тематикой выбранных для эксперимента предложений была органическая химия, однако тестовый набор включал в себя также около 20 предложений, относящихся к другим областям. Именно их обычно выбирали авторы популярных статей, посвящённых демонстрации (по всей видимости, в силу того, что примеры из области химии не казались им достаточно интересными для широкой публики).

Вот несколько примеров переводов, выполненных машиной:

KACHYESTVO UGLYA OPRYEDYELYAYETSYA KALORYIYNOSTJYU -> The quality of coal is determined by calory content.

KRAXMAL VIRABATIVAYETSYA MYEXANYICHYESKYIM PUTYEM YIZ KARTOFYELYA -> Starch is produced by mechanical methods from potatoes.

VYELYICHYINA UGLA OPRYEDYELYAYETSYA OTNOSHYENYIYEM DLYINI DUGI K RADYIUSU -> Magnitude of angle is determined by the relation of length of arc to radius.

OBRABOTKA POVISHAYET KACHYESTVO NYEFTYI -> Processing improves the quality of crude oil.

MI PYERYEDAYEM MISLYI POSRYEDSTVOM RYECHYI -> We transmit thoughts by means of speech.

ZHIYELYEZO DOBIVAYETSYA YIZ RUDI XYIMYICHYESKYIM PROTSYESSOM -> Iron is obtained from ore by chemical process.

Поделиться:
Популярные книги

Адептус Астартес: Омнибус. Том I

Коллектив авторов
Warhammer 40000
Фантастика:
боевая фантастика
4.50
рейтинг книги
Адептус Астартес: Омнибус. Том I

Имперский Курьер. Том 2

Бо Вова
2. Запечатанный мир
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Имперский Курьер. Том 2

Никто и звать никак

Ром Полина
Фантастика:
фэнтези
7.18
рейтинг книги
Никто и звать никак

Кодекс Крови. Книга ХIV

Борзых М.
14. РОС: Кодекс Крови
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Кодекс Крови. Книга ХIV

Генерал Скала и ученица

Суббота Светлана
2. Генерал Скала и Лидия
Любовные романы:
любовно-фантастические романы
6.30
рейтинг книги
Генерал Скала и ученица

Возвышение Меркурия. Книга 17

Кронос Александр
17. Меркурий
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Возвышение Меркурия. Книга 17

Игрушка богов. Дилогия

Лосев Владимир
Игрушка богов
Фантастика:
фэнтези
4.50
рейтинг книги
Игрушка богов. Дилогия

Студент из прошлого тысячелетия

Еслер Андрей
2. Соприкосновение миров
Фантастика:
героическая фантастика
попаданцы
аниме
5.00
рейтинг книги
Студент из прошлого тысячелетия

Убивать чтобы жить 6

Бор Жорж
6. УЧЖ
Фантастика:
боевая фантастика
космическая фантастика
рпг
5.00
рейтинг книги
Убивать чтобы жить 6

Законы Рода. Том 10

Андрей Мельник
10. Граф Берестьев
Фантастика:
юмористическая фантастика
аниме
фэнтези
5.00
рейтинг книги
Законы Рода. Том 10

Госпожа Доктор

Каплунова Александра
Фантастика:
попаданцы
фэнтези
5.00
рейтинг книги
Госпожа Доктор

Боярышня Дуняша 2

Меллер Юлия Викторовна
2. Боярышня
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Боярышня Дуняша 2

Интернет-журнал "Домашняя лаборатория", 2007 №7

Журнал «Домашняя лаборатория»
Дом и Семья:
хобби и ремесла
сделай сам
5.00
рейтинг книги
Интернет-журнал Домашняя лаборатория, 2007 №7

Кодекс Крови. Книга II

Борзых М.
2. РОС: Кодекс Крови
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Кодекс Крови. Книга II