Наш коллега - робот
Шрифт:
Вряд ли. Ведь одно и то же слово участвует в предложениях разного типа с десятком интонаций, сотнями вариантов произношения. Чтобы такая речь мало-мальски "ласкала слух", потребуется слишком большая куча вариантов произнесения слов и, следовательно, слишком длительный поиск нужного варианта. Все это окажется слишком дорого. Хорошо бы, задумались конструкторы, создать машину, которая бы не воспроизводила заранее записанные фрагменты, а говорила сама, то есть синтезировала речь, подобно человеку.
Историю говорящих машин следовало бы начать с глубины веков. Самые первые были тщательными моделями человеческого речевого аппарата. Кузнечный мех вдувал мощную струю воздуха в кожаную гортань,
Как это неоднократно происходило в истории техники, механический принцип копирования благополучно завершил серию тщетных потуг и новая фаворитка человечества - электроника прочно уселась на его место.
Исследованиями было установлено, что подавляющая часть "звуковой энергии" человеческой речи сосредоточена в пяти типовых областях частот: от 200 до 3500 герц. Эта шкала разбивается на пять фонем, каждая из которых генерируется своей специально настроенной звуковой схемой. Управление частотой и амплитудой каждой схемы, а также очередностью их срабатывания поручается компьютеру. В результате определенных последовательностей включения генерирующих схем и возникают необходимые звуки "человеческого голоса".
Однако качество работы машины, полностью синтезирующей речь, в большой степени зависит от того, насколько удачно удается электронная имитация смеси переходных шумов между отдельными звуками, поскольку эти шумы играют определяющую роль для понимания языка вообще и, следовательно, искусственного языка в частности. Еще более усложняет все дело то, что они бывают чрезвычайно разнообразными, зависят от того, в какой последовательности произносятся гласные и согласные, от скорости и громкости произнесения слов и т. д. и т. п.
Еще недавно как великую экзотику демонстрировали кибернетики системы, полностью синтезирующие человеческую речь, а уже поступают сообщения о серийном выпуске говорящих часов, фотокамер и светофоров.
Это следствие появления на рынке близкого родственника современного микропроцессора - который назван voiceprocessor (от английского слова "voice" - голос).
Что-то вроде "процессор для синтеза голоса" или "голосистый процессор". Такое устройство программируется как обычный компьютер и может синтезировать электронную копию волнового спектра, возникающего при произнесении слов. Этим машина похожа на читающего, который, правда, не имеет понятия о смысле прочитанного.
Лингвистические способности роботов не только "оживили" безгласные вещи, но и помогают человеку в его "разговорной деятельности"; например, созданы карманные компьютеры, используемые в качестве помощников при переводе, которые "выговаривают" отдельные слова с правильным произношением на нужном языке; или целые роботы-переводчики, которые могут осуществлять перевод международных разговоров несложного бытового содержания. Такова, например, система перевода английский - японский. Память робота содержит около восьми тысяч фонем слов, четыреста идиом, примерно тысячу грамматических правил обоих языков. Она почти не отличается от аналогичных интеллектуальных переводчиков.
Одна из фирм в ФРГ, занимающаяся выполнением заказов по пересылке, давно использует в своей деятельности компьютер, который отвечает на звонок человеческим голосом, робот подтверждает получение заказа или же сообщает о невозможности его выполнения, закончив разговор, говорит "спасибо" и "до свидания".
Хорошо трудится вот уже почти два года "Карлуша" - крупная железнодорожная справочная система: абонент называет вокзал назначения и без промедления получает устную справку о поездах, следующих в данном направлении, времени и вокзалах, в которых можно сделать удобную пересадку.
Постоянно растущий объем информации требует новых путей и методов ведения информационно-справочной работы. Все острее ощущается нехватка людей, времени и средств для компетентных ответов на вопросы из всех областей знания. В будущем тут могут помочь лишь понимающие язык и могущие "изъясняться" роботы, снабженные "банками памяти".
Серьезные усилия, прилагаемые в области создания машин, понимающих человеческую речь и отвечающих людям, наглядно свидетельствуют о том, что речь при этом идет не о каких-то игрушках. Взаимодействие с машиной на языковом уровне позволит людям, не обладающим специальными знаниями, эффективно пользоваться компьютерами и роботами.
МИДИ, МИНИ, МИКРО...
В одном из номеров журнала "Техника - молодежи" была помещена красочная фотография: симпатичная девушка расположилась на удобном коврике 2X2 метра с пестрым современным рисунком. Подпись под фотографией гласила: "Так выглядит одна из секций большой интегральной схемы, размер которой в натуре составляет 250 микрон в поперечнике". Пестрота этого коврика объясняется тысячами нитей, квадратиков, прямоугольников, каждый из которых представляет собой транзистор, проводок или другой элемент микромодуля. На таком коврике переплетаются около миллиона электронных компонентов. Это в десять раз больше, чем их было в одном из первых компьютеров ЭНИАК - 30-тонном монстре, который начал работать в 1946 году. Несколько последних десятилетий инженеры практически ежегодно, грубо говоря, удваивали число электронных узлов в одном микрокристалле. При этом - примите как парадокс или как закономерность - с ростом плотности "упаковки" микроэлементов снижается их стоимость и размеры. К 1990 году инженеры намерены разместить в одном модуле 10 миллионов транзисторов. В результате столь потрясающей эволюции интегральные схемы стали сверхнадежными. Достаточно сказать, что ЭВМ на радиолампах такой же сложности вряд ли смогла бы проработать до первого отказа даже несколько секунд. Из-за предельной близости элементов схемы друг к другу электрические сигналы пробегают от одного элемента схемы к другому по таким коротким путям, что это почти не требует затрат электроэнергии и происходит за минимально возможное время. Отсюда качественные шедевры быстродействия и объема памяти. Современный микропроцессор реализует что-то около миллиона операций в секунду, а такого же размера блок памяти хранит около 64 тысяч единиц информации.
На рекламной фотографии изображены рядом два одинаковых по размеру муравья: один из них наш "лесной друг", другой - миниатюрный блок памяти, "вмещающий" толстую телефонную книгу.
Мода на пресловутые мини-юбки давно канула в прошлое, "мода" на мини-компьютеры буквально захлестнула нашу планету. Сейчас в мире эксплуатируется более двух миллионов мини-компьютеров, и их доля в общем объеме ЭВМ, по прогнозам специалистов, будет и дальше увеличиваться примерно на 35 процентов в год.