Чтение онлайн

на главную - закладки

Жанры

Итоги № 36 (2013)

Итоги Итоги Журнал

Шрифт:

Журналисту наш герой кажется родной душой — большая часть его профессиональной жизни связана с печатным словом. Программа FineReader, распознающая тексты на 189 языках, электронные словари Lingvo, помогающие переводить и изучать 20 иностранных языков, — все это создано командой ABBYY. Основатель компании Давид Ян рассказал «Итогам», откуда в нем такая тяга к лингвистике и чего стоит построить бизнес на языковом фундаменте.

— Давид, ваше увлечение лингвистикой из детства? Вы ведь росли в интернациональной семье.

— Действительно, моя мама — армянка, папа — китаец. Но важнее то, что оба они ученые, и уже с третьего класса я мечтал стать физиком, как они. Участвовал в олимпиадах

и после физматшколы поступил в МФТИ. Мой научный шеф — Всеволод Феликсович Гантмахер, ныне академик РАН, работал в Институте физики твердого тела АН СССР в Черноголовке. Под его руководством я занимался исследованиями в области физики твердого тела. Но при этом хотелось ходить на дискотеки и купить джинсы и кроссовки. У родителей денег на это я не просил, вот и возникла идея заработать. А идея такая. Написать в июле программу — словарь, англо-русский и русско-английский, в августе продать 100 экземпляров программы по 100 рублей каждый, заработать кучу денег и в сентябре вернуться к занятиям на пятом курсе.

— Тогда уже можно было продавать программы?

— Это был 1989 год. Шла перестройка, и организации уже что-то могли приобретать, правда, по безналу. В начале июля мне удалось найти программиста — Саша Москалев работал в соседнем институте в Черноголовке. Он подумал и сказал: я напишу программу, а ты будешь ее продавать. И еще я взял на себя задачу обеспечить словарную базу. Я сразу описал некий язык, с помощью которого нужно разметить текст словаря, чтобы программа могла автоматически вычленить заглавное слово, синонимы, антонимы, пометы и т. д. Впоследствии это получило название DSL (Dictionary Specification Language — язык спецификации словаря). Сейчас на нем ведется много различной работы, а тогда мы просто набросали страничку на бумаге, переписали от руки второй экземпляр и разошлись — каждый со своим листочком.

Нашел деньги — три тысячи рублей, по тому времени большие, годовая зарплата моего отца, профессора, и кооператив, который согласился перевести содержимое словаря с бумажного носителя на электронный, создать электронную словарную базу и предоставить нам права на публикацию.

Кооперативу в наследство от советских времен достались машинный зал с бобинами, на которых сохранялись данные, и операторы ввода — их было человек 30. Вся эта структура раньше входила в состав какого-то НИИ. Наборщики текстов работали вслепую — у них была только клавиатура. Но чтобы помнить, где они остановились в ходе работы, у каждого был мониторчик размером в один символ — с помощью курсора можно было прокрутить в этом окошке текст, вспомнить, в каком месте остановился, и продолжить набор.

Правда, они сами недооценили объем работ. Обязались все сделать до 1 сентября, а в реальности сдали работу только в апреле. У словаря ведь очень сложная структура. В отдельной инструкции было расписано, какими спецсимволами нужно помечать, скажем, авиационную промышленность. Более того, у клавиатур не было верхнего и нижнего регистров. Каждый раз, когда встречалась заглавная буква, она тоже помечалась спецзнаком. Это была эпохальная работа. Но в нашем с ними договоре была заложена неустойка на количество ошибок. Но не была оговорена максимальная сумма этой неустойки. И выяснилось, что ошибок у них столько, что вместо трех тысяч, которые мы должны были заплатить им, получилась неустойка на четыре тысячи. Руководитель кооператива умолял: люди работали девять месяцев, нужно им что-то заплатить. Я ему отвечал в том смысле, а что же делать нам. Сидели, препирались. А дело в том, что еще в августе прошлого года я уже продал, как собирался, этот словарь. Правда, не 100, а три экземпляра. Но не по 100, а по 700 рублей. И у нас уже был договор продажи на 2100 рублей. А продукта не было. Заказчик спрашивал: где словарь? Что делать? Мы с Сашей садимся и начинаем править базу сами. Вообще-то днем мне надо было учиться, а ему работать. Поэтому правили по ночам. И вот доходим до буквы «К», а ее нет нигде.

Наборщики о ней то ли забыли, то ли схитрили, не знаю. А ведь в словаре это огромный объем! Что остается делать? Сели и начали вводить сами. Это было что-то ужасное! В конце концов загрузили в программу, и Lingvo начала переводить! Вводишь русское слово, она выдает английское, вводишь английское, получаешь в ответ русское. Счастье мы испытали бесконечное!

— Заказчик тоже был счастлив?

— Мы запаковали дискеты и отправили к заказчику гонца. Это был Арам Пахчанян, мой одноклассник. У меня не было денег на билет до Еревана, а Арам как раз летел домой. А связи — никакой, мобильных телефонов еще не было. Только потом мы узнали, что он там пережил: приходит к заказчику, устанавливает систему, запускает программу, она спрашивает у него пароль, а мы в суматохе этот пароль сказать забыли. Вот сидит он, перед ним черный экран DOS и строка «введите пароль», а вокруг приемная комиссия заказчика, между прочим, большого серьезного НИИ в Ереване.

— И он выкрутился?

— Свершилось чудо! Мне кажется, физтехи могут все. Он ввел VELAKSOМ, и программа приняла этот пароль! Как он догадался, что Москалев задал в качестве пароля свою фамилию, написанную наоборот?! Но все получилось. НИИ перечислил деньги, даже не стал брать неустойку за девятимесячную задержку.

С задержками, проблемами программа Lingvo начала продаваться. Не за месяц, правда, а за год заработали 10 тысяч рублей. А к окончанию первого года обнаружили, что на рынке существует около 50 тысяч нелегальных копий нашей программы.

— Как это выяснили?

— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал программу-переводчик — словарь Lingvo за 700 рублей. Вначале меня слушали, а к концу первого бизнес-года в каждом третьем месте, куда мы звонили, отвечали, что у нас уже есть Lingvo и не надо нам говорить, что вы ее разработали. Украли, наверное, и пытаетесь продать. Нам, конечно, льстило, что программой уже пользуются… И еще мы поняли, что словарь словарем, а источник того, что надо переводить, — на бумаге. И человеку без знания английского языка достаточно сложно набрать на клавиатуре текст для перевода. Вот было бы здорово сделать всеобъемлющий продукт — от бумажного листа на одном языке до бумажного листа на другом языке! Скажем, вставляешь в сканер книжку на английском языке, нажимаешь несколько кнопок на компьютере, и из принтера выходит книга, распечатанная на русском. Это была мечта. Но мы попытались ее реализовать.

— Каким образом?

— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.

Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если где-то в середине встретится что-то напечатанное другим шрифтом, программа опять этого не поймет, вновь придется обучать. А наша будет понимать все шрифты сразу. И мы решили такую программу сделать. Начали проект в 1992 году, а в 1993-м выпустили первый продукт. И в первый день продали 40 коробок с ПО FineReader, а за первый месяц — 800! Это было просто немыслимо по тем временам.

Поделиться:
Популярные книги

Внешники такие разные

Кожевников Павел
Вселенная S-T-I-K-S
Фантастика:
боевая фантастика
попаданцы
5.00
рейтинг книги
Внешники такие разные

Измена. Тайный наследник

Лаврова Алиса
1. Тайный наследник
Фантастика:
фэнтези
5.00
рейтинг книги
Измена. Тайный наследник

По воле короля

Леви Кира
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
По воле короля

Истребители. Трилогия

Поселягин Владимир Геннадьевич
Фантастика:
альтернативная история
7.30
рейтинг книги
Истребители. Трилогия

Бракованная невеста. Академия драконов

Милославская Анастасия
Фантастика:
фэнтези
сказочная фантастика
5.00
рейтинг книги
Бракованная невеста. Академия драконов

Страж Кодекса. Книга IX

Романов Илья Николаевич
9. КО: Страж Кодекса
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Страж Кодекса. Книга IX

Завод 2: назад в СССР

Гуров Валерий Александрович
2. Завод
Фантастика:
попаданцы
альтернативная история
фэнтези
5.00
рейтинг книги
Завод 2: назад в СССР

Страж Кодекса. Книга IV

Романов Илья Николаевич
4. КО: Страж Кодекса
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Страж Кодекса. Книга IV

Вперед в прошлое!

Ратманов Денис
1. Вперед в прошлое
Фантастика:
попаданцы
5.00
рейтинг книги
Вперед в прошлое!

Умеющая искать

Русакова Татьяна
1. Избранница эльты
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Умеющая искать

Отверженный IX: Большой проигрыш

Опсокополос Алексис
9. Отверженный
Фантастика:
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Отверженный IX: Большой проигрыш

Третий

INDIGO
Фантастика:
космическая фантастика
попаданцы
5.00
рейтинг книги
Третий

Лучший из худших-2

Дашко Дмитрий Николаевич
2. Лучший из худших
Фантастика:
фэнтези
5.00
рейтинг книги
Лучший из худших-2

Метатель

Тарасов Ник
1. Метатель
Фантастика:
боевая фантастика
попаданцы
рпг
фэнтези
фантастика: прочее
постапокалипсис
5.00
рейтинг книги
Метатель