Что за рыбка в вашем ухе?
Шрифт:
Создание схемы какой-то словарной области (не говоря уж обо всем языке) с помощью таких элементарных смысловых составляющих представляется очень заманчивым проектом, но он упирается в фундаментальную проблему: по какому критерию производить отбор этих элементарных
Такие квазиматематические вычисления «значения» не решают и еще более фундаментальную проблему: как идентифицировать те единицы, значения которых нужно указать. Чтобы спросить, что значит то или иное слово (а у переводчиков такое спрашивают часто), надо знать само это слово, а это, в свою очередь, требует знания о том, что такое слово вообще. Слово слово,
Ответ должны знать компьютеры, потому что они считают слова. Однако это нам никак не поможет. Компьютеры знают о словах только то, что им сказали, а именно: слово – это последовательность алфавитных символов, ограниченная слева и справа пробелом или одним из следующих символов: –/?!:;, {41} . Компьютерам не нужно знать, что означает слово, для выполнения над ним требуемых операций. А нам нужно! И если мы не знаем значения какого-то слова, то смотрим в словарь, спрашиваем у знакомого или слушаем, как употребляют это слово другие. Но при этом остается масса проблем.
41
К алфавитным последовательностям, включающим дефис (кто-то) или звездочку (торговый знак E*Trade), применяются дополнительные правила, а в некоторых языках есть дополнительные типографские знаки, такие как ?!, но эти и другие особенности языков с буквенной или слоговой письменностью не меняют ни структуры правил, ни основного понятия слова с компьютерной точки зрения.
Конец ознакомительного фрагмента.