Введение в лингвофольклористику: учебное пособие
Шрифт:
В лингвофольклористике значительное место занимают стандартные процедуры, выполняемые вручную любым исследователем, как-то: поиск необходимых изданий и релевантных текстовых сегментов; составление и проверка библиографических описаний; многократное переписывание цитат; всевозможные сортировки и т. д. При условии их хотя бы частичной автоматизации интеллектуальный труд становится продуктивным. Рутинные процедуры доверяются машине, а сэкономленное время тратится на творческую деятельность.
Филологическая мысль и практика видят несколько путей работ, целесообразных с точки зрения использования современных информационных технологий в интересах гуманитарной
система СКАЗКА как инструмент исследования волшебных сказок [Рафаева 2005]; мультимедийные технологии описания фольклорной и хозяйственно-бытовой традиции села [Серов 2005]. В материалах международной научной конференции «Типология фольклорной традиции: актуальные проблемы полевой фольклористики» (Москва, 22–23 ноября 1999 г.) есть специальный раздел «Компьютерная систематизация полевых записей и мультимедийные публикации».
Суть материалов этого раздела выражена в статье о проблемах компьютеризации фольклорных архивов [Мороз 2004]. Автор пишет о том, что большинство фольклорных, диалектологических и этнолингвистических архивов организовано по старинке, что позволяет использовать информацию не более чем на 30 %, поскольку записи в картотеках рассортированы по минимуму признаков; записи хранятся в папках или в аудиокассетах с краткой описью; классификация, сортировка и поиск возможны по одному параметру; доступ лиц, не причастных непосредственно к созданию архива, затруднителен; публикация материалов в значительном объёме затруднена; записи в одном селе дублируются разными экспедициями. Первые попытки применения компьютерной техники ориентируются на те же принципы, что и рукописные архивы. Автор формулирует принципы использования компьютера в создании фольклорных архивов: одновременный перекрёстный поиск по разным параметрам: соединение текстовых, аудио-, фото– и видеоматериалов в одном архиве; широкие возможности распространения (в том числе и через Интернет); создание единой информационной системы, объединяющей несколько архивов.
Информационные технологии можно классифицировать как коллективные и индивидуальные. Коллективные технологии делятся на технологии общего пользования, способные решать неограниченный круг задач, и технологии специализированные, тематические, создаваемые с целью решения определённых задач. К первым относятся технологии, основанные на корпусной лингвистике. Ко вторым можно отнести, например, ресурсы для исследования топонимии. Индивидуальными можно назвать те, которые создаются если не самим пользователем, то при активном его участии и ориентированы на решение определённых исследовательских задач.
Начнём с вопроса, в какой реальной помощи со стороны информатики нуждается гуманитарий-исследователь? Ответ: в наличии электронного корпуса текстов и программном обеспечении, позволяющем быстро и точно представлять пользователю все необходимые
Как используются индивидуальные информационные системы, покажем на примере созданного нами информационного текстового комплекса «Конкорданс русской народной лирики».
Из семитомного свода А.И. Соболевского «Великорусские народные песни» (СПб., 1895–1902) (тома 2–6) были извлечены песенные тексты, записанные в XIX веке в Курской, Архангельской и Олонецкой губерниях. Также учитывались былинные тексты, записанные А.Ф. Гильфердингом от Т.Г. Рябинина. В итоге сформировались четыре корпуса текстов – «Курск», «Архангельск», «Олонец» и «Рябинин».
Тексты подверглись некоторой адаптации: были сняты все примечания и указания на место записи, сборник и год публикации, каждый текст получил паспорт – в ломаных скобках номер тома свода Соболевского / Гильфердинга и номер песни / былины в томе. В результате каждый корпус превратился в единый текст, похожий на гипертекст, под которым понимается некое информационное пространство, позволяющее разрушить формальную оболочку отдельного конкретного текста, в него помещённого, за счёт создания системы связей, служащих объединению этих отдельных текстов в сверхтекстовые единства [Дедова 2003: 106–107]. В нашем случае гипертекст – это корпус текстов, представленный одним файлом в текстовом формате с системой паспортизации.
Далее гипертекст с помощью компьютерной «Программы автоматизированного составления и обработки словников» (авторы – Михаил Викторович и Елена Викторовна Литус из города Славянска-на-Кубани) преобразуется в лексикографические продукты.
Рабочее окно программы состоит из трёх полей: (1) поле словника, (2) поле слияния словоформ в лексему и (3) конкорданс отмеченной словоформы (лексемы). В нижней строке отмечается наличие / отсутствие текстового файла, необходимого для составления словника.
Меню первого поля «Файл» содержит команды следующих операций.
Открыть – открывается анализируемый текстовый файл. В специальной строке внизу указывается имя открытого файла, его адрес и степень готовности словника (в процентах).
(Рис. 1)
Сохранить – словник словоформ (лексем) фиксируется в специальном файле с расширением. slv, который раскрывается только программой NewSlov.
Экспорт – создаётся текстовый файл словника.
Выход – завершение работы программы.
Меню первого поля «Вид» обеспечивает обе основные операции программы – (1) операцию по слиянию словоформ в лексему и (2) предъявление контекста со словоформой.
Меню первого поля «Сервис» содержит следующие команды.
Загрузить словник – открывается текстовый файл словника с расширением. slv.
Создать словник – загруженный текстовый файл «рассыпается» на словоформы. Одинаковые словоформы суммируются. Например,