Методы статистического анализа исторических текстов (часть 2)
Шрифт:
Эта на первый взгляд простая идея, сформулированная А.Н.Ширяевым и А.Т.Фоменко, оказалась полезной при анализе конкретных исторических текстов. Более того, оказалось, что результаты, полученные на основе применения этой идеи и статистического исследования Б.С.Дарховского, Б.Е.Бродского и Г.В.Носовского, применительно к конкретным историческим текстам, хорошо согласуются с независимыми результатами, полученными применением совсем других методов, тоже статистического характера.
В качестве численной характеристики исследуемого текста была взята функция объема, введенная выше. Напомним ее определение. Предположим, что исторический текст X разбит на "главы" X(t),
Излагаемый ниже метод разбиения больших исторических текстов на однородные и неоднородные куски применим не только к графикам объема текстов, но и к другим численным характеристикам. Для упрощения изложения мы будем говорить здесь лишь о функциях объемов.
Выше мы говорили об однородных кусках исторических текстов. Однако в действительности, мы разобьем тексты на т.н. стационарные куски, являющиеся не только однородными, но и такими, что внутри них "параметры процесса" практически не меняются.
2. РАЗЛАДКИ В РУССКИХ ЛЕТОПИСЯХ.
Начнем с анализа русских летописей, собранных в Полном Собрании русских летописей (Москва, изд-во Наука). При этом из каждой летописи были выделены те куски, внутри которых имеется четкое разбиение на годы, что дало возможность вычислить объемы погодных фрагментов. Дело в том, что иногда в летописях имеются фрагменты, посвященные описанию длительных периодов и не имеющие детального разбиения по годам. Такие куски летописи не анализировались, так как отсутствие временной шкалы не позволяет вычислить функцию объема. Мы обработали функции объемов, вычисленные А.Т.Фоменко для следующих исторических текстов:
1) Двинской летописец (краткая редакция): фрагмент, описывающий события от 1390 до 1717 годов н.э.
2) Двинской летописец (пространная редакция): фрагмент, описывающий события от 1340 до 1751 годов н.э.
3) Повесть временных лет: фрагмент, описывающая события якобы от 850 до 1430 годов н.э.
4) Никифоровская летопись: фрагмент, описывающий события якобы от 850 до 1430 годов н.э.
5) Супрасльская летопись: фрагмент, описывающий события якобы от 850 до 1450 годов н.э.
6) Волынская летопись: фрагмент, описывающий события якобы от 860 до 1555 годов н.э.
7) Холмогорская летопись: фрагмент, описывающий события якобы от 850 до 1850 годов н.э.
8) Летописец князя Владимира Киевского: фрагмент, описывающий события якобы от 970 до 1237 годов н.э.
9) Летописец Рачинского: фрагмент, описывающий события от 1401 до 1548 годов н.э.
10) Евреиновская летопись: фрагмент, описывающий события от 1401 до 1547 годов н.э.
11) Академическая летопись: фрагмент, описывающий события от 1339 до 1446 годов н.э.
Функции объемов этих летописей приведены в Приложении 4.1.
На каждом рисунке указаны обнаруженные зоны однородности, а также выделены те куски, которые содержат мало данных, в которых статистический анализ не дает надежных результатов. ОТЧЕТЛИВО ВИДНЫ МОМЕНТЫ РАЗЛАДКИ. Каждый такой момент, то есть смена режима, определяется, конечно, приблизительно. На рисунках пунктиром указаны границы той зоны, внутри которой, с указанной на рисунках вероятностью, находится момент разладки, момент смены режима.
Приведем здесь также некоторые следствия из полученных результатов. Наиболее интересное - это наглядное обнаружение зависимостей между различными текстами. Напомним, что тексты называются зависимыми, если они описывают одни и те же события в истории одного региона на одном и том же интервале времени. В главе 3 настоящей книги была описана статистическая методика выявления зависимых и независимых текстов. В частности, применительно к русским летописям, была обнаружена зависимость, например, между следующими текстами:
Двинской летописец (краткая редакция) и Двинской летописец (пространная редакция).
Зависимость этих летописей абсолоютно естественна, так как эти два текста просто являются разными вариантами одной и той же хроники краткая и более полная версия. Чрезвычайно интересно, что факт зависимости проявляется и в результате применения метода выявления однородных и неоднородных кусков, а также моментов разладки. Естественно ожидать, что однородные куски внутри зависимых текстов должны быть "примерно одинаковыми". См. условное изображение на рис.Доп-2.7. И действительно, эта гипотеза подтверждается при анализе конкретных исторических текстов.
На рис.Доп-2.3 отчетливо видна корреляция между однородными кусками внутри краткой и полной редакций Двинского летописца.
В Главе 3 была обнаружена зависимость между Никифоровской и Супрасльской летописями. Эта зависимость проявляется и в результатах, полученных методом, излагаемым здесь. В самом деле, на рис.Доп-2.5 отчетливо видна корреляция между однородными кусками внутри Никифоровской и Супрасльской хроник. Интересно сравнить эти результаты со структурой знаменитой "Повести временных лет". Дело в том, что эта хроника также в значительной мере зависима с Никифоровской и Супрасльской летописями. Однако, "Повесть временных лет" существенно подробнее две другие хроники и в то же время она существенно короче. Поэтому на рис.Доп-2.4 эта зависимость не проявляется, если не считать примерно одновременного "начала лакун". Поскольку обсуждаемый здесь метод обрабатывает амплитуды графиков объема, то здесь существенную роль играет разница между богатыми и бедными летописями. В данном примере "Повесть временных лет" - богатая летопись, а Никифоровская и Супрасльская - бедные летописи. Амплитудные корреляции между зависимыми бедными и богатыми текстами обсуждаются в работах С.Т.Рачева и А.Т.Фоменко. См. Главу 3.
Таким образом, при сравнении летописей приблизительно одного уровня подробности (изложения) полученные здесь результаты согласуются с результатами, полученными ранее на основе совсем других идей.
Кроме перечисленных выше русских летописей, были обработаны также следующие хроники из Полного собрания русских летописей.
АКАДЕМИЧЕСКАЯ ЛЕТОПИСЬ. Оказалось, что здесь - мало данных для уверенного применения метода обнаружения разладки. Длительность погодного интервала примерно 100 лет с лакуной около 40 лет.