Империя - II
Шрифт:
Соответствующее вероятностное пространство обозначим через (W_1, S_1, P_1), где W_1 – множество всех перестановок имен в списке Х; S_1 = 2^W 1, P_1 – некоторая вероятностная мера на S_1, относительно которой мы пока не будем делать никаких предположений.
Таким образом, порядок имен в хронологическом списке Х мы рассматриваем как элементарный исход в вероятностной схеме (W_1, S_1, P_1).
Рассмотрим разбиение списка Х на N глав одинакового объема (Мы предполагаем, что длина списка n делится на N.) Число глав N считаем фиксированным и не зависящим от случая. Как и выше, построим по списку Х,
Соответствующее этой схеме вероятностное пространство (W_2, S_2, P_2) состоит из множества элементарных исходов W_2, которое представляет собой множество пар порядковых номеров выбранных элементов в списке : w_2 = i, j, алгебры событий S_2 = 2^W 2 и равномерного распределения:
P_2(w_2) = 1/n^2 для любого w_2EW_2.
Поскольку мера P_2 не зависит от w_1, то итоговое вероятностное пространство (W, S, P) является произведением пространств (W_1, S_1, P_1) и (W_2, S_2, P_2):
W = W_1xW_2; S=2^W; P(w)=P(w_1, w_2)=P_1(w_1)xP_2(w_2).
На вероятностном пространстве (W, S, P) определена случайная величина з:
з(w)=з(w_1, w_2)=з(w_2).
Пусть A – некоторое событие из S. Сформулируем предположение о вероятностной мере P_1 (то есть о вероятностном механизме образования порядка имен в правильном хронологическом списке).
Предположение. Предположим, что случайная величина з не зависит от события A:
Pз=x|A = Pз=x для всех x.
Никаких других условий на меру P_1 мы накладывать не будем.
Сделанное предположение зависит от выбора события A. Если в качестве A выбрать локальное событие (определение локальных событий дано выше), то это предположение вытекает (для правильного хронологического списка) из сформулированного выше следствия гипотезы Н_0:
Pз=x|A, з»е = Pз=x|з»е,
где е – радиус затухания зависимости в списке Х.
Здесь мы без ограничения общности будем считать, что е=0.
Общий случай сводится к этому простой модификацией вероятностой схемы (W_2, S_2, P_2).
Глава 3. Матрицы связей для хронологических списков имен
1. Как узнать – какие именно части летописи являются дубликатами?
В предыдущей главе с помощью гистограмм частот разнесений связанных имен проверялась гипотеза об отсутствии дубликатов в данном хронологическом списке имен.
В тех случаях, когда присутствие дубликатов было обнаружено, определялись типичные сдвиги между дубликатами в списке. Однако метод гистограмм частот связанных имен не дает прямого ответа на следующий основной вопрос:
Какие именно части списка
Напомним, что в соответствии с понятием слоистой хроники, два отрезка хронологического списка называются дубликатами, если они содержат соответственно дублирующие друг друга слои.
В данной главе мы опишем метод, позволяющий отвечать на этот вопрос. Результатом его применения к историческому хронологическому списку будет являться так называемая «матрица связей» (фрагментов) данного списка. Это – квадратная таблица, показывающая в какой мере те или иные отрезка списка имен являются дубликатами друг друга («связаны» между собой).
Мы уже вкратце описали идею метода, пользуясь модельной задачей о колоде карт (см. главу 1). Проведем теперь эти рассуждения уже не для модельной задачи, а для реальных хронологических списков.
Пусть имеется список имен Х, который может содержать ошибки, пропуски и (или) дубликаты.
Неизвестный нам истинный список имен, лежащий в основе реального списка Х, обозначим через Y. Таким образом, Y – воображаемый список имен, содержащий полные неискаженные данные (скажем, об именах правителей данного государства) для длительного исторического промежутка времени I_Y.
Реальный список имен Х, который находится в нашем распоряжении является искажением, «зашумлением» списка Y с возможной потерей доли информации.
Предположим, что промежуток времени I_Y был описан многими летописцами – очевидцами или современниками происходящих событий.
Каждый из них составлял свою короткую летопись Z_i по современным ему событиям. Поскольку мы изучаем сейчас не весь текст летописи, а только имена, извлеченные из нее, то можем считать (для удобства), что каждый летописец составлял некий короткий хронологический список имен, который мы также обозначим через Z_i.
Если промежуток времени I_Y описывался K летописцами, то в основе наших знаний о события, происходивших на этом промежутке, лежит K коротких летописей Z_1, Z_2,…, Z_K (включая и утраченные летописи). Множество этих летописей (коротких хронологических списков имен) мы обозначим через Z_i.
Множество Z_i образует некоторое покрытие списка Y.
Это покрытие мы будем считать:
а) Достаточно плотным, то есть предположим, что каждый отдельный год из промежутка I_Y описывался не одним, а сразу несколькими летописцами независимо друг от друга.
б) Состоящим из уже искаженных – как-то разреженных и местами ошибочных коротких хронологических списков. В самом деле, даже в своем исходном виде каждая из летописей Z_1, Z_2,…, Z_K упоминала, возможно, не все имена правителей, не всех исторических деятелей, участвующих в событиях. Кроме того, при последующем переписывании и компиляциях появлялись ошибки, пропуски, произвольные вставки и т.п. Для простоты рассуждений мы будем считать все эти ошибки присущими летописям Z_i с самого начала.