Большая Советская Энциклопедия (СТ)
Шрифт:
Ю. В. Прохоров.
Статистические сборники
Статисти'ческие сбо'рники, справочные издания, содержащие цифровую информацию о развитии народного хозяйства, его отраслей и подразделений. Различаются по назначению (ежегодники, справочники, юбилейные издания, бюллетени и т.п.), объёму (полные и краткие), охвату данных (общеэкономические и отраслевые, по всей стране или по республикам, районам), ведомственной принадлежности, форме (книги и журналы) и периодичности издания (десятилетние, годовые, квартальные, месячные, разовые и др.). Независимо от назначения С. с. охватывают характеристику (состояние и развитие) территории и населения, науки и научно-технического прогресса, промышленности и её отраслей, сельского хозяйства, строительства, транспорта и связи, торговли, финансов и кредита, внешних связей, образования и культуры, здравоохранения, труда и быта, материального благосостояния и развития народного хозяйства в целом. Разработка схем и методологии С. с. — неотъемлемая часть статистики как науки, а их составление и публикация — важный раздел в деятельности (в странах социализма — плановой) статистических организаций (в СССР — ЦСУ СССР и его органов в республиках и на местах). В России систематические издания С. с. осуществлялись с 19 в. («Статистический Временник Российской империи», 1866—94, и «Ежегодник России», 1905—18). В 1924 в СССР вышел первый С. с. по народному хозяйству. В 1925 он был дополнен новым материалом и издан под названием «Народное хозяйство Союза ССР в цифрах». Это был первый опыт отражения в статистических публикациях системы показателей развития народного хозяйства СССР. С 1956 ежегодно (кроме 1958) выпускается С. с. «Народное хозяйство СССР», а с 1957 — С. с. о развитии народного хозяйства отдельно по
В. М. Симчера.
Статистический анализ многомерный
Статисти'ческий ана'лиз многоме'рный, в широком смысле — раздел математической статистики , объединяющий методы изучения статистических данных, относящихся к объектам, которые характеризуются несколькими качественными или количественными признаками. Наиболее разработана часть С. а. м., основанная на допущении, что результаты отдельных наблюдений независимы и подчинены одному и тому же многомерному нормальному распределению (обычно именно к этой части применяют термин С. а. м. в узком смысле). Иными словами, результат Xj наблюдения с номером j можно представить вектором
Xj = (Xj1 , Xj2 ,..., Xjs ),
где случайные величины Xjk имеют математическое ожидание mk , дисперсию s2k , а коэффициент корреляции между Xjk и Xjl равен rkl . Вектор математических ожиданий m = (m1 ,..., ms ) и ковариационная матрица S с элементами sk sl rkl , k, l = 1,..., s , являются основными параметрами, полностью определяющими распределение векторов X1 ,..., Xn — результатов п независимых наблюдений. Выбор многомерного нормального распределения в качестве основной математической модели С. а. м. отчасти может быть оправдан следующими соображениями: с одной стороны, эта модель приемлема для большого числа приложений, с другой — только в рамках этой модели удаётся вычислить точные распределения выборочных характеристик. Выборочное среднее
[где
Ряд задач С. а. м. более или менее аналогичен соответствующим одномерным задачам (например, задача проверки гипотез о равенстве средних значений в двух независимых выборках). Другого типа задачи связаны с проверкой гипотез о независимости тех или иных групп компонент векторов Xj, проверкой таких специальных гипотез, как гипотеза сферической симметрии распределения Xj и т.д. Необходимость разобраться в сложных взаимосвязях между компонентами случайных векторов Xj ставит новые проблемы. В целях сокращения числа рассматриваемых случайных признаков (уменьшения размерности) или сведения их к независимым случайным величинам применяются метод главных компонент и метод канонических корреляций. В теории главных компонент осуществляется переход от векторов Xj к векторам Yj = (Yj1 ,..., Yjr ). При этом, например, Yj1 выделяется максимальной дисперсией среди всех нормированных линейных комбинаций компонент X1 ; Yj2 имеет наибольшую дисперсию среди всех линейных функций компонент X1 , не коррелированных с Yj1 и т.д. В теории канонических корреляций каждое из двух множеств случайных величин (компонент Xj ) линейно преобразуется в новое множество т. н. канонических величин так, что внутри каждого множества коэффициенты корреляции между величинами равны 0, первые координаты каждого множества имеют максимальную корреляцию, вторые координаты имеют наибольшую корреляцию из оставшихся координат и т.д. (упорядоченные т. о. корреляции называются каноническими). Последний метод указывает максимальную корреляцию линейных функций от двух групп случайных компонент вектора наблюдения. Выводы методов главных компонент и канонических корреляций помогают понять структуру изучаемой многомерной совокупности. Сходным целям служит и факторный анализ , в схеме которого предполагается, что компоненты случайных векторов Xj явлются линейными функциями от некоторых ненаблюдаемых факторов, подлежащих изучению. В рамках С. а. м. рассматривается и проблема дифференциации двух или большего числа совокупностей по результатам наблюдений. Одна часть проблемы заключается в том, чтобы на основе анализа выборок из нескольких совокупностей отнести новый элемент к одной из них (дискриминация), другая — в том, чтобы внутри совокупности разделить элементы на группы, в определённом смысле максимально отличающиеся друг от друга.
Лит.: Андерсон Т., Введение в многомерный статистический анализ, пер. с англ., М., 1963; Kendall М. G., Stuart А., The advanced theory of statistics, v. 3, L., 1966; Dempster A. P., Elements of continuons multivariate analysis, L., 1969.
Статистический анализ случайных процессов
Статисти'ческий ана'лиз случа'йных проце'ссов, раздел математической статистики, посвященный методам обработки и использования статистических данных, касающихся случайных процессов (т. е. функций X (t ) времени t , определяемых с помощью некоторого испытания и при разных испытаниях могущих в зависимости от случая принимать различные значения). Значение x (t ) случайного процесса X (t ), получаемое в ходе одного испытания, называется реализацией (иначе — наблюдённым значением, выборочным значением или траекторией) процесса X (t ); статистические данные о X (t ), используемые при статистическом анализе этого процесса, обычно представляютсобой сведения о значениях одной или нескольких реализаций x (t ) в течение определенного промежутка времени или же о значениях каких-либо величин, связанных с процессом X (t ) (например, о наблюденных значениях процесса Y (t ), являющегося суммой X (t ) и некоторого «шума» N (t ), созданного внешними помехами и ошибками измерения значений x (t )). Весьма важный с точки зрения приложений класс задач С. а. с. п. представляют собой задачи обнаружения сигнала на фоне шума, играющие большую роль при радиолокации. С математической точки зрения эти задачи сводятся к статистической проверке гипотез : здесь по наблюденным значениям некоторой функции требуется заключить, справедлива ли гипотеза о том, что функция эта является реализацией суммы шума N (t ) и интересующего наблюдателя сигнала X (t ), или же справедлива гипотеза о том, что она является реализацией одного лишь шума N (t ). В случаях, когда форма сигнала X (t ) не является полностью известной, задачи обнаружения часто включают в себя и задачи статистической оценки неизвестных параметров сигнала; так, например, в задачах радиолокации очень важна задача об оценке времени появления сигнала, определяющего расстояние до объекта, породившего этот сигнал. Задачи статистической оценки параметров возникают и тогда, когда по данным наблюдений за значениями процесса X (t ) в течение определённого промежутка времени требуется оценить значения каких-то параметров распределения вероятностей случайных величин X (t ) или же, например, оценить значение в фиксированный момент времени t = t1 самого процесса Х (t ) (в предположении, что t1 лежит за пределами интервала наблюдений за этим процессом) или значение y (t1 ) какого-либо вспомогательного процесса Y (t ), статистически связанного с Х (t ) (см. Случайных процессов прогнозирование ). Наконец, ряд задач С. а. с. п. Относится к числу задач на непараметрические методы статистики; так обстоит дело, в частности, когда по наблюдениям за течением процесса X (t ) требуется оценить некоторые функции, характеризующие распределения вероятностей значений этого процесса (например, плотность вероятности величины Х (t ), или корреляционную функцию Ex (t ) X (s ) процесса Х (t ), или, в случае стационарного случайного процессаX (t ), его спектральную плотность f (l )
При решение задач С. а. с. п. всегда требуется принять те или иные специальные предположения о статистической структуре процесса X (t ), т. е. как-то ограничить класс рассматриваемых случайных процессов. Очень ценным с точки зрения С. а. с. п. является допущение о том, что рассматриваемый процесс X (t ) является стационарным случайным процессом; при этом допущении, зная значения единственной реализации x (t ) в течение промежутка времени 0 lbt lb T , можно уже получить целый ряд статистических выводов о вероятностных характеристиках процесса X (t ). В частности, среднеарифметическое значение
в случае стационарного случайного процесса X (t ) при весьма широких условиях является состоятельной оценкой математического ожидания Ex (t ) = m (т. е.
где t > 0, при широких условиях является состоятельной оценкой корреляционной функции B (t)= Ex (t ) X (t + t).
Однако Фурье преобразование функции
При исследовании статистических свойств оценок вероятностных характеристик стационарных случайных процессов очень полезными оказываются дополнительные допущения о природе X (t ) (например, допущение о том, что все конечномерные распределения значений процесса X (t ) являются нормальными распределениями вероятностей). Большое развитие получили также исследования по С. а. с. п., в которых предполагается, что изучаемый процесс X (t ) является марковским процессом того или иного типа, или компонентой многомерного марковского процесса, или компонентой многомерного процесса, удовлетворяющего определённой системе стохастических дифференциальных уравнений.