Большая Советская Энциклопедия (МА)
Шрифт:
или
где r — число интервалов группировки, ak — их середины (в случае таблицы 1а — 13,07; 13,12; 13,17; 13,22 и т. д.). Если материал сгруппирован по слишком крупным интервалам, то такой подсчёт даёт слишком грубые результаты. Иногда в таких случаях полезно прибегать к специальным поправкам на группировку. Однако эти поправки имеет смысл вводить лишь при условии выполнения определённых вероятностных предположений.
О совместных распределениях двух и большего числа признаков см. Корреляция , Корреляционный
Связь статистических распределений с вероятностными. Оценка параметров.
Проверка вероятностных гипотез. Выше были изложены лишь некоторые избранные простейшие приёмы статистического описания, представляющего собой довольно обширную дисциплину с хорошо разработанной системой понятий и техникой вычислений. Приёмы статистического описания интересны, однако не сами по себе, а в качестве средства для получения из статистического материала выводов о закономерностях, которым подчиняются изучаемые явления, и о причинах, приводящих в каждом отд. случае к тем или иным наблюдённым статистическим распределениям.
Например, данные, приведённые в таблице 2а, естественно связать с такой теоретической схемой. Заболевание гриппом каждого отдельного работника универмага следует считать случайным событием, так как общие условия работы и жизни обследованных работников универмага могут определять не сам факт заболевания такого-то и такого-то работника, а лишь некоторую вероятность заболевания. Вероятности заболевания для вдыхавших сыворотку (p1 ) и для не вдыхавших (p ), судя по статистическим данным, различны: эти данные дают основания предполагать, что p1 существенно меньше p . Перед М. с. возникает задача: по наблюдённым частотам h1 = 4/501 » 0,008 и h = 150/1825 » 0,082 оценить вероятности p1 и p0 и проверить, достаточен ли статистический материал для того, чтобы считать установленным, что p1 < p (то есть что вдыхание сыворотки действительно уменьшает вероятность заболевания). Утвердительный ответ на поставленный вопрос в случае данных таблицы 2а достаточно убедителен и без тонких средств М. с. Но в более сомнительных случаях необходимо прибегать к разработанным М. с. специальным критериям.
Данные первого столбца таблицы 1а собраны с целью установления точности изготовления деталей, расчётный диаметр которых равен 13,40 мм, при нормальном ходе производства. Простейшим допущением, которое может быть в этом случае обосновано некоторыми теоретическими соображениями, является предположение, что диаметры отдельных деталей можно рассматривать как случайные величины X , подчинённые нормальному распределению вероятностей
P{X <x } =
Если это допущение верно, то параметры a и s2 — среднее и дисперсию вероятностного распределения — можно с достаточной точностью оценить по соответствующим характеристикам статистического распределения (так как число наблюдений n = 200 достаточно велико). В качестве оценки для теоретической дисперсии s2 предпочитают не статистическую дисперсию D2 = S2/ n , а несмещенную оценку
s2 = S2 / (n– 1).
Для теоретического среднего квадратичного отклонения не существует общего (пригодного при любом распределении вероятностей) выражения несмещенной оценки. В качестве оценки (вообще говоря, смещенной) для s чаще всего употребляют s .
s2a = s2/n ~ s2 / n ,
где знак ~ обозначает приближённое равенство при больших n . Таким образом, уславливаясь прибавлять к оценкам со знаком ± их среднее квадратичное отклонение, имеем при больших n в предположении нормального распределения (1):
Для данных первого столбца таблицы 1а формулы (2) дают
a = 13,416 ± 0,008,
s = 0,110 ± 0,006.
Объём выборки n = 200 достаточен для законности пользования этими формулами теории больших выборок.
Дальнейшие сведения об оценке параметров теоретических распределений вероятностей см. в статьях Статистические оценки , Доверительные границы . О способах, при помощи которых по данным первого столбца таблицы 1а можно было бы проверить исходные гипотезы нормальности распределения и независимости наблюдений, см. в статьях Распределения , Непараметрические методы , Статистическая проверка гипотез .
При рассмотрении данных следующих столбцов таблицы 1а, каждый из которых составлен на основе 10 измерений, употребление формул теории больших выборок, установленных лишь в качестве предельных формул при n ® yen, может служить только для первой ориентировки. В качестве приближённых оценок параметров a и s по-прежнему употребляются величины
Все основанные на теории вероятностей правила статистической оценки параметров и проверки гипотез действуют лишь с определённым значимости уровнем w < 1, то есть могут приводить к ошибочным результатам с вероятностью a = 1 — w. Например, если в предположении нормального распределения и известной теоретической дисперсии s2 производить оценку a по
Если твой босс... монстр!
Любовные романы:
любовно-фантастические романы
рейтинг книги
Кодекс Охотника. Книга XIV
14. Кодекс Охотника
Фантастика:
боевая фантастика
попаданцы
аниме
рейтинг книги
Взлет и падение третьего рейха (Том 1)
Научно-образовательная:
история
рейтинг книги
