Чтение онлайн

на главную - закладки

Жанры

Думай медленно... решай быстро
Шрифт:

Понимание регрессии к среднему

Независимо от того, не замечают ли его или неправильно объясняют, феномен регрессии чужд человеческому разуму. Регрессию впервые опознали и поняли на двести лет позже, чем теорию гравитации и дифференциальное исчисление. Более того, для объяснения регрессии потребовался один из лучших британских умов XIX века.

Впервые это явление описал сэр Фрэнсис Гальтон, троюродный брат Чарльза Дарвина, обладавший поистине энциклопедическими знаниями. В статье под названием «Регрессия к среднему при наследовании»,

опубликованной в 1886 году, он сообщил об измерениях нескольких последовательных поколений семян и о сравнении роста детей с ростом их родителей. О семенах он пишет так:

«Исследования дали интересный результат, и на их основании 9 февраля 1877 года я прочитал лекцию в Королевской ассоциации. Эксперименты показали, что потомство не походило на родителей размером, но всегда оказывалось более заурядным, то есть меньше крупных родителей или больше мелких… Эксперименты показали также, что в среднем регрессия потомства прямо пропорциональна отклонению родителей от среднего».

Гальтон, очевидно, ожидал, что ученая аудитория в Королевской ассоциации, старейшей независимой исследовательской организации мира, так же удивится его «интересным результатам», как и он сам. Но самое интересное состоит в том, что его удивила обычная статистическая закономерность. Регрессия распространена повсеместно, но мы её не узнаём. Она прячется на виду. За несколько лет, с помощью выдающихся статистиков того времени, Гальтон проделал путь от открытия наследственной регрессии размеров до более широкого понимания того, что регрессия неизбежно возникает при неполной корреляции между двумя величинами.

Среди препятствий, которые пришлось преодолеть исследователю, оказалась и проблема измерения регрессии между величинами, выражающимися в разных единицах: например, весом и умением играть на пианино. Их измеряют, беря в качестве эталона для сравнения все население. Представьте, что у 100 детей из всех классов начальной школы измерили вес и умение играть и расположили результаты по порядку, от максимальной до минимальной величины каждого показателя. Если Джейн на третьем месте по музыке и на двадцать седьмом по весу, можно сказать, что игра на пианино у нее лучше, чем рост. Давайте для простоты сделаем несколько допущений.

В любом возрасте:

• Успехи в игре на пианино зависят только от количества часов занятий в неделю.

• Вес зависит исключительно от количества потребляемого мороженого.

• Поедание мороженого и количество часов занятий музыкой в неделю – независимые величины.

Теперь мы можем написать некоторые уравнения с использованием позиций в списке (или стандартных оценок, как их называют статистики):

вес = возраст + потребление мороженого

игра на пианино = возраст + количество часов занятий в неделю

Очевидно, что при попытках предсказать уровень игры на пианино по весу или наоборот, будет появляться регрессия к среднему. Если о Томе известно лишь то, что он по весу двенадцатый (намного выше среднего), можно сделать статистический вывод, что Том, вероятно, старше среднего и, возможно, потребляет больше мороженого, чем другие. Если о Барбаре известно лишь то, что она восемьдесят пятая по пианино (намного ниже среднего по группе), можно сделать вывод, что Барбара, скорее всего, еще маленькая и, наверное,

занимается меньше других.

Коэффициент корреляции между двумя величинами, варьирующийся от 0 до 1, – это мера относительного веса факторов, влияющих на обе из них. Например, у всех нас половина генов – общая с каждым из родителей, и у черт, на которые внешние факторы влияют мало (например, у роста), корреляция между показателями родителя и ребенка близка к 0,5. Чтобы оценить значение меры корреляции, приведу несколько примеров коэффициентов:

• Корреляция между размерами объектов, точно измеренных в метрических или в имперских единицах, составляет 1. Все определяющие факторы влияют на оба измерения.

• Корреляция между весом и ростом, сообщенными респондентами, для взрослых американских мужчин составляет 0,41. Если включить в группу женщин и детей, то корреляция будет намного выше, поскольку пол и возраст индивида влияют на их оценку своего роста и веса, что увеличивает относительные значения общих факторов.

• Корреляция между школьными тестами на определение академических способностей и средним баллом в колледже равна примерно 0,60. Однако корреляция между тестами на проверку способностей и успехами в магистратуре намного ниже – в основном потому, что уровень способностей в этой группе не слишком различается. Если способности у всех примерно одинаковы, то разница в этом параметре вряд ли сильно повлияет на меру успеха.

• Корреляция между доходом и уровнем образования в США составляет примерно 0,40.

• Корреляция между доходом семьи и последними четырьмя цифрами номера их телефона равна 0.

Фрэнсису Гальтону потребовалось несколько лет, чтобы понять, что корреляция и регрессия – это не две разные концепции, а две точки зрения на одну. Общее правило довольно простое, но у него удивительные следствия: в случаях, когда корреляция не идеальна, наблюдается регрессия к среднему. Чтобы проиллюстрировать открытие Гальтона, возьмем предположение, которое многие находят довольно любопытным:

Умные женщины часто выходят замуж за менее умных мужчин.

Если на вечеринке попросить ваших приятелей найти объяснение этому факту, то интересный разговор вам обеспечен. Даже знакомые со статистикой люди проинтерпретируют это утверждение в каузальных терминах. Кто-то решит, что умные женщины стремятся избежать конкуренции умных мужчин; кто-то предположит, что они вынуждены идти на компромиссы при выборе супруга из-за того, что умные мужчины не хотят соревноваться с умными женщинами; другие предложат более надуманные объяснения. А теперь подумайте над следующим утверждением:

Корреляция между оценками интеллекта супругов не идеальна.

Разумеется, это утверждение верно – и совершенно неинтересно. В этом случае никто не ожидает идеальной корреляции. Объяснять здесь нечего. Тем не менее с алгебраической точки зрения эти два утверждения эквивалентны. Если корреляция между оценками интеллекта супругов не идеальна (и если женщины и мужчины в среднем не различаются по интеллекту), то математически неизбежно, что умные женщины выйдут замуж за мужчин, которые в среднем будут менее умными (и наоборот). Наблюдаемая регрессия к среднему не может быть более интересна или более объяснима, чем неидеальная корреляция.

Поделиться:
Популярные книги

Альда. Дилогия

Ищенко Геннадий Владимирович
Альда
Фантастика:
фэнтези
7.75
рейтинг книги
Альда. Дилогия

Игрушка богов. Дилогия

Лосев Владимир
Игрушка богов
Фантастика:
фэнтези
4.50
рейтинг книги
Игрушка богов. Дилогия

Купец IV ранга

Вяч Павел
4. Купец
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Купец IV ранга

Газлайтер. Том 19

Володин Григорий Григорьевич
19. История Телепата
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Газлайтер. Том 19

Вспомнить всё (сборник)

Дик Филип Киндред
Фантастика:
научная фантастика
6.00
рейтинг книги
Вспомнить всё (сборник)

Предатель. Цена ошибки

Кучер Ая
Измена
Любовные романы:
современные любовные романы
5.75
рейтинг книги
Предатель. Цена ошибки

Школа. Первый пояс

Игнатов Михаил Павлович
2. Путь
Фантастика:
фэнтези
7.67
рейтинг книги
Школа. Первый пояс

Гарри Поттер (сборник 7 книг) (ЛП)

Роулинг Джоан Кэтлин
Фантастика:
фэнтези
5.00
рейтинг книги
Гарри Поттер (сборник 7 книг) (ЛП)

Камень. Книга восьмая

Минин Станислав
8. Камень
Фантастика:
фэнтези
боевая фантастика
7.00
рейтинг книги
Камень. Книга восьмая

О, Путник!

Арбеков Александр Анатольевич
1. Квинтет. Миры
Фантастика:
социально-философская фантастика
5.00
рейтинг книги
О, Путник!

Шаман. Ключи от дома

Калбазов Константин Георгиевич
2. Шаман
Фантастика:
боевая фантастика
7.00
рейтинг книги
Шаман. Ключи от дома

Пистоль и шпага

Дроздов Анатолий Федорович
2. Штуцер и тесак
Фантастика:
альтернативная история
8.28
рейтинг книги
Пистоль и шпага

Боярышня Дуняша

Меллер Юлия Викторовна
1. Боярышня
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Боярышня Дуняша

Вечный. Книга IV

Рокотов Алексей
4. Вечный
Фантастика:
боевая фантастика
попаданцы
рпг
5.00
рейтинг книги
Вечный. Книга IV