Чтение онлайн

на главную - закладки

Жанры

Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее
Шрифт:

судьи были менее склонны предоставлять политические убежища, если уже одобрили предыдущие два дела. Это также объясняет то неприятное чувство на школьном экзамене, когда вы заметили, что выбрали ответ «б» четыре раза подряд.

В случайных данных часто обнаруживаются последовательности и кластеры. Вы удивитесь, если узнаете, что есть шанс 50/50 выбросить четыре «решки» подряд в любой серии из двадцати бросков? Такие последовательности часто неправильно интерпретируют как свидетельства неслучайного поведения, ошибки интуиции, которые называются иллюзией кластеров.

Посмотрите на пару картинок

ниже. Какая из них сгенерирована случайным образом?

Иллюзия кластеров

Стивен Пинкер. Лучшие ангелы нашей природы. New York: Viking Books, 2011.

Эти картинки взяты из книги психолога Стивена Пинкера «Удачные ракурсы нашей натуры». Левая картинка, на которой очевидны кластеры, на самом деле случайная. Правая картинка, которая интуитивно кажется случайной, на самом деле такой не является. Это фотография светлячков на своде пещеры в Вайтомо, Новая Зеландия. Светлячки специально рассаживаются подальше друг от друга в борьбе за еду.

Во время Второй мировой войны лондонцы пытались найти закономерность в бомбардировках их города немецкими войсками. Некоторые считали, что целят в одни районы, а другие щадят. Появились теории заговоров о том, что немцы симпатизируют определенным районам, которые не подверглись обстрелу. Но статистический анализ показал, что нет никаких доказательств, подтверждающих неслучайную природу бомбардировок.

Невероятное не следует путать с невозможным. Если долго пытаться, можно получить даже редкий результат.

Некоторые люди выигрывают в лотерею, а некоторых ударяет молния. События с вероятностью «один на миллион» происходят довольно часто на планете, где живет 7 млрд человек.

В США чиновников из сферы здравоохранения просят расследовать больше тысячи подозрительных кластеров заболеваемости раком каждый год. Хотя история знает о заметных кластерах случаев рака, вызванного взаимодействием с промышленными токсинами, подавляющее большинство заявленных происшествий абсолютно случайны. Существует более 400 000 компаний, где числится 50 и более сотрудников. Очень велика вероятность того, что горстка людей получит один и тот же неутешительный диагноз.

Зная об ошибке игрока, не стоит ждать, что краткосрочный результат всегда будет совпадать с долгосрочными ожиданиями. Справедливо и обратное: не стоит основывать долгосрочные ожидания на маленьком наборе краткосрочных результатов.

Возможно, вам известно выражение проклятие второй попытки, которым описывается сценарий, когда группа получает восторженные отзывы на первый альбом, а второй публика принимает уже холоднее, или когда начинающий бейсболист блестяще выступает в первом сезоне, но на следующий год его средний результат уже не так впечатляет. Можно предположить, что этому есть какое-то психологическое объяснение, например они не выдерживают своего успеха. Но в большинстве случаев истинная причина этого явления – чисто математическая, и объясняется моделью, которая называется регрессией к норме.

Норма – это еще одно название среднего значения,

и регрессия к норме объясняет, почему за экстремальными событиями обычно следует что-то более типичное: регрессия к ожидаемой норме. Например, никто не ждет, что бегун два раза подряд побьет рекорд в забеге на время. От него ждут менее впечатляющих результатов. Ведь редкий результат потому и редкий, что не стоит надеяться на него несколько раз подряд.

Не стоит думать, что результат, основанный на небольшой выборке, будет типичным. Он не отразит результат ни для любой другой маленькой выборки, ни для гораздо большей. Как и единичные случаи, небольшие выборки очень мало сообщают вам помимо того, что случившееся может произойти. Хотя первое впечатление и бывает точным, нужно относиться к нему скептически. Дополнительные данные помогут отличить вероятное событие от аномалии.

Кривая нормального распределения

Когда имеете дело с большим количеством данных, используйте графики и сводную статистику, чтобы бороться с информационной перегрузкой. Термином статистика на самом деле просто называют числа, которые используются для обобщения наборов данных (и математический процесс, с помощью которого генерируются эти числа). Графики и сводная статистика кратко излагают факты о наборе данных.

Вы постоянно используете сводную статистику, даже не понимая этого.

Если кто-то спросит вас: «Какова температура здорового человека?» – вы, скорее всего, ответите, что 98,6 °F или 37 °C. На самом деле это сводная статистика, которая называется нормой, что, как мы только что объяснили, является другим названием среднего значения.

Возможно, вы даже не помните, когда впервые узнали об этом факте, и еще вероятнее, что вы даже не знаете, откуда взялась эта цифра. Чтобы высчитать эту статистику, немецкий доктор Карл Вундерлих в XIX веке собрал и проанализировал больше миллиона температур, замеренных подмышкой у 25 000 пациентов (очень много подмышек).

И все же 98,6 °F – это не какая-то волшебная температура. Во-первых, более свежие данные отмечают более низкую норму, ближе к 98,2 °F (36,8 °C). Во-вторых, вы могли заметить, что «нормальная» температура у вас или члена вашей семьи отклоняется от этого среднего значения. На самом деле женщины в среднем немного теплее мужчин, и для них температура до 99,9 °F (37,7 °C) считается нормой. В-третьих, температура человеческого тела естественным образом меняется в течение дня, повышаясь в среднем на 0,9 °F (0,5 °C) с утра до вечера.

Если вы просто скажете, что 98,6 °F – это нормальная температура, вы не учтете всех этих нюансов. Вот почему ряд сводных статистик или графиков часто используется для каждого случая в отдельности, чтобы обобщить данные. Норма (среднее или ожидаемое значение) показывает центральную тенденцию, или место, где значения склоняются к центру. Также центральную тенденцию измеряют медиана (средняя величина, которая делит данные на две половины) и мода (наиболее частый результат). Эти статистические данные помогают описать, как будет выглядеть «типичное» число для выбранного набора данных.

Поделиться:
Популярные книги

Тайны затерянных звезд. Том 2

Лекс Эл
2. Тайны затерянных звезд
Фантастика:
боевая фантастика
космическая фантастика
космоопера
фэнтези
5.00
рейтинг книги
Тайны затерянных звезд. Том 2

Зайти и выйти

Суконкин Алексей
Проза:
военная проза
5.00
рейтинг книги
Зайти и выйти

Я еще не барон

Дрейк Сириус
1. Дорогой барон!
Фантастика:
боевая фантастика
попаданцы
аниме
5.00
рейтинг книги
Я еще не барон

Всадник Системы

Poul ezh
2. Пехотинец Системы
Фантастика:
фэнтези
попаданцы
рпг
5.00
рейтинг книги
Всадник Системы

Ученик

Губарев Алексей
1. Тай Фун
Фантастика:
фэнтези
5.00
рейтинг книги
Ученик

Тройняшки не по плану. Идеальный генофонд

Лесневская Вероника
Роковые подмены
Любовные романы:
современные любовные романы
6.80
рейтинг книги
Тройняшки не по плану. Идеальный генофонд

Восход черной звезды

Звездная Елена
4. Катриона
Фантастика:
фэнтези
6.25
рейтинг книги
Восход черной звезды

Идеальный мир для Лекаря 14

Сапфир Олег
14. Лекарь
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 14

Генерал-адмирал. Тетралогия

Злотников Роман Валерьевич
Генерал-адмирал
Фантастика:
альтернативная история
8.71
рейтинг книги
Генерал-адмирал. Тетралогия

Магия чистых душ 2

Шах Ольга
Любовные романы:
любовно-фантастические романы
5.56
рейтинг книги
Магия чистых душ 2

Новый Рал 9

Северный Лис
9. Рал!
Фантастика:
попаданцы
аниме
фэнтези
фантастика: прочее
5.00
рейтинг книги
Новый Рал 9

Идеальный мир для Лекаря 17

Сапфир Олег
17. Лекарь
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Идеальный мир для Лекаря 17

Книга 4. Игра Кота

Прокофьев Роман Юрьевич
4. ОДИН ИЗ СЕМИ
Фантастика:
фэнтези
боевая фантастика
рпг
6.68
рейтинг книги
Книга 4. Игра Кота

В поисках Оюты

Лунёва Мария
Оюта
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
В поисках Оюты