Думай медленно... решай быстро
Шрифт:
Гальтону можно посочувствовать – попытки понять и объяснить феномен регрессии даются нелегко. По ироническому замечанию статистика Дэвида Фридмана, если вопрос о регрессии возникает в ходе судебного разбирательства, та сторона, которой приходится объяснять его суть присяжным, обязательно проигрывает. Почему это так сложно? Главная причина трудностей регулярно упоминается в этой книге: наш разум склонен к каузальным объяснениям и плохо справляется с «простой статистикой». Если какое-то событие привлекает наше внимание, ассоциативная память начинает искать его причину, а точнее, активируется любая причина, уже хранящаяся в памяти. При обнаружении регрессии подыскиваются каузальные объяснения, но они будут неверными, потому что на самом деле у регрессии к среднему объяснение есть, а причин
Наши трудности с пониманием регрессии возникают и из-за Системы 1, и из-за Системы 2. Без дополнительных инструкций (а во многих случаях – даже после некоторого знакомства со статистикой) отношение между корреляцией и регрессией остается неясным. Системе 2 трудно его понять и усвоить. Частично это происходит из-за настойчивых требований Системы 1 давать каузальные объяснения.
Трехмесячное применение энергетических напитков для лечения депрессии у детей дает значительные улучшения состояния.
Я выдумал этот заголовок, но описанный в нем факт – правда: если какое-то время поить энергетическими напитками детей, страдающих депрессией, наблюдается клинически значимое улучшение. Аналогичным образом дети с депрессией, которые будут ежедневно по пять минут стоять на голове или по двадцать минут гладить кошек, также покажут улучшение состояния. Большинство читателей таких заголовков автоматически заключат, что улучшение наступило из-за энергетического напитка или поглаживания кошки, но это – совершенно необоснованный вывод. Дети в депрессии – это экстремальная группа, а такие группы с течением времени регрессируют к среднему. Корреляция между уровнями депрессии во время последовательных проверок неидеальна, так что регрессия к среднему неизбежна: детям с депрессией со временем станет чуть легче, даже если они не будут гладить кошек и пить «Ред Булл». Для вывода об эффективности энергетического напитка – или любого другого способа лечения – необходимо сравнить группу пациентов, получающих его, с контрольной группой, не получающей лечения совсем (или, еще лучше, получающей плацебо). Ожидается, что контрольная группа покажет улучшение только за счет регрессии, а цель эксперимента состоит в выяснении, улучшается ли состояние пациентов, получающих лечение, больше, чем объясняется регрессией.
Неверное каузальное определение эффекта регрессии свойственно не только читателям популярной прессы. Статистик Говард Вейнер составил длинный список выдающихся исследователей, допустивших такую же ошибку, то есть спутавших корреляцию с каузальностью. Эффект регрессии – частый источник проблем в исследованиях, и у опытных ученых развивается здоровая боязнь ловушек, то ест ь необоснованных каузальных выводов.
Один из моих любимых примеров ошибки в интуитивных предсказаниях взят из замечательной книги Макса Базермана «Оценочные суждения при принятии управленческих решений» и адаптирован:
Вы прогнозируете продажи в сети магазинов. Все магазины сети сходны по размеру и ассортименту, но объем продаж у них разный из-за расположения, конкуренции и различных случайных факторов. Вам представили результаты за 2011 год и попросили определить продажи в 2012-м. У вас есть указания придерживаться общего прогноза экономистов о том, что рост продаж в целом составит 10%. Как бы вы заполнили следующую таблицу?
Прочитав эту главу, вы знаете, что очевидное решение прибавить по 10% к продажам каждого из магазинов
Разговоры о регрессии к среднему
«По ее словам, она по опыту знает, что критика эффективнее похвалы. Но она не понимает, что все это – просто результат регрессии к среднему».
«Возможно, второе собеседование впечатлило нас меньше потому, что кандидат боялся нас разочаровать. Однако, скорее всего, первое собеседование прошло необычайно хорошо».
«Процедура отбора хороша, но неидеальна, так что вероятна регрессия. Не стоит удивляться, что даже самые лучшие кандидаты часто не соответствуют нашим ожиданиям».
18. Как справляться с интуитивными предсказаниями
Жизнь дает нам много возможностей предсказывать. Экономисты прогнозируют инфляцию и безработицу, финансовые аналитики прогнозируют доходы, военные эксперты прогнозируют количество жертв, венчурные капиталисты оценивают прибыльность новых компаний, издатели и продюсеры предсказывают целевые аудитории, подрядчики оценивают время на выполнение проекта, шеф-повара предугадывают спрос на блюда в меню, инженеры вычисляют количество бетона, необходимое для строительства здания, начальники пожарных команд определяют число машин, требуемое для тушения пожара. В личной жизни мы предсказываем реакцию супруга на предлагаемый переезд или свою способность освоиться на новом рабочем месте.
Некоторые предсказательные оценки, например те, что дают инженеры, в основном полагаются на данные таблиц, точные вычисления и подробный анализ результатов, наблюдавшихся в подобных случаях. Для других предсказаний в действие вступают интуиция и Система 1, в двух основных формах. Бывают предчувствия, основанные в первую очередь на навыках и экспертизе, полученных повторением некоторого опыта. Быстрые автоматические оценки и выборы, совершаемые гроссмейстерами, пожарными и врачами, которые описал Гэри Кляйн в «Источниках силы» и других работах, иллюстрируют профессиональную интуицию: решение текущей проблемы быстро приходит в голову, поскольку обусловлено знакомыми подсказками.
Другие предчувствия, иногда субъективно неотличимые от первых, возникают в ходе эвристических процедур, которые часто заменяют заданный трудный вопрос более легким. Интуитивные суждения выносятся уверенно, даже если они основаны на нерегрессивных оценках слабых доказательств. Конечно, многие оценки, особенно в профессиональных областях, рождаются из сочетания анализа и интуиции.
Нерегрессивные предчувствия
Давайте вспомним старую знакомую:
Джули оканчивает университет штата. Она бегло читала в четыре года. Какой у нее средний балл?
Люди, знакомые с американской системой образования, быстро выдают число, зачастую близкое к 3,7 или 3,8. Как это происходит? Через несколько операций Системы 1.
• Ищется каузальная связь между исходными данными (умением Джули читать) и целью прогноза (средним баллом). Связь может быть непрямой. В данном случае и раннее умение читать, и высокий средний балл отражают хорошие способности, а значит, должна существовать какая-то связь. Вы (то есть ваша Система 2), скорее всего, посчитаете неважной информацию о том, что Джули выиграла соревнования рыболовов-любителей или успешно занималась тяжелой атлетикой в старших классах. Процесс, по сути, дихотомический: можно отбросить то, что заведомо неверно или неважно, но Система 1 не умеет принимать во внимание более мелкие недостатки данных. В результате интуитивные предсказания почти совершенно не учитывают реальные предсказывающие свойства информации. Если найдена связь, как в случае с ранним чтением Джули, срабатывает принцип «что ты видишь, то и есть»: ассоциативная память быстро и автоматически составляет наилучшую возможную при имеющейся информации историю.