Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет
Шрифт:
Неточные данные также послужили причиной плохих прогнозов распространения свиного гриппа в 2009 г. Смертность, связанная с H1N1, была, по всей видимости, достаточно высокой в Мексике, однако оказалась невероятно низкой в США. Хотя отчасти это было связано с различиями в эффективности здравоохранения в каждой стране, значительная часть различий представляла собой на самом деле статистическую иллюзию.
Само понятие смертности представляет собой простое отношение количества смертельных случаев, вызванных болезнью, к количеству случаев заболеваний. Однако оба элемента этого соотношения вызывают целый ряд вопросов. С одной стороны, в Мексике имелась тенденция относить к жертвам H1N1 людей, умерших от других форм гриппа или вообще других болезней. Лабораторные тесты показали, что не менее четверти смертей, ранее связывавшихся с действием вируса H1N1, в реальности не имели никаких черт, присущих гриппу. С другой стороны, в ряде случаев данные о заболеваниях, вызванных вирусом H1N1, передавались не в полном объеме. В таких развивающихся странах, как Мексика, не развиты ни такая сложная система отчетов, как в Соединенных Штатах, ни культура посещения врача при первых признаках заболевания {504} .
504
Marc Lacey and Elisabeth Malkin, «First Flu Death Provides Clues to Mexico Toll», New York Times, April 30, 2009. http://www.nytimes.com/2009/05/01/health/01oaxaca.html?scp=28&sq=h1n1&st=nyt.
Фактически вирус H1N1 мог циркулировать по южной и центральной Мексике на протяжении ряда месяцев, пока на него не обратила внимание медицинская общественность (занятая в то время поисками следов птичьего гриппа в Азии). Отчеты о вспышке респираторного заболевания появились сначала в небольшом городке Ла Глория, штат Веракрус, в начале марта 2009 г., после того как гриппом заболело большинство жителей, однако поначалу мексиканские власти полагали, что это вызвано более привычным штаммом вируса под названием H3N2 {505} .
505
Jo Tuckman and Robert Booth, «Four-Year-Old Could Hold Key in Search for Source of Swine Flu Outbreak», The Guardian, April 27, 2009. http://www.guardian.co.uk/world/2009/apr/27/swine-flu-search-outbreak-source.
Напротив, свиной грипп был навязчивым объектом множества публикаций в СМИ с момента его появления на территории США. Только несколько случаев могло бы остаться без внимания. Так как в США используются более высокие стандарты отчетности, показатель смертности там был более надежным и позволял исключить некоторые плохие сценарии из дальнейшего рассмотрения – но лишь до тех пор, пока не оказалось слишком поздно отказываться от некоторых пугающих прогнозов, ставших доступными широкой публике.
Самореализующиеся и самоотменяющиеся предсказания
Во многих случаях, связанных с предсказаниями деятельности человека, сам факт создания предсказания может повлиять на поведение людей. Иногда, как и в экономике, эти изменения в поведении могут повлиять и на результат прогноза, либо аннулировав его, либо, напротив, повысив его точность. Прогнозы, касающиеся гриппа и других инфекционных заболеваний, затрагивают обе стороны этой проблемы. Случай, при котором предсказание приводит к событиям, его подтверждающим, называется самореализующимся предсказанием или самоисполняющимся пророчеством. Примером его может служить выпуск результатов политического опроса в гонке с множеством кандидатов, например, первичные выборы на президентский пост.
В таких случаях избиратели могут из тактических соображений поддержать кандидата, потенциально способного выиграть (а не растратить зря свой голос), и раскрученные результаты опроса часто лучше всего показывают, какому кандидату это по силам. Например, на последних этапах политической гонки республиканцев в Айове в 2012 г. канал CNN выпустил результаты опроса, показывавшие, что Рик Санторум может рассчитывать на 16 % голосов, а не на 10 %, как это было раньше {506} . Этот опрос выбивался из общего ряда – другие исследования общественного мнения не показывали, что Санторум набирает обороты, даже после выпуска опроса CNN {507} . Тем не менее благодаря опросу Санторум получил значительную и позитивную поддержку СМИ, и некоторые избиратели, ранее поддерживавшие кандидатуры других, близких по идеологическим взглядам кандидатов типа Мишель Бахманн и Рика Перри, перешли на его сторону. Через некоторое время опрос сделал свое дело, Санторум выиграл в Айове, а Бахманн и Перри остались далеко позади.
506
CNN/Time/ORC International poll of Iowa Republican voters, December 21–27, 2011. http://i2.cdn.turner.com/cnn/2011/images/12/28/topstate3.pdf.
507
Selzer & Company poll of Iowa Republican voters, Des Moines Register, December 27–30, 2011. http://www.desmoinesregister.com/assets/pdf/FullTopLineResults.pdf.
Более тонкие примеры этого подхода можно найти в таких областях, как дизайн и развлечения, где компании, в сущности, соревнуются друг с другом в том, что смогут предугадать вкусы потребителей. Но они также способны влиять на потребителей определенным образом через толковые маркетинговые планы. Что касается моды, то специалисты в этой области пытаются угадать, какие цвета будут популярными в следующем сезоне {508} – это нужно делать заранее, примерно за год, поскольку именно такой срок требуется для переналадки производственных линий.
508
Marshall L. Fisher, Janice H. Hammon, Walter R. Obermeyer, and Ananth Raman, «Making Supply Meet Demand in an Uncertain World», Harvard Business Review, May 1994. http://hbr.org/1994/05/making-supply-meet-demand-in-an-uncertain-world/ar/1.
Допустим, группа влиятельных модельеров решит, что в следующем году популярным будет коричневый цвет, и начнет выпускать большое количество одежды коричневого цвета. Если модели и знаменитости начнут носить коричневое, а в каталогах
509
Со сходным случаем я столкнулся, консультируя крупную голливудскую киностудию в 2009 г. Руководство этой студии, обладавшей сложной структурой и на протяжении многих лет управлявшейся с помощью данных, верило, что определенный уик-энд, скажем, первый уик-энд октября, – особенно хороший момент для начала показа потенциального блокбастера, даже если не было связи ни с какими другими факторами. Это произошло из-за того, что студия в прошлом выпустила фильм, показ которого начался в это время и который оказался на редкость удачным (возможно, просто из-за того, что это был очень хороший фильм). Однако студия приписала часть успеха периоду начала показа. Поэтому в каждом следующем году она приберегала свои лучшие релизы на один и тот же уик-энд октября, а затем изо всех сил начинала заниматься его продвижением. Разумеется, хороший и активно рекламируемый фильм будет финансово успешным вне зависимости от того, когда он выходит в прокат. Тем не менее происходившее лишь подтверждало их предсказание о том, что начало октября – самое лучшее время для выпуска фильма.
Заболевания и другие медицинские обстоятельства также могут обладать свойствами самореализации. Когда те или иные медицинские аспекты широко обсуждаются в СМИ, люди чаще начинают находить у себя соответствующие симптомы, а врачи чаще диагностируют ту или иную болезнь. Наиболее известный пример такого случая, наблюдаемый в последние годы, связан с аутизмом.
Если вы сравните количество детей, которым поставлен диагноз «аутизм» {510} , с частотой использования термина аутизм в американских газетах {511} , то обнаружите почти идеальное соответствие по модели «один-к-одному» (рис. 7.3), причем оба значения в недавние годы выросли. И хотя аутизм не всегда воспринимается как заболевание, можно провести определенные параллели с гриппом. «Мы наблюдаем поразительное явление. Для заболеваний, не имеющих четкого механизма возникновения, новости сами по себе начинают способствовать появлению все новых случаев постановки такого диагноза», – рассказал мне доктор Алекс Озонофф из гарвардской Школы здравоохранения. Озонофф серьезно изучал математику и довольно свободно разбирается в вопросе управляемых данных, однако сейчас он в основном концентрируется на использовании тщательного статистического анализа при исследовании гриппа и других инфекционных заболеваний. «Мы раз за разом обнаруживаем, что чем чаще люди думают и обсуждают конкретный диагноз или болезнь, тем чаще его начинают ставить, и корреляция доходит почти до 100 %».
510
Это расчет основан на количестве детей, отнесенных к аутистам и тем самым получивших право на обучение по особой программе в государственных школах в соответствии с федеральным законом IDEAS Act. «Table 45. Children 3 to 21 Years Old Served Under Individuals with Disabilities Education Act, Part B, by Type of Disability: Selected Years, 1976–77 through 2008–09», Digest of Educational Statistics, National Center for Education Statistics, Institute of Education Sciences, 2010. http://nces.ed.gov/programs/digest/d10/tables/dt10_045.asp.
511
По данным NewsLibrary.com. На рис. 7.3 приведены цифры количества статей с обсуждением темы аутизма, отражающие общее количество статей в базе данных NewsLibrary.com на конкретный год, а затем проиндексированные таким образом, чтобы соответствовать по масштабу количеству учеников государственных школ, обучавшихся по специальным программам в области аутизма в соответствии с законом IDEAS Act.
Рис. 7.3. Аутизм: освещение в СМИ и количество поставленных диагнозов, 1992–008 гг.
Озонофф полагает, что именно это явление может отвечать за ту скорость, с которой свиной грипп распространился по США в 2009 г. Хотя болезнь и распространялась достаточно быстро, резкий статистический прирост мог быть отчасти связан с тем, что люди сообщали врачам о симптомах, которые прежде игнорировали.
Если бы доктора решили производить расчеты темпа распространения болезни среди населения, то количество официально объявленных случаев привело бы к искаженной статистике. Чем-то это напоминает ситуацию со статистикой преступности. Предположим, что полиция сообщает об увеличении количества ограблений в каком-то районе. Связано ли это с тем, что полицейские усилили бдительность и стали раскрывать больше преступлений, чем раньше, или же им стало проще сообщать об этом? [95] А может быть, этот район действительно стал более опасным? Подобные проблемы очень сложны для любого, кто хочет делать прогнозы заболеваемости гриппом на ранних стадиях.
95
Например, в Нью-Йорке (в отличие от Сан-Франциско) не разрешается подавать заявление в полицию через Сеть. Я обнаружил это, когда в арендованную мной для поездки машину влезли воришки. Сан-Франциско удается лучше информировать горожан и туристов о преступлениях и их предотвращении. При этом такой метод работы приводит к повышению количества зарегистрированных преступлений. – Прим. авт.