Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет
Шрифт:
Например, на рубеже XX в. многие градостроители были обеспокоены увеличением использования конных экипажей, следствием использования которых было загрязнение улиц конским навозом. Один из авторов газеты Times of London предсказывал, что если в 1894 г. улицы Лондона, фигурально выражаясь, погрязли по колено в навозе, то к 1940-м гг. они окажутся погребенными под трехметровой толщей этой субстанции {491} . К счастью, примерно через 10 лет после публикации этой статьи Генри Форд начал производить первые прототипы автомобиля «Модели Т», и подобного кризиса удалось избежать.
491
Stephen Davies, «The Great Horse-Manure Crisis of 1894», The Freeman, 54, no. 7, September 2004. http://www.thefreemanonline.org/columns/our-economic-past-the-great-horse-manure-crisis-of-1894/.
Экстраполяция также стала виновником и некоторых других неудачных предсказаний, связанных с ростом населения. Возможно, самые первые серьезные усилия по предсказанию роста населения в мире были предприняты английским экономистом сэром Уильямом Петти в 1682 г. {492} . В то время статистика населения была не особенно доступна, и Петти
492
Sir William Petty, «An Essay Concerning the Multiplication of Mankind», 1682.
493
Tomas Frejka, «World Population Projections: A Concise History», Center for Policy Studies, Working Papers Number 66, March 1981. http://pdf.usaid.gov/pdf_docs/PNAAR555.pdf.
Через сто лет началась промышленная революция, и население начало расти значительно быстрее. В реальности количество жителей планеты, перевалившее за 7 млрд в конце 2011 г. {494} , примерно в 10 раз больше, чем следовало из прогнозов Петти.
В 1968 г. была издана достаточно противоречивая книга «Демографическая бомба» (Paul Ehrlich «Population Bomb»), написанная биологом из Стэнфорда Полом Р. Эрлихом и его женой, Анной Эрлих. В ней была допущена противоположная ошибка. Авторы этой книги совершенно ошибочно предположили, что от голода в 1970-е гг. умрут сотни миллионов людей {495} . Неудача этого предсказания была вызвана огромным количеством причин, в том числе и склонностью Эрлихов концентрироваться на самых страшных сценариях, чтобы привлечь внимание к своей точке зрения. Однако одна значительная проблема состояла в том, что они предполагали сохранение высокого уровня рождаемости, присущего эре свободной любви 1960-х гг., и в будущем. С их точки зрения, это означало появление все большего и большего количества голодных ртов [93] .
494
Haya El Nasser, «World Population Hits 7 Billion», USA Today, October 31, 2011.
495
Ronald Bailey, «Seven Billion People Today – Malthusians Still Wrong (and Always Will Be)», Reason.com, October 31, 2011. http://reason.com/blog/2011/10/31/seven-billion-people-today-mal.
93
Если бы мы предположили, что население мира должно было увеличиваться на 2,1 % в год, и взяли за точку отсчета 1968 г., когда Эрлих опубликовал свою книгу, то к 2012 г. количество жителей планеты должно было бы составить почти 9 млрд что значительно выше реального значения в 7 млрд. – Прим. авт.
«В процессе написания “Демографической бомбы” я предполагал, что интерес людей к сексу и детям настолько силен, что изменить размер семьи будет сложно, – рассказывал мне Пол Эрлих в коротком интервью, – но затем мы поняли, что, если относиться к женщинам достойно и предоставить им достаточно возможностей для работы, показатель рождаемости начинает снижаться». Другие ученые, не склонные к подобным упрощениям, поняли это уже тогда. Прогнозы роста населения, изданные ООН в 1960-е и 1970-е гг., в целом достаточно точно показали, чему будет равна численность населения планеты через 30 или 40 лет {496} .
496
Frejka, «World Population Projections».
Экстраполяция приводит к одной из самых значительных проблем при исследовании как роста населения, так и распространения болезней, когда изучаемый показатель увеличивается по экспоненте. В начале 1980-х гг. совокупное количество случаев заболевания СПИДом, диагностированных в США, росло в геометрической прогрессии {497} : в 1980 г. было 99 случаев, в 1981 г. – 434, а к 1984 г. оно достигло 11 148. Эти цифры можно нанести на график, как сделали некоторые ученые в то время {498} , и попытаться его экстраполировать, чтобы выявить закономерность. В этом случае можно было бы сделать прогноз о том, что количество случаев СПИДа, диагностированных в США, могло бы вырасти к 1995 г. до 270 тыс. Довольно неутешительный прогноз, однако на самом деле все стало гораздо хуже: к 1985 г. СПИДом заболело около 560 тыс. человек, то есть примерно в два раза больше (рис. 7.2).
497
«U.S. HIV and AIDS Cases Reported Through December 1999», HIV/AIDS Surveillance Report, 11, no. 2, U. S. Department of Health and Human Services, Centers for Disease Control and Prevention. http://www.cdc.gov/hiv/topics/surveillance/resources/reports/pdf/hasr1102.pdf.
498
James M. Hyman and E. Ann Stanley, «Using Mathematical Models to Understand the AIDS Epidemic», Mathematical Biosciences 90, pp. 415–473, 1988. http://math.lanl.gov/~mac/papers/bio/HS88.pdf.
Рис. 7.2. Общее количество случаев заболевания СПИДом, диагностированных в США: реальное до 1984 г. и экстраполированное до 1995 г.
Возможно, однако, что с точки зрения статистики точные прогнозы, основанные на экстраполяции по экспоненциальной шкале, вообще нельзя делать. Даже корректная версия этого метода {499} , учитывающая предел погрешности, показывает, что количество случаев заболевания СПИДом в 1995 г. могло колебаться в пределах от 35 тыс. до 1,8 млн. Этот диапазон слишком широк, чтобы дать какую-то разумную основу для прогноза.
499
Для расчетов я использовал логарифмическое преобразование переменных,
Почему оказались неудачными предсказания, касающиеся эпидемии гриппа в 2009 г.
Хотя статистические методы, используемые эпидемиологами при анализе вспышек гриппа, не так просты, как в описанных выше примерах, при их использовании все равно приходится сталкиваться с проблемой экстраполяции. Это связано с тем, что обычно имеется только небольшое количество потенциально сомнительных базовых точек данных.
Одной из самых полезных переменных при прогнозировании распространения болезни является так называемое репродуктивное число, обычно обозначаемое R0. Значение R0 показывает, какое количество неинфицированных людей потенциально могут заразиться от единственного инфицированного человека. Например, значение R0, равное 4, означает, что – при отсутствии вакцин или других средств защиты – заболевший человек передаст болезнь еще четырем людям до того момента, как выздоровеет (или умрет).
Теоретически любая болезнь с R0 > 1 распространится со временем (при отсутствии вакцин и карантинов) на все население. Однако порой значение R0 бывало обманчивым: оно приближалось к 3 для «испанки», к 6 для оспы и к 15 для кори. В случае малярии, одной из самых смертельно опасных болезней в истории цивилизации, до сих пор отвечающей примерно за 10 % смертей в некоторых уголках мира, значение этого показателя может достигать сотен {500} (табл. 7.1).
500
Richard Carter and Kamini N. Mendis, table 4 in «Evolutionary and Historical Aspects of the Burden of Malaria», Clinical Microbiology Reviews, 15, no. 4, pp. 564–594, October 2002.
Таблица 7.1. Медианные значения [94] R0 для различных заболеваний {501}
Проблема состоит в невозможности сформулировать надежные расчеты R0 до тех пор, пока болезнь не распространится по всему сообществу и пока у вас не появится достаточно времени для тщательного изучения статистики. Поэтому эпидемиологи вынуждены делать экстраполяции, основываясь на ранних и немногих данных. Измерить на ранних этапах другой ключевой статистический показатель заболеваемости, смертность, может быть столь же сложно. Мы сталкиваемся с ситуацией «Уловки-22»; болезнь невозможно точно предсказать без этой информации, однако надежные количественные расчеты чаще всего оказываются невозможными, пока болезнь не наберет обороты.
94
Медианным, или срединным, значением (Ме) называют такое значение случайной величины, при котором половина результатов имеет меньшее, а другая – большее значение, чем Me.
501
Стоит отметить, что в профессиональной литературе значение RO часто приводится в виде диапазона; для простоты повествования я указываю среднее значение этого диапазона. Источники: David L. Smith, F. Ellis McKenzie, Robert W. Snow, and Simon I. Hay, малярия: «Revisiting the Basic Reproductive Number for Malaria and Its Implications for Malaria Control», PLoS Biology, 5, no. 3, March 2007.Эбола: G. Chowell, N. W. Hengartner, C. Castillo-Chavez, P. W. Fenimore, and J. M. Hyman, «The Basic Reproductive Number of Ebola and the Effects of Public Health Measures: The Cases of Congo and Uganda», Journal of Theoretical Biology, 229, no. 1, pp. 119–126, July 7, 2004. math.lanl.gov/~gchowell/publications/ebolaJTB.pdf; 1918 грипп: Marc Lipsitch, Christina Mills, and James Robins, «Estimates of the Basic Reproductive Number for 1918 Pandemic Influenza in the United States: Implications for Policy», Global Health Security Initiative, 2005. www.ghsi.ca/documents/Lipsitch_et_al_Submitted%2020050916.pdf; грипп в 2009 г. и сезонный грипп: Todd Neale, «2009 Swine Flu More Transmissible Than Seasonal Flu», MedPage Today, May 11, 2009.HIV/AIDS: R. M. Anderson and R. M. May, «Population Biology of Infectious Diseases: Part I», Nature, 280, pp. 361–367, August 2, 1979; SARS: J. Wallinga and P. Teunis, «Different Epidemic Curves for Severe Acute Respiratory Syndrome Reveal Similar Impacts of Control Measures», American Journal of Epidemiology, 160, no. 6, pp. 509–516, 2004; другие заболевания: «History and Epidemiology of Global Smallpox Eradication» в «Smallpox: Disease, Prevention, and Intervention» Centers for Disease Control and Prevention. http://www.bt.cdc.gov/agent/smallpox/training/overview/pdf/eradicationhistory.pdf.
Данные о первых вспышках инфекционных заболеваний часто бывают искаженными. Например, приведенные выше цифры о первых поставленных диагнозах СПИДа в США стали доступными лишь через несколько лет после заражений. Но даже скорректированные статистические данные не позволили улучшить качество прогнозов. Однако если бы мы были вынуждены положиться на данные, реально доступные ученым в то время {502} , то результаты могли оказаться еще хуже. Это связано с тем, что в первые годы своего развития СПИД плохо воспринимался и вызывал чувство стыда как у пациентов, так и у врачей {503} . Множество странных синдромов с симптомами, напоминавшими СПИД, оставались без диагноза или диагностировались неправильно – иногда причиной смерти считались другие инфекции, вызываемые СПИДом. Лишь многие годы спустя, когда врачи начали заново открывать старые истории болезней, им удалось лучше оценить развитие СПИДа в первые годы.
502
«Acquired Immunodeficiency Syndrome (AIDS) Weekly Surveillance Report», Centers for Disease Control, December 31, 1984. http://www.cdc.gov/hiv/topics/surveillance/resources/reports/pdf/surveillance84.pdf.
503
Gregory M. Herek and John P. Capitanio, «AIDS Stigma and Sexual Prejudice», American Behavioral Scientist, 42, pp. 1126–1143, 1999. http://psychology.ucdavis.edu/rainbow/html/abs99_sp.pdf.