Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет
Шрифт:
Армстронг сообщил мне, что не создавал прогноза «для неизменных условий», поскольку не мог определить никаких заслуживающих внимания байесовских априорных значений для любых альтернативных предположений; он обнаружил, что прогноз «для неизменных условий» отлично подходил для других областей, которые он изучал. И многим казалось правильным, если бы он применил в вопросе прогнозирования климата те же тщательные методы, что и в других областях. Вместо этого он сообщил комиссии Конгресса в 2011 г.: «Я искренне стараюсь не узнавать больше о реальных изменениях климата. Я занимаюсь прогнозированием» {890} .
890
«Climate Change: Examining the Processes Used to Create Science and Policy», слушания в комитете Конгресса
Но эта книга советует вам опасаться прогнозистов, которые говорят, что наука неважна для их работы, или ученых, заявляющих, что им не нужно прогнозирование. Эти виды деятельности серьезно и глубоко связаны друг с другом. Прогнозист, утверждающий, что его не волнует наука, – это все равно, что повар, заявляющий, что ему безразлично, какие он использует продукты. Именно связь с объективным миром и отличает науку и делает прогнозы научными. Прогнозы терпят поражение, когда мы не принимаем во внимание ничего, кроме нашего собственного метода, максимы или модели.
Неудобная правда о температурных данных
Однако если критика Армстронга настолько неверна, то о чем нам говорит его предполагаемое пари с Гором? Его прогноз не оказался неудачным. Напротив, он был довольно успешным. С момента, когда Армстронг заявил о своем пари в 2007 г., изменение температуры от месяца к месяцу было существенным, но какая-либо явная закономерность в этом изменении не проявлялась; 2011 г. оказался лишь ненамного прохладнее, чем, допустим, 2007-й.
Рис. 12.9. Изменение глобальной температуры за период с 2001 по 2011 г.
И подобная тенденция сохранялась более четырех лет. Неудобная для многих правда в том, что в течение десятилетия от 2001 до 2011 г. глобальная температура вообще не повышалась (рис. 12.9). Более того, она понизилась, хотя и несильно {891} .
Порой расчеты могут содержать в себе манипулятивный элемент. Например, если вы выберете в качестве точки отсчета 1998 г., когда температура была рекордно высокой под влиянием цикла ENSO, то вам будет довольно просто увидеть «тенденцию» к похолоданию. И, напротив, «тренд» для периода с 2008 по 2018 г. будет свидетельствовать о потеплении, поскольку 2008 г. был сравнительно прохладным. Статистика такого рода чем-то напоминает ситуацию, когда табло на стадионе оптимистично говорит нам о том, что игрок на позиции шорт-стопа смог восемь раз из 19 попасть по мячу в результате противостояния с питчерами другой команды. Однако тот факт, что в среднем за сезон результативность этого игрока составляет всего 0,190, игнорируется {892} .
891
Успех методов прогнозирования, датированных 1990-ми, зависит от значительного увеличения потепления, возникшего в предыдущие периоды.
892
Voros McCracken, «13 for His Last 24: Tomfoolery with Multiple Endpoints», Primate Studies, Baseball Think Factory, March 20, 2001. http://www.baseballthinkfactory.org/primate_studies/discussion/mccracken_2001%E2%80%9303%E2%80%9320_0/.
Тем не менее глобальное потепление не происходит с постоянной скоростью. Вместо этого периоды повышения температуры сопровождаются периодами так называемого бокового движения тренда, когда повышения температуры нет, а могут наблюдаться даже негативные тренды. Например, признаки потепления можно заметить не только в десятилетие между 2001 и 2011 гг., а также и в периоды между 1894 и 1913, 1937 и 1956 или 1966 и 1977 гг. (рис. 12.10), и это происходило, несмотря на постоянный рост концентрации CO2. Такая ситуация отчасти напоминает ту, с которой сталкиваются финансовые аналитики: в долгосрочной перспективе фондовый рынок, по сути, всегда движется вверх. Однако это знание не скажет вам о его поведении на следующий день, следующую неделю или через год.
Рис. 12.10.
Возможно, мир науки сможет объяснить возникшие в последнее время боковые движения температурного тренда; свою роль, например, мог сыграть рост выбросов серы в Китае. Кроме того, стоит помнить, что, хотя температуры и не росли в период 2001–2011 гг., они все равно были значительно выше, чем в любом предыдущем десятилетии.
Тем не менее эта книга побуждает читателей задуматься о сигнале и шуме и стремиться к использованию прогнозов, основанных на процентных или вероятностных показателях. Такие прогнозы более честно указывают границы наших способностей к предсказаниям. Когда предсказание какого-то сложного явления высказывается с явной убежденностью, это может считаться признаком того, что прогнозист недостаточно глубоко продумал проблему, что его статистическая модель обладает определенным оверфиттингом или что он больше заинтересован не в истине, а в создании себе имени.
Ни Армстронг, ни Шмидт не пытались придавать слишком большое значение своим прогнозам, касающимся температурного тренда. «Мы провели ряд симуляций за период с 1850 по 2007 г., – рассказал мне Армстронг. – Поэтому когда я изучил данные на 100 лет вперед, то посчитал, что практически наверняка выиграю свое пари» {893} . При этом Шмидт был даже готов предлагать довольно привлекательные ставки тем, кто решился бы оспорить его утверждение о том, что температуры будут расти и дальше. «Я мог легко ставить любые деньги на то, что следующее десятилетие окажется теплее, чем это, – рассказал он мне. – Если вы хотите иметь шансы 100 к 1, то я вам их дам».
893
Армстронг был готов признать, что в краткосрочной перспективе имелись шансы на то, что его прогноз «без изменений» окажется ошибочным. В разговоре со мной он заметил, что, по его расчетам, шансы выиграть пари у Гора, смотревшего на данные о повышении температуры в ближайшем десятилетии, а не в следующем столетии, составляли около 70 %.
Помочь в разрешении спора могут методы статистического прогнозирования, о которых я упоминал выше. Именно они способны доказать, что ни Армстронг, ни Шмидт не были совершенно правы. Если вы будете измерять температурный тренд в масштабе десятилетий, то увидите, что тенденция к потеплению с 1900 г. проявлялась в течение 75 % времени, а в остальные периоды наблюдалось похолодание. По мере роста в атмосфере концентрации CO2, приводящей к усилению парникового эффекта, периоды стабильных или понижающихся температур должны становиться более редкими. Тем не менее они не являются невозможными, и вряд ли против этого исхода стоит заключать пари со ставками 100 к 1. Если вы вместо этого предположите, что уровни CO2 будут повышаться такими же темпами, то есть около 2 ppm в год, то вероятность того, что в рамках заданного десятилетия не будет наблюдаться потепление, составит примерно 15 % {894} .
894
Этот расчет основан на векторе ошибок коэффициента, связанного с ростом температуры в регрессионной модели. Он предполагает, что нам известен точный объем диоксида углерода и что он будет повышаться ежегодно в той же пропорции, что и между 2002 и 2011 гг. На практике модель немного недооценивает величину ошибки и, следовательно, недооценивает шансы на охлаждение в течение десятилетия, как из-за того, что точный объем CO2 неизвестен, так и в связи с неопределенностью, присущей самой модели.
Еще одна причина, по которой так важно учитывать неопределенность
Неопределенность представляет собой важнейшую и необсуждаемую часть прогноза. Мы замечаем, что порой именно честное и точное заявление о неопределенности помогает спасти имущество и жизни людей. В других же случаях, как, например, при торговле опционами на акции или ставках на команду НБА, вы можете делать ставки на свою способность точно прогнозировать неопределенность.
Однако есть и еще одна причина для тщательной и всесторонней количественной оценки неопределенности. Это крайне важно для научного прогресса, особенно при применении теоремы Байеса.