Сигнал и шум. Почему одни прогнозы сбываются, а другие - нет
Шрифт:
Поэтому Вулгарис не просто выявляет закономерности – сделать это в любой среде с большими массивами данных несложно; именно так и поступают посредственные азартные игроки. Самое главное – это понять, что представляет собой данная закономерность – шум или сигнал.
Но, хотя я и не могу поделиться с вами каким-либо основным и единственным доводом, на основании которого Вулгарис делает или не делает ставку, его решения направляются определенным типом мыслительного процесса, называемого рассуждениями Байеса.
Невероятное наследие Томаса Байеса
Томас Байес был английским священником, родившимся то ли в 1701, то ли в 1702 г. О жизни его известно довольно мало, хотя он подарил свое имя целому направлению в статистике и, возможно, самой знаменитой ее теореме. Неясно даже, как выглядел Байес на самом деле, его портрет, который часто приводят в энциклопедиях, может принадлежать другому лицу {556} .
Нам известно, что Байес, скорее всего, родился в зажиточной семье, проживавшей в юго-восточном английском графстве Хартфордшир. Он был вынужден отправиться в далекое
556
D. R. Bellhouse, «The Reverend Thomas Bayes FRS: A Biography to Celebrate the Tercentenary of His Birth», Statistical Science, 19, 1, pp. 3–43; 2004. http://www2.isye.gatech.edu/~brani/isyebayes/bank/bayesbiog.pdf.
557
Возможно, Байес также был арианцем, последователем учения раннехристианского проповедника Ария, который считал Иисуса Христа небесным сыном Бога, а не одним из выражений Бога (как считает в наши дни большинство христиан).
Тем не менее Байес был все равно избран членом Королевского научного общества, несмотря на незначительное количество публикаций. Там он обычно выполнял роль своего рода внутреннего критика или был посредником в ходе интеллектуальных дебатов. Одной из работ, которые ученые приписывают Байесу (несмотря на ее публикацию под псевдонимом Джон Нун {558} ), является трактат под названием «Божественная доброта» {559} . В этом трактате Байес рассматривал извечный теологический вопрос о том, как могут существовать в мире страдания и зло, несмотря на безграничную доброту Господа. В сущности, ответ Байеса на этот вопрос состоит в том, что мы ошибочно принимаем наше собственное несовершенство за несовершенство Бога, чей замысел в отношении нашей Вселенной мы не можем понять в полной мере. В письме другому теологу Байес писал «довольно странно… для человека, видящего лишь нижнюю часть шкалы, говорить о всеобъемлющем поражении счастья в мире» {560} .
558
Thomas Bayes, «Divine Benevolence: Or an Attempt to Prove That the Principal End of the Divine Providence and Government Is the Happiness of His Creatures». http://archive.org/details/DivineBenevolenceOrAnAttemptToProveThatThe.
559
Thomas Bayes, «Divine Benevolence: Or an Attempt to Prove That the Principal End of the Divine Providence and Government Is the Happiness of His Creatures». http://archive.org/details/DivineBenevolenceOrAnAttemptToProveThatThe.
560
Thomas Bayes, «Divine Benevolence: Or an Attempt to Prove That the Principal End of the Divine Providence and Government Is the Happiness of His Creatures». http://archive.org/details/DivineBenevolenceOrAnAttemptToProveThatThe.
Более знаменитая работа Байеса «Очерки к решению проблемы доктрины шансов» {561} была опубликована только после его смерти и после того, как была представлена вниманию Королевского общества в 1763 г. другом Байеса по имени Ричард Прайс. В работе рассматривался вопрос о том, как мы формулируем вероятностные представления о мире, сталкиваясь с новыми данными.
В описании эссе Байеса Прайс приводит пример человека, попадающего в наш мир (например, Адама или человека из платоновской пещеры) и впервые наблюдающего восход солнца. Поначалу он не знает, обычное ли это событие или из ряда вон выходящее. Однако он видит восход солнца каждый последующий день и начинает все сильнее верить, что это – постоянное свойство природы. Постепенно, основываясь лишь на этой, в чистом виде статистической форме взаимодействия с природой, он присваивает своему прогнозу о том, что солнце вновь встанет на следующий день, вероятность, максимально близкую (хотя и никогда не достигающую) к 100 %.
561
The Late Rev. Mr. Bayes, Communicated by Mr. Price, in a Letter to John Canton, M. A. and F. R. S., «An Essay Towards Solving a Problem in the Doctrine of Chances», Philosophical Transactions of the Royal Society of London, 53, pp. 370–418; 1763. http://www.stat.ucla.edu/history/essay.pdf.
Суть идеи Байеса и Прайса состоит не в том, что мир всегда оценивается в вероятностях или степенях неопределенности. Байес верил в небесное совершенство; он также выступал сторонником взглядов Исаака Ньютона, согласно которым природа следует регулярным и предсказуемым законам. Скорее, Байес говорил – с математической и философской точек зрения – о том, как нам следует изучать Вселенную. Мы учимся новым представлениям о ней с помощью аппроксимаций, оказываясь ближе и ближе к истине по мере того, как мы собираем все больше свидетельств.
Это заключение прямо противоположно более скептичной точке зрения шотландского философа Дэвида Юма {562} , который считал, что, поскольку мы не можем быть уверены в том, что солнце взойдет, наш прогноз относительно этого события не может считаться более рациональным, чем обратное заключение {563} . Напротив, байесовская
562
Donald A. Gillies, «Was Bayes a Bayesian?», Historia Mathematica, 14, no. 4, pp. 325–346, November 1987. http://www.sciencedirect.com/science/article/pii/0315086087900656.
563
David Hume, «Cause and Effect” in An Enquiry Concerning Human Understanding (1772) (Hackett Publishing Company, 1993). http://www.marxists.org/reference/subject/philosophy/works/en/hume.htm.
Вероятность и прогресс
Стоит отметить, насколько это утверждение напоминает слова Байеса, приведенные в трактате «Божественная доброта» («Divine Benevolence»), где утверждалось, что нам не стоит относить собственное несовершенство на ошибки Бога. Однако в философии Байеса, по сути, нет ничего религиозного {564} .
Нужно отметить, что самое точное математическое выражение того, что в наши дни считается теоремой Байеса, было разработано человеком, который с высокой долей вероятности был атеистом {565} , – французским математиком и астрономом Пьером-Симоном Лапласом.
564
Некоторые христиане считают, что байесовская вероятность более совместима с их мировоззрением. Согласно теореме Байеса, если вы присвоите 100 %-ную априорную вероятность гипотезе о существовании христианского бога, то никакие доказательства в мире не заставят вас отступить от своих позиций. Вполне возможно, что Байес это понимал. В своем вступлении к эссе Байеса Ричард Прайс упоминал, что, по его мнению, теорема Байеса помогает подтвердить «существование Божества». Дополнительную информацию по этой теме можно найти: Steve Bishop, «Christian Mathematicians – Bayes, God & Math: Thinking Christianly About Mathematics», Education, March 22, 2012 г. http://godandmath.com/2012/03/22/christian-mathematicians-bayes/.
565
«Fundamental Atheism», Free Atheist Church. https://sites.google.com/site/freeatheistchurch/fundamental-atheism.
Лаплас, как вы, возможно, помните из главы 4, был ярким представителем человека, стоящего на позициях научного детерминизма. Он считал, что мы могли бы идеально спрогнозировать нашу Вселенную, если бы знали положение каждой частицы в ней и могли бы достаточно быстро рассчитать ее движение. Так почему же Лаплас так увлекся теорией, основанной на вероятности?
Причина заключается в разрыве между совершенством природы и нашим человеческим несовершенством в измерении и понимании ее. Лапласа изрядно расстраивали астрономические наблюдения, свидетельствовавшие об аномалиях в орбитах Юпитера и Сатурн – по их предсказаниям, Юпитер должен был врезаться в Солнце, а Сатурн – вылететь за края Солнечной системы {566} .
566
Sharon Bertsch McGrayne, The Theory That Would Not Die: How Bayes’ Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy (New Haven, CT: Yale University Press, Kindle edition), 427–436.
Разумеется, эти предсказания были в корне неверными, Лаплас посвятил значительную часть своей жизни тому, чтобы более точно определить орбиты этих планет {567} . Уточнения, которые внес Лаплас, были основаны на вероятностных заключениях {568} , а не на результатах более точных измерений, поскольку инструменты того времени (например, телескопы) были достаточно грубыми. Лаплас начал рассматривать вероятность как срединную точку между невежеством и знанием. Ему казалось очевидным, что для достижения научного прогресса важно уделять вопросам вероятности значительно больше внимания {569} .
567
E. O. Lovett, «The Great Inequality of Jupiter and Saturn», Astronomical Journal, 15, 351 (1895), pp. 113–127.
568
McGrayne, The Theory That Would Not Die, Kindle location 19.
569
Pierre-Simon Laplace, «A Philosophical Essay on Probabilities» (1902), pp. 6–8.
Таким образом, Байес и Лаплас уже в XVIII в. отлично понимали, что существует некая тонкая связь между вероятностью, предсказанием и научным прогрессом. И это было еще в тот период, когда человечество только начало сталкиваться с взрывообразным ростом объемов информации, ставшим возможным благодаря изобретению печатного пресса несколькими столетиями ранее и способствовавшим развитию устойчивого научного, технического и экономического прогресса. Эта связь крайне важна – как для предсказания орбит планет, так и для угадывания победителя в матче с участием Lakers. Как мы увидим ниже, наука зашла в тупик позже, когда в XX в. начала доминировать иная статистическая парадигма, лишившая предсказание былой значимости и пытавшаяся рассматривать неопределенность как результат несовершенства наших измерений, а не как ошибку наших суждений.