Лаять не на то дерево
Шрифт:
Если бы вы могли переговорить и знали, что можете друг другу доверять, ответ был бы простым: обоим молчать и отделаться одним годом тюрьмы. Но можете ли вы доверять своему другу в такой ситуации? Может быть, полиция запугала его до смерти? Вдруг вы промолчите, а он даст показания против вас? Тогда он выйдет на свободу, а вы на пять лет сядете в тюрьму.
Решение принять трудно. И если бы это был единичный случай, разумнее всего было бы дать показания. Но что, если вам предстоит сыграть в эту игру 20 раз? Это больше похоже на жизнь, верно? Наша судьба редко зависит от одного-единственного решения.
С этого начинал Роберт Аксельрод. Между США и СССР бушевала холодная война, и он хотел выяснить, что может заставить людей доверять друг другу и сотрудничать. Какая
Психологи, экономисты, математики, социологи и другие ученые прислали в общей сложности 14 алгоритмов (и одну программу, которая вела себя случайным образом). Представьте себе круговой турнир вроде «мартовского безумия» в баскетболе – только для нравственных систем. Одна из программ была до безумия доброй: она всегда сотрудничала – даже после того, как ее обманывали. Другая программа (с названием ALL D) была полной противоположностью: она предавала своего оппонента в каждом раунде игры, без исключений. Остальные алгоритмы располагались посредине. Некоторые из наиболее сложных программ большую часть времени вели себя дружелюбно, но время от времени пытались совершить предательство, чтобы получить преимущество. Одна программа под названием «Проверяющий» (Tester) следила за действиями других игроков, чтобы понять, что может сойти ей с рук, и давала задний ход, если ее застигали врасплох с рукой в банке с печеньем.
Какая нравственная система в итоге оказалась лучшей? К огромному удивлению исследователей, турнир выиграла самая простая из предоставленных программ. Она состояла всего из двух строк кода и действовала по знакомому нам с детства принципу «око за око» (tit for tat).
Все действия этой программы сводились к следующему: она сотрудничала в первом раунде дилеммы заключенного, а в каждом последующем раунде повторяла предыдущее действие оппонента. В предыдущем раунде вы сотрудничали? Значит, я буду сотрудничать в этом раунде. В прошлом раунде вы меня предали? Я предам вас в ответ.
Эта простая программа выкосила всех конкурентов и вышла на первое место. Поэтому Аксельрод снова устроил соревнование. Он обратился к другим экспертам и на этот раз собрал 62 участника. Были предложены и более сложные алгоритмы. Были даже вариации на тему «око за око». Кто выиграл?
Простейшая программа «Око за око». Снова.
Какой волшебной силой обладала эта простая и скромная стратегия? По мнению Аксельрода, все сводилось к нескольким ключевым факторам.
Он увидел то же, что мы заметили при сравнении методов «плохишей» и альтруистичного подхода дающих: в первое время хорошие парни оказываются в проигрыше. Аналогично ситуации, описанной в статье «Плохое сильнее хорошего», в начале взаимодействия плохие парни быстро заняли верхние позиции. Даже победившая в итоге программа «Око за око» вначале всегда проигрывала, потому что ее первым шагом было сотрудничество.
Плохие парни быстро получали свою выгоду, но затем начинали стремительно отставать от алгоритмов, основанных на сотрудничестве. Сталкиваясь с сотрудничающим на каждом ходу алгоритмом, «Око за око» получала огромное преимущество. Даже программы вроде «Проверяющего» (которые опускали руку в банку с печеньем) понимали, что сотрудничество более выгодно, чем периодические выигрыши от предательства.
Программа «Око за око» имела ряд преимуществ. Начинала она всегда с сотрудничества и тем самым демонстрировала добрую волю. При контакте с «добрыми» программами это означало быстрое начало взаимодействия и набор очков. У агрессивных программ не было шанса набрать обороты, так что они, по сути, превращались в «хороших парней». Что касается алгоритмов, созданных по типу «Проверяющего», при взаимодействии с ними «Око за око» демонстрировала готовность наказать за предательство. Никакой бесхарактерности. Поэтому эти программы начали подстраиваться.
Как только они переходили к сотрудничеству, «Око за око» начинала демонстрировать им свое лучшее достоинство – умение
Но на этом Аксельрод не остановился. Вместе с другими исследователями он попробовал составить еще более эффективный алгоритм. «Око за око» победила в двух больших турнирах, но можно ли создать истинного суперхищника, который разбил бы конкурентов в пух и прах? Оказывается, это было возможно. Нужно ли было сделать алгоритм более агрессивным? Нет. Наоборот, нужно было усилить его положительную составляющую, а именно способность прощать.
Аксельрод с коллегами убедились в том, что их доработанное «великодушное “Око за око”» еще успешнее первоначальной версии. Теперь этот алгоритм не просто каждый раз повторял предыдущий ход оппонента, но и периодически прощал ему предательство и отвечал сотрудничеством. Из-за этого программа уступила чуть больше очков агрессивным алгоритмам вроде ALL D, но потери более чем компенсировались огромными прибылями за счет того, что она вытягивала потенциально «хорошие» программы из нисходящей петли. (Мужчины, иногда соглашайтесь с женами и признавайте свою неправоту, даже если они ведут себя совершенно неадекватно. Вы же знаете, что в конечном итоге их намерения благие, так зачем разрушать брак из-за цвета стен в гараже?)
Основными причинами успеха алгоритма «Око за око» было то, что он сотрудничал и умел прощать, был понятен и предсказуем для других игроков, а при необходимости мог наказывать.
Уверен, вы уже замечаете некоторые параллели с тем, что обсуждалось ранее, но давайте окончательно убедимся в том, что принципы этой простой игры могут привести к огромному успеху в реальной жизни.
Молдова – это все равно что страна ALL D. Конечно, там есть некоторые потенциально хорошие «программы», но все они переходят на темную сторону. И хороших парней истребляют поодиночке. Если бы хорошие парни Молдовы могли собраться вместе и объединиться, они быстро обрели бы опору под ногами. Но этого не происходит. Они совершают благие дела и подают сигналы в попытке найти других хороших парней, но эти же сигналы их выдают: по писку голодных цыплят мама-курица определит, куда бежать и кормить своих детей, но и голодный кот их тоже найдет. А котов в бедной, несчастной Молдове значительно больше, чем мам-куриц.
Пираты не стали бы терпеть ALL D. В таком демократичном сообществе с правилами, предписывающими поровну делить добычу между всеми, этого эгоиста выбросили бы за борт. Даже если бы он был главарем, то недолго продержался бы на своем месте, потому что капитаны подчинялись общим правилам. И правила принимались только единогласно. Полному эгоисту было бы трудно остаться на борту обманным путем.
А что, если добавить еще больше характеристик адам-грантовского дающего? Что, если бы пираты, вместо того чтобы грабить всех непиратов, начали с ними сотрудничать, поначалу на минимальном уровне? Что, если бы вместо одного пиратского корабля или небольшой группы кораблей они создали намного более обширную сеть? Возможно, у королевского флота не осталось бы ни шанса…
Агрессивная стратегия «плохих парней» исходно базируется на двух допущениях, которые на самом деле не так уж часто оправдываются в реальном мире. Первое допущение заключается в том, что все последующие раунды игры будут похожи на начальный. Во время турнира многие программы, включая «Око за око», следили за предыдущими ходами оппонентов и реагировали соответственно, наказывая за плохое поведение. В жизни тоже так бывает. Мы зарабатываем определенную репутацию. В большинстве случаев мы взаимодействуем с окружающими не анонимно. Как правило, мы постоянно имеем дело с одними и теми же людьми.