Кибернетика или управление и связь в животном и машине
Шрифт:
Существуют игры, как, например, в крестики и нулики, где вся стратегия известна и такую политику можно проводить с самого начала. Если это возможно, то это явно наилучший способ игры. Но во многих играх, как шахматы и шашки, наше знание недостаточно для полного осуществления подобной стратегии, и тогда мы можем лишь приблизиться к ней. Приближенная теория в стиле фон Неймана, как правило, учит игрока действовать с крайней осторожностью, исходя из допущения, что его противник — совершенный мастер.
Однако такая установка не всегда оправданна. На войне, являющейся родом игры, она, как правило, будет вести к нерешительным действиям, которые во многих случаях будут немногим лучше поражения. Приведу два исторических примера. Когда Наполеон сражался с австрийцами в Италии, его успех был обусловлен отчасти тем, что ему было известно ограниченное и традиционное военное
Итак, в обоих случаях руководящим принципом была известная репутация командира и его противников, проявившаяся статистически в их прошлых действиях, а не стремление проводить совершенную игру против совершенного противника. Непосредственное применение метода фон Неймана в этих случаях не принесло бы пользы. [c.255]
Подобно этому, учебники шахматной теории написаны не с точки зрения фон Неймана. Они представляют собой собрания принципов, извлеченных из практического опыта шахматистов, игравших против других шахматистов высокой квалификации и больших знаний, и устанавливают определенные стоимости или веса, присваиваемые потере каждой фигуры, подвижности, господству над пространством, развитию сил и другим факторам, изменяющимся в ходе партии.
Не очень трудно сделать машины, которые будут играть в шахматы каким-то образом. Простое соблюдение законов игры, при котором делаются лишь разрешенные ходы, легко осуществимо на весьма простых вычислительных машинах. Для этой цели нетрудно приспособить обычную цифровую машину.
Теперь встает вопрос о политике в рамках правил игры. Всякие оценки фигур, господства, подвижности и т. д. внутренне допускают сведение к количественным выражениям, и, когда это сделано, становится возможным применить принципы шахматного учебника, чтобы на каждой стадии найти лучшие ходы. Такие машины созданы, и они будут играть очень хорошие любительские партии, но пока что не партии на уровне мастера.
Представьте себе, что вы играете в шахматы против такой машины. Чтобы сделать ситуацию справедливой, предположим, что вы играете заочно, не зная, что играете против машин, и, следовательно, без предубеждений. Естественно, как всегда бывает в шахматной игре, вы составите некоторое суждение о шахматной индивидуальности вашего противника. Вы обнаружите, что, когда на доске возникает дважды одно и то же положение, ваш противник будет реагировать каждый раз одинаковым образом, и вы решите, что его поведение весьма негибкое. Если какой-нибудь из ваших приемов достигнет цели, то этот прием всегда будет достигать цели при тех же самых условиях. Поэтому искусному игроку не очень трудно выработать надлежащую линию игры против противника-машины и все время обыгрывать ее.
Однако существуют машины, которые нельзя обыграть так тривиально. Предположим, что машина через каждые несколько игр делает перерыв и использует свои способности для другой цели. На этот раз она не [c.256] играет с противником, но исследует все предшествующие партии, записанные у нее в памяти, чтобы определить, какие веса различных оценок фигур, господства, подвижности и т. п. приводят чаще всего к выигрышу. Таким образом, она учится не только на своих неудачах, но и на успехах противника. После этого она заменяет свои прежние оценки новыми и начинает играть как другая, лучшая машина. Такая машина уже не будет иметь жесткой индивидуальности, и приемы, бывшие прежде успешными против нее, потерпят в конце концов неудачу. Более того, она может стечением времени усвоить нечто из стратегии своих противников.
Все это очень трудно осуществить в шахматах, и на практике метод не был разработан настолько, чтобы создать машину, способную играть в шахматы как мастер. Шашки представляют более легкую задачу. Равноценность фигур значительно
В этой книге уже упоминалась, в связи с задачей предсказания, идея сочетать программирование первого порядка, которое может быть в ряде случаев линейным, с программированием второго порядка, в котором для выбора стратегии, применяемой при программировании первого порядка, используется гораздо больший отрезок прошлого. Предсказывающее устройство использует [c.257] ближайшее прошлое полета самолета для предсказания будущего при помощи линейной операции; но отыскание правильной линейной операции есть статистическая задача, в которой долгое прошлое этого полета и прошлое многих подобных полетов используются для получения статистической основы.
Статистические исследования, необходимые для того, чтобы почерпать из долгого прошлого стратегию, предназначенную для короткого прошлого, являются в высшей мере нелинейными. Так, при использовании для предсказания уравнения Винера — Гопфа [181] коэффициенты уравнения разыскиваются нелинейным методом. В общем случае обучающаяся машина действует при помощи нелинейной обратной связи. Шашечная машина, описанная Сэмьюэлом [182] и Ватанабе [183] , может выучиться обыгрывать своего программиста вполне закономерным образом после 10—20 рабочих часов программирования.
181
Wiener N. Extrapolation, Interpolation, and Smoothing of Stationary Time Series with Engineering Applications. — New York: The Technology Press of M.I.Т., and J. Wiley & Sons, 1949.
182
Samuel A.L. Some Studies in Machine Learning: Using the Game of Checkers. // IBM Journal of Research and Development. — 1959. — Vol. 3. — P. 210—229.
183
Watanabe S. Information Theoretical Analysis of Multivariate Correlation. // IBM Journal of Research and Development. — 1960. — Vol. 4. — P. 66—82.
Философские идеи Ватанабе о применении программирующих машин чрезвычайно интересны. С одной стороны, метод доказательства элементарной геометрической теоремы, оптимальным образом отвечающий определенным критериям изящества и простоты, рассматривается Ватанабе как обучение игре, но не против индивидуального противника, а против, так сказать, «полковника Боуги» [184] . Другая игра, исследуемая Ватанабе, ведется при логической индукции, когда, желая построить теорию, оптимальную в таком же квазиэстетическом смысле, исходя из оценки экономичности, прямоты и т. п., мы определяем значения конечного числа параметров, оставленных свободными. Несмотря на ограниченность такой логической индуктивной игры, она вполне заслуживает изучения. [c.258]
184
Полковник Боуги (Coloner Bogey) — воображаемый игрок, который всегда играет безупречно (в гольфе). — Прим. ред.
#Бояръ-Аниме. Газлайтер. Том 11
11. История Телепата
Фантастика:
фэнтези
попаданцы
аниме
рейтинг книги
Темный Лекарь 4
4. Темный Лекарь
Фантастика:
фэнтези
аниме
рейтинг книги
Тагу. Рассказы и повести
Проза:
советская классическая проза
рейтинг книги
Сама себе хозяйка
Любовные романы:
любовно-фантастические романы
рейтинг книги
В прятки с отчаянием
Детективы:
триллеры
рейтинг книги
Вечный зов. Том I
Проза:
советская классическая проза
рейтинг книги
Боярышня Дуняша
1. Боярышня
Фантастика:
попаданцы
альтернативная история
рейтинг книги
Диверсант. Дилогия
Фантастика:
альтернативная история
рейтинг книги
