Мы, собаки и другие животные: Записки дрессировщика
Шрифт:
Сначала о том, что формирует поведение, делает его более частым.
Положительное (позитивное) подкрепление — процесс вознаграждения за выполненное действие, правильное поведение. Подкреплять можно игрой, едой, одобрением (похвалой, поглаживанием). Положительное подкрепление, по сути, это достижение конкретного результата в моменте. Последовательное его применение в перспективе формирует правильное поведение.
Для запоминания: положительное подкрепление — главный, но в ряде случаев недостаточный инструмент в формировании и автоматизации навыка.
Отрицательное (негативное) подкрепление —
Кстати, в классической теории условных рефлексов есть понятие суммации, когда серийное воздействие малозначимых по силе стимулов суммируется и в конце концов становится значимым и эффективным. Пример из истории человечества — известная китайская пытка, когда узнику в колодках на голову ритмично падали капли — и он в результате сходил с ума. Отдельная упавшая на голову капля особого эффекта на человека не производит, но, когда эти капли ритмично падают на голову целый день, их воздействие суммируется и становится непереносимым.
Классика негативного подкрепления в экспериментах Скиннера — это непрерывная струя воздуха, направленная точно в глаз голубя для изменения его поведения. Серия рывков поводком, длительное надавливание на круп собаки тоже варианты негативного подкрепления.
Для запоминания: с помощью негативного подкрепления можно формировать навыки и (или) их автоматизировать.
Теперь о том, что прекращает поведение или делает его более редким.
Позитивное наказание — неприятное воздействие в момент, когда собака совершает нежелательное действие. При этом ожидаемый собакой результат не достигается, новое поведение не формируется. Согласно теории Скиннера, в перспективе частота нежелательных действий снижается. Здесь можно использовать и стимульный контроль, когда подается предупреждающий сигнал (команда, предотвращающая действия), например «нет», «фу».
К слову, киноманы помнят, что позитивное наказание с помощью специального шлема (по сути, аналога радиоэлектронного ошейника) к самому себе применял Шелдон Купер в серале «Теория Большого взрыва», когда отвлекался на темы, мешающие решению математических задач. Отвлекся — получи удар током. По логике означенного персонажа он должен был меньше отвлекаться. По тому же принципу в зоопарках используется электропастух.
Ну а мы, скромные собаководы, с помощью ощутимого разового отрицательного воздействия (слабый удар током, выстрел из рогатки) отучаем собаку «пылесосить» — есть что-то с земли. Один раз возьмет, второй, а на третий — не станет. Достаточно жесткий, но эффективный метод, спасший жизнь не одной собаке. Важное дополнение: воздействовать нужно непосредственно в момент совершения деяния, и тут все разумные люди солидарны с классиками-бихевиористами. По существу, позитивное наказание как бы говорит собаке: не делай этого больше никогда!
В системной дрессировке категорически неправильно просто ударить собаку током, крикнуть «нельзя!» и оставить ее с этим грустным фактом. Нужно дать питомцу что-то взамен. Прекратила безобразие? Теперь сделай что-то — и получишь награду. В результате эмоциональный негатив превращается в позитив.
Допустим, собака получила удар током во время попытки взять корм с земли. Системный дрессировщик сразу же предложит ей выполнить какую-нибудь команду, например «ко мне». Этим он переключит ее внимание и при правильном выполнении новой задачи животное
Это не имеет прямого отношения к позитивному наказанию, но вспомнилось, что в 1990-е гг., когда собак готовили к разным провокациям со стороны всевозможных асоциальных элементов, использовался и такой метод: собаке, которая находилась на привязи или на поводке рядом с хозяином, специально подбрасывали корм. Вслед за болевым воздействием, если собака была «жесткая» и боль ожидаемо вызывала у нее переадресованную агрессию, следовало подкрепление этой агрессии хваткой. Так собаке давали возможность укусить провоцировавшего ее злодея.
Для запоминания: позитивное наказание «по-бихевиористски» — это разовое отрицательное воздействие в терминологии системной дрессировки.
Негативное наказание — прием обучения, использующий прекращение позитивного подкрепления. Эдакий дрессировочный вариант даосского принципа недеяния — боли и тактильного дискомфорта тут нет. В системной дрессировке (термины которой, повторю, в большей степени методические, нежели научные) негативное наказание — это не что иное, как игнорирование, оно же неподкрепление. Поведение перестает подкрепляться, и это делает его более редким. Другими словами, создается ситуация, когда привычно результативное поведение внезапно перестает быть таковым, сходит на нет, угасает — и это ведет к поиску новых форм поведения.
Негативное наказание применяется для прекращения нежелательных действий животного. Собаки зачастую используют баловство разного рода просто для того, чтобы хозяин обратил на них внимание. Все просто и, в общем, старо как мир. К примеру, если вы не хотите, чтобы собака непрерывно приставала к вам, предлагая играть, перестаньте обращать на нее внимание. Не хотите, чтобы ваша собака подралась с другой, — не подкрепляйте ее решимость жестами, натянутым поводком (он умножает уверенность собаки, дает ощущение хозяйской поддержки) и криками «фу!», «пошла отсюда!» (они ее только возбуждают). Просто развернитесь и идите в другую сторону.
Использование этого приема также эффективно при борьбе с агрессией собаки, направленной на хозяев. Надев собаке намордник, вы лишаете ее возможности подкрепить агрессию укусом. А не подкрепив атаку своим поведением (не ответив ей, не дернувшись, не закричав от боли), то есть проигнорировав ее, вы ставите собаку в тупик, ибо ваше поведение расходится с тем, чего она ожидает. В результате ее поведение становится нерезультативным.
Ремарка для поклонников полицейской дрессировки и ринг-спорта: именно поэтому в полицейских нормативах нидерландского КНПВ есть проверка способности собаки бороться с несопротивляющимся, замершим после задержания помощником. Ее поведение не должно угасать в результате неподкрепления, ей нужно удерживать нарушителя до команды проводника.
Для запоминания: негативное наказание равно игнорированию (неподкреплению). Небольшое отступление. Как бороться с негативом и скукой
Теоретики «дрессировочного позитивизма», как правило, советуют все нежелательные формы поведения «лечить» с помощью системы положительных подкреплений. Такой подход вызывает множество вопросов. Конечно, плохое поведение можно прекратить разными способами, и самый очевидный — сформировать другое поведение, перенаправить деятельность собаки. А вот если собака грызет мебель, то сформировать абстрактное поведение «я не грызу мебель», невозможно, потому что непонятно, каким образом нужно подкреплять такого рода «недеяние».