1. Нравится ли собаке учиться?
Почему утром мы просыпаемся и встаем с кровати, затем умываемся, одеваемся, завтракаем и добираемся тем или иным транспортом до работы? Отчего на работе одни из нас отдают все свои силы, другие отбывают там время по необходимости? Однако и те и другие обедают, а, возвращаясь домой после работы, заходят в магазины, ужинают, смотрят телевизор, ложатся спать. Помимо этого мы учимся, много читаем, посещаем выставки и концерты, кино и театр, общаемся со знакомыми, занимаемся спортом, ходим в походы, строим дома и дачи, рожаем и воспитываем детей, заводим животных.
Зачем все это нам нужно? Почему мы делаем это изо дня в день, из года в год? Что движет нами? К чему мы стремимся? На эти и многие другие вопросы, включая и заданный нами в заголовке, позволяет дать ответы теория функциональных систем, разработанная более 50 лет тому назад академиком П.К.Анохиным.
С позиции теории функциональных систем наше с вами поведение в основном определяют естественные биологические и социальные потребности. Другими словами, когда мы хотим есть, то готовим еду или идем в столовую. Если хочется пить – наливаем себе воду или ищем автоматы с газировкой. В том же случае, если на нас мчится автомобиль, отскакиваем в сторону.
Поведение собак также определяют биологические и «социальные» потребности; в этом мы очень похожи друг на друга и, видимо, оттого наша многовековая дружба и взаимодействие приносят нам столько радости и тепла.
Несмотря на то, что одновременно потребностей у человека и собаки может быть несколько, в каждый конкретный момент в реальное поведение может преобразоваться лишь одна из них – наиболее сильная. Например, если вам хочется и есть, и спать, и читать, то вы сначала поедите, потом почитаете и лишь затем уснете. В том же случае, если спать хочется очень сильно, вам будет не до еды и не до книги. И у собаки обычно бывает в одно и то же время несколько потребностей, но в каждый конкретный момент доминирует и удовлетворяется лишь одна из них. Например, если собака играет, то есть удовлетворяет ее потребность в игре, это не значит, что при этом у нее нет потребности в еде, воде или половом партнере.
Значит, характер поведения человека, собаки или любого другого существа определяется в основном той потребностью организма, которая в настоящее время доминирует, то есть является более сильной.
При этом все действия человека или животного направлены на достижение вполне определенного результата – частичное или полное удовлетворение этой потребности. Однако для того, чтобы доминирующая потребность была полностью удовлетворена, необходимо сложное по своей структуре целенаправленное поведение. В основе его лежит функциональный принцип организации. Попытаемся проиллюстрировать закономерности, его определяющие, на примерах пищевого поведения человека и собаки.
Предположим, что, находясь на рабочем месте, вы захотели есть, однако, как это не печально, пока не настанет время обеда, вам не удастся утолить голод. Ну вот, наконец, можно идти обедать. Тут вы, привлекая свою память, анализируете обстановку. «Диетическая столовая,- думаете вы,- находится недалеко, но там в последнее время плохо готовят. Кафе «Орленок» закрыто на ремонт. В ресторане «Восход» приходится долго ждать, пока обслужат, а мне надо успеть до конца перерыва купить продукты; к тому же там дорого. Столовая №8 находится в 10 минутах езды на трамвае, там кормят неплохо, недорого и быстро, рядом есть большой гастроном». Выбор сделан – вы решили ехать в столовую №8. Однако, проходя мимо кафе «Орленок», видите, что оно открыто, ремонт закончился. Вы идете обедать туда. Зайдя в кафе, в соответствии со степенью голода и своим вкусом выбираете блюда, порой осуществляя замену их уже на подносе. После чего садитесь за стол и потребляете пищу. После окончания еды, если вы недостаточно сыты, то можете взять дополнительную порцию, а потом, если хватит времени – отправитесь удовлетворять другую свою потребность (пойдете в магазин за продуктами)…
Закономерности, лежащие в основе функциональной системы поведения человека, можно представить следующим образом.
Вы почувствовали голод; а что, собственно это значит? Голод – это прежде всего ваше субъективное ощущение дискомфорта, то есть отрицательное эмоциональное состояние, связанное с недостатком питательных веществ в организме. Другими словами, организм извещает мозг посредством определенных биохимических сигналов, что существует потребность в пище. Эти сигналы запускают деятельность особых центров мозга (мотивационных), формируется мотивационное возбуждение, распространяющееся на различные области мозга.
В результате вы начинаете чувствовать голод и реальное желание пойти подкрепиться – начинает доминировать пищевая мотивация. Пищевая мотивация возникает заранее, с большим опережением во времени, а не тогда, когда организм уже обессилел от истощения. Доминирующая мотивация является мощным направляющим и организующим фактором поведения, объединяя вполне определенные структуры мозга. Пищевая мотивация активирует также наследственную (генетическую) и приобретенную память.
Это значит, что, захотев есть, вы начинаете вспоминать все, что когда-либо было связано с удовлетворением пищевой потребности в данных конкретных условиях. Ведь опыт добычи пищи в тайге, в тундре, в тропиках и городе различен. В описанном нами примере вы начинаете проигрывать возможные варианты обедов в том или ином общественном заведении. В том случае, если поблизости от предприятия, где вы работаете, нет ни кафе, ни столовых, ни гастронома, а еду из дома вы не захватили, то пищевая потребность не может быть удовлетворена.
Таким образом, доминирующая мотивация может реализовываться в целенаправленное поведение только во вполне определенных условиях. В нашем случае одним из важнейших факторов обстановки является перерыв на обед и наличие столовой. Получается, что для реализации любой доминирующей мотивации необходимо присутствие вполне определенных стимулов – обстановочных и санкционирующего («разрешающего»). В данном примере санкционирующим стимулом является время обеда, установленное правилами внутреннего распорядка работы предприятия.
Итак, обстановка благоприятствует, однако, перед тем, как идти обедать вы выбираете вполне определенное место обеда, отсеивая непригодные варианты. Иными словами, из нескольких возможных решений вы принимаете единственное, как вам кажется, правильное. На этом этапе вы уже заранее предвидите конечный результат своего обеденного похода: у вас есть модель будущего результата поведения. Это предвидение обеспечивается специфическим механизмом, так называемым акцептором результата действия. Акцептор результата действия позволяет с опережением во времени предвосхищать успех или неуспех задуманного поступка, исправлять поведение походу, а также сличать предполагаемый (модельный) результат с реально полученным.
Скажем, перед тем как пойти поесть, вы с высокой точностью предусматриваете все возможные варианты обедов и их качество в том или ином предприятии питания, а при движении в столовую осуществляете коррекцию своих действий и целенаправленно меняете место обеда. Попав в кафе «Орленок», вы отбираете блюда, оцениваете их вкусовые качества, внешний вид, а после обеда – степень своей сытости. В том случае, если голод не утолен, вы производите дополнительные действия, позволяющие достигнуть конечного результата, то есть полностью насытиться. Именно на этих этапах реализации поведения наиболее активно функционирует механизм предвидения его результата.
Исходя из концепции К.В.Судакова, целостное поведения человека и животных можно поделить на отдельные структурные единицы - «кванты». Каждый «квант» формируется доминирующей потребностью организма и завершается при большем или меньшем ее удовлетворении.
В основе «кванта» поведения лежат уже знакомые нам принципы организации функциональной системы. Поведенческая деятельность собаки также состоит из «квантов». Поведенческий «квант» в процессе дрессировки, по-видимому, будет соответствовать одной реализации
навыка.
Н а в ы к о м называется определенная последовательность действий собаки, позволяющая ей с высокой вероятностью достигать приспособительного результата ( то есть частичного или полного удовлетворения потребности). Например, прыгнув по команде, собака получает кусочек пищи, то есть частично удовлетворяет потребность в пище.
Итак, на простом примере пищедобывательного поведения мы рассмотрели основные закономерности, лежащие в основе любой целенаправленной деятельности, нашей с вами в том числе. Можно ли провести какую либо аналогию между поведением дрессировщика и его собаки? Какие общие законы лежат в их основе? Попытаемся ответить на эти и заданные ранее вопросы, проанализировав поведение собаки во время дрессировки при обучении ее навыку апортировки (подноски предметов). Навык апортировки может быть выработан на базе различных потребностей животного: в пище, игре, самосохранении.
Например, мы с вами решили обучать собаку, используя ее потребность в пище. При каких условиях нам это удается? Во-первых, если мы сможем заинтересовать собаку, объяснив ей, что, подав апортировочный предмет в руки владельца, она обязательно получит лакомый кусочек; во-вторых, если создадим такие условия, в которых пищевая мотивация станет доминирующей. Чтобы добиться этого, мы организуем кормление собаки так, что основную часть своего рациона она будет получать во время работы. Именно это позволит нам объяснить собаке, что для того, чтобы получать пищу, нужно работать, и что, выполняя требуемую работу, можно насытиться.
При соблюдении этих условий пищевая потребность легко трансформируется в пищевую мотивацию. А мотивация, в свою очередь, активирует в памяти животного то, что связано с процессом его обучения навыку подноски предметов и удовлетворения при этом пищевой потребности. Предположим, что дрессируемая собака имеет незначительный опыт обучения апортировке и оттого не всегда точно и умело подает предмет непосредственно в руки владельца. Однако делает она это с большим желанием. Увидев палку в руках дрессировщика, собака внимательно наблюдает за его движениями, ожидая команды «Апорт», взмаха рукой и броска предмета (в нашем случае она ведет себя так потому, что хочет есть). Одновременно с этим она оценивает и окружающую обстановку. Знание обстановки необходимо собаке для того, чтобы с опережением во времени «планировать» свою деятельность, в том числе и пищевое поведение. Например, в том случае, если дрессировщик забыл взять с собой на занятия пищу или на дрессировочной площадке находятся «враги» обучаемой собаки, то отработка навыка апортировки на базе пищевой мотивации вряд ли будет возможна.
Но вот дрессировщик взмахнул палкой и подал команду «Апорт»; собака, наблюдая за движением его руки еще до того, как полетит палка, определяет направление и дальность броска, то есть мгновенно оценивает характер обстановочных стимулов (направление, силу взмаха). Взмах руки и команда в данном случае являются санкционирующими («разрешающими») стимулами, поэтому сразу после броска собака стремительно бежит к палке… Пока она подбегает к ней, вспомним, как вы выбирали место обеда, перебирая в уме возможные варианты. Примерно таким же образом, но только очень быстро, собака из нескольких программ поведения выбирает одну и принимает единственное решение из нескольких возможных (ведь направлений бега может быть много). Место падения палки собака определяет, используя свою способность к экстраполяции направления заранее, то есть у нее, как и у нас с вами, имеется аппарат предвидения результата поведения – акцептор результата действия.
Вот собака добежала и схватила палку, но сделала это неудачно и уронила ее. Животное тотчас же исправилось и бегом двинулось в сторону владельца. Поднеся предмет, собака остановилась. Однако до того как хозяин взял палку и подал команду «Дай», собака бросила ее и потянулась за лакомством. Но пищу она не получила, так как хозяин не одобрил ее поведения. Указав на палку, он вновь подал команду «Апорт». Собака поскулила, но затем исправилась – схватила палку и подала ее дрессировщику в руки, за что тут же получила кусочек пищи, то есть достигла того результата, к которому все время стремилась.
После того, как результат достигнут или не достигнут (то есть животное получило или не получило подкрепление), обязательно оценивается эффективность деятельности. Животное сопоставляет тот результат, который заранее запланирован, с результатом, полученным в процессе поведенческой деятельности. Именно в этот момент сопоставления наиболее активно функционирует механизм предвидения результата поведения.
Предположим, что в процессе дрессировки мы все время допускаем одну и ту же ошибку: как только собака подносит брошенный предмет, мы, не взяв его в руки, хвалим ее и достаем лакомство. Увидев пищу, собака тянется к ней, ожидая подкрепления, и бросает апортировочный предмет. Но пищу не дают: для собаки реальный результат поведения не соответствует ожидаемому. В этом случае функциональная система поведения животного перестраивается, осуществляется новое исправление программ поведения, принимаются новые решения, предпринимаются все новые и новые попытки удовлетворения пищевой потребности.
Если мы ни разу не дадим лакомство, то собака откажется от дальнейшего выполнения навыка. Это объясняется тем, что сила пищевой мотивации, направляющей поведение, в связи с нерезультативностью поведения, падает (то есть, уменьшается заинтересованность собаки в работе). Это происходит несмотря на то, что потребность в пище у собаки объективно сохраняется на прежнем уровне.
Если же мы будем давать собаке пищу, хотя она и бросает палку, то тем самым восстановим пищевую мотивацию, повысив результативность ее поведения. Однако, в конечном итоге, наши действия приведут к тому, что собака начнет бросать апортировочный предмет целенаправленно, поскольку именно такие действия влекут за собой получение пищи.
Дрессировщику следует также учитывать, что во время дрессировки собаки в любой момент вместо пищевой может сформироваться и другая мотивация.
Вот на дрессировочной площадке появляется другая собака. Она весьма агрессивно настроена по отношению к нашей. И тут исчезнет пищевая мотивация, а с ней и поведение собаки, направленное на подноску предметов. Более сильной станет мотивация, основанная на потребности собаки в самосохранении. Появится поведение избегания или агрессия.
Если же рядом окажутся друзья нашей собаки, то пищевая мотивация может уступить игровой. В этом случае занятия по апортировке все равно придется приостановить и полюбоваться на играющих собак. Если собака наедается во время занятия, добиваясь искомого результата – полного удовлетворения пищевой потребности – то функциональная система данного поведения распадается: пищевая мотивация перестает доминировать, изменяется направленность поведения собаки.
Иначе говоря, если во время занятий вдруг появились другие собаки, то не злитесь на своего друга за непослушание, а выждите немного, пока пищевая мотивация вновь начнет доминировать («голод – не тетка»). Сытую собаку дрессировать на базе пищевой мотивации бессмысленно.
Учиться собаки любят лишь тогда, когда это им интересно, то есть когда они удовлетворяют те или иные свои потребности.
Таким образом, на примере небольшого упрощенного дрессировочного фрагмента мы рассмотрели закономерности достаточно сложного целенаправленного поведения собаки, базирующегося на пищевой мотивации. Эти закономерности лежат в основе многих навыков, формируемых в процессе дрессировки.
Я надеюсь, что знание этих закономерностей поможет перестроить отношение дрессировщика и к самому процессу дрессировки, и к его деятельному участнику – собаке.
2. Как добиться эффективной дрессировки, сохранив доверие и взаимопонимание.
Многие дрессировщики считают, что если они обучают собаку, то успех зависит от них, и только от них. На самом деле, это не так. Активный участник процесса дрессировки – собака.
Если внимательно понаблюдать за отношениями дрессировщика и его собаки, можно увидеть, что некоторые собаки в значительно большей степени овладели искусством дрессировки, нежели их хозяева. Отдрессировав своего владельца как следует, они рано утром или поздно вечером выводят его погулять вместе с собой, попрыгать через сугробы и заборы, побегать за другими собаками…
Как мы заметили выше, поведение собаки в принципе подчиняется тем же законам, что и поведение обучающего его дрессировщика. Вот почему при формировании любого навыка необходим взаимный интерес с обеих сторон. Нужно не простое взаимодействие, а выгодное взаимосодействие партнеров. Взаимная заинтересованность дрессировщика и его собаки основана как на обоюдных положительных и отрицательных воздействиях, так и на социально-ролевых отношениях между ними.
Например, обучая собаку навыку прыжка через препятствие, каждое выполнение ею навыка вы поощряете дачей пищи, игрой, всячески одобряя при этом ее поведение (то есть удовлетворяете ее потребность и в пище, и в игре, а также «социальную» потребность – угодить «лидеру»). Вы же, в свою очередь, также удовлетворяете различные собственные интересы (мотивации). Например, вам хочется, чтобы ваша собака прыгала не хуже других, а лучше. Возможно, вы считаете, что она должна прыгать для того, чтобы поддерживать хорошую физическую форму. А может, вам нужен диплом по общему курсу дрессировки, чтобы собаку допустили на выставку…
Все же результат деятельности собаки в процессе дрессировки, как правило, в большей степени зависит от дрессировщика, чем от нее самой. Иными словами, от вас и только от вас зависит, сможет ли собака в процессе обучения и повседневного общения с вами удовлетворять свои интересы (потребности). А это важно прежде всего потому, что этим определяется ее заинтересованность в работе и характер складывающихся между вами отношений. Однако успех дрессировки в целом зависит от обоих участников, взаимные интересы которых сочетаются с взаимными обязанностями.
3. Отчего одна собака слушается своего хозяина, а другая нет?
Живя в семье человека, собака все же остается собакой и воспринимает семью, как собачью стаю. Она переносит законы, лежащие в основе организации стаи, на отношения с человеком. Что это значит? В каждой стае есть вожак – лидер, которого каждый из членов стаи обязан слушаться, его «слово» - закон для подчиненных. Есть в стаях и особи низшего ранга, которые подчиняются всем, и каждый член стаи может помыкать ими по своему усмотрению. Однако, между высшей ступенью, на которой стоит лидер, и низшей есть и промежуточные ранги.
Вырастая, собака занимает в человеческой семье определенное ранговое место. Если оно высшее, то она, как лидер, который диктует свои условия остальным членам семьи – становится «диктатором». Я знал, например, одного колли, который не любил звуков пылесоса и кофемолки. При шуме этих приборов собака не тряслась от страха, не пряталась в дальний угол – наоборот, показывала зубы, рычала, а если ее не понимали, то и могла схватить за ногу или за руку. Хозяин собаки подчинялся ей и выключал работающий прибор. В результате успех дрессировки владельца собакой был налицо. А если собака не любит мыть лапы после прогулки – рычит и хватает за руки, и хозяин отступает? Кто кого дрессирует? Таких примеров можно привести множество.
Если вы хотите добиться успеха, дрессируя свою собаку, то вам совершенно необходимо быть по отношению к ней лидером.
Однако лидеры бывают разные. Некоторые владельцы, являясь несомненными лидерами для своей собаки, порой самоутверждаясь за ее счет, излишне подавляют индивидуальность четвероногого друга. Это настолько «обезличивает» собаку, что в результате она превращается в жалкое, забитое животное. Такая собака, как правило, не способна к самостоятельному несению службы, в частности, не может охранять квартиру.
Другой вариант: хозяин становится лидером лишь в определенной ситуации, например, на дрессировочной площадке, а в обыденном общении пускает все на самотек. Это тоже может приводить к неприятностям. Помню кобеля немецкой овчарки, послушного и хорошо управляемого на улице. Дома же он резко менял свое поведение! Он не только не слушался своих владельцев, но и сам управлял ими. В квартире он запрещал им говорить по телефону, не выпускал из дома, заставлял себя гладить, угрожающе рычал, если они отказывались это делать…
Успех дрессировки возможен лишь в том случае, если хозяин всегда, независимо от ситуации, является лидером для собаки. Важно также и то, что лидерство не превращалось в тиранство, иначе в результате такого воспитания вместо преданного друга вырастает «безликое», подавленное существо.
Желательно также, чтобы и остальные члены семьи были выше по своему ранговому положению, нежели собака. Ведь согласно законам стаи, во время отсутствия вожака лидирующее положение в большинстве случаев начинать занимать животное, стоящее на следующей после лидера ступени «табели на рангах». Если собака слушается только дрессировщика, а он уедет в командировку, пес тотчас же займет его место лидера. В результате он будет либо управлять поведением оставшихся домочадцев, или же просто не станет их слушаться.
Для того чтобы правильно наладить взаимовыгодные отношения с собакой и успешно управлять ее поведением, необходимо знать основные правила и принципы обучения и дрессировки. А дрессировка для собаки совершенно необходима еще и потому, что в процессе обучения ее мозг развивается быстрее и она становится гораздо понятливее и умнее.
4. Какие основные принципы лежат в основе обучения и дрессировки?
А теперь давайте разберемся в том, что такое обучение и какие методы его можно использовать для дрессировки собак. И на эти вопросы мы тоже попытаемся ответить с помощью теории функциональных систем П.К. Анохина.
Обучение – это процесс целенаправленного формирования животным (или человеком у животного) навыков, при осуществлении которых прежде чем достигнуть приспособительного результата (получить подкрепление), оно совершает определенную работу.
В настоящее время дрессировка животных осуществляется с использованием двух основных методов обучения: оперантного и условно-рефлекторного. В большинстве существующих пособий по дрессировке почему-то говорится об условно-рефлекторном обучении. На мой взгляд, более прогрессивен метод оперантного обучения; естественно, он и используется в дрессировке более широко, нежели условно-рефлекторный…
Оперантное обучение – это такой способ обучения, при котором обучающийся активно и целенаправленно осуществляет обор желательных и устранение нежелательных для него программ поведения, позволяющий в дальнейшем эффективно и экономично достигать приспособительного результата.
На основании этих принципов американским зоопсихологом Л. Скинером и его последователями разработан метод оперантного обучения.
Метод оперантного обучения – это целенаправленный, поэтапный отбор и закрепление дрессировщиком желательных и устранение нежелательных для него действий животного, который производится посредством положительных и отрицательных воздействий обучающего.
Сформированный с помощью этого метода навык в дальнейшем подводится под так называемый «стимульный контроль». Это означает, что навык (в зависимости от стадии обучения) санкционируется или запускается определенной командой.
Под санкционирующей я понимаю такую команду, которая как бы разрешает реализацию того или иного поведения, направленного на достижение конкретного результата, однако, пути его достижения могут быть разные. Значит, возможны и различные варианты программ поведения, с помощью которых нужный результат может быть достигнут.
Запускающая команда – такая, которая при любом типе обучения (в частности, после автоматизации навыка при оперантном обучении) запускает строго определенное поведение животного. При этом результат поведения достигается с помощью конкретных, выработанных в процессе обучения программ действия.
При обучении простым навыкам команды начинают применять с самого начала обучения. Команда всегда должна предварять положительные или отрицательные воздействия на животное. Таким образом, условно-рефлекторное и Оперантное обучение внешне как будто схожи – команда дается перед теми или иными воздействиями на обучаемого. Однако, по сути, они различны. В начале простого оперантного обучения команда – лишь стимул, санкционирующий реализацию поведения; она не запускает его. При условно-рефлекторном же обучении команда запускает выполнение навыка. Объясняется это тем, что применяемые при этом типе обучения воздействия вызывают относительно простые поведенческие реакции, и их реализация не требует от животного принятия сложных альтернативных решений, корригирующих его деятельность.
Метод оперантного обучения широко используется при дрессировке собак, как служебных, так и цирковых. Необходимым условием обучения является наличие доминирующей мотивации – пищевой, игровой, оборонительной или какой-либо другой.
Рассмотрим на примерах, как применяется этот метод при дрессировке собак.
1.Преодоление препятствия (барьера).
Сперва у собаки формируется доминирующая пищевая мотивация; реализуя ее животное может преодолеть барьер. Для этого собаку подводят к низкому барьеру и, подавая команду «Барьер», побуждают к прыжку поводком или лакомством (либо тем и другим). После прыжка собака получает подкрепление в виде порции пищи и ласки. Если эту последовательность действий повторить несколько раз, то в дальнейшем собака по своей инициативе станет перепрыгивать барьер, как только окажется в его зоне, или будет делать это по команде дрессировщика.
2.Более сложная схема оперантного обучения применяется тогда, когда у собаки требуется сформировать многокомпонентный навык. В этом случае сложный навык разбивается на составные элементы. Например, у собаки необходимо сформировать навык сидения на задних лапах в позе «столбик» с одновременными взмахами передними лапами. Можно применять следующую схему обучения. Собаку с помощью лакомства, поднятого над ее головой, и поводка ставят на задние конечности. Каждый раз, когда собака встает на задние лапы, это подкрепляется дачей пищи. Затем награждают уже не каждый подъем на задние лапы, иногда и не дают подкрепления. Проходит некоторое время, и тогда в ста процентах случаев начинают подкреплять только подъем собаки на задние лапы именно в позе «столбик». Через некоторое время вновь переходят на как бы случайный режим подкрепления (собака не знает, когда именно она получит пищу за проделанную работу, но точно знает, что непременно получит). При этом любое движение в позе «столбик» подкрепляется каждый раз (в 100% случаев) и так далее. Таким образом, можно сформировать любой самый сложный навык у собаки или другого животного, затем подвести его под «стимульный контроль», то есть требовать выполнения навыка по определенной команде.
В условиях оперантного метода обучения собака является активным участником дрессировочного процесса.
Работа, выполняемая животным во время обучения, может быть различной: физическая, совершение сложных двигательных упражнений, преодоление нервно-психологических нагрузок. Характер работы зависит от исходной мотивации, на базе которой формируется навык, от обстановки дрессировочного процесса и того конечного результата, которого добивается дрессировщик. Однако, независимо от типа работы, собака выполняет ее всегда целенаправленно, предлагая в ответ на действия дрессировщика «встречные» способы выполнения. Одну и ту же поставленную задачу (в зависимости от характера обучения) собака может решать качественно различными способами: методом «проб и ошибок» или посредством «собачьей логики» (используя свою способность к элементарной рассудочной деятельности – ассоциативное обучение, инсайт, экстраполяция).
Дрессировка – это тоже обучение, но такое, которое проходит при определенных социально-ролевых взаимодействиях между дрессировщиком и собакой.
В результате выработанный навык воспроизводится собакой по команде и в любой обстановке, даже в таких ситуациях, которые угрожают жизни собаки. Важным отличием дрессировки от обычного обучения является и то, что для выполнения отработанного навыка уже не требуется удовлетворения тех потребностей, на базе которых навык был сформирован.
Описываемые в литературе методы дрессировки можно классифицировать, как те или иные способы воздействия на потребностно-мотивационную сферу деятельности животных. Охарактеризуем основные из них.
1.Механический метод. У собаки формируется сначала пассивное, а затем активное избегание неприятных воздействий со стороны дрессировщика. Ярким примером этого метода является процедура отработки навыка хождения рядом с помощью рывков поводком. Подав команду «Рядом» и воздействуя поводком, мы принуждаем собаку встать в заданное нами положение около левой ноги; как только собака занимает желаемое место, рывки прекращаются, собаку хвалят. Если собака попытается уйти из положения «рядом», вновь звучит команда «Рядом» и производятся рывки поводком. Сначала собака возвращается к ноге пассивно, избегая воздействий поводком, а в дальнейшем активно, по команде, уже без применения рывков.
2.Пищевой метод состоит в формировании истинной пищевой мотивации. Так в процессе реализации пищевой мотивации собака активно ищет пути удовлетворения своей потребности, то таким методом у нее можно сформировать очень сложные по своей структуре навыки. Примеры применения этого метода мы приводили при описании оперантного метода обучения.
3.Вкусопоощрительный метод – формирование у собаки мотивации избирательного аппетита («метод премий»). При дрессировке этим методом животное не испытывает потребности в пище, ему просто хочется чего-нибудь вкусненького. Метод используется ограниченно, он может быть эффективен лишь тогда, когда собака видит, обоняет или каким-либо другим способом непосредственно ощущает лакомство. В настоящее время, к сожалению, на многих дрессировочных площадках используется именно этот метод.
4.Подражательный метод – формирование у собаки подражания поведению другой собаки, человека или группы особей. Используется, например, при формировании злобы у служебных собак.
5.Игровой метод – формирование того или иного игрового поведения собаки с целью обучения желательному навыку. Используется, в частности, при формировании у собак навыков апортировки, преодоления препятствий. ( Следует отметить, что существует целая школа дрессировки, основанная на формировании практически всех навыков послушания и защиты на базе игровых мотиваций. Причем с раннего детства у собак целенаправленно формируется повышенная потребность в игре . Эта методика характерна в частности для итальянской школы дрессировки).
6.Контрастный метод (метод «кнута и пряника») заключается в последовательном чередовании приятных и неприятных для собаки воздействий. Сначала посредством неприятных воздействий вызывают у собаки мотивацию пассивного избегания вплоть до выполнения требуемого действия, а в момент его выполнения (или сразу же после этого) дают пищевое или вкусопоощрительное подкрепление. Наиболее пригоден для установления у дрессировщика статуса лидера. Этот метод широко используется нашими дрессировщиками, однако, при этом часто сила неприятных воздействий передозируется.
В процессе обучения собаки при формировании того или иного навыка она достигает не только того результата, который удовлетворяет ее биологическую потребность. У животного появляется и вполне определенное эмоциональное состояние – а это тоже результат!
Согласно биологической теории эмоций П.К Анохина, эмоции и их качество определяются совпадением или рассогласованием между ожидаемым и получаемым результатами в процессе целенаправленного поведения. При совпадении программируемого результата с реально достигнутым возникает положительная эмоция, при несовпадении – отрицательная. Перечисленные выше методы воздействий на потребностно-мотивационную сферу деятельности собаки также нужно рассматривать, как положительные и отрицательные подкрепляющие воздействия. Подкрепляющие же воздействия прежде всего влияют на эмоциональную деятельность собаки. Как правильно применять их в процессе дрессировки?
Положительные подкрепляющие воздействия должны совпадать по времени с каким-либо действием собаки и вызывать у нее при этом положительные эмоции. Они увеличивают вероятность появления нужного поведения; к ним-то и стремится собака при обучении. В качестве положительных подкрепляющих воздействий можно использовать пищу, ласку, лакомства, игру, то есть, все то, что доставляет собаке удовольствие.
Отрицательные подкрепляющие воздействия – такие, которые совпадают по времени с каким-либо действием собаки и вызывают у нее отрицательные эмоции. Отрицательные воздействия призваны формировать у собаки желание избежать повторного совершения данного действия (мотивацию активного избегания или агрессию). В качестве отрицательных воздействий можно использовать рывки поводком (различной силы) и любые другие неприятные для собаки воздействия.
Наказание, в отличие от отрицательных подкрепляющих воздействий, производится уже после совершения нежелательного действия (то есть, когда собака уже достигла какого-то результата, нежелательного для дрессировщика: подобрала и съела лежащий на земле корм, подралась с другой собакой и пр.) и поэтому воздействует на собаку менее эффективно.
Отсюда и вытекают правила применения положительных и отрицательных подкрепляющих воздействий.
Воздействия должны производиться в момент совершения действия или сразу после него, иначе их применение малоэффективно. Это объясняется тем, что, помимо приятных или неприятных ощущений, (+) или (-) подкрепляющие воздействия несут собаке еще и информацию о том, что именно в ее поведении нравится дрессировщику, а что нет. Поэтому запаздывающие подкрепления – наигрубейшая ошибка дрессировщика.
Отрицательные подкрепления должны прекращаться сразу же, как только прекратилось нежелательное действие собаки, чтобы собака могла активно избежать неприятного для нее воздействия и достигнуть при этом приспособительного результата. Отрицательные воздействия нужно строго дозировать (по силе и по длительности); при отработке приемов послушания они не должны вызывать у собаки ни страха, ни агрессии.
Размеры кусочков пищи, используемых для положительного подкрепления, варьируются в зависимости от размеров собаки, но общим правилом при этом является максимальное уменьшение разовой порции. За особо трудную для собаки работу, например, прыжки через глухой барьер, размеры подкрепления значительно увеличиваются.
Режим применения подкрепления в процессе обучения д о л ж е н и з м е н я т ь с я. В начале формирования навыка - стопроцентный режим воздействия, а затем вероятностный (то есть, когда подкрепление дается не каждый раз, а в случайном порядке). Причем, когда собака получает пищу или игру во время дрессировки в случайном порядке, ее заинтересованность в выполнении навыка резко возрастает, а у дрессировщика при этом появляется возможность отбирать и закреплять желаемое.
При работе с собакой не всегда целесообразно или возможно воздействовать на собаку в нужный момент (например, при отработке «выдержки» и т.п.), однако, именно такая своевременность необходима, чтобы объяснить собаке, что она делает правильно, а что нет. В этих случаях применяют «условные» подкрепляющие воздействия, положительные и отрицательные. Положительные условные подкрепления не всегда означают дачу корма, лакомства, хотя, зачастую им сопутствуют, а являются сигналом для собаки: «делаешь верно». Обычно для этих целей используются слова: «хорошо!», «браво!», «умница!» и т.п. Отрицательные условные подкрепления – это слова «нельзя!», «фу!», «тубо!» и пр.
В процессе реальной дрессировки обычно используются все описанные выше методы обучения и дрессировки (в зависимости от поставленной задачи) с учетом правил применения положительных и отрицательных подкрепляющих воздействий. Однако чтобы более полно понять закономерности, лежащие в основе дрессировочного процесса, необходимо детально рассмотреть основные принципы и этапы формирования поведенческого навыка.
5.Как правильно дрессировать собаку?
На первом этапе обучения создают такие условия, чтобы пищевая мотивация стала доминирующей. Для этого основную часть рациона собаке скармливают в процессе дрессировки. Когда мотивация создана, то есть собака хочет есть и готова что-то сделать, чтобы поесть, ей объясняют, чего от нее хотят добиться. Этот этап обучения можно условно назвать «этапом взаимных объяснений» между дрессировщиком и собакой.
Обучение собаки на этом этапе должно проходить в условиях максимального обеднения дрессировочной обстановки. В начале формирования навыка необходимо проводить занятия дома и в местах, где нет посторонних людей и собак. Иначе возрастет вероятность появления конкурирующих мотиваций: игровой, половой, оборонительной и т.д., что сделает невозможным процесс обучения на базе выбранной вами мотивации, и собака потеряет интерес к работе.
Теми или иными способами: с помощью поводка (потягиваний, подергиваний, направляющих рывков), касаний руками, подталкиваний, направления лакомством, подсаживаний, поддерживаний, интонации и т.п. – вы пытаетесь объяснить собаке суть ваших требований. Собака же, если у нее есть заинтересованность (мотивация), пытается понять вас. Иными словами, так как ваша собака «слова не понимает» (вернее, не понимает настолько, чтобы возник речевой контакт), мы заменяем речевое общение языком жестов, движений, интонаций, обеспечивающих взаимопонимание. Перед тем, как «наводить» собаку на выполнение какого-либо навыка, мы один-два раза произносим санкционирующую команду, которая после автоматизации навыка приобретает значение запускающего стимула. Как только собака выполняет желаемое действие, мы сразу же подкрепляем это действие кусочком пищи или игрой. Характер подкрепления зависит от используемой мотивации, на базе которой строится навык.
Чтобы объяснить собаке, что она выполнила то, что требуется, сразу после завершения нужного действия, а порой и в процессе его выполнения, мы восклицаем «хорошо!», «браво!» и т.п. (вводим условные положительные подкрепляющие действия), что означает для собаки: « делаешь правильно». Дрессировщику необходимо ясно представлять границы формируемого навыка (то есть то, какие именно действия и в каком порядке он будет подкреплять, а какие не будет) и объяснить их собаке. Собака должна четко знать, что правильные действия подкрепляются положительным подкрепляющими воздействиями, а ошибочные не подкрепляются вовсе или подкрепляются отрицательно. Собака должна прочно усвоить, где «черное», а где «белое», и безошибочно отличать их друг от друга.
Приведем пример формирования у собаки простого навыка – посадки по команде «сидеть».
Соблюдая принцип «обеднения обстановки», обучение собаки начнем с дома. Перед кормлением возьмем собаку на поводок и расположим ее перед собой. Подавая команду сидеть» (санкционирующий стимул, по нашей терминологии), мы придерживаем собаку за поводок левой рукой, а правой подносим к носу собаки зажатый в ладони кусочек пищи. Как только собака коснется носом ладони с кусочком пищи и попытается достать его, ладонь медленно уводится за голову собаки, вверх-назад (по касательной к голове). Собака тянется за лакомством, задирает голову вверх, и если ей немного помочь – придержать за поводок или легко надавить на круп, - то собака сядет. Сразу после посадки собака получает порцию пищи и «условное» подкрепляющее воздействие – «хорошо!». Несколько таких повторений, и собака будет садиться уже после команды. Однако, нам необходимо, чтобы собака после команды не только садилась, но и оставалась в этом положении столько, сколько потребуется. Поэтому, определим для себя, что подкреплять пищей будем не только посадку собаки после команды «сидеть», но и выдержку ее в этом положении вплоть до отменяющей выполнение приема команды «гуляй» (или какой-нибудь другой). Итак, границами навыка на данном этапе у нас будет посадка собаки сразу после команды «сидеть» (желательно одной) и выдержка ее в этом положении вплоть до отмены команды. Теперь наша главная задача объяснить все это собаке. Для этого, как только собака после команды примет соответствующее положение, мы сразу дадим ей кусочек пищи и будем повторять многократно «хорошо!», что на нашем с собакой языке означает: «делаешь правильно». Если собака сохраняет нужное положение, то мы подкрепляем ее действия – в данном случае выдержку – кусочками пищи и «условным» подкреплением «хорошо!». Если вдруг собака попытается встать без разрешения, то мы тут же подадим команду «сидеть», а если она не сядет сама, усадим ее с помощью поводка насильно. Как только собака примет прежнее положение, вновь последует «условное» подкрепление – «хорошо!», но реального подкрепления сразу после этого не последует. Реальное подкрепление собака получит лишь после некоторой выдержки в положении «сидеть». Так, постепенно, но достаточно быстро, мы сможем объяснить собаке, что она должна садиться по команде «сидеть», так как за это получает пищу (положительное подкрепление достигает приспособительного результата), затем находится некоторое время в этом положении (за что ее тоже положительно подкрепляют),и что вставать ей без разрешающей команды нельзя, так как за это ее ругают и, воздействуя поводком, опять сажают на место (отрицательное подкрепляющее воздействие) и пищу не дают.
Вот таким образом (или примерно таким) происходит формирование навыка, в процессе которого создаются новые элементы «языка» общения между дрессировщиком и собакой, определяются границы навыка, вводятся команды, санкционирующие выполнение и отмену приема, используя элементы контрастного метода дрессировки. При этом следует напомнить, что вся проделанная работа, которую мы здесь описали, проводится исключительно на поводке (то есть под постоянным контролем).
Итак, мы завершили «этап взаимных объяснений», на котором у собаки был сформирован и в достаточной степени закреплен навык посадки после команды «сидеть», Однако, если мы сочтем, что навык уже отработан, и подготовленную таким образом собаку приведем в незнакомую обстановку, где будет много отвлекающих факторов, и попытаемся посадить ее по команде, то скорее всего у нас это не получится. Вместо посадки собака, весьма вероятно, будет демонстрировать ярко выраженную ориентировочно-исследовательскую активность, которая затем может перейти в игровое или оборонительное поведение.
Чтобы избежать подобных сбоев в работе на следующем этапе – «автоматизация навыка» - мы продолжаем занятия в условиях обедненной обстановки и постепенно с помощью воздействия поводком вводим еще более жесткий контроль за соблюдением собакой границ сформированного навыка. Например, если на этапе взаимных объяснений собака соблюдала все наши требования лишь тогда, когда она находилась вблизи от нас, то на втором этапе мы добиваемся от нее устойчивой посадки на любом расстоянии. При этом значительно возрастает темп работы (команду «сидеть» подаем своевременно, то есть непосредственно с момент изменения собакой положения тела, а следующие за ней направляющие и подкрепляющие воздействия производим очень быстро). Кроме того, производимые нами действия становятся максимально однообразными: быстро перемещаясь, мы сразу же подбегаем к собаке в том случае, если она изменяет положение тела (например, встает, заваливает на бок задние ноги и т.п.), и незамедлительно поправляем ее, воздействуя поводком. В том случае, если собака сразу выполняет команду, практически мгновенно подкрепляем ее правильные действия, применяя условное подкрепляющее воздействие «хорошо!» и пищу, после чего сразу же отходим от собаки. Все наши действия должны быть как можно более однообразны (стереотипны).
Следующей нашей задачей является постепенный перевод собаки со стопроцентного режима положительных подкреплений на вероятностный; для этого мы будем подкреплять пищей не каждую правильную посадку собаки, а в случайном порядке. При этом собака не должна знать, когда она получит пищу, выполнив требуемую работу (навык), а когда – нет. Это побуждает ее вновь и вновь повторять выполнение навыка посадки, в итоге зарабатывая тем самым кусочек пищи. Так же последовательно мы уменьшаем количество отрицательных воздействий на собаку (с помощью поводка) в случае нарушений ею границ выполнения навыка (изменение позы, уход с места и т.п.) или явного нежелания его выполнять, но степень этих воздействий постепенно увеличивается (то есть сила рывков раз от раза увеличивается).
После того, как мы добились от собаки четкого (сразу после команды) выполнения навыка в условиях обедненной дрессировочной обстановки, можно переходить к работе с ней в усложненных условиях, то есть в присутствии других собак, посторонних людей, шумов и т.д. Однако, усложнение обстановки, в которой мы работаем с собакой, нужно проводить не сразу, а последовательно, по элементам. Так, например, сначала мы попробуем воспроизвести навык посадки собаки где-нибудь в углу тихого сквера (на тихой улице), затем в более людном месте, потом в месте выгула собак (в их отсутствии), в присутствии одной посторонней собаки, относящейся к нашей безразлично и т.д. Вне зависимости от сложности условий обстановки, в которой происходит дрессировка, мы должны всегда добиваться от собаки быстрого и четкого выполнения навыка посадки сразу после первой команды. Однако, в зависимости от характера этих условий, степень усложнения границ выполняемого навыка (длительность выдержки в положении сидя, дальность ухода от собаки и т.п.), а также суммарное время работы с собакой, затрачиваемое на отработку навыка посадки, необходимо строго ограничивать. В зависимости от характера условий, в которых проходит дрессировка, собака получает большую или меньшую нервно-психологическую нагрузку, а работоспособность ее нервной системы не беспредельна, значит нагрузку необходимо дозировать. В результате проделанной работы мы должны добиться того, чтобы собака всегда, вне зависимости от внешних условий, четко и быстро выполняла навык посадки после первой поданной нами команды, без применения как положительных, так и отрицательных подкрепляющих воздействий. Только после этого поводок снимается, и с собакой продолжают работать без него. Постепенно условное положительное подкрепляющее воздействие («хорошо!») применяется все реже и реже, а потом и вообще перестает подаваться.