Pozitivní posilování ve výcviku psů. Jak to vlastně funguje, aneb výcvik je nejen umění, ale i věda
Za dobu své kynologické praxe se často setkávám s názorem, že "z výcviku psů se v poslední době dělá příliš velká věda". A ono to tak doopravdy leckdy může působit. Ostatně člověk se psem vedle sebe žijí již tisíciletí a po celou dobu toto soužití úspěšně fungovalo na bázi "selského rozumu", bez složitých definic a vědeckých teorií.
Není tedy celá ta teorie o učení, chování a výcviku zvířat pro naše každodenní fungování se psy vlastně zbytečná a má nějaký smysl kromě toho, že celou věc pouze zbytečně komplikuje?
Jak asi tušíte, důvodem, proč celý tento seriál vznikl, je moje přesvědčení, že nikoliv. To se zakládá na následující úvaze. Přestože po tisíce let žijeme a spolupracujeme se psy a po celou tu dobu jsme si vystačili převážně s "citem a rozumem", tato situace se v posledních letech změnila. Důvodem je změna životního stylu, odklon od "původního způsobu života", který byl nejen pro nás, ale především pro psy mnohem srozumitelnější a uchopitelnější. Zatímco v minulosti stálo naše soužití na oboustranně prospěšné spolupráci, ať už se jednalo např. o společný lov nebo ochranu obydlí, v současné době se role psů ve společnosti mění.
Existuje pouze několik málo plemen, která mají to štěstí, že stále mají uplatnění blížící se účelu, pro který byla původně člověkem ochočena a šlechtěna. Role těch ostatních se zásadním způsobem změnila, podobně jako prostředí, ve kterém s námi žijí. V současné době většina psů plní spíš roli našich společníků, v některých případech nám nahrazují lidské životní partnery a namísto společného lovu, který je pro ně jako pro predátory přirozenou činností, plní roli vodících a asistenčních psů pro zdravotně postižené. Kromě toho musejí být schopni pohybovat se v provozu a ruchu velkoměst a žít s námi v bytech, kde jsou "principy správného chování" a "strategie přežití" tolik odlišné od divočiny, ze které, stejně jako jejich nejbližší příbuzní, vlci, pocházejí. Z této změny jsme zcela bez úhony nevyšli ani my, lidé.
Na jednu stranu máme mnohem vyšší životní úroveň než naši předkové a zvyšuje se i průměrný věk, na druhou stranu nás sužuje celá řada civilizačních nemocí jak fyzické, tak i psychické povahy.
Na začátku byli lachtani
Je nutné brát v úvahu, že toto "nové prostředí" jsme vytvořili my, lidé. Proto je pro nás mnohem snadnější se mu přizpůsobit - ať už díky našim fyziologickým vlastnostem, tak schopnostem našeho mozku a uvažování, které se od toho psího značně liší. Zároveň s tím stoupají i nároky naší společnosti na psy samotné. Očekáváme, že budou s nasazením vlastního života chránit náš majetek, nicméně v naší společnosti je napadení člověka psem záležitostí končící u soudu nebo v médiích a pro psa smrtící injekcí. Kvůli řadě nedorozumění mezi člověkem a psem se plní psí útulky. Naši psi musejí chápat celou řadu z jejich pohledu nesrozumitelných konceptů, jako například "vybavení bytu není hračka na žvýkání" nebo "obývací pokoj není toaleta", které v jejich přirozeném prostředí nedávají smysl.
A tady někde možná nastala ta změna, která stojí za zvyšující se oblibou metodiky pozitivního posilování u psů.
V minulém díle jsem psal o tom, že za vznikem a rozvojem této metodiky stojí trenéři mořských savců v amerických akváriích. A jak akvária, tak zoologické zahrady se do značné míry odlišují od přirozeného prostředí zvířat, která jsou v nich chována. A stejně tak jako pro psa nedává žádný smysl neudělat si z vybavení bytu hračku na žvýkání, pro lachtana nedává žádný smysl nastavit ocasní ploutev a nechat do sebe zapíchnout jehlu pro účely odběru krve. Z jeho pohledu jde o přímé ohrožení, tedy situaci, ve které je ve svém přirozeném prostředí ochoten i zabít, aby si zajistil vlastní přežití. V akváriu nebo v zoologické zahradě je však naprosto nezbytné, aby tento úkon byl schopen podstoupit a nikoho z ošetřovatelů ani sebe samotného neohrozil. V principu podobný je i příklad s představením lachtanů pro veřejnost. Nyní se tedy nabízí otázka: Nevzniká nám tady náhodou paralela mezi lachtanem v zoo a psem ve velkoměstě?
Proč vás pes poslechne
Je tu však jeden, poměrně zásadní rozdíl. Zatímco lachtana nebo delfína k tomu, aby si nechal odebrat krev, silou nebo nátlakem nepřesvědčíme, u psa se nám to pravděpodobně podaří už jenom kvůli domu, kolik je nám toho jako druh ochoten odpustit. Jinými slovy - zatímco u psa vám pravděpodobně přístup "buďto si necháš ty drápky ostříhat, nebo...", popřípadě "buďto teď všeho necháš a přiběhneš na přivolání, nebo..." docela dobře projde, u lachtana nebo kosatky byste s tímto přístupem velmi rychle a pravděpodobně i bolestivě narazili.
Nicméně, zaprvé ani u psů ne vše a vždy jde řešit nátlakem, zadruhé dlouhodobé působení nátlaku zanechává na každé živé bytosti velmi nepříjemné a někdy nevratné následky. Proto dává smysl naučit psa, aby i chování, které je pro něj neužitečné a původně i nepříjemné, vykonával sám od sebe, z jeho vlastního rozhodnutí.
Když už tedy víme, proč by nás ta "šedá teorie" měla zajímat, podívejme se na základní principy učení a chování zvířat.
Klasické podmiňování
Je nejznámější formou učení zvířat. Všichni známe příklad se psy I.P. Pavlova se zvonečkem a potravou. Pokud po původně neutrálním podnětu (zazvonění zvonečku) přichází bezprostředně další podnět (potrava), vzniká podmíněný reflex - pes začne slinit už při zazvonění, tedy ještě předtím, než se objeví miska s potravou.
Operantní podmiňování
Je další, z pohledu trenérů zvířat pravděpodobně zajímavější formou učení. Na rozdíl od klasického podmiňování, které zavádí vazbu mezi podnětem a následkem na úrovni reflexu, tzn. něčeho, co subjekt není schopný vůlí ovlivnit, stojí principy operantního podmiňování na sekvenci spouštěč (anglicky Antecendent) - chování (Behaviour) - následek (Consequence). Proto se na základě prvních písmen anglických termínů pro jednotlivé části někdy mluví o sekvenci "A-B-C".
Spouštěč - může být cokoli, co danému chování předchází, například povel "sedni".
Chování - je samotná akce, kterou zvíře provede. V našem případě tedy pes zaujme polohu vsedě. Důležité je, že samotné chování je tím, čím zvíře do procesu aktivně stupuje a na rozdíl od podmiňování klasického je schopno vůlí ovlivnit.
Následek - nastane bezprostředně po chování. Z pohledu učení je následek tím, co rozhoduje, zda se pravděpodobnosti konkrétního chování bude do budoucna zvyšovat nebo snižovat. Z pohledu operantního podmiňování tedy každý následek spadá do jedné z následujících čtyř kategorií, označovaných také jako "kvadranty operantního podmiňování".
Pozitivní posílení - do systému (z pohledu zvířete) přibyde něco, o co v danou chvíli stojí. V našem příkladu je tedy pes za to, že si sednul, odměněn pamlskem. Pokud v danou chvíli pes o pamlsek doopravdy stojí, pravděpodobnost, že si v budoucnu znovu sedne, se zvyšuje. (Vzpomeňte si na minulý díl, ve kterém se uvádí, že zvíře určuje, co je posílení a co je trest, nikoli trenér, pokud tedy psa odměníte něčím, co mu nechutná, nebo dostane pamlsek ve chvíli, kdy o něj nestojí, nejde o posílení.) Příkladem pozitivního posílení z lidského života mohou být například mimořádné prémie za splnění pracovního úkolu.
Pozitivní trest - následkem chování přibyde něco, co je zvířeti nepříjemné. Klasickým příkladem je to, že pes štěká a majitel ho za to uhodí. Pravděpodobnost výskytu chování do budoucna se snižuje. Podobně bude fungovat "výchovná facka" u dítěte, které provádí nějakou nepřístojnost.
Negativní posílení - ze systému ubyde něco, co je v danou chvíli zvířeti nepříjemné. Příkladem negativního posílení může být situace, kdy nás začne bolet hlava, my spolkneme prášek a bolest hlavy zmizí. Pokud nás příště začne bolet hlava, pravděpodobně zopakujeme chování, které v minulosti fungovalo, tzn. zvýší se pravděpodobnost, že si jako reakci na bolest hlavy vezmeme prášek.
Stejně jako u pozitivního posílení se při negativním posílení pravděpodobnost výskytu chování do budoucna zvyšuje, v praxi se ale při tréninku mořských savců téměř nevyužívá. Na začátku sekvence totiž musí přijít něco, co je zvířeti nepříjemné a čeho se chce zbavit. Zároveň chování získané negativním posílením z povahy věci zvířete nevykonává na základě vlastního rozhodnutí, což je pravý opak základního principu tréninku mořských savců i metodiky pozitivního posilování.
Negativní trest - následkem chování je odebrání něčeho, o co zvíře v danou chvíli stojí. Příkladem může být situace, kdy se člověk se psem přetahuje o hračku a poté, co se pes při hře příliš rozvášní a omylem majitele kousne, majitel mu hračku sebere a hru ukončí. Pravděpodobnost výskytu chování do budoucna se snižuje.
Všimněte si, prosím, v definici jednotlivých kvadrantů dvou důležitých poznatků. Prvním z nich je, že "pozitivní" v kontextu operantního podmiňování neznamená "dobrý" a "negativní" neznamená "špatný". Pozitivní znamená pouze "něco přibylo" a negativní "něco ubylo". Definici pozitivního trestu tedy splňuje situace, kdy psa udeříme za to, že štěká. Z pohledu psa se samozřejmě nejedná o nic dobrého.
Druhý a možná ještě důležitější poznatek je, že posílením se rozumí cokoli, co způsobí zvýšení pravděpodobnosti výskytu chování do budoucna a trestem se analogicky rozumí cokoli, co pravděpodobnost výskytu chování sníží. Z tohoto pohledu tedy pojem "trest" nemá nic společného s "morální stránkou věci". Protože lidé intuitivně chápou termín "trest" často poněkud jinak, možná by bylo vhodnější použít termín "potlačení". Protože je však termín "trest" v této oblasti standardně používaný a zavedený, budeme se této terminologie dále držet. Přesto je jeho definice poněkud jiná, než jak tento pojem chápeme intuitivně, proto se u něj ještě na chvíli zastavíme - a to hned v příštím čísle.
Článek vyšel v časopisu č.1/2 2015