Pozitivní posilování ve výcviku psů 2. Jak to vlastně funguje aneb výcvik je nejen umění, ale i věda
Jak kynologům, tak trenérům exotických zvířat je známá základní poučka, že zvířata uvažují v reálném čase a aby byla schopna si spojit chování s následkem, musí následek přijít bezprostředně po chování. U mořských savců se jako maximální prodleva mezi chováním a následkem obvykle uvádí tři sekundy, což je ale na psa podle mého názoru už celkem dlouhá doba. Jinými slovy, pokud chceme, aby si pes odměnu nebo trest spojil s chováním, které mu předcházelo, musí následek přijít maximálně do tří sekund.
Z definice zároveň vyplývá, že z pohledu operantního podmiňování je posílení nebo trest vždy striktně definováno jako následek chování, není tedy možné potrestat zvíře, ale potrestat (potlačit) můžeme vždy jenom konkrétní chování.
Abychom pouze neteoretizovali, demonstrujme si toto pravidlo na jednom, v soužití lidí a psů velmi rozšířeném příkladu. Majitel štěněte odchází na 8 hodin do práce a po návratu zjistí, že štěně mezitím rozkousalo peřiny a roztahalo po bytě obsah odpadkového koše. Po návratu tedy milé štěně potrestá, protože nepořádek se doma přece nedělá. Po několik dalších dní se stejná situace opakuje s tím rozdílem, že tentokrát už v momentě, kdy majitel otevře dveře, se před ním štěně plazí a chová se "provinile". Majitel tedy štěně znovu potrestá, protože udělalo nepořádek, a ještě sám sebe ujistí, že pejsek ví, za co ten trest přišel, protože se přece choval provinile už ve chvíli, kdy majitel vstoupil domů, ještě předtím, než jej začal trestat - takže potrestat psa po návratu domů je správně, akorát to asi bylo málo, protože pejsek stejně dělá nepořádek dál, bude asi potřeba přidat na tvrdosti.
Opravdu pes "cítí vinu"?
Bohužel se však majitel psa mýlí, a tím dochází k velmi smutnému nedorozumění mezi ním a jeho štěňátkem. Konkrétně se touto situací a schopnostmi psů cítit vinu zabývala celá řada vědeckých studií a jeden z experimentů vypadal takto: Výzkumný tým zavřel psa do místnosti a v místnosti mu nechal hromadu novin v koši. Pes je v době, kdy byl v místnosti sám, roztrhal a po návratu lidí byl potrestán. Po nějaké době již vykazoval "známky provinění" pokaždé, když do místnosti lidé opět vstoupili. Výzkumný tým tedy udělal to, že psa nechal v místnosti samotného bez přístupu ke koši s novinami a těsně předtím, než lidé následně vstoupili do místnosti, do ní vložil natrhané kusy novin. Reakce psa po vstupu lidí byla naprosto stejná, jako kdyby ty noviny roztrhal on (vysílal směrem k lidem konejšivé signály a choval se "provinile"), přestože tentokrát v tom byl zcela nevinně.
Podívejme se nyní na celou situaci prizmatem spouštěč - chování - následek. V tomto případě je spouštěčem kombinace dvou událostí: V místnosti je nepořádek a do místnosti vstoupí majitel. Pes v tuto chvíli na základě toho, co se naučil už dříve, zcela přesně ví, že bude následovat něco nepříjemného. Provede tedy pro něj přirozené chování, kterým člověka "ukonejší" a pokusí se hrozící výprask od majitele zmírnit. Následkem tohoto chování je tedy to, že něco nepříjemného i tak přijde (protože podle názoru majitele ten pes ví, že "udělal něco špatně"). Jaká bude prognóza tohoto chování do budoucna, je nejisté.
Buďto pes dospěje k názoru, že něco nepříjemného sice přišlo i přes jeho snahu majitele ukonejšit, ale že kdyby se o to nepokusil, mohlo by to být ještě horší. Nebo rezignuje a už se ani nebude pokoušet majitele ukonejšit. V nejhorším případě zkusí jinou strategii - když nefunguje konejšení, zkusí majiteli pohrozit zavrčením a pokud to nebude stačit, bude muset přidat a nezbyde mu nic jiného, než majitele pokousat.
Pes tedy sice rozumí tomu, že když je v místnosti nepořádek, stane se něco nepříjemného, už si ale v tu chvíli nedokáže spojit, že ten nepořádek udělal on, a tudíž nemá šanci porozumět tomu, že výprask se váže k chování, které nastalo před několika hodinami, kdy roztrhal po místnosti noviny (což pro něj nejspíš byla úžasná a jediná zábava celého nudného dopoledne).
Pokud by majitel chtěl, aby trest doopravdy fungoval, musel by nějak zařídit, aby trest přišel bezprostředně poté, co nastane chování. V tomto případě by tedy musel udělat něco jako do místnosti nainstalovat kameru a ve chvíli, kdy pes začne trhat noviny, do místnosti vrazit a psovi vynadat.
Proč to ten pes dělá?
Důkladné zamyšlení nad předchozími odstavci přinese jeden důležitý závěr, který je třeba mít na paměti po celou dobu našeho soužití nejen se zvířaty, ale i s lidmi. Důvodem, proč zvíře provádí jakékoli chování je, že očekává, že mu toto chování něco přinese, tedy buďto předpokládá, že následkem chování získá něco, o co stojí (pozitivní posílení). Předchozí větu by bylo možné interpretovat jako "všechno, co zvířata dělají, dělají kvůli odměně". Byť je tato formulace formálně správná, bývá často matoucí a vyvolává nesouhlasné reakce s tím, že degraduje zvířata na "biologické stroje", za jejichž chováním není žádná další abstrakce kromě potřeby vlastního přežití a rozmnožování.
Další analýzou, která už by ovšem byla nad rámec tohoto článku, bychom nakonec možná dospěli k závěru, že většina "odměn", kvůli jejichž dosažení zvířata i lidé vynakládají úsilí, s tématem přežití a reprodukce nějak, byť leckdy velmi vzdáleně, souvisejí. Problematika posílení, odměn a chování je ovšem poněkud složitější a sama o sobě by vydala na několik dalších dílů tohoto seriálu.
Nyní se však nabízí jiná otázka. Pokud víme, že posílení výskyt chování zvyšuje a trest ho snižuje, není univerzálním a nejrychlejším řešením důsledně a pokaždé odměňovat chování, které chceme získat, a naopak trestat chování, které chceme odbourat? Na tomto principu ostatně stojí kontrastní metoda výcviku psů, která byla po dlouhou dobu zdaleka nejrozšířenější a nejpoužívanější. Odpověď na tuto otázku není tak snadná a jednoznačná.
Co když je za tím něco jiného?
Vraťme se nyní k našemu příkladu se psem ničícím vybavení bytu. Předpokládejme, že majitel je zkušený psovod, který procesu chování a učení zvířat dokonale rozumí a ví, že pes si umí spojit následek s chováním pouze v případě, že následek přijde okamžitě. Zároveň se rozhodne věnovat čas a peníze na vytvoření instalace s kamerou a vynadat psovi pokaždé, když strčí hlavu do koše s novinami - vzal si k tomuto účelu dovolenou, kterou tráví tak, že sedí ve vedlejší místnosti a celý den sleduje obraz z kamery, aby nepromeškal ani jeden vhodný okamžik. (Mohl by zde ještě nastat problém, že pes se v přítomnosti psovoda ve vedlejší místnosti chová jinak a nepořádek dělá, jenom když je v bytě zcela sám, ale tuto možnost pro účely příkladu pomiňme). Mělo by se mu tedy podařit tento problém po nějaké době jednou pro vždy vyřešit. Je to však řešení ideální a bezpečné jak pro člověka, tak pro psa?
Vzpomeňme si nyní na to, že každé chování zvířeti něco přináší. Je docela dobře možné, že u našeho modelového psa doopravdy jde pouze o "neškodnou" zábavu a pokud mu ji odepřeme, nic zásadního se nestane. Co když je ale příčina chování v tom, že majitel se psovi nevěnuje, nedává mu možnost naplnit jeho přirozené potřeby jako je pohyb, hra nebo interakce s jinými psy, psa ráno pouze 10 minut vyvenčí a poté je pes celý den zavřený v jedné místnosti? Nebo psa nikdo nenaučil být doma samotný, pes trpí separační úzkostí a ničení bytu je jeho způsob, jak se s touto úzkostí vyrovnává? Co když má pes nějaký zdravotní problém a to, že si najde náhradní činnost, je jeho způsob, jak se vyrovnat s bolestí, kterou mu tento zdravotní problém způsobuje? Pokud takovému psovi řekneme "tohle ne", ale už mu nedáme k dispozici jiné chování, které mu přinese to samé, co chování původní, možná si zaděláváme na mnohem větší problém, než je nepořádek v pokoji po našem příchodu.
Ostatně i u lidí je celkem známá strategie, jak se vyrovnávat s psychickými nebo fyzickými obtížemi - sebepoškozování. I toto chování lidem něco přináší. Pokud se soustředí na bolest, kterou si sami způsobí, odkloní to jejich pozornost od jiné bolesti, která je pro ně hůře snesitelná.
Také se snadno může stát, že pes se s nedostatkem, který mu po odepření možnosti ničení vybavení bytu vznikne, vypořádá tak, že začne být agresivní vůči svému okolí. Proto se vždy vyplatí zamyslet se nad tím, jak bychom vzniklý problém mohli řešit bez použití trestů.
V tomto případě se nabízí celá řada strategií. V první řadě je nutné psa postupně přivyknout na to, že nějakou dobu bude doma sám a tuto dobu prodlužovat postupně. Zároveň bychom ho měli zaměstnat a naplnit jeho potřeby třeba tak, že ranní venčení o nějakou dobu prodloužíme a vymyslíme aktivitu, při které se pes unaví nejen fyzicky, ale i psychicky. Ideální k tomuto účelu jsou pachové práce, například jednoduchá stopa nebo pachové čtverce.
Staré pravidlo říká, že utahaný pes je hodný pes bez potřeby vybíjet se přebytek energie na vybavení bytu. Také můžeme psovi dát k dispozici žvýkací hračky naplněné něčím hodně atraktivním, které pro psa budou zajímavější objekt ke žvýkání než obsah odpadkového koše. Ale nejlepší je zamezit psovi přístup k odpadkovému koši. Chování, které pro nás nepředstavuje problém (žvýkání hraček) bude pro něj jednodušší na provedení než chování nežádoucí (dělání nepořádku).
Domácí úkol pro vás
Dnešní díl jsem se rozhodl zakončit tím, že vám zadám úlohu k řešení. Jedna moje kamarádka má fenku, kterou občas venčí její tatínek. A tatínek přišel s tím, že fenka nechce chodit na vodítku. Kamarádce to bylo divné, protože s ní chodí na vodítku zcela bez problémů. Nějakou dobu tedy pátrala, až se jí z tatínka podařilo dostat informaci, že "vždycky, když se fence nechce, pokusí se jí "rozchodit" na piškot.
Zadání pro vás zní: Co je v tomto případě spouštěčem, co je chováním a co je následkem? Jaká bude prognóza do budoucna? A jakým způsobem byste vzniklý problém řešili bez použití trestů?
Pokud vás v tuto chvíli napadají odpovědi na tyto otázky, článek splnil svůj účel. A v úplně nejlepším případě se i vám samotným povede najít odpověď na otázku "proč se můj pes v určité situaci chová nežádoucím způsobem" a "jak to můžu změnit, aniž bych psovi způsobil/a něco nepříjemného".
Článek vyšel v časopisu č.3/4 2015