Kiképzés elmélet Előadó: Hornig Rudolf Népszigeti Kutyaiskola (www.kutyasuli.hu) Klikker Klub (www.klikker.hu)
Tartalom Kiképzés elmélet Mitől és hogyan tanul a kutya? (a pavlovi és az operáns kondicionálás) Megerősítés és büntetés Kiképzési irányzatok Jelek és ingerek A kutya érzékelése (általánosító képesség és megfigyelési képesség)
Kiképzés elmélet A viselkedés kutatók élőlények viselkedését próbálják leírni modellek segítségével Reflex alapú magyarázat pavlovi kondicionálás az alany elszenvedi (reszpondens) Viselkedés alapú magyarázat B.F. Skinner: a viselkedés jövőbeni előfordulási gyakoriságát a következményei módosítják Az alany aktív résztvevője a tanulásnak, a környezeten operál saját céljai érdekében
Pavlov kísérlete
Thorndike kitalálós doboz
Skinner doboz
Célunk a kiképzéssel Azt szeretnénk elérni, hogy a kutya különféle jelekre reagálva számunkra szükséges, hasznos viselkedéseket produkáljon, illetve nekünk nem tetsző viselkedéseket egyáltalán ne produkáljon lehetőség szerint minél nagyobb megbízhatósággal.
A viselkedések kialakulását azok következményi szabályozzák Ha egy adott viselkedésnek az alany számára felismerhető és számára lényeges következményei vannak, akkor az alany adott viselkedésének jövőbeni előfordulási valószínűsége változni fog. Az, hogy csökkeni vagy nőni fog, attól függ, hogy a következmény kellemes, vagy kellemetlen volt az alany számára
A megerősítés Megerősítés lehet bármi, ami egy cselekvéssel kapcsolatban történik és növeli a valószínűségét, hogy az adott cselekvés a jövőben újra megtörténik. Ez a kiképzés lényege. Minden más már csak további adalék és pontosítás. FIGYELEM: az eredménnyel van definiálva, és csak egy cselekvéssel kapcsoltban van értelme NEM ugyanaz mint a jutalom
A megerősítés viszonylagos Ugyanaz a következmény teljesen másképp befolyásolhatja a cselekvést. Pl. az eredmény függhet: környezettől (tanári dicséret osztályban/kint) fajtól (eső macska, kacsa, szarvasmarha) belső állapottól (pl. jóllakottság éhség) A jutalom nagyságát az alany dönti el, mindegy, hogy a kiképző mit gondol
A büntetés Büntetés lehet bármi, ami egy cselekvéssel kapcsolatban történik és csökkenti a valószínűségét, hogy az adott cselekvés a jövőben újra megtörténik. Ez is az eredménnyel van definiálva. Ha nem csökken a viselkedés valószínűsége, akkor az nem volt büntetés Averzív inger: olyasmi ami kellemetlen a kutya számára
A büntetés és hatásai félelem bizalmatlanság elkerülő magatartás passzivitás
A környezetben valamit... Megerősítés és büntetés hozzáadunk eleveszünk A viselkedés... Sűrűsödik Pozitív Megerősítés +M Negatív Megerősítés -M Ritkul Pozitív Büntetés +B Negatív Büntetés -B Ha nincs következmény: a viselkedés spontán kialszik
Babonák, hisztéria Akkor fordulnak elő, ha egy viselkedés és egy kellemes inger, véletlenül együtt jár, míg az alany azt hiszi, hogy valós kapcsolat van köztük. (pl. szerencsepóló, baseball, foci játékosok, kutya hisztije megérkezéskor az autóban) Hisztéria: szerencsétlen egymást gerjesztő megerősítések (anyuka a szupermarketben)
Az időzítés fontossága A tanításhoz kritikus, hogy a következmény összekapcsolódjon a cselekvéssel, ezért annak pontosan a cselekvés után, vagy közben kell érkeznie. Minél többet késik, annál kevesebb információt hordoz az alany számára Ha a cselekvés előtt történik a jutalmazás azt megvesztegetésnek hívjuk. (gorilla, bicikli, előre fizetés) A túl késői is káros lehet. Mást erősít meg, esetleg félreérthető. (munkahelyek, szinészek)
Probléma: A megerősítést nehéz jól időzíteni Nem vagyunk mindig fizikailag a kutya mellett A jutalmat nehéz pontosan és időben célba juttatni (pl. mire előveszem a labdát a zsebemből, a kutya már rég mást csinál mint amiért jutalmazni szerettem volna) Ezen problémákra számos trükköt kidolgoztak, de ezek is csak speciális esetekben működnek (labdaadagolós mellény, virsli köpködés stb.)
Kondicionált megerősítés (KM) Egy korábban semleges inger (KM) és egy, az alany számára ösztönösen kívánatos inger (EM) összekapcsolásával jön létre Az összekapcsolás pavlovi kondicionálással történik A kondicionálás eredményeképpen az addig semleges jelet is kellemes élményként éli meg az alany. Kimutathatóak a kémiai változások, amit a kondicionált megerősítő okoz.
Miért a klikker? Elvileg bármilyen inger használható lenne A klikker előnyei, a verbális KM-hez (okos) képest: Rövid, így jól időzíthető Egyedi, igy könnyen felfogható, érzékelhető Nem zavaró a környezetnek Szabadon marad a szánk más célra A hirtelen, impulzus-szerű ingerek, könnyebben behatolnak a primitív agyba, ahol az örömérzet is keletkezik
KM az embereknél A klikker KM a kiképzőnél is, mivel a kutya sikeres akciói az ember számára is megerősítőek Pénz, mint univrzális KM az emberi társadalomban
Kiképzési irányzatok Mindegyikkel lehet eredmény elérni A különbség, hogy az adott feladatot milyen hatékonysággal sajátítja el az alany, illetve hogy a feladatot milyen érzelmi állapotban tudja majd végrehajtani.
Büntetétes kiképzés Használt módszerek: Pozitív büntetés (nagyrészt) Negatív megerősítés Már a kezdetektől hibátlan gyakorlatra törekszik
Tradicionális kiképzés Használt módszerek: Negatív megerősítés (nagyrészt) Pozitív büntetés Pozitív megerősítés (esetleg, bár főként a büntetés káros hatásainak kioltására használják, ugyanis minden negatív megerősítést szükségszerűen megelőz egy pozitív büntetés, amelynek viszont káros hatása van a munkára) Már a kezdetektől hibátlan gyakorlatra törekszik
Motivációs kiképzés Használt módszerek: Pozitív megerősítés (eleinte) Pozitív büntetés (később, pontosítás ) Kezdetben megengedi, a pontatlan gyakorlatokat, később büntetéssel pontosít
Klikkerképzés Használt módszerek: Pozitív megerősítés A viselkedés kialvása Negatív büntetés Kondicionált megerősítés Ezek együttes és kizárólagos használata esetén beszélünk klikker tréningről. Ha +B és M is használatban van az NEM klikker tréning, akkor sem, ha a megerősítésre klikkert használunk.
Miért nem lehet keverni őket jól? A tradicinális tréning passzivitásra tanít: Ha nem mondott semmit a gazda, az a legbiztonságosabb, ha nem csinálsz semmit. A klikker aktivitásra tanít: Ha nem történt semmi, próbálj valami mást, az talán működni fog. A két dolog nem egyeztethető össze, hasonlóan mint ahogy nem lehet valaki egyszerre optimista és pesszimista is.
Az operáns kondicionálás hármas egysége előzmények pl. hangjel, testjel stb. viselkedés eredmény megerősítés Abban az esetben, ha a viselkedést megelőző jel mindig jelen van, amikor a viselkedés megerősítést nyer, a jel és a viselkedés összekapcsolódik (a jel és a viselkedés összekapcsolódása pavlovi kondicionálás!!!)
Jelek, parancsok, ingerek Klikkerképzésben inkább jelekről és nem parancsokról beszélünk, jelezve, hogy ezekben semmilyen kényszer nincsen (zöld lámpa) Jelentősen eltér a bevezetésük is, mivel itt először megtanítjuk a viselkedést és csak utána nevezzük meg (tangózz) Tradicionálisan, már a kezdetektől kiadjuk a paracsot, majd végrehajttatjuk azt (figyelmeztető inger) Lehetőséget ad a kellemetlenségek elkerülésére
Diszkriminatív ingerek Egy viselkedéssel társuló inger, amely előre jelzi a viselkedés várható eredményét (pl. az autó ajtaján a zár és a kinyitás mint cselekvés) Két fajtája van: ID: a cselekvés sikeres lesz (megerősítést hoz) Idelta: a cselekvés nem lesz sikeres, nem lesz megerősítve pl. zöld/piros lámpa
Inger kontrol Négy feltétel van, melynek tejesülése esetén beszélhetünk csak teljes ingeri kontrollról X jelre az X cselekvés kiváltódik (X jel ID az X cselekvésre) spontán az X cselekvés nem történik meg (a jelek teljes hiánya Idelta az X cselekvésre) Y jelre soha nem történik X cselekvés (minden Y jel Idelta az X cselekvésre) X jelre soha nem történik Y cselekvés (X jel Idelta az Y cselekvésre)
A jutalom kiszámíthatósága A túlságosan kiszámítható egyhangú jutalom veszít az értékéből. Ugyanakkor a kiszámíthatatlanság (minőségben és mennyiségben) jelentősen növeli az értékét (ld. pénz) Ez mozgatja a szerencsejátékokat is. Pl. rengetegen lottóznak, noha világos, hogy várható értékben a fogadók veszítenek A főnyeremény (jackpot) szintén jól használható
Általánosító- és megfigyelőképesség Mi van a képen?
Általánosítási képességek A büntetést a kutya könnyebben általánosítja (viszont sokszor rosszul) A pozitív megerősítéssel tanított gyakorlatok sokkal inkább érzékenyek a környezeti ingerekre (a kutya itt nehezebben általánosít, viszon a környezeti ingereket is a tanult viselkedéshez köti)
Összefoglalás Megerősítés és büntetés Az időzítés fontossága, a kondicionált megerősítés Jelek és ingerek, viselkedések jelhez kötése Inger kontroll Általánosító képesség