Kunsten å ødelegge en kommando

Kunsten å ødelegge en kommando

En artikkel om positive og negative diskriminative stimuli, eller hvorfor man ikke bør blande klikkertrening og trening med korrigering.

Tekst: Karen Pryor

En tillært stimulus som kommer forut for en operant adferd kalles av læringspsykologene for en `diskriminativ stimulus`. Læringspsykologene skiller ikke, så vidt jeg vet, mellom en diskriminativ stimulus som er lært ved hjelp av positiv forsterkning og en som er lært ved hjelp av negativ forsterkning. I praksis er det derimot en klar forskjell.

I klikkertrening (operant betinging med en betinget forsterker) blir adferden først utviklet, som en operant adferd fritt tilbudt i forventning av positiv forsterkning. Den diskriminative stimulusen (f.eks. kommandoen) blir deretter paret med adferden for å kunne fungere som en indikator på at den bestemte adferden vil bli etterfulgt av en positiv forsterker. Hver diskriminative stimulus signaliserer muligheten til å tjene en forsterker for en bestemt adferd eller samling adferder.

Denne positivt innlærte diskriminative stimulusen «åpner alltid døren» til positiv forsterkning. Hvis adferden ikke forekommer, er det eneste resultatet at forsterkeren uteblir. Når adferden forekommer er forsterkeren garantert. (Klikkertrenere kaller ofte denne typen kommando for et «signal» for å skille det fra den tradisjonelle kommandoen). Så snart dyret forstår hva en gitt kommando betyr, blir kommandoen, eller den diskriminative stimulusen, i seg selv en betinget forsterker, akkurat som klikket.

Altså kan man bruke kommandoen som en forsterker for adferd som forekommer i det kommandoen blir gitt. Man kan for eksempel bruke den veletablerte positive kommandoen for en bestemt adferd til å forme (shape) en annen adferd.

Det virker også sannsynlig at den behagelige følelsesmessige responsen som vi vet assosieres med klikket også faller sammen med presentasjonen av disse positivt innlærte kommandoene.

Adferd som har blitt trent med korrigering er også styrt av diskriminative stimuli som indikerer når en bestemt adferd skal forekomme. Men disse diskriminative stimuliene kan eller kan ikke føre til positiv forsterkning. Hvis hunden ikke utfører adferden på kommando, eller utfører den feil, tilføres positiv straff (vanligvis kalt «korrigering»). Den negative diskriminative stimulusen (kommandoen) er nå en betinget negativ forsterker og signaliserer muligheten for å unngå straff.

Selv når adferden tidligere ble trent utelukkende med positiv forsterkning vil stimulusen øyeblikkelig miste sin verdi som en positiv forsterker dersom man klikker for korrekt adferd etter en diskriminativ stimuli, men også tilfører aversiver (korrigeringer som rykk i lina, kjefting etc.) for ukorrekt adferd etter samme stimulus. Det er i beste fall tvetydig i forhold til forsterkning. Det er ikke et klikk.

Den diskriminative stimulusen vil ikke lenger automatisk utløse de positive følelsene assosiert med betingede positive forsterkere. Kommandoene kan ikke lenger brukes forutsigbart i en kjede for å forsterke forrige adferd.

Selv om pirimære forsterkere, som kos, leker og godbiter tilføres i overflod under eller etter trening eller konkurranse, vil de diskriminative stimuliene, kommandoene, være like mye trusler som lovnader om forsterkere. Adferd har da en tendens til å bryte sammen, interessant nok både før og etter disse tvetydige kommandoene. Før; fordi adferden foran kommandoen vil ekstingveres på grunn av manglende positiv forsterkning. I stedet vil utførelse av adferden «belønnes» med en trussel. Og etter; fordi adferd som kan bli straffet har en tendens til å unngås.

Skiftet blir tydelig hos hunden som skifter fra lydhør iver til motvilje, ofte med synlige manifestasjoner av stress. Selv om korrekt respons etter et bestemt diskriminativt stimulus fremdeles følges av forsterkning har du gjort denne bestemte diskriminative stimulusen tvetydig i forhold til resultatet dersom ukorrekt respons nå følges av straff.

Den diskriminative stimulusen er ikke lenger «trygg». Du har ødelagt kommandoen din…

Det er forsket endel på fenomenet “Poisoned cues” de siste årene, først og fremst av Dr. Jesús Rosales-Ruiz ved University of North Texas og hans studenter. Du kan lese en hel masteroppgave om temaet her