Konsten att förstöra ett kommando

Konsten att förstöra ett kommando

En artikel om positiva och negativa diskriminativa stimuli, eller hur man inte bör blanda klickerträning och träning med korrigering.

Text : Karen Pryor

En inlärd stimulus som kommer före ett operant beteende kallas av inlärningspsykologerna för en ”diskriminativ stimulus”. Inlärningspsykologerna skiljer inte, så vitt jag vet, mellan en diskriminativ stimulus som har lärts in med hjälp av positiv förstärkning och en som har lärts in med hjälp av negativ förstärkning.

praktiken är det däremot en klar skillnad. Vid klickerträning (operant betingning med en betingad förstärkare) utvecklas först beteendet som ett operant beteende fritt erbjudet i förväntan på positiv förstärkning. Den diskriminativa stimulusen (t ex kommandot) paras därefter med beteendet för att kunna fungera som en indikator på att det bestämda beteendet efterföljs av en positiv förstärkare. Varje diskriminativa stimulus signalerar möjligheten att förtjäna en förstärkare för ett bestämt beteende eller för en samlad mängd beteenden.

Denna positivt inlärda diskriminativa stimulus ”öppnar alltid dörren” till positiv förstärkning. Om beteendet inte erbjuds, blir resultatet endast att förstärkaren uteblir. När beteendet erbjuds, garanteras förstärkaren. (Klickertränare kallar ofta denna typ av kommando för en ”signal” för att skilja den från det traditionella kommandot).

Så snart djuret förstår vad ett givet kommando betyder, kommer kommandot, eller den diskriminativa stimulusen, att bli en betingad förstärkare, precis som klicket. Alltså kan man använda kommandot som en förstärkare för det beteende som utförs just när kommandot ges. Man kan t ex använda det väletablerade positiva kommandot för ett speciellt beteende för att forma (shapa) ett annat beteende. Det verkar också sannolikt att den angenäma känslomässiga respons som vi vet associeras med klicket, även förknippas med presentationen av dessa positivt inlärda kommandon.

Beteenden som har tränats med korrigering är också styrda av diskriminativa stimuli som indikerar när ett givet beteende skall utföras. Men dessa diskriminativa stimuli kan eller kan inte leda till positiv förstärkning. Om hunden inte utför beteendet på kommando, eller utför det fel, tillförs positivt straff (vanligtvis kallat ”korrigering”). Den negativa diskriminativa stimulus (kommandot) är nu en betingad negativ förstärkare och signalerar möjligheten att undvika straff. Även när beteendet tidigare tränades uteslutande med positiv förstärkning, där man klickar för korrekt beteende efter en diskriminativ stimulus, kommer stimulus ögonblickligen förlora sitt värde som en positiv förstärkare om man samtidigt tillför även aversiver (korrigeringar så som ryck i kopplet, skäll etc) för inkorrekt beteende efter samma stimulus. Det är i bästa fall tvetydigt i förhållande till förstärkning. Det är inte klicket. Den diskriminativa stimulusen kommer inte längre att automatiskt utlösa de positiva känslorna associerade med betingade positiva förstärkare. Kommandoorden kan inte längre användas förutsägbart i en kedja för att förstärka föregående beteende.

Även om primära förstärkare, så som kel, lek och godis tillförs i mängder under eller efter träning eller tävling, kommer de diskriminativa stimulierna, kommandoorden, att vara lika mycket ett hot som löftet om förstärkare. Beteenden har då en tendens att bryta samman, intressant nog både före och efter dessa tvetydiga kommandon. – Före; därför att beteendet före kommandot kommer att extingveras (utsläckas) på grund av bristande positiv förstärkning. I stället kommer beteendets utförande att ”belönas” med ett hot. – Och efter; därför att ett beteende som kan bestraffas har en tendens att undvikas.

Förändringen blir tydlig hos hunden som ändrar från lyhörd iver till motvilja, ofta med synliga manifestationer på stress. Även om korrekt respons efter en bestämd diskriminativ stimulus fortfarande följs upp med förstärkning, har du gjort denna bestämda diskriminativa stimulus tvetydig i förhållande till resultatet om inkorrekt respons nu följs av straff.

Den diskriminativa stimulusen är inte längre ”trygg”. Du har förstört ditt kommando… 

Det är forskat en hel del på fenomenet “Poisoned cues” de senaste åren, först och främst av Dr Jesús Rosales-Ruiz vid University of North Texas och hans studenter. Du kan läsa en hel mastersuppgift om temat här.