Positiv eller negativ forsterkning?

Positiv eller negativ forsterkning?

Noen ganger når man hører hundefolk diskutere treningsmetoder, skulle man nesten ikke tro at de snakket om den samme dyrearten...

Tekst: Morten Egtvedt & Cecilie Køste

Forestill deg at du har invitert to erfarne hundeinstruktører til middag. Som alltid når hundefolk er samlet, blir samtaleemnet fort ganske ensporet, og allerede under forretten er bikkjepraten i gang.

 

Middag med to hundeinstruktører

Dere begynner først å diskutere problemet med naboens briard som av en eller annen grunn har utviklet et “hilserituale” som går ut på å plante forbeina i brystkassen til alle folk den skal hilse på. “Sett kneet i brystet på´n”, sier den første instruktøren. “Snu ryggen til og overse hunden til den har alle beina på bakken”, sier den andre. “Jaha”, tenker du og spiser videre.

Under hovedretten begynner dere å diskutere hvorfor så mange hunder gjør det dårligere i lydighetskonkurranser enn på trening. “Bikkja skjønner at føreren ikke kan ta han inne i ringen”, sier den ene instruktøren. “Bikkjene skjønner at de ikke får tennisballen eller godbiten så lenge de er inne i ringen”, sier den andre. “Hæ?”, tenker du mens du lusker ut på kjøkkenet etter desserten.

Dere begynner på desserten. “Vær konsekvent! Har du sagt “sitt” så skal hunden sitte enten den vil eller ikke”, sier den ene instruktøren. “Hvis hunden ikke etterkommer kommandoen er det du som går for fort frem. Gjør det litt lettere for hunden og prøv en gang til”, sier den andre.

På dette stadiet har du blitt så forvirret at du forlengst har mistet matlysten. Når de to instruktørene begynner å diskutere apportering, finner du det smartest å snike deg ut på toalettet. Gjennom døra hører du at ordene “tvangsapport” og “baklengskjeding” flyr gjennom lufta mens lydnivået stadig blir høyere.

De to instruktørene fortsetter å komme med tilsynelatende helt motstridende løsninger på de samme problemene. De er selvsagt helt uenige med hverandre, og ingen av dem kan fatte og begripe hvordan den andre noen gang har fått til en hund. Samtidig vet du at begge instruktører kan vise til gode resultater i praksis med sine egne hunder.

Hva er årsaken til at de to er så uenige? Kan det være noe med middagen? Svaret får du kanskje hvis du leser videre.

To typer forsterkning

Adferd hos dyr (inkludert mennesker) er slett ikke så tilfeldig som det av og til kan se ut til ved første øyekast. Hvis man ser nærmere etter, vil man oppdage at de aller fleste handlinger fører til et eller annet synlig resultat.

Adferd Konsekvens (resultat av adferden)
Per tar ned dørhåndtaket Døra går opp
Hunden drar i båndet Hunden kommer seg fortere framover
Kari går utenom en søledam Kari unngår å bli våt på beina
Hunden går og legger seg i kurven sin Eieren slutter å stirre/peke på hunden

 

I alle disse fire eksemplene ser vi at adferden har et resultat, eller en konsekvens som man sier på fagspråket. Enten oppnår vi noe vi har lyst på (døra åpner seg, hunden kommer seg fortere framover til interessante lukteflekker) eller vi unngår noe ubehagelig (unngår å bli våte på beina eller en truende eier). I alle tilfeller blir adferden forsterket. Det vil si at det blir mer sannsynlig at adferden vil bli gjentatt neste gang vi er i en lignende situasjon.

Vi ser fra eksemplene at det er to typer forsterkning. Den første kaller vi positiv forsterkning. I dagligtale kaller vi ofte dette for belønning. Når en adferd resulterer i noe vi har lyst på, er det mer sannsynlig at vi vil gjenta den samme adferden senere i en lignende situasjon.

Hvis du har gått 9 års grunnskole og ellers fått en normal oppdragelse har du også lært å utføre en hel del adferder for å unngå ubehagelige ting. Dette kalles for negativ forsterkning. Hvis en adferd fører til at vi unngår noe ubehagelig er det også større sjanse for at vi vil gjenta denne adferden neste gang vi er i en lignende situasjon.

Hvis man ser litt nøyere etter er det vanligvis lett å se på en hund om adferden den utfører akkurat i dette øyeblikket er under kontroll av positiv eller negativ forsterkning. Neste gang du ser på en lydighetskonkurranse kan du legge spesielt godt merke til hundens kroppsholdning og ansiktsuttrykk. Legg også merke til førerens oppførsel og stemmebruk. En hund som jobber for å få tennisballen eller en godbit (positiv forsterkning), vil oppføre seg på en annen måte enn en hund som jobber for å unngå et rykk i halsbåndet, kjeft eller noe annet ubehagelig (negativ forsterkning). For utenforstående kan det se ut som om de to hundene gjør nøyaktig det samme. Begge to utfører jo øvelsene og følger førerens kommandoer. Likevel lever de to hundene i to helt forskjellige verdener.

Hundeførerne oppfører seg også forskjellig. En hundeeier som har lært hunden å jobbe primært for å unngå ubehag vil ofte si kommandoene med høyere stemme, han vil ofte ha en truende kroppsholdning og du ser på eieren at han er klar til å ”ta hunden” hvis den skulle finne på noe tull.

Hundeeiere som har lært å bruke positiv forsterkning på en effektiv måte trenger ikke å brøle kommandoene. De vet at hunden hører aldeles utmerket og at det ikke er volumet som er avgjørende for resultatet. De har også ofte en mer avslappet kroppsholdning (selv om de sikkert også blir anspente under konkurranser) og stoler mer på hunden sin. Hunder som er trent positivt har jo ingen grunn til å ville stikke av uten videre. Det er jo hos eieren at godsakene finnes.

Adferd er egoistisk

Det er en utbredt misforståelse (eller i beste fall lite presist) at hunder gjør ting “fordi vi sier det”, “fordi den jobber for oss”, “fordi vi har lederskap/er sjefen” osv. Hunden jobber enten 1) for å oppnå noe den har lyst på, eller 2) for å unngå noe ubehagelig. Andre alternativer finnes ikke.

Kommandoen vår er bare et hint til hunden om at hvis den utfører en bestemt adferd akkurat nå, har den sjansen til 1) å få en godbit (eller en annen belønning) eller 2) den kan unngå en ubehagelig korrigering (avhengig av hvordan den har blitt trent). Med andre ord – adferden innebærer noe fordelaktig for hunden selv. All adferd er egoistisk!

Hunden adlyder slett ikke en kommando fordi den vil at eieren skal føle seg bedre (”bli tilfredstilt”) – den gjør det fordi dette innebærer noe fordelaktig for den selv. Hundeeiere som sier at “hunden skal gjøre det fordi jeg sier det!” trener stort sett med hjelp av mye ubehag hvis man ser nærmere etter.

Av en eller annen grunn vil hundeeiere som trener med mye ubehag ofte bruke mange abstrakte begrep som f.eks. ”respekt”, ”autoritet”, ”lederskap”, de snakker om å etterligne ulver osv. Kanskje har dette sammenheng med at det ikke er så moro å snakke konkret om hvordan de trener i praksis. Det høres unektelig litt finere ut å si at man bruker ”ulvemetoden” enn å si at ”jeg fillerister hunden eller rykker i halsbåndet slik at hunden letter fra bakken”.

Utsagn om at hunder prøver å tilfredstille oss har derfor liten dekning. Det har derimot atskillig mer å gjøre med at hunden har funnet ut at den får mindre kjeft når den gjør som du sier enn at den har noen dypere forståelse for din emosjonelle tilstand.

Ros

Er ros alltid en positiv forsterker? De fleste forutsetter dette. Imidlertid forstår ikke hunden hva “flink gutt” betyr før han har lært det. Ros kan faktisk bety forskjellige ting for forskjellige hunder.

En hund som blir trent hovedsaklig med positiv forsterkning, får ofte ros rett før tennisballen eller godbiten blir servert. For denne hunden vil “flink gutt” etterhvert bety det samme som “belønningen er på vei!”. Du kan formelig se at det lyser tennisracket i øynene på en slik hund når den får ros. I denne situasjonen kan vi derfor anta at ros er en betinget positiv forsterker, for å bruke fagspråket.

En hund som blir trent mye med ubehag får også ros av og til, men her får rosen en annen betydning. For denne hunden betyr rosen noe sånt som at “akkurat nå er det ingen fare for at jeg får kjeft, rykk i bånd eller andre ubehageligheter”. Det vesentlige for denne hunden er med andre ord at når den får ros er den “trygg” og slipper ubehageligheter en liten stund. Denne rosen er med andre ord på et helt annet språk…

Mange tror at de trener “positivt” fordi de ofte roser hundene sine når de gjør riktig. De tror til og med at hunden jobber for å få ros. Hvis man ser nærmere på mange av disse hundene, vil man imidlertid se at de egentlig jobber for å unngå å bli korrigert. Rosen forteller dem at de ikke blir korrigert akkurat nå, men adferden er fortsatt under kontroll av negativ forsterkning. Hvis denne hundeføreren slutter å korrigere når hunden gjør feil og bare roser som før, vil sannsynligvis hunden slutte å prestere særlig bra ettersom det er det å unngå ubehageligheter som gjelder for denne hunden.

Vi har også en tredje type hund, som det finnes ganske mange av. Denne hunden forbinder ikke rosen med noe som helst. Føreren har hørt at man skal rose hunden, så det gjør han ganske ofte, men rosen etterfølges sjelden av noe annet. Rosen har derfor ingen som helst betydning. Den er bare “bakgrunnsstøy” uten signalverdi for hunden og har derfor ingen treningseffekt i det hele tatt.

Hvem har rett?

Nå som vi vet litt mer om forsterkning kan vi gå tilbake til de to kranglefantene ved middagsbodet. Hvem er det egentlig som har rett?

Hvorfor går hunden dårlig i lydighetsringen? Er det fordi den vet at føreren ikke kan “ta han” eller er det fordi den vet at den ikke får godbiter i ringen? Det høres kanskje merkelig ut, men begge instruktører kan faktisk ha like rett. Det kommer bare an på hvordan hunden er trent…

For en hund som er trent med mye ubehag, er nok den første forklaringen den mest sannsynlige. Hunden har gjennom flere konkurranser funnet ut at han “er trygg” inne i ringen samme hva han gjør. Det er egentlig ikke helt presist å si at hunden “skjønner” at føreren ikke kan “ta han”; Vi kan si at en hund som blir trent med mye ubehag lever i den forståelse at så lenge den ikke blir korrigert, gjør den riktig. Når denne hunden går dårlig inne i lydighetsringen og føreren ikke kan korrigere hunden for dette (det har han jo ikke lov til etter regelverket), vil han faktisk forsterke at hunden går dårlig! Fraværet av ubehag “forteller” hunden at den gjør riktig selv om både poeng og forhåpninger om opprykk blåser avgårde. Noen førere som opplever dette sier at hunden egentlig vet at den gjør feil. Men det gjør den ikke! Tvert i mot så vet hunden at den gjør alt helt riktig (sett fra sitt ståsted) så lenge den ikke blir korrigert – samme hvor elendig den går (sett fra dommerens og førerens synspunkt).

Hunder som er trent med positiv forsterkning, kan etter noen konkurranser finne ut at de aldri blir belønnet inne i lydighetsringen samme hvor bra de går. Dermed forsvinner arbeidslysten ut av vinduet. I dette tilfellet er det den andre instruktøren som har rett.

Løsningen blir i begge tilfeller å trene så likt konkurransesituasjonen som mulig. For førere som trener mye med ubehag er det viktig at de har trent så godt og grundig før konkurransen at de er sikre på at hunden ikke gjør feil. For hvis den gjør feil under konkurransen og føreren ikke kan korrigere dette, vil hunden lære at “dette er en grei måte å gjøre det på under konkurranser!”.

For førere som trener mest med positiv forsterkning er det viktigste at man har lært hunden å jobbe over lengre tid og utføre flere øvelser for hver belønning. Det beste er om hunden kan gå gjennom hele konkurranseprogrammet for å få tennisballen eller godbiten til slutt (på utsiden av ringen), men dette må trenes opp gradvis. Også her er det viktig å trene likt konkurransesituasjonen slik at hunden ikke finner ut at det er mye mindre sjanse for å bli belønnet under konkurranser. Hunden finner fort ut at “aha, denne situasjonen kjenner jeg igjen, her er det ingen vits å anstrenge seg. Jeg får ikke ballen uansett”.

Når man vet hvorfor hunder oppfører seg slik de gjør trenger vi ikke lenger å tillegge dem menneskelige egenskaper eller motiver. Hunder er slett ikke ”sta”, ”prøver å opponere”, ”protestere” eller ”teste deg”. De bare gjør det som blir forsterket – punktum.

Skal man være ”konsekvent”?

Skal man være “konsekvent” eller skal man bare overse hunden når den gjør feil? Nok en gang har begge instruktører like rett, og her ligger en vesentlig forskjell mellom trening med positiv og negativ forsterkning.

Hvis du trener med aversiv kontroll (ubehag) må du være “konsekvent” i den betydning at hunden må være helt sikker på at hvis den gjør en feil, blir det ubehagelig – hver eneste gang i alle situasjoner. Hvis du bare korrigerer en uønsket adferd av og til, vil hunden med en gang begynne å tenke ”hva var det som var forskjellig i denne situasjonen og når jeg gjorde nøyaktig det samme før i dag? Kan det kanskje ha noe å gjøre med at eieren min ikke var i rommet da…?” Omtrent slik ville hunden kanskje ressonert hvis den kunne snakke og ressonere. Vel, den finner ihvertfall konklusjonen ganske fort.

Hvis du først korrigerer hunden etter å ha gjentatt kommandoen flere ganger, lærer hunden fort ikke å skjerpe seg før den tredje kommandoen (eller når stemmebruken er høy nok). Derav rådet om at man skal “mene hva man sier”.

Med en hund som er trent med positiv forsterkning, f.eks. en tennisball eller godbit, er det ikke like viktig å være “konsekvent” i den samme betydningen. Hvis hunden går dårlig fri ved foten, er det ingen krise. Føreren kan bare velge å avbryte (beklager kamerat – dette får du ingen belønning for!), eller fortsette å gå og vente med å belønne til hunden går bra nok. Samtidig må føreren innse at hunden ikke var klar for dette steget enda og gå litt tilbake i innlæringen ved neste forsøk.

Hvis vi trener med positiv forsterkning kan vi etterhvert belønne etter en variabel forsterkningsskala. Dette betyr at vi belønner sjeldnere rent gjennomsnittlig, men etter et uregelmessig mønster. Omtrent som en spilleautomat. Hvis vi øker tiden som hunden må jobbe for hver belønning gradvis og fornuftig, får vi etterhvert en hund som kan jobbe over lang tid mellom hver belønning.

Hvis du trener med aversiv kontroll, kan du ikke bruke en forsterkningsskala. Aversiv kontroll er bare effektivt hvis hunden vet at den blir korrigert hver eneste gang den gjør feil.

Vi ser at dette er to fundamentalt forskjellige måter å trene på. Trener man med aversiv kontroll, kan vi si at man leter etter feil. Hver feil må korrigeres og etterhvert finner hunden “den smale sti” som han kan holde seg på for å slippe ubehageligheter. Trener man med positiv forsterkning, leter man heller etter det hunden gjør riktig. Etterhvert finner hunden ut hva som gir resultat og ikke. Det er ikke rart at treningsrådene kan bli forskjellige….

”Sikker i øvelsen”…..?

Mange hundeeiere bruker mest positiv forsterkning under nyinnlæringen, men hevder så at man etterhvert må stille “krav”. Dette innebærer stort sett at man begynner å korrigere hunden når den gjør feil. ”Den vet jo hva den skal gjøre..!” Man starter altså innlæringen med positiv forsterkning, men baserer seg etterhvert også på negativ forsterkning. Det hevdes at dette er nødvendig for å gjøre hunden “sikker” i øvelsen. Det er riktig at dette er én måte å gjøre det på. Det er imidlertid helt feil at man gjøre dette.

Det er ingen trenere som kaster seg over en spekkhogger som gjør feil for å korrigere den (det skulle jeg likt å se forresten) – og de kjøttbergene blir rimelig sikre i å hoppe gjennom ringer likevel. Her skaper man “sikkerhet” i øvelsen gjennom variabel forsterkning samt å holde tilbake fisken (belønningen) når spekkhoggeren gjør feil, ikke presterer bra nok eller ikke utfører øvelsen raskt nok på kommando/signal. Det samme kan man selvfølgelig gjøre med hunder også.

En hund blir aldri 100% sikker på å utføre en øvelse. ”Full kontroll”, som noen snakker om, sier nok mer om enkelte instruktørers markedsføringsegenskaper enn om deres forståelse for hvordan levende vesener fungerer.

Hver gang hunden blir belønnet for å gjøre en ting riktig blir den litt flinkere, og det er dermed enda litt mer sannsynlig at den vil gjøre ting riktig også neste gang. Jobben vår er å gi hunden så mange vellykkede repetisjoner som mulig i så mange forskjellige situasjoner som mulig. (En ”vellykket repetisjon” er tre ting: 1) hunden gjør det vi vil, 2) vi forsterker presist, og 3) forsterkeren er noe hunden virkelig setter pris på). Hvis vi trener riktig vil vi etterhvert få en hund som gjør det vi ber den om i de aller fleste situasjoner – og det skal vi være fornøyd med.

Er det egentlig praktisk mulig å bare overse alt det gale en hund gjør og heller bare belønne når den gjør riktig? Vel, det er dessverre ikke riktig så enkelt heller. Det hadde vært så enkelt hvis de eneste positive forsterkerne i hundens liv befant seg i vår jakkelomme, men verden byr jo som kjent også på mange andre fristende ting. Det er selvsagt meningløst å overse eller ignorere en hund som ikke kommer på innkalling og springer bort til andre hunder eller går og lukter i stedet. Selv om hunden gikk glipp av godbiten fordi den ikke kom, blir den jo fortsatt belønnet for å stikke av. Å leke med andre hunder eller å lukte på tispeflekker er jo meget effektive forsterkere. Å overse uønsket adferd er bare effektivt så lenge vi har kontrollen over det hunden ønsker å oppnå (oppmerksomhet, godbitene vi har i lomma osv.).

Å sette grenser, eller rettere sagt hindre at hunden blir forsterket for uønsket adferd, er derfor også nødvendig i noen situasjoner. Men dette kan gjøres på en rolig og vennlig måte uten å skyte spurv med kanoner. Bruk langline som du rolig kan stoppe unghunden med når den prøver å stikke av. Klikk og belønn når den kommer til deg i stedet (og kanskje la den springe bort til den andre hunden som belønning fordi den kom til deg!). Sett hånden foran brystet på valpen når den prøver å hoppe opp på kakebordet, klikk og belønn når den holder alle fire beina på bakken.

Hvilken type forsterkning er ”best?

Hva virker best? Trening med positiv forsterkning eller aversiv kontroll? Vel, vi kan ihvertfall slå fast at de to innfallsvinklene virker forskjellig. Begge deler ”fungerer når det blir brukt riktig. Hunder kan lære på begge måter. I hverdagen er begge forsterkningsmekanismer virksomme enten vi vil eller ikke. I samhandling med andre hunder lærer for eksempel valpen din at andre hunder slutter å true (avslutter ubehaget) hvis de selv snur hodet til siden eller bruker andre dempende signaler. Dette er et eksempel på aversiv kontroll, selv om det forsåvidt er helt uskyldig og ikke skadelig på noen måte (ihvertfall så lenge den andre hunden faktisk reagerer på valpens signaler). Man kan ikke si at all bruk av aversiv kontroll er forkastelig pr. definisjon slik noen later til  mene. Graden av ubehag er avgjørende hvis man skal snakke om etikk i denne sammenhengen.

Selv er vi ikke så veldig opptatt av etikk i forbindelse med hundetrening. Derimot er vi veldig opptatt av hva som er effektivt, og det er først og fremst på den bakgrunn vi velger å bruke positiv forsterkning framfor aversiv kontroll. Så hvis du etter å ha lest denne artikkelen fortsatt velger å bruke aversiv kontroll som basis for treningen din har vi kanskje gjort en dårlig skrivejobb. Det er også noen bivirkninger du skal være klar over:

Bivirkninger ved aversiv kontroll

Mye bruk av aversiv kontroll kan føre til passivitet og at hunden ikke tør  gjøre ting på egen hånd. Hunden blir redd for  å gjøre feil og finner ofte ut at det er tryggest  gjøre minst mulig, hvertfall så lenge ikke eieren ber den om  gjøre noe. Mange foretrekker faktisk at hunden deres skal være slik - som en instinktløs sofaputelignende organisme uten fnugg av egeninitiativ. Men hvis man skal bruke hunden til aktiviteter som krever større selvstendighet fra hundens side (f.eks. jakt, bruks, redningshundarbeid osv – eller at du rett og slett ønsker å la hunden leve et godt liv) vil dette være en stor ulempe.

En annen ting er at det er vanskelig å være presis når du trener med aversiv kontroll. Hunden kan finne ut andre måter  slippe unna ubehaget på enn å  gjøre akkurat det du ønsket, og så må du korrigere dette også til hunden til slutt finner ut at den bare kan slippe unna ubehaget ved  å gjøre akkurat slik du ønsker.

Mye bruk av aversiver (ubehag) i treningen kan også føre til stress og etterhvert sykdom hos hunder. Hunden har det rett og slett ikke bra. Jo sterkere ubehag man benytter, jo verre kan bivirkningene være. Det er ikke umulig at mange hunder som sliter med mye ”diffuse» sykdommer, allergier, dårlig immunforsvar osv. burde gjort noe med eierens trening i stedet for  gå på medisiner. Det blir som  være konstant på kontoret med en drittsekk som sjef. Slikt blir det som kjent fort endel sykefravær av!

Noen hunder ser ut til å tåle bruk av harde metoder bedre enn andre før de “melder seg ut og blir passive. Mange hundeførere bruker derfor flere forsøk før de finner en hund som passer (er “hardfør nok) til denne typen trening. Generelt sett ser gjeterhundraser som schäfere, belgere, border collie o.l. ut til  være lettere å dressere med aversiv kontroll enn andre raser. Disse hundene svarer ofte på en korrigering med å bli enda mer intensive i sin kontakt med føreren (noen eiere tolker dette som at «de liker å bli korrigert», mens hundene egentlig bare jobber livet av seg for å roe ned føreren). Raser som riesenschnauzer, retrievere o.l. vil ofte bare bli sure, passive eller melder seg ut når de blir behandlet hardt. (“Hvorfor skal jeg være med deg når du behandler meg sånn….?). Og med raser av urhundtype som f.eks. basnjii kan du ihvertfall glemme å trene på denne måten…

Når et dyr blir utsatt for smerte og ubehag skjer det også noe annet som man skal være meget oppmerksom på. I hjernen har vi (både dyr og mennesker) et senter for belønning og et senter for straff. Når vi opplever noe behagelig blir belønningssenteret i hjernen stimulert og frigjør signalsubstanser som gjør at vi føler oss glade og tilfredse. Når vi opplever ubehag, f.eks. når sjefen kjefter på oss eller vi slår oss på tommelen med en hammer, blir straffsenteret vårt stimulert. Vi vet hvordan vi da føler oss. Vi blir sinte, irriterte og gretne.

Tenk deg en dag hvor alt har gått på tverke. Bilen vil ikke starte på grunn av kulden, og du må slite i et kvarter før du endelig får start. Du kommer for sent til jobben, får en overhøvling av sjefen og han setter deg til  gjøre ”drittarbeid resten av dagen. Etter jobben går du tilbake til bilen bare for å oppdage at du har fått en parkeringsbot for  ha parkert en halv meter for langt over streken. Hjemover er det kø langs hele hovedveien og du er ikke spesielt fornøyd idet du endelig kommer inn over dørstokken – og da begynner ektefellen  kjefte på deg fordi du glemte  kjøre innom butikken. Da sprekker det for deg og du svarer tilbake slik at både ungene og bikkja springer og gjemmer seg. Tror du at du hadde brydd deg like mye hvis du nettopp hadde fått et lønnspålegg og ellers vært i strålende humør den dagen? Sannsynligvis hadde du bare smilt og sagt vennlig at du kunne kjøre tilbake til butikken med en gang.

Du har sikkert opplevd lignende situasjoner selv. Når vi er i dårlig humør skal det utrolig lite til før vi blir skikkelig sinte og lar det gå utover noen andre. Det er en rent fysiologisk forklaring på dette fenomenet. Når straffsenteret stimuleres skjer det en av to ting; 1) vi blir sinte, eller 2) vi blir redde.

Når man overfører dette til hundetrening forklarer det plutselig veldig mye. Mange hunder er sinte på andre hunder. Ofte legges grunnlaget for dette i unghundtiden når spesielt hannhundene gjerne vil bort og hilse på alle andre hunder. Veldig ofte får hunden kjeft og/eller rykk i båndet i disse situasjonene. Etterhvert lærer hunden å forbinde synet av andre hunder med ubehag, og vi får disse ukontrollerte utbruddene med bjeffing og utfall, spesielt når hunden er i bånd.

Sammenhengen trenger ikke å være så direkte heller. Vi tør komme med følgende påstand: Hunder som trenes med mye bruk av ubehag vil oftere være aggressive og/eller redde enn hunder som trenes bare med positiv forsterkning. Det er selvfølgelig mange andre faktorer som spiller inn her (miljøtrening, sosialisering med andre hunder og folk osv.), men vi ser fram mot kontrollerte forsøk som tester denne hypotesen. Tenk deg en schäfer (kunne forsåvidt vært en hvilken som helst rase) som har vært på lydighetstrening av den gamle sorten. Hunden har blitt servert kjeft og kobbelrykk med jevne mellomrom den siste halvannen timen. På veien hjem møter de en intetanende golden retriever, og schäferen styrter fram og gir den stakkars hunden en skikkelig omgang. De færreste eiere vil se noen sammenheng mellom treningen og denne episoden, men sannsynligvis var det en direkte sammenheng. Schäferens straffsenter var så stimulert at det var stor sannsynlighet for at noe slikt ville skje.

Morten hund, Kiro, hadde på grunn av flere uheldige episoder utviklet seg til en aldri så liten bråkmaker i sin ungdom. Han skadet sjelden den andre hunden, men begynte ofte å bjeffe og snappe hysterisk etter den andre hunden når han skulle hilse. Morten begynte med følgende opplegg; Hver gang han så en annen hund nærme seg klikket han og belønte med godbit. Det var ikke så farlig hva Kiro gjorde. Han kunne gå ved siden av Morten, kikke opp på han, se på den andre hunden  Morten klikket og belønte uansett, gjerne 7-8 klikk+godbit før de kom helt bort til den andre hunden. Vi oppdaget at hver gang vi kjørte dette opplegget ble det nesten aldri noe bråk når han hilste på den andre hunden. Vi klikket og belønte også når Kiro greide  forlate den andre hunden uten å bråke. Jeg tror mye av årsaken til denne bedringen lå på det ”medisinske» planet. Belønningssenteret hans ble stimulert rett før han møtte den andre hunden og dette gjorde at lunta hans var mye lenger enn den ellers ville vært. Når han først fikk sjansen til å lære at det gikk an  hilse pent på den andre hannhunden og så gå videre uten å bråke, og ble belønnet for det flere ganger, gikk ting veldig fort framover. Nå er det lenge mellom hver gang han er i trøbbel.

Vi tror at med mange hunder som er såkalt aggressive kan man gjøre mye bare ved å se på hvordan man behandler hunden i hverdagen. Vanligvis må det gjøres andre ting også, men å sørge for at hunden din har det bra og er i godt humør er en god start. Og klikkertrening får garantert hunden din i godt humør!

Positiv forsterkning virker med andre ord motsatt av ubehag. Hunden blir gladere og mer tilfreds. I tillegg er positiv forsterkning en mye mer presis måte  trene på. Man kan informere hunden nøyaktig hva den skal gjøre i stedet for  å fortelle den om alle de tingene den IKKE skal gjøre.

Man kan selvfølgelig gjøre feil når man trener med positiv forsterkning også. Timing er viktig. Belønningen må være så god at hunden virkelig vil jobbe for den. Men hvis man gjør feil skjer det ikke noe verre enn at hunden ikke lærer det du vil – du ødelegger hvertfall ikke forholdet mellom deg og hunden.

Ja takk, begge deler…?

Hvis man under trening benytter seg av både positiv forsterkning og aversiv kontroll er det en faktor man bør være klar over. Vi kan se for oss en hund som blir belønnet med både godbiter og andre ting når den er flink, men også tildels kraftige korrigeringer når den gjør feil – en ikke helt uvanlig praksis.

Når hunder utsettes for mye ubehag under treningen blir virkningen av belønningen mindre! Hunden kan rett og slett bli så opptatt av å unngå ubehag at den ikke jobber så hardt for belønningen lenger. Dette kan ha sammenheng med at det evolusjonært sett har større overlevelsesverdi å unngå noe truende enn å oppnå en enkelt fordel.

I en medisinsk fagbok kan vi hente følgende utsagn: “Det er spesielt interessant at stimulering av straffsenteret {i hjernen} ofte kan inhibere senterne for belønning og velbehag totalt, noe som demonstrerer at straff og frykt tar overhånd over velbehag og belønning (Guyton & Hall, 1996).»

Sagt på en enklere måte; du kan belønne hunden til du blir grønn, men det “går ikke inn». Hunden jobber kun for  unngå  bli korrigert – ikke for belønningen.

Det er også en annen ulempe ved å kombinere bruk av belønning og ubehag. En av de største fordelene med å trene 100% positivt er at du kan «fortelle» hunden meget effektivt at den gjorde feil bare ved å holde tilbake belønningen. På denne måten kan du på en veldig fin måte fortelle hunden både hva den gjør riktig (= belønning) og hva den ikke gjør riktig (= ingen belønning). Hvis man derimot kombinerer bruk av belønning og ubehag er det ikke like effektivt å holde tilbake belønningen når hunden gjør feil. For denne hunden betyr nemlig både «belønning» og «ingen ubehag» at den gjorde riktig! Hunden er derfor fortsatt ganske fornøyd, for den fikk jo ikke noe ubehag ihvertfall. Man mister dermed en veldig grei måte å kommunisere med hunden, og må derfor ofte gå hardere til verks for å fortelle hunden når den gjør feil i stedet (med alle de ulemper det fører med seg). Det er med andre ord verre å slutte med aversiv kontroll hvis du først har begynt. Men slett ikke umulig…

Hvordan skal jeg trene?

Dette er et valg du må ta selv. Som hundeeier vil du stadig høre at du trene på en spesiell måte for å få resultater. Dette er feil. Når folk sier at du gjøre en ting er dette som regel bare et uttrykk for denne personens preferanser. Og kanskje har denne preferansen blitt så sterk at han/hun har fått skylapper og ikke lenger greier å se at det finnes alternativer. Eller kanskje han/hun rett og slett ikke vet at det finnes alternativer.

Så la dette være sagt nok en gang: Du kan trene alle lydighetsøvelser både med positiv forsterkning og med negativ forsterkning (eller en kombinasjon av disse).

Men før du nå begynner å tro at det nærmest er likegyldig for oss hvordan du trener hunden din, skal du få vår helt klare mening. Vår drøm er at alle hundeeiere lærer å trene effektivt med positiv forsterkning. Ikke bare for hunden sin del, men kanskje mest av alt for eierens del. Måten du trener på gjør noe med hunden, men det gjør også noe med deg.

En viktig bivirkning ved å bruke ubehag i treningen din er, som vi tidligere nevnte, at du ”ødelegger” kommandoene dine. Hvis du f.eks. har lært hunden å ligge ved hjelp av å bruke ubehag vil kommandoen ”ligg” rett og slett være en trussel for hunden. Kommandoen betyr ”legg deg, ellers….”. Innkallingen din vil bety ”kom hit, ellers…”. Resultatet er at du får en hund som rett og slett hater å få kommandoer. Joda, den adlyder kanskje, men den hater det likefullt. Ingen liker å få trusler…

Og noe tristere hundehold enn dette kan vi rett og slett ikke tenke oss. Tenk deg at din beste venn skal komme når du roper fordi han er redd for at du skal gjøre ubehaglige ting… Sammenlign dette med en hund som kommer mot deg i fullt firsprang overlykkelig over at du endelig ropte på den slik at den fikk sjansen til å komme inn til deg og få en godbit eller en liten kosestund. Og hva er et flott resultat i lydighetsringen verd hvis du vet med deg selv at du har truet hunden din gjennom programmet…?

Opplevelsen av å gå gjennom et perfekt lydighetsprogram der du ser at hunden tydelig går og venter på belønningen hele tiden, er noe vi unner alle hundeeiere å oppleve. Når du først har opplevd dette, er det ingen vei tilbake…

Oppsummering

All adferd styres av positiv forsterkning eller aversiv kontroll. Dette gjelder både under trening og ellers i dagliglivet. Hvis vi ønsker å forklare og forstå hundens adferd er det derfor nyttig å kjenne til begge disse mekanismene. Målsetningen med denne artikkelen var å vise at man må trene helt forskjellig alt etter hvilken type forsterkning man ønsker  jobbe med. Når folk kommer med totalt motstridende råd kan ofte forklaringen være at de jobber med forskjellig type forsterkning. Derfor kan faktisk begge ha like rett – på sin måte. Det er imidlertid liten tvil om hva som er mest effektivt, og hvis hunden fikk velge er det nok enda mindre tvil om hvordan den hadde foretrukket å lære Trening med positiv forsterkning krever litt innsats og tålmodighet av eieren i starten, men resultatet blir så mye bedre på lang sikt.

Det viktigste er kanskje bare det å være klar over at det er forsterkning som gjør at hunden vår lærer – både imponerende lydighetsøvelser og plagsomme unoter. En god start for å effektivisere treningen din kan være å tenke gjennom og bli bevisst hvilken type forsterkning du bruker til enhver tid. Neste gang du mottar et velmenende råd fra en instruktør eller treningskamerat kan du nå på forhånd analysere om dette rådet bygger på positiv forsterkning eller aversiv kontroll.

Og for all del  ikke la deg lure om den du får råd av pakker det inn i fine ord som ”lederskap, ”respekt», «naturlig trening», ”sosiale krav», ”eieren i fokus» osv, osv. Nå som du har lest dette kapittelet vet du nok til  gjennomskue denne retorikken. Forlang bestandig å få konkrete råd! Hvis instruktøren ikke kan eller vil være konkret, kan du jo spørre deg selv om hvorfor og trekke dine egne konklusjoner.

Det virkelige gjennombruddet kommer når du tar med deg denne forståelsen ut i dagliglivet og begynner å analysere adferd hos både dyr og mennesker. Se på situasjonen, se på adferden, og se på resultatet av adferden. Blir adferden du akkurat nå observerer hos naboens hund opprettholdt av positiv forsterkning eller aversiv kontroll? Kunne det blitt gjort på en annen måte?

Lykke til med treningen!