BEVOR ES LOSGEHEN KANN
Um komplexe Verhalten trainieren zu können, ist es enorm wichtig, so eindeutig wie möglich mit dem Hund zu kommunizieren. Dazu sind einige lerntheoretische Grundlagen nötig, denn nur auf dieser Basis lässt sich das Training entsprechend effektiv gestalten. Als Trainer müsst ihr wissen, wie ihr Verhalten hervorrufen sowie erwünschte Verhalten verstärken könnt und wie mit unerwünschten Verhalten umzugehen ist. Effektives Training bedeutet auch, das Trainingshandwerkszeug zu beherrschen. Ein guter Trainer zu sein, kann man lernen. Übungen zur Verbesserung des eigenen Timings, die Schulung des Auges und die Arbeit an der eigenen Körperwahrnehmung und -kontrolle lohnen sich. Auf lange Sicht erleichtern sie es euch, dem Hund eure Ideen begreiflich zu machen.
Moderne Lerntheorie kompakt – das Handwerkszeug
Wir unterscheiden zwischen klassischer und operanter Konditionierung. Bei der klassischen Konditionierung nach Pawlow wird ein unbedeutender Reiz in einen bedeutsamen Reiz umgewandelt (bei Pawlow folgte auf einen Glockenton jedes Mal Futter). Dieser Reiz löst in Zukunft eine Reaktion aus (der Glockenton löste von nun an Speichelfluss aus). Beispiele für klassische Konditionierung sind emotionale und reflexartige Reaktionen auf Reize, etwa Angst bei Gewitter oder Erwartungshaltungen im Training.
Bei der operanten Konditionierung nach Skinner beeinflusst die für den Hund positive oder negative Konsequenz, ob das jeweilige Verhalten häufiger oder seltener auftritt. Es ist also entscheidend, was NACH dem Verhalten passiert. Training mit operanter Konditionierung hat den Vorteil, dass wir steuern können, ob ein Verhalten in Zukunft öfter gezeigt wird. In klassisch konditionierte Prozesse kann man allerdings nur sehr schwer über operante Konditionierung eingreifen, weil der Reiz die Kontrolle über das Verhalten hat.
Wer effektiv trainieren und von aktiver Mitarbeit des Hundes profitieren möchte und wer im Endergebnis auf Lebendigkeit des gezeigten Verhaltens Wert legt, bedient sich der operanten Konditionierung mittels positiver Verstärkung. Das heißt konkret, er nutzt in erster Linie Belohnungen (das Hinzufügen von etwas Positivem). Wenn Strafe überhaupt zur Anwendung kommt, handelt es sich um negative Strafe (das Vorenthalten von etwas Positivem).
Belohnen – aber richtig!
Je genauer wir dem Hund vermitteln können, welches Verhalten ihm Erfolg bringt, desto höher wird die Wahrscheinlichkeit, dass er das Verhalten häufiger anbietet.
Wer die Vorteile positiver Verstärkung voll ausschöpfen möchte, kommt am Einsatz konditionierter Verstärker nicht vorbei. Man kann eine Vielzahl von Verstärkern aufbauen, je nachdem, wofür und wie diese eingesetzt werden sollen.
Man unterscheidet zwischen primären Verstärkern (alles, was direkt dazu führt, dass der Hund ein Verhalten öfter zeigt, z. B. Futter, Spielzeug, Schnüffeln, Rennen), sekundären Verstärkern (kündigen den primären Verstärker an, z. B. Clicker, Markerwort) und tertiären Verstärkern (kündigen den sekundären Verstärker an, z. B. Keepgoing-Signal, Intermediäre Brücke). Zusätzlich gibt es noch eine ganze Reihe von Verstärkern, die nicht eindeutig in dieses System eingeordnet werden können (z. B. Kontinuitätsmarker und entsprechend konditionierte Verhalten). Außer den primären Verstärkern funktionieren alle anderen Verstärker nur, wenn man über klassische Konditionierung einen Zusammenhang hergestellt hat, beispielsweise zwischen dem Klickgeräusch und der Futterbelohnung.
Wir nutzen im Training, außer den primären Verstärkern, nur den sekundären Verstärker (Eventmarker), einen Kontinuitätsmarker und als Verstärker konditionierte Verhalten. Aus diesem Grund werden auch nur diese Verstärker hier näher vorgestellt.
Was macht den Unterschied zwischen der direkt verabreichten Belohnung und der angekündigten Belohnung aus? Letztere verschafft uns zunächst einen Timingvorteil. Der Einsatz des sekundären Verstärkers oder Eventmarkers versetzt uns in die Lage, ein Verhalten zu markieren und mit etwas Zeitverzögerung die Belohnung hervorzuholen. Gerade wenn wir ohne Futter am Körper trainieren oder den Hund auf große Entfernung bestätigen möchten, ist das von Vorteil. Den entscheidenden Unterschied macht allerdings die vom Hund nicht beeinflussbare körperliche Reaktion, die der Eventmarker hervorruft. Das Produzieren einer Erwartungshaltung verleiht der eingesetzten Belohnung deutlich mehr Wirkung, und außerdem wird damit eine gedankliche Umlenkung von der Belohnung zum Eventmarker erreicht. So hilfreich das Erzeugen dieser Erwartungshaltung in vielen Fällen ist, so kontraproduktiv kann es in manchen Situationen sein. Wir nutzen also nach wie vor auch primäre Verstärker ohne Ankündigung durch den Marker.
Primärer Verstärker = primärer Verstärker?!
Uns muss klar sein, dass es auf den Hund ankommt, was als primärer Verstärker funktioniert. Kleine, weiche Futterstückchen wie Käse- oder Fleischwurstwürfel werden von den meisten Hunden gern genommen und krümeln nicht. Als Spielzeugbelohnung eignen sich Spielzeuge, mit denen gemeinsames Spiel möglich ist. Allerdings haben viele Hunde Schwierigkeiten mit dem Spielen im Training. Teilweise funktionieren zunächst nur einzelne Spielsegmente als Belohnung: So könnte ein geworfener Ball als Jackpot, ein Zergelspiel hingegen als Niete empfunden werden. Spielroutinen müssen gezielt aufgebaut werden, damit sie als primäre Verstärker nutzbar sind.
Es gibt auch Hunde, bei denen die leicht im Training nutzbaren Verstärker wie Fressen und Spielen im Vergleich zu solchen wie Mäuschensuchen, Schwimmen, Interaktion mit Artgenossen oder Schnüffeln generell nicht konkurrenzfähig sind. Solche Hunde gelten dann als schwer trainierbar und ungeeignet für den Hundesport.
Mithilfe des Premack-Prinzips, nach dem ein Verhalten als Verstärker für ein anderes eingesetzt wird, kann man die Wertigkeit der im Training leicht einsetzbaren Verstärker durch andere, für den Hund interessantere Verstärker positiv beeinflussen. So könnte ein kurzes Zergelspiel die Grundbedingung für das Spielen mit anderen Hunden werden.
Spielt der Hund, gibt es einen Klick, und als Belohnung darf er zu seinen Kameraden.
Spielt der Hund nicht, bleibt er an der Leine.
Auch die Wertigkeitsunterschiede zwischen Futter und Spielzeug lassen sich so beeinflussen. Für erfolgreiches Training ist es essenziell, die Vorlieben seines Hundes genau zu kennen und alle nutzbaren Verstärker so gut aufgebaut zu haben, dass der Hund jederzeit den angebotenen Verstärker als Belohnung annimmt. Nur dann lässt sich über die Wahl des Verstärkers das Verhalten gezielt beeinflussen (Spielzeug für Explosivität und Dynamik, Futter für Genauigkeit und Ausdauer).
EVENTMARKER
Der Eventmarker kennzeichnet das in diesem Moment gezeigte Verhalten als richtig. Mit ihm endet die Übung; der Hund darf nicht nur, er soll seine Position sogar verlassen und erhält seine Belohnung. Um ein für den Hund verlässliches Kommunikationssystem zu etablieren, ist der Eventmarker unumgänglich. Er ermöglicht es, dem Hund konfliktfrei und eindeutig den sofortigen Zugang zur Belohnung mitzuteilen. Oft wird der Zugang zur Belohnung jedoch teilweise an weitere Bedingungen geknüpft, indem bei manchen Übungen nach dem Eventmarker und vor der Belohnung ein Freigabesignal oder eine Aufmunterung erfolgt. Für solche Hunde ist der markierte Moment nicht mehr klar nachvollziehbar, was einen Entscheidungskonflikt verursacht. Gerade beim Aufbau neuer Verhalten sind sie unsicher, ob sie die Belohnung haben dürfen oder nicht. Beim Heelwork-Training ist das hinderlich, weil sich dieser Konflikt negativ auf technische Details und auf die Ausstrahlung auswirkt.
Das Handling von Clicker und Futter in einer Hand verlangt Übung. (Foto: Eva Hampe)
Bevor ihr anfangt, müsst ihr euch im Klaren darüber sein, was ihr als Eventmarker einsetzen möchtet. Geeignet ist das Klickgeräusch eines Clickers. Ihr könnt aber auch ein Schnalzen oder ein prägnantes einsilbiges Wort (wie Yes, Win, Top oder Ping) benutzen. Wir konditionieren immer Clicker und Markerwort. Der Clicker hat den Vorteil, dass er sich immer gleich anhört. Ihr müsst aber in der Lage sein, das Training mit „Finger am Abzug“ zu meistern, sonst geht der Timingvorteil verloren. Ein Markerwort lässt euch dagegen die Hände frei und ihr habt es immer und überall mit dabei. Es hat aber den Nachteil, dass völlige Emotionsfreiheit nicht gegeben ist. Wir sprechen im Folgenden der Einfachheit halber grundsätzlich vom „Klick“, wenn wir den Eventmarker meinen.
In jedem Fall ist es sinnvoll,...