2 Lernen durch Kontiguität
2.1 Klassische Konditionierung: Pawlow
Während seiner Arbeiten zur Verdauungsphysiologie beobachtete Pawlow (1849–1936) bei seinen Versuchstieren die Absonderung von Speichel bereits vor der eigentlichen Versuchsphase, nämlich der Darbietung des Futters, dem natürlichen Auslöser für die Speichelsekretion. Die genaue Analyse dieses Phänomens führte ihn zu den bahnbrechenden Forschungen zum bedingten Reflex, über die er 1903 auf dem Internationalen medizinischen Kongress in Madrid unter dem Titel »Experimentelle Psychologie und Psychopathologie bei Tieren« erstmals referierte (siehe Pawlow 153, S. 113–125).
2.1.1 Standardexperiment
An der klassischen Versuchsanordnung Pawlows, der Speichelkonditionierung beim Hund, sollen die Grundbegriffe dieses Lernparadigmas erläutert werden:
Vor Beginn des Versuchs wird das Tier an den von äußeren Reizen abgeschirmten Versuchsraum gewöhnt. Während der eigentlichen experimentellen Prozedur ist es bandagiert, um den Versuchsablauf störende Bewegungen zu unterbinden. Eine operativ angebrachte Fistel ermöglicht dem Experimentator die exakte Messung der abgesonderten Speichelmenge (siehe Abb. 2.1).
Im ersten Versuchsstadium wird dem Hund Fleischpulver eingegeben und die daraufhin unwillkürlich erfolgende Speichelsekretion festgehalten. Das Fleischpulver wirkt dabei als angeborener Auslöser, unbedingter Reiz (UCS = »unconditioned stimulus«; von lateinisch: conditio – Bedingung) genannt, für die unbedingte Reaktion (UCR = »unconditioned reaction«) des Speichelflusses. Dieser Vorgang stellt eine angeborene Reiz-Reaktions-Verbindung dar und kann noch nicht als Lernen bezeichnet werden.
Abb. 2.1: Versuchsanordnung nach Pawlow
Im zweiten Versuchsstadium (Erwerbs- oder Trainingsphase) werden mehrmals gleichzeitig der UCS (Futter) und ein neutraler Reiz (NS = »neutral stimulus«) dargeboten, z. B. ein Ton. Neutralität bedeutet hierbei die Unfähigkeit zur Speichelreflexauslösung, welche Pawlow prüfte, indem er den neutralen Reiz (Ton) alleine vor der Erwerbsphase darbot und sich vergewisserte, dass daraufhin keine unbedingte Reaktion (Speichelfluss) erfolgte. In der Erwerbsphase reagiert das Versuchstier wegen des anwesenden UCS mit der UCR.
Aufgrund dieser mehrmaligen UCS-NS Koppelung folgt im dritten Stadium des Experiments als Ergebnis die Speichelabsonderung allein auf die Darbietung des Tones. Dieser wird nun bedingter Reiz (CS = »conditioned stimulus«) genannt und der durch ihn ausgelöste Speichelfluss bedingte Reaktion (CR = »conditioned reaction«), um deutlich zu machen, dass an seiner Auslösung kein UCS (Futter) beteiligt war.
Bei der klassischen Konditionierung wird somit eine im Verhaltensrepertoire befindliche Reaktion durch einen ehemals neutralen Stimulus ausgelöst, d. h. das Versuchstier lernt, auf einen neuen Reiz mit einem verfügbaren Verhalten zu antworten. Abbildung 2.2 fasst die wesentlichen Stadien des Erwerbs einer bedingten Reaktion schematisch zusammen.
Abb. 2.2: Schematische Zusammenfassung des klassischen Konditionierens
Die relevanten Parameter zur Ausbildung einer bedingten Reaktion sind demnach einerseits der zeitliche Abstand und die Dauer von NS und UCS, sowie andererseits die Anzahl notwendiger gemeinsamer Koppelungen. Der Frage nach dem optimalen Zeitintervall zwischen CS und UCS wollen wir in einem eigenen Abschnitt nachgehen.
Bezüglich der Anzahl notwendiger gemeinsamer Darbietungen von CS und UCS, also der Dauer der Erwerbsphase, ist festzuhalten, dass sie sowohl innerhalb als auch zwischen verschiedenen Arten sehr großen Schwankungen unterliegt und von einer einzigen Koppelung bis zu mehreren hundert Versuchsdurchgängen reichen kann. So schreiben Angermeier & Peters (1973, S. 37): »Es gibt wenig Anhaltspunkte dafür, wie oft der bedingte Reiz mit dem unbedingten Reiz gepaart werden muss, um wirksam zu sein.« Darüber hinaus eignet sich nicht jeder beliebige Reiz – wie Pawlow ursprünglich annahm – als CS.
Grundvoraussetzung für bedingte Reaktionen bilden jedoch in jedem Fall eine begrenzte Anzahl in der Primärausstattung – d. h. von Geburt an vorhandener – genetisch festgelegter Reiz-Reaktions-Verbindungen, die sog. unbedingten Reflexe (z. B. Schluck-, Speichel-, Beuge-, Schreck-, Lidschlagreflex) und die mit ihnen verbundenen emotionalen Reaktionen.
2.1.2 Ausweitung, Differenzierung und Rückbildung bedingter Reaktionen
Generalisation und Diskrimination
Die einfachste und ohne weiteres Zutun stattfindende Form der Ausweitung liegt im Fall der Reizgeneralisation vor. Hierunter versteht man die Tatsache, dass bedingte Reaktionen nicht nur durch den während der Erwerbsphase verwendeten CS ausgelöst werden, sondern auch durch Stimuli, welche diesem ähnlich sind. Je nach verwendetem CS kann sich die Ähnlichkeit auf physikalische oder psychologische, quantitative oder qualitative Aspekte beziehen.
Wurde z. B. eine CR auf einen Ton von 1800 Hz ausgebildet, so wird sie auch durch Töne von 1600 oder 2000 Hz hervorgerufen, wenngleich in etwas schwächerer Form. Die Intensität der CR variiert dabei in Abhängigkeit von der Ähnlichkeit des Reizes mit dem ursprünglich verwendeten CS. Je unähnlicher ein Stimulus dem »Original-CS« ist, desto schwächer fällt die CR aus. Graphisch lässt sich dieser Zusammenhang, Generalisationsgradient genannt, folgendermaßen darstellen:
Abb. 2.3: Generalisationsgradient
Die Bedeutung der Generalisation ist vor allem in einer erhöhten Anpassungsleistung des Organismus an die Umwelt zu sehen, da er sich nicht ständig auf kleine Schwankungen auf der Stimulusseite neu einstellen muss.
Während durch das Prinzip der Generalisation das Spektrum der auslösenden Reize erweitert wird, bewirkt die Diskrimination den gegenteiligen Effekt, nämlich die Einengung der bedingten Reaktion auf einen ganz begrenzten Stimulusbereich, z. B. den Speichelfluss des Hundes lediglich auf einen Ton von 1800 und nicht von 2000 oder 1600 Hz. Experimentell lässt sich dies am einfachsten durch eine Ausdehnung der Erwerbsphase, also sehr viele CS-UCS-Koppelungen erreichen, d. h. bei entsprechend langer Übung nimmt die Generalisation von alleine ab. Im Labor erreicht man Diskrimination auch durch den gezielten Einsatz des UCS: Bietet man z. B. sowohl Töne von 1800, 2000, 1600 … Hz an, lässt den UCS aber nur auf den Ton von 1800 Hz folgen, so reagiert das Versuchstier bald nur noch auf den Ton von 1800 Hz mit Speichelsekretion. Eine Differenzierung gelingt umso leichter, je unterschiedlicher die verwendeten zu diskriminierenden Reize sind, und sie wird mit zunehmender Ähnlichkeit der Reize zeitaufwendiger. Ist das Versuchstier jedoch nicht mehr in der Lage, die zu unterscheidenden Stimuli auseinanderzuhalten, also durch die Diskriminationsaufgabe überfordert, kann es zu sog. experimentellen Neurosen kommen. So berichtet Pawlow (1953, S. 176–183) von einem Versuch, bei dem zuerst eine bedingte Reaktion (Speichelfluss) auf einen Lichtkreis (CS) ausgebildet wurde, der auf eine vor dem Versuchstier stehende Scheibe projiziert wurde. Im anschließenden Diskriminationsprozess bot der Experimentator den Kreis mit dem UCS (Futter), eine Ellipse (Halbachsenverhältnis 2:1) jedoch ohne UCS dar, so dass sich eine Diskrimination einstellte, d. h. der Hund reagierte auf den Kreis mit der CR und zeigte auf die Ellipse hin keine bedingte Reaktion. Die Diskrimination wurde nun schrittweise immer stärker verfeinert, das Halbachsenverhältnis der Ellipse also dem Kreis angeglichen. Bei einem Verhältnis der Halbachsen von 9:8 reagierte der Hund plötzlich ungewohnt: Er wurde in seinem Gestell motorisch sehr unruhig, winselte und verlor zum Teil bereits gut beherrschte bedingte Reaktionen. Die Versuchsanordnung führte bei ihm zu einem Verhalten, das Pawlow experimentelle Neurose nannte.
Konditionierung höherer Ordnung
Das Prinzip der Konditionierung höherer Ordnung hat bereits Pawlow beobachtet, jedoch wurde ihm erst in den 70er und 80er Jahren des letzten Jahrhunderts durch die Arbeitsgruppe um Rescorla (1973, 1980) intensivere Aufmerksamkeit zuteil.
Es handelt sich dabei um die Ausbildung bedingter Reaktionen, bei denen ein bedingter Reiz (CS) die Funktion des UCS übernimmt. Konditionierungen höherer Ordnung bauen immer auf einer Konditionierung erster Ordnung auf, bei der ein NS durch gemeinsame Darbietung mit dem UCS zum CS wird. In einer zweiten Trainingsphase wird der CS1 (z. B. Ton) mit einem weiteren neutralen Reiz (z. B. Lichtsignal) gemeinsam ohne den UCS präsentiert. Als Resultat führt nun der zweite neutrale Reiz ebenfalls zur bedingten...