auch instrumentelle Konditionierung genannt
Die operante oder auch instrumentelle Konditionierung ist eine Lernform, bei der Organismen die Auftretenshäufigkeit von Verhaltensweisen durch positive oder negative Konsequenzen erhöhen bzw. reduzieren. Im Standard-Paradigma der operanten Konditionierung wird einem Organismus ein Stimulus präsentiert, er führt eine Handlung aus und wird anschließend bestraft oder belohnt. Während also bei der klassischen Konditionierung die Organsimen Reaktionen auf Stimuli zeigen, damit aber keinen Einfluss auf die Konsequenzen haben, können sie beim operanten Konditionieren lernen, welches Verhalten zu welchen Konsequenzen führt. Erste gezielte Untersuchungen wurden von Edward Thorndike durchgeführt, der das Verhalten von hungrigen Katzen in einem Problemkäfig beobachtete. Thorndike formulierte basierend auf seinen Beobachtungen das Law of Effect, nachdem eine positive Konsequenz die Auftretenswahrscheinlichkeit eines Verhaltens als Reaktion (R) auf einen spezifischen Stimulus (S) erhöht. Er beschreibt damit die Bildung einer S-R-Assoziation. Burrhus F. Skinner entwickelte das experimentelle Vorgehen von Thorndike weiter und studierte mit Hilfe seiner Skinner-Box die Folgen unterschiedlicher Konsequenzen. Dies ist die sogenannte Dreifachkontingenz. Ein Organsimus lernt in einer gegebenen Situation (S) nach einem spezifischen Verhalten (R) eine bestimmte Konsequenz (C) zu erwarten.
Beim operanten Konditionieren werden positive (geben eines angenehmen Reizes) und negative Verstärker (Entfernen eines negativen Reizes), sowie Bestrafung (Typ I: geben eines unangenehmen Reizes, Typ II: entfernen eines angenehmen) unterschieden. Die Gabe von Verstärkern kann unterschiedlichen Prinzipien folgen, es werden vier Typen von Verstärkerplänen unterschieden: feste und variable Quotenverstärkung (Gabe der Verstärker hängt von der gezeigten Reaktionshäufigkeit ab) sowie feste und variable Intervallverstärkung (Gabe der Verstärker basiert auf Zeitintervallen).
Bei operanten Konditionieren können primäre (natürliche), sekundäre (gelernte) und generalisierte Verstärker genutzt werden. Es lässt sich nahezu jedes beliebige Verhalten erzeugen. Verhaltensweisen, die nicht durch Zufall auftreten können durch die stufenweise Annäherung (shaping) und Verketten von neue Verhaltensfolgen (chaining) gelernt werden.
Wichtige Effekte im Zusammenhang mit operanter Konditionierung sind das Premack-Prinzip und das sogenannte Lernen abergläubischen Verhaltens.
Quellen: