Operante conditionering Definitie, kenmerken en voorbeelden



de operante conditionering ofinstrumentele conditionering is een vorm van leren waarbij gedrag met gevolgen wordt beheerst.

Het is gebaseerd op het idee dat versterkend gedrag vaker optreedt, terwijl gestraft gedrag is gedoofd.

Wat is het verschil tussen operante conditionering en klassieke conditionering? Bij operante conditionering wordt een vrijwillige reactie gevolgd door een reinforcer. Op deze manier zal de vrijwillige reactie (bijvoorbeeld studeren voor een examen) in de toekomst waarschijnlijk meer voorkomen. Integendeel, in klassieke conditionering activeert een stimulus automatisch een onvrijwillige reactie.

Operante conditionering kan worden beschreven als een proces dat probeert om gedrag aan te passen door het gebruik van positieve en negatieve versterking. Door operante conditionering maakt een individu een verband tussen een bepaald gedrag en een gevolg. Voorbeelden:

  • Ouders belonen goede cijfers voor een kind met snoep of een andere prijs.
  • Een leraar beloont de studenten die rustig en goed opgeleid zijn. Studenten realiseren zich dat door zich zo te gedragen ze meer punten krijgen.
  • Elke keer als er op een hendel wordt gedrukt, krijgt een dier voedsel.

B.F. Skinner (1938) bedacht de term operante conditionering. Skinner identificeerde drie soorten responsen of operands die het gedrag kunnen volgen:

  • Neutrale operatoren: reacties uit de omgeving die de kans op herhaling van een gedrag niet vergroten of verkleinen.
  • enhancers: reacties uit de omgeving die de kans op herhaling van een gedrag vergroten. Versterkers kunnen positief of negatief zijn.
  • straffen: reacties uit de omgeving die de kans verminderen dat een gedrag zich herhaalt. Straf verzwakt het gedrag.

Antecedenten van operante conditionering

Thorndike was de eerste om te erkennen dat deze conditionering meer omvat dan alleen een antwoord en een bekrachtiger. Het antwoord wordt gegeven in de aanwezigheid van bepaalde stimuli, rekening houdend met drie gebeurtenissen: de prikkel, de respons en de consequentie van de respons of de bekrachtiger.

Deze structuur vergemakkelijkt de ontwikkeling van verschillende verbanden zoals de associatie tussen de stimulus en de respons, die voor Thorndike de sleutel was tot de formulering van de wet van effect. Hiermee bevestigde het dat de antwoorden die worden gevolgd door versterkende gevolgen een grotere waarschijnlijkheid zullen hebben dat de stimulus weer verschijnt.

Integendeel, die reacties die worden gevolgd door negatieve gevolgen zullen een lagere kans hebben dat ze optreden wanneer de stimulus weer verschijnt. De wet van effect is het antecedent van operatieve conditionering of instrumentele conditionering, zoals het werd genoemd door Thorndike.

Maar voor Skinner, gedragspsycholoog, was de conditionering het versterken van gedrag volgens de gevolgen die eerder zouden zijn verkregen.

In deze regel zijn er twee vormen van conditionering:

  • De klassieke of Pavlovische: het is gebaseerd op de associatie van ongeconditioneerde en geconditioneerde stimuli, zijnde de reacties gecontroleerd door de stimuli antecedenten.
  • Operante conditionering: de daaruit voortvloeiende of versterkende stimuli zorgen ervoor dat een bepaald gedrag wordt afgegeven. Skinner legt uit dat als het gedrag wordt gevolgd door een positieve bekrachtiger, dit de kans vergroot dat dergelijk gedrag in de toekomst wordt uitgegeven. Integendeel, als een reactie niet wordt gevolgd door een reinforcer of als de reinforcer negatief is, is de kans dat dit gedrag in de toekomst wordt uitgegeven lager.

Basisbegrippen van operante conditionering

steun

Het is verantwoordelijk voor het uitgeven van antwoorden, dat wil zeggen, de waarschijnlijkheid dat ze zullen gebeuren, of het in de toekomst groter of kleiner is. Het is een versterkende en consistente stimulus, omdat het optreedt zodra de reactie is opgetreden.

Het is onmogelijk om te weten of een bepaalde versterker het gedrag beïnvloedt totdat deze contingent met een reactie wordt gepresenteerd en wordt gecontroleerd dat het gedrag verandert als gevolg van de bekrachtiger.

Er zijn twee soorten wapening: positief en negatief. Beide hebben hetzelfde doel om de kans te vergroten dat de reactie in toekomstige situaties zal worden uitgegeven. Voor Skinner worden versterkers bovendien gedefinieerd door gedragingen die waarneembaar en meetbaar zijn.

Positieve versterking

Positieve bekrachtiging versterkt een gedrag door een gevolg te geven dat een persoon beloont.

Negatieve versterking

Het verwijderen van een onaangename versteviger kan ook een gedrag versterken. Dit staat bekend als negatieve versterking omdat het de eliminatie is van een nadelige stimulus die het dier of de persoon "beloont". Negatieve versterking versterkt het gedrag omdat het een onaangename ervaring stopt of elimineert.

Primaire versterkers

Het zouden al die basisversterkers zijn die geen geschiedenis van voorafgaande conditionering nodig hebben om als zodanig te functioneren. Enkele voorbeelden zijn water, voedsel en seks.

Secundaire versterkers

De secundaire versterkers als ze gebaseerd zouden zijn op eerdere geschiedenissen van conditionering dankzij de associatie met ongeconditioneerde stimuli. Enkele voorbeelden zijn geld en kwalificaties.

Noodzaak van drie termen

Het is het basismodel van operante conditionering en bestaat uit drie componenten: de discriminerende stimulus, de respons en de versterkende stimulus..

Een discriminerende prikkel zou er een zijn die de proefpersoon zal laten zien dat de versterker beschikbaar is, hetgeen aangeeft dat als hij een bepaald gedrag uitvoert hij in staat zal zijn de versteviger te verkrijgen. In tegenstelling daarmee hebben we de delta-stimulus of stimuli die aangeven dat het gedrag niet zal leiden tot het verkrijgen van enig type bekrachtiger.

Het antwoord zou het gedrag zijn dat het subject zal uitvoeren, waarvan de uitvoering al dan niet zal leiden tot het verkrijgen van de versterkende stimulus.

Een versterkende stimulus, zoals hierboven vermeld, is verantwoordelijk voor de emissie van het gedrag, omdat dankzij zijn uiterlijk de kans op het geven van een reactie in de toekomst zal toenemen of afnemen..

Er zijn begrippen bekend over operante conditionering

straf

Straf wordt ook gemeten door de effecten ervan op het gedrag van het onderwerp. Aan de andere kant, in tegenstelling tot wapening, is het de bedoeling om een ​​bepaald gedrag te verminderen of te onderdrukken.

Een straf vermindert de kans op het uiten van gedrag in latere situaties. Het antwoord wordt echter niet geëlimineerd, want als de dreiging van straf afneemt, kan het gedrag opnieuw verschijnen.

In straf zijn er ook twee verschillende soorten of procedures, positieve straf en negatieve straf.

Positieve straf

Dit omvat de presentatie van een aversieve stimulus na de uitvoering van een bepaald gedrag. Het wordt contingent gegeven aan de reactie van het onderwerp.

Negatieve straf

Het bestaat uit het elimineren van een stimulus als gevolg van een bepaald gedrag, dat wil zeggen dat het bestaat uit het stoppen van een positieve stimulus na het uitvoeren van een bepaald gedrag.

uitdoving

Bij de extinctie wordt een reactie gestopt omdat de reinforcer niet langer wordt weergegeven. Dit proces is gebaseerd op het onvermogen om de corresponderende versterker te leveren die naar verwachting zal worden bereikt en die ertoe heeft geleid dat dit gedrag in de loop van de tijd wordt gehandhaafd..

Wanneer een reactie wordt gedoofd, wordt de discriminerende stimulus een extinctiestimulus. Dit proces moet niet worden verward met vergeten, dat wordt gegeven wanneer de kracht van een gedrag afneemt wanneer het niet binnen een bepaalde tijd is uitgegeven.

generalisatie

In reactie op een specifieke situatie of stimulus is een respons geconditioneerd, die kan optreden vóór andere stimuli of soortgelijke situaties..

discriminatie

Dit proces is het tegenovergestelde van dat van generalisatie, het reageert anders volgens de stimulus en de context.

Versterkingsprogramma's

Skinner heeft ook verschillende wapeningsprogramma's opgezet, waaronder continue wapeningsprogramma's en intermitterende versterkingsprogramma's..

Continue versterkingsprogramma's

Ze zijn gebaseerd op de constante versterking van de respons elke keer dat deze wordt gepresenteerd, dat wil zeggen, elke keer dat het subject het gewenste gedrag uitvoert, zal hij of zij een versterkende of positieve prikkel krijgen..

Intermitterende versterkingsprogramma's

Daarentegen verkrijgt het onderwerp hier niet altijd de bekrachtiger bij het uitvoeren van het gewenste gedrag. Deze worden gedefinieerd op basis van het aantal gegeven antwoorden of het tijdsinterval tussen de antwoorden, wat aanleiding geeft tot verschillende procedures.

Vaste ratio-programma's

In deze programma's wordt de reinforcer verschaft wanneer het onderwerp vaste en constante responsen genereert. Bijvoorbeeld, in een programma van verhouding 10 verkrijgt de persoon de bekrachtiger na tien responsen te hebben gemaakt wanneer de stimulus wordt gepresenteerd.

Programma's met variabele reden

Dit is hetzelfde opgebouwd als het vorige, maar in dit geval is het aantal antwoorden dat het onderwerp moet geven om de reinforcer te verkrijgen variabel.

De versterker zou afhankelijk blijven van het aantal antwoorden dat door het onderwerp wordt uitgezonden, maar met een variabele reden, waardoor het subject niet kan voorspellen wanneer de bekrachtiger zal worden verkregen.

Vaste intervalprogramma's

In intervalprogramma's is het verkrijgen van de reinforcer niet afhankelijk van het aantal antwoorden dat het onderwerp geeft, maar wordt bepaald door de verstreken tijd. Bijgevolg wordt het eerste antwoord dat wordt geproduceerd nadat het een bepaalde periode heeft overschreden, versterkt.

In de programma's met een vast interval is de tijd tussen de reinforcer en de reinforcer altijd hetzelfde.

Variabele intervalprogramma's

In deze programma's wordt de versterker na een tijdje verkregen, hoewel de tijd voor elke ontvangen versterker verschilt.

Gedragsverandering

Opeenvolgende benaderingen of vormgeving

Het vormen bestaat uit de gedragsverandering door het vormen van gedragingen of de differentiële versterking van opeenvolgende benaderingen.

Een reeks stappen wordt gevolgd om een ​​concreet gedrag vorm te geven. Allereerst identificeren we het oorspronkelijke gedrag dat moet worden gevormd om te weten welke u wilt bereiken.

Vervolgens worden de mogelijke versterkers die moeten worden gebruikt afgebakend en wordt het proces in stappen of fasen gescheiden om het uiteindelijke gedrag te bereiken, waarbij elke stap of opeenvolgende benadering wordt versterkt totdat de laatste wordt bereikt..

Met deze dynamische procedure worden zowel het gedrag als de gevolgen ervan getransformeerd. In die zin worden opeenvolgende benaderingen van objectief gedrag versterkt.

Om het uit te voeren, is het echter noodzakelijk om te beginnen met een eerder gedrag dat het subject al uitvoert, om zijn gedrag geleidelijk te versterken totdat het het doel bereikt.

aaneenschakeling

Hiermee wordt een nieuw gedrag gevormd van de ontbinding naar eenvoudiger stappen of sequenties, waarbij elke reactie die in elk van de stappen wordt gegeven wordt versterkt om te leiden tot de vaststelling van een meer complexe reactie in het gedragsrepertoire van het onderwerp..

Lange reactieketens kunnen worden gevormd met behulp van geconditioneerde bekrachtigers, waarbij een functionele eenheid wordt gekozen waarvan de oprichting leidt tot de verwerving en definitie van een bepaalde vaardigheid.

referenties

  1. Operante conditionering. Opgehaald van wikipedia.org
  2. Operante conditionering. Opgehaald van e-torredebabel.com.
  3. Hersteld van biblio3.url.
  4. Wet van effect. Opgehaald van wikipedia.org.
  5. Extinction. Opgehaald van wikipedio.org.
  6. Domjan, M. Principes van leren en gedrag. Paraninfo. 5e editie.