Condizionamento classico ed operante: comprendiamoli meglio

Saliamo in macchina, ci assicuriamo che la cintura di sicurezza sia allacciata, accendiamo la macchina e ce ne andiamo. Se non lo facessimo, quel fastidioso suono d’avvertimento emesso dalla macchina in caso di cinture non allacciate,continuerebbe ad aumentare di volume, rendendo spiacevole la guida.

È una bella giornata di sole e decidiamo di aprire i finestrini per goderci il caldo primaverile, l’aria nei nostri occhi ci fa sbattere le palpebre.

Perché questo ci rende più simili ai nostri animali di quanto possiamo credere?

Perché le regole che regolano l’apprendimento sono le stesse sia per gli animali che per gli esseri umani.

Nel primo esempio impariamo ad indossare la cintura di sicurezza grazie a quello che viene chiamato condizionamento operante, nel secondo esempio il battito delle palpebre è un riflesso regolato dalle leggi del condizionamento classico.

Nel primo caso impariamo ad indossare la cintura di sicurezza per interrompere uno stimolo sgradevole (l’allarme): questo significa che impariamo dalle conseguenze del nostro comportamento.

In particolare, è quello che chiamiamo rinforzo negativo.

Nel secondo caso non possiamo fare nulla perché non riusciamo a controllare i riflessi ed è qualcosa che viene dai nostri geni.

Ma vediamo nel dettaglio di cosa si tratta. 

Condizionamento classico

Il condizionamento rispondente è meglio conosciuto come condizionamento classico o pavloviano, dal nome dello scienziato russo che per primo descrisse il fenomeno nel 1927: Ivan Pavlov.

Durante i suoi esperimenti, egli scoprì che i cani iniziavano a salivare non solo quando vedevano il cibo o prendevano il cibo in bocca, ma anche prima che ciò accadesse. Questo fenomeno era già noto come salivazione psichica, ma l’importanza del comportamento non era ancora stata compresa.

Gli animali cominciarono a rispondere allo stimolo in modo anticipatore: altri stimoli, oltre alla carne, potevano causare la salivazione; per esempio, l’abito dell’inserviente, il suono di un metronomo, il suono della ciotola, etc

Nel condizionamento rispondente uno stimolo neutro può diventare uno stimolo condizionato se viene accoppiato un certo numero di volte con uno stimolo non condizionato: cioè, accoppiando il suono del metronomo (NS) con la carne (US) per un numero sufficiente di volte, il metronomo inizia a suscitare la risposta della salivazione (risposta incondizionata).

Pertanto, il metronomo diventa stimolo condizionato (CS) e la salivazione risultante dalla sua risposta condizionata (CR).

Pertanto, gli organismi possono associare stimoli che si verificano insieme nello stesso periodo e, per associazione, uno o più stimoli possono essere sostituiti da un altro stimolo.

Grazie al condizionamento rispondente è possibile modificare lo stimolo per la maggior parte dei riflessi mentre è praticamente impossibile modificare la risposta. Un esempio di questo tipo di condizionamento viene dalla prima fase di impostazione del clicker, quando si vuole introdurre il significato del clicker: il suono del clicker sarà ripetutamente abbinato alla comparsa del cibo in modo che, essendo il cibo rinforzante, anche il click diventa rinforzante: attenzione che il click non sarà mai uguale al cibo.

Molti formatori cercano di stabilire con precisione se si tratta di un condizionamento rispondente o operante, ma non è possibile fare una chiara distinzione tra i due perché c’è sempre una base di rispondente nel comportamento dell’operante.

Condizionamento operante

Non tutti i comportamenti sono suscitati da uno stimolo come nel condizionamento rispondente, spesso il comportamento è motivato dalle sue conseguenze che possono aumentare o diminuire la frequenza con cui viene emesso. In questo secondo caso si parla di comportamento operante, perché la risposta opera sull’ambiente per produrre conseguenze.

Questo tipo di condizionamento è chiamato condizionamento strumentale, perché la risposta è strumentale nel produrre conseguenze. È anche noto come condizionamento operante.

Gli scienziati che hanno descritto questo tipo di apprendimento sono Thorndike e Skinner.

Inoltre, in questo caso non si parla di “teoria” ma di una descrizione del fenomeno naturale di come gli animali imparino ad interagire con l’ambiente.

Si tratta di un potente strumento di modificazione comportamentale.

È importante sottolineare la necessità non tanto di insegnare al cane abbastanza abilità, ma di insegnare il comportamento in modo da raggiungere la perfezione nell’addestramento: usare il condizionamento operante in modo superficiale è tanto semplice quanto rischioso.

L’apprendimento del rispondente è composto, come abbiamo visto, da due elementi: lo stimolo (antecedente) e la risposta (comportamento). È lo stimolo che guida il comportamento

Cioè, l’antefatto è la causa del comportamento.

Nell’apprendimento operante ci sono invece tre elementi:

  • Un antecedente
  • Un comportamento
  • Una conseguenza

La conseguenza è quella che più influenza il comportamento, che lo guida.

Come abbiamo detto, quelli del comportamento rispondente e dell’operante non sono categorie dicotomiche, ma piuttosto abbiamo comportamenti rispondenti e operanti disposti lungo un continuum: tutti i comportamenti operanti hanno una componente rispondente.

Semplificando il concetto il più possibile, possiamo dire che il comportamento volontario è modificato attraverso il condizionamento operante, mentre i riflessi seguono le leggi del condizionamento rispondente.

Il condizionamento operante si basa su semplici principi convalidati da dati sperimentali.

Secondo i coniugi Brelands, i principi su cui si basa il condizionamento operante sono:

Stimolazione: gli animali rispondono agli stimoli. Le risposte possono essere sia istintive che apprese.

Rinforzo: aumenta la frequenza del comportamento. Il rinforzo è il risultato dell’evoluzione biologica.

Fate attenzione perché è peggio rinforzare un comportamento indesiderato che non rinforzare il comportamento desiderato.

– Estinzione: diminuisce la frequenza del comportamento

– Punizione: diminuisce la frequenza del comportamento

– Generalizzazione degli stimoli e generalizzazione della risposta

Quali sono le conseguenze di un comportamento?

Il rinforzo è un cambiamento nell’ambiente che segue una risposta e aumenta o mantiene la frequenza futura di tale comportamento.

Il rinforzo positivo è un cambiamento nell’ambiente in cui viene aggiunto uno stimolo a seguito di una risposta, che aumenta o mantiene la frequenza futura di quella risposta.

Per esempio chiedo al mio cane di sedersi (antecedente), lui si siede (comportamento), gli dò una ricompensa (conseguenza – rinforzo positivo).

Il rinforzo negativo è un cambiamento nell’ambiente in cui uno stimolo viene sottratto a seguito di una risposta, e che aumenta o mantiene la frequenza futura di quel comportamento. Per esempio una zanzara mi morde (antecedente), mi gratto (comportamento), prurito attenuato (conseguenza – rinforzo negativo)

La punizione è un cambiamento nell’ambiente che segue una risposta e diminuisce la frequenza futura di tale comportamento.

La punizione positiva è un cambiamento nell’ambiente in cui viene aggiunto uno stimolo a seguito di una risposta, e che diminuisce la frequenza futura di tale comportamento. Per esempio il semaforo è rosso (antecedente), non si ferma la macchina (comportamento), la polizia si ferma ed eleva una multa (conseguenza – punizione positiva).

La punizione negativa è un cambiamento nell’ambiente in cui uno stimolo (appetitoso) viene sottratto a seguito di una risposta, e che diminuisce la frequenza futura di quel comportamento. Ad esempio si hanno 20 punti sulla patente di guida (appetito precedente) – si guida troppo veloce (comportamento) – si perdono 10 punti (conseguenza – punizione negativa – costo della risposta).

Non entreremo nel dettaglio dei programmi di rinforzo, qui è sufficiente ricordare tre concetti chiave nella pianificazione dell’allenamento:

Tempistica: quando

Criteri: cosa

Frequenza: con quale frequenza

È necessario sapere esattamente quando rinforzare. In generale è necessario rinforzare solo il comportamento desiderato ed impostare un solo criterio alla volta.

Ricordate che un’alta frequenza di rinforzo riduce la distraibilità.

È essenziale stabilire dei criteri durante la pianificazione dell’addestramento per decidere esattamente cosa rinforzare e cosa non rinforzare.

Se il criterio impostato è troppo alto risulterà in una frequenza di rinforzo troppo bassa, se il criterio è troppo basso si finirà per nutrire l’animale.

È fondamentale stabilire la frequenza di rinforzo per garantire che sia vantaggiosa per l’animale.

1 commento su “Condizionamento classico ed operante: comprendiamoli meglio”

Lascia un commento

Torna su