Rinforzare: si ma come?

Una cosa che ho notato spesso nella mia carriera di addestratore è una certa tendenza alla fissità nel premiare i cani sia da parte dei proprietari che degli addestratori più giovani. Cosa intendo quando parlo di fissità? Intendo la tendenza a rinforzare il cane durante il lavoro sempre nello stesso modo, usando sempre lo stesso cibo (pensate che non posso mangiare la pizza con i wurstel a causa delle centinaia di proprietari che si sono presentati al campo con i wurstel come premio per i cani) o lo stesso gioco, indipendentemente dal lavoro che il cane sta facendo e dalla quantità di energia, fisica e mentale, necessaria per eseguire l’esercizio.

La scienza ci viene in aiuto descrivendo quelli che vengono chiamati piani di rinforzo. Prima di tutto, cosa significa premiare il cane? L’atto di premiare il cane è definito in gergo tecnico come “rinforzo positivo”. Un rinforzo è qualcosa che aumenta o mantiene la frequenza di un comportamento, un rinforzo positivo consiste nell’aggiungere una conseguenza gradita (come il cibo o il gioco) al comportamento del cane per aumentare la probabilità che venga emesso più frequentemente in futuro. Quando chiedete al vostro cane di ‘sedersi’ e lui si siede, il rinforzo positivo è il biscotto che gli date come ricompensa per essersi seduto.

Torniamo ai piani di rinforzo: in quanti modi diamo la ricompensa ai nostri amici a quattro zampe?

I parametri di rinforzo sono la forza, la quantità e la lunghezza. È necessario regolare uno o più parametri del rinforzo a seconda del comportamento da rinforzare. Ad esempio, non appena si aumenta lo sforzo necessario per completare una risposta, probabilmente sarà necessario aumentare la forza del rinforzo. A questo contribuisce anche il piano di rinforzo. Un piano di rinforzo è la regola che descrive o specifica quali risposte saranno seguite da un rinforzo e quali no. I piani di rinforzo sono cioè tempi e relazioni numeriche tra una risposta e un rinforzo. Ogni rinforzo è associato ad un modello di qualche tipo.
Ai confini degli schemi di rinforzo abbiamo uno schema di rinforzo continuo da un lato, e l’estinzione dall’altro. Nello schema di rinforzo continuo tutte le risposte corrette sono rinforzate. All’estremo opposto abbiamo il piano di estinzione che in realtà rappresenta uno schema di non rinforzo in cui non viene rinforzata alcuna ripetizione del comportamento.
Tra questi due schemi di base ci sono miriadi di piani di rinforzo intermittenti. Rinforzo intermittente significa che alcune risposte sono rinforzate, altre no. Alcune sono semplici, altre complesse, altre composte.
Il rinforzo continuo è generalmente usato per stabilire o rinforzare i comportamenti. Il rinforzo intermittente è di solito usato per mantenere comportamenti già costruiti.
Nei modelli basati sulla frequenza, il rinforzo viene dato dopo un certo numero di risposte. Nei modelli basati sull’intervallo, il rinforzo viene dato per la prima risposta corretta emessa dopo un certo periodo di tempo dal precedente rinforzo.
Nei modelli fissi il numero di risposte o il tempo rimangono gli stessi. Nei modelli variabili il numero di risposte o la quantità di tempo sono casuali ma ruotano intorno ad un certo valore.
Vediamo alcuni esempi:

  • Una moneta viene messa nel salvadanaio ogni cinque piatti lavati da Marco. FREQUENZA FISSA
  • Una moneta viene messa nel salvadanaio ogni cinque piatti lavati da Marco. Poi ogni volta dopo tre piatti, poi dopo sei. FREQUENZA VARIABILE
  • Laura loda il suo cane per essere rimasto a terra. Torna dopo cinque minuti e loda il suo cane non appena lo vede a terra. INTERVALLO FISSO
  • Laura loda il suo cane per essere rimasto a terra. Torna dopo cinque minuti e loda il suo cane non appena lo vede a terra. Poi torna dopo tre minuti. Poi dopo quattro INTERVALLO VARIABILE.

Il tempo, il numero e la contingenza contribuiscono a rendere prevedibili i modelli di comportamento. Nei piani fissi, le risposte tendono a interrompersi dopo il rinforzo o ad esplodere. Nei modelli variabili, le risposte diventano stabili e non c’è pausa tra una risposta e l’altra.
I modelli basati sulla frequenza producono frequenze di risposta più alte rispetto ai modelli basati sull’intervallo. Nei modelli a frequenza fissa, noti anche come tutto/niente, si ha una pausa nel rispondere immediatamente dopo un rinforzo, a cui segue un’esplosione di risposte. Le pause tendono a diventare sempre più lunghe.
Nei modelli a frequenza variabile si ottiene un comportamento di risposta stabile ad alta frequenza. Un modello ad intervallo fisso risulta in una pausa di risposta immediatamente dopo il rinforzo, seguita da un graduale aumento della frequenza di risposta che raggiunge un picco vicino al rinforzo successivo. Un modello ad intervallo variabile produce risposte stabili con una risposta in frequenza bassa/moderata.

Pensate al gioco d’azzardo: le persone sviluppano delle dipendenze perché non sanno mai cosa li aspetta in quella scommessa. Potrebbe essere una grande vittoria, una vittoria giusta o una perdita. Inoltre, un fattore chiave nello sviluppo della dipendenza è anche l’attesa: le slot machine, pur avendo già il risultato pronto al momento dell’inserimento della moneta, creano una suspense di musica e luci che creano un “effetto magico” che attrae il giocatore.

Con il cane è nostro dovere ricreare questa situazione da “slot machine”: in questo modo avremo partner entusiasti e sempre pronti a lavorare.

Vorrei però concludere questo breve articolo con un suggerimento: se non siete seguiti da un professionista esperto, utilizzate la variabilità del rinforzo intendendola come variabilità di tipologia di rinforzo: a volte la palla, altre volte la salsiccia, altre volte il manicotto, altre volte un biscotto e così via. In assenza delle supervisione di un esperto vi consiglio di non rinforzare solo alcune risposte corrette del cane e di ignorarne altre perché questo può portare alla frustrazione.

E ricordate… il rinforzo è un processo, non un istante. Giocate con il cane, divertitevi con lui senza sentirvi a disagio. Lui non vi giudica.

1 commento su “Rinforzare: si ma come?”

Lascia un commento

Torna su