AccueilÉpanouissement personnelPsychologieSchémas de renforcement en psychologie (exemples)

Schémas de renforcement en psychologie (exemples)

Écrit par MentorShow
Le 09 November 2023 | 8 minutes de lecture

Principales conclusions

  • Un calendrier de renforcement est une règle indiquant quels comportements, le cas échéant, seront renforcés.
  • Les programmes de renforcement peuvent être divisés en deux grandes catégories : les programmes continus et les programmes partiels (également appelés programmes intermittents).
  • Dans un programme continu, chaque comportement souhaité est renforcé, alors que les programmes partiels ne renforcent le comportement souhaité qu’occasionnellement.
  • Les programmes de renforcement partiel sont décrits comme étant fixes ou variables, et comme étant des intervalles ou des ratios.
  • La combinaison de ces quatre descripteurs donne quatre types de programmes de renforcement partiel : ratio fixe, intervalle fixe, ratio variable et intervalle variable.

En 1957, un livre révolutionnaire pour le domaine des sciences du comportement a été publié : Schedules of Reinforcement de C.B. Ferster et B.F. Skinner.

Le livre décrivait que les organismes pouvaient être renforcés selon différents calendriers et que des calendriers différents entraînaient des résultats comportementaux variés.

Les travaux de Ferster et Skinner ont établi que la manière et le moment où les comportements étaient renforcés avaient des effets significatifs sur la force et la cohérence de ces comportements.

Introduction

Un calendrier de renforcement est un élément du conditionnement opérant (également connu sous le nom de conditionnement ininstrumental). Il s’agit d’un dispositif permettant de déterminer quand renforcer un comportement. Par exemple, il s’agit de déterminer s’il faut renforcer le comportement en fonction du temps ou du nombre de réponses.

Les schémas de renforcement peuvent être divisés en deux grandes catégories : le renforcement continu, qui renforce une réponse à chaque fois, et le renforcement partiel, qui renforce une réponse occasionnellement.

Le type de schéma de renforcement utilisé a un impact significatif sur le taux de réponse et la résistance à l’extinction du comportement.

La recherche sur les schémas de renforcement a eu des implications importantes dans le domaine des sciences comportementales, y compris le comportement de choix, la pharmacologie comportementale et l’économie comportementale.

Renforcement continu

Dans les schémas continus, le renforcement est fourni à chaque fois après le comportement souhaité.

Comme le comportement est renforcé à chaque fois, l’association est facile à faire et l’apprentissage se produit rapidement. Cependant, cela signifie également que l’extinction se produit rapidement lorsque le renforcement n’est plus fourni.

Pour l’exemple

Nous pouvons mieux comprendre le concept de renforcement continu en prenant l’exemple des distributeurs de bonbons.

Les distributeurs de bonbons sont des exemples de renforcement continu, car chaque fois que nous y mettons de l’argent (comportement), nous recevons des bonbons en retour (renforcement positif).

Toutefois, si une machine à bonbons ne fournissait pas de bonbons deux fois de suite, nous cesserions probablement d’essayer d’y mettre de l’argent (Myers, 2011).

Nous en sommes venus à nous attendre à ce que notre comportement soit renforcé chaque fois qu’il est exécuté et nous nous décourageons rapidement s’il ne l’est pas.

Programmes de renforcement partiel (intermittent)

Contrairement aux programmes continus, les programmes partiels ne renforcent le comportement souhaité qu’occasionnellement et non pas tout le temps. L’apprentissage est donc plus lent, car il est initialement plus difficile de faire le lien entre le comportement et le renforcement.

Cependant, les programmes partiels produisent également un comportement plus résistant à l’extinction. Les organismes sont tentés de persister dans leur comportement dans l’espoir d’être éventuellement récompensés.

Par exemple, les machines à sous dans les casinos fonctionnent selon des horaires partiels. Elles fournissent de l’argent (renforcement positif) après un nombre imprévisible de jeux (comportement). Les joueurs de machines à sous sont donc susceptibles de jouer continuellement dans l’espoir de gagner de l’argent au prochain tour (Myers, 2011).

Les programmes de renforcement partiel sont les plus fréquents dans la vie quotidienne et varient en fonction du nombre de réponses récompensées (fixe ou variable) ou de l’intervalle de temps (intervalle ou ratio) entre les réponses.

Programme fixe

Dans un programme fixe, le nombre de réponses ou l’intervalle de temps entre les renforcements est fixé et ne change pas. Le programme est prévisible.

Programme variable

Dans un programme variable, le nombre de réponses ou le délai entre les renforcements change de manière aléatoire. Le calendrier est imprévisible.

Ratio Schedule

Dans un calendrier de ratio, le renforcement a lieu après qu’un certain nombre de réponses ont été émises.

Programme à intervalles

Les programmes à intervalles impliquent le renforcement d’un comportement après un certain temps.

La combinaison de ces quatre descripteurs donne quatre types de programmes de renforcement partiel : à rapport fixe, à intervalles fixes, à rapport variable et à intervalles variables.

Fixed Interval Schedule

En conditionnement opérant, un programme à intervalle fixe est

lorsque le renforcement est accordé à une réponse souhaitée après un laps de temps spécifique (prévisible).

Ce type d’horaire entraîne une tendance des organismes à augmenter la fréquence des réponses à l’approche du moment prévu pour le renforcement. Cependant, immédiatement après le renforcement, la fréquence des réponses diminue.

La fluctuation des taux de réponse signifie qu’un programme à intervalles fixes produira un schéma festonné (voir figure ci-dessous) plutôt que des taux de réponse réguliers.

Par exemple

Un exemple de programme à intervalles fixes serait celui d’un enseignant donnant à ses élèves un examen hebdomadaire tous les lundis.

Au cours du week-end, il y a soudainement une vague d’études pour l’examen. Le lundi, les élèves passent l’examen et sont renforcés pour avoir étudié (renforcement positif : obtenir une bonne note ; renforcement négatif : ne pas échouer à l’examen).

Les jours suivants, ils sont susceptibles de se détendre après avoir terminé cette expérience stressante, jusqu’à ce que la date de l’examen suivant soit trop proche pour qu’ils puissent l’ignorer.

Programme à intervalle variable

Dans le cadre du conditionnement opérant, un programme à intervalle variable est un programme dans lequel le renforcement est fourni après un laps de temps aléatoire (imprévisible) à la suite de l’exécution d’un comportement spécifique.

Ce schéma produit un taux de réponse faible et régulier, car les organismes ne savent pas quand ils recevront les renforçateurs.

Par exemple

Dans la boîte de Skinner, un pigeon doit picorer une barre pour recevoir une boulette de nourriture. Il reçoit une boulette de nourriture après des intervalles de temps variables allant de 2 à 5 minutes.

On lui donne une pastille après 3 minutes, puis 5 minutes, puis 2 minutes, etc. Il répondra régulièrement puisqu’il ne sait pas quand son comportement sera renforcé.

Calendrier à ratio fixe

Dans le conditionnement opérant, un calendrier à ratio fixe renforce le comportement après un nombre spécifié de réponses correctes.

Ce type de calendrier permet d’obtenir des taux de réponse élevés et constants. Les organismes persistent à répondre dans l’espoir que la prochaine réponse sera celle qui sera nécessaire pour recevoir le renforcement. Ce type d’horaire est utilisé dans les jeux de loterie.

Par exemple

Un exemple d’horaire à rapport fixe serait celui d’une couturière payée 500 $ pour chaque dizaine de robes qu’elle fabrique. Après avoir expédié un lot de 10 robes, il reçoit 500 dollars de plus. Il est probable qu’il fasse une courte pause immédiatement après ce renforcement avant de recommencer à produire des robes.

Calendrier à ratio variable

Un calendrier à ratio variable est un calendrier de renforcement dans lequel un comportement est renforcé après un nombre aléatoire de réponses.

Ce type de calendrier permet d’obtenir des taux de réponse élevés et réguliers. Les organismes persistent à répondre parce qu’ils espèrent que la prochaine réponse sera celle qui sera nécessaire pour recevoir le renforcement. Ce type d’horaire est utilisé dans les jeux de loterie.

Par exemple

Un exemple d’horaire à rapport fixe serait celui d’un enfant à qui l’on donnerait des bonbons toutes les 3 à 10 pages d’un livre qu’il lirait. Par exemple, il reçoit des bonbons après avoir lu 5 pages, puis 3 pages, puis 7 pages, puis 8 pages, etc.

Le renforcement imprévisible les motive à continuer à lire, même s’ils ne sont pas immédiatement renforcés après avoir lu une page.

Taux de réponse des différents horaires de renforcement

Les horaires à ratio – ceux qui sont liés à un certain nombre de réponses – produisent des taux de réponse plus élevés que les horaires à intervalles.

De même, les horaires variables produisent un comportement plus cohérent que les horaires fixes ; l’imprévisibilité du renforcement entraîne des réponses plus cohérentes que le renforcement prévisible (Myers, 2011).

Extinction of Responses Reinforced at Different Schedules

La résistance à l’extinction fait référence à la durée pendant laquelle un comportement continue à se manifester même après avoir cessé d’être renforcé. Une réponse présentant une résistance élevée à l’extinction mettra plus de temps à s’éteindre complètement.

Différents horaires de renforcement produisent différents niveaux de résistance à l’extinction. En général, les programmes qui renforcent de manière imprévisible sont plus résistants à l’extinction.

Par conséquent, le programme à intervalles variables est plus résistant à l’extinction que le programme à intervalles fixes. L’horaire à intervalles variables est plus résistant à l’extinction que l’horaire à intervalles fixes tant que les intervalles moyens sont similaires.

Dans l’horaire à rapport fixe, la résistance à l’extinction augmente à mesure que le rapport augmente. Dans le schéma à intervalles fixes, la résistance à l’extinction augmente à mesure que l’intervalle s’allonge.

Parmi les quatre types de schémas de renforcement partiel, le schéma à rapport variable est celui qui résiste le mieux à l’extinction. Même si les joueurs ne reçoivent pas de renforçateurs après un grand nombre de réponses, ils gardent l’espoir d’être bientôt renforcés.

Implications pour la psychologie comportementale

Dans son article “Schedules of Reinforcement at 50 : A Retroactive Appreciation”, Morgan (2010) décrit les façons dont les calendriers de renforcement sont utilisés pour étudier des domaines importants de la science comportementale.

Choice Behavior

Les comportementalistes s’intéressent depuis longtemps à la façon dont les organismes font des choix en matière de comportement – comment ils choisissent entre des alternatives et des renforçateurs. Ils ont pu étudier les choix comportementaux grâce à l’utilisation de calendriers simultanés.

En utilisant simultanément deux calendriers de renforcement distincts (souvent les deux calendriers à intervalles variables), les chercheurs sont en mesure d’étudier la manière dont les organismes répartissent leur comportement entre les différentes options.

Une découverte importante a été la loi d’appariement, qui stipule que les taux de réponse d’un organisme à un certain programme suivront de près le ratio de renforcement obtenu.

Par exemple, disons que le père de Joe a donné de l’argent à Joe presque chaque fois que Joe l’a demandé, mais que la mère de Joe n’a presque jamais donné d’argent à Joe lorsqu’il l’a demandé. Étant donné que la réponse de Joe, qui consiste à demander de l’argent, est renforcée plus souvent lorsqu’il demande à son père, il est plus probable qu’il demande de l’argent à son père plutôt qu’à sa mère.

Les recherches ont montré que les individus tentent de choisir le comportement qui leur procure la plus grande récompense. D’autres facteurs influent également sur le choix comportemental d’un organisme : le taux de renforcement, la qualité du renforcement, le délai avant le renforcement et l’effort de réponse.

Le blog Babble behavior résume bien les résultats : “Tout le monde préfère des quantités, une qualité et des taux de récompense plus élevés. Ils préfèrent les récompenses qui arrivent plus tôt et qui demandent moins d’effort pour être reçues.”

Pharmacologie comportementale

Les calendriers de renforcement sont utilisés pour évaluer la préférence et le potentiel d’abus des médicaments. L’une des méthodes utilisées dans le cadre de la recherche pharmacologique comportementale consiste à utiliser un schéma de ratio progressif.

Dans un schéma de ratio progressif, l’exigence de réponse est continuellement augmentée à chaque fois que le renforcement est atteint. Dans le cas de la pharmacologie, les participants doivent démontrer un nombre croissant de réponses afin d’obtenir une injection de médicament (renforcement).

Dans un schéma de ratio progressif, une seule injection peut nécessiter jusqu’à des milliers de réponses. Les participants sont évalués en fonction du point où la réponse finit par s’arrêter, ce qui est appelé le “point de rupture”.

La collecte de données sur les points de rupture des drogues permet une catégorisation reflétant le potentiel d’abus des différentes drogues. L’utilisation du schéma de rapport progressif pour évaluer la préférence et/ou le choix des drogues est désormais courante en pharmacologie comportementale.

Économie comportementale

Les expériences pratiques offrent un moyen idéal d’étudier le comportement microéconomique ; les participants peuvent être considérés comme des consommateurs et les renforçateurs comme des marchandises.

En expérimentant différents schémas de renforcement, les chercheurs peuvent modifier la disponibilité ou le prix d’une marchandise et suivre l’évolution de l’allocation des réponses en conséquence.</Par exemple, la modification du ratio (augmentation ou diminution du nombre de réponses nécessaires pour recevoir le renforçateur) est un moyen d’étudier l’élasticité.

Un autre exemple du rôle que jouent les schémas de renforcement est l’étude de la substituabilité en rendant différents produits disponibles au même prix (même schéma de renforcement). En utilisant le laboratoire opérant pour étudier le comportement, les chercheurs ont l’avantage de pouvoir manipuler les variables indépendantes et de mesurer les variables dépendantes.

Mini Quiz

Voici des exemples de calendriers de renforcement à l’œuvre dans le monde réel. Lisez les exemples et déterminez le type de programme de renforcement utilisé.

  • Réponse : Rapport variable
  • Réponse : Intervalle fixe
  • Réponse : Variable-intervalle
  • Réponse : Programme de renforcement continu
  • Réponse : Rapport fixe

Références

Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York : Appleton-Century-Crofts.

Morgan, D. L. (2010). Les schémas de renforcement à 50 ans : une appréciation rétrospective. The Psychological Record ; Heidelberg, 60 (1), 151-172.

Myers, David G. (2011). Psychologie (10e éd.). Worth Publishers.

Qu’est-ce qui influence mon comportement ? L’explication de la loi de correspondance qui va changer la façon dont vous comprenez vos actions. (2017, 27 août). Behaviour Babble. https://www.behaviourbabble.com/what-influences-my-behavior/

Informations complémentaires

Schedules of reinforcement at 50 : A retrospective appreciation

Ayllon, T., & Michael, J. (1959). The psychiatric nurse as a behavioral engineer. Journal of the Experimental Analysis of behavior, 2(4), 323-334.

Qu’est-ce qu’un schéma de renforcement ?

Les calendriers de renforcement sont des règles qui contrôlent le moment et la fréquence du renforcement dans le conditionnement opérant. Ils comprennent les calendriers à rapport fixe, à rapport variable, à intervalle fixe et à intervalle variable, chacun dictant un modèle différent de récompenses en réponse à un comportement.

Quel schéma de renforcement est le plus résistant à l’extinction des réponses apprises ?

Le schéma de renforcement à rapport variable est le plus résistant à l’extinction. En effet, le renforcement est accordé après un nombre imprévisible de réponses, ce qui rend plus difficile la cessation du comportement. Parmi les exemples, citons les jeux d’argent ou la loterie, où un gain est imprévisible mais peut survenir à tout moment.

Laissez-nous un commentaire