Le conditionnement opérant, ou conditionnement instrumental, est une théorie de l’apprentissage selon laquelle le comportement est influencé par ses conséquences. Dans les années 1920, John B. Watson avait quitté la psychologie académique et d’autres behavioristes devenaient influents, proposant de nouvelles formes d’apprentissage autres que le conditionnement classique. Le plus important d’entre eux est peut-être Burrhus Frederic Skinner. Pour des raisons évidentes, il est plus connu sous le nom de B.F. Skinner.
Les opinions de Skinner étaient légèrement moins extrêmes que celles de Watson (1913). Skinner pensait que l’esprit existait bel et bien, mais qu’il était simplement plus productif d’étudier le comportement observable plutôt que les événements mentaux internes.
Le travail de Skinner était ancré dans l’idée que le conditionnement classique était beaucoup trop simpliste pour constituer une explication complète du comportement humain complexe. Il pensait que la meilleure façon de comprendre le comportement était d’examiner les causes d’une action et ses conséquences. Il a appelé cette approche le conditionnement opérant.
CHAPITRES
ToggleBF Skinner : Le conditionnement opérant
Skinner est considéré comme le père du conditionnement opérant, mais son travail était basé sur la loi de l’effet de Thorndike (1898). Selon ce principe, un comportement suivi de conséquences agréables est susceptible d’être répété, et un comportement suivi de conséquences désagréables est moins susceptible d’être répété.
Skinner a introduit un nouveau terme dans la loi de l’effet – le renforcement. un comportement qui est renforcé a tendance à être répété (c’est-à-dire renforcé) ; un comportement qui n’est pas renforcé a tendance à disparaître ou à s’éteindre (c’est-à-dire affaibli).
Skinner est considéré comme le père du conditionnement opérant, mais ses travaux étaient basés sur la loi de l’effet de Thorndike (1898),
Skinner (1948) a étudié le conditionnement opérant en menant des expériences avec des animaux qu’il a placés dans une « Skinner Box » qui était similaire à la boîte à puzzle de Thorndike.
Une boîte de Skinner, également appelée chambre de conditionnement opérant, est un dispositif utilisé pour enregistrer objectivement le comportement d’un animal dans un laps de temps réduit. Un animal peut être récompensé ou puni pour avoir adopté certains comportements, comme appuyer sur un levier (pour les rats) ou picorer une clé (pour les pigeons).
Skinner a identifié trois types de réponses, ou opérants, qui peuvent suivre un comportement.
- Opérants neutres : réponses de l’environnement qui n’augmentent ni ne diminuent la probabilité qu’un comportement soit répété.
- Renforçateurs : Réponses de l’environnement qui augmentent la probabilité qu’un comportement soit répété. Les renforçateurs peuvent être positifs ou négatifs.
- Punisseurs : Réponses de l’environnement qui diminuent la probabilité qu’un comportement soit répété. La punition affaiblit le comportement.
Nous pouvons tous penser à des exemples de la manière dont notre propre comportement a été affecté par les renforçateurs et les punisseurs. Par exemple, lorsque vous étiez plus jeune, si vous avez essayé de fumer à l’école et que la principale conséquence a été que vous vous êtes retrouvé parmi les gens que vous aviez toujours voulu fréquenter, vous avez été renforcé positivement (c’est-à-dire que vous avez été récompensé) et il est probable que vous répétiez votre comportement, si, en revanche, la principale conséquence avait été de vous faire prendre, de vous donner des coups de bâton, de vous suspendre de l’école et que vos parents s’en étaient mêlés, vous auriez très certainement été puni et, par conséquent, vous seriez beaucoup moins enclin à fumer aujourd’hui.
Renforcement positif
Le renforcement positif est un terme décrit par B. F. Skinner dans sa théorie sur le conditionnement opérant. Dans le cadre du renforcement positif, une réponse ou un comportement est renforcé par des récompenses, ce qui conduit à la répétition du comportement souhaité. La récompense est un stimulus renforçant.
Les renforçateurs primaires sont des stimuli qui renforcent naturellement parce qu’ils ne sont pas appris et satisfont directement un besoin, comme la nourriture ou l’eau.
Les renforçateurs secondaires sont des stimuli qui sont renforcés par leur association avec un renforçateur primaire, comme l’argent, les notes à l’école. Ils ne satisfont pas directement un besoin inné, mais peuvent en être le moyen. Un renforçateur secondaire peut donc être un motivateur tout aussi puissant qu’un renforçateur primaire.
Skinner a montré comment fonctionnait le renforcement positif en plaçant un rat affamé dans sa boîte de Skinner. La boîte contenait un levier sur le côté, et lorsque le rat se déplaçait dans la boîte, il heurtait accidentellement le levier. Les rats ont rapidement appris à aller directement vers le levier après avoir été placés plusieurs fois dans la boîte. La conséquence de recevoir de la nourriture, s’ils appuyaient sur le levier, les incitait à répéter l’action encore et encore.
Le renforcement positif renforce un comportement en fournissant une conséquence que l’individu trouve gratifiante. Par exemple, si votre professeur vous donne 5 livres sterling chaque fois que vous faites vos devoirs (c’est-à-dire une récompense), vous serez plus enclin à répéter ce comportement à l’avenir, ce qui renforcera l’habitude de faire vos devoirs.
Le principe de Premack est une forme de renforcement positif dans le cadre du conditionnement opérant. Il suggère d’utiliser une activité préférée (comportement à forte probabilité) comme récompense pour l’accomplissement d’une activité moins préférée (comportement à faible probabilité).
Cette méthode encourage le comportement moins souhaitable en l’associant à un résultat souhaitable, renforçant ainsi le comportement moins favorisé.
Negative Reinforcement
Le renforcement négatif consiste à mettre fin à un état désagréable à la suite d’une réponse.
On parle de renforcement négatif parce qu’il s’agit de la suppression d’un stimulus négatif qui est « gratifiant » pour l’animal ou la personne. Le renforcement négatif renforce le comportement parce qu’il met fin à une expérience désagréable ou la supprime.
Par exemple, si vous ne faites pas vos devoirs, vous donnez 5 livres sterling à votre professeur. Vous ferez vos devoirs pour éviter de payer 5 £, renforçant ainsi le comportement de faire vos devoirs.
Skinner a montré comment le renforcement négatif fonctionnait en plaçant un rat dans sa boîte de Skinner, puis en le soumettant à un courant électrique désagréable qui lui causait un certain inconfort. Lorsque le rat se déplaçait dans la boîte, il heurtait accidentellement le levier.
Aussitôt qu’il le faisait, le courant électrique était coupé. Les rats ont rapidement appris à aller directement au levier après avoir été placés plusieurs fois dans la boîte. En fait, Skinner a même appris aux rats à éviter le courant électrique en allumant une lumière juste avant que le courant électrique ne s’allume. Les rats ont rapidement appris à appuyer sur le levier lorsque la lumière s’allumait, car ils savaient que cela empêcherait le courant électrique de s’allumer.
Ces deux réponses apprises sont connues sous le nom d’apprentissage par la fuite et d’apprentissage par l’évitement.
Punition (affaiblit le comportement)
La punition est le contraire du renforcement puisqu’elle est conçue pour affaiblir ou éliminer une réponse plutôt que de l’augmenter. Comme le renforcement, la punition peut être appliquée soit en appliquant directement un stimulus désagréable, comme un choc, après une réponse, soit en supprimant un stimulus potentiellement gratifiant, par exemple en déduisant l’argent de poche d’une personne pour punir un comportement indésirable.
Note : il n’est pas toujours facile de faire la distinction entre la punition et le renforcement négatif.
Le recours à la punition pose de nombreux problèmes, notamment :
- Le comportement puni n’est pas oublié, il est supprimé – le comportement réapparaît lorsque la punition n’est plus présente.
- Augmentation de l’agressivité – montre que l’agressivité est un moyen de faire face aux problèmes.
- Création d’une peur qui peut se généraliser et entraîner des comportements indésirables, par exemple : la peur de l’école, le renforcement vous dit ce qu’il faut faire et la punition vous dit seulement ce qu’il ne faut pas faire.
Exemples de conditionnement opérant
- Renforcement positif : Supposons que vous êtes un entraîneur et que vous voulez que votre équipe améliore la précision de ses passes au football. Lorsque les joueurs exécutent des passes précises pendant l’entraînement, vous les félicitez pour leur technique. Ce feedback positif les encourage à répéter le bon comportement de passe.
- Renforcement négatif : si vous remarquez que votre équipe travaille efficacement ensemble et fait preuve d’un excellent esprit d’équipe au cours d’une séance d’entraînement difficile, vous pouvez mettre fin à la séance d’entraînement plus tôt que prévu, ce que les membres de l’équipe perçoivent comme un soulagement. Ils comprennent que le travail d’équipe mène à des résultats positifs, ce qui renforce le comportement de l’équipe.
- Punition négative : si un employé de bureau arrive continuellement en retard, son supérieur peut lui retirer le privilège d’avoir des horaires de travail flexibles. Cette suppression d’un stimulus positif encourage l’employé à être ponctuel.
- Renforcement positif : on peut apprendre à un chat à utiliser une litière en lui donnant une friandise chaque fois qu’il l’utilise correctement. Le chat associera le comportement à la récompense et le répétera probablement.
- Punition négative : si un adolescent reste dehors après le couvre-feu, ses parents peuvent lui confisquer sa console de jeu pendant une semaine. L’adolescent sera alors plus enclin à respecter le couvre-feu à l’avenir pour éviter de perdre un objet auquel il tient.
- Punition inefficace : Votre enfant refuse de finir ses légumes au dîner. Vous le punissez en lui interdisant le dessert, mais il refuse toujours de manger des légumes la prochaine fois. La punition semble inefficace.
- Application du principe de Premack : Vous pourriez motiver votre enfant à manger des légumes en lui proposant une activité qu’il aime après avoir terminé son repas. Par exemple, pour chaque légume mangé, il a droit à cinq minutes supplémentaires de jeu vidéo. Il apprécie le temps consacré aux jeux vidéo, ce qui pourrait l’encourager à manger des légumes.
- Autres exemples de principes Premack:
- Un élève qui n’aime pas l’histoire mais adore l’art pourrait gagner du temps supplémentaire dans l’atelier d’art pour chaque chapitre d’histoire révisé.
- Pour chaque 10 minutes qu’une personne consacre aux tâches ménagères, elle peut consacrer 5 minutes à son passe-temps favori.
- Pour chaque journée réussie d’alimentation saine, une personne s’autorise un petit morceau de chocolat noir à la fin de la journée.
- Un enfant peut choisir entre sortir les poubelles ou faire la vaisselle. En lui donnant le choix, il est plus enclin à accomplir la corvée de son plein gré.
L’expérience du pigeon de Skinner
B.F. Skinner a mené plusieurs expériences avec des pigeons pour démontrer les principes du conditionnement opérant.
L’une des plus célèbres de ces expériences est souvent appelée familièrement « La superstition chez le pigeon ». »Cette expérience a été menée pour explorer les effets du renforcement non-contingent sur les pigeons, ce qui a donné lieu à des observations fascinantes qui peuvent être comparées aux superstitions humaines.
Le renforcement non-contingent (RNC) fait référence à une méthode dans laquelle les récompenses (ou renforcements) sont délivrées indépendamment du comportement de l’individu. En d’autres termes, le renforcement est donné à des moments ou à des intervalles déterminés, indépendamment de ce que fait l’individu.
L’expérience:
- Les pigeons ont été amenés à un état de famine, réduits à 75 % de leur poids d’origine.
- Au lieu que la nourriture soit donnée à la suite d’une action spécifique du pigeon, elle a été présentée à intervalles réguliers, indépendamment du comportement du pigeon.
Observation:
- Au fil du temps, Skinner a observé que les pigeons commençaient à associer n’importe quelle action aléatoire qu’ils faisaient lorsque la nourriture était livrée à la livraison de la nourriture elle-même.
- Cela a conduit les pigeons à répéter ces actions, croyant (en termes anthropomorphiques) que leur comportement provoquait l’apparition de la nourriture.
Résultats:
- Dans la plupart des cas, les pigeons ont développé différents comportements ou rituels « superstitieux ». Par exemple, un pigeon tournait dans le sens inverse des aiguilles d’une montre entre les distributions de nourriture, tandis qu’un autre enfonçait sa tête dans un coin de la cage.
- Ces comportements ne sont pas apparus avant l’introduction de la trémie de nourriture et sa présentation périodique.
- Ces comportements n’étaient pas initialement liés à la distribution de nourriture, mais sont devenus liés dans l’esprit du pigeon en raison de la coïncidence du moment de la distribution de la nourriture.
- Le taux de renforcement (fréquence de présentation de la nourriture) a joué un rôle important. Des intervalles plus courts entre les présentations de nourriture ont conduit à un conditionnement plus rapide et mieux défini.
- Une fois qu’un comportement a été établi, l’intervalle entre les renforcements peut être augmenté sans diminuer le comportement.
Comportement superstitieux:
Les pigeons ont commencé à agir comme si leurs comportements avaient un effet direct sur la présentation de la nourriture, même s’il n’y avait aucun lien de ce type. Par exemple, un joueur de cartes peut avoir des rituels pour changer sa chance, ou un joueur de bowling peut faire des gestes en pensant qu’ils peuvent influencer une boule déjà en mouvement.
Conclusion:
Cette expérience démontre que les comportements peuvent être conditionnés même sans relation directe de cause à effet. Tout comme les humains, les pigeons peuvent développer des comportements « superstitieux » basés sur des coïncidences.
Cette étude éclaire non seulement les subtilités du conditionnement opérant, mais établit également des parallèles entre les comportements animaux et humains face à des renforcements aléatoires.
Les horaires de renforcement
Imaginez un rat dans une « boîte de Skinner » Dans le cadre du conditionnement opérant, si aucune boulette de nourriture n’est délivrée immédiatement après avoir appuyé sur le levier, le rat cesse d’appuyer sur le levier après plusieurs tentatives (combien de temps quelqu’un continuerait-il à aller au travail si son employeur cessait de le payer ?) Les comportementalistes ont découvert que différents schémas (ou calendriers) de renforcement avaient des effets différents sur la vitesse d’apprentissage et d’extinction. Ferster et Skinner (1957) ont mis au point différentes méthodes de renforcement et ont constaté qu’elles avaient des effets sur
1. Le taux de réponse – La vitesse à laquelle le rat appuie sur le levier (c’est-à-dire l’intensité de son travail).
2. Le taux d’extinction – La vitesse à laquelle le rat cesse d’appuyer sur le levier (c’est-à-dire le moment où il abandonne).
Skinner a découvert que le type de renforcement qui produit le taux d’extinction le plus lent (c’est-à-dire que les gens continueront à répéter le comportement le plus longtemps sans renforcement) est le renforcement à rapport variable. Le type de renforcement qui produit le taux d’extinction le plus rapide est le renforcement continu.
(A) Renforcement continu
Un animal ou un humain reçoit un renforcement positif chaque fois qu’un comportement spécifique se produit, par ex, chaque fois qu’un levier est actionné, une pastille est distribuée, puis la distribution de nourriture est interrompue.
- Le taux de réponse est LENT
- Le taux d’extinction est RAPIDE
(B) Renforcement à rapport fixe
Le comportement est renforcé uniquement lorsqu’il se produit un certain nombre de fois, c’est-à-dire qu’un renforcement est donné après un certain nombre de réponses correctes, par exemple après chaque cinquième réponse. Par exemple, un enfant reçoit une étoile pour chaque cinq mots correctement orthographiés.
- Le taux de réponse est RAPIDE
- Le taux d’extinction est MOYEN
(C) Renforcement à intervalle fixe
Un renforcement est donné après un intervalle de temps fixe à condition qu’au moins une réponse correcte ait été donnée. Le fait d’être payé à l’heure en est un exemple. Un autre exemple serait la distribution d’une boulette toutes les 15 minutes (demi-heure, heure, etc.) (à condition qu’au moins une pression sur le levier ait été effectuée), puis l’arrêt de la distribution de nourriture.
- Le taux de réponse est MOYEN
- Le taux d’extinction est MOYEN
(D) Renforcement à rapport variable
Le comportement est renforcé après un nombre imprévisible de fois. Par exemple, le jeu ou la pêche.
-
- Le taux de réponse est RAPIDE
-
- Le taux d’extinction est LENT (très difficile à éteindre en raison de l’imprévisibilité)
(E) Renforcement à intervalle variable
Si une réponse correcte a été donnée, le renforcement est accordé après un laps de temps imprévisible, par ex.g., en moyenne toutes les 5 minutes. Un exemple est celui d’un travailleur indépendant payé à des moments imprévisibles.
- Le taux de réponse est RAPIDE
- Le taux d’extinction est LENT
Applications
1. Thérapie de modification du comportement
La modification du comportement est un ensemble de techniques thérapeutiques basées sur le conditionnement opérant (Skinner, 1938, 1953). Le principe de base consiste à modifier les événements environnementaux liés au comportement d’une personne. Par exemple, le renforcement des comportements souhaités et le fait d’ignorer ou de punir les comportements indésirables.
Ce n’est pas aussi simple qu’il y paraît – le fait de toujours renforcer un comportement souhaité, par exemple, revient en fait à le corrompre.
Il existe différents types de renforcements positifs. On parle de renforcement primaire lorsqu’une récompense renforce un comportement en soi. Les exemples de thérapie de modification du comportement comprennent l’économie de jetons et le modelage du comportement.
Économie de jetons
L’économie de jetons est un système dans lequel les comportements ciblés sont renforcés par des jetons (renforçateurs secondaires) et échangés plus tard contre des récompenses (renforçateurs primaires).
Les jetons peuvent prendre la forme de fausse monnaie, de boutons, de jetons de poker, d’autocollants, etc. Les récompenses peuvent aller d’une collation à des privilèges ou à des activités. Par exemple, les enseignants utilisent l’économie de jetons à l’école primaire en donnant aux jeunes enfants des autocollants pour récompenser leur bon comportement.
L’économie de jetons s’est avérée très efficace dans la gestion des patients psychiatriques. Cependant, les patients peuvent devenir trop dépendants des jetons, ce qui rend difficile leur adaptation à la société une fois qu’ils quittent la prison, l’hôpital, etc.
Le personnel qui met en œuvre un programme d’économie de jetons a beaucoup de pouvoir. Pour que le programme fonctionne, il est important que le personnel ne favorise pas ou n’ignore pas certaines personnes. Par conséquent, le personnel doit être formé pour donner des jetons de manière équitable et cohérente, même en cas de changement d’équipe, comme dans les prisons ou les hôpitaux psychiatriques.
Formation du comportement
Une autre contribution importante de Skinner (1951) est la notion de formation du comportement par approximations successives. Skinner affirme que les principes du conditionnement opérant peuvent être utilisés pour produire des comportements extrêmement complexes si les récompenses et les punitions sont délivrées de manière à encourager un organisme à se rapprocher de plus en plus du comportement souhaité à chaque fois.
Dans le façonnage, la forme d’une réponse existante est progressivement modifiée au cours d’essais successifs vers un comportement cible souhaité en récompensant des segments exacts du comportement.2. Applications pédagogiques
Dans la situation d’apprentissage conventionnelle, le conditionnement opérant s’applique largement aux questions de gestion de la classe et des étudiants, plutôt qu’au contenu de l’apprentissage. Un moyen simple de modeler le comportement consiste à fournir un retour d’information sur les performances de l’apprenant, par exemple sous forme de compliments, d’approbation, d’encouragement et d’affirmation.
Un rapport variable produit le taux de réponse le plus élevé pour les étudiants qui apprennent une nouvelle tâche, le renforcement initial (par exemple, les compliments) se produisant à intervalles fréquents, par exemple, si un enseignant veut encourager les élèves à répondre à des questions en classe, il doit les féliciter pour chaque tentative (que la réponse soit correcte ou non). Progressivement, l’enseignant ne félicitera les élèves que lorsque leur réponse est correcte et, avec le temps, seules les réponses exceptionnelles seront félicitées.
Les comportements indésirables, tels que les retards et le fait de dominer la discussion en classe, peuvent être éteints en étant ignorés par l’enseignant (au lieu d’être renforcés par le fait que l’attention est attirée sur eux). Ce n’est pas une tâche facile, car l’enseignant peut paraître peu sincère s’il réfléchit trop à la manière de se comporter.
La connaissance de la réussite est également importante, car elle motive l’apprentissage futur. Cependant, il est important de varier le type de renforcement donné afin que le comportement soit maintenu. Ce n’est pas une tâche facile, car l’enseignant peut paraître peu sincère s’il réfléchit trop à la manière de se comporter.
Conditionnement opérant vs. conditionnement classique
Type d’apprentissage
Bien que les deux types de conditionnement impliquent un apprentissage, le conditionnement classique est passif (réponse automatique aux stimuli), tandis que le conditionnement opérant est actif (le comportement est influencé par les conséquences).
- Le conditionnement classique associe une réponse involontaire à un stimulus. Il se produit passivement de la part de l’apprenant, sans récompense ni punition. Par exemple, un chien salive au son d’une cloche associée à de la nourriture.
- Le conditionnement opérant associe un comportement volontaire à une conséquence. Le conditionnement opérant exige que l’apprenant participe activement et effectue un certain type d’action pour être récompensé ou puni. Il est actif, le comportement de l’apprenant étant influencé par les récompenses ou les punitions. Par exemple, un chien s’assoit sur commande pour obtenir une friandise.
Processus d’apprentissage
Le conditionnement classique implique l’apprentissage par l’association de stimuli entraînant des réponses involontaires, tandis que le conditionnement opérant se concentre sur l’apprentissage par les conséquences, façonnant des comportements volontaires.
- Apprentissage par association (conditionnement classique):Dans l’apprentissage par association, une personne (ou un animal) apprend à associer deux stimuli, ce qui entraîne un changement de comportement. Un stimulus neutre est associé à un stimulus non conditionné qui déclenche naturellement une réponse.Au fil du temps, la personne réagit au stimulus neutre comme s’il s’agissait du stimulus non conditionné, même lorsqu’il est présenté seul. La réponse est involontaire et automatique.
Un exemple est un chien qui salive (réponse) au son d’une cloche (stimulus neutre) après avoir été associé à plusieurs reprises à de la nourriture (stimulus non conditionné).
- Apprentissage par les conséquences (conditionnement opérant):Dans l’apprentissage par les conséquences, le comportement est appris en fonction de ses résultats ou de ses conséquences. L’apprenant est actif et la réponse est volontaire.
Un comportement suivi de conséquences agréables (récompenses) est plus susceptible d’être répété, tandis qu’un comportement suivi de conséquences désagréables (punitions) est moins susceptible d’être répété.
Par exemple, si un enfant est félicité (conséquence agréable) pour avoir rangé sa chambre (comportement), il sera plus enclin à le faire à l’avenir.
A l’inverse, s’il se fait gronder (conséquence désagréable) parce qu’il n’a pas fait ses devoirs, il sera plus enclin à les faire la prochaine fois pour éviter la réprimande.
Temps du stimulus et de la réponse
Le temps de la réponse par rapport au stimulus diffère entre le conditionnement classique et le conditionnement opérant:
- Conditionnement classique (réponse après le stimulus) : dans cette forme de conditionnement, la réponse se produit après le stimulus. Le comportement (réponse) est déterminé par ce qui le précède (stimulus).
Par exemple, dans l’expérience classique de Pavlov, les chiens ont commencé à saliver (réponse) après avoir entendu la cloche (stimulus) parce qu’ils l’associaient à la nourriture.
- Conditionnement opérant (réponse avant le stimulus) : dans cette forme de conditionnement, la réponse se produit généralement avant la conséquence (qui agit comme stimulus pour le comportement futur).
Sommaire
En examinant les études classiques de Skinner sur le comportement des pigeons et des rats, nous pouvons identifier certaines des principales hypothèses de l’approche behavioriste.
– La psychologie doit être considérée comme une science, qui doit être étudiée de manière scientifique. L’étude de Skinner sur le comportement des rats a été menée dans des conditions de laboratoire soigneusement contrôlées.
– Le béhaviorisme s’intéresse principalement au comportement observable, par opposition aux événements internes tels que la pensée et les émotions. Notez que Skinner n’a pas dit que les rats avaient appris à appuyer sur un levier parce qu’ils voulaient de la nourriture. Il s’est plutôt concentré sur la description du comportement facilement observable que les rats ont acquis.
– La principale influence sur le comportement humain est l’apprentissage à partir de notre environnement. Dans l’étude de Skinner, parce que la nourriture suivait un comportement particulier, les rats ont appris à répéter ce comportement, c’est-à-dire le conditionnement opérant.
– Il y a peu de différence entre l’apprentissage qui a lieu chez les humains et celui qui a lieu chez d’autres animaux. Par conséquent, la recherche (par exemple, le conditionnement opérant) peut être menée sur des animaux (rats / pigeons) aussi bien que sur des êtres humains. Skinner a proposé que la façon dont les humains apprennent le comportement est très similaire à la façon dont les rats ont appris à appuyer sur un levier.
Donc, si l’idée que vous vous faites de la psychologie a toujours été celle de personnes dans des laboratoires portant des blouses blanches et regardant des rats infortunés essayer de négocier des labyrinthes pour arriver à leur dîner, alors vous pensez probablement à la psychologie comportementale.
Le béhaviorisme et ses ramifications tendent à être parmi les perspectives psychologiques les plus scientifiques. La psychologie comportementale est l’approche psychologique qui se concentre sur la manière dont cet apprentissage a lieu.
Évaluation critique
Le conditionnement opérant peut être utilisé pour expliquer une grande variété de comportements, du processus d’apprentissage à la toxicomanie et à l’acquisition du langage. Cependant, le conditionnement opérant ne tient pas compte du rôle des facteurs héréditaires et cognitifs dans l’apprentissage et constitue donc une explication incomplète du processus d’apprentissage chez les humains et les animaux. Par exemple, Kohler (1924) a constaté que les primates semblent souvent résoudre les problèmes par un éclair de lucidité plutôt que par l’apprentissage par essais et erreurs. De même, la théorie de l’apprentissage social (Bandura, 1977) suggère que les humains peuvent apprendre automatiquement par l’observation plutôt que par l’expérience personnelle.
L’utilisation de la recherche animale dans les études de conditionnement opérant soulève également la question de l’extrapolation. Certains psychologues affirment que nous ne pouvons pas généraliser les études sur les animaux aux humains, car leur anatomie et leur physiologie sont différentes de celles des humains, et ils ne peuvent pas penser à leurs expériences et invoquer la raison, la patience, la mémoire ou l’autoconfort.
Questions fréquemment posées
Qui a découvert le conditionnement opérant ?
Le conditionnement opérant a été découvert par B.F. Skinner, un psychologue américain, au milieu du 20e siècle. Skinner est souvent considéré comme le père du conditionnement opérant, et ses travaux ont largement porté sur le mécanisme de récompense et de punition des comportements, le concept étant que les comportements suivis de résultats positifs sont renforcés, tandis que ceux suivis de résultats négatifs sont découragés.
En quoi le conditionnement opérant diffère-t-il du conditionnement classique ?
Le conditionnement opérant diffère du conditionnement classique, car il se concentre sur la manière dont le comportement volontaire est façonné et maintenu par les conséquences, telles que les récompenses et les punitions.
Dans le conditionnement opérant, un comportement est renforcé ou affaibli en fonction des conséquences qui en découlent. En revanche, le conditionnement classique implique l’association d’un stimulus neutre à une réponse naturelle, créant ainsi une nouvelle réponse apprise.
Alors que les deux types de conditionnement impliquent l’apprentissage et la modification du comportement, le conditionnement opérant met l’accent sur le rôle du renforcement et de la punition dans la formation du comportement volontaire.
Quel est le lien entre le conditionnement opérant et la théorie de l’apprentissage social ?
Le conditionnement opérant est une composante essentielle de la théorie de l’apprentissage social, qui souligne l’importance de l’apprentissage par observation et de la modélisation dans l’acquisition et la modification du comportement.
La théorie de l’apprentissage social suggère que les individus peuvent apprendre de nouveaux comportements en observant les autres et les conséquences de leurs actions, ce qui est similaire aux processus de renforcement et de punition dans le conditionnement opérant.
En observant et en imitant des modèles, les individus peuvent acquérir de nouvelles compétences et de nouveaux comportements et modifier leur propre comportement en fonction des résultats qu’ils observent chez les autres.
Dans l’ensemble, le conditionnement opérant et la théorie de l’apprentissage social soulignent tous deux l’importance des facteurs environnementaux dans la formation du comportement et de l’apprentissage.
Quels sont les inconvénients du conditionnement opérant ?
Les inconvénients de l’utilisation du conditionnement opérant sur les individus comprennent le risque de conséquences négatives involontaires, en particulier avec l’utilisation de la punition. En outre, certains comportements peuvent être difficiles à façonner ou à modifier à l’aide de techniques de conditionnement opérant, en particulier lorsqu’ils sont fortement ancrés ou liés à des états internes complexes.
En outre, les individus peuvent résister à l’idée de modifier leur comportement pour répondre aux attentes des autres, en particulier s’ils perçoivent les exigences ou les conséquences du renforcement ou de la punition comme indésirables ou injustes.
Quelle est une application de la théorie du conditionnement opérant de B.F. Skinner ?
Une application de la théorie du conditionnement opérant de B.F. Skinner est observée dans le domaine de l’éducation et de la gestion de classe. Les enseignants utilisent le renforcement positif (récompenses) pour encourager le bon comportement et la réussite scolaire, et le renforcement négatif ou la punition pour décourager les comportements perturbateurs.
Par exemple, un élève peut bénéficier d’une récréation supplémentaire (renforcement positif) s’il termine ses devoirs à temps, ou perdre le privilège d’utiliser les ordinateurs de la classe (punition négative) s’il se comporte mal.
Vidéo
Lecture complémentaire
- Ivan Pavlov Conditionnement classique Apprentissage et comportement PowerPoint
- Ayllon, T., & Michael, J. (1959). The psychiatric nurse as a behavioral engineer. Journal of the Experimental Analysis of Behavior, 2(4), 323-334.
Références
- Bandura, A. (1977).Théorie de l’apprentissage social. Englewood Cliffs, NJ : Prentice Hall.
- Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York : Appleton-Century-Crofts.
- Kohler, W. (1924). The mentality of apes. Londres : Routledge & Kegan Paul.
- Skinner, B. F. (1948). superstition’ in the pigeon. Journal of experimental psychology, 38(2), 168.
- Schunk, D. (2016). Théories de l’apprentissage : An educational perspective. Pearson.
- Skinner, B. F. (1938). Le comportement des organismes : Une analyse expérimentale. New York : Appleton-Century.
- Skinner, B. F. (1948). Superstition » chez le pigeon. Journal of Experimental Psychology, 38, 168-172.
- Skinner, B. F. (1951). Comment enseigner aux animaux. Freeman.
- Skinner, B. F. (1953). Science et comportement humain. Macmillan.
- Thorndike, E. L. (1898). Animal intelligence : Une étude expérimentale des processus associatifs chez les animaux. Monographies psychologiques : General and Applied, 2(4), i-109.
- Watson, J. B. (1913). Psychology as the behaviorist views it. Psychological Review, 20, 158-177.