Principaux enseignements
- Le principe de Premack, également appelé théorie de la relativité du renforcement et hypothèse de la probabilité différentielle, stipule qu’une activité plus désirable (par exemple, manger du chocolat) peut être utilisée pour renforcer une activité moins désirable (par exemple, rédiger une dissertation).
- David Premack a établi sa théorie à partir d’expériences menées sur des rats, des enfants et, plus tard, des chimpanzés.
- Bien que le principe de Premack ait été critiqué pour un certain nombre de raisons, son dérivé, la théorie de la privation de réponse, conserve une grande influence dans la psychologie de l’apprentissage.
Origines
Le principe de Premack stipule que les comportements plus probables renforcent les comportements moins probables. Le comportement en lui-même peut renforcer le comportement, et la présence d’un comportement très probable peut rendre plus probable un comportement peu probable.
Par exemple, un jeune enfant peu studieux peut être incité à faire ses devoirs (un comportement normalement peu probable) si ses parents lui disent qu’il pourra ensuite aller au parc (une activité que l’enfant a probablement envie de faire seul).
Inversement, le C prédit que la présence d’un comportement très fréquent au-dessus de la ligne de base découragera le comportement peu fréquent. Ainsi, pour reprendre l’exemple des devoirs, un enfant autorisé à aller au parc de manière excessive est moins susceptible de faire ses devoirs (Knapp, 1974).
Avant le principe de Premack, les béhavioristes pensaient que les renforçateurs avaient une nature dite trans-situationnelle, et que quelque chose qui est un renforçateur dans un contexte donné sera toujours un renforçateur. Par exemple, un pigeon conditionné à rechercher des boulettes verra toujours les boulettes comme un renforçateur, quelle que soit leur abondance.
En revanche, le point de vue de Premack établit que les animaux ont une préférence pour l’ordre des réponses, et que les réponses les plus fortes renforceront les réponses les plus faibles (Knapp, 1974).
Les recherches de Premack sur le principe de Premack sont nées de ses travaux de 1959 sur l’effet « différentiel de taux » ou « différentiel de probabilité ».
L’effet probabilité-différence stipule que « toute réponse A renforcera toute réponse B, si et seulement si le taux indépendant de A est supérieur à celui de B »
En d’autres termes, une réponse qui se produit à un taux élevé peut renforcer une réponse qui se produit à un taux faible. Par exemple, selon cet effet de probabilité différentielle, un rat continuera à courir dans une roue où il est récompensé par de l’eau si et seulement si la probabilité que le rat boive de l’eau est plus grande que celle que la roue tourne (Premack, 1961).
L’effet probabilité-différence a trouvé des applications telles que l’augmentation de la probabilité que les personnes souffrant de troubles du développement fassent de l’exercice en subordonnant l’accès aux jeux (une réponse à taux élevé) à la pratique de l’exercice (Allen et Iwata, 1980).
Premack (1965), à la suite de ses premières recherches sur l’effet différentiel de probabilité, a constaté que cet effet s’accompagnait d’un autre : lorsque la possibilité d’adopter un comportement à forte probabilité renforce un comportement à faible probabilité, le taux du comportement à forte probabilité diminue en lui-même (en raison de l’obstacle que constitue l’activité à faible probabilité), ce qui encourage la possibilité d’adopter le comportement à forte probabilité.
C’est ce qu’on appelle la réduction de la réponse. Toute réponse A peut renforcer une réponse B si le taux de A est inférieur à sa valeur de référence, quelle que soit la réponse la plus fréquente (Mazur, 1975 ; Timberlake et Allison, 1974).
Par exemple, dans une expérience menée par Eisenberger et ses collaborateurs, les personnes chargées de faire tourner une roue étaient plus susceptibles d’appuyer sur une barre si la vitesse de rotation de la roue était supprimée en dessous de sa valeur de référence, quelle que soit la fréquence de rotation de la roue par rapport à celle de l’appui sur la barre (1967).
Cette idée de suppression de réponse a ensuite évolué vers la privation de réponse (Timberlake et Allison, 1974), qui a trouvé un certain nombre d’applications dans la modification du comportement humain.
Par exemple, Dougher (1983) a constaté que la privation de réponse consistant à boire une boisson préférée pouvait augmenter le comportement socialement approprié chez les adultes diagnostiqués schizophrènes lorsque l’accès à la boisson dépendait de ce comportement social approprié (Klatt et Morris, 2001).
Exemples
Apprentissage du langage chez les chimpanzés
Dans son article fondateur de 1971, Language in Chimpanzees, David Premack s’est demandé s’il était possible d’enseigner le langage aux grands singes. Premack estimait qu’il s’agissait d’une question importante, non seulement d’un point de vue biologique, mais aussi en ce qui concerne la question fondamentale de la nature du langage.
Premack aborde cette question de deux manières parallèles : en dressant une liste d’exemples et en créant une liste correspondante d’instructions pour former les organismes afin qu’ils puissent apprendre ces exemples.
Premack (1971) a défini les exemples comme des aspects des mots, des phrases, des questions et de l’utilisation du langage pour enseigner le langage ; des concepts de classe décrits par le langage tels que la couleur, la forme et la taille ; la copule, qui, en linguistique, est le mot ou la phrase qui relie les sujets aux compléments de sujet (comme est dans « Le chat est duveteux ») ; et le connecteur logique si-alors.
Premack a tenté d’enseigner le langage aux chimpanzés Cebus à l’aide de morceaux de plastique à support métallique adhérant à des ardoises magnétisées.
Les dresseurs nourrissaient les chimpanzés et introduisaient progressivement les pièces du système linguistique jusqu’à ce que les chimpanzés placent la pièce de plastique sur une « planche de langage »
Les dresseurs ont donné aux chimpanzés différents types de fruits en fonction de la partie du discours que le mot représentait. Premack a ensuite tenté de vérifier si les chimpanzés avaient formé une association entre les objets en plastique et les parties du discours qu’ils représentaient à l’aide de deux tests différents.
Les chercheurs ont constaté que les chimpanzés savaient quel mot allait avec chaque fruit.
Les chercheurs ont modifié les donneurs de fruits de manière à ce que chaque changement de donneur soit associé à un changement de l’élément de la deuxième langue donné au chimpanzé.
Par exemple, pour recevoir une pomme en présence de Mary, le chimpanzé devait signaler « Mary apple », et pour recevoir une pomme en présence de Randy, le chimpanzé devait signaler « Randy apple » et non pas « Mary apple » ou « apple Randy »
Finalement, le chimpanzé de l’article de Premack de 1971 a été capable de construire la phrase « Mary donne une pomme à Sarah » (ce qui aurait permis au chimpanzé d’obtenir la pomme) et « Mary donne une pomme à Gussie » (ce qui aurait permis à un autre chimpanzé d’obtenir la pomme).
Premack (1971) a ensuite utilisé son étude sur le chimpanzé pour tester l’hypothèse selon laquelle l’acquisition du langage est la mise en correspondance de connaissances existantes. Les chercheurs ont placé des binômes devant les chimpanzés et ont tenté de leur apprendre la différence entre les mots « même » et « différent »
Là encore, le chimpanzé était largement capable de faire la différence entre des objets identiques et différents. Les chercheurs ont ensuite posé au chimpanzé des questions de type « oui-non », telles que « X est-il différent de X ?
En outre, Premack (1971) a pu introduire des concepts tels que la couleur, la forme, la taille, etc. grâce à ce renforcement.
L’article de Premack de 1971 a renforcé le principe de Premack dans la mesure où les chercheurs ont utilisé un comportement à forte probabilité (un chimpanzé voulant manger différents types de fruits) pour renforcer un comportement à faible probabilité (le chimpanzé apprenant les principes fondamentaux du langage).
Perte de poids
Les chercheurs ont testé le principe Premack dans un certain nombre d’applications cliniques.
Dans l’une de ces études, Horan et Johnson (1971) ont recruté 96 étudiantes volontaires et les ont réparties au hasard dans l’un des quatre groupes de traitement : un groupe témoin et trois groupes expérimentaux avec trois entretiens de conseil d’une demi-heure au cours desquels les participantes devaient identifier un comportement spécifique hautement probable (tel que « s’asseoir sur une chaise particulière ») et réfléchir à une paire d’associations négative-positive spécifique associée au surpoids (telle que « une durée de vie plus courte » et « des vêtements qui tombent mieux »).
Les chercheurs ont constaté que les personnes invitées à appliquer le principe de Premack perdaient beaucoup plus de poids que le groupe témoin ou que les personnes invitées à simplement penser à la paire d’associations négatives-positives tout au long de la journée (Horan et Johnson, 1971).
Recherches complémentaires
Les premières études de Premack sur les rats
Dans une étude antérieure, Premack (1963) a contrôlé les taux de base des rats en matière de consommation d’alcool (fréquence à laquelle ils lèchent un buvomètre) et de course (nombre de rotations de la roue).
Premack a constaté que des périodes de temps plus longues passées à boire renforçaient des périodes de temps plus longues passées à courir et vice-versa. Premack a utilisé trois concentrations différentes de sucre dans la solution de boisson (64 %, 32 % et 16 %) et deux niveaux de difficulté différents pour courir dans la roue d’activité (avec un poids de 18 ou de 80 grammes).
En observant des rats dans une situation de « choix libre », il a constaté l’ordre de préférence suivant (Allison, 2019) :
16 % de boisson > 32 % de boisson > courir avec un poids de 18 grammes > 64 % de boisson > courir avec un poids de 80 grammes.
Au total, Premack a mené une expérience avec cinq groupes de rats dont l’une des réponses précédentes était un renforçateur pour l’actionnement d’un levier.
Conformément au principe de Premack, les résultats ont révélé que le nombre moyen de réponses au levier par session de 10 minutes par les rats dépendait de la réponse utilisée comme renforçateur.
Lorsque la préférence pour la deuxième réponse augmente, la performance d’une réponse apprise augmente également. Alors que les rats ayant reçu une brève course dans la roue lourdement lestée ont appuyé sur le levier environ 20 fois par session, ceux ayant reçu une boisson contenant 16 % de saccharose ont appuyé sur le levier environ 37 fois par session (Allison, 2019).
Cette théorie s’applique également à la punition. Premack affirme que la punition implique une situation dans laquelle une réponse plus préférée est suivie par l’exigence que quelqu’un s’engage dans une réponse moins préférée.
Par exemple, un rat buvant la solution de saccharose à 16 % serait puni s’il était ensuite contraint de courir sur une roue lourdement lestée. Premack a établi dans d’autres études qu’un système de punition diminue le temps pendant lequel l’animal fait une réponse préférée. Ainsi, toute réponse peut renforcer une réponse plus faible mais punir une réponse plus forte (Allison, 2019).
Cependant, les chercheurs ont depuis critiqué la méthodologie de Prremack. Par exemple, le plan expérimental mesurait si la réponse de course était évoquée indépendamment de la consommation d’alcool, s’il s’agissait d’un effet de l’autre comportement ou s’il existait des réponses connexes, telles que l’approche de l’abreuvoir.
Cela conduit à un problème récurrent dans les études de Premack : alors que la privation semble nécessaire pour que le comportement le moins probable se produise, cet effet n’est souvent pas mesuré (Klatt et Morris, 2001).
L’étude de Premack sur les élèves de première année
Premack a observé des élèves de première année dans une situation où ils devaient choisir entre des distributeurs de bonbons et des flippers.
Les chercheurs ont établi les préférences de chacun des enfants, qui ont ensuite été identifiés comme joueurs ou mangeurs. Les chercheurs ont ensuite séparé les enfants en quatre groupes, qui ont établi une contingence entre le distributeur de bonbons et la réponse au flipper, afin de déterminer si le comportement des enfants pouvait être modifié.
Les chercheurs ont prédit, conformément au principe de Premack, que manger serait un renforçateur pour les mangeurs et que jouer serait un renforçateur pour les joueurs, mais pas l’inverse (Allison, 2019).
Groupe | Préférence | Tâche d’apprentissage |
---|---|---|
1a | joueur | distributeur de bonbons puis possibilité d’utiliser le flipper |
1b | joueur | flipper suivi d’une possibilité d’utiliser le distributeur de bonbons |
2a | Mangeur | distributeur de bonbons suivi d’une possibilité d’utiliser le flipper |
2b | Mangeur | flipper suivi d’une possibilité d’utiliser le distributeur de bonbons |
Conformément aux prédictions du principe de Premack, les chercheurs ont constaté qu’il existait un effet de congruence lorsque le succès de l’apprentissage différait entre les deux types d’enfants.
Seuls les enfants des groupes 1a et 2b étaient plus susceptibles d’adopter leur comportement non préféré qu’auparavant, tandis que les deux autres groupes réagissaient autant à la première machine que lors de la session de préapprentissage (Allison, 2019).
Évaluation critique
Bien que le principe de Premack ait suscité un grand intérêt dans des domaines tels que l’éducation (Allison, 2019), les universitaires l’ont supplanté par d’autres théories en raison de plusieurs prédictions apparemment incohérentes.
Souvent, le principe de Premack peut prédire l’apprentissage d’une manière qui contredit les données expérimentales. Par exemple, Timberlake et Allison (1974) ont noté que les réponses plus faibles peuvent parfois sembler renforcer les réponses plus fortes et que les réponses plus fortes ne renforcent parfois pas une réponse plus faible.
En outre, il peut y avoir d’autres caractéristiques de la situation qui ne sont pas couvertes par le principe de Premack, où le type d’apprentissage qui se produit dépend de la vitesse relative à laquelle chaque réponse doit être exécutée pour pouvoir faire l’autre.
Enfin, certains événements qui ne sont pas considérés comme des réponses en soi peuvent également modérer les comportements qui s’ensuivent. Par exemple, les chocs peuvent punir un comportement, mais ils ne constituent pas des réponses instrumentales que les animaux adoptent (Staddon et Ettinger, 1989).
Théorie de la privation de réponse
En réponse à ces objections, Timberlake et Allison (1974) ont développé l’hypothèse de la privation de réponse. La privation de réponse est un élément de l’établissement des opérations.
Selon l’hypothèse de la privation de réponse, une réponse faible peut devenir un renforçateur d’une réponse plus forte par le biais de la privation, et la plupart des études sur l’apprentissage instrumental menées par Premack comportaient un élément de privation.
Par exemple, dans l’expérience avec le flipper et les distributeurs de bonbons, les joueurs qui préféraient manger des bonbons dans un groupe étaient privés de manger en devant jouer en premier.
Pour prendre un autre exemple de l’hypothèse de la privation de réponse, les chercheurs peuvent priver un rat de la capacité de courir. Même si la course n’est pas la réponse préférée du rat, celui-ci augmentera sa vitesse de course par rapport à la ligne de base lorsqu’il sera à nouveau capable de courir.
Modifiant le principe de Premack, l’hypothèse de la privation de réponse généralise le fait qu’un animal effectuera une activité non privative ou moins privative afin de pouvoir effectuer une activité plus privative.
L’idée de l’approche d’Allison et Timberlake (1974) est que les animaux en situation de libre choix sont dans un état d’équilibre, capables de s’engager dans des activités aux niveaux préférés, ce que les chercheurs appellent les « bliss points » (points de félicité).
Le fait d’être au-dessus ou au-dessous d’un point de félicité peut déclencher des réponses appétitives ou aversives. Dans l’une des expériences d’Allison et Timberlake sur les rats, les rats ont tendance à boire la solution sucrée 60 % du temps et la solution sèche 40 % du temps lorsqu’ils sont en situation de libre choix.
Cependant, lorsque les chercheurs ont placé les rats dans une situation où ils devaient boire la solution sucrée dix fois plus vite que la solution sèche, ils ont effectivement forcé les rats à atteindre un niveau inférieur à leur point de félicité, ce qui a motivé les rats à faire des choses qui leur permettraient de boire plus de solution sèche, même si ce n’est pas ce qu’ils préfèrent dans une situation de libre choix (Allison, 2019)