A PROPOS DES PRINCIPALES FORMES D’APPRENTISSAGE.

Ce post a pour thème les renforcements et punitions au cours du processus d’apprentissage.

Il se décompose en plusieurs parties.

La première partie est consacrée  à l’énumération des différents types de renforcements et de punitions utilisés dans le processus d’apprentissage.

Les parties suivantes vous proposeront quelques extraits de textes écrits par des scientifiques sur ce sujet.

Les avis de certains auteurs divergent quant au sens qu’ils accordent aux termes de renforcement positif, renforcement négatif, et de punition.

Dans ce post, je prendrai comme référence, les auteurs qui envisagent les modalités d’interactions entre réponse et renforcement de la manière suivante :

Les 4 catégories du conditionnement opérant :

  1. Le renforcement positif : ajout de quelque chose d’agréable pour augmenter la probabilité qu’un comportement se produise.
  2. Le renforcement négatif : suppression d’une chose aversive pour augmenter la probabilité qu’un comportement se produise.
  3. La punition positive : ajout d’une chose aversive pour diminuer la probabilité qu’un comportement se produise.
  4. La punition négative : suppression de quelque chose d’agréable, pour diminuer la probabilité qu’un comportement se produise.

Il faut considérer les termes « positif » et « négatif » non pas avec une connotation de jugement de valeur mais simplement comme un moyen de préciser qu’un élément est ajouté (positif) ou supprimé (négatif).

Les théories du conditionnement opérant définies par le psychologue Burrhus Frederic Skinner(1904-1990) servent également de références théoriques aux éthologues, car les principes d’apprentissage sont les mêmes pour les animaux, tel le cheval, et pour les hommes.

Essayons d’associer à chaque catégorie de conditionnement un exemple concret . Prenons l’exemple d’un dresseur qui voudrait apprendre au travail à pied une levade à son cheval uniquement à la demande (sachant que ce dernier a déjà spontanément produit ce mouvement) :

  • Apprentissage par  renforcement positif : le dresseur met son cheval en liberté et décide de jouer avec lui. Au cours de cette séance, il cherche à déclencher un cabrer en stimulant son cheval soit par des bruits ou une gestuelle spécifique, lorsque le cabrer se produit celui-ci est   aussitôt  récompensé, par exemple, d’une friandise. 
    • Production spontanée d’un comportement (souhaité par le dresseur)=>récompense par ajout d’un élément agréable =>augmentation de la probabilité que le comportement se reproduise.
  • Apprentissage par renforcement négatif: le dresseur agit directement sur son cheval grâce à ses aides tactiles (badine derrière les postérieurs pour rassembler, et mains qui agissent par demi-arrêts sur les rênes pour déclencher l’élévation de l’avant main). Ces actions mettent le cheval dans un certain inconfort et, pour s’y soustraire, il va produire différentes réponses. Lorsque la bonne réponse est produite (levade), le dresseur cesse aussitôt ses actions, permettant ainsi à son cheval de retrouver du confort.
    • Production provoquée d’un comportement=>récompense par suppression d’une stimulation gênante=>augmentation de la probabilité que le comportement se reproduise.
                 
                                                                                                                    
  • Conditionnement par punition positive : le cheval se cabre sans y avoir été invité. Le dresseur agit de la cravache sur la croupe du cheval pour le porter en avant, ce qui le fait redescendre.  
    • Production spontanée d’un comportement (non souhaité par le dresseur)=>sanction par ajout d’un élément désagréable=>diminution de la probabilité que le comportement se reproduise.


  • Conditionnement par punition négative :  le cheval se cabre sans y avoir été invité. Le dresseur ne donne aucune récompense pour ne pas encourager le cheval à recommencer.
    •  Production spontanée d’un comportement (non souhaité par le dresseur)=>sanction par suppression d’un élément agréable=>diminution de la probabilité que le comportement se reproduise.
A suivre…

Leave a Reply