Overblog Suivre ce blog
Editer l'article Administration Créer mon blog

Recherche

27 mai 2010 4 27 /05 /mai /2010 10:08

En ce moment, je m'intéresse beaucoup à la notion de jackpot et à son utilité dans l'apprentissage.

104B9970.jpg

Je me suis donc replongée dans Don't shoot the dogde Karen Pryor (le livre fera le sujet d'un article plus tard) et voilà ce que j'ai retrouvé.

"Une des techniques les plus efficaces, avec la nourriture ou n’importe quel autre renforcement, pour les animaux ou pour les gens, est le jackpot. Le jackpot est une récompense qui est beaucoup plus grosse, par exemple dix fois plus grosse, que le renforçateur normal et qui survient comme une surprise pour le sujet. (...)

Un jackpot peut être utilisé pour signaler une soudaine amélioration. Voilà ce que fait l’un des entraîneurs de chevaux de ma connaissance : quand un jeune cheval exécute une manœuvre difficile pour la première fois, il descend de son dos, enlève la selle et le filet et laisse le cheval libre dans la carrière : un jackpot de liberté totale qui semble souvent rendre le nouveau comportement effectif.

Paradoxalement, un simple jackpot peut parfois être efficace pour améliorer la réponse d’un sujet récalcitrant, peureux ou résistant, qui n’offre aucun comportement désirable. Au parc de Sea Life, nous travaillions pour les chercheurs de la Navy, en essayant de renforcer un dauphin pour des nouvelles réponses, au lieu des comportements anciens et déjà entraînés. Notre sujet était un animal docile nommé Hou qui proposait rarement de nouvelles réponses. Quand elle n’arrivait pas à être renforcée pour ce qu’elle proposait, elle devenait inactive et au final elle restait 20 minutes sans rien proposer du tout. L’entraîneur lui a finalement donné 2 poissons pour « rien ». Visiblement ébahie par ces largesses, Hou redevint active et fit très vite un mouvement qui pouvait être renforcé. Ce qui conduisit à un réel progrès pour la session suivante."

 

Ainsi le jackpot doit répondre à plusieurs conditions:

-Une qualité/quantité exceptionnelle par rapport à la récompense utilisée durant l'exercice.

-Un caractère surprenant : autrement dit l'animal ne doit pas savoir que ce comportement en question apportera un jackpot.

-Une rareté relative: un jackpot distribué trop souvent perdra de sa force de renforcement. Il faut rester dans ce qu'on appelle un schéma de renforcement aléatoire.

 

Pourquoi un jackpot?

 

Récemment, je travaillais avec Obi sur la caisse de transport en free shaping. Comme j'aime le shaping bien détaillé, bien découpé, j'ai une tendance à cliquer beaucoup avec une petite récompense à chaque fois. Je place donc Obi devant la caisse et clique le premier coup d'oeil qu'il y jette. Je projette de morceler ainsi le comportement d'entrer dans la caisse jusqu'à ce qu'il mette la tête à l'intérieur. Problème: les dernières séances de shaping ont consisté en: monter sur un objet/mettre la patte sur un objet. Le premier comportement ayant obtenu un renforcement très fort, c'est celui qu'il me propose le plus. Je ne clique rien. S'ensuivent les aboiements et geignements de frustration qu'il fait si bien. Il passe ensuite au comportement deux, la patte. Ce qui fait qu'en 2 minutes je ne clique que 14 fois. Il finit par mettre la tête dans la caisse.Je donne deux récompenses au lieu d'une. Jackpot pensais-je! La suite prouva que non!

Il repart dans son comportement de patte.Je décide de baisser mon critère et d'augmenter la dose de récompenses. Bingo. Il finit par entrer et là gros jackpot: une poignée entière de récompenses dans la caisse.

 

Mes erreurs sur cette séance furent nombreuses:

-J'ai confondu récompenses et jackpot

-Je n'ai pas tenu compte de l'historique de renforcement de comportements autres que celui désiré.

-J'ai oublié que Obi était un chiot et pas un chien expérimenté comme peuvent l'être Cirius et Voltaire.

-J'ai voulu augmenter mon critère trop vite sans assurer le précédent

-La séance a duré trop longtemps (7 minutes)

 

Bref beaucoup de conclusion à tirer de cette séance pour améliorer les prochaines.

 

Un conseil filmez vous quand vous cliquez, c'est extremmement formateur!

 

 

Je vais aller reprendre mes autres bouquins pour voir ce que je peux y trouver et je vous tiens au courant!

 

 

 

 

Partager cet article

Repost 0
obiblog.over-blog.fr - dans Apprentissage
commenter cet article

commentaires

Marie 27/05/2010 22:11



Le livre Don't shoot the dog existe t-il en français??



Pauline 28/05/2010 10:05



Malheureusement non. Mais il se lit très bien en anglais, avec de bonnes bases.



Marie 27/05/2010 22:08



Autre question : est-il possible que lorsqu'il a fini de mettre sa tête dans la caisse, le fait de lui donner un jakpot et non seulement deux récompenses auraient changé sa réaction suivante, à
savoir repartir dans son comportement de patte?



Pauline 28/05/2010 10:04



Je pense que oui mais ça reste incertain. Question Jackpots j'ai remarqué qu'il préfère que je lui balance le tout par terre, bien éparpillé. Il adore chercher les récompenses. J'aurai dû jeter
une poignée dans la caisse je pense que ça aurait beaucoup aidé, en donnant en plus une forte valeur à la caisse (qu'on a fini par obtenir mais après 5 minutes de plus)



Marie 27/05/2010 22:03



Bonsoir Pauline,


J'ai trouvé ton article très intéressant et je rencontre ce problème avec Véra sur un exercice.


Je me posais la question suivante : qu'as-tu fait concrètement pour rabaisser ton critère? Quel mouvement as-tu choisi pour augmenter les friandises sans atteindre le jakpot?


 


J'ai tendance à trop renforcer un comportement sur certains exercices. Je lui ai appris à tourner autour d'une chaise dans un certain sens et maintenant, je n'arrive pas à le lui faire faire dans
l'autre sens tellement que j'ai renforcé dans un sens.



Pauline 28/05/2010 10:02



Dans le cadre de l'exercice, j'ai recompensé tout mouvement/regard vers la caisse qui ne tendait pas vers monter sur la caisse/mettre la patte sur la grille. J'ai augmenté les nombres de clics
et  de récompenses.


Pour tourner dans l'autre sens autour de la chaise, j'ai eu ce problème avec Volt. Il est très peu sur de lui et reste dans un renforcement ancien, dont il est certain qu'il fonctionne, plutôt
que de se lancer dans l'aventure du nouveau comportement!


Il m'a fallu plusieurs séances. Premièrement, je n'ai plus cliqué aucun mouvement qui correspondait à l'ancien comportement. C'est dur pour le chien qui est habitué à être toujours renforcé pour
ce mouvement. Volt s'est mis à aboyer de frustration sans plus bouger. Je l'ai appelé à moi et on est reparti!J'ai "triché" si on peut dire, en bougeant du côté où je voulais qu'il aille. Avec le
recul, je donnerai un énorme jackpot pour le premier mouvement dans cette direction. Je ne l'ai pas fait à ce moment là et je pense que ça a beaucoup ralenti le processus.


Je pense que tricher, dans le sens où on leurre, n'est pas grave, au contraire. Il faut parfois débloquer le chien, surotut quand il n'est pas expérimenté. Un chien qui a plus de bouteille
changera très vite de comportement. Pour aider un chien non expérimenté, j'utiliserai l'exercice de la boite, avec comme règle de ne jamais cliquer deux fois de suite le même comportement.
Cela rend le chien plus sur de lui et l'oblige à renouveller sans cesse son répertoire.


Il faut voir le tempérmanet de chaque chien pour savoir comment procéder. Je tatonne beaucoup, même avec Volt