Keep Pet >> Animaux >  >> chiens >> Entraînement

Comprendre le dressage de chiens basé sur la récompense

L'élégante dame d'âge moyen descendit vivement le tapis en caoutchouc du centre d'entraînement, son Labrador Retriever noir rebondissant joyeusement à ses côtés. Elle s'arrêta en douceur et Skip s'assit rapidement à côté d'elle, dans une position de talon parfaite. "Oui!" Je me suis dit, puis j'ai grimacé lorsque Carla s'est penchée et a tapoté Skip sur la tête avec enthousiasme. Skip se leva d'un bond et s'éloigna de son humain.

"Carla," dis-je doucement. "Vous venez de le punir pour s'être assis droit." Le visage de Carla s'assombrit. "Mince!" s'exclama-t-elle. "Pourquoi est-ce que je ne m'en souviens pas !"

Comprendre le dressage de chiens basé sur la récompense

Attendez une minute . . . Depuis quand caresser un chien est-il considéré comme une punition ? Depuis que Skip nous a fait savoir en baissant la tête et en s'éloignant de la main de Carla qu'il n'aimait pas se faire caresser. Tous les autres laboratoires que Carla avait possédés et formés tout au long de sa vie avaient adoré être touchés en guise de récompense. Carla a caressé son chien pour être bon sans même y penser - c'était une réponse bien conditionnée. Malheureusement, puisque Skip n'aimait pas être touché, chaque fois qu'elle le lui faisait, elle le punissait en fait, diminuant ainsi la probabilité qu'il réalise à nouveau cette position assise parfaite !

Les décisions d'un chien dans la vie et les comportements qui en résultent dépendent du fait qu'un comportement particulier donne quelque chose qu'il aime (une récompense) ou quelque chose qu'il n'aime pas (une punition). La formation consiste simplement à manipuler les récompenses et les punitions de manière réfléchie. . . Mais vous devez connaître votre chien - être parfaitement conscient de ses goûts et de ses aversions - et être conscient de votre propre comportement pour que le " dressage " fonctionne pour vous.

Récompenses et punitions
Dans les années 1950, le spécialiste du comportement B.F. Skinner a développé un certain nombre de principes applicables à tous les êtres vivants dotés d'un système nerveux central. Il a constaté que les animaux sont susceptibles de répéter des comportements qui leur sont agréables/gratifiants, et peu susceptibles de répéter des comportements qui entraînent quelque chose de désagréable (punition). Les stimuli neutres - des choses qui n'ont pas d'importance pour l'animal - n'ont pas d'impact sur le comportement dans un sens ou dans l'autre.

Skinner a démontré que les humains peuvent utiliser ces principes simples pour modifier le comportement d'un animal. Les récompenses sont le moyen le plus fiable d'augmenter délibérément les comportements offerts par un animal ; à l'inverse, la punition diminue ces comportements. (Voir « Les quatre principes du conditionnement opérant », à la fin de l'histoire). Nous utilisons ces principes comportementaux dans le dressage des chiens avec beaucoup de succès.

Cependant, comme pour Skip, l'application pratique des « récompenses » et des « punitions » varie d'un chien à l'autre, même si la définition ne le fait pas. Une récompense est tout ce qu'un chien en particulier aime. Une punition est tout ce que le chien n'aime pas.

Nous utilisons fréquemment des friandises comme récompense lors de l'entraînement, car nous pouvons presque toujours trouver de la nourriture qu'un chien appréciera suffisamment pour qu'elle puisse servir de récompense irrésistible, mais la nourriture n'est pas la seule récompense à notre disposition. N'oubliez pas qu'une récompense est tout ce qu'un chien aime. Cela pourrait être une tape sur la tête (mais pas pour les chiens comme Skip, qui n'aiment pas être touché), des éloges verbaux, un jeu de tir à la corde, une poursuite après un bâton ou une balle de tennis, une promenade en laisse , un trajet en voiture, l'autorisation de sauter sur le canapé, le signal pour exécuter un parcours d'agilité, la libération d'une "attente" pour courir dans la cour, l'autorisation d'aller sauter dans le lac ou le signal pour arrondir un troupeau de moutons.

Lorsque le maître-chien moyen et inexpérimenté entend le mot «punition», il pense généralement à des formes manifestes de punition physique, telles que frapper, pincer ou donner des coups de pied au chien, ou secouer la laisse. Je ne recommande ni n'utilise de châtiment corporel, car cela met en danger le maître-chien, nuit à la relation avec son chien et peut détruire l'enthousiasme du chien pour l'entraînement. Heureusement, la punition physique n'est pas le seul moyen d'éliminer un comportement indésirable.

N'oubliez pas que les comportementalistes définissent le mot «punition» comme tout ce qui amène un animal à diminuer un certain comportement. Ainsi, dans le cas de Skip, le laboratoire qui n'aimait pas être touché, une tape sur la tête après avoir effectué une position assise droite suffisait à le faire cesser de faire ces positions assises droites.

Les « formateurs positifs » - les personnes qui se sont engagées à s'entraîner sans recourir à la douleur, à la peur, à la force ou à l'intimidation - utilisent souvent certaines formes de « punition » (au sens comportemental) pour atteindre leurs objectifs d'entraînement. Par exemple, lorsqu'un chien qui a soif de contact physique et d'attention saute sur le dresseur, il lui tourne le dos et s'éloigne, supprimant à la fois son attention (contact visuel et interaction) et la possibilité d'un contact physique avec le chien. Ce sont les récompenses que le chien recherche en sautant. Lorsque le comportement de saut du chien continue d'entraîner la perte de quelque chose qu'il veut vraiment, il arrête de sauter - surtout lorsque cette "punition" est associée à la "récompense" de l'attention, des friandises et des caresses pour s'être assis tranquillement.

Ce qui constitue réellement une punition ou une récompense pour un chien donné est donc une affaire individuelle; en termes de comportement, le contexte est primordial.

Entraînement involontaire
L'entraînement est donc l'utilisation intentionnelle de récompenses et de punitions pour manipuler délibérément le comportement d'un chien. Ce qui est parfois difficile à retenir, c'est le fait que les chiens apprennent tout le temps, que nous soyons attentifs ou non. Les gens sont souvent perplexes quant à la raison pour laquelle leurs chiens font certaines des choses qu'ils font ou ne font pas ce que les gens veulent qu'ils fassent.

C'est en fait assez simple. Les chiens font ce qui fonctionne pour eux; ils ne font rien à moins qu'ils n'en retirent quelque chose.

Les chiens font des choses que nous considérons comme des "comportements inappropriés", parce que c'est amusant, que ça fait du bien ou que ça a bon goût. Du point de vue d'un chien, les comportements inacceptables pour nous, comme aller à la poubelle, chasser les chats ou dormir sur le canapé, sont tout simplement amusants !

Les propriétaires frustrés disent souvent à leurs dresseurs :« Il sait qu'il n'est pas censé faire ça ! Je le punis quand il le fait, mais il le fait quand même. Pourquoi?" Parfois, le plaisir que le chien tire de ce comportement l'emporte sur la "punition" du propriétaire. Un chien qui est très excité par l'expérience de chasser un chat par-dessus la clôture du jardin peut ne pas se soucier un peu de se faire crier dessus.

Dans d'autres cas, la "punition" peut en fait être gratifiante pour le chien. Par exemple, un Labrador bruyant qui se fait crier dessus, frapper ou même donner des coups de pied pour avoir sauté sur son propriétaire peut ne pas avoir la moindre idée que crier, frapper et donner des coups de pied est censé être une punition. Pour les chiens qui ont soif d'attention et qui aiment le contact physique avec les gens, ce traitement brutal est simplement une invitation à jouer à un jeu agréable (gratifiant).

De plus, les propriétaires de chiens peuvent ne pas se rendre compte qu'ils punissent souvent sans réfléchir un chien pour avoir fait la bonne chose. Si vous le faites assez fréquemment, vous "entraînerez" par inadvertance votre chien à cesser d'offrir les comportements que vous souhaitez.

Considérez la femme dont le chien s'amuse bien avec des copains canins au parc à chiens. Il est temps de partir, alors elle appelle son chien. Il quitte immédiatement ses copains de jeu et se précipite vers elle. "Bon chien!" s'exclame-t-elle, et claque sa laisse, l'emmenant du parc. À son avis, les éloges verbaux étaient une récompense suffisante et le fait de quitter le parc n'a aucun lien avec le rappel. Mais voici comment le chien le voit :« Maman a appelé, je suis venu et la fête est finie. Quand je viens voir maman, une mauvaise chose se produit - le plaisir s'arrête. Il y pensera probablement à deux fois avant de venir la prochaine fois qu'elle l'appellera pendant qu'il joue avec des amis !

Beaucoup de gens ont beaucoup de mal à entraîner leur chien à venir de manière fiable lorsqu'il est appelé. Peut-être n'ont-ils pas suffisamment réfléchi à ce qui arrive au chien la plupart du temps après sa venue. Il ne faut pas un Einstein canin pour se rendre compte que venir quand on l'appelle est une mauvaise idée si quelque chose de "mauvais" lui arrive constamment immédiatement après - disons, il est enfermé dans le sous-sol ou enfermé loin de tous les invités dans la cuisine, ou jeté dehors sous la pluie froide.

L'entraînement peut également échouer lorsque la récompense n'est pas assez précieuse pour motiver le chien à se donner la peine d'essayer de l'obtenir. Vous devez programmer une réponse automatique au signal « venez » avec une récompense de grande valeur en l'absence de distractions attrayantes avant d'essayer de l'appliquer face à des écureuils fringants. Rares sont les chiens qui quitteront une chasse à l'écureuil pour venir gagner une croquette sèche ! De nombreux entraîneurs positifs utilisent une variété de récompenses attrayantes et les mélangent. Ensuite, le chien n'est jamais sûr de l'importance de la « récompense » pour son bon comportement ; il sait juste que ce sera bien.

Si vous doutez que mélanger de petites récompenses (comme des félicitations verbales, une tape ou un morceau de croquette sèche) avec des récompenses plus importantes (comme des morceaux de viande fraîche, courir après une balle ou être libéré pour courir librement) est un puissant facteur de motivation, pensez à la machine à sous. Tant qu'il rapporte un mélange d'aucune récompense, de petites récompenses et seulement un jackpot occasionnel, les joueurs humains continueront à s'asseoir et à tirer sur la poignée, bien après le moment où cela aurait du sens !

Actes aléatoires de renforcement
Avoir une variété de récompenses dans votre trousse d'outils d'entraînement vous donne une plus grande flexibilité et vous permet d'entraîner votre chien sans toujours avoir une énorme réserve de friandises dans votre poche. Un bon programme d'entraînement évolue vers un renforcement variable une fois que le chien exécute de manière fiable un nouveau comportement. Au lieu de cliquer et de donner une friandise au chien à chaque fois qu'il exécute le comportement, vous sautez de temps en temps un clic et félicitez le chien à la place, puis demandez à nouveau le comportement et cliquez sur le suivant. Augmentez progressivement la variation et la durée du programme de renforcement, en vous rappelant que le caractère aléatoire est important.

Si vous continuez simplement à faire travailler votre chien de plus en plus dur pour un clic, il est susceptible de vous abandonner. Si vous modifiez le programme de renforcement, comme une machine à sous de Las Vegas, il ne peut pas prédire quand vous paierez. Aurai-je un clic cette fois ? Ce temps? Ce temps? Cliquez sur! Tout comme les gens continueront à insérer des quartiers, votre chien continuera à proposer des comportements avec enthousiasme, sûr que le prochain remportera le jackpot.

Pour maintenir son enthousiasme à mesure que vous allongez progressivement le programme de renforcement, utilisez d'autres récompenses pour lui faire savoir qu'il est toujours sur la bonne voie. J'utilise fréquemment "Bon chien !" comme éloge après avoir cliqué et traité, de sorte que mes chiens associent la même sensation chaleureuse et floue d'obtenir une récompense alimentaire avec l'éloge verbal. Ensuite, lorsque j'utilise l'éloge verbal même sans le clic et la friandise, ils ont toujours la même réponse conditionnée classiquement de l'association de l'éloge avec la nourriture, et cela les fait se sentir bien. Ainsi, "Bon chien!" devient une récompense utile même sans nourriture.

D'autres récompenses peuvent créer davantage d'interruption dans le jeu d'entraînement. Si vous utilisez un jouet comme récompense, vous devez vous arrêter et laisser votre chien jouer avec pendant un moment. Cela peut très bien fonctionner pour l'amplifier sur l'échelle de l'enthousiasme, en particulier pour un chien qui est fou de balle ou qui aime tirer. Cela ne fonctionne pas bien lorsque vous voulez faire beaucoup de répétitions d'un comportement discret à la suite. Si vous lancez la balle à chaque fois qu'il répond à votre signal « vers le bas », il vous faudra beaucoup de temps pour faire une demi-douzaine de répétitions. Cela fonctionne bien comme récompense pour un comportement prolongé, tel que le talon. Un chien fou de ballon peut apprendre à marcher au pied avec une attention parfaite pendant de longues périodes en prévision de la poursuite du ballon qui se produit à la fin.

Le timing est essentiel
Il est important pour un programme de dressage réussi de comprendre ce que votre chien aime et n'aime pas, et d'utiliser efficacement ces récompenses et punitions. Pour être efficaces, les conséquences - bonnes ou mauvaises - doivent être livrées à proximité dans le temps du comportement que vous essayez d'influencer.

Dites à votre chien de vous renverser sur la poubelle de votre cuisine pendant que vous êtes au travail. Si vous le réprimandez lorsque vous rentrez du travail, quelques heures après la descente aux ordures, cela ne fait qu'apprendre à votre chien que vous êtes parfois imprévisible et dangereux lorsque vous rentrez à la maison. Peu importe à quel point il a l'air «coupable» lorsque vous le grondez, il ne fait aucun lien entre votre comportement de crier après lui et son comportement d'aller à la poubelle des heures plus tôt. Votre perception de son apparente conscience coupable, qui se manifeste dans sa tête baissée, son manque de contact visuel et sa fuite le long des plinthes, est une interprétation erronée de ses tentatives classiques de langage corporel canin pour apaiser votre colère, quelle qu'en soit la cause.

Les comportementalistes conviennent qu'une récompense ou une punition doit être délivrée dans les trois secondes, de préférence une seconde ou moins, du comportement que vous essayez d'augmenter ou de diminuer. Il s'agit d'une assez petite fenêtre de temps, et souligne la valeur de l'utilisation d'un clicker ou d'un autre marqueur de récompense (ou marqueur de non-récompense) pour marquer l'instant du comportement souhaité (ou inapproprié). Si vous dites « Oups ! » Dès que votre chien saute et que vous vous détournez, vous apprenez à votre chien un marqueur de non-récompense, que vous pouvez utiliser pour communiquer à votre chien quel comportement a fait disparaître la bonne chose (punition négative). Si vous cliquez ! ou dites « Oui ! » à l'instant où votre chien s'assoit, il comprendra que l'assise lui a valu la récompense, même s'il vous faut plusieurs secondes pour mettre la friandise dans sa bouche, et même s'il se lève de l'assise avant que vous ne parveniez à lui donner la friandise .

Passer à autre chose
Carla et moi avons longuement discuté de la manière de poursuivre la formation de Skip. Nous avons identifié deux options. En utilisant la désensibilisation, nous pourrions enseigner à Skip que le fait d'avoir Carla lui tapotant la tête était vraiment une récompense, en associant constamment son toucher à une récompense de friandise hors du commun, en utilisant un contact doux au début, puis en augmentant l'intensité jusqu'à ce qu'il apprenne à associer des tapotements vigoureux avec "des trucs vraiment bons". Carla s'est engagée à le faire sur le long terme, car elle voulait vraiment que Skip apprécie son toucher.

Nous avons également lancé une approche à court terme visant à modifier le comportement de Carla, en acceptant d'utiliser le renforcement positif et la punition négative avec elle. Chaque fois que Skip s'asseyait et qu'elle ne se penchait pas pour le caresser, Carla gagnait une récompense, comme un quart, un morceau de chocolat ou un jouet pour chien. Chaque fois qu'elle oubliait et se penchait pour le caresser, je sortais de la salle d'entraînement sans un mot, pendant une période de temps allant de 30 secondes à trois minutes. Cela a fonctionné à merveille, et en peu de temps, Skip était assis avec bonheur dans une position de talon parfaite lorsque Carla s'est arrêtée, sans crainte d'être punie pour son bon comportement.

-Par Pat Miller