Apprendre par le renforcement (avec diagramme)

Lisez cet article pour en savoir plus sur la signification, les types et les calendriers de renforcement.

Signification de renforcement:

Le renforcement joue un rôle central dans le processus d'apprentissage. Selon la loi d’effet, le renforcement peut être défini comme tout ce qui à la fois augmente la force de la réponse et tend à induire des répétitions du comportement qui a précédé le renforcement. Le renforcement est également défini fonctionnellement: quelque chose ne se renforce que si elle renforce la réponse qui la précède et induit des répétitions de la réponse.

Le renforcement est une explication externe du comportement par rapport à la motivation qui est une explication interne du comportement (se préoccuper des besoins intérieurs). Bien que les termes renforcement et récompenses soient parfois utilisés de manière interchangeable, il existe néanmoins une différence technique dans ces termes. Une récompense est simplement quelque chose que la personne qui la présente juge souhaitable, elle ne renforce pas toujours.

En termes très simples, le renforcement renvoie aux conséquences du comportement. Il existe quatre types de renforts dans les organisations. Renforcement positif Renforcement négatif, punition et extinction. Les deux premiers renforcent, à savoir les renforcements positifs et négatifs, visent tous deux à encourager le comportement souhaitable par des approches différentes. Les deux derniers responsables, à savoir la punition et l'extinction, cherchent tous deux à décourager les comportements indésirables par des approches différentes.

Types de renfort:

1. Renfort positif:

Un renforcement positif est une récompense pour un comportement souhaité. La récompense devrait être telle qu'elle stimule le comportement souhaité et renforce la probabilité de le répéter à l'avenir. Les renforcements positifs peuvent être primaires ou secondaires. Les renforts ayant des conséquences bénéfiques directes sont appelés renforts primaires, tels que nourriture, vêtements et logement.

Les renforcements secondaires apportent également des avantages, mais ont des significations différentes pour des individus différents. L'argent est le renforcement positif le plus puissant, car il peut être utilisé pour acheter des renforcements primaires tels que de la nourriture, etc. Certains autres renforçateurs secondaires peuvent être la participation à la prise de décision, à la promotion, à la reconnaissance et aux louanges. Il existe quelques conditions pour que le renforcement positif soit efficace.

Ce sont comme expliqué ci-dessous:

(i) La récompense devrait correspondre aux besoins des employés, car tous les individus ont des motivations différentes pour la performance. Les gestionnaires doivent soit développer un système de récompense adapté à tous les membres de leur organisation, soit adapter leurs récompenses à chaque individu. Par exemple, pour un employé, l'argent serait un exécutant, alors que pour un autre éloge, son exécution serait un exécutant plus efficace.

(ii) La récompense doit être fonction du type de performance. Pour que «plus le degré de performance de l'employé est élevé, plus grande devrait être la récompense». Ou, en d'autres termes, la récompense doit être directement liée au comportement.

(iii) Le moment de la récompense est également très important. Ceci est connu comme le principe du renforcement immédiat. Le renforcement aura un effet plus profond s'il est administré peu de temps après le comportement souhaité. Plus le délai pour donner la récompense du comportement souhaité est long, moins une telle récompense sera efficace en tant que renforcement positif.

2. Renforcement Négatif:

Le renforcement négatif est également appelé "apprentissage par évitement" ou "conditionnement d'évasion". Comme il ressort clairement de ces noms, un renforcement négatif a lieu lorsque des individus apprennent à éviter ou à échapper à des circonstances désagréables. Ainsi, le renforcement négatif renforce et augmente le comportement en mettant fin ou en retirant une conséquence indésirable.

Tout comme le renforcement positif, il s'agit également d'une méthode de renforcement du comportement souhaité. Mais sous un renforcement positif, l'employé travaille d'arrache-pied pour obtenir des récompenses financières et autres, alors que sous un renforcement négatif, il s'efforce d'éviter ou d'éviter des conséquences désagréables telles que la réprimande du patron.

Par exemple, le responsable peut souhaiter que ses subordonnés viennent en tenue de soirée sur son lieu de travail et peut critiquer les personnes qui s'habillent de manière informelle ou désinvolte. Pour éviter les critiques, les employés peuvent bien s'habiller pour que le responsable soit heureux. Ainsi, ils adoptent un comportement souhaitable pour éviter une conséquence désagréable.

Une grande partie du comportement légal dans notre société est basée sur l'apprentissage par évitement. Par exemple, nous garons notre véhicule sur le bon emplacement, même si cela n’est pas pratique, afin d’éviter d’obtenir un billet. Ainsi, le renforcement négatif est en réalité une forme de chantage social, car la personne se comportera d'une certaine manière pour ne pas être réprimandée. Cependant, aucune punition ou menace de punition n'est impliquée dans ces actions. Sur les lieux de travail, la formation, la sécurité, les avertissements, les séances d'orientation et les conseils aident les employés à se protéger des conséquences négatives d'un comportement indésirable. Lorsqu'il est associé à un renforcement positif pour un comportement approprié, l'effet peut être extrêmement bénéfique.

3. Extinction:

Alors que le renforcement positif et le renforcement négatif augmentent la fréquence des comportements souhaitables, l'extinction diminue la fréquence des comportements indésirables, en particulier lorsque de tels comportements ont déjà été récompensés, il s'agit d'une non-application. L'élimination de tout renforcement qui maintient un comportement s'appelle l'extinction. En d’autres termes, si l’on retire des récompenses pour des comportements précédemment renforcés, ce comportement deviendra probablement moins fréquent et finira par disparaître.

La méthode en cause est une forme appropriée de punition consistant à empêcher l'exécution positive ou à ignorer simplement le comportement indésirable. Par exemple, un enseignant qui souhaite dissuader les étudiants espiègles de gêner la classe en posant des questions inutiles peut éliminer ce comportement en ignorant les étudiants qui lèvent la main pour poser des questions. La main levée s'éteindra quand il y aura toujours une absence de renforcement.

Du point de vue organisationnel également, un employé qui, par exemple, combat avec tout le monde et qui est apparemment puni ou réprimandé par son supérieur hiérarchique peut poursuivre les perturbations du fait de l’attention qu’il apporte. En ignorant ou en isolant l'employé perturbateur, l'attention est retenue et peut-être aussi la motivation pour se battre.

Il faut souligner que même les comportements souhaitables disparaîtront si les récompenses cessent. Par exemple, un employé très ponctuel et félicité par son superviseur (à cause de cette habitude) sous un prétexte ou un autre, deviendra désinvolte si le superviseur commence à ignorer cette qualité et cesse de louer devant les autres employés ou ne le recommande pas pour une augmentation de salaire.

4. punition:

La punition est tout ce qui affaiblit le comportement et tend à diminuer sa fréquence ultérieure. La punition est la méthode de modification du comportement la plus controversée et implique de produire une conséquence désagréable en cas d'apparition d'un comportement indésirable. La punition et l'extinction ont pour effet de réduire et d'éliminer le comportement indésirable, mais techniquement, il y a une différence.

L'extinction est utilisée pour réduire les comportements indésirables précédemment récompensés. Le processus de punition, en revanche, consiste en l'application d'une conséquence indésirable ou le retrait d'une conséquence souhaitable pour un comportement indésirable qui n'a jamais été associé à la récompense auparavant. Quelques formes courantes de punition sont les critiques sévères, la retenue de salaire, le refus de privilèges, la rétrogradation ou la perte de la liberté du salarié de faire son travail à sa manière.

La punition est la méthode historique pour réduire ou éliminer les comportements indésirables. Mais parfois, la punition contrecarre le puni et conduit à un antagonisme envers l'agent punisseur. En conséquence, l'efficacité de l'agent de publication diminue avec le temps. Par exemple, si un responsable est réprimandé par son responsable pour avoir pris des pauses non autorisées, le comportement peut cesser, mais uniquement lorsque le responsable est présent lorsque le responsable n'est pas visible, les interruptions peuvent se reproduire. En conséquence, la direction décourage généralement l’application de toute forme de sanction et privilégie généralement les techniques de renforcement positif.

Cependant, il existe des situations où la punition devient nécessaire dans la modification du comportement. Certains comportements indésirables doivent être punis, sinon ils auront des effets considérables. Par exemple, un employé qui harcèle sexuellement un collègue ne devrait pas rester impuni. Mais en raison des dangers potentiels de la peine, il doit être administré correctement.

Les points suivants peuvent être notés à cet égard:

Les quatre stratégies de renforcement sont illustrées ci-dessous:

(i) Premièrement, une vieille règle empirique devrait être suivie: «Louange en public, punir en privé». Une réprimande privée peut être constructive, tandis que réprimander un employé devant des tiers peut être très embarrassant et risque de provoquer des effets émotionnels et comportement indésirables.

(ii) La punition devrait rapidement suivre le comportement indésirable. Il est plus efficace lorsqu'il est appliqué immédiatement après l'apparition du comportement indésirable. De plus, chaque comportement indésirable doit être sanctionné.

(iii) Troisièmement, la punition devrait être axée sur le comportement et non sur la personne. L'employé doit être clairement informé de ce qu'il a mal fait et du comportement alternatif souhaité. La sanction doit être juste, proportionnelle, impersonnelle, cohérente dans le temps et impartiale.

(iv) La punition est efficace pour modifier un comportement si elle oblige la personne à choisir un comportement souhaitable qui est renforcé. Si cela n'est pas fait, le comportement indésirable a tendance à réapparaître, provoquant la peur et l'anxiété chez la personne punie.

(v) La punition doit être administrée avec précaution afin de ne pas récompenser les comportements indésirables.

Horaires de renfort

Le renforcement ne suit pas toujours une réponse particulière. Un étudiant peut travailler fort pour les examens à chaque fois, mais il obtient parfois de bonnes notes et parfois il ne le fait pas. Du point de vue organisationnel, un employé qui travaille fort et qui fait toujours son travail à temps reçoit parfois des éloges et de la reconnaissance et peut être ignoré à d'autres moments. Dans de nombreux cas, l’apparition ou l’absence de renforcement suite à une forme de comportement donnée semble être tout à fait aléatoire. Il est régi par des règles définies. Ces règles sont connues sous le nom de programmes de renforcement et exercent de puissants effets sur le comportement.

S'il est nécessaire de savoir quel type de renforcement serait le plus efficace dans une situation donnée, il est tout aussi important d'examiner les différentes manières ou calendriers d'administration de ces techniques de renforcement. La structure et le moment exacts du renforcement ont un impact considérable sur le comportement résultant.

O. Aldis a prescrit deux types d'horaires de renforcement:

(i) Horaire continu

(ii) annexe partielle

De même, Ferster et Skinner ont décrit quatre types de calendriers de renforcement qui s’appliquent davantage aux renforcements partiels.

Ces catégories sont expliquées plus en détail comme suit:

1. Calendrier continu:

Un programme de renforcement continu renforce le comportement souhaité chaque fois qu'il est administré et le renforcement est immédiat. Ce type de renforcement augmente très rapidement le comportement positif, mais lorsque le renforcement est retiré, les performances diminuent rapidement. Par exemple, un employé avait du mal à arriver au travail à l'heure.

Chaque fois qu'il n'était pas en retard, son responsable le félicitait, il essayait d'arriver à l'heure, mais lorsque le responsable cessait de le faire à chaque fois, l'employé redevenait en retard. Parce que le comportement appris par la stratégie de renforcement continu a tendance à ne pas persister lorsque ce renforcement est appliqué moins fréquemment ou est arrêté.

Cette stratégie est très difficile à appliquer dans un contexte organisationnel car il n'est pas seulement possible de renforcer le comportement à chaque fois. De plus, l'observation continue de la performance subordonnée n'est pas propice à une bonne interaction.

2. Calendrier de renforcement partiel:

Dans le programme de renforcement partiel ou intermittent, chaque comportement du comportement souhaité n'est pas renforcé, mais un renforcement est donné suffisamment souvent pour que le comportement mérite d'être répété. On pense que «le comportement a tendance à être persistant lorsqu'il est appris dans des conditions de renforcement partiel ou retardé». Bien que cette stratégie entraîne un apprentissage lent, elle est plus durable que le renforcement continu. Le programme de renforcement partiel a une application beaucoup plus large dans le comportement organisationnel. Ce facteur est extrêmement pertinent pour la forte résistance observée aux changements d’attitudes, de valeurs, de normes, etc.

Un renforcement partiel peut être de type ratio ou intervalle. Les calendriers de rapport dépendent du nombre de réponses données par le sujet. L'individu est renforcé après avoir donné un certain nombre de types de comportement spécifiques. Les intervalles d'intervalle dépendent du temps écoulé depuis le dernier renforcement. Avec les programmes d'intervalle, l'individu est renforcé sur le premier comportement approprié après un laps de temps donné. Un renforcement peut également être classé comme fixe ou variable.

Les techniques de renforcement partiel peuvent ainsi être classées en quatre catégories, comme indiqué dans la figure suivante:

une. Calendrier à intervalle fixe:

Dans ce type d'horaire, un délai fixe doit s'écouler avant l'administration d'un renforcement. La variable critique est le temps et il est maintenu constant. Au début de toute situation d'apprentissage, un intervalle très court était nécessaire. Cependant, au fur et à mesure que l'apprentissage progresse, l'intervalle peut être allongé. L’exemple le plus courant est celui des traitements ou salaires versés à la fin d’une période déterminée. La plupart des travailleurs sont payés à l'heure, à la semaine ou au mois, pour le temps consacré à leur travail.

Les limites de cette liste sont les suivantes:

(i) Les calendriers à intervalles fixes produisent une structure de réponses inégale. Le taux de réponses le plus élevé se produit assez près du moment où le renforcement se produit.

(ii) Cette méthode est la moins motivée par le travail acharné des travailleurs, car la rémunération est liée à l'intervalle de temps plutôt qu'à la performance réelle. La survenue d'un renforcement dépend en grande partie du temps qui passe.

b. Calendrier d'intervalle variable:

Dans le programme d'intervalle variable, les récompenses sont réparties dans le temps, de sorte que les renforts sont imprévisibles. En d'autres termes, le renforcement est administré à des moments aléatoires impossibles à prédire par l'employé. Les tests surprises en classe en sont un exemple. De même, une série de visites inopinées, programmées aléatoirement, dans les bureaux de la société par le personnel de vérification de la société est un autre exemple de planification à intervalles variables.

Le calendrier est une méthode idéale pour administrer des visites de louange, de promotion, de reconnaissance et de supervision. Comme le renforcement est distribué de manière imprévisible, les calendriers variables génèrent un taux de réponse plus élevé et une performance plus stable et cohérente. Ainsi, les performances ont tendance à être plus élevées et les fluctuations seraient moins importantes que dans le cadre d’un programme à intervalles fixes.

c. Calendrier à rapport fixe:

Dans un calendrier à rapport fixe, une récompense ou un renforcement est administré après un nombre de réponses fixe ou constant. Si le calendrier est un ratio fixe, le nombre exact de réponses est spécifié. La récompense est toujours liée à la sortie. Un exemple serait le système de rémunération à la pièce où les récompenses sont proportionnelles au nombre d'articles produits.

L’administration de récompenses selon un calendrier à taux fixe a tendance à produire un taux de réponses beaucoup plus élevé. La personne détermine rapidement que le renforcement est basé sur le nombre de réponses et effectue les réponses le plus rapidement possible afin de recevoir la récompense. De plus, ce taux de réponse élevé sera à la fois vigoureux et constant. Le niveau de réponse des travailleurs sera considérablement plus élevé que celui obtenu dans un programme à intervalles.

ré. Calendrier à rapport variable:

Le calendrier des ratios variables est similaire au calendrier des ratios fixes, à la différence que le nombre de réponses requises avant qu'un renforcement soit déterminé, n'est pas fixe mais varie d'une situation à l'autre. Cependant, le nombre de réponses varie autour d'une moyenne prédéterminée. Ainsi, on peut dire que dans le programme, la récompense varie en fonction du comportement des individus.

Les vendeurs à la commission sont des exemples de personnes sur un tel programme de renforcement. À certaines occasions, ils peuvent effectuer une vente après seulement deux appels chez un client potentiel. En d'autres occasions, ils peuvent avoir besoin de faire vingt appels ou plus pour obtenir une vente. La récompense varie donc en fonction du nombre d'appels réussis du vendeur.

Les recherches ont révélé que, parmi toutes les variations dans les procédures de planification disponibles, celle-ci est la plus puissante pour maintenir le comportement. Cette méthode provoque un taux de réponse rapide. La valeur de la récompense et son imprévisibilité maintiennent le comportement à un niveau élevé de désirabilité. Ainsi, les joueurs compulsifs continuent à jouer en raison de la possibilité aléatoire de gagner. Cependant, cette méthode ne doit pas être utilisée dans une situation organisationnelle en tant que plan unique pour la planification du renforcement.