Conditionnement classique

Sources de donnéesEdit

Les expériences sur les problèmes théoriques du conditionnement ont principalement été effectuées sur des vertébrés, en particulier des rats et des pigeons. Cependant, le conditionnement a également été étudié chez les invertébrés, et des données très importantes sur la base neurale du conditionnement sont venues d’expériences sur la limace de mer, Aplysia. La plupart des expériences pertinentes ont utilisé la procédure de conditionnement classique, bien que des expériences de conditionnement instrumental (opérant) aient également été utilisées, et la force du conditionnement classique est souvent mesurée à travers ses effets opérants, comme dans la suppression conditionnée (voir la section Phénomènes ci-dessus) et la mise en forme automatique. / p>

Stimulus-substitution theoryEdit

Informations complémentaires: Contre-conditionnement

Selon Pavlov, le conditionnement n’implique pas l’acquisition d’un nouveau comportement, mais plutôt la tendance à répondre anciennes façons de nouveaux stimuli. Ainsi, il a émis l’hypothèse que le CS se substitue simplement aux États-Unis en évoquant la réponse réflexe. Cette explication est appelée la théorie du conditionnement par substitution de stimulus.: 84 Un problème critique avec la théorie de substitution de stimulus est que CR et UR ne sont pas toujours les mêmes. Pavlov lui-même a observé que la composition de la salive d’un chien produite sous forme de CR différait de celle produite en tant que UR. Le CR est parfois même l’opposé de l’UR. Par exemple: la réponse inconditionnelle à un choc électrique est une augmentation de la fréquence cardiaque alors qu’un CS qui a été associé au choc électrique provoque une diminution de la fréquence cardiaque (cependant, il a été proposé que ce n’est que lorsque l’UR n’implique pas le système nerveux central que le CR et l’UR sont opposés.)

Rescorla – Wagner modelEdit

Article principal: Modèle Rescorla – Wagner

Le modèle Rescorla – Wagner (R – W) est un modèle de conditionnement relativement simple mais puissant. Le modèle prédit un certain nombre de phénomènes importants, mais il échoue également de manière importante, conduisant ainsi à un certain nombre de modifications et de modèles alternatifs. Cependant, parce qu’une grande partie de la recherche théorique sur le conditionnement au cours des 40 dernières années a été provoquée par ce modèle ou des réactions il, le modèle R – W mérite une brève description ici. : 85

Le modèle Rescorla-Wagner soutient qu’il y a une limite à la quantité de conditionnement qui peut se produire dans l’appariement de deux stimuli. Un des facteurs déterminants de cette limite est la nature des États-Unis. Par exemple: jumeler une cloche avec un steak juteux est plus susceptible de produire de la salivation que jumeler la cloche avec un morceau de pain sec, et le pain sec fonctionnera probablement mieux qu’un morceau de carton. Une idée clé derrière le modèle R – W est qu’un CS signale ou prédit les États-Unis. On pourrait dire qu’avant le conditionnement, le sujet est surpris par les États-Unis. Cependant, après conditionnement, le sujet n’est plus surpris, car le CS prédit la venue des États-Unis. (Notez que le modèle peut être décrit mathématiquement et que des mots comme prédire, surprendre et s’attendre ne sont utilisés que pour aider à expliquer le modèle.) Ici, le fonctionnement du modèle est illustré par de brefs comptes rendus d’acquisition, d’extinction et de blocage. Le modèle prédit également un certain nombre d’autres phénomènes, voir l’article principal sur le modèle.

EquationEdit

Δ V = α β ( λ – Σ V) {\ displaystyle \ Delta V = \ alpha \ beta (\ lambda – \ Sigma V)}

C’est l’équation de Rescorla-Wagner. Il spécifie la quantité d’apprentissage qui se produira sur une seule paire d’un stimulus de conditionnement (CS) avec un stimulus inconditionné (US). L’équation ci-dessus est résolue à plusieurs reprises pour prédire le cours de l’apprentissage sur de nombreux essais de ce type.

Dans ce modèle, le degré d’apprentissage est mesuré par la façon dont le CS prédit les États-Unis, ce qui est donné par la « force associative « du CS. Dans l’équation, V représente la force associative actuelle du CS, et ∆V est le changement de cette force qui se produit lors d’un essai donné. ΣV est la somme des forces de tous les stimuli présents dans la situation. λ est la force associative maximale qu’un États-Unis donné soutiendra; sa valeur est généralement fixée à 1 lors des essais lorsque les États-Unis sont présents et à 0 lorsque les États-Unis sont absents. α et β sont des constantes liées à la saillance du CS et à la vitesse d’apprentissage pour un US donné. La façon dont l’équation prédit divers résultats expérimentaux est expliquée dans les sections suivantes. Pour plus de détails, voir l’article principal sur le modèle.:85–89

Modèle R – W: acquisitionEdit

Le modèle R – W mesure le conditionnement en attribuant une «force associative» au CS et à d’autres stimuli locaux. Avant qu’un CS ne soit conditionné, il a une force associative de zéro. L’appariement du CS et des États-Unis entraîne une augmentation progressive de la force associative du CS. Cette augmentation est déterminée par la nature des États-Unis (par exemple, son intensité).: 85–89 La quantité d’apprentissage qui se produit lors d’un seul appariement CS-US dépend de la différence entre les forces associatives totales de CS et d’autres stimuli présents dans la situation (ΣV dans l’équation), et un maximum fixé par les États-Unis ( λ dans l’équation). Sur le premier couple CS et US, cette différence est grande et la force associative du CS fait un grand pas en avant. À mesure que les appariements CS-US s’accumulent, les États-Unis deviennent plus prévisibles et l’augmentation de la force associative à chaque essai devient de plus en plus petite. Enfin, la différence entre la force associative du CS (plus celle qui peut revenir à d’autres stimuli) et la force maximale atteint zéro. Autrement dit, les États-Unis sont entièrement prédits, la force associative du CS cesse de croître et le conditionnement est terminé.

Modèle R – W: extinctionEdit

Comparaison de la force associée par le modèle RW dans l’apprentissage

Le processus associatif décrit par le modèle R – W également explique l’extinction (voir ci-dessus « procédures »). La procédure d’extinction commence par une force associative positive du CS, ce qui signifie que le CS prédit que les États-Unis se produiront. Lors d’un essai d’extinction, les États-Unis ne parviennent pas à se produire après le CS. À la suite de ce résultat « surprenant », la force associative du CS diminue. L’extinction est complète lorsque la force du CS atteint zéro; aucun US n’est prédit, et aucun US ne se produit. Cependant, si ce même CS est présenté sans les États-Unis mais accompagné d’un inhibiteur conditionné (IC) bien établi, c’est-à-dire d’un stimulus qui prédit l’absence d’un US (en termes de RW, un stimulus avec une force d’associé négative) alors RW prédit que le CS ne le sera pas subir une extinction (son V ne diminuera pas en taille).

Modèle R – W: blockingEdit

Article détaillé: effet de blocage

La contribution la plus importante et la plus nouvelle du modèle R – W est son hypothèse que le conditionnement d’un CS dépend non seulement de ce CS seul, et de sa relation avec les États-Unis, mais aussi de tous les autres stimuli présents dans la situation de conditionnement. En particulier, le modèle indique que le US est prédit par la somme des forces associatives de tous les stimuli présents dans le conditionnement situat ion. L’apprentissage est contrôlé par la différence entre cette force associative totale et la force soutenue par les États-Unis. Lorsque cette somme de forces atteint un maximum fixé par les États-Unis, le conditionnement se termine comme il vient d’être décrit.:85–89

L’explication R – W du phénomène de blocage illustre une conséquence de l’hypothèse qui vient d’être énoncée. En blocage (voir «phénomènes» ci-dessus), CS1 est apparié à un US jusqu’à ce que le conditionnement soit complet. Ensuite, sur des essais de conditionnement supplémentaires, un deuxième stimulus (CS2) apparaît avec CS1, et les deux sont suivis par les États-Unis. Enfin, CS2 est testé et montré qu’il ne produit aucune réponse car l’apprentissage de CS2 a été « bloqué » par l’apprentissage initial de CS1. Le modèle R – W explique cela en disant qu’après le conditionnement initial, CS1 prédit complètement les États-Unis. Puisqu’il n’y a pas différence entre ce qui est prédit et ce qui se passe, aucun nouvel apprentissage ne se produit sur les essais supplémentaires avec CS1 + CS2, donc CS2 ne donne plus tard aucune réponse.

Problèmes théoriques et alternatives au modèle Rescorla – WagnerModifier

L’une des principales raisons de l’importance du modèle R – W est qu’il est relativement simple et permet des prédictions claires. Les tests de ces prédictions ont conduit à un certain nombre de nouvelles découvertes importantes et à une compréhension considérablement accrue du conditionnement. Certaines de nouvelles informations ont soutenu la théorie, mais beaucoup ne l’ont pas été, et il est généralement admis que la théorie est, au mieux, trop simple. Cependant, aucun modèle ne semble rendre compte de tous les phénomènes produits par les expériences. certains problèmes théoriques connexes.

Contenu de learningEdit

Le modèle R – W réduit le conditionnement à l’association d’un CS et US, et mesure cela avec un seul nombre, l’associatif force du CS. Un certain nombre de résultats expérimentaux indiquent que l’on apprend plus que cela. Parmi ceux-ci, deux phénomènes décrits plus haut dans cet article

  • Inhibition latente: si un sujet est exposé à plusieurs reprises au CS avant le début du conditionnement, alors le conditionnement prend plus de temps. Le modèle R – W ne peut pas l’expliquer car la pré-exposition laisse la force du CS inchangée à zéro.
  • Récupération de la réponse après l’extinction: il semble que quelque chose reste après l’extinction a réduit la force associative à zéro car plusieurs procédures provoquent répondre pour réapparaître sans autre conditionnement.

Rôle de l’attention dans learningEdit

Une inhibition latente peut se produire parce qu’un sujet arrête de se concentrer sur un CS qui est fréquemment vu avant qu’il ne soit associé à un US.En fait, les changements d’attention au CS sont au cœur de deux théories importantes qui tentent de faire face aux résultats expérimentaux qui donnent du mal au modèle R – W. Dans l’un de ceux-ci, proposé par Nicholas Mackintosh, la vitesse de conditionnement dépend de la quantité d’attention consacrée au CS, et cette quantité d’attention dépend à son tour de la façon dont le CS prédit les États-Unis. Pearce et Hall ont proposé un modèle connexe basé sur un principe attentionnel différent. Les deux modèles ont été largement testés, et aucun des deux n’explique tous les résultats expérimentaux. Par conséquent, divers auteurs ont tenté des modèles hybrides combinant les deux processus attentionnels. Pearce et Hall en 2010 ont intégré leurs idées attentionnelles et ont même suggéré la possibilité d’incorporer l’équation Rescorla-Wagner dans un modèle intégré.

ContextEdit

Comme indiqué précédemment, une idée clé dans le conditionnement est que le CS signale ou prédit les États-Unis (voir la « procédure de contingence zéro » ci-dessus). Cependant, par exemple, la pièce dans laquelle le conditionnement a lieu « prédit » également que les États-Unis peuvent se produire. Pourtant, la salle prédit avec beaucoup moins de certitude que le CS expérimental lui-même, car la salle est également là entre les essais expérimentaux, lorsque les États-Unis sont absents. Le rôle d’un tel contexte est illustré par le fait que les chiens de l’expérience de Pavlov commençaient parfois à saliver en approchant de l’appareil expérimental, avant de voir ou d’entendre un CS. De tels stimuli dits « contextuels » sont toujours présents, et leur influence permet de rendre compte de certaines découvertes expérimentales par ailleurs déroutantes. La force associative des stimuli contextuels peut être entrée dans l’équation de Rescorla-Wagner, et ils jouent un rôle important dans les théories comparatives et informatiques décrites ci-dessous.

Théorie des comparateurs bonne mesure de ce qui a été appris. En ce qui concerne le conditionnement, il est prouvé que les sujets d’une expérience de blocage apprennent quelque chose sur le CS « bloqué », mais ne parviennent pas à montrer cet apprentissage en raison de la d.

Les théories « comparatives » du conditionnement sont « basées sur la performance », c’est-à-dire qu’elles soulignent ce qui se passe au moment du test. En particulier, ils examinent tous les stimuli présents lors des tests et comment les associations acquises par ces stimuli peuvent interagir. Pour simplifier un peu trop, les théories comparatives supposent que pendant le conditionnement, le sujet acquiert à la fois des associations CS-US et context-US. Au moment du test, ces associations sont comparées et une réponse au CS ne se produit que si l’association CS-US est plus forte que l’association contexte-US. Une fois qu’un CS et des États-Unis sont appariés à plusieurs reprises dans une acquisition simple, l’association CS-US est forte et l’association contexte-US est relativement faible. Cela signifie que le CS suscite un CR fort. En «contingence zéro» (voir ci-dessus), la réponse conditionnée est faible ou absente car l’association contexte-États-Unis est à peu près aussi forte que l’association CS-US. Le blocage et d’autres phénomènes plus subtils peuvent également être expliqués par des théories comparatives, cependant, encore une fois, ils ne peuvent pas tout expliquer.

Théorie computationnelleEdit

Le besoin d’un organisme de prédire les événements futurs est au cœur des théories modernes du conditionnement. La plupart des théories utilisent des associations entre stimuli pour prendre en compte ces prédictions. Par exemple: dans le modèle R – W, la force associative d’un CS nous indique la force avec laquelle CS prédit un US. Une approche différente de la prédiction est suggérée par des modèles tels que celui proposé par Gallistel & Gibbon (2000, 2002). Ici, la réponse n’est pas déterminée par les forces associatives. Au lieu de cela, l’organisme enregistre les heures d’apparition et de décalage des CS et des États-Unis et les utilise pour calculer la probabilité que les États-Unis suivent le CS. Un certain nombre d’expériences ont montré que les humains et les animaux peuvent apprendre à chronométrer les événements (voir Cognition animale), et le modèle Gallistel & Gibbon donne de très bons ajustements quantitatifs à une variété de données expérimentales. Cependant, des études récentes ont suggéré que les modèles basés sur la durée ne peuvent pas tenir compte de certaines découvertes empiriques ainsi que des modèles associatifs.

Modèles basés sur des élémentsModifier

Le modèle Rescorla-Wagner traite un stimulus comme une seule entité, et il représente la force associative d’un stimulus avec un nombre, sans enregistrement de la façon dont ce nombre a été atteint. Comme indiqué ci-dessus, cela rend difficile pour le modèle de rendre compte d’un certain nombre de résultats expérimentaux. Plus de flexibilité est fournie en supposant qu’un stimulus est représenté en interne par une collection d’éléments, dont chacun peut changer d’un état associatif à un autre.Par exemple, la similitude d’un stimulus à un autre peut être représentée en disant que les deux stimuli partagent des éléments en commun. Ces éléments partagés aident à rendre compte de la généralisation du stimulus et d’autres phénomènes qui peuvent dépendre de la généralisation. En outre, différents éléments d’un même ensemble peuvent avoir des associations différentes, et leurs activations et associations peuvent changer à des moments et à des rythmes différents. Cela permet aux modèles basés sur des éléments de gérer des résultats autrement inexplicables.

Le modèle SOPEdit

Un exemple marquant de l’approche élémentaire est le modèle « SOP » de Wagner. Le modèle a été élaboré de diverses manières depuis son introduction, et il peut désormais rendre compte en principe d’une très grande variété de résultats expérimentaux. Le modèle représente un stimulus donné avec une grande collection d’éléments. Le moment de la présentation de divers stimuli, l’état de leurs éléments , et les interactions entre les éléments, déterminent tous le cours des processus associatifs et les comportements observés lors des expériences de conditionnement.

Le compte rendu SOP du conditionnement simple illustre certains éléments essentiels du modèle SOP. Pour commencer, le modèle suppose que CS et US sont chacun représentés par un grand groupe d’éléments. Chacun de ces éléments de stimulus peut être dans l’un des trois états suivants:

  • activité principale (A1) – En gros, le stimulus est «pris en charge». (Les références à « l’attention » sont destinées uniquement à faciliter la compréhension et ne font pas partie du modèle.)
  • activité secondaire (A2) – Le stimulus est « assisté de manière périphérique ».
  • inactif (I) – Le stimulus n’est « pas pris en charge ».

Parmi les éléments qui représentent un seul stimulus à un moment donné, certains peuvent être dans l’état A1, certains dans l’état A2, et certains dans l’état I.

Lorsqu’un stimulus apparaît pour la première fois, certains de ses éléments passent de l’inactivité I à l’activité principale A1. De l’état A1, ils se désintègrent progressivement en A2, puis reviennent à I. Activité de l’élément ne peut changer que de cette manière; en particulier, les éléments de A2 ne peuvent pas retourner directement à A1. Si les éléments du CS et des États-Unis sont à l’état A1 en même temps, une association est apprise entre les deux stimuli. signifie que si, ultérieurement, le CS est présenté avant les États-Unis et que certains éléments CS entrent en A1, ces éléments activeront certains éléments américains. Cependant, les éléments américains activés indirectement de cette manière seulement être boosté à l’état A2. (On peut penser que le CS suscite un souvenir des États-Unis, qui ne sera pas aussi fort que la vraie chose.) Avec des essais répétés du CS-US, de plus en plus d’éléments sont associés, et de plus en plus d’éléments américains vont à A2 quand le CS s’allume. Cela laisse progressivement de moins en moins d’éléments américains qui peuvent entrer en A1 lorsque les États-Unis eux-mêmes apparaissent. En conséquence, l’apprentissage ralentit et approche une limite. On pourrait dire que les États-Unis sont « entièrement prédits » ou « pas surprenants » parce que presque tous ses éléments ne peuvent entrer en A2 que lorsque le CS s’allume, en laissant peu pour former de nouvelles associations.

Le modèle peut expliquer les résultats qui sont pris en compte par le modèle Rescorla-Wagner et un certain nombre de résultats supplémentaires. Par exemple, contrairement à la plupart des autres modèles, les SOP prennent en compte le temps. La montée et la décroissance de l’activation des éléments permet au modèle d’expliquer les effets dépendant du temps tels que le fait que le conditionnement est le plus fort lorsque le CS vient juste avant les États-Unis, et que lorsque le CS vient après les États-Unis (« conditionnement en arrière ») le résultat est souvent un CS inhibiteur. De nombreux autres phénomènes plus subtils sont également expliqués.

Un certain nombre d’autres modèles puissants sont apparus ces dernières années, qui incorporent des représentations d’éléments. Ceux-ci incluent souvent l’hypothèse que les associations impliquent un réseau de des connexions entre « nœuds » qui représentent des stimuli, des réponses et peut-être une ou plusieurs couches « cachées » d’interconnexions intermédiaires. Ces modèles sont en contact avec une explosion actuelle de recherche sur les réseaux de neurones, l’intelligence artificielle et l’apprentissage automatique.

Write a Comment

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *