Condicionamiento clásico

Fuentes de datosEditar

Los experimentos sobre cuestiones teóricas del condicionamiento se han realizado principalmente en vertebrados, especialmente ratas y palomas. Sin embargo, el condicionamiento también se ha estudiado en invertebrados, y los datos muy importantes sobre la base neuronal del condicionamiento provienen de experimentos con la babosa marina, Aplysia. Los experimentos más relevantes han utilizado el procedimiento de condicionamiento clásico, aunque también se han utilizado experimentos de condicionamiento instrumental (operante), y la fuerza del condicionamiento clásico a menudo se mide a través de sus efectos operantes, como en la supresión condicionada (ver la sección Fenómenos más arriba) y la autoformación.

Teoría de sustitución de estímulosEditar

Más información: Contracondicionamiento

Según Pavlov, el condicionamiento no implica la adquisición de ningún comportamiento nuevo, sino más bien la tendencia a responder en viejas formas a nuevos estímulos. Por lo tanto, teorizó que el CS simplemente sustituye a los EE. UU. Al evocar la respuesta refleja. Esta explicación se denomina teoría del condicionamiento por sustitución de estímulos.:84 Un problema crítico con la teoría de sustitución de estímulos es que CR y UR no son siempre iguales. El propio Pavlov observó que la saliva de un perro producida como RC difería en composición de la producida como UR. La RC a veces es incluso lo opuesto a la UR. Por ejemplo: la respuesta incondicional a una descarga eléctrica es un aumento de la frecuencia cardíaca, mientras que un CS que se ha emparejado con la descarga eléctrica provoca una disminución en la frecuencia cardíaca (sin embargo, se ha propuesto que solo cuando el UR no involucra al sistema nervioso central son los opuestos CR y UR).

Modelo Rescorla-WagnerEditar

Artículo principal: Modelo Rescorla-Wagner

El modelo Rescorla-Wagner (R-W) es un modelo de acondicionamiento relativamente simple pero poderoso. predice una serie de fenómenos importantes, pero también falla en formas importantes, lo que lleva a una serie de modificaciones y modelos alternativos. Sin embargo, debido a que gran parte de la investigación teórica sobre el condicionamiento en los últimos 40 años ha sido instigada por este modelo o reacciones a Esto, el modelo R – W merece una breve descripción aquí. : 85

El modelo Rescorla-Wagner sostiene que existe un límite en la cantidad de condicionamiento que puede ocurrir en el emparejamiento de dos estímulos. Un determinante de este límite es la naturaleza de EE. UU. Por ejemplo: combinar una campana con un jugoso bistec tiene más probabilidades de producir salivación que combinar la campana con un trozo de pan seco, y es probable que el pan seco funcione mejor que un trozo de cartón. Una idea clave detrás del modelo R – W es que una CS señala o predice los EE. UU. Se podría decir que antes del condicionamiento, el sujeto es sorprendido por Estados Unidos. Sin embargo, después del acondicionamiento, el sujeto ya no se sorprende, porque el CS predice la llegada de Estados Unidos. (Tenga en cuenta que el modelo se puede describir matemáticamente y que palabras como predecir, sorprender y esperar solo se utilizan para ayudar a explicar el modelo). Aquí el funcionamiento del modelo se ilustra con breves descripciones de adquisición, extinción y bloqueo. El modelo también predice una serie de otros fenómenos, consulte el artículo principal sobre el modelo.

EquationEdit

Δ V = α β ( λ – Σ V) {\ displaystyle \ Delta V = \ alpha \ beta (\ lambda – \ Sigma V)}

Esta es la ecuación de Rescorla-Wagner. Especifica la cantidad de aprendizaje que se producirá en un solo emparejamiento de un estímulo condicionante (CS) con un estímulo no condicionado (EE. UU.). La ecuación anterior se resuelve repetidamente para predecir el curso del aprendizaje en muchas de estas pruebas.

En este modelo, el grado de aprendizaje se mide por qué tan bien el CS predice los EE. UU., Que viene dado por la «fuerza asociativa «de la CS. En la ecuación, V representa la fuerza asociativa actual del CS, y ∆V es el cambio en esta fuerza que ocurre en una prueba determinada. ΣV es la suma de las fuerzas de todos los estímulos presentes en la situación. λ es la fuerza asociativa máxima que admitirá un determinado EE. UU.; su valor suele establecerse en 1 en los ensayos cuando EE. UU. está presente y en 0 cuando EE. UU. está ausente. α y β son constantes relacionadas con la prominencia del CS y la velocidad de aprendizaje para un EE. UU. dado. La forma en que la ecuación predice varios resultados experimentales se explica en las siguientes secciones. Para obtener más detalles, consulte el artículo principal sobre el modelo.:85–89

Modelo R – W: adquisiciónEdit

El modelo R – W mide el condicionamiento asignando una «fuerza asociativa» al CS y otros estímulos locales. Antes de que se condicione un CS, tiene una fuerza asociativa de cero. Emparejar el CS y los EE. UU. Provoca un aumento gradual en la fuerza asociativa del CS. Este aumento está determinado por la naturaleza de EE. UU. (Por ejemplo, su intensidad).: 85–89 La cantidad de aprendizaje que ocurre durante cualquier emparejamiento CS-US depende de la diferencia entre las fuerzas asociativas totales de CS y otros estímulos presentes en la situación (ΣV en la ecuación), y un máximo establecido por los EE. UU. ( λ en la ecuación). En el primer emparejamiento de la CS y EE. UU., Esta diferencia es grande y la fuerza asociativa de la CS da un gran paso adelante. A medida que se acumulan los emparejamientos CS-EE. UU., EE. UU. Se vuelve más predecible y el aumento de la fuerza asociativa en cada ensayo se hace cada vez más pequeño. Finalmente, la diferencia entre la fuerza asociativa del CS (más cualquier que pueda acumularse a otros estímulos) y la fuerza máxima llega a cero. Es decir, EE. UU. Está completamente predicho, la fuerza asociativa del CS deja de crecer y el acondicionamiento está completo.

Modelo R – W: extinctionEdit

Comparación de la fuerza asociada por el modelo RW en el aprendizaje

El proceso asociativo descrito por el modelo R – W también explica la extinción (ver «procedimientos» más arriba). El procedimiento de extinción comienza con una fuerza asociativa positiva del CS, lo que significa que el CS predice que ocurrirá el EE. UU. En un ensayo de extinción, EE. UU. No se produce después de la CS. Como resultado de este resultado «sorprendente», la fuerza asociativa de la CS se reduce. La extinción se completa cuando la fuerza de la CS llega a cero; no se predice ningún EE. UU. Y no ocurre ningún EE. UU. Sin embargo, si ese mismo CS es presentado sin EE. UU. pero acompañado por un inhibidor condicionado (IC) bien establecido, es decir, un estímulo que predice la ausencia de EE. UU. (en términos de RW, un estímulo con una fuerza asociada negativa), entonces RW predice que el CS no sufren extinción (su V no disminuirá de tamaño).

Modelo R – W: BlockEdit

Artículo principal: Efecto de bloqueo

La contribución más importante y novedosa del modelo R-W es su suposición de que el condicionamiento de un CS depende no solo de ese CS y su relación con los EE. UU., sino también de todos los demás estímulos presentes en la situación de condicionamiento. En particular, el modelo establece que el US se predice por la suma de las fuerzas asociativas de todos los estímulos presentes en la situación de condicionamiento ion. El aprendizaje está controlado por la diferencia entre esta fuerza asociativa total y la fuerza respaldada por EE. UU. Cuando esta suma de fuerzas alcanza un máximo establecido por los EE. UU., El condicionamiento termina como se acaba de describir.:85–89

La explicación R – W del fenómeno de bloqueo ilustra una consecuencia de la suposición que se acaba de enunciar. En el bloqueo (ver «fenómenos» más arriba), CS1 se empareja con un US hasta que se completa el acondicionamiento. Luego, en ensayos de acondicionamiento adicionales, aparece un segundo estímulo (CS2) junto con CS1, y ambos son seguidos por EE. UU. Finalmente, se prueba CS2 y se demuestra que no produce respuesta porque el aprendizaje inicial sobre CS1 «bloqueó» el aprendizaje sobre CS2. El modelo R-W explica esto diciendo que después del acondicionamiento inicial, CS1 predice completamente los EE. UU. diferencia entre lo que se predice y lo que sucede, no se produce ningún aprendizaje nuevo en las pruebas adicionales con CS1 + CS2, por lo que CS2 luego no da respuesta.

Problemas teóricos y alternativas al modelo Rescorla-WagnerEditar

Una de las principales razones de la importancia del modelo R-W es que es relativamente simple y hace predicciones claras. Las pruebas de estas predicciones han llevado a una serie de nuevos hallazgos importantes y una comprensión considerablemente mayor del condicionamiento. Algunos La nueva información ha apoyado la teoría, pero mucha no lo ha hecho, y en general se acepta que la teoría es, en el mejor de los casos, demasiado simple. Sin embargo, ningún modelo único parece dar cuenta de todos los fenómenos que han producido los experimentos. A continuación se presenta un breve resumen aries de algunos temas teóricos relacionados.

Contenido del aprendizajeEditar

El modelo R – W reduce el condicionamiento a la asociación de un CS y US, y mide esto con un solo número, el asociativo fuerza de la CS. Varios hallazgos experimentales indican que se aprende más que esto. Entre estos se encuentran dos fenómenos descritos anteriormente en este artículo

  • Inhibición latente: si un sujeto se expone repetidamente al CS antes de que comience el acondicionamiento, entonces el acondicionamiento lleva más tiempo. El modelo R-W no puede explicar esto porque la preexposición deja la fuerza de la CS sin cambios en cero.
  • Recuperación de la respuesta después de la extinción: Parece que algo permanece después de la extinción ha reducido la fuerza asociativa a cero porque varios procedimientos causan respondiendo para reaparecer sin más condicionamientos.

Papel de la atención en el aprendizajeEditar

La inhibición latente puede ocurrir porque un sujeto deja de enfocarse en un CS que se ve con frecuencia antes de emparejarlo con un US.De hecho, los cambios en la atención al CS están en el corazón de dos teorías prominentes que intentan hacer frente a resultados experimentales que le dan dificultad al modelo R – W. En uno de estos, propuesto por Nicholas Mackintosh, la velocidad del condicionamiento depende de la cantidad de atención que se le dedique al CS, y esta cantidad de atención depende a su vez de qué tan bien el CS predice los EE. UU. Pearce y Hall propusieron un modelo relacionado basado en un principio de atención diferente. Ambos modelos han sido ampliamente probados y ninguno explica todos los resultados experimentales. En consecuencia, varios autores han intentado modelos híbridos que combinan los dos procesos atencionales. Pearce y Hall en 2010 integraron sus ideas de atención e incluso sugirieron la posibilidad de incorporar la ecuación de Rescorla-Wagner en un modelo integrado.

ContextEdit

Como se dijo anteriormente, una idea clave en el condicionamiento es que la CS señala o predice a los EE. UU. (ver «procedimiento de contingencia cero» más arriba). Sin embargo, por ejemplo, la habitación en la que tiene lugar el acondicionamiento también «predice» que los EE. UU. Pueden ocurrir. Aún así, la sala predice con mucha menos certeza que la propia CS experimental, porque la sala también está ahí entre los ensayos experimentales, cuando EE. UU. Está ausente. El papel de tal contexto se ilustra por el hecho de que los perros en el experimento de Pavlov a veces comenzaban a salivar cuando se acercaban al aparato experimental, antes de que vieran o escucharan cualquier EC. Tales estímulos del llamado «contexto» siempre están presentes, y su influencia ayuda a explicar algunos hallazgos experimentales que de otro modo serían desconcertantes. La fuerza asociativa de los estímulos contextuales se puede ingresar en la ecuación de Rescorla-Wagner, y juegan un papel importante en las teorías comparativas y computacionales que se describen a continuación.

Teoría del comparadorEditar

Para averiguar lo que se ha aprendido, de alguna manera debemos medir el comportamiento («desempeño») en una situación de prueba. Sin embargo, como los estudiantes saben muy bien, el desempeño en una situación de prueba no siempre es un buena medida de lo que se ha aprendido. En cuanto al condicionamiento, hay evidencia de que los sujetos en un experimento de bloqueo aprenden algo sobre el CS «bloqueado», pero no muestran este aprendizaje debido a la forma en que normalmente se les prueba d.

Las teorías de acondicionamiento «comparadoras» están «basadas en el rendimiento», es decir, enfatizan lo que está sucediendo en el momento de la prueba. En particular, observan todos los estímulos que están presentes durante la prueba y cómo las asociaciones adquiridas por estos estímulos pueden interactuar. Para simplificar un poco, las teorías de comparación asumen que durante el condicionamiento el sujeto adquiere asociaciones CS-US y contexto-US. En el momento de la prueba, estas asociaciones se comparan y se produce una respuesta a la CS solo si la asociación CS-US es más fuerte que la asociación contexto-US. Después de que CS y EE. UU. Se emparejan repetidamente en una adquisición simple, la asociación CS-EE. UU. Es fuerte y la asociación contexto-EE. UU. Es relativamente débil. Esto significa que el CS provoca un CR fuerte. En «contingencia cero» (ver arriba), la respuesta condicionada es débil o está ausente porque la asociación contexto-EE. UU. Es casi tan fuerte como la asociación CS-EE. UU. El bloqueo y otros fenómenos más sutiles también pueden explicarse mediante teorías comparativas, de nuevo, no pueden explicarlo todo.

Teoría computacionalEditar

La necesidad de un organismo de predecir eventos futuros es fundamental para las teorías modernas del condicionamiento. La mayoría de las teorías usan asociaciones entre estímulos para atender estas predicciones. Por ejemplo: En el modelo R – W, la fuerza asociativa de un CS nos dice con qué fuerza el CS predice un EE. UU. Modelos como el propuesto por Gallistel & Gibbon (2000, 2002) sugieren un enfoque diferente de la predicción. Aquí la respuesta no está determinada por las fortalezas asociativas. En cambio, el organismo registra los tiempos de aparición y desaparición de los CS y los EE. UU. Y los utiliza para calcular la probabilidad de que EE. UU. Siga el CS. Varios experimentos han demostrado que los seres humanos y los animales pueden aprender a medir el tiempo de los eventos (consulte Cognición animal), y el modelo de Gibbon de Gallistel & produce muy buenos ajustes cuantitativos para una variedad de datos experimentales. Sin embargo, estudios recientes han sugerido que los modelos basados en la duración no pueden dar cuenta de algunos hallazgos empíricos ni de los modelos asociativos.

Modelos basados en elementosEditar

El modelo Rescorla-Wagner trata un estímulo como una sola entidad, y representa la fuerza asociativa de un estímulo con un número, sin registro de cómo se alcanzó ese número. Como se señaló anteriormente, esto dificulta que el modelo tenga en cuenta varios resultados experimentales. Se proporciona más flexibilidad suponiendo que un estímulo está representado internamente por una colección de elementos, cada uno de los cuales puede cambiar de un estado asociativo a otro.Por ejemplo, la similitud de un estímulo con otro puede representarse diciendo que los dos estímulos comparten elementos en común. Estos elementos compartidos ayudan a explicar la generalización de estímulos y otros fenómenos que pueden depender de la generalización. Además, diferentes elementos dentro del mismo conjunto pueden tener diferentes asociaciones, y sus activaciones y asociaciones pueden cambiar en diferentes momentos y a diferentes velocidades. Esto permite que los modelos basados en elementos manejen algunos resultados que de otro modo serían inexplicables.

El modelo SOPEditar

Un ejemplo destacado del enfoque de elementos es el modelo «SOP» de Wagner. El modelo ha sido elaborado de diversas formas desde su introducción, y ahora puede dar cuenta en principio de una gran variedad de hallazgos experimentales. El modelo representa cualquier estímulo dado con una gran colección de elementos. El tiempo de presentación de varios estímulos, el estado de sus elementos , y las interacciones entre los elementos, todos determinan el curso de los procesos asociativos y los comportamientos observados durante los experimentos de condicionamiento.

La explicación del SOP del condicionamiento simple ejemplifica algunos de los elementos esenciales del modelo SOP. Para empezar, el modelo asume que CS y EE. UU. están representados por un gran grupo de elementos. Cada uno de estos elementos de estímulo puede estar en uno de tres estados:

  • actividad primaria (A1): en términos generales, el estímulo es «atendido». (Las referencias a «atención» tienen como único objetivo ayudar a la comprensión y no son parte del modelo).
  • actividad secundaria (A2): el estímulo «se atiende de forma periférica».
  • inactivo (I): el estímulo «no es atendido».

De los elementos que representan un solo estímulo en un momento dado, algunos pueden estar en el estado A1, otros en el estado A2, y algunos en el estado I.

Cuando un estímulo aparece por primera vez, algunos de sus elementos saltan de la inactividad I a la actividad primaria A1. Desde el estado A1 van decayendo gradualmente a A2, y finalmente de nuevo a I. Actividad del elemento solo puede cambiar de esta manera; en particular, los elementos de A2 no pueden volver directamente a A1. Si los elementos de CS y de EE. UU. están en el estado A1 al mismo tiempo, se aprende una asociación entre los dos estímulos. significa que si, en un momento posterior, la CS se presenta por delante de EE. UU. y algunos elementos de CS ingresan a A1, estos elementos activarán algunos elementos de EE. UU. solo se elevan al estado A2. (Se puede pensar que el CS despertando un recuerdo de los EE. UU., Que no será tan fuerte como el real). Con ensayos repetidos de CS-US, se asocian más y más elementos, y más y más elementos de EE. UU. Van a A2 cuando se enciende el CS. Esto gradualmente deja cada vez menos elementos estadounidenses que puedan ingresar a A1 cuando aparezca el propio EE. UU. En consecuencia, el aprendizaje se ralentiza y se acerca a un límite. Se podría decir que EE. UU. Está «completamente predicho» o «no es sorprendente» porque casi todos sus elementos solo pueden ingresar a A2 cuando se enciende el CS, dejando pocos para formar nuevas asociaciones.

El modelo puede explicar los hallazgos que se explican por el modelo de Rescorla-Wagner y también una serie de hallazgos adicionales. Por ejemplo, a diferencia de la mayoría de los otros modelos, SOP tiene en cuenta el tiempo. El aumento y la disminución de la activación de elementos permite que el modelo explique los efectos dependientes del tiempo, como el hecho de que el condicionamiento es más fuerte cuando el CS viene justo antes de los EE. UU., Y que cuando el CS viene después de los EE. UU. («Condicionamiento hacia atrás»), el resultado es a menudo un SC inhibitorio. También se explican muchos otros fenómenos más sutiles.

En los últimos años han aparecido otros modelos poderosos que incorporan representaciones de elementos. Estos a menudo incluyen la suposición de que las asociaciones involucran una red de conexiones entre «nodos» que representan estímulos, respuestas y quizás una o más capas «ocultas» de interconexiones intermedias. Estos modelos entran en contacto con una explosión actual de investigación sobre redes neuronales, inteligencia artificial y aprendizaje automático.

Write a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *