Condicionamento clássico

Data sourcesEdit

Os experimentos sobre questões teóricas do condicionamento foram feitos principalmente em vertebrados, especialmente ratos e pombos. No entanto, o condicionamento também foi estudado em invertebrados, e dados muito importantes sobre a base neural do condicionamento vieram de experimentos com a lesma marinha, Aplysia. A maioria dos experimentos relevantes utilizou o procedimento de condicionamento clássico, embora experimentos de condicionamento instrumental (operante) também tenham sido usados, e a força do condicionamento clássico é frequentemente medida por meio de seus efeitos operantes, como na supressão condicionada (consulte a seção Fenômenos acima) e na autoformação.

Teoria da substituição de estímulo Editar

Mais informações: Contracondicionamento

De acordo com Pavlov, o condicionamento não envolve a aquisição de qualquer novo comportamento, mas sim a tendência de responder em velhas formas para novos estímulos. Assim, ele teorizou que o CS meramente substitui o US ao evocar a resposta reflexa. Essa explicação é chamada de teoria do condicionamento de substituição de estímulo.:84 Um problema crítico com a teoria de substituição de estímulo é que o CR e o UR nem sempre são os mesmos. O próprio Pavlov observou que a saliva de um cão produzida como um CR difere em composição daquela produzida como um UR. Às vezes, o CR é até o oposto do UR. Por exemplo: a resposta incondicional ao choque elétrico é um aumento na frequência cardíaca, enquanto um SC que foi emparelhado com o choque elétrico provoca uma diminuição na freqüência cardíaca. (No entanto, foi proposto que apenas quando o UR não envolve o sistema nervoso central são os opostos RC e UR.)

Rescorla – Wagner modelEdit

Artigo principal: Modelo Rescorla – Wagner

O modelo Rescorla – Wagner (R – W) é um modelo de condicionamento relativamente simples, mas poderoso. prevê uma série de fenômenos importantes, mas também falha de maneiras importantes, levando a uma série de modificações e modelos alternativos. No entanto, porque muitas das pesquisas teóricas sobre condicionamento nos últimos 40 anos foram instigadas por este modelo ou reações a isso, o modelo R – W merece uma breve descrição aqui. : 85

O modelo Rescorla-Wagner argumenta que há um limite para a quantidade de condicionamento que pode ocorrer no emparelhamento de dois estímulos. Um determinante desse limite é a natureza dos EUA. Por exemplo: emparelhar um sino com um bife suculento tem mais probabilidade de produzir salivação do que emparelhar o sino com um pedaço de pão seco, e pão seco provavelmente funciona melhor do que um pedaço de papelão. Uma ideia chave por trás do modelo R – W é que um CS sinaliza ou prevê os EUA. Pode-se dizer que antes do condicionamento, o sujeito é surpreendido pelos EUA. Porém, após o condicionamento, o sujeito não se surpreende mais, pois o CS prevê a vinda dos EUA. (Observe que o modelo pode ser descrito matematicamente e que palavras como prever, surpreender e esperar são usadas apenas para ajudar a explicar o modelo.) Aqui, o funcionamento do modelo é ilustrado com breves relatos de aquisição, extinção e bloqueio. O modelo também prevê uma série de outros fenômenos, consulte o artigo principal sobre o modelo.

EquationEdit

Δ V = α β ( λ – Σ V) {\ displaystyle \ Delta V = \ alpha \ beta (\ lambda – \ Sigma V)}

Esta é a equação de Rescorla-Wagner. Ele especifica a quantidade de aprendizado que ocorrerá em um único par de um estímulo condicionador (CS) com um estímulo não condicionado (US). A equação acima é resolvida repetidamente para prever o curso do aprendizado ao longo de muitas dessas tentativas.

Neste modelo, o grau de aprendizado é medido por quão bem o CS prevê o US, que é dado pela “força associativa “do CS. Na equação, V representa a força associativa atual do CS, e ∆V é a mudança nesta força que ocorre em uma determinada tentativa. ΣV é a soma das intensidades de todos os estímulos presentes na situação. λ é a força associativa máxima que um determinado US suportará; seu valor é geralmente definido como 1 em testes quando os EUA estão presentes e 0 quando os EUA estão ausentes. α e β são constantes relacionadas à saliência do CS e à velocidade de aprendizado para um determinado US. Como a equação prevê vários resultados experimentais é explicado nas seções seguintes. Para obter mais detalhes, consulte o artigo principal sobre o modelo.:85–89

Modelo R – W: verificationEdit

O modelo R – W mede o condicionamento atribuindo uma “força associativa” ao CS e outros estímulos locais. Antes de um CS ser condicionado, ele tem uma força associativa igual a zero. Emparelhar o CS e o US causa um aumento gradual na força associativa do CS. Este aumento é determinado pela natureza dos EUA (por exemplo, sua intensidade).: 85-89 A quantidade de aprendizado que acontece durante qualquer emparelhamento CS-US depende da diferença entre as forças associativas totais de CS e outros estímulos presentes na situação (ΣV na equação), e um máximo definido pelo US ( λ na equação). No primeiro par de CS e US, essa diferença é grande e a força associativa do CS dá um grande passo. À medida que os pares CS-US se acumulam, os EUA se tornam mais previsíveis e o aumento da força associativa em cada tentativa se torna cada vez menor. Finalmente, a diferença entre a força associativa do CS (mais qualquer que possa resultar de outros estímulos) e a força máxima chega a zero. Ou seja, os EUA estão totalmente previstos, a força associativa do CS para de crescer e o condicionamento está completo.

Modelo R – W: extinctionEdit

Comparando a força do associado pelo modelo RW na aprendizagem

O processo associativo descrito pelo modelo R – W também contas de extinção (ver “procedimentos” acima). O procedimento de extinção começa com uma força associativa positiva do CS, o que significa que o CS prevê que ocorrerá o US. Em um julgamento de extinção, os EUA não ocorrem após o CS. Como resultado deste resultado “surpreendente”, a força associativa do CS diminui. A extinção está completa quando a força do CS chega a zero; nenhum US é previsto e nenhum US ocorre. No entanto, se esse mesmo CS for apresentado sem o US, mas acompanhado por um inibidor condicionado bem estabelecido (CI), ou seja, um estímulo que prevê a ausência de um US (em termos de RW, um estímulo com uma força associada negativa), então RW prevê que o CS não sofrerá extinção (seu V não diminuirá de tamanho).

Modelo R – W: BlockEdit

Artigo principal: Efeito de bloqueio

A contribuição mais importante e inovadora do modelo R – W é a suposição de que o condicionamento de um CS depende não apenas desse CS sozinho, e sua relação com os EUA, mas também de todos os outros estímulos presentes na situação de condicionamento. Em particular, o modelo afirma que o O US é previsto pela soma das forças associativas de todos os estímulos presentes na situação de condicionamento íon. O aprendizado é controlado pela diferença entre essa força associativa total e a força apoiada pelos EUA. Quando essa soma de forças atinge um máximo definido pelos EUA, o condicionamento termina conforme descrito.:85-89

A explicação R-W do fenômeno de bloqueio ilustra uma consequência da suposição que acabamos de afirmar. No bloqueio (veja “fenômenos” acima), CS1 é pareado com um US até que o condicionamento seja concluído. Em seguida, em testes de condicionamento adicionais, um segundo estímulo (CS2) aparece junto com CS1, e ambos são seguidos pelos EUA. Por fim, CS2 é testado e não produz nenhuma resposta porque o aprendizado sobre CS2 foi “bloqueado” pelo aprendizado inicial sobre CS1. O modelo R – W explica isso dizendo que, após o condicionamento inicial, CS1 prevê totalmente os EUA. Como não há diferença entre o que é previsto e o que acontece, nenhum novo aprendizado acontece nas tentativas adicionais com CS1 + CS2, portanto, CS2 posteriormente não produz resposta.

Questões teóricas e alternativas para o ModelEdit Rescorla-Wagner

Uma das principais razões para a importância do modelo R – W é que ele é relativamente simples e faz previsões claras. Os testes dessas previsões levaram a uma série de novas descobertas importantes e a um entendimento consideravelmente maior do condicionamento. Algumas novas informações apoiaram a teoria, mas muitas não, e é geralmente aceito que a teoria é, na melhor das hipóteses, simples demais. No entanto, nenhum modelo isolado parece explicar todos os fenômenos que os experimentos produziram. A seguir, um breve resumo aries de algumas questões teóricas relacionadas.

Conteúdo de learningEdit

O modelo R – W reduz o condicionamento à associação de um CS e US, e mede isso com um único número, o associativo força do CS. Uma série de descobertas experimentais indicam que se aprende mais do que isso. Entre eles estão dois fenômenos descritos anteriormente neste artigo

  • Inibição latente: Se um sujeito é repetidamente exposto ao CS antes do início do condicionamento, o condicionamento leva mais tempo. O modelo R – W não pode explicar isso porque a pré-exposição deixa a força do CS inalterada em zero.
  • Recuperação da resposta após a extinção: Parece que algo permanece após a extinção reduziu a força associativa a zero porque vários procedimentos causam responder para reaparecer sem condicionamento adicional.

Papel da atenção no learningEdit

A inibição latente pode acontecer porque um sujeito para de se concentrar em um CS que é visto com frequência antes de ser emparelhado com um US.Na verdade, as mudanças na atenção ao CS estão no cerne de duas teorias proeminentes que tentam lidar com resultados experimentais que dão dificuldade ao modelo R – W. Em um deles, proposto por Nicholas Mackintosh, a velocidade do condicionamento depende da quantidade de atenção dedicada ao CS, e essa quantidade de atenção, por sua vez, depende de quão bem o CS prevê o US. Pearce e Hall propuseram um modelo relacionado com base em um princípio de atenção diferente. Ambos os modelos foram amplamente testados e nenhum explica todos os resultados experimentais. Consequentemente, vários autores têm tentado modelos híbridos que combinam os dois processos atencionais. Pearce e Hall em 2010 integraram suas ideias de atenção e até sugeriram a possibilidade de incorporar a equação de Rescorla-Wagner em um modelo integrado.

ContextEdit

Como afirmado anteriormente, uma ideia-chave no condicionamento é que o CS sinaliza ou prediz os EUA (consulte “procedimento de contingência zero” acima). No entanto, por exemplo, a sala em que ocorre o condicionamento também “prediz” que o US pode ocorrer. Ainda assim, a sala prevê com muito menos certeza do que o próprio CS experimental, porque a sala também está lá entre os ensaios experimentais, quando os EUA estão ausentes. O papel de tal contexto é ilustrado pelo fato de que os cães no experimento de Pavlov às vezes começavam a salivar ao se aproximarem do aparato experimental, antes de ver ou ouvir qualquer CS. Esses chamados estímulos de “contexto” estão sempre presentes, e sua influência ajuda a explicar algumas descobertas experimentais que de outra forma seriam intrigantes. A força associativa dos estímulos de contexto pode ser inserida na equação de Rescorla-Wagner e eles desempenham um papel importante nas teorias comparativas e computacionais descritas abaixo.

Teoria do comparador Editar

Para descobrir o que foi aprendido, devemos de alguma forma medir o comportamento (“desempenho”) em uma situação de teste. No entanto, como os alunos sabem muito bem, o desempenho em uma situação de teste nem sempre é um boa medida do que foi aprendido. Quanto ao condicionamento, há evidências de que os sujeitos em um experimento de bloqueio aprendem algo sobre o CS “bloqueado”, mas falham em mostrar esse aprendizado devido à maneira como geralmente são testados d.

As teorias de condicionamento do “comparador” são “baseadas no desempenho”, ou seja, enfatizam o que está acontecendo no momento do teste. Em particular, eles observam todos os estímulos que estão presentes durante o teste e como as associações adquiridas por esses estímulos podem interagir. Para simplificar um pouco, as teorias do comparador assumem que durante o condicionamento o sujeito adquire associações CS-US e context-US. No momento do teste, essas associações são comparadas e uma resposta ao CS ocorre apenas se a associação CS-US for mais forte do que a associação contexto-US. Depois que um CS e US são repetidamente emparelhados na aquisição simples, a associação CS-US é forte e a associação contexto-US é relativamente fraca. Isso significa que o CS elicia um CR forte. Em “contingência zero” (veja acima), a resposta condicionada é fraca ou ausente porque a associação contexto-US é quase tão forte quanto a associação CS-US. Bloqueio e outros fenômenos mais sutis também podem ser explicados por teorias de comparação, no entanto, novamente, eles não podem explicar tudo.

Teoria computacional Editar

A necessidade de um organismo de prever eventos futuros é central para as teorias modernas de condicionamento. A maioria das teorias usa associações entre estímulos para cuidar dessas previsões. Por exemplo: no modelo R – W, a força associativa de um CS nos diz com que intensidade esse CS prediz um US. Uma abordagem diferente para a previsão é sugerida por modelos como o proposto por Gallistel & Gibbon (2000, 2002). Aqui, a resposta não é determinada por forças associativas. Em vez disso, o organismo registra os tempos de início e deslocamento de CSs e USs e os usa para calcular a probabilidade de que os US sigam o CS. Vários experimentos mostraram que humanos e animais podem aprender a cronometrar eventos (consulte Cognição animal), e o modelo Gallistel & Gibbon produz ajustes quantitativos muito bons para uma variedade de dados experimentais. No entanto, estudos recentes sugeriram que os modelos baseados na duração não podem levar em conta algumas descobertas empíricas, bem como os modelos associativos.

Modelos baseados em elementos Editar

O modelo Rescorla-Wagner trata um estímulo como uma entidade única, e representa a força associativa de um estímulo com um número, sem registro de como esse número foi alcançado. Conforme observado acima, isso torna difícil para o modelo levar em conta uma série de resultados experimentais. Mais flexibilidade é fornecida assumindo que um estímulo é internamente representado por uma coleção de elementos, cada um dos quais pode mudar de um estado associativo para outro.Por exemplo, a semelhança de um estímulo com outro pode ser representada dizendo que os dois estímulos compartilham elementos em comum. Esses elementos compartilhados ajudam a explicar a generalização do estímulo e outros fenômenos que podem depender da generalização. Além disso, diferentes elementos dentro do mesmo conjunto podem ter associações diferentes, e suas ativações e associações podem mudar em momentos diferentes e em taxas diferentes. Isso permite que os modelos baseados em elementos lidem com alguns resultados inexplicáveis.

O modelEdit de SOP

Um exemplo proeminente da abordagem de elemento é o modelo “SOP” de Wagner. O modelo foi elaborado de várias maneiras desde a sua introdução, e agora pode, em princípio, explicar uma grande variedade de descobertas experimentais. O modelo representa qualquer estímulo dado com uma grande coleção de elementos. O tempo de apresentação de vários estímulos, o estado de seus elementos , e as interações entre os elementos, todos determinam o curso dos processos associativos e os comportamentos observados durante os experimentos de condicionamento.

A descrição do SOP do condicionamento simples exemplifica alguns fundamentos do modelo SOP. Para começar, o modelo assume que CS e US são representados por um grande grupo de elementos. Cada um desses elementos de estímulo pode estar em um de três estados:

  • atividade primária (A1) – Grosso modo, o estímulo é “atendido”. (As referências a “atenção” destinam-se apenas a auxiliar a compreensão e não fazem parte do modelo.)
  • atividade secundária (A2) – O estímulo é “atendido perifericamente”.
  • inativo (I) – O estímulo é “não atendido”.

Dos elementos que representam um único estímulo em um determinado momento, alguns podem estar no estado A1, alguns no estado A2, e alguns no estado I.

Quando um estímulo aparece pela primeira vez, alguns de seus elementos saltam da inatividade I para a atividade primária A1. Do estado A1 eles decaem gradualmente para A2 e, finalmente, voltam para I. Atividade do elemento só pode mudar desta forma; em particular, os elementos em A2 não podem voltar diretamente para A1. Se os elementos de ambos CS e US estiverem no estado A1 ao mesmo tempo, uma associação é aprendida entre os dois estímulos. significa que se, em um momento posterior, o CS for apresentado à frente dos EUA, e alguns elementos do CS entrarem em A1, esses elementos irão ativar alguns elementos dos EUA. No entanto, os elementos dos EUA são ativados indiretamente desta forma só é impulsionado para o estado A2. (Isso pode ser pensado no CS despertando uma memória dos EUA, que não será tão forte quanto a coisa real.) Com os repetidos testes CS-US, mais e mais elementos são associados e mais e mais elementos dos EUA vão para A2 quando o CS é ativado. Isso deixa gradualmente cada vez menos elementos dos EUA que podem entrar em A1 quando o próprio EUA aparece. Em conseqüência, a aprendizagem desacelera e se aproxima de um limite. Pode-se dizer que os EUA estão “totalmente previstos” ou “não é surpreendente” porque quase todos os seus elementos só podem entrar em A2 quando o CS surge, deixando poucos para formar novas associações.

O modelo pode explicar as descobertas que são contabilizadas pelo modelo Rescorla-Wagner e uma série de descobertas adicionais também. Por exemplo, ao contrário da maioria dos outros modelos, o SOP leva o tempo em consideração. O aumento e diminuição da ativação do elemento permite que o modelo explique os efeitos dependentes do tempo, como o fato de que o condicionamento é mais forte quando o CS vem logo antes dos EUA, e que quando o CS vem depois dos EUA (“condicionamento para trás”), o resultado costuma ser um CS inibitório. Muitos outros fenômenos mais sutis também são explicados.

Vários outros modelos poderosos surgiram nos últimos anos que incorporam representações de elementos. Freqüentemente, eles incluem a suposição de que as associações envolvem uma rede de conexões entre “nós” que representam estímulos, respostas e talvez uma ou mais camadas “ocultas” de interconexões intermediárias. Esses modelos fazem contato com uma explosão atual de pesquisas em redes neurais, inteligência artificial e aprendizado de máquina.

Write a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *