Źródła danychEdytuj
Eksperymenty dotyczące teoretycznych zagadnień kondycjonowania przeprowadzano głównie na kręgowcach, zwłaszcza na szczurach i gołębiach. Jednak kondycjonowanie badano również u bezkręgowców, a bardzo ważne dane na temat neuronowych podstaw warunkowania pochodzą z eksperymentów na ślimaku morskim Aplysia. W większości odpowiednich eksperymentów stosowano procedurę warunkowania klasycznego, chociaż stosowano również eksperymenty warunkowania instrumentalnego (operantowego), a siłę warunkowania klasycznego często mierzy się za pomocą jego efektów operantowych, jak w warunkowej supresji (patrz sekcja Zjawiska powyżej) i auto-kształtowaniu.
Teoria substytucji bodźcówEdytuj
Według Pavlova warunkowanie nie obejmuje nabywania żadnego nowego zachowania, ale raczej tendencję do reagowania stare sposoby na nowe bodźce. Stąd teoretyzował, że CS jedynie zastępuje Stany Zjednoczone w wywoływaniu odruchowej odpowiedzi. Wyjaśnienie to nazywa się teorią warunkowania substytucji bodźców: 84. Krytycznym problemem związanym z teorią substytucji bodźców jest to, że CR i UR nie zawsze są takie same. Sam Pawłow zauważył, że ślina psa produkowana jako CR różniła się składem od śliny wytwarzanej jako UR. CR jest czasami nawet przeciwieństwem UR. Na przykład: bezwarunkową reakcją na porażenie prądem jest przyspieszenie akcji serca, mając na uwadze, że kortykosteroidy, które zostały połączone z porażeniem elektrycznym, powodują zmniejszenie częstości akcji serca (zaproponowano jednak, że tylko wtedy, gdy UR nie obejmuje ośrodkowego układu nerwowego, CR i UR są przeciwieństwami).
Model Rescorla – WagnerEdit
Model Rescorla – Wagner (R – W) jest stosunkowo prostym, ale silnym modelem warunkowania. przewiduje szereg ważnych zjawisk, ale także zawodzi pod wieloma względami, prowadząc w ten sposób do szeregu modyfikacji i alternatywnych modeli. Jednakże, ponieważ wiele badań teoretycznych nad uwarunkowaniami w ciągu ostatnich 40 lat zostało zainicjowanych przez ten model lub reakcje na model R – W zasługuje na krótki opis w tym miejscu. : 85
Model Rescorla-Wagner dowodzi, że istnieje ograniczenie ilości uwarunkowań, które mogą wystąpić podczas parowania dwóch bodźców. Jednym z wyznaczników tego limitu jest natura Stanów Zjednoczonych. Na przykład: połączenie dzwonka z soczystym stekiem powoduje większe wydzielanie śliny niż połączenie dzwonka z kawałkiem suchego chleba, a suchy chleb prawdopodobnie będzie działał lepiej niż kawałek tektury. Kluczową ideą stojącą za modelem R – W jest to, że CS sygnalizuje lub przewiduje Stany Zjednoczone. Można powiedzieć, że przed uwarunkowaniem badany jest zaskoczony przez Stany Zjednoczone. Jednak po uwarunkowaniu podmiot nie jest już zaskoczony, ponieważ CS przewiduje nadejście Stanów Zjednoczonych. (Zwróć uwagę, że model można opisać matematycznie, a słowa takie jak przewidywanie, zaskoczenie i oczekiwanie są używane tylko w celu wyjaśnienia modelu). Tutaj działanie modelu zilustrowano krótkimi opisami przejęcia, wymierania i blokowania. Model przewiduje również szereg innych zjawisk, patrz główny artykuł na temat modelu.
EquationEdit
To jest równanie Rescorli-Wagnera. Określa ilość uczenia się, która nastąpi przy pojedynczym połączeniu bodźca warunkującego (CS) z bodźcem bezwarunkowym (US). Powyższe równanie jest wielokrotnie rozwiązywane, aby przewidzieć przebieg uczenia się w wielu takich próbach.
W tym modelu stopień uczenia się jest mierzony na podstawie tego, jak dobrze CS przewiduje Stany Zjednoczone, co jest określane przez „siłę asocjacyjną „z CS. W równaniu V reprezentuje aktualną siłę asocjacyjną CS, a ΔV jest zmianą tej siły, która ma miejsce w danej próbie. ΣV jest sumą sił wszystkich bodźców obecnych w sytuacji. λ jest maksymalną siłą asocjacyjną, jaką dane USA będą wspierać; jego wartość jest zwykle ustawiona na 1 w próbach, gdy Stany Zjednoczone są obecne i 0, gdy USA są nieobecne. α i β to stałe związane z istotnością CS i szybkością uczenia się dla danego USA. W następnych sekcjach wyjaśniono, w jaki sposób równanie przewiduje różne wyniki eksperymentalne. Więcej szczegółów można znaleźć w głównym artykule na temat modelu.:85–89
Model R – W: PozyskiwanieEdit
Model R – W mierzy warunkowanie poprzez przypisanie „siły asocjacyjnej” do CS i innych lokalnych bodźców. Przed uwarunkowaniem CS ma asocjacyjną siłę równą zero. Powiązanie CS i US powoduje stopniowy wzrost asocjacyjnej siły CS. Wzrost ten determinowany jest charakterem Stanów Zjednoczonych (np. Intensywnością).: 85–89 Ilość uczenia się, która ma miejsce podczas pojedynczego parowania CS-US zależy od różnicy między całkowitą siłą asocjacyjną CS i innych bodźców obecnych w sytuacji (ΣV w równaniu), a wartością maksymalną ustaloną przez USA ( λ w równaniu). Przy pierwszym parowaniu CS i US ta różnica jest duża, a asocjacyjna siła CS robi duży krok w górę. W miarę kumulacji par CS-US Stany Zjednoczone stają się bardziej przewidywalne, a wzrost siły asocjacyjnej w każdej próbie staje się coraz mniejszy. Wreszcie różnica między mocą asocjacyjną CS (plus jakąkolwiek, która może narosnąć na inne bodźce) a maksymalną siłą osiąga zero. Oznacza to, że Stany Zjednoczone są w pełni przewidziane, siła asocjacyjna CS przestaje rosnąć, a warunkowanie jest zakończone.
Model R – W: extinctionEdit
Porównanie siły skojarzonej przez model RW w uczeniu się
Proces asocjacyjny opisany przez model R – W również odpowiada za wymieranie (patrz „procedury” powyżej). Procedura wygaszania zaczyna się od pozytywnej asocjacyjnej siły CS, co oznacza, że CS przewiduje, że USA wystąpią. Podczas próby wyginięcia USA nie wystąpią po CS. W wyniku tego „zaskakującego” wyniku, asocjacyjna siła CS zmniejsza się. Wygaśnięcie jest zakończone, gdy siła CS osiągnie zero; nie przewiduje się żadnego US i nie występuje USA. Jednakże, jeśli ten sam CS jest prezentowany bez US, ale towarzyszy mu dobrze znany inhibitor warunkowy (CI), to znaczy bodziec, który przewiduje brak US (w terminach RW, bodziec o ujemnej sile asocjacyjnej), wówczas RW przewiduje, że CS nie będzie ulega wymarciu (jego V nie zmniejszy się).
Model R – W: blockingEdit
Najważniejszy i nowatorski wkład modelu R – W jest jego założeniem, że uwarunkowanie CS zależy nie tylko od tego samego CS i jego związku z USA, ale także od wszystkich innych bodźców obecnych w sytuacji warunkującej. US jest przewidywane przez sumę asocjacyjnych sił wszystkich bodźców obecnych w sytuacji warunkowej jon. Nauka jest kontrolowana przez różnicę między całkowitą siłą asocjacyjną a siłą wspieraną przez Stany Zjednoczone. Kiedy suma sił osiągnie maksimum ustalone przez Stany Zjednoczone, warunkowanie kończy się tak, jak opisano powyżej .:85–89
Wyjaśnienie R – W zjawiska blokowania ilustruje jedną konsekwencję właśnie stwierdzonego założenia. W blokowaniu (patrz „zjawiska” powyżej) CS1 jest sparowany z US aż do zakończenia warunkowania. Następnie w dodatkowych próbach warunkujących pojawia się drugi bodziec (CS2) wraz z CS1, a po obu następuje USA. Na koniec testowano CS2 i wykazano, że nie daje żadnej odpowiedzi, ponieważ uczenie się o CS2 zostało „zablokowane” przez wstępne uczenie się o CS1. Model R – W wyjaśnia to, mówiąc, że po wstępnym uwarunkowaniu CS1 w pełni przewiduje Stany Zjednoczone. różnica między tym, co jest przewidywane a tym, co się dzieje, w dodatkowych próbach z CS1 + CS2 nie dochodzi do nowego uczenia się, stąd CS2 później nie daje odpowiedzi.
Zagadnienia teoretyczne i alternatywy dla modelu Rescorla – WagneraEdytuj
Jednym z głównych powodów znaczenia modelu R – Z jest to, że jest on stosunkowo prosty i daje jasne prognozy. Testy tych przewidywań doprowadziły do wielu ważnych nowych odkryć i znacznie lepszego zrozumienia uwarunkowań. nowe informacje potwierdziły teorię, ale wiele nie, i ogólnie przyjmuje się, że teoria jest w najlepszym przypadku zbyt prosta. Jednak żaden pojedynczy model nie wydaje się uwzględniać wszystkich zjawisk, które wywołały eksperymenty. Poniżej znajduje się krótkie podsumowanie niektóre powiązane zagadnienia teoretyczne.
Treść uczenia sięEdit
Model R – W redukuje warunkowanie do skojarzenia CS i US i mierzy to za pomocą jednej liczby, asocjacyjnej siła CS. Szereg odkryć eksperymentalnych wskazuje, że można nauczyć się więcej niż to. Wśród nich znajdują się dwa zjawiska opisane wcześniej w tym artykule.
- Utajone hamowanie: jeśli podmiot jest wielokrotnie wystawiany na działanie kortykosteroidów przed rozpoczęciem warunkowania, wtedy warunkowanie trwa dłużej. Model R – W nie może tego wyjaśnić, ponieważ ekspozycja wstępna pozostawia siłę CS niezmienioną na poziomie zerowym.
- Odzyskiwanie odpowiedzi po wyginięciu: wydaje się, że coś pozostaje po wygaszeniu zmniejszyło siłę asocjacyjną do zera, ponieważ kilka procedur powoduje reaguje na ponowne pojawienie się bez dalszego warunkowania.
Rola uwagi w uczeniu sięEdytuj
Utajone zahamowanie może się zdarzyć, ponieważ podmiot przestaje skupiać się na CS, który jest często widywany, zanim zostanie sparowany z US.W rzeczywistości zmiany uwagi na CS są sednem dwóch wybitnych teorii, które próbują poradzić sobie z wynikami eksperymentalnymi, które sprawiają, że model R – W jest trudny. W jednym z nich, zaproponowanym przez Nicholasa Mackintosha, szybkość warunkowania zależy od ilości uwagi poświęconej CS, a ta ilość zależy z kolei od tego, jak dobrze CS przewiduje USA. Pearce i Hall zaproponowali podobny model oparty na innej zasadzie uwagi Oba modele zostały szeroko przetestowane i żaden z nich nie wyjaśnia wszystkich wyników eksperymentalnych. W związku z tym różni autorzy podjęli próby modeli hybrydowych, które łączą dwa procesy uwagi. Pearce i Hall w 2010 roku połączyli swoje pomysły uwagi, a nawet zasugerowali możliwość włączenia równania Rescorli-Wagnera do zintegrowanego modelu.
ContextEdit
Jak wspomniano wcześniej, kluczowa idea warunkowania polega na tym, że CS sygnalizuje lub przewiduje Stany Zjednoczone (patrz „procedura zerowej awaryjności” powyżej). Jednak na przykład pomieszczenie, w którym ma miejsce warunkowanie, również „przewiduje”, że mogą wystąpić Stany Zjednoczone. Mimo to pomieszczenie przewiduje ze znacznie mniejszą pewnością niż sam eksperymentalny CS, ponieważ pomieszczenie istnieje również między próbami eksperymentalnymi, kiedy nie ma Stanów Zjednoczonych. Rolę takiego kontekstu ilustruje fakt, że psy w eksperymencie Pawłowa czasami zaczynały ślinić się, gdy zbliżały się do aparatu doświadczalnego, zanim zobaczyły lub usłyszały jakiekolwiek CS. Takie tak zwane bodźce „kontekstowe” są zawsze obecne i ich wpływ pomaga wyjaśnić pewne zagadkowe wyniki eksperymentalne. Asocjacyjną siłę bodźców kontekstowych można wprowadzić do równania Rescorli-Wagnera i odgrywają one ważną rolę w komparatorach i teoriach obliczeniowych opisanych poniżej.
Teoria porównawczaEdytuj
Aby dowiedzieć się, czego się nauczyliśmy, musimy w jakiś sposób zmierzyć zachowanie („wydajność”) w sytuacji testowej. Jednak, jak dobrze wiedzą uczniowie, wyniki w sytuacji testowej jest dobrą miarą tego, czego się nauczyliśmy. Jeśli chodzi o warunkowanie, istnieją dowody na to, że osoby biorące udział w eksperymencie blokującym uczą się czegoś o „zablokowanym” CS, ale nie pokazują tego uczenia się, ponieważ zazwyczaj są d.
Teorie warunkowania oparte na „komparatorach” są „oparte na wynikach”, to znaczy podkreślają to, co się dzieje w czasie testu. W szczególności przyglądają się wszystkim bodźcom obecnym podczas testowania i temu, jak mogą oddziaływać na siebie skojarzenia nabyte przez te bodźce. Aby nieco uprościć, teorie porównawcze zakładają, że podczas warunkowania podmiot uzyskuje skojarzenia zarówno CS-US, jak i kontekst-US. W czasie testu skojarzenia te są porównywane, a odpowiedź na CS występuje tylko wtedy, gdy powiązanie CS-US jest silniejsze niż powiązanie kontekst-USA. Po wielokrotnym parowaniu CS i US w prostej akwizycji, powiązanie CS-US jest silne, a powiązanie kontekst-US jest stosunkowo słabe. Oznacza to, że CS wywołuje silne CR. W przypadku „zerowej awaryjności” (patrz powyżej) warunkowa odpowiedź jest słaba lub nieobecna, ponieważ powiązanie kontekst-USA jest mniej więcej tak silne, jak powiązanie CS-US. Blokowanie i inne bardziej subtelne zjawiska można jednak wyjaśnić również teoriami porównawczymi, znowu nie są w stanie wyjaśnić wszystkiego.
Teoria obliczeniowaEdytuj
Potrzeba przewidywania przyszłych wydarzeń przez organizm ma kluczowe znaczenie dla współczesnych teorii uwarunkowań. Większość teorii wykorzystuje skojarzenia między bodźcami, aby zająć się tymi przewidywaniami. Na przykład: W modelu R – W siła asocjacyjna CS mówi nam, jak mocno CS przewiduje USA. Inne podejście do przewidywania sugerują modele, takie jak zaproponowane przez Gallistela & Gibbona (2000, 2002). Tutaj odpowiedź nie jest określana przez siły asocjacyjne. Zamiast tego organizm rejestruje czasy wystąpienia i przesunięcia CS i US i wykorzystuje je do obliczenia prawdopodobieństwa, że Stany Zjednoczone będą postępować zgodnie z CS. Szereg eksperymentów wykazało, że ludzie i zwierzęta mogą uczyć się do zdarzeń czasowych (zobacz Poznanie zwierząt), a model Gallistela & Gibbona daje bardzo dobre ilościowe dopasowanie do różnych danych eksperymentalnych. Jednak ostatnie badania sugerują, że modele oparte na czasie trwania nie mogą uwzględniać niektórych ustaleń empirycznych, a także modeli asocjacyjnych.
Modele oparte na elementachEdytuj
Model Rescorla-Wagner traktuje bodziec jako pojedynczą jednostkę i reprezentuje asocjacyjną siłę bodźca o jednej liczbie, bez zapisów, jak ta liczba została osiągnięta. Jak wspomniano powyżej, utrudnia to modelowi uwzględnienie szeregu wyników eksperymentalnych. Większą elastyczność zapewnia założenie, że bodziec jest wewnętrznie reprezentowany przez zbiór elementów, z których każdy może zmieniać się z jednego stanu asocjacyjnego w inny.Na przykład podobieństwo jednego bodźca do drugiego można przedstawić, mówiąc, że te dwa bodźce mają wspólne elementy. Te wspólne elementy pomagają wyjaśnić uogólnienie bodźca i inne zjawiska, które mogą zależeć od uogólnienia. Ponadto różne elementy w tym samym zestawie mogą mieć różne skojarzenia, a ich aktywacje i skojarzenia mogą zmieniać się w różnym czasie iz różną szybkością. Pozwala to modelom opartym na elementach obsłużyć niektóre w inny sposób niewytłumaczalne wyniki.
SOP modelEdit
Wybitnym przykładem podejścia opartego na elementach jest model „SOP” Wagnera. Model został opracowywany na różne sposoby od czasu jego wprowadzenia, a obecnie może wyjaśniać w zasadzie bardzo szeroką gamę wyników eksperymentalnych. Model reprezentuje dowolny dany bodziec z dużym zbiorem elementów. Czas prezentacji różnych bodźców, stan ich elementów i interakcje między elementami determinują przebieg procesów asocjacyjnych i zachowania obserwowane podczas eksperymentów warunkujących.
Konto SOP prostego warunkowania stanowi przykład niektórych zasadniczych elementów modelu SOP. Na początek model zakłada, że zarówno CS, jak i US są reprezentowane przez dużą grupę elementów. Każdy z tych elementów bodźca może znajdować się w jednym z trzech stanów:
- aktywność podstawowa (A1) – Mówiąc ogólnie, bodziec jest „zajęty”. (Odniesienia do „uwagi” mają jedynie pomóc w zrozumieniu i nie są częścią modelu).
- działanie drugorzędne (A2) – bodziec jest „zajęty obwodowo”.
- nieaktywny (I) – bodziec „nie jest obsługiwany”.
Spośród elementów, które reprezentują pojedynczy bodziec w danym momencie, niektóre mogą znajdować się w stanie A1, inne w stanie A2, a niektóre w stanie I.
Kiedy bodziec pojawia się po raz pierwszy, niektóre jego elementy przeskakują z nieaktywności I do podstawowej aktywności A1. Ze stanu A1 stopniowo zanikają do A2, a ostatecznie z powrotem do I. Aktywność elementu może się zmieniać tylko w ten sposób; w szczególności elementy w A2 nie mogą powrócić bezpośrednio do A1. Jeśli elementy zarówno CS, jak i US są w tym samym czasie w stanie A1, uczy się skojarzenia między tymi dwoma bodźcami. oznacza, że jeśli w późniejszym czasie CS zostanie zaprezentowany przed USA, a niektóre elementy CS wejdą do A1, elementy te aktywują niektóre elementy US. Jednak elementy US aktywowane pośrednio w ten sposób tylko zostanie wzmocniony do stanu A2. (Można to sobie wyobrazić, że CS budzi pamięć o USA, które nie będzie tak silne, jak w rzeczywistości). Z powtarzanymi próbami CS-US wiąże się coraz więcej elementów i coraz więcej elementów amerykańskich trafia do A2 kiedy włączy się CS. To stopniowo pozostawia coraz mniej elementów US, które mogą wejść do A1, gdy pojawi się sam US. W konsekwencji uczenie się zwalnia i zbliża się do granicy. Można powiedzieć, że Stany Zjednoczone są „w pełni przewidywane” lub „nie są zaskakujące”, ponieważ prawie wszystkie jego elementy mogą wejść do A2 tylko wtedy, gdy pojawi się CS, pozostawiając niewiele do utworzenia nowych skojarzeń.
Model może wyjaśnić ustalenia, które są uwzględnione w modelu Rescorla-Wagner, a także szereg dodatkowych ustaleń. Na przykład, w przeciwieństwie do większości innych modeli, SOP wymaga czasu. Wzrost i zanik aktywacji pierwiastków umożliwia modelowi wyjaśnienie efektów zależnych od czasu, takich jak fakt, że warunkowanie jest najsilniejsze, gdy CS pojawia się tuż przed USA, a kiedy CS pojawia się po USA („warunkowanie wsteczne”), wynik jest często hamującą CS. Wiele innych, bardziej subtelnych zjawisk jest również wyjaśnionych.
W ostatnich latach pojawiło się wiele innych potężnych modeli, które zawierają reprezentacje elementów. Często zawierają one założenie, że skojarzenia obejmują sieć połączenia między „węzłami”, które reprezentują bodźce, odpowiedzi i być może jedną lub więcej „ukrytych” warstw pośrednich połączeń. Takie modele stykają się z obecną eksplozją badań nad sieciami neuronowymi, sztuczną inteligencją i uczeniem maszynowym.