- Förklara vad som är quasi-experimentell forskning och skiljer den tydligt från både experimentell och korrelationsforskning.
- Beskriv tre olika typer av kvasi-experimentella forskningsdesigner (icke-motsvarande grupper, förprov efter post och avbrutna tidsserier) och identifiera exempel på var och en.
Prefixet kvasi betyder ”liknar.” Således är kvasi-experimentell forskning forskning som liknar experimentell forskning men inte är sann experimentell forskning. Även om den oberoende variabeln manipuleras tilldelas deltagarna inte slumpmässigt villkor eller ordningsvillkor (Cook & Campbell, 1979) Eftersom den oberoende variabeln manipuleras innan den beroende variabeln mäts, eliminerar kvasi-experimentell forskning riktningsproblemet. Men eftersom deltagarna inte slumpmässigt tilldelas – vilket gör det troligt att det finns andra skillnader mellan förhållanden – kvasi-experimentell forskning eliminerar inte problemet med förvirrande variabler. När det gäller intern validitet är kvasi-experiment därför i allmänhet någonstans mellan korrelationsstudier och sanna experiment.
Quasi-experiment kommer sannolikt att utföras i fältinställningar i vilken slumpmässig uppgift är svår eller omöjlig. De utförs ofta för att utvärdera effektiviteten av en behandling – pe kanske en typ av psykoterapi eller en pedagogisk intervention. Det finns många olika typer av kvasi-experiment, men vi kommer att diskutera några av de vanligaste här.
Minns att när deltagare i ett experiment mellan ämnen slumpmässigt tilldelas villkor, blir de resulterande grupperna är sannolikt ganska lika. Faktum är att forskare anser att de är likvärdiga. När deltagarna inte slumpmässigt tilldelas villkoren är det troligt att de resulterande grupperna är olika på vissa sätt. Av denna anledning anser forskare att de inte är likvärdiga. En icke-motsvarande gruppdesign är alltså en design mellan ämnen där deltagarna inte slumpmässigt har tilldelats villkor.
Tänk dig till exempel en forskare som vill utvärdera en ny metod för att undervisa fraktioner till tredje väghyvlar. Ett sätt skulle vara att genomföra en studie med en behandlingsgrupp bestående av en klass av elever av tredje klass och en kontrollgrupp som består av en annan klass av elever av tredje klass. Denna design skulle vara en icke-motsvarande gruppdesign eftersom studenterna inte slumpmässigt tilldelas klasser av forskaren, vilket innebär att det kan finnas viktiga skillnader mellan dem. Till exempel kan föräldrarna till högre elever eller mer motiverade elever ha varit mer benägna att begära att deras barn tilldelas till Williams Williams klass. Eller rektorn kan ha tilldelat ”bråkmakarna” till herr Jones klass för att han är en starkare disciplinär. Naturligtvis kan lärarnas stilar, och till och med klassrumsmiljöerna, vara väldigt olika och kan orsaka olika nivåer av prestation eller motivation bland Om det i slutet av studien fanns en skillnad i de två klassernas kunskap om fraktioner, kan det ha orsakats av skillnaden mellan undervisningsmetoderna – men det kan ha orsakats av någon av dessa förvirrande variabler. / p>
Naturligtvis kan forskare som använder en ekvivalent gruppdesign vidta åtgärder för att se till att deras grupper är så lika som möjligt. I det aktuella exemplet kan forskaren försöka välja två klasser vid samma skola, där eleverna i de två klasserna har liknande poäng på ett standardiserat matematikprov och lärarna är av samma kön, har nära ålder och har liknande undervisningsstilar. Att ta sådana steg skulle öka den interna giltigheten av studien eftersom det skulle eliminera några av de viktigaste förvirrande variablerna. Men utan riktigt slumpmässigt tilldelning av eleverna till förhållanden, finns det fortfarande möjligheten till andra viktiga förvirrande variabler som forskaren inte kunde kontrollera.
Förprov-posttestdesign
I ett förprov -posttest design, den beroende variabeln mäts en gång innan behandlingen implementeras och en gång efter att den har implementerats. Föreställ dig till exempel en forskare som är intresserad av effektiviteten av ett antidrogramprogram på grundskolestudenters attityder till illegala droger. Forskaren kunde mäta elevernas attityder vid en viss grundskola under en vecka, genomföra antidrogramprogrammet under nästa vecka och slutligen mäta deras attityder igen nästa vecka. Förtest-posttestdesignen är ungefär som ett experiment inom försökspersoner där varje deltagare testas först under kontrollförhållandet och sedan under behandlingsförhållandet.Det skiljer sig från ett experiment inom försökspersonerna, dock genom att villkorens ordning inte motverkas eftersom det vanligtvis inte är möjligt för en deltagare att testas i behandlingstillståndet först och sedan i ett ”obehandlat” kontrolltillstånd.
Om den genomsnittliga poängen för eftertest är bättre än den genomsnittliga förtestpoängen, är det vettigt att dra slutsatsen att behandlingen kan vara ansvarig för förbättringen. Tyvärr kan man ofta inte avsluta detta med hög säkerhet eftersom det kan finnas andra förklaringar till varför posttestpoängen är bättre. En kategori alternativa förklaringar går under historiens namn. Andra saker kan ha hänt mellan förprovet och posttestet. Kanske ett antidrugsprogram sändes på tv och många av eleverna såg det, eller kanske en kändis dog av en överdos av läkemedel och många av eleverna hörde talas om det. En annan kategori av alternativa förklaringar går under namnet mognad. Deltagarna kanske har förändrats mellan förprovet och posttestet på sätt som de ändå skulle göra för att de växer och lär sig. Om det var ett årslångt program kan deltagarna bli mindre impulsiva eller bättre resonemang och detta kan vara ansvarig för förändringen.
En annan alternativ förklaring till en förändring av den beroende variabeln i en förprovning efter posttest är regression till den elaka. Detta hänvisar till det statistiska faktumet att en person som gör extremt poäng på en variabel vid ett tillfälle tenderar att göra mindre extremt vid nästa tillfälle. Till exempel kommer en bowler med ett långsiktigt genomsnitt på 150 som plötsligt kastar en 220 nästan säkert att göra det lägre i nästa spel. Hennes poäng kommer att ”gå tillbaka” mot hennes genomsnittliga poäng på 150. Regression till medelvärdet kan vara ett problem när deltagare väljs för vidare studier på grund av deras extrema poäng. Tänk dig till exempel att endast studenter som fick särskilt lågt betyg på ett test av fraktioner får ett särskilt träningsprogram och testas sedan igen. Regression till medelvärdena men garanterar att deras poäng blir högre även om träningsprogrammet inte har någon effekt. Ett nära besläktat koncept – och ett extremt viktigt inom psykologisk forskning – är spontan remission. Detta är tendensen för många medicinska och psykologiska problem att förbättras över tiden utan någon form av behandling. Förkylning är ett bra exempel. Om man skulle mäta symtomens svårighetsgrad hos 100 förkylning idag, ge dem en skål kycklingsoppa. varje dag och sedan mäta symtomens svårighetsgrad igen på en vecka skulle de förmodligen förbättras mycket. Detta betyder inte att kycklingsoppan var ansvarig för förbättringen ver, eftersom de skulle ha förbättrats mycket utan någon behandling alls. Detsamma gäller många psykologiska problem. En grupp allvarligt deprimerade människor idag kommer sannolikt att vara mindre deprimerade i genomsnitt på 6 månader. Vid granskningen av resultaten från flera studier av behandlingar mot depression fann forskarna Michael Posternak och Ivan Miller att deltagarna i förhållandena med väntelistkontroll förbättrade i genomsnitt 10 till 15% innan de fick någon behandling alls (Posternak & Miller, 2001). Man måste alltså i allmänhet vara mycket försiktig med att dra slutsatsen om orsakssamband från förprov-posttestdesign.
Tidiga studier av effektiviteten av psykoterapi tenderade att använda förprov-posttestdesigner. I en klassisk artikel från 1952 sammanfattade forskaren Hans Eysenck resultaten av 24 sådana studier som visade att ungefär två tredjedelar av patienterna förbättrades mellan förprovet och posttestet (Eysenck, 1952). företagsregister som visar att liknande patienter återhämtade sig i ungefär samma takt utan psykoterapi. Denna parallell föreslog för Eysenck att den förbättring som patienter visade i studierna för test efter posttest kanske inte är mer än spontan remission. Observera att Eysenck inte drog slutsatsen att psykoterapi var ineffektiv. Han drog bara slutsatsen att det inte fanns några bevis för att det var, och han skrev om ”nödvändigheten av korrekt planerade och genomförda experimentella studier inom detta viktiga område” (s. 323). Du kan läsa hela artikeln här: Klassiker i historien om Psykologi.
Lyckligtvis tog många andra forskare upp Eysencks utmaning, och 1980 hade hundratals experiment genomförts där deltagarna slumpmässigt tilldelades behandlings- och kontrollförhållanden, och resultaten sammanfattades i en klassisk bok av Mary Lee Smith, Gene Glass och Thomas Miller (Smith, Glass, & Miller, 1980). De fann att den övergripande psykoterapin var ganska effektiv, med cirka 80% av behandlingsdeltagarna förbättrade mer än den genomsnittliga kontrolldeltagaren. Efterföljande forskning har fokuserat mer på de förhållanden under vilka olika typer av psykoterapi är mer eller mindre effektiva.
Interrupted Time Series Design
En variant av den tidigaste testtestdesignen är den avbrutna tidsserie-designen. En tidsserie är en uppsättning mätningar som görs med intervaller över en tidsperiod. Till exempel kan ett tillverkningsföretag mäta sina arbetstagares produktivitet varje vecka under ett år. I en avbruten tidsserie-design ”avbryts” en tidsserie som den här av en behandling. I ett klassiskt exempel var behandlingen minskningen av arbetsskiften i en fabrik från 10 timmar till 8 timmar (Cook & Campbell, 1979). Eftersom produktiviteten ökade ganska snabbt efter förkortningen av arbetsskiften och eftersom den förblev förhöjd i många månader efteråt, drog forskaren slutsatsen att förkortningen av skiften orsakade ökningen av produktivitet. Lägg märke till att den avbrutna tidsserie-designen är som en förprovning-efter-test-design genom att den inkluderar mätningar av den beroende variabeln både före och efter behandlingen. Den skiljer sig från designen för test-posttest, dock genom att den inkluderar flera förprovningar och posttestmätningar.
Figur 7.3 visar data från en hypotetisk avbruten tidsseriestudie. Den beroende variabeln är antalet studentfrånvaro per vecka i en forskningsmetodkurs. Behandlingen är att instruktören börjar delta varje dag offentligt så att eleverna vet att instruktören är medveten om vem som är närvarande och vem som är frånvarande. Den övre panelen i figur 7.3 visar hur data kan se ut om denna behandling fungerade. Det finns ett konstant stort antal frånvaro före behandlingen och det finns en omedelbar och ihållande minskning av frånvaron efter behandlingen. Den nedre panelen i figur 7.3 visar hur data kan se ut om behandlingen inte fungerade. I genomsnitt är antalet frånvaro efter behandlingen ungefär samma som antalet tidigare. Denna figur illustrerar också en fördel med den avbrutna tidsserie-designen jämfört med en enklare förprovning-posttest-design. Om det bara hade gjorts en mätning av frånvaro före behandlingen vid vecka 7 och en därefter vid vecka 8, skulle det ha sett ut som om behandlingen var ansvarig för minskningen. De flera mätningarna både före och efter behandlingen tyder på att minskningen mellan vecka 7 och 8 inte är mer än normal variation från vecka till vecka.
Kombinationsdesigner
En typ av kvasi-experimentell design som i allmänhet är bättre än antingen den icke-motsvarande gruppdesignen eller förprovet-posttest design är en som kombinerar element i båda. Det finns en behandlingsgrupp som får ett förprov, får en behandling och sedan får en posttest. Men samtidigt finns det en kontrollgrupp som får ett förprov, inte får behandlingen och sedan får ett posttest. Frågan är alltså inte bara om deltagare som får behandlingen förbättras utan om de förbättras mer än deltagare som inte får behandlingen.
Tänk dig till exempel att elever i en skola får ett förprov på deras attityder till droger, utsätts sedan för ett antidrugsprogram och får slutligen ett posttest. Studenter i en liknande skola får förprovet, utsätts inte för ett antidrogramprogram och slutligen ges ett posttest. Återigen, om studenter i behandlingstillståndet blir mer negativa mot droger, kan denna attitydförändring vara en effekt av behandlingen, men det kan också handla om historia eller mognad. Om det verkligen är en effekt av behandlingen, bör studenter i behandlingstillståndet bli mer negativa än studenter i kontrolltillståndet. Men om det handlar om historia (t.ex. nyheter om en överdos av kändisdroger) eller mognad (t.ex. förbättrat resonemang) skulle elever under de två förhållandena sannolikt visa liknande mängder förändring. Denna typ av design eliminerar dock inte möjligheten att förvirra variabler. Något kan inträffa vid en av skolorna men inte den andra (t.ex. en överdos av elever), så elever vid den första skolan skulle påverkas av den medan elever vid den andra skolan inte skulle göra det.
Slutligen, om deltagare i denna typ av design slumpmässigt tilldelas villkor blir det ett verkligt experiment snarare än ett kvasi-experiment. Det är faktiskt den typ av experiment som Eysenck efterlyste – och som nu har genomförts många gånger – för att visa effektiviteten av psykoterapi.
- Quasi-experimentell forskning innebär manipulation av en oberoende variabel utan att deltagarna slumpmässigt tilldelas villkor eller villkor.Bland de viktiga typerna finns icke-motsvarande gruppdesigner, förprov efter posttest och avbrutna tidsserieutformningar.
- Kvasi-experimentell forskning eliminerar riktningsproblemet eftersom det innebär manipulation av den oberoende variabeln. Det eliminerar emellertid inte problemet med förvirrande variabler, eftersom det inte innebär slumpmässig tilldelning till villkor. Av dessa skäl är kvasi-experimentell forskning i allmänhet högre i intern validitet än korrelationsstudier men lägre än sanna experiment.
- Övning: Föreställ dig att två professorer bestämmer sig för att testa effekten av att ge dagliga frågesporter på studenternas prestationer i en statistikkurs. De bestämmer att professor A ska göra frågesporter men professor B inte. De kommer sedan att jämföra studenternas prestationer i sina två avsnitt på en gemensam slutprov. Lista fem andra variabler som kan skilja sig mellan de två sektionerna som kan påverka resultaten.
- Diskussion: Tänk dig att en grupp överviktiga barn rekryteras till en studie där deras vikt mäts, sedan deltar de i 3 månader i ett program som uppmuntrar dem att vara mer aktiva och slutligen mäts deras vikt igen. Förklara hur vart och ett av följande kan påverka resultaten:
- regression till medelvärdet
- spontan remission
- historia
- mognad
Bildbeskrivningar
Bild 7.3 bildbeskrivning: Två linjediagram som visar antalet frånvaro per vecka under 14 veckor . De första 7 veckorna är utan behandling och de senaste 7 veckorna är under behandling. I det första linjediagrammet finns det mellan 4 och 8 frånvaro varje vecka. Efter behandlingen sjunker frånvaron till 0 till 3 varje vecka, vilket tyder på att behandlingen fungerade. I den andra linjediagrammet finns det ingen märkbar förändring i antalet frånvaro per vecka efter behandlingen, vilket tyder på att behandlingen inte fungerade.
En konstruktion mellan ämnen där deltagarna inte slumpmässigt har tilldelats villkor.
Den beroende variabeln mäts en gång innan behandlingen implementeras och en gång efter att den har implementerats.
En kategori av alternativa förklaringar för skillnader mellan poäng som till exempel händelser som inträffade mellan förprovet och posttestet, utan samband med studien.
En alternativ förklaring som hänvisar till hur deltagarna kan ha förändrats mellan förprovet och posttestet på ett sätt som de ändå skulle göra för att de växer och lär sig.
Det statistiska faktumet att en individ som gör extremt mycket för en variabel vid ett tillfälle tenderar att göra mindre extremt vid nästa tillfälle.
Tendensen för många medicinska och psykologiska problem att förbättras över tiden utan någon form av behandling.
En uppsättning mätningar som görs med intervaller över en tidsperiod som avbryts av en behandling.