- Forklar hvad kvasi-eksperimentel forskning er og skel den klart fra både eksperimentel og korrelationsforskning.
- Beskriv tre forskellige typer kvasi-eksperimentelle forskningsdesign (ikke-ækvivalente grupper, pretest-posttest og afbrudte tidsserier) og identificer eksempler på hver enkelt.
Præfikset kvasi betyder “ligner.” Således er kvasi-eksperimentel forskning forskning, der ligner eksperimentel forskning, men som ikke er sand eksperimentel forskning. Selvom den uafhængige variabel manipuleres, tildeles deltagerne ikke tilfældigt til betingelser eller ordrer af betingelser (Cook & Campbell, 1979). Fordi den uafhængige variabel manipuleres, før den afhængige variabel måles, eliminerer kvasi-eksperimentel forskning retningsproblemet. Men fordi deltagerne ikke er tilfældigt tildelt – hvilket gør det sandsynligt, at der er andre forskelle mellem forhold – kvasi-eksperimentel forskning eliminerer ikke problemet med forvirrende variabler. Med hensyn til intern gyldighed er kvasi-eksperimenter generelt generelt et sted mellem korrelationsstudier og sande eksperimenter.
Kvasi-eksperimenter vil sandsynligvis blive udført i feltindstillinger i hvilken tilfældig opgave er vanskelig eller umulig. De udføres ofte for at evaluere effektiviteten af en behandling – pe måske en type psykoterapi eller en pædagogisk intervention. Der er mange forskellige slags kvasi-eksperimenter, men vi vil diskutere blot nogle få af de mest almindelige her.
Husk, at når deltagere i et eksperiment mellem forsøgspersoner tilfældigt tildeles til betingelser, er de resulterende grupper sandsynligvis være ret ens. Faktisk betragter forskere dem som ækvivalente. Når deltagerne ikke tilfældigt tildeles betingelser, vil de resulterende grupper dog sandsynligvis være forskellige på nogle måder. Af denne grund betragter forskere dem som ikke-tilsvarende. Et ikke-ækvivalent gruppedesign er derfor et design mellem emnerne, hvor deltagerne ikke er tilfældigt tildelt betingelser.
Forestil dig f.eks. En forsker, der ønsker at evaluere en ny metode til at undervise fraktioner til tredje gradere. En måde ville være at gennemføre en undersøgelse med en behandlingsgruppe bestående af en klasse af studerende i tredje klasse og en kontrolgruppe bestående af en anden klasse af studerende i tredje klasse. Dette design ville være et ikke-tilsvarende gruppedesign, fordi de studerende ikke tilfældigt tildeles klasser af forskeren, hvilket betyder, at der kan være vigtige forskelle mellem dem. For eksempel har forældre til studerende med højere præstationer eller mere motiverede været mere tilbøjelige til at anmode om, at deres børn blev tildelt fru Williams klasse. Eller rektoren har måske tildelt “urolighederne” til Mr. Jones klasse, fordi han er en stærkere disciplinær. Naturligvis kan lærernes stilarter og endda klasseværelset være meget forskellige og kan forårsage forskellige niveauer af præstation eller motivation blandt Hvis der ved afslutningen af undersøgelsen var en forskel i de to klassers kendskab til fraktioner, kunne det være forårsaget af forskellen mellem undervisningsmetoderne – men det kunne have været forårsaget af nogen af disse forvirrende variabler. / p>
Naturligvis kan forskere, der bruger et ikke-tilsvarende gruppedesign, tage skridt til at sikre, at deres grupper er så ens som muligt. I dette eksempel kan forskeren prøve at vælge to klasser på samme skole, hvor de studerende i de to klasser har ens score på en standardiseret matematikprøve, og lærerne er af samme køn, er tæt på alderen og har lignende undervisningsformer. At tage sådanne trin vil øge undersøgelsens interne gyldighed fordi det ville eliminere nogle af de vigtigste forvirrende variabler. Men uden ægte tilfældig tildeling af de studerende til forhold, er der fortsat muligheden for andre vigtige forvirrende variabler, som forskeren ikke var i stand til at kontrollere.
Design for test-posttest
I en forprøve -posttest design, den afhængige variabel måles en gang før behandlingen implementeres og en gang efter den er implementeret. Forestil dig for eksempel en forsker, der er interesseret i effektiviteten af et antidrugsuddannelsesprogram på grundskolestudenters holdning til ulovlige stoffer. Forskeren kunne måle holdningerne hos studerende på en bestemt grundskole i løbet af en uge, implementere antidrugsprogrammet i den næste uge og endelig måle deres holdninger igen den følgende uge. Det for-test-posttest-design ligner meget et inden-forsøgseksperiment, hvor hver deltager testes først under kontrolbetingelsen og derefter under behandlingsbetingelsen.Det er i modsætning til et eksperiment inden for forsøgspersoner, dog ved, at rækkefølgen af forhold ikke modvægtes, fordi det typisk ikke er muligt for en deltager at blive testet i behandlingstilstanden først og derefter i en “ubehandlet” kontroltilstand.
Hvis den gennemsnitlige posttest-score er bedre end den gennemsnitlige for-test-score, er det fornuftigt at konkludere, at behandlingen kan være ansvarlig for forbedringen. Desværre kan man ofte ikke konkludere dette med en høj grad af sikkerhed, fordi der kan være andre forklaringer på, hvorfor posttest scorer bedre. En kategori af alternative forklaringer går under navnet historien. Andre ting er muligvis sket mellem pretest og posttest. Måske blev et antidrugsprogram sendt på tv, og mange af de studerende så det, eller måske døde en berømthed af en overdosis af stoffer, og mange af de studerende hørte om det. En anden kategori af alternative forklaringer går under navnet modning. har skiftet mellem forprøven og posttesten på måder, som de alligevel ville, fordi de vokser og lærer. Hvis det var et årligt program, kunne deltagerne blive mindre impulsive eller bedre begrundere, og dette kan være ansvarlig for ændringen.
En anden alternativ forklaring på en ændring i den afhængige variabel i et forprøve-posttest-design er regression til middelværdien. Dette refererer til det statistiske faktum, at en person, der scorer ekstremt på en variabel ved en lejlighed, har tendens til at score mindre ekstremt ved den næste lejlighed. For eksempel vil en bowler med et langsigtet gennemsnit på 150, der pludselig kaster en 220, næsten helt sikkert score lavere i det næste spil. Hendes score vil “regressere” mod hendes gennemsnitlige score på 150. Regression til gennemsnittet kan være et problem, når deltagerne vælges til yderligere undersøgelse på grund af deres ekstreme score. Forestil dig for eksempel, at kun studerende, der scorede særligt lave på en test af fraktioner får et specielt træningsprogram og derefter testes igen. Regression til det gennemsnit, men garanterer, at deres score vil være højere, selvom træningsprogrammet ikke har nogen effekt. Et nært beslægtet koncept – og et ekstremt vigtigt inden for psykologisk forskning – er spontan remission Dette er tendensen til, at mange medicinske og psykologiske problemer forbedres over tid uden nogen form for behandling. Forkølelse er et godt eksempel. Hvis man måler symptomernes sværhedsgrad hos 100 forkølelsespatienter i dag, så giv dem en skål kyllingesuppe. hver dag og derefter måle deres symptom sværhedsgrad igen om en uge, ville de sandsynligvis blive meget bedre. Dette betyder ikke, at kyllingesuppe var ansvarlig for forbedringen, men ver, fordi de ville have været meget forbedret uden nogen behandling overhovedet. Det samme gælder for mange psykologiske problemer. En gruppe stærkt deprimerede mennesker i dag vil sandsynligvis være mindre deprimerede i gennemsnit om 6 måneder. Ved at gennemgå resultaterne af flere undersøgelser af behandlinger mod depression fandt forskerne Michael Posternak og Ivan Miller, at deltagerne i ventelistekontrolforholdene i gennemsnit forbedrede 10 til 15%, før de overhovedet modtog nogen behandling (Posternak & Miller, 2001). Således skal man generelt være meget forsigtig med at udlede årsagssammenhæng fra prædest-posttest-design.
Tidlige studier af effektiviteten af psykoterapi havde tendens til at bruge præfest-posttest-design. I en klassisk artikel fra 1952 opsummerede forsker Hans Eysenck resultaterne af 24 sådanne undersøgelser, der viste, at ca. to tredjedele af patienterne forbedrede sig mellem pretest og posttest (Eysenck, 1952). Men Eysenck sammenlignede også disse resultater med arkivdata fra statshospital og forsikring virksomhedsoptegnelser, der viser, at lignende patienter kom sig i omtrent samme hastighed uden at få psykoterapi. Denne parallel foreslog Eysenck, at den forbedring, som patienterne viste i de test-posttest-studier, måske ikke var mere end spontan remission. Bemærk, at Eysenck ikke konkluderede, at psykoterapi var ineffektiv. Han konkluderede blot, at der ikke var noget bevis for, at det var, og han skrev om “nødvendigheden af korrekt planlagte og udførte eksperimentelle undersøgelser inden for dette vigtige felt” (s. 323). Du kan læse hele artiklen her: Klassikere i historien om Psykologi.
Heldigvis tog mange andre forskere Eysencks udfordring, og i 1980 var der blevet udført hundreder af eksperimenter, hvor deltagerne tilfældigt blev tildelt behandlings- og kontrolforhold, og resultaterne blev opsummeret i en klassisk bog af Mary Lee Smith, Gene Glass og Thomas Miller (Smith, Glass, & Miller, 1980). De fandt ud af, at den samlede psykoterapi var ret effektiv med ca. 80% af behandlingsdeltagerne forbedrede sig mere end den gennemsnitlige kontroldeltager. Efterfølgende forskning har mere fokuseret på de betingelser, hvorunder forskellige typer psykoterapi er mere eller mindre effektive.
Designet afbrudt tidsserie
En variant af det for-test-posttest-design er det afbrudte tidsserie-design. En tidsserie er et sæt målinger taget med intervaller over en tidsperiode. For eksempel kan en fremstillingsvirksomhed måske måle medarbejdernes produktivitet hver uge i et år. I et afbrudt tidsseriedesign “afbrydes” en tidsserie som denne af en behandling. I et klassisk eksempel var behandlingen reduktionen af arbejdsskift på en fabrik fra 10 timer til 8 timer (Cook & Campbell, 1979). Fordi produktiviteten steg ret hurtigt efter forkortelsen af arbejdsskiftene, og fordi den forblev forhøjet i mange måneder derefter, konkluderede forskeren, at afkortningen af skiftene forårsagede stigningen i Produktivitet. Bemærk, at det afbrudte tidsseriedesign er som et fortest-posttest-design, idet det inkluderer målinger af den afhængige variabel både før og efter behandlingen. og posttestmålinger.
Figur 7.3 viser data fra en hypotetisk afbrudt tidsserieundersøgelse. Den afhængige variabel er antallet af studerendes fravær pr. uge i et forskningsmetodeforløb. Behandlingen er, at instruktøren begynder offentligt at deltage hver dag, så de studerende ved, at instruktøren er opmærksom på, hvem der er til stede, og hvem der er fraværende. Toppanelet i figur 7.3 viser, hvordan dataene kan se ud, hvis denne behandling fungerede. Der er et konstant stort antal fravær før behandlingen, og der er et øjeblikkeligt og vedvarende fald i fravær efter behandlingen. Nederste panel i figur 7.3 viser, hvordan dataene kan se ud, hvis denne behandling ikke fungerede. I gennemsnit er antallet af fravær efter behandlingen omtrent det samme som antallet før. Denne figur illustrerer også en fordel ved det afbrudte tidsserie-design i forhold til et enklere for-test-posttest-design. Hvis der kun havde været en måling af fravær før behandlingen i uge 7 og en derefter i uge 8, så ville det have set ud som om behandlingen var ansvarlig for reduktionen. De mange målinger både før og efter behandlingen tyder på, at reduktionen mellem uge 7 og 8 ikke er mere end normal variation fra uge til uge.
Kombinationsdesign
En type kvasi-eksperimentelt design, der generelt er bedre end enten det ikke-ækvivalente gruppedesign eller det forudgående test design er et, der kombinerer elementer fra begge dele. Der er en behandlingsgruppe, der får en forprøve, modtager en behandling og derefter får en posttest. Men på samme tid er der en kontrolgruppe, der får en forprøve, ikke modtager behandlingen og derefter får en posttest. Spørgsmålet er derfor ikke blot, om deltagere, der får behandlingen, forbedres, men om de forbedrer sig mere end deltagere, der ikke modtager behandlingen.
Forestil dig for eksempel, at elever i en skole får et forprøve på deres holdning til stoffer, udsættes derefter for et antidrugsprogram og får endelig en posttest. Studerende på en lignende skole får forprøven, udsættes ikke for et antidrugsprogram og til sidst får de en posttest. Igen, hvis studerende i behandlingstilstanden bliver mere negative over for stoffer, kan denne holdningsændring være en effekt af behandlingen, men det kan også være et spørgsmål om historie eller modning. Hvis det virkelig er en effekt af behandlingen, skal studerende i behandlingstilstanden blive mere negative end studerende i kontroltilstanden. Men hvis det er et spørgsmål om historie (f.eks. Nyheder om en overdosis af berømtheder) eller modning (f.eks. Forbedret ræsonnement), vil studerende under de to forhold sandsynligvis vise lignende ændringer. Denne type design eliminerer dog ikke helt muligheden for at forveksle variabler. Der kunne forekomme noget på en af skolerne, men ikke den anden (f.eks. En overdosis af studiemedicin), så elever på den første skole ville blive påvirket af den, mens elever på den anden skole ikke ville.
Endelig, hvis deltagere i denne form for design tilfældigt tildeles betingelser, bliver det et sandt eksperiment snarere end et kvasi-eksperiment. Faktisk er det den slags eksperiment, som Eysenck krævede – og som nu er blevet gennemført mange gange – for at demonstrere effektiviteten af psykoterapi.
- Kvasi-eksperimentel forskning involverer manipulation af en uafhængig variabel uden tilfældig tildeling af deltagere til betingelser eller ordrer af betingelser.Blandt de vigtige typer er ikke-ækvivalente gruppedesign, pretest-posttest og afbrudte tidsseriedesign.
- Kvasi-eksperimentel forskning eliminerer retningsproblemet, fordi det involverer manipulation af den uafhængige variabel. Det eliminerer dog ikke problemet med forvirrende variabler, fordi det ikke involverer tilfældig tildeling til betingelser. Af disse grunde er kvasi-eksperimentel forskning generelt højere i intern gyldighed end korrelationsstudier, men lavere end ægte eksperimenter.
- Øvelse: Forestil dig, at to professorer beslutter at teste effekten af at give daglige quizzer på studerendes præstationer i et statistikforløb. De beslutter, at professor A vil give quizzer, men professor B ikke. De sammenligner derefter elevernes præstationer i deres to sektioner på en fælles afsluttende eksamen. Skriv fem andre variabler, der kan variere mellem de to sektioner, der kan påvirke resultaterne.
- Diskussion: Forestil dig, at en gruppe af overvægtige børn rekrutteres til en undersøgelse, hvor deres vægt måles, så deltager de i 3 måneder i et program, der opmuntrer dem til at være mere aktive, og endelig måles deres vægt igen. Forklar, hvordan hvert af følgende kan påvirke resultaterne:
- regression til middelværdien
- spontan remission
- historie
- modning
Billedbeskrivelser
Figur 7.3 billedbeskrivelse: To linjediagrammer, der viser antallet af fravær pr. uge over 14 uger . De første 7 uger er uden behandling, og de sidste 7 uger er under behandling. I den første linjediagram er der mellem 4 og 8 fravær hver uge. Efter behandlingen falder fraværet til 0 til 3 hver uge, hvilket tyder på, at behandlingen fungerede. I den anden linjediagram er der ingen mærkbar ændring i antallet af fravær pr. Uge efter behandlingen, hvilket antyder, at behandlingen ikke fungerede.
Et design mellem emnerne, hvor deltagerne ikke er tilfældigt tildelt betingelser.
Den afhængige variabel måles en gang før behandlingen er implementeret, og en gang efter at den er implementeret.
En kategori af alternative forklaringer på forskelle mellem scores såsom begivenheder, der skete mellem pretest og posttest, der ikke er relateret til undersøgelsen.
En alternativ forklaring, der henviser til, hvordan deltagerne muligvis har skiftet mellem fortest og posttest på måder, som de alligevel ville, fordi de vokser og lærer.
Den statistiske kendsgerning, at en person, der scorer ekstremt på en variabel ved en lejlighed, vil have tendens til at score mindre ekstremt ved den næste lejlighed.
Tendensen til, at mange medicinske og psykologiske problemer forbedres over tid uden nogen form for behandling.
Et sæt målinger taget med intervaller over en periode der afbrydes af en behandling.