- Erklären Sie, was quasi-experimentelle Forschung ist, und unterscheiden Sie sie klar von experimenteller und korrelativer Forschung.
- Beschreiben Sie drei verschiedene Arten von quasi-experimentellen Forschungsdesigns (nicht äquivalente Gruppen, Pretest-Posttest und unterbrochene Zeitreihen) und identifizieren Sie Beispiele für jedes einzelne.
Das Präfix bedeutet quasi „ähnlich“. Quasi-experimentelle Forschung ist also Forschung, die experimenteller Forschung ähnelt, aber keine echte experimentelle Forschung ist. Obwohl die unabhängige Variable manipuliert wird, werden die Teilnehmer nicht zufällig Bedingungen oder Ordnungen von Bedingungen zugeordnet (Cook & Campbell, 1979). Da die unabhängige Variable manipuliert wird, bevor die abhängige Variable gemessen wird, beseitigt quasi-experimentelle Forschung das Richtungsproblem. Da die Teilnehmer jedoch nicht zufällig zugewiesen werden – was es wahrscheinlich macht, dass es andere Unterschiede zwischen den Bedingungen gibt -, quasi-experimentelle Forschung beseitigt nicht das Problem verwirrender Variablen. In Bezug auf die interne Validität liegen Quasi-Experimente daher im Allgemeinen irgendwo zwischen Korrelationsstudien und echten Experimenten.
Quasi-Experimente werden höchstwahrscheinlich in Feldeinstellungen in durchgeführt welche zufällige Zuordnung schwierig oder unmöglich ist. Sie werden oft durchgeführt, um die Wirksamkeit einer Behandlung zu bewerten – pe Vielleicht eine Art Psychotherapie oder eine pädagogische Intervention. Es gibt viele verschiedene Arten von Quasi-Experimenten, aber wir werden hier nur einige der häufigsten diskutieren.
Denken Sie daran, dass die resultierenden Gruppen zufällig den Bedingungen zugeordnet werden, wenn Teilnehmer an einem Experiment zwischen Probanden zufällig Bedingungen zugeordnet werden sind wahrscheinlich ziemlich ähnlich. Tatsächlich betrachten Forscher sie als gleichwertig. Wenn die Teilnehmer jedoch nicht zufällig Bedingungen zugeordnet werden, sind die resultierenden Gruppen wahrscheinlich in gewisser Weise unterschiedlich. Aus diesem Grund betrachten Forscher sie als nicht äquivalent. Ein nicht-äquivalentes Gruppendesign ist also ein Design zwischen Subjekten, bei dem die Teilnehmer nicht zufällig Bedingungen zugeordnet wurden.
Stellen Sie sich beispielsweise einen Forscher vor, der eine neue Methode zum Unterrichten von Brüchen an Dritte bewerten möchte Grader. Eine Möglichkeit wäre, eine Studie mit einer Behandlungsgruppe durchzuführen, die aus einer Klasse von Schülern der dritten Klasse und einer Kontrollgruppe besteht, die aus einer anderen Klasse von Schülern der dritten Klasse besteht. Dieses Design wäre ein nicht äquivalentes Gruppendesign, da die Schüler vom Forscher nicht zufällig Klassen zugeordnet werden, was bedeutet, dass es wichtige Unterschiede zwischen ihnen geben könnte. Zum Beispiel könnten Eltern von leistungsstärkeren oder motivierteren Schülern eher darum gebeten haben, dass ihre Kinder der Klasse von Frau Williams zugewiesen werden. Oder der Schulleiter hat die „Unruhestifter“ Mr. Jones ‚Klasse zugewiesen, weil er ein stärkerer Disziplinarist ist. Natürlich können die Stile der Lehrer und sogar das Unterrichtsumfeld sehr unterschiedlich sein und unterschiedliche Leistungsniveaus oder Motivationen hervorrufen Wenn es am Ende des Studiums einen Unterschied in der Kenntnis der beiden Klassen über Brüche gab, könnte dies durch den Unterschied zwischen den Lehrmethoden verursacht worden sein – aber möglicherweise durch eine dieser verwirrenden Variablen / p>
Natürlich können Forscher, die ein nicht gleichwertiges Gruppendesign verwenden, Schritte unternehmen, um sicherzustellen, dass ihre Gruppen so ähnlich wie möglich sind. Im vorliegenden Beispiel könnte der Forscher versuchen, zwei Klassen an derselben Schule auszuwählen, an der die Schüler arbeiten In beiden Klassen gibt es ähnliche Ergebnisse für einen standardisierten Mathe-Test. Die Lehrer haben das gleiche Geschlecht, sind altersnah und haben ähnliche Unterrichtsstile. Solche Schritte würden die interne Validität der Studie erhöhen weil es einige der wichtigsten verwirrenden Variablen beseitigen würde. Ohne eine echte zufällige Zuordnung der Schüler zu Bedingungen bleibt jedoch die Möglichkeit anderer wichtiger verwirrender Variablen bestehen, die der Forscher nicht kontrollieren konnte.
Pretest-Posttest-Design
In einem Pretest – Nach dem Testdesign wird die abhängige Variable einmal vor der Implementierung der Behandlung und einmal nach der Implementierung gemessen. Stellen Sie sich zum Beispiel einen Forscher vor, der an der Wirksamkeit eines Antidrug-Aufklärungsprogramms für die Einstellung von Grundschülern zu illegalen Drogen interessiert ist. Der Forscher könnte die Einstellungen von Schülern einer bestimmten Grundschule während einer Woche messen, das Antidrug-Programm in der nächsten Woche implementieren und schließlich ihre Einstellungen in der folgenden Woche erneut messen. Das Pretest-Posttest-Design ähnelt einem Experiment innerhalb der Probanden, bei dem jeder Teilnehmer zuerst unter der Kontrollbedingung und dann unter der Behandlungsbedingung getestet wird.Es ist jedoch anders als bei einem Experiment innerhalb der Probanden, dass die Reihenfolge der Bedingungen nicht ausgeglichen wird, da es typischerweise nicht möglich ist, dass ein Teilnehmer zuerst in der Behandlungsbedingung und dann in einer „unbehandelten“ Kontrollbedingung getestet wird. P. >
Wenn der durchschnittliche Posttest-Score besser ist als der durchschnittliche Pretest-Score, ist es sinnvoll zu folgern, dass die Behandlung für die Verbesserung verantwortlich sein könnte. Leider kann man dies oft nicht mit hoher Sicherheit abschließen, da dies der Fall sein kann andere Erklärungen, warum die Ergebnisse nach dem Test besser sind. Eine Kategorie alternativer Erklärungen wird unter dem Namen Geschichte geführt. Andere Dinge könnten zwischen dem Vortest und dem Posttest passiert sein. Vielleicht wurde im Fernsehen eine Antidrug-Sendung ausgestrahlt, und viele der Schüler sahen sie sich an, oder Vielleicht starb eine Berühmtheit an einer Überdosis Drogen, und viele der Schüler hörten davon. Eine andere Kategorie alternativer Erklärungen trägt den Namen Reifung. Die Teilnehmer könnten haben zwischen dem Vortest und dem Posttest auf eine Weise gewechselt, die sie sowieso wollten, weil sie wachsen und lernen. Wenn es sich um ein einjähriges Programm handeln würde, könnten die Teilnehmer weniger impulsive oder bessere Denker werden, und dies könnte für die Änderung verantwortlich sein.
Eine andere alternative Erklärung für eine Änderung der abhängigen Variablen in einem Pretest-Posttest-Design ist die Regression auf der Mittelwert. Dies bezieht sich auf die statistische Tatsache, dass eine Person, die bei einer Variablen bei einer Gelegenheit extrem punktet, bei der nächsten Gelegenheit tendenziell weniger extrem punktet. Zum Beispiel wird ein Bowler mit einem langfristigen Durchschnitt von 150, der plötzlich einen 220 bowlt, im nächsten Spiel mit ziemlicher Sicherheit weniger Punkte erzielen. Ihre Punktzahl wird sich in Richtung ihrer mittleren Punktzahl von 150 „zurückbilden“. Die Regression auf die mittlere Punktzahl kann ein Problem sein, wenn die Teilnehmer aufgrund ihrer extremen Punktzahl für das weitere Studium ausgewählt werden. Stellen Sie sich zum Beispiel vor, dass nur Schüler bei einem Test von besonders schlecht abschneiden Fraktionen erhalten ein spezielles Trainingsprogramm und werden dann erneut getestet. Eine Regression auf den Mittelwert garantiert jedoch, dass ihre Punktzahlen höher sind, auch wenn das Trainingsprogramm keine Wirkung hat. Ein eng verwandtes Konzept – und ein äußerst wichtiges in der psychologischen Forschung – ist die spontane Remission Dies ist die Tendenz, dass sich viele medizinische und psychische Probleme im Laufe der Zeit ohne jegliche Behandlung bessern. Die Erkältung ist ein gutes Beispiel. Wenn man heute die Schwere der Symptome bei 100 Erkältungskranken messen möchte, geben Sie ihnen eine Schüssel Hühnersuppe Jeden Tag und dann in einer Woche erneut die Schwere der Symptome zu messen, würden sie wahrscheinlich stark verbessert sein. Dies bedeutet nicht, dass die Hühnersuppe für die Verbesserung verantwortlich war, wie auch immer ver, weil sie ohne Behandlung überhaupt viel verbessert worden wären. Gleiches gilt für viele psychische Probleme. Eine Gruppe schwer depressiver Menschen ist heute im Durchschnitt in 6 Monaten wahrscheinlich weniger depressiv. Bei der Überprüfung der Ergebnisse mehrerer Studien zur Behandlung von Depressionen stellten die Forscher Michael Posternak und Ivan Miller fest, dass sich die Teilnehmer an Kontrollbedingungen auf der Warteliste im Durchschnitt um 10 bis 15% verbesserten, bevor sie überhaupt eine Behandlung erhielten (Posternak &
Frühe Studien zur Wirksamkeit der Psychotherapie tendierten dazu, Pretest-Posttest-Designs zu verwenden. In einem klassischen Artikel aus dem Jahr 1952 fasste der Forscher Hans Eysenck die Ergebnisse von 24 solchen Studien zusammen und zeigte, dass sich zwischen dem Vortest und dem Posttest etwa zwei Drittel der Patienten verbesserten (Eysenck, 1952). Eysenck verglich diese Ergebnisse jedoch auch mit Archivdaten aus staatlichen Krankenhäusern und Versicherungen Unternehmensunterlagen zeigen, dass sich ähnliche Patienten ohne Psychotherapie etwa gleich schnell erholten. Diese Parallele deutete Eysenck an, dass die Verbesserung, die Patienten in den Pretest-Posttest-Studien zeigten, nicht mehr als eine spontane Remission sein könnte. Beachten Sie, dass Eysenck nicht zu dem Schluss kam, dass die Psychotherapie unwirksam war. Er kam lediglich zu dem Schluss, dass es keine Beweise dafür gibt, und schrieb über „die Notwendigkeit ordnungsgemäß geplanter und durchgeführter experimenteller Studien auf diesem wichtigen Gebiet“ (S. 323). Den gesamten Artikel können Sie hier lesen: Klassiker in der Geschichte von Psychologie.
Glücklicherweise nahmen viele andere Forscher die Herausforderung von Eysenck an, und bis 1980 wurden Hunderte von Experimenten durchgeführt, bei denen die Teilnehmer zufällig den Behandlungs- und Kontrollbedingungen zugeordnet wurden Die Ergebnisse wurden in einem klassischen Buch von Mary Lee Smith, Gene Glass und Thomas Miller (Smith, Glass, & Miller, 1980) zusammengefasst. Sie fanden heraus, dass die allgemeine Psychotherapie mit ziemlich effektiv war Etwa 80% der Behandlungsteilnehmer verbesserten sich mehr als der durchschnittliche Kontrollteilnehmer. Nachfolgende Untersuchungen konzentrierten sich mehr auf die Bedingungen, unter denen verschiedene Arten der Psychotherapie mehr oder weniger wirksam sind.
Unterbrochenes Zeitreihendesign
Eine Variante des Pretest-Posttest-Designs ist das unterbrochene Zeitreihendesign. Eine Zeitreihe ist eine Reihe von Messungen, die in Intervallen über einen bestimmten Zeitraum durchgeführt werden. Beispielsweise könnte ein produzierendes Unternehmen die Produktivität seiner Mitarbeiter ein Jahr lang jede Woche messen. In einem unterbrochenen Zeitreihendesign wird eine Zeitreihe wie diese durch eine Behandlung „unterbrochen“. In einem klassischen Beispiel war die Behandlung die Reduzierung der Arbeitsschichten in einer Fabrik von 10 Stunden auf 8 Stunden (Cook & Campbell, 1979). Da die Produktivität nach der Verkürzung der Arbeitsschichten ziemlich schnell anstieg und viele Monate danach erhöht blieb, kam der Forscher zu dem Schluss, dass die Verkürzung der Schichten die Zunahme von verursachte Beachten Sie, dass das unterbrochene Zeitreihendesign insofern einem Pretest-Posttest-Design ähnelt, als es Messungen der abhängigen Variablen sowohl vor als auch nach der Behandlung enthält. Es unterscheidet sich jedoch vom Pretest-Posttest-Design darin, dass es mehrere Pretests enthält und Posttest-Messungen.
Abbildung 7.3 zeigt Daten aus einer hypothetischen unterbrochenen Zeitreihenstudie. Die abhängige Variable ist die Anzahl der Abwesenheiten von Studenten pro Woche in einem Forschungsmethoden-Kurs Der Ausbilder nimmt jeden Tag öffentlich teil, damit die Schüler wissen, dass der Ausbilder weiß, wer anwesend ist und wer abwesend ist. Das obere Feld in Abbildung 7.3 zeigt, wie die Daten aussehen könnten, wenn diese Behandlung funktioniert. Es gibt eine konstant hohe Anzahl von Abwesenheiten vor der Behandlung und einen sofortigen und anhaltenden Rückgang der Abwesenheiten nach der Behandlung. Das untere Feld in Abbildung 7.3 zeigt, wie die Daten aussehen könnten, wenn diese Behandlung nicht funktioniert hätte. Im Durchschnitt entspricht die Anzahl der Abwesenheiten nach der Behandlung in etwa der Anzahl zuvor. Diese Abbildung zeigt auch einen Vorteil des unterbrochenen Zeitreihendesigns gegenüber einem einfacheren Pretest-Posttest-Design. Wenn es vor der Behandlung in Woche 7 und danach in Woche 8 nur eine Messung der Abwesenheiten gegeben hätte, hätte es so ausgesehen, als ob die Behandlung für die Reduktion verantwortlich wäre. Die Mehrfachmessungen vor und nach der Behandlung legen nahe, dass die Verringerung zwischen Woche 7 und 8 nichts anderes als eine normale Variation von Woche zu Woche ist.
Kombinationsdesigns
Eine Art quasi-experimentelles Design, das im Allgemeinen besser ist als das nicht-äquivalente Gruppendesign oder der Pretest-Posttest Design ist eines, das Elemente von beiden kombiniert. Es gibt eine Behandlungsgruppe, die einen Vortest erhält, eine Behandlung erhält und dann einen Posttest erhält. Gleichzeitig gibt es eine Kontrollgruppe, die einen Vortest erhält, die Behandlung nicht erhält und dann einen Posttest erhält. Die Frage ist also nicht einfach, ob sich die Teilnehmer, die die Behandlung erhalten, verbessern, sondern ob sie sich mehr verbessern als die Teilnehmer, die die Behandlung nicht erhalten.
Stellen Sie sich zum Beispiel vor, dass Schüler einer Schule einen Vortest erhalten über ihre Einstellung zu Drogen, werden dann einem Antidrug-Programm ausgesetzt und erhalten schließlich einen Posttest. Schüler einer ähnlichen Schule erhalten den Vortest, der keinem Antidrug-Programm ausgesetzt ist, und schließlich einen Posttest. Wenn Studierende im Behandlungszustand gegenüber Drogen negativer werden, kann diese Änderung der Einstellung eine Auswirkung der Behandlung sein, aber auch eine Frage der Vorgeschichte oder der Reifung. Wenn es sich tatsächlich um eine Auswirkung der Behandlung handelt, sollten Schüler im Behandlungszustand negativer werden als Schüler im Kontrollzustand. Wenn es sich jedoch um eine Frage der Vorgeschichte (z. B. Nachrichten über eine Überdosierung von Promi-Medikamenten) oder der Reifung (z. B. verbesserte Argumentation) handelt, zeigen die Schüler unter den beiden Bedingungen wahrscheinlich ähnliche Veränderungen. Diese Art des Entwurfs schließt jedoch die Möglichkeit der Verwechslung von Variablen nicht vollständig aus. An einer der Schulen könnte etwas passieren, an der anderen jedoch nicht (z. B. eine Überdosis Drogen für Schüler), sodass Schüler der ersten Schule davon betroffen wären, während Schüler der anderen Schule dies nicht tun würden.
Schließlich Wenn Teilnehmer an dieser Art von Design zufällig Bedingungen zugeordnet werden, wird dies eher zu einem echten Experiment als zu einem Quasi-Experiment. Tatsächlich ist es die Art von Experiment, die Eysenck forderte – und das jetzt schon oft durchgeführt wurde -, um die Wirksamkeit der Psychotherapie zu demonstrieren.
- Quasi-experimentelle Forschung beinhaltet die Manipulation einer unabhängigen Variablen ohne die zufällige Zuordnung von Teilnehmern zu Bedingungen oder Ordnungen von Bedingungen.Zu den wichtigen Typen gehören nichtäquivalente Gruppendesigns, Pretest-Posttest- und unterbrochene Zeitreihendesigns.
- Quasi-experimentelle Forschung beseitigt das Richtungsproblem, da es die Manipulation der unabhängigen Variablen beinhaltet. Das Problem der Verwechslung von Variablen wird jedoch nicht beseitigt, da keine zufällige Zuordnung zu Bedingungen erforderlich ist. Aus diesen Gründen hat quasi-experimentelle Forschung im Allgemeinen eine höhere interne Validität als Korrelationsstudien, aber eine niedrigere als echte Experimente.
/ div>
- Übung: Stellen Sie sich vor, zwei Professoren beschließen, die Auswirkung täglicher Tests auf die Leistung der Schüler in einem Statistikkurs zu testen. Sie beschließen, dass Professor A Quizfragen geben wird, Professor B jedoch nicht. Anschließend vergleichen sie die Leistung der Schüler in ihren beiden Abschnitten anhand einer gemeinsamen Abschlussprüfung. Nennen Sie fünf weitere Variablen, die sich zwischen den beiden Abschnitten unterscheiden können, die sich auf die Ergebnisse auswirken können.
- Diskussion: Stellen Sie sich vor, eine Gruppe fettleibiger Kinder wird für eine Studie rekrutiert, in der ihr Gewicht gemessen wird, und nehmen dann für 3 teil Monate in einem Programm, das sie ermutigt, aktiver zu sein, und schließlich wird ihr Gewicht erneut gemessen. Erklären Sie, wie sich die folgenden Faktoren auf die Ergebnisse auswirken können:
- Regression auf die mittlere
- spontane Remission
- Vorgeschichte
- Reifung
Bildbeschreibungen
Abbildung 7.3 Bildbeschreibung: Zwei Liniendiagramme, in denen die Anzahl der Abwesenheiten pro Woche über 14 Wochen dargestellt ist . Die ersten 7 Wochen sind ohne Behandlung und die letzten 7 Wochen sind mit Behandlung. Im ersten Liniendiagramm gibt es zwischen 4 und 8 Abwesenheiten pro Woche. Nach der Behandlung sinken die Abwesenheiten jede Woche auf 0 bis 3, was darauf hindeutet, dass die Behandlung erfolgreich war. Im zweiten Liniendiagramm ändert sich die Anzahl der Abwesenheiten pro Woche nach der Behandlung nicht merklich, was darauf hindeutet, dass die Behandlung nicht funktioniert hat.
Ein Zwischensubjekt-Design, bei dem die Teilnehmer nicht zufällig Bedingungen zugewiesen wurden.
Die abhängige Variable wird zuvor einmal gemessen Die Behandlung wird implementiert und einmal nach ihrer Implementierung.
Eine Kategorie alternativer Erklärungen für Unterschiede zwischen Scores, wie z. B. Ereignisse zwischen dem Vortest und dem Posttest, die nicht mit der Studie zusammenhängen.
Eine alternative Erklärung, die sich darauf bezieht, wie sich die Teilnehmer zwischen dem Vortest und dem Posttest auf eine Weise verändert haben, die sie sowieso wollten, weil sie wachsen und lernen.
Die statistische Tatsache, dass eine Person, die bei einer Variablen bei einer Gelegenheit extrem punktet, bei der nächsten Gelegenheit tendenziell weniger punktet.
Die Tendenz vieler medizinischer und psychischer Probleme, sich im Laufe der Zeit ohne jegliche Behandlung zu bessern.
Eine Reihe von Messungen, die in Intervallen über einen bestimmten Zeitraum durchgeführt wurden die durch eine Behandlung unterbrochen werden.