Man kann mit Sicherheit sagen, dass die meisten Personen, die Statistiken verwenden, mit parametrischen Analysen besser vertraut sind als mit nichtparametrischen Analysen. Nichtparametrische Tests werden auch als verteilungsfreie Tests bezeichnet, da sie nicht davon ausgehen, dass Ihre Daten einer bestimmten Verteilung folgen.
Sie haben möglicherweise gehört, dass Sie nichtparametrische Tests verwenden sollten, wenn Ihre Daten nicht den Annahmen von entsprechen der parametrische Test, insbesondere die Annahme über normalverteilte Daten. Das klingt nach einer guten und unkomplizierten Auswahl, aber es gibt zusätzliche Überlegungen.
In diesem Beitrag werde ich Ihnen helfen, zu bestimmen, wann Sie Folgendes verwenden sollten:
- Parametrische Analyse für Testgruppen bedeutet.
- Nichtparametrische Analyse für Testgruppenmediane.
Insbesondere werde ich mich auf einen wichtigen Grund konzentrieren, nichtparametrische Tests zu verwenden, die ich nicht verwende Ich glaube nicht, dass oft genug erwähnt wird!
Hypothesentests des Mittelwerts und des Medians
Nichtparametrische Tests sind wie ein Paralleluniversum zu parametrischen Tests. Die Tabelle zeigt verwandte Paare von Hypothesentests, die Minitab Statistische Software bietet.
Parametrische Tests (Mittelwerte) |
Nichtparametrische Tests (Mediane) |
t-Test mit 1 Stichprobe |
1-Stichproben-Zeichen, 1-Stichproben-Wilcoxon |
2-Stichproben-t-Test |
Mann-Whitney-Test |
Einweg-ANOVA |
Kruskal-Wallis, Moods Median-Test |
Faktorielle DOE mit einem Faktor und einer Blockierungsvariablen |
Friedman-Test |
Gründe für die Verwendung parametrischer Tests
Grund 1: Parametrische Tests können mit verzerrten und nicht normalen Verteilungen gut funktionieren.
Dies mag eine Überraschung sein, aber parametrische Tests können mit kontinuierlichen Daten, die nicht normal sind, gut funktionieren, wenn Sie die Richtlinien für die Stichprobengröße in erfüllen In der nachstehenden Tabelle. Diese Richtlinien basieren auf Simulationsstudien, die von Statistikern hier bei Minitab durchgeführt wurden. Weitere Informationen zu diesen Studien finden Sie in unseren technischen Unterlagen.
Parametrisch Analysen |
Richtlinien für die Stichprobengröße für nicht normale Daten |
t-Test mit 1 Stichprobe |
Größer als 20 |
t-Test mit 2 Stichproben |
Jede Gruppe sollte größer als 15 sein. |
Einweg-ANOVA |
|
Grund 2: Parametrische Tests können gut funktionieren, wenn die Streuung jeder Gruppe ist anders
Während nichtparametrische Tests nicht davon ausgehen, dass Ihre Daten einer Normalverteilung folgen, haben sie andere Annahmen, die schwer zu erfüllen sein können. Bei nichtparametrischen Tests, bei denen Gruppen verglichen werden, wird häufig davon ausgegangen, dass die Daten für alle Gruppen dieselbe Streuung (Dispersion) aufweisen müssen. Wenn Ihre Gruppen eine andere Streuung haben, liefern die nichtparametrischen Tests möglicherweise keine gültigen Ergebnisse.
Wenn Sie dagegen den 2-Stichproben-t-Test oder die Einweg-ANOVA verwenden, können Sie einfach zum gehen Unterdialog Optionen und Deaktivieren Sie Gleiche Abweichungen annehmen. Voilà, Sie können auch dann loslegen, wenn die Gruppen unterschiedliche Spreads haben!
Grund 3: Statistische Leistung
Parametrische Tests haben normalerweise mehr statistische Leistung als nichtparametrische Tests. Daher ist es wahrscheinlicher, dass Sie einen signifikanten Effekt feststellen, wenn einer tatsächlich existiert.
Gründe für die Verwendung nichtparametrischer Tests
Grund 1: Ihr Studienbereich wird besser durch den Median
Dies ist mein Lieblingsgrund für einen nichtparametrischen Test, der nicht oft genug erwähnt wird! Die Tatsache, dass Sie einen parametrischen Test mit nicht normalen Daten durchführen können, bedeutet nicht, dass der Mittelwert die Statistik ist, die Sie testen möchten.
Beispielsweise kann das Zentrum einer verzerrten Verteilung wie das Einkommen sein besser gemessen am Median, wobei 50% über dem Median und 50% unter dem Median liegen. Wenn Sie einer Stichprobe einige Milliardäre hinzufügen, steigt der mathematische Mittelwert stark an, obwohl sich das Einkommen für die typische Person nicht ändert.
Wenn Ihre Verteilung ausreichend verzerrt ist, wird der Mittelwert stark von weit entfernten Änderungen beeinflusst im Schwanz der Verteilung, während der Median das Zentrum der Verteilung weiterhin genauer widerspiegelt. Für diese beiden Verteilungen ergibt eine Zufallsstichprobe von 100 aus jeder Verteilung Mittelwerte, die sich signifikant unterscheiden, aber Mediane, die sich nicht signifikant unterscheiden.
Zwei andere Blog-Beiträge veranschaulichen diesen Punkt gut:
- Verwenden des Mittelwerts in der Datenanalyse: Es ist nicht immer ein Slam-Dunk
- Die nicht parametrische Wirtschaft: Was bedeutet Durchschnitt eigentlich?
Grund 2: Sie haben eine sehr kleine Stichprobengröße
Wenn Sie die Richtlinien für die Stichprobengröße für die parametrischen Tests nicht erfüllen und nicht sicher sind, ob Sie diese haben Bei normalverteilten Daten sollten Sie einen nichtparametrischen Test verwenden. Wenn Sie eine wirklich kleine Stichprobe haben, können Sie möglicherweise nicht einmal die Verteilung Ihrer Daten ermitteln, da die Verteilungstests nicht über ausreichende Leistung verfügen, um aussagekräftige Ergebnisse zu liefern.
In diesem Szenario befinden Sie sich in einem schwierige Situation ohne gültige Alternative. Nichtparametrische Tests haben anfangs weniger Leistung und es ist ein Doppelschlag, wenn Sie zusätzlich eine kleine Stichprobengröße hinzufügen!
Grund 3: Sie haben Ordnungsdaten, Rangdaten oder Ausreißer, die Sie nicht können entfernen
Typische parametrische Tests können nur kontinuierliche Daten bewerten und die Ergebnisse können durch Ausreißer erheblich beeinflusst werden. Umgekehrt können einige nichtparametrische Tests Ordnungsdaten und Rangdaten verarbeiten und werden von Ausreißern nicht ernsthaft beeinflusst. Überprüfen Sie unbedingt die Annahmen für den nichtparametrischen Test, da jeder seine eigenen Datenanforderungen hat.
Wenn Sie Likert-Daten haben und zwei Gruppen vergleichen möchten, lesen Sie meinen Beitrag Beste Methode zur Analyse von Likert-Artikeldaten: Zwei Beispiel-T-Test gegen Mann-Whitney.
Abschließende Gedanken
Es wird allgemein angenommen, dass die Notwendigkeit, zwischen einem parametrischen und einem nichtparametrischen Test zu wählen, auftritt, wenn Ihre Daten eine Annahme der nicht erfüllen parametrischer Test. Dies kann der Fall sein, wenn Sie sowohl eine kleine Stichprobengröße als auch nicht normale Daten haben. Andere Überlegungen spielen jedoch häufig eine Rolle, da parametrische Tests häufig nicht normale Daten verarbeiten können. Umgekehrt haben nichtparametrische Tests strenge Annahmen, die Sie nicht außer Acht lassen können.
Die Entscheidung hängt häufig davon ab, ob der Mittelwert oder Median das Zentrum der Verteilung Ihrer Daten genauer darstellt.
- Wenn der Mittelwert genau das Zentrum Ihrer Verteilung darstellt und Ihre Stichprobengröße groß genug ist, ziehen Sie einen parametrischen Test in Betracht, da diese leistungsfähiger sind.
- Wenn der Median das Zentrum Ihrer Verteilung besser darstellt, berücksichtigen Sie den nichtparametrischen Testen Sie selbst dann, wenn Sie eine große Stichprobe haben.
Wenn Sie eine sehr kleine Stichprobengröße haben, kann es sein, dass Sie mit einem nichtparametrischen Test nicht weiterkommen. Bitte sammeln Sie beim nächsten Mal weitere Daten, wenn dies überhaupt möglich ist! Wie Sie sehen können, sind die Richtlinien für die Stichprobengröße nicht wirklich so groß. Ihre Chance, einen signifikanten Effekt zu erkennen, wenn einer vorhanden ist, kann sehr gering sein, wenn Sie sowohl eine kleine Stichprobengröße haben als auch einen weniger effizienten nichtparametrischen Test verwenden müssen!