Można śmiało powiedzieć, że większość osób korzystających ze statystyk lepiej zna analizy parametryczne niż analizy nieparametryczne. Testy nieparametryczne są również nazywane testami bez dystrybucji, ponieważ nie zakładają, że dane mają określony rozkład.
Być może słyszałeś, że powinieneś używać testów nieparametrycznych, gdy twoje dane nie spełniają założeń test parametryczny, zwłaszcza założenie dotyczące danych o rozkładzie normalnym. Brzmi to jak miły i prosty sposób wyboru, ale istnieją dodatkowe kwestie.
W tym poście pomogę Ci określić, kiedy należy użyć:
- Analiza parametryczna dla średnich grup testowych.
- Analiza nieparametryczna dla median grup testowych.
W szczególności skupię się na ważnym powodzie, dla którego warto stosować testy nieparametryczne, których myślę, że jest wymieniany wystarczająco często!
Testy hipotez średniej i mediany
Testy nieparametryczne są jak wszechświat równoległy do testów parametrycznych. Tabela pokazuje powiązane pary testów hipotez, które Oferty oprogramowania statystycznego.
Testy parametryczne (średnie) |
Testy nieparametryczne (mediany) |
Test t z 1 próbką |
1-próbka znak, 1-próbka Wilcoxon |
2-próbka t test |
Test Manna-Whitneya |
Jednokierunkowa ANOVA |
Kruskal-Wallis, test mediany Mooda |
Factorial DOE z jednym czynnikiem i jedną zmienną blokującą |
Test Friedmana |
Powody, dla których warto stosować testy parametryczne
Powód 1: Testy parametryczne mogą dobrze działać ze skośnymi i nienormalnymi rozkładami
Może to być niespodzianką, ale testy parametryczne mogą działać dobrze z ciągłymi danymi, które są nienormalne, jeśli spełniasz stół poniżej. Niniejsze wytyczne są oparte na badaniach symulacyjnych przeprowadzonych przez statystyków w firmie Minitab. Aby dowiedzieć się więcej o tych badaniach, przeczytaj nasze artykuły techniczne.
Parametryczne analizy |
Wytyczne dotyczące wielkości próby dla danych nienormalnych |
Test t z 1 próbką |
Większe niż 20 |
Test t z 2 próbkami |
Każda grupa powinna być większa niż 15 |
Jednokierunkowa ANOVA |
|
Powód 2: Testy parametryczne mogą działać dobrze, gdy rozrzut każdej grupy jest różne
Chociaż testy nieparametryczne nie zakładają, że dane mają rozkład normalny, mają inne założenia, które mogą być trudne do spełnienia. W przypadku testów nieparametrycznych, które porównują grupy, zakłada się, że dane dla wszystkich grup muszą mieć taki sam rozrzut (rozproszenie). Jeśli twoje grupy mają inny rozrzut, testy nieparametryczne mogą nie dać prawidłowych wyników.
Z drugiej strony, jeśli używasz testu t z 2 próbami lub jednokierunkowej ANOVA, możesz po prostu przejść do Okno dialogowe Opcje i usuń zaznaczenie opcji Zakładaj równe wariancje. Voilà, możesz działać, nawet jeśli grupy mają różne spready!
Powód 3: Moc statystyczna
Testy parametryczne mają zwykle większą moc statystyczną niż testy nieparametryczne. W związku z tym prawdopodobieństwo wykrycia znaczącego efektu jest większe, gdy istnieje naprawdę.
Powody, dla których warto stosować testy nieparametryczne
Powód 1: Twój obszar badań jest lepiej reprezentowany przez medianę
To jest mój ulubiony powód, aby używać testu nieparametrycznego i takiego, o którym nie mówi się wystarczająco często! Fakt, że możesz przeprowadzić test parametryczny z danymi nienormalnymi, nie oznacza, że średnia jest statystyką, którą chcesz przetestować.
Na przykład środek skośnego rozkładu, takiego jak dochód, może być lepiej mierzony medianą, gdzie 50% jest powyżej mediany, a 50% poniżej. Jeśli dodasz do próby kilku miliarderów, średnia matematyczna znacznie wzrośnie, mimo że dochód typowej osoby się nie zmieni.
Kiedy Twój rozkład jest wystarczająco wypaczony, znaczny wpływ na średnią mają daleko idące zmiany poza ogonem rozkładu, podczas gdy mediana nadal dokładniej odzwierciedla środek rozkładu. Dla tych dwóch dystrybucji losowa próbka 100 z każdej dystrybucji daje średnie, które są znacząco różne, ale mediany nie różnią się znacząco.
Dwa inne posty na blogu dobrze to ilustrują:
- Używanie średniej w analizie danych: nie zawsze jest to slam-dunk
- Gospodarka nieparametryczna: co właściwie oznacza średnia?
Powód 2: Masz bardzo małą próbę
Jeśli nie spełniasz wytycznych dotyczących wielkości próby dla testów parametrycznych i nie masz pewności, że masz danych o rozkładzie normalnym, należy użyć testu nieparametrycznego. Jeśli masz naprawdę małą próbkę, możesz nawet nie być w stanie ustalić rozkładu danych, ponieważ testy dystrybucji nie będą miały wystarczającej mocy, aby dostarczyć znaczących wyników.
W tym scenariuszu jesteś w trudne miejsce bez ważnej alternatywy. Testy nieparametryczne mają na początku mniejszą moc, a dodanie do tego małej próbki jest podwójną porażką!
Powód 3: masz dane porządkowe, rankingowe lub wartości odstające usuń
Typowe testy parametryczne mogą oceniać tylko ciągłe dane, a wartości odstające mogą mieć znaczący wpływ na wyniki. I odwrotnie, niektóre testy nieparametryczne mogą obsługiwać dane porządkowe, dane rankingowe i nie mają na nie poważnego wpływu wartości odstające. Pamiętaj, aby sprawdzić założenia dla testu nieparametrycznego, ponieważ każdy z nich ma własne wymagania dotyczące danych.
Jeśli masz dane Likerta i chcesz porównać dwie grupy, przeczytaj mój post Najlepszy sposób na analizę danych pozycji Likerta: dwa Przykładowy test T w porównaniu z testem Manna-Whitneya.
Uwagi końcowe
Powszechnie uważa się, że potrzeba wyboru między testem parametrycznym a nieparametrycznym pojawia się, gdy dane nie spełniają założeń test parametryczny. Może tak być w przypadku, gdy masz zarówno mały rozmiar próbki, jak i nietypowe dane. Jednak inne względy często odgrywają rolę, ponieważ testy parametryczne często radzą sobie z danymi nienormalnymi. I odwrotnie, testy nieparametryczne mają ścisłe założenia, których nie można lekceważyć.
Decyzja często zależy od tego, czy średnia lub mediana dokładniej reprezentuje środek rozkładu danych.
- Jeśli średnia dokładnie przedstawia środek rozkładu, a wielkość próby jest wystarczająco duża, rozważ test parametryczny, ponieważ są one silniejsze.
- Jeśli mediana lepiej odzwierciedla środek rozkładu, rozważ nieparametryczny test, nawet jeśli masz dużą próbkę.
Wreszcie, jeśli masz bardzo małą próbkę, możesz utknąć przy użyciu testu nieparametrycznego. Proszę, zbierz więcej danych następnym razem, jeśli to w ogóle możliwe! Jak widać, wytyczne dotyczące wielkości próby nie są tak duże. Twoja szansa na wykrycie znaczącego efektu, gdy taki istnieje, może być bardzo mała, gdy masz zarówno mały rozmiar próbki, jak i potrzebujesz mniej wydajnego testu nieparametrycznego!