Kiezen tussen een niet-parametrische test en een parametrische test

Het is veilig om te zeggen dat de meeste mensen die statistieken gebruiken meer vertrouwd zijn met parametrische analyses dan met niet-parametrische analyses. Niet-parametrische tests worden ook wel distributievrije tests genoemd, omdat ze er niet van uitgaan dat uw gegevens een specifieke distributie volgen.

U heeft misschien gehoord dat u niet-parametrische tests moet gebruiken als uw gegevens niet voldoen aan de aannames van de parametrische test, vooral de aanname over normaal verdeelde gegevens. Dat klinkt als een leuke en eenvoudige manier om te kiezen, maar er zijn aanvullende overwegingen.

In dit bericht zal ik je helpen te bepalen wanneer je een:

  • Parametrische analyse om groepsgemiddelden te testen.
  • Niet-parametrische analyse om groepsmedianen te testen.

In het bijzonder zal ik me concentreren op een belangrijke reden om niet-parametrische tests te gebruiken die ik doe ik denk niet dat wordt vaak genoeg genoemd!

Hypothesetests van het gemiddelde en de mediaan

Niet-parametrische tests zijn als een parallel universum voor parametrische tests. De tabel toont gerelateerde paren hypothesetests die Minitab Statistische software biedt.

Parametrische tests (middelen)

Niet-parametrische tests (medianen)

1-steekproef t-test

1-sample Sign, 1-sample Wilcoxon

2-sample t-test

Mann-Whitney-test

One-Way ANOVA

Kruskal-Wallis, Mood’s mediane test

Factorial DOE met één factor en één blokkerende variabele

Friedman-test

Redenen om parametrische tests te gebruiken

Reden 1: Parametrische tests kunnen goed presteren met scheve en niet-normale distributies

Dit kan een verrassing zijn, maar parametrische tests kunnen goed presteren met continue gegevens die niet normaal zijn als u voldoet aan de richtlijnen voor steekproefomvang in De tafel onder. Deze richtlijnen zijn gebaseerd op simulatiestudies die door statistici hier bij Minitab zijn uitgevoerd. Lees onze technische documenten voor meer informatie over deze onderzoeken.

Parametrisch analyses

Richtlijnen voor steekproefomvang voor niet-normale gegevens

1-steekproef t-test

Groter dan 20

2-steekproef t-test

Elke groep moet groter zijn dan 15

One-Way ANOVA

  • Als je 2-9 groepen hebt, moet elke groep groter zijn dan 15.
  • Als je 10-12 groepen hebt, moet elke groep groter zijn dan 20.

Reden 2: parametrische tests kunnen goed presteren als de spreiding van elke groep verschillend

Hoewel niet-parametrische tests er niet van uitgaan dat uw gegevens een normale verdeling volgen, hebben ze wel andere aannames waaraan moeilijk kan worden voldaan. Voor niet-parametrische tests die groepen vergelijken, is een algemene aanname dat de gegevens voor alle groepen dezelfde spreiding (spreiding) moeten hebben. Als uw groepen een andere spreiding hebben, leveren de niet-parametrische tests mogelijk geen geldige resultaten op.

Aan de andere kant, als u de 2-sample t-test of One-Way ANOVA gebruikt, kunt u gewoon naar de Het subdialoogvenster Opties en schakel Veronderstel gelijke varianties uit. Voilà, je bent klaar om te gaan, zelfs als de groepen verschillende spreads hebben!

Reden 3: statistische kracht

Parametrische tests hebben meestal meer statistische kracht dan niet-parametrische tests. Het is dus waarschijnlijker dat u een significant effect opmerkt wanneer er echt een bestaat.

Redenen om niet-parametrische tests te gebruiken

Reden 1: uw studiegebied wordt beter weergegeven door de mediaan

Dit is mijn favoriete reden om een niet-parametrische test te gebruiken en degene die niet vaak genoeg wordt genoemd! Het feit dat u een parametrische test kunt uitvoeren met niet-normale gegevens, betekent niet dat het gemiddelde de statistiek is die u wilt testen.

Het centrum van een scheve verdeling, zoals inkomen, kan bijvoorbeeld zijn beter gemeten door de mediaan waarbij 50% boven de mediaan ligt en 50% eronder. Als u een paar miljardairs aan een steekproef toevoegt, neemt het wiskundige gemiddelde enorm toe, ook al verandert het inkomen voor de gemiddelde persoon niet.

Wanneer uw verdeling voldoende scheef is, wordt het gemiddelde sterk beïnvloed door uit in de staart van de distributie, terwijl de mediaan het centrum van de distributie nauwer blijft weerspiegelen. Voor deze twee distributies levert een willekeurige steekproef van 100 van elke distributie middelen op die significant verschillen, maar medianen die niet significant verschillen.

Twee andere blogposts illustreren dit punt goed:

  • Het gemiddelde gebruiken in gegevensanalyse: het is niet altijd een klap.
  • De niet-parametrische economie: wat betekent gemiddelde eigenlijk?

Reden 2: u heeft een zeer kleine steekproefomvang

Als u niet voldoet aan de richtlijnen voor steekproefomvang voor de parametrische tests en u er niet zeker van bent dat u wel normaal verdeelde gegevens, moet u een niet-parametrische test gebruiken. Als je een heel kleine steekproef hebt, ben je misschien niet eens in staat om de distributie van je gegevens te achterhalen, omdat de distributietests onvoldoende kracht hebben om zinvolle resultaten te geven.

In dit scenario bevindt u zich in een moeilijke plek zonder geldig alternatief. Niet-parametrische tests hebben om te beginnen minder kracht en het is een dubbele klap als je daar een kleine steekproef aan toevoegt!

Reden 3: je hebt ordinale gegevens, gerangschikte gegevens of uitschieters die je niet kunt remove

Typische parametrische tests kunnen alleen continue gegevens beoordelen en de resultaten kunnen aanzienlijk worden beïnvloed door uitschieters. Omgekeerd kunnen sommige niet-parametrische tests ordinale gegevens en gerangschikte gegevens verwerken en niet ernstig worden beïnvloed door uitschieters. Zorg ervoor dat je de aannames voor de niet-parametrische test controleert, want elke test heeft zijn eigen gegevensvereisten.

Als je Likert-gegevens hebt en twee groepen wilt vergelijken, lees dan mijn bericht Beste manier om Likert-itemgegevens te analyseren: twee Voorbeeld T-test versus Mann-Whitney.

Afsluitende gedachten

Er wordt algemeen aangenomen dat de noodzaak om te kiezen tussen een parametrische en niet-parametrische test optreedt wanneer uw gegevens niet voldoen aan de aanname van de parametrische test. Dit kan het geval zijn wanneer u zowel een kleine steekproefomvang als niet-normale gegevens heeft. Er spelen echter vaak andere overwegingen een rol omdat parametrische tests vaak niet-normale gegevens kunnen verwerken. Omgekeerd hebben niet-parametrische tests strikte veronderstellingen die u niet kunt negeren.

De beslissing hangt er vaak van af of het gemiddelde of de mediaan nauwkeuriger het centrum van de gegevensverdeling vertegenwoordigt.

  • Als het gemiddelde nauwkeurig het centrum van uw distributie vertegenwoordigt en uw steekproefomvang groot genoeg is, overweeg dan een parametrische test omdat deze krachtiger is.
  • Als de mediaan het centrum van uw distributie beter vertegenwoordigt, overweeg dan de niet-parametrische test zelfs als je een grote steekproef hebt.

Ten slotte, als je een zeer kleine steekproef hebt, zit je misschien vast met een niet-parametrische test. Verzamel alsjeblieft de volgende keer meer gegevens als het überhaupt mogelijk is! Zoals u kunt zien, zijn de richtlijnen voor steekproefomvang niet echt zo groot. Uw kans om een significant effect te detecteren wanneer er een bestaat, kan erg klein zijn wanneer u zowel een kleine steekproefgrootte heeft als u een minder efficiënte niet-parametrische test moet gebruiken!

Write a Comment

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *