Att välja mellan ett icke-parametriskt test och ett parametriskt test

Det är säkert att säga att de flesta som använder statistik är mer bekanta med parametriska analyser än icke-parametriska analyser. Icke-parametriska tester kallas också distributionsfria tester eftersom de inte antar att dina data följer en specifik distribution.

Du kanske har hört att du bör använda icke-parametriska tester när dina data inte uppfyller antagandena om det parametriska testet, särskilt antagandet om normalt distribuerad data. Det låter som ett trevligt och enkelt sätt att välja, men det finns ytterligare överväganden.

I det här inlägget hjälper jag dig att avgöra när du ska använda en:

  • Parametrisk analys till testgrupp betyder.
  • Icke-parametrisk analys för testgruppsmedianer.

Jag fokuserar särskilt på en viktig anledning att använda icke-parametriska test som jag inte gör tänker inte nämns ofta nog!

Hypotes Tester av medelvärdet och medianen

Icke-parametriska tester är som ett parallellt universum till parametriska tester. Tabellen visar relaterade par hypotesprov som Minitab Statistisk programvara erbjuder.

Parametriska tester (medel)

Icke-parametriska tester (medianer)

1-prov t-test

1-provtecken, 1-prov Wilcoxon

2-prov t-test

Mann-Whitney test

Envägs ANOVA

Kruskal-Wallis, Moods medianprov

Faktorisk DOE med en faktor och en blockerande variabel

Friedman-test

Anledningar till att använda parametriska tester

Orsak 1: Parametriska tester kan fungera bra med snedställda och icke-normala fördelningar

Detta kan vara en överraskning men parametriska tester kan fungera bra med kontinuerliga data som inte är normala om du uppfyller riktlinjerna för provstorlek i tabellen nedan. Dessa riktlinjer är baserade på simuleringsstudier utförda av statistiker här på Minitab. För att lära dig mer om dessa studier, läs våra tekniska dokument.

Parametrisk analyser

Riktlinjer för provstorlek för icke-normala data

1-prov t test

Mer än 20

2-prov t-test

Varje grupp ska vara större än 15

Envägs ANOVA

  • Om du har 2-9 grupper ska varje grupp vara större än 15.
  • Om du har 10-12 grupper ska varje grupp vara större än 20.

Orsak 2: Parametriska tester kan fungera bra när spridningen för varje grupp är olika

Även om icke-parametriska tester inte antar att dina data följer en normal distribution, har de andra antaganden som kan vara svåra att uppfylla. För icke-parametriska tester som jämför grupper är ett vanligt antagande att data för alla grupper måste ha samma spridning (dispersion). Om dina grupper har en annan spridning kan det hända att de icke-parametriska testerna inte ger giltiga resultat.

Å andra sidan, om du använder 2-prov t-test eller Envägs ANOVA, kan du helt enkelt gå till Alternativ underdialog och avmarkera Antag lika avvikelser. Voilà, du är bra att gå även när grupperna har olika spridningar!

Orsak 3: Statistisk kraft

Parametriska tester har vanligtvis mer statistisk kraft än icke-parametriska tester. Således är det mer troligt att du upptäcker en signifikant effekt när en verkligen finns.

Anledningar att använda icke-parametriska test

Orsak 1: Ditt studieområde representeras bättre av medianen

Detta är min favoritskäl att använda ett icke-parametriskt test och det som inte nämns tillräckligt ofta! Det faktum att du kan utföra ett parametriskt test med icke-normala data betyder inte att medelvärdet är den statistik som du vill testa.

Till exempel kan mitten av en sned fördelning, som inkomst, vara bättre mätt med medianen där 50% ligger över medianen och 50% är under. Om du lägger till några miljardärer i ett urval ökar det matematiska medelvärdet kraftigt även om inkomsten för den typiska personen inte ändras.

När din fördelning är tillräckligt sned påverkas medelvärdet starkt av förändringar långt ut i fördelningens svans medan medianen fortsätter att återspegla distributionens centrum. För dessa två distributioner ger ett slumpmässigt urval på 100 från varje distribution medel som är signifikanta olika, men medianer som inte är signifikant olika.

Två andra blogginlägg illustrerar denna punkt väl:

  • Använda medelvärdet i dataanalys: Det är inte alltid en slam-dunk
  • Den icke-parametriska ekonomin: Vad betyder genomsnittet egentligen?

Orsak 2: Du har en mycket liten provstorlek

Om du inte uppfyller riktlinjerna för provstorlek för parametriska tester och du inte är säker på att du har normalt distribuerad data bör du använda ett icke-parametriskt test. När du har ett riktigt litet urval kanske du inte ens kan fastställa distributionen av dina data eftersom distributionstesterna saknar tillräcklig kraft för att ge meningsfulla resultat.

I det här scenariot befinner du dig i en tuff plats utan något giltigt alternativ. Icke-parametriska tester har mindre kraft till att börja med och det är dubbelt whammy när du lägger till en liten provstorlek på toppen av det!

Orsak 3: Du har ordinarie data, rankad data eller outliers som du inte kan ta bort

Typiska parametriska tester kan bara bedöma kontinuerlig data och resultaten kan påverkas avsevärt av avvikare. Omvänt kan vissa icke-parametriska tester hantera ordinarie data, rankade data och inte påverkas allvarligt av outliers. Var noga med att kontrollera antagandena för det icke-parametriska testet eftersom var och en har sina egna datakrav.

Om du har Likert-data och vill jämföra två grupper, läs mitt inlägg Bästa sättet att analysera Likert-objektdata: Två Exempel på T-test kontra Mann-Whitney.

Avslutande tankar

Det anses vanligtvis att behovet att välja mellan ett parametriskt och icke-parametriskt test uppstår när dina data inte uppfyller ett antagande om parametriskt test. Detta kan vara fallet när du har både en liten provstorlek och icke-normala data. Men andra överväganden spelar ofta en roll eftersom parametriska tester ofta kan hantera icke-normala data. Omvänt har icke-parametriska tester strikta antaganden som du inte kan bortse från.

Beslutet beror ofta på om medelvärdet eller medianen mer exakt representerar centrum för din datas distribution.

  • Om medelvärdet representerar mitten av din distribution och din provstorlek är tillräckligt stor, överväg ett parametriskt test eftersom de är mer kraftfulla.
  • Om medianen bättre representerar mitten av din distribution, överväg det icke-parametriska test även när du har ett stort urval.

Slutligen, om du har en mycket liten provstorlek, kanske du fastnar med ett icke-parametriskt test. Vänligen samla in mer information nästa gång om det är möjligt! Som du kan se är riktlinjerna för provstorlek inte riktigt så stora. Din chans att upptäcka en signifikant effekt när en existerar kan vara väldigt liten när du har både en liten provstorlek och du måste använda ett mindre effektivt icke-parametriskt test!

Write a Comment

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *