Alegerea dintre un test nonparametric și un test parametric

Este sigur să spunem că majoritatea oamenilor care folosesc statistici sunt mai familiarizați cu analizele parametrice decât analizele nonparametrice. Testele nonparametrice se mai numesc și teste fără distribuție, deoarece nu presupun că datele dvs. urmează o distribuție specifică.

Este posibil să fi auzit că ar trebui să utilizați teste nonparametrice atunci când datele dvs. nu îndeplinesc ipotezele testul parametric, în special ipoteza despre datele distribuite în mod normal. Sună ca o modalitate drăguță și simplă de a alege, dar există considerente suplimentare.

În această postare, vă voi ajuta să stabiliți când ar trebui să utilizați un:

  • Analiza parametrică pentru a testa mijloacele de grup.
  • Analiza nonparametrică pentru a testa medianele de grup.

În special, mă voi concentra pe un motiv important pentru a utiliza teste nonparametrice pe care nu le fac Nu cred că este menționat suficient de des!

Testele de ipoteză ale mediei și medianei

Testele nonparametrice sunt ca un univers paralel cu testele parametrice. Tabelul prezintă perechi de teste de ipoteză legate de Minitab Oferte de software statistice.

Teste parametrice (mijloace)

Teste nonparametrice (mediane)

Test cu 1 eșantion t

1-eșantion Semn, 1-eșantion Wilcoxon

2-eșantion t test

Test Mann-Whitney

ANOVA unidirecțional

Kruskal-Wallis, testul mediu al lui Mood

DOE factorial cu un factor și o variabilă de blocare

test Friedman

Motive pentru utilizarea testelor parametrice

Motivul 1: Testele parametrice pot funcționa bine cu distribuții înclinate și nenormale

Aceasta poate fi o surpriză, dar testele parametrice pot funcționa bine cu date continue care sunt nenormale dacă îndepliniți indicațiile privind dimensiunea eșantionului din tabelul de mai jos. Aceste linii directoare se bazează pe studii de simulare efectuate de statistici aici la Minitab. Pentru a afla mai multe despre aceste studii, citiți Documentele noastre tehnice.

Parametric analize

Linii directoare privind dimensiunea eșantionului pentru date nenormale

1-test t test

Mai mare de 20

Test cu 2 eșantioane

Fiecare grup trebuie să fie mai mare de 15

ANOVA unidirecțional

  • Dacă aveți 2-9 grupuri, fiecare grup ar trebui să fie mai mare de 15.
  • Dacă aveți 10-12 grupuri, fiecare grup ar trebui să fie mai mare de 20.

Motivul 2: Testele parametrice pot avea rezultate bune atunci când răspândirea fiecărui grup este diferite

În timp ce testele nonparametrice nu presupun că datele dvs. urmează o distribuție normală, ele au și alte ipoteze care pot fi greu de îndeplinit. Pentru testele neparametrice care compară grupurile, o presupunere comună este că datele pentru toate grupurile trebuie să aibă aceeași răspândire (dispersie). Dacă grupurile dvs. au o diferență diferită, este posibil ca testele nonparametrice să nu ofere rezultate valide.

Pe de altă parte, dacă utilizați testul t cu 2 eșantioane sau ANOVA unidirecțional, puteți accesa Subdialog Opțiuni și debifați Să presupunem varianțe egale. Voilà, ești bine să mergi chiar și atunci când grupurile au diferențe diferite!

Motivul 3: Puterea statistică

Testele parametrice au de obicei mai multă putere statistică decât testele nonparametrice. Astfel, este mai probabil să detectați un efect semnificativ atunci când unul există cu adevărat.

Motive pentru a utiliza teste nonparametrice

Motivul 1: Zona dvs. de studiu este reprezentată mai bine de mediana

Acesta este motivul meu preferat pentru a folosi un test nonparametric și cel care nu este menționat suficient de des! Faptul că puteți efectua un test parametric cu date nenormale nu implică faptul că media este statistica pe care doriți să o testați.

De exemplu, centrul unei distribuții înclinate, cum ar fi venitul, poate fi mai bine măsurată prin mediană unde 50% sunt peste medie și 50% sunt sub. Dacă adăugați câțiva miliardari la un eșantion, media matematică crește foarte mult, chiar dacă veniturile pentru persoana tipică nu se modifică.

Când distribuția dvs. este suficient de înclinată, media este puternic afectată de modificările de departe în coada distribuției, în timp ce mediana continuă să reflecte mai atent centrul distribuției. Pentru aceste două distribuții, un eșantion aleatoriu de 100 din fiecare distribuție produce mijloace care sunt semnificativ diferite, dar mediane care nu sunt semnificativ diferite.

Alte două postări pe blog ilustrează bine acest punct:

  • Utilizarea mediei în analiza datelor: nu este întotdeauna un Slam-Dunk
  • Economia non-parametrică: ce înseamnă de fapt media?

Motivul 2: aveți o dimensiune a eșantionului foarte mică

Dacă nu respectați liniile directoare privind dimensiunea eșantionului pentru testele parametrice și nu sunteți sigur că aveți datele distribuite în mod normal, ar trebui să utilizați un test nonparametric. Când aveți un eșantion foarte mic, s-ar putea să nu fiți capabil nici măcar să aflați distribuția datelor dvs., deoarece testele de distribuție nu vor avea suficientă putere pentru a oferi rezultate semnificative.

În acest scenariu, vă aflați într-un loc dificil fără alternativă validă. Testele nonparametrice au mai puțină putere pentru început și este o dublă greșeală atunci când adăugați o dimensiune mică a eșantionului!

Motivul 3: Aveți date ordinale, date clasificate sau valori anormale pe care nu le puteți elimina

Testele parametrice tipice pot evalua doar date continue, iar rezultatele pot fi semnificativ afectate de valori aberante. Dimpotrivă, unele teste nonparametrice pot trata date ordinale, date clasificate și nu pot fi afectate în mod serios de valori aberante. Asigurați-vă că verificați ipotezele pentru testul nonparametric, deoarece fiecare are propriile cerințe de date.

Dacă aveți date Likert și doriți să comparați două grupuri, citiți articolul meu Cel mai bun mod de a analiza datele despre elementele Likert: Două Eșantion T-Test față de Mann-Whitney.

Gânduri de închidere

De obicei se crede că necesitatea de a alege între un test parametric și un test nonparametric apare atunci când datele dvs. nu îndeplinesc o presupunere a test parametric. Acesta poate fi cazul când aveți atât o dimensiune mică a eșantionului, cât și date non-normale. Cu toate acestea, alte considerații joacă adesea un rol, deoarece testele parametrice pot gestiona adesea date nenormale. În schimb, testele nonparametrice au presupuneri stricte pe care nu le puteți ignora.

Decizia depinde adesea dacă media sau mediana reprezintă mai precis centrul distribuției datelor dvs.

  • Dacă media reprezintă cu precizie centrul distribuției dvs. și dimensiunea eșantionului dvs. este suficient de mare, luați în considerare un test parametric, deoarece acestea sunt mai puternice.
  • Dacă mediana reprezintă mai bine centrul distribuției dvs., luați în considerare parametrul nonparametric testați chiar și atunci când aveți un eșantion mare.

În cele din urmă, dacă aveți o dimensiune foarte mică a eșantionului, s-ar putea să vă blocați folosind un test nonparametric. Vă rugăm, colectați mai multe date data viitoare dacă este posibil! După cum puteți vedea, liniile directoare privind dimensiunea eșantionului nu sunt chiar atât de mari. Șansa dvs. de a detecta un efect semnificativ atunci când există poate fi foarte mică atunci când aveți atât o dimensiune mică a eșantionului, cât și trebuie să utilizați un test nonparametric mai puțin eficient!

Write a Comment

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *