On turvallista sanoa, että useimmat tilastoja käyttävät ihmiset tuntevat paremmin parametriset analyysit kuin ei-parametrit. Ei-parametreja testejä kutsutaan myös jakeluittaisiksi testeiksi, koska niissä ei oleteta, että tietosi seuraavat tiettyä jakaumaa.
Olet ehkä kuullut, että sinun tulisi käyttää ei-parametreja testejä, kun tietosi eivät täytä parametritesti, erityisesti oletus normaalisti jaetusta datasta. Se kuulostaa hyvältä ja suoraviivaiselta tavalta valita, mutta on myös muita näkökohtia.
Tässä viestissä autan sinua määrittämään, milloin sinun pitäisi käyttää:
- Parametrinen analyysi testiryhmän keskiarvoille.
- Ei-parametrinen analyysi ryhmän mediaanien testaamiseksi.
Keskityn erityisesti tärkeään syyn käyttää ei-parametrisia testejä, joita en Luulen, ettei mainita tarpeeksi usein!
Hypoteesitestit keskiarvosta ja mediaanista
Parametrittomat testit ovat kuin rinnakkainen universumi parametritesteille. Taulukko näyttää liittyvät hypoteesitestit, jotka Minitab Tilasto-ohjelmisto tarjoaa.
Parametriset testit (keskiarvot) |
Ei-parametriset testit (mediaanit) |
1-näyte t-testi |
1-näyte-merkki, 1-näyte Wilcoxon |
2-näyte-t-testi |
Mann-Whitney-testi |
Yksisuuntainen ANOVA |
Kruskal-Wallis, Moodin mediaanitesti |
Factorial DOE yhdellä tekijällä ja yhdellä estomuuttujalla |
Friedman-testi |
Syitä käyttää parametrisia testejä
Syy 1: Parametriset testit voivat toimia hyvin vinojen ja ei-normaalien jakaumien kanssa.
Tämä voi olla yllätys, mutta parametriset testit voivat toimia hyvin jatkuvilla tiedoilla, jotka eivät ole normaaleja, jos täytät näytteen koon ohjeet alla olevassa taulukossa. Nämä ohjeet perustuvat simulaatiotutkimuksiin, jotka tilastotieteilijät ovat tehneet täällä Minitabissa. Lisätietoja näistä tutkimuksista on teknisissä asiakirjoissamme.
Parametri analyysi |
Näytekoko-ohjeet ei-normaalille tiedolle |
1 näyte t-testi |
Yli 20 |
2-otos t-testi |
Jokaisen ryhmän tulisi olla suurempi kuin 15 |
Yksisuuntainen ANOVA |
|
Syy 2: Parametriset testit voivat toimia hyvin, kun kunkin ryhmän leviäminen on erilainen
Vaikka ei-parametrisissa testeissä ei oleteta, että tietosi seuraavat normaalijakaumaa, niillä on kuitenkin muita oletuksia, joita voi olla vaikea täyttää. Ei-parametrisissa testeissä, joissa verrataan ryhmiä, on yleinen oletus, että kaikkien ryhmien tiedoilla on oltava sama leviäminen (hajonta). Jos ryhmilläsi on erilainen leviäminen, ei-parametriset testit eivät välttämättä tarjoa kelvollisia tuloksia.
Toisaalta, jos käytät 2-otoksen t-testiä tai yksisuuntaista ANOVAa, voit yksinkertaisesti siirtyä Vaihtoehtojen alidialogi ja poista valinta Oletetaan, että varianssit ovat samat. Voilà, sinulla on hyvä mennä, vaikka ryhmillä on erilaiset leviämiset!
Syy 3: Tilastollinen voima
Parametrisilla testeillä on yleensä enemmän tilastollisia voimia kuin ei-parametreilla testeillä. Täten havaitset todennäköisemmin merkittävän vaikutuksen, kun sellainen todella on.
Syitä käyttää ei-parametreja testejä
Syy 1: Tutkimusaluettasi edustaa paremmin mediaani
Tämä on suosikkini syy käyttää ei-parametrista testiä ja sitä, jota ei mainita tarpeeksi usein! Se, että voit suorittaa parametrisen testin ei-normaalilla tiedolla, ei tarkoita, että keskiarvo on tilasto, jonka haluat testata.
Esimerkiksi vinon jakauman keskipiste, kuten tulot, voi olla paremmin mitattuna mediaanilla, jossa 50% on mediaanin yläpuolella ja 50% alle. Jos lisäät muutama miljardööri otokseen, matemaattinen keskiarvo kasvaa huomattavasti, vaikka tyypillisen ihmisen tulot eivät muutu.
Kun jakaumasi on vinossa, muutokset vaikuttavat voimakkaasti keskiarvoon. jakauman hännässä, kun taas mediaani heijastaa edelleen tarkemmin jakauman keskipistettä. Näille kahdelle jakelulle satunnainen näyte 100 jokaisesta jakaumasta tuottaa merkitsevästi erilaisia keskiarvoja, mutta mediaanit, jotka eivät ole merkittävästi erilaisia.
Kaksi muuta blogiviestiä havainnollistavat tätä asiaa hyvin:
- Keskiarvon käyttö tietojen analysoinnissa: se ei ole aina Slam-Dunk
- Ei-parametrinen talous: Mitä keskiarvo todella tarkoittaa?
Syy 2: Sinulla on hyvin pieni otoskoko
Jos et noudata parametritestien otoskoko-ohjeita ja et ole varma, että sinulla on normaalisti hajautettuja tietoja, sinun tulee käyttää ei-parametrista testiä. Kun sinulla on todella pieni otos, et ehkä edes pysty selvittämään tietojesi jakaumaa, koska jakelutesteillä ei ole riittävästi voimaa mielekkäiden tulosten tuottamiseen.
Tässä tilanteessa olet kova paikka ilman kelvollista vaihtoehtoa. Ei-parametrisilla testeillä on aluksi vähemmän voimaa, ja se on kaksinkertainen pahuus, kun lisäät pienen otoskokon tämän päälle!
Syy 3: Sinulla on järjestys-, järjestetty- tai poikkeavia tietoja, joita et voi poista
Tyypillisillä parametrisilla testeillä voidaan arvioida vain jatkuvaa dataa, ja poikkeamat voivat vaikuttaa merkittävästi tuloksiin. Toisaalta jotkut ei-parametriset testit voivat käsitellä järjestysdataa, paremmuusjärjestykseen luokiteltuja tietoja, eikä poikkeamat vaikuta niihin vakavasti. Muista tarkistaa epäparametrisen testin oletukset, koska jokaisella on omat tietovaatimuksensa.
Jos sinulla on Likert-tietoja ja haluat verrata kahta ryhmää, lue viestini Paras tapa analysoida Likert-kohteen tietoja: Kaksi Näyte T-testistä Mann-Whitneyn kanssa.
Loppuajatukset
Yleisesti ajatellaan, että tarve valita parametri- tai ei-parametrinen testi esiintyy, kun tietosi eivät täytä oletusta parametrinen testi. Näin voi olla, kun sinulla on sekä pieni otoskoko että ei-normaalit tiedot. Muilla näkökohdilla on kuitenkin usein merkitystä, koska parametritestit voivat usein käsitellä ei-normaalia dataa. Päinvastoin, ei-parametrisissa testeissä on tiukat oletukset, joita et voi jättää huomioimatta.
Päätös riippuu usein siitä, edustaako keskiarvo vai mediaani tarkemmin datasi jakauman keskipistettä.
- Jos keskiarvo edustaa tarkasti jakelusi keskipistettä ja otoskokosi on riittävän suuri, harkitse parametritestiä, koska ne ovat tehokkaampia.
- Jos mediaani edustaa paremmin jakautumasi keskipistettä, ota huomioon ei-parametri testaa myös silloin, kun sinulla on suuri näyte.
Jos näytteen koko on hyvin pieni, saatat olla jumissa ei-parametrisen testin avulla. Kerää lisää tietoja ensi kerralla, jos se on mahdollista! Kuten näette, otoskoko-ohjeet eivät todellakaan ole niin suuria. Mahdollisuutesi havaita merkittävä vaikutus, kun sellainen on olemassa, voi olla hyvin pieni, kun otoskoko on sekä pieni että sinun on käytettävä vähemmän tehokasta ei-parametrista testiä!