A nem paraméteres teszt és a paraméteres teszt közötti választás

Nyugodtan mondhatjuk, hogy a statisztikákat használó emberek többsége jobban ismeri a paraméteres elemzéseket, mint a nem paraméteres elemzéseket. A nem paraméteres teszteket disztribúció nélküli teszteknek is nevezzük, mivel nem feltételezik, hogy az adatai egy meghatározott eloszlást követnek.

Lehet, hogy hallottad már, hogy nem paraméteres teszteket kell használnod, ha az adatok nem felelnek meg a a paraméteres teszt, különösen a normálisan elosztott adatokra vonatkozó feltételezés. Ez úgy hangzik, mint egy jó és egyszerű módja a választásnak, de vannak további szempontok is.

Ebben a bejegyzésben segítek meghatározni, hogy mikor kell használnia:

  • Parametrikus elemzés a csoport teszteléséhez.
  • Nonparametrikus elemzés a csoport mediánjainak teszteléséhez.

Különösen arra fogok összpontosítani, hogy miért használok olyan nem paraméteres teszteket, amelyeket nem Szerintem nem említik elég gyakran!

Az átlag és a medián hipotézistesztjei

A nem paraméteres tesztek olyanok, mint egy párhuzamos univerzum a paraméteres tesztekhez. A táblázat azokat a hipotézis tesztpárokat mutatja, amelyeket a Minitab A Statisztikai szoftver ajánlatok.

Paraméteres tesztek (átlag)

Nem paraméteres tesztek (mediánok)

1 mintás t teszt

1-mintás jel, 1-mintás Wilcoxon

2-mintás t teszt

Mann-Whitney teszt

Egyirányú ANOVA

Kruskal-Wallis, Mood medián teszt

Faktoriális DOE egy tényezővel és egy blokkoló változóval

Friedman-teszt

A paraméteres tesztek használatának okai

1. ok: A paraméteres tesztek jól elférhetnek ferde és nem normális eloszlások esetén.

Ez meglepetés lehet, de a paraméteres tesztek jól teljesítenek olyan folyamatos adatokkal, amelyek nem normálisak, ha megfelel a mintaméret-irányelveknek. az alábbi táblázat. Ezek az irányelvek a Minitabnál statisztikusok által végzett szimulációs vizsgálatokon alapulnak. Ha többet szeretne megtudni ezekről a tanulmányokról, olvassa el a műszaki dokumentumainkat.

Paraméter elemzi

Mintaméret irányelvek a nem normális adatokhoz

1-mintás t teszt

20-nál nagyobb

2-mintás t teszt

Minden csoportnak nagyobbnak kell lennie, mint 15

Egyirányú ANOVA

  • Ha 2-9 csoportja van, akkor mindegyik csoportnak nagyobbnak kell lennie, mint 15.
  • Ha 10-12 csoportja van, akkor minden csoportnak nagyobbnak kell lennie, mint 20.

2. ok: A paraméteres tesztek akkor tudnak jól teljesíteni, ha az egyes csoportok elterjedése eltérő

Noha a nem paraméteres tesztek nem feltételezik, hogy az adatok normális eloszlást követnek, vannak más feltételezéseik is, amelyeket nehéz teljesíteni. A csoportokat összehasonlító, nem paraméteres teszteknél általános feltételezés az, hogy az összes csoport adatainak azonos szórással (diszperzióval) kell rendelkezniük. Ha a csoportjainak eltérõ elterjedése van, akkor a nem paraméteres tesztek nem biztos, hogy megfelelõ eredményeket szolgáltatnak.

Ha viszont a 2 mintás t tesztet vagy az egyirányú ANOVA-t használja, akkor egyszerűen lépjen a Opciók aldialog, és törölje az Egyenlő varianciák feltételezése jelölőnégyzetet. Voilà, akkor is jó, ha akkor megy, ha a csoportoknak különbözõ a spreadje!

3. ok: Statisztikai teljesítmény

A paraméteres teszteknek általában nagyobb statisztikai erejük van, mint a nem paraméteres teszteknek. Így nagyobb valószínűséggel észlel egy jelentős hatást, ha az valóban létezik.

A nem paraméteres tesztek alkalmazásának okai

1. ok: A vizsgálati területet jobban reprezentálja a medián

Ez a kedvenc okom a nem paraméteres teszt használatára, és arra, amelyet nem említenek elég gyakran! Az a tény, hogy egy paraméteres tesztet nem normál adatokkal hajthat végre, nem jelenti azt, hogy az átlag az a statisztika, amelyet tesztelni szeretne.

Például a ferde eloszlás középpontja, például a jövedelem, jobban mérhető a mediánnal, ahol 50% a medián felett, 50% pedig alatta van. Ha hozzáad néhány milliárdost egy mintához, a matematikai átlag nagymértékben megnő, annak ellenére, hogy a tipikus ember jövedelme nem változik.

Ha az eloszlás eléggé ferde, az átlagot erősen befolyásolják a változások míg a medián továbbra is jobban tükrözi az eloszlás középpontját. Ehhez a két disztribúcióhoz az egyes disztribúciókból vett 100 véletlenszerű minta jelentősen eltérő átlagokat eredményez, de nem szignifikánsan eltérő mediánokat.

Két másik blogbejegyzés jól szemlélteti ezt a pontot:

  • Az átlag használata az adatelemzésben: ez nem mindig Slam-Dunk
  • A nem parametrikus gazdaság: Mit jelent valójában az átlag?

2. ok: Nagyon kis mintamérete van

Ha nem felel meg a paraméteres tesztek mintaméret-irányelveinek, és nem biztos abban, hogy rendelkezik normálisan elosztott adatok esetén használjon nem paraméteres tesztet. Ha valóban kicsi a mintád, akkor lehet, hogy nem is tudod megállapítani az adatok eloszlását, mert az elosztási teszteknek nincs elegendő erejük az értelmes eredmények biztosításához.

Ebben a forgatókönyvben egy kemény hely, érvényes alternatíva nélkül. A nem paraméteres teszteknek kezdetben kevesebb az energiájuk, és ez kettős ütés, ha ehhez kis mintaméretet adunk!

3. ok: Rendszámadatok, rangsorolt adatok vagy kiugró értékek vannak, amelyeket nem lehet eltávolítás

A tipikus paraméteres tesztek csak a folyamatos adatokat képesek felmérni, és az eredményeket a kiugró értékek jelentősen befolyásolhatják. Ezzel ellentétben néhány nem paraméteres teszt képes kezelni a sorszámadatokat, a rangsorolt adatokat, és a kiugró értékek nem érinthetik őket komolyan. Ügyeljen arra, hogy ellenőrizze a nem paraméteres teszt feltételezéseit, mert mindegyiknek megvan a saját adatigénye.

Ha Likert-adatokkal rendelkezik, és két csoportot szeretne összehasonlítani, olvassa el a Likert-elem adatainak elemzésének legjobb módja című bejegyzésemet. Minta T-teszt Mann-Whitney-vel szemben.

Záró gondolatok

Általánosságban azt gondolják, hogy a paraméteres és a nem paraméteres teszt közötti választás akkor jelentkezik, amikor az adatok nem felelnek meg paraméteres teszt. Ez akkor fordulhat elő, ha mind kis mintaméret, mind nem normális adatok vannak. Más szempontok azonban gyakran szerepet játszanak, mivel a paraméteres tesztek gyakran nem normális adatokat képesek kezelni. Ezzel szemben a nem paraméteres tesztek szigorú feltételezéseket tartalmaznak, amelyeket nem hagyhat figyelmen kívül.

A döntés gyakran attól függ, hogy az átlag vagy a medián pontosabban ábrázolja-e az adatok terjesztésének központját.

  • Ha az átlag pontosan reprezentálja az eloszlás középpontját, és a minta mérete elég nagy, fontoljon meg egy paraméteres tesztet, mert ezek erősebbek.
  • Ha a medián jobban képviseli az eloszlás középpontját, vegye figyelembe a nem paraméteres értéket teszteljen akkor is, ha nagy mintája van.

Végül, ha nagyon kicsi a mintamérete, akkor előfordulhat, hogy nem paraméteres tesztet használ. Kérjük, gyűjtsön további adatokat legközelebb, ha ez egyáltalán lehetséges! Mint látható, a minta méretére vonatkozó irányelvek nem igazán olyan nagyok. A jelentős hatás észlelésének esélye, ha létezik, nagyon kicsi lehet, ha mindkettő kis mintamérettel rendelkezik, és kevésbé hatékony, nem paraméteres tesztet kell használnia!

Write a Comment

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük