È sicuro affermare che la maggior parte delle persone che utilizzano le statistiche ha più familiarità con le analisi parametriche rispetto alle analisi non parametriche. I test non parametrici sono anche chiamati test senza distribuzione perché non presumono che i tuoi dati seguano una distribuzione specifica.
Potresti aver sentito che dovresti usare test non parametrici quando i tuoi dati non soddisfano i presupposti di il test parametrico, in particolare l’assunzione di dati normalmente distribuiti. Sembra un modo carino e diretto per scegliere, ma ci sono considerazioni aggiuntive.
In questo post, ti aiuterò a determinare quando dovresti usare un:
- Analisi parametrica per testare le medie del gruppo.
- Analisi non parametrica per testare le mediane del gruppo.
In particolare, mi concentrerò su un motivo importante per utilizzare i test non parametrici che indosso non credo venga menzionato abbastanza spesso!
Test di ipotesi della media e della mediana
I test non parametrici sono come un universo parallelo ai test parametrici. La tabella mostra le coppie correlate di test di ipotesi che Minitab Offerte di software statistico.
Test parametrici (medie) |
Test non parametrici (mediane) |
Test t di 1 campione |
Segno 1 campione, Wilcoxon 1 campione |
Test t 2 campioni |
Test di Mann-Whitney |
ANOVA unidirezionale |
Kruskal-Wallis, test mediano dell’umore |
DOE fattoriale con un fattore e una variabile di blocco |
Test di Friedman |
Motivi per utilizzare i test parametrici
Motivo 1: i test parametrici possono funzionare bene con distribuzioni distorte e non normali
Questa può essere una sorpresa, ma i test parametrici possono funzionare bene con dati continui che non sono normali se soddisfi le linee guida sulla dimensione del campione in la tabella sottostante. Queste linee guida si basano su studi di simulazione condotti da statistici qui a Minitab. Per ulteriori informazioni su questi studi, leggi i nostri documenti tecnici.
Parametrico analisi |
Linee guida sulle dimensioni del campione per dati non normali |
Test t di 1 campione |
Maggiore di 20 |
test t di 2 campioni |
Ogni gruppo deve essere maggiore di 15 |
ANOVA unidirezionale |
|
Motivo 2: i test parametrici possono funzionare bene quando la distribuzione di ciascun gruppo è diverso
Sebbene i test non parametrici non presumano che i dati seguano una distribuzione normale, hanno altri presupposti che possono essere difficili da soddisfare. Per i test non parametrici che confrontano i gruppi, un assunto comune è che i dati per tutti i gruppi devono avere la stessa diffusione (dispersione). Se i tuoi gruppi hanno una distribuzione diversa, i test non parametrici potrebbero non fornire risultati validi.
D’altra parte, se utilizzi il test t a 2 campioni o ANOVA a una via, puoi semplicemente andare al Finestra di dialogo secondaria Opzioni e deselezionare Assumi varianze uguali. Voilà, sei a posto anche quando i gruppi hanno spread diversi!
Motivo 3: potere statistico
I test parametrici di solito hanno più potere statistico dei test non parametrici. Pertanto, è più probabile che tu rilevi un effetto significativo quando ne esiste veramente uno.
Motivi per utilizzare test non parametrici
Motivo 1: la tua area di studio è meglio rappresentata dalla mediana
Questo è il motivo che preferisco per utilizzare un test non parametrico e quello che non viene menzionato abbastanza spesso! Il fatto che sia possibile eseguire un test parametrico con dati non normali non implica che la media sia la statistica che si desidera testare.
Ad esempio, il centro di una distribuzione asimmetrica, come il reddito, può essere meglio misurata dalla mediana dove il 50% è al di sopra della mediana e il 50% al di sotto. Se aggiungi alcuni miliardari a un campione, la media matematica aumenta notevolmente anche se il reddito per la persona tipica non cambia.
Quando la tua distribuzione è abbastanza distorta, la media è fortemente influenzata dai cambiamenti di gran lunga fuori nella coda della distribuzione mentre la mediana continua a riflettere più da vicino il centro della distribuzione. Per queste due distribuzioni, un campione casuale di 100 da ciascuna distribuzione produce mezzi significativamente diversi, ma mediane non significativamente differenti.
Altri due post del blog illustrano bene questo punto:
- Usare la media nell’analisi dei dati: non è sempre una schiacciata
- L’economia non parametrica: cosa significa realmente la media?
Motivo 2: hai una dimensione del campione molto piccola
Se non soddisfi le linee guida sulla dimensione del campione per i test parametrici e non sei sicuro di aver dati distribuiti normalmente, è necessario utilizzare un test non parametrico. Quando hai un campione molto piccolo, potresti non essere nemmeno in grado di accertare la distribuzione dei tuoi dati perché i test di distribuzione non avranno potenza sufficiente per fornire risultati significativi.
In questo scenario, ti trovi in una punto difficile senza alternative valide. I test non parametrici hanno meno potenza per cominciare ed è un doppio disastro quando aggiungi una piccola dimensione del campione in più!
Motivo 3: hai dati ordinali, dati classificati o valori anomali che non puoi remove
I test parametrici tipici possono solo valutare dati continui ei risultati possono essere significativamente influenzati da valori anomali. Al contrario, alcuni test non parametrici possono gestire dati ordinali, dati classificati e non essere seriamente influenzati da valori anomali. Assicurati di controllare i presupposti per il test non parametrico perché ognuno ha i propri requisiti di dati.
Se disponi di dati Likert e desideri confrontare due gruppi, leggi il mio articolo Il modo migliore per analizzare i dati degli articoli Likert: due Esempio di test T rispetto a Mann-Whitney.
Pensieri conclusivi
Si pensa comunemente che la necessità di scegliere tra un test parametrico e non parametrico si verifica quando i dati non soddisfano un’ipotesi del test parametrico. Questo può essere il caso in cui si dispone sia di una piccola dimensione del campione che di dati non normali. Tuttavia, altre considerazioni giocano spesso un ruolo perché i test parametrici possono spesso gestire dati non normali. Al contrario, i test non parametrici hanno presupposti rigidi che non puoi ignorare.
La decisione spesso dipende dal fatto che la media o la mediana rappresenti più accuratamente il centro della distribuzione dei dati.
- Se la media rappresenta accuratamente il centro della tua distribuzione e la dimensione del tuo campione è abbastanza grande, considera un test parametrico perché sono più potenti.
- Se la mediana rappresenta meglio il centro della tua distribuzione, considera il non parametrico prova anche quando hai un campione di grandi dimensioni.
Infine, se hai una dimensione del campione molto piccola, potresti essere bloccato usando un test non parametrico. Per favore, raccogli più dati la prossima volta se è possibile! Come puoi vedere, le linee guida sulla dimensione del campione non sono così grandi. La tua possibilità di rilevare un effetto significativo quando ne esiste uno può essere molto piccola quando hai sia una piccola dimensione del campione che devi utilizzare un test non parametrico meno efficiente!