É seguro dizer que a maioria das pessoas que usam estatísticas estão mais familiarizadas com análises paramétricas do que com análises não paramétricas. Os testes não paramétricos também são chamados de testes sem distribuição porque não presumem que seus dados sigam uma distribuição específica.
Você deve ter ouvido que deve usar testes não paramétricos quando seus dados não atendem às suposições de o teste paramétrico, especialmente a suposição sobre dados normalmente distribuídos. Parece uma maneira simples e agradável de escolher, mas há considerações adicionais.
Nesta postagem, vou ajudá-lo a determinar quando você deve usar um:
- Análise paramétrica para testar as médias do grupo.
- Análise não paramétrica para testar as medianas do grupo.
Em particular, vou me concentrar em um motivo importante para usar testes não paramétricos que não acho que não é mencionado com frequência!
Testes de hipótese de média e mediana
Os testes não paramétricos são como um universo paralelo aos testes paramétricos. A tabela mostra pares relacionados de testes de hipótese que o Minitab Ofertas de software estatístico.
Testes paramétricos (médias) |
Testes não paramétricos (medianas) |
Teste t de 1 amostra |
Sinal de 1 amostra, Wilcoxon de 1 amostra |
Teste t de 2 amostras |
Teste de Mann-Whitney |
ANOVA unilateral |
Kruskal-Wallis, teste da mediana de Mood |
DOE fatorial com um fator e uma variável de bloqueio |
Teste de Friedman |
Razões para usar testes paramétricos
Razão 1: os testes paramétricos podem funcionar bem com distribuições distorcidas e não normais
Isso pode ser uma surpresa, mas os testes paramétricos podem funcionar bem com dados contínuos que são não normais se você atender às diretrizes de tamanho da amostra em A mesa abaixo. Essas diretrizes são baseadas em estudos de simulação conduzidos por estatísticos aqui no Minitab. Para saber mais sobre esses estudos, leia nossos Artigos técnicos.
Paramétrico análises |
Diretrizes de tamanho de amostra para dados não normais |
Teste t de 1 amostra |
Maior que 20 |
Teste t de 2 amostras |
Cada grupo deve ser maior que 15 |
ANOVA unilateral |
|
Razão 2: os testes paramétricos podem funcionar bem quando a distribuição de cada grupo é diferente
Embora os testes não paramétricos não presumam que seus dados seguem uma distribuição normal, eles têm outras premissas que podem ser difíceis de cumprir. Para testes não paramétricos que comparam grupos, uma suposição comum é que os dados para todos os grupos devem ter o mesmo spread (dispersão). Se seus grupos tiverem uma distribuição diferente, os testes não paramétricos podem não fornecer resultados válidos.
Por outro lado, se você usar o teste t de 2 amostras ou ANOVA de uma via, pode simplesmente ir para o Opções subdialog e desmarque Assumir variâncias iguais. Voilà, você está pronto para ir, mesmo quando os grupos têm spreads diferentes!
Razão 3: poder estatístico
Testes paramétricos geralmente têm mais poder estatístico do que testes não paramétricos. Assim, é mais provável que você detecte um efeito significativo quando um realmente existe.
Razões para usar testes não paramétricos
Razão 1: sua área de estudo é melhor representada pela mediana
Este é meu motivo favorito para usar um teste não paramétrico e aquele que não é mencionado com freqüência suficiente! O fato de você poder realizar um teste paramétrico com dados não normais não implica que a média seja a estatística que deseja testar.
Por exemplo, o centro de uma distribuição distorcida, como a renda, pode ser melhor medido pela mediana onde 50% estão acima da mediana e 50% estão abaixo. Se você adicionar alguns bilionários a uma amostra, a média matemática aumenta muito, mesmo que a renda de uma pessoa comum não mude.
Quando sua distribuição é distorcida o suficiente, a média é fortemente afetada por mudanças muito na cauda da distribuição, enquanto a mediana continua a refletir mais de perto o centro da distribuição. Para essas duas distribuições, uma amostra aleatória de 100 de cada distribuição produz médias que são significativamente diferentes, mas medianas que não são significativamente diferentes.
Duas outras postagens de blog ilustram bem esse ponto:
- Usando a média na análise de dados: nem sempre é difícil
- A economia não paramétrica: o que a média realmente significa?
Razão 2: você tem um tamanho de amostra muito pequeno
Se você não atender às diretrizes de tamanho de amostra para os testes paramétricos e não tiver certeza de que dados normalmente distribuídos, você deve usar um teste não paramétrico. Quando você tem uma amostra muito pequena, pode nem mesmo ser capaz de determinar a distribuição de seus dados porque os testes de distribuição não terão poder suficiente para fornecer resultados significativos.
Neste cenário, você está em um ponto difícil sem alternativa válida. Testes não paramétricos têm menos poder para começar e é um golpe duplo quando você adiciona um pequeno tamanho de amostra em cima disso!
Razão 3: você tem dados ordinais, dados classificados ou outliers que não pode remover
Testes paramétricos típicos podem avaliar apenas dados contínuos e os resultados podem ser significativamente afetados por outliers. Por outro lado, alguns testes não paramétricos podem lidar com dados ordinais, dados classificados e não ser seriamente afetados por outliers. Certifique-se de verificar as suposições para o teste não paramétrico porque cada um tem seus próprios requisitos de dados.
Se você tem dados Likert e deseja comparar dois grupos, leia meu post: Melhor maneira de analisar dados de itens Likert: dois Teste T de amostra versus Mann-Whitney.
Reflexões finais
É comumente considerado que a necessidade de escolher entre um teste paramétrico e não paramétrico ocorre quando seus dados falham em atender a uma suposição de teste paramétrico. Esse pode ser o caso quando você tem um tamanho de amostra pequeno e dados não normais. No entanto, outras considerações geralmente desempenham um papel, porque os testes paramétricos geralmente podem lidar com dados não normais. Por outro lado, os testes não paramétricos têm suposições estritas que você não pode ignorar.
A decisão geralmente depende se a média ou mediana representa com mais precisão o centro de distribuição de seus dados.
- Se a média representa com precisão o centro da sua distribuição e o tamanho da sua amostra é grande o suficiente, considere um teste paramétrico porque eles são mais poderosos.
- Se a mediana representa melhor o centro da sua distribuição, considere o não paramétrico teste mesmo quando você tem uma grande amostra.
Finalmente, se você tem um tamanho de amostra muito pequeno, você pode ficar preso em um teste não paramétrico. Por favor, colete mais dados da próxima vez se for possível! Como você pode ver, as diretrizes do tamanho da amostra não são tão grandes. Sua chance de detectar um efeito significativo quando existe pode ser muito pequena quando você tem um tamanho de amostra pequeno e precisa usar um teste não paramétrico menos eficiente!