Se puede decir con seguridad que la mayoría de las personas que usan estadísticas están más familiarizadas con los análisis paramétricos que con los no paramétricos. Las pruebas no paramétricas también se denominan pruebas sin distribución porque no asumen que sus datos siguen una distribución específica.
Es posible que haya escuchado que debe usar pruebas no paramétricas cuando sus datos no cumplen con los supuestos de la prueba paramétrica, especialmente la suposición sobre datos distribuidos normalmente. Suena como una forma sencilla y agradable de elegir, pero hay consideraciones adicionales.
En esta publicación, te ayudaré a determinar cuándo debes usar:
- Análisis paramétrico para probar las medias de grupo.
- Análisis no paramétrico para probar las medianas de grupo.
En particular, me centraré en una razón importante para utilizar pruebas no paramétricas que no ¡Creo que se menciona con suficiente frecuencia!
Pruebas de hipótesis de la media y la mediana
Las pruebas no paramétricas son como un universo paralelo a las pruebas paramétricas. La tabla muestra pares relacionados de pruebas de hipótesis que Minitab Ofertas de software estadístico.
Pruebas paramétricas (medias) |
Pruebas no paramétricas (medianas) |
Prueba t de 1 muestra |
Signo de 1 muestra, Wilcoxon de 1 muestra |
Prueba t de 2 muestras |
Prueba de Mann-Whitney |
ANOVA unidireccional |
Kruskal-Wallis, prueba de la mediana de Mood |
DOE factorial con un factor y una variable de bloqueo |
Prueba de Friedman |
Razones para utilizar pruebas paramétricas
Razón 1: Las pruebas paramétricas pueden funcionar bien con distribuciones asimétricas y no normales
Esto puede ser una sorpresa, pero las pruebas paramétricas pueden funcionar bien con datos continuos que no son normales si cumple con las pautas de tamaño de muestra en la mesa de abajo. Estas pautas se basan en estudios de simulación realizados por estadísticos aquí en Minitab. Para obtener más información sobre estos estudios, lea nuestros artículos técnicos.
Paramétrico análisis |
Pautas de tamaño de muestra para datos no normales |
Prueba t de 1 muestra |
Mayor que 20 |
Prueba t de 2 muestras |
Cada grupo debe ser mayor de 15 |
ANOVA unidireccional |
|
Razón 2: las pruebas paramétricas pueden funcionar bien cuando la dispersión de cada grupo es diferente
Si bien las pruebas no paramétricas no asumen que sus datos siguen una distribución normal, tienen otras suposiciones que pueden ser difíciles de cumplir. Para las pruebas no paramétricas que comparan grupos, una suposición común es que los datos de todos los grupos deben tener la misma extensión (dispersión). Si sus grupos tienen una distribución diferente, es posible que las pruebas no paramétricas no proporcionen resultados válidos.
Por otro lado, si usa la prueba t de 2 muestras o el ANOVA de una vía, simplemente puede ir a la Opciones de subdiálogo y desmarque Asumir varianzas iguales. ¡Voilà, estás listo incluso cuando los grupos tienen diferentes diferenciales!
Razón 3: Poder estadístico
Las pruebas paramétricas generalmente tienen más poder estadístico que las pruebas no paramétricas. Por lo tanto, es más probable que detecte un efecto significativo cuando realmente existe.
Razones para usar pruebas no paramétricas
Razón 1: Su área de estudio está mejor representada por la mediana
¡Esta es mi razón favorita para usar una prueba no paramétrica y la que no se menciona con suficiente frecuencia! El hecho de que pueda realizar una prueba paramétrica con datos no normales no implica que la media sea la estadística que desee probar.
Por ejemplo, el centro de una distribución sesgada, como los ingresos, puede ser mejor medido por la mediana donde el 50% están por encima de la mediana y el 50% están por debajo. Si agrega algunos multimillonarios a una muestra, la media matemática aumenta considerablemente aunque los ingresos de la persona típica no cambien.
Cuando su distribución está lo suficientemente sesgada, la media se ve muy afectada por los cambios que se producen en el futuro. en la cola de la distribución, mientras que la mediana sigue reflejando más de cerca el centro de la distribución. Para estas dos distribuciones, una muestra aleatoria de 100 de cada distribución produce medias que son significativamente diferentes, pero medianas que no son significativamente diferentes.
Otras dos publicaciones de blog ilustran bien este punto:
- Uso de la media en el análisis de datos: no siempre es un fracaso
- La economía no paramétrica: ¿Qué significa realmente el promedio?
Razón 2: Tiene un tamaño de muestra muy pequeño
Si no cumple con las pautas de tamaño de muestra para las pruebas paramétricas y no está seguro de haber datos distribuidos normalmente, debe utilizar una prueba no paramétrica. Cuando tiene una muestra realmente pequeña, es posible que ni siquiera pueda determinar la distribución de sus datos porque las pruebas de distribución carecerán de la potencia suficiente para proporcionar resultados significativos.
En este escenario, se encuentra en un lugar difícil sin alternativa válida. Las pruebas no paramétricas tienen menos poder para empezar y es un doble golpe cuando agrega un tamaño de muestra pequeño además de eso.
Razón 3: tiene datos ordinales, datos clasificados o valores atípicos que no puede eliminar
Las pruebas paramétricas típicas solo pueden evaluar datos continuos y los resultados pueden verse afectados significativamente por valores atípicos. Por el contrario, algunas pruebas no paramétricas pueden manejar datos ordinales, datos clasificados y no verse seriamente afectados por valores atípicos. Asegúrese de verificar las suposiciones para la prueba no paramétrica porque cada una tiene sus propios requisitos de datos.
Si tiene datos Likert y desea comparar dos grupos, lea mi publicación La mejor manera de analizar datos de elementos Likert: dos Prueba T de muestra versus Mann-Whitney.
Reflexiones finales
Se piensa comúnmente que la necesidad de elegir entre una prueba paramétrica y no paramétrica ocurre cuando sus datos no cumplen con una suposición de prueba paramétrica. Este puede ser el caso cuando tiene un tamaño de muestra pequeño y datos no normales. Sin embargo, otras consideraciones suelen influir porque las pruebas paramétricas a menudo pueden manejar datos no normales. Por el contrario, las pruebas no paramétricas tienen suposiciones estrictas que no puede ignorar.
La decisión a menudo depende de si la media o la mediana representan con mayor precisión el centro de distribución de sus datos.
- Si la media representa con precisión el centro de su distribución y el tamaño de la muestra es lo suficientemente grande, considere una prueba paramétrica porque es más poderosa.
- Si la mediana representa mejor el centro de su distribución, considere la opción no paramétrica pruebe incluso cuando tenga una muestra grande.
Por último, si tiene un tamaño de muestra muy pequeño, es posible que no utilice una prueba paramétrica. Por favor, recopile más datos la próxima vez si es posible. Como puede ver, las pautas de tamaño de muestra no son realmente tan grandes. ¡Su probabilidad de detectar un efecto significativo cuando existe uno puede ser muy pequeña cuando tiene un tamaño de muestra pequeño y necesita usar una prueba no paramétrica menos eficiente!