Clase digital 8. Comparación entre grupos (no paramétricas)

red and blue light streaks

Comparación entre grupos (no paramétricas)

Introducción

¡Hola!

¡Qué emoción volvernos a encontrar! Espero que sigas con ese mismo ímpetu de la primera clase y sigas aprendiendo, por lo tanto te invito a comenzar esta octava clase.

Es hora de revisar alternativas estadísticas a datos sesgados. Ahora veremos las pruebas no paramétricas, como alternativas de pruebas estadísticas cuando contamos con datos con una distribución no anormal. Muchas veces se comete el error estadístico de aplicar pruebas paramétricas cuando se cuenta con datos sin distribución normal; sin embargo eso nos lleva a cometer errores de tipo I, por lo que la mejor opción para tomar conclusiones estadísticas certeras y confiables es usar las pruebas no paramétricas.

En esta ocasión revisaremos las alternativas para la t de student independiente y dependiente y para la ANOVA, revisadas con anterioridad.

¡Ánimo, te estás convirtiendo en un experto de la estadística!

Desarrollo del tema

Cuando tenemos dos grupos independientes, pero tenemos una distribución no normal de los datos, no es correcto usar t de student independiente, porque la prueba te utiliza las medias como medio de comparación, cuando tenemos una distribución no normal la media no funciona como medida representativa del comportamiento real de los datos, ya que estará sesgada por los datos extremos de la distribución no normal.

La alternativa paramétrica es la U de Mann Withney, puedes checar el siguiente video:

Ejercicio: Se tomó una muestra de 19 pacientes con trastorno por abuso de sustancias, a los cuales se les pregunto el numero de eventos de abuso sexual que habían sufrido, se desea saber si existe alguna diferencia estadística entre la presencia de eventos de abuso sexual entre los pacientes y un grupo de 17 sujetos controles (sin el trastorno).

H0= los eventos de abuso sexual son iguales entre el grupo de pacientes y el grupo control.
H1= los eventos de abuso sexual son mayores en el grupo de pacientes.

1.- Ordenamos de menor a mayor valor (0 a 13).
2.- Cuando exista un empate, sumamos los rangos asignados en el caso del valor cero, se suma el rango 1+2+3… hasta el 13 y se divide entre 13 datos pareados, lo que da 7, a cada dato con el valor cero se le asignará el valor 7, de esa manera con los demás rangos empatados.

3.- Una vez asignados los rangos, se agrupan, en este caso el grupo A es el grupo de pacientes con trastorno por consumo de sustancias y B el grupo control.

4.- Para tomar la decisión de aceptar o rechazar la hipótesis, lo único que se hace es identificar el valor de la suma de rangos menor en la tabla de U, con n=19 y n=17, para este caso el valor crítico es de 109, por lo que rechaza la Ho (NOTA: este es el único caso en el que cuando el valor calculado es menor que el tabulado entonces se rechaza la H0)

En este caso se rechaza la H0: los eventos de abuso sexual son iguales entre el grupo de pacientes y el grupo control y se acepta H1.

4.- Si se desea se puede calcular la significancia estadística con la siguiente fórmula.

La alternativa para cuando se tienen dos grupos relacionados o pareados, pero los datos no tienen una distribución normal, se sugiere usar la prueba de wilcoxon o prueba de los signos:

Ejercicio: En un grupo de 18 estudiantes de universidad, se quiere saber si su promedio ha mejorado con respecto a su promedio de prepa, se cuentan con los siguientes datos:

H0: El promedio de prepa es igual al promedio de universidad.
H1: El promedio de prepa es distinto al promedio de universidad.

3.- Se sustituye la siguiente fórmula, donde t calculada es igual a -2.83

4.- Se verifica en tablas t a 0.05 de valor de p, el valor de t de tablas es de 1.73, por lo que se rechaza la H0 y se acepta la H1

Cuando se tienen más de tres grupos y se quiere comparar, pero no se tiene una distribución normal, no se puede usar ANOVA porque compararía medias, pero la media en este caso no es el valor representativo, ya que se ve sesgado por los extremos. Por lo que se recomienda usar la prueba de Kruskal Wallis.

Ejercicio: Se requiere comparar los días de hospitalización por atentado de suicidio entre los hospitales de Irapuato, León y Guanajuato, se cuenta con los siguientes datos:

H0: Los días de hospitalización por tentativa de suicidio es igual entre los hospitales de Irapuato, León y Guanajuato.
H1: Los días de hospitalización por tentativa de suicidio es diferente entre los hospitales de Irapuato, León y Guanajuato.

1.- Se le asigna el rango a la muestra total
2.- Se agrupa según el hospital (grupo)

3.- Se aplica la fórmula siguiente:

H= 2.94
Con gl=K-1 (3-1=2)
2 grados de libertad, p<0.05

El valor crítico de tablas es de 5.9915

Conclusión: El valor de H de 2.94 es menor al valor crítico de 5.9915, por lo que se acepta la H0.

Conclusión

En conclusión, se han revisado las pruebas estadísticas no paramétricas, recuerda que un buen estadista no es aquel que se aprende las fórmulas de memoria, sino aquel que sabe como usarlas; pues bueno si has llegado hasta aquí, estamos a un paso de ser expertos en estadística, felicidades.

Hemos llegado al final de la sesión y no me resta más que felicitarte por llegar hasta esta parte del curso. Te invito a que continúes con tu proceso formativo realizando la tarea asignada y mandarla como corresponde. Te encuentro próximamente.

Fuentes de información