Prueba 157 Wilcoxon Mann Whitney

12
1 La prueba de Wilcoxon-Mann-Whitney Introducción Es una prueba no paramétrica aplicada a dos muestras independientes. El único requisito para aplicarla es que la variable esté medida al menos en una escala ordinal. Objetivos Al concluir el estudio de la prueba será capaz de: 1. Conceptualizar los términos de: puntuaciones en una tabla, rangos de una tabla, recuento de puntuaciones y método de significación del valor observado mediante la identificación y análisis de sus características para comprender la aplicación de la técnica. 2. Desarrollar la habilidad para plantear las hipótesis, indicando en la nula que X y Y tienen la misma distribución muestral, es decir [ > ] = 1/2. Y para la alternativa las muestras no provienen de la misma sucesión de datos, en este caso sería [ > ] ≠ 1/2. 3. El procedimiento de la prueba establece que se requiere combinar las puntuaciones de ambos grupos y ordenarlos por rangos de manera ascendente. 4. Interpretar los resultados de la prueba con base en la gráfica, los cálculos sin errores y la regla de decisión, entre otros, para probar la aceptación de la hipótesis nula. Características Nivel de medición: Ordinal u ordenada. Se aplica en dos muestras independientes, la cantidad de observaciones es indistinta, y para la medida de asociación se utiliza en Coeficiente de correlación , de Spearman de rangos ordenados. Fundamentos 1. Determinar el tamaño de las muestras (, ). Si son menores o iguales a 10, se consideran muestras pequeñas, pero si son mayores que 10, se consideran muestras grandes. 2. Arreglar los datos en rangos de menor a mayor. En caso de que existan empates de rangos iguales, se deberán detectar para un ajuste posterior. 3. Calcular los valores de , en el caso de muestras pequeñas y determinar el valor de Z para muestras grandes, así comparar con los críticos del estadístico de la tabla de probabilidades asociadas con valores pequeños en la prueba de Wilcoxon-Mann- Whitney. 4. Cabe mencionar, que la distribución muestral se aproximará a la normal en la medida en que el tamaño de muestra sea mayor. 5. Es una opción a la técnica paramétrica de la prueba t − student. Trabaja con datos independientes no normales. 6. Otra forma de comparar las hipótesis es utilizando las medianas de las poblaciones, es este caso la hipótesis nula es que la mediana de las dos poblaciones son iguales y en la hipótesis alterna la mediana de la población 1 sea mayor (menor o distinta) de la mediana de la población 2.

description

Breve descripción de la Prueba Wilcoxon-Mann-Whitney con algunos ejemplos para su aplicación.

Transcript of Prueba 157 Wilcoxon Mann Whitney

Page 1: Prueba 157 Wilcoxon Mann Whitney

1

La prueba de Wilcoxon-Mann-Whitney

Introducción

Es una prueba no paramétrica aplicada a dos muestras independientes. El único requisito para aplicarla es que la variable esté medida al menos en una escala ordinal.

Objetivos

Al concluir el estudio de la prueba será capaz de:

1. Conceptualizar los términos de: puntuaciones en una tabla, rangos de una tabla, recuento de puntuaciones y método de significación del valor observado mediante la identificación y análisis de sus características para comprender la aplicación de la técnica.

2. Desarrollar la habilidad para plantear las hipótesis, indicando en la nula que X y Y tienen la misma distribución muestral, es decir 𝑃[𝑋 > 𝑌] = 1/2. Y para la alternativa las muestras no provienen de la misma sucesión de datos, en este caso sería 𝑃[𝑋 > 𝑌] ≠ 1/2.

3. El procedimiento de la prueba establece que se requiere combinar las puntuaciones de ambos grupos y ordenarlos por rangos de manera ascendente.

4. Interpretar los resultados de la prueba con base en la gráfica, los cálculos sin errores y la regla de decisión, entre otros, para probar la aceptación de la hipótesis nula.

Características

Nivel de medición: Ordinal u ordenada. Se aplica en dos muestras independientes, la cantidad de observaciones es indistinta, y para la medida de asociación se utiliza en Coeficiente de correlación 𝑟𝑠, de Spearman de rangos ordenados.

Fundamentos

1. Determinar el tamaño de las muestras (𝑚, 𝑛). Si son menores o iguales a 10, se consideran muestras pequeñas, pero si son mayores que 10, se consideran muestras grandes.

2. Arreglar los datos en rangos de menor a mayor. En caso de que existan empates de rangos iguales, se deberán detectar para un ajuste posterior.

3. Calcular los valores de 𝑊𝑥 , 𝑊𝑦en el caso de muestras pequeñas y determinar el valor

de Z para muestras grandes, así comparar con los críticos del estadístico de la tabla de probabilidades asociadas con valores pequeños en la prueba de Wilcoxon-Mann-Whitney.

4. Cabe mencionar, que la distribución muestral se aproximará a la normal en la medida en que el tamaño de muestra sea mayor.

5. Es una opción a la técnica paramétrica de la prueba t − student. Trabaja con datos independientes no normales.

6. Otra forma de comparar las hipótesis es utilizando las medianas de las poblaciones, es este caso la hipótesis nula es que la mediana de las dos poblaciones son iguales y en la hipótesis alterna la mediana de la población 1 sea mayor (menor o distinta) de la mediana de la población 2.

Page 2: Prueba 157 Wilcoxon Mann Whitney

2

Supuestos

Se debe conocer el tamaño de la muestra, las puntuaciones observadas de la prueba, tener un nivel de significación, y finalmente determinar la hipótesis unidireccional o bidireccional para poder considerar la decisión de 𝑅𝐻𝑜 o 𝑁𝑅𝐻0.

A. Muestra grande

Ejemplo

Para este ejemplo, se examinaran los datos de Whiting y Child, que se muestran en la siguiente tabla, los cuales se utilizarán para demostrar el uso de la mediana.

Tabla 1

Resultados del experimento

Sociedades con presencia

de explicaciones

orales

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Puntuación en

socialización de la

ansiedad

17 16 15 15 15 14 14 14 13 13 13 12 12 12 12 11 11 10 10 10 8 8 6

Sociedades sin presencia

de explicaciones

orales

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Puntuación en

socialización de la

ansiedad

13 12 12 10 10 10 10 9 8 8 7 7 7 7 7 6

Procedimiento 11 pasos:

Paso 1. Variables

𝑁 = 39, 𝑚 = 16, 𝑛 = 23, 𝛼 = 0.01.

Paso 2. Planteamiento de H0 y H1

𝐻0: la socialización oral es igualmente severa en ambos tipos de sociedades (con presencia o ausencia de explicaciones orales de enfermedades).

𝐻1: las sociedades con explicaciones orales de las enfermedades presentes son superiores en la socialización oral de la ansiedad, que aquellas que no tienen explicaciones orales de las enfermedades.

Page 3: Prueba 157 Wilcoxon Mann Whitney

3

Paso 3. Nivel de significación.

𝜶 = 0.01, 𝑚 es el número de sociedades con explicaciones orales ausentes = 16, y 𝑛 es

el número de sociedades con explicaciones orales presentes = 23.

Paso 4. Estadístico de la prueba

𝜇𝑥 =𝑚(𝑁+1)

2 (1)

𝜎𝑥2 =

𝑚𝑛(𝑁+1)

12 (2)

Esto es, cuando 𝑚 > 10 o 𝑛 > 10, se puede determinar la significación de un valor observado de 𝑊𝑥 por medio de

𝑧 =𝑊𝑥 ± 0.5 − 𝜇𝑊𝑥

𝜎𝑊𝑥

=𝑊𝑥 ± 0.5 − 𝑚(𝑁 + 1)/2

√𝑚𝑛(𝑁 + 1)/12

(3)

El valor de (+0.5) se agrega si se desea encontrar la probabilidad del lado izquierdo de la distribución, por el contrario para el lado derecho se cambia el signo a negativo.

Paso 5. Valor crítico

Para 𝑛 > 10 se mantienen los valores de la siguiente ecuación. La probabilidad asociada con la ocurrencia según 𝐻0 de valores extremos como una 𝑧 observada formula (3),

puede determinarse buscando el resultado de 𝑧 en la tabla A del apéndice I.

Paso 6. Regla de decisión.

Se 𝑅𝐻0 cuando la probabilidad de que 𝐻𝑜 sea verdadera es menor que 𝛼, es decir: 𝜌 < 𝛼.

Paso 7. Valor calculado

En la siguiente tabla se muestra las puntuaciones asignadas a cada una de las 39 sociedades, y los rangos de cada grupo (a los grupos empatados se les asigna el rango promedio).

Page 4: Prueba 157 Wilcoxon Mann Whitney

4

Tabla 1.

Socialización oral de la ansiedad y explicación oral de las enfermedades.

Sociedades sin presencia

de explicaciones

orales

Puntuación en

socialización de la

ansiedad Rango

Sociedades con

presencia de explicaciones

orales

Puntuación en

socialización de la

ansiedad Rango

1 13 29.5 1 17 39

2 12 24.5 2 16 38

3 12 24.5 3 15 36

4 10 16 4 15 36

5 10 16 5 15 36

6 10 16 6 14 33

7 10 16 7 14 33

8 9 12 8 14 33

9 8 9.5 9 13 29.5

10 8 9.5 10 13 29.5

11 7 5 11 13 29.5

12 7 5 12 12 24.5

13 7 5 13 12 24.5

14 7 5 14 12 24.5

15 7 5 15 12 24.5

16 6 1.5 16 11 20.5

𝑊𝑥 = 200 17 11 20.5

18 10 16

19 10 16

20 10 16

21 8 9.5

22 8 9.5

23 6 1.5

𝑊𝑦 = 580

Page 5: Prueba 157 Wilcoxon Mann Whitney

5

Las puntuaciones asignadas a cada una de las 39 sociedades se muestran en la tabla 1, junto con el rango de cada grupo combinado. Nótese que a los rangos empatados se les asigna el rango promedio. Para estos datos, 𝑊𝑥 = 200, 𝑊𝑦 = 580. Podemos encontrar el

valor de 𝑧 al sustituir los valores en la ecuación 1.

𝑧 =𝑊𝑥 ± 0.5 − 𝑚(𝑁 + 1)/2

√𝑚𝑛(𝑁 + 1)/12⟹

200 + 0.5 − 16(39 + 1)/2

√(16)(23)(39 + 1)/12= −3.41

Paso 8. Gráfica.

H0: 𝑊𝑥 = 𝑊𝑦

H1: 𝑊𝑥 ≠ 𝑊𝑦

0.XXX 0.XXX 𝑅𝐻𝑜 𝑁𝑅𝐻𝑜

X.XXX X.XXX 0 𝜌 = 0.003 𝛼 = 0.01

Paso 9. Decisión.

Ahora bien, al localizar en la tabla A del apéndice I el valor de 𝑧, se tiene el siguiente

resultado 𝑧 ≤ −3,41 tiene una probabilidad unidireccional cuando 𝐻0 es verdadera de 𝑝 <0.0003. Puesto que 𝑝 es menor que 𝛼 = 0.01 ⟹ 𝑅𝐻0.

Paso 10. Interpretación.

A modo de conclusión: las sociedades con presencia de explicaciones orales de las enfermedades son superiores en la socialización oral de la ansiedad, que las sociedades con explicaciones orales ausentes.

Paso 11. Potencia-eficacia

Es una excelente opción a la prueba t y, por supuesto, no tiene todas las restricciones en los supuestos y requisitos asociados con dicha prueba.

Page 6: Prueba 157 Wilcoxon Mann Whitney

6

Empates

El valor de 𝑧 cuando se realizó la corrección para los empates es un tanto mayor del

encontrado anteriormente cuando no se utilizó la corrección. La diferencia entre 𝑧 ≤−3.41 𝑦 𝑧 ≤ −3.44 es mínimo, tanto así que la probabilidad proporcionada por la tabla A del apéndice I es la misma para ambos casos en una prueba unidireccional.

B. Muestra pequeña

En un estudio para ratas en las que se generalizó el aprendizaje de imitación cuando eran colocadas bajo un nuevo impulso (una nueva condición motivante) y en una nueva situación. Cinco ratas fueron entrenadas en imitar a ratas líderes en un laberinto en T, cuando tenían hambre. Los sujetos se encontraban en un régimen de privación de alimento y debían seguir al líder a través del laberinto para conseguir comida. Después se logró que las ratas experimentales imitaran a las ratas líderes, fueron cambiadas a una situación de evitación de choques eléctricos, donde la imitación que hicieran del líder les permitiría evitar dicha estimulación aversiva.

La conducta en la situación de evitación se comparó con la de cuatro sujetos de control que no habían tenido entrenamiento previo en seguir a líderes. La 𝐻0 es que las primeras cinco ratas que habían sido entrenadas para imitar transferían ese entrenamiento a la nueva situación y así, alcanzaría el criterio de aprendizaje en la situación de evitación más rápidamente que las cuatro ratas control. Las comparaciones se realizaron en términos de cuantos ensayos le tomó a cada rata alcanzar el criterio de 10 respuestas correctas en 10 ensayos, con 𝛼 = 0.05.

Procedimiento 10 pasos.

Paso 1. Variables

𝑚 = 4, 𝑛 = 5, 𝛼 = 0.05

Paso 2. Planteamiento de H0: y H1

𝐻0: el numero de ensayos necesarios para alcanzar el criterio en la situación de evitación es el mismo para las ratas que fueron entrenadas para seguir a un líder con el fin de conseguir comida, que para aquellas que no fueron previamente entrenadas.

𝐻1: las ratas que fueron previamente entrenadas para seguir un líder con el fin de conseguir comida alcanzarán el criterio de ejecución en la situación de evitación de choques eléctricos en menos ensayos que las que no tuvieron el entrenamiento previo.

Paso 3. Nivel de significación

𝜶 = 0.05

Paso 4. Estadístico de prueba

𝑊𝑥 + 𝑊𝑦 =𝑁(𝑁 + 1)

2

Page 7: Prueba 157 Wilcoxon Mann Whitney

7

Si 𝐻0 fuera verdadera, esperaríamos que el promedio de rangos en cada uno de ambos grupos fueran aproximadamente iguales.

Paso 5. Valor crítico

Localizar en la tabla J del apéndice I la subtabla para 𝑚 = 4. Dado que la hipótesis alterna

es que 𝑊𝑥es mayor, se utiliza el lado derecho (superior) de la distribución.

Paso 6. Regla de decisión

Puesto que 𝐻1 plantea la dirección de la diferencia predicha, la región de rechazo es

unidireccional. Ésta consiste en todos los valores de 𝑊𝑥 los cuales son tan grandes que la probabilidad asociada con su ocurrencia cuando 𝐻0 es verdadera, sea menor o igual

𝜶 = 𝟎. 𝟎𝟓.

Paso 7. Valor calculado

Los números de ensayos como criterio requerido para las ratas experimentales y control fueron los siguientes:

Ratas controles: 110 70 53 51

Ratas experimentales: 78 64 75 45 82

Al ordenar estas puntuaciones en orden de magnitud, identificando a cada una tenemos:

Puntuación 45 51 53 64 70 75 78 82 110

Grupo Y X X Y X Y Y Y X

Rango 1 2 3 4 5 6 7 8 9

La sumatoria de rangos con estos datos para el grupo de control es: 𝑊𝑥 = 2 + 3 + 5 + 9 =19, en la tabla J del apéndice I, se localiza la subtabla para 𝑚 = 4. Dado que la hipótesis alterna es que 𝑊𝑥es mayor, se utiliza el lado derecho (superior) de la distribución.

Cuando 𝐻0 es verdadera, 𝑃[𝑊𝑥 ≥ 19] = 0.6349

Paso 8. Decisión

No rechazo 𝐻0 a un nivel de significancia de 𝛼 = 0.05.

Paso 9. Interpretación.

Los datos no proporcionan evidencia que justifique el 𝑅𝐻0 en el nivel de significación seleccionado. Por lo tanto, estos datos no apoyan la hipótesis de que el entrenamiento previo en imitación generalice a otras situaciones y en otras circunstancias motivacionales.

Page 8: Prueba 157 Wilcoxon Mann Whitney

8

Paso 10. Potencia-eficacia

Es una excelente opción a la prueba t y, por supuesto, no tiene todas las restricciones en los supuestos y requisitos asociados con dicha prueba.

Ejemplo 1

Un pedagogo, desea probar la hipótesis de que el procedimiento psicológico inductivo (trabaja con ejemplos y después se enseña la teoría), es más eficaz que el lógico (primero la teoría y luego las aplicaciones prácticas).

Como actúa con dos grupos (A y B), selecciona a 10 sujetos del grupo A y otros 10 del B, emparejados en rendimiento musical previo, en actitud y en aptitudes musicales. Decide al azar que en el A aplicará el procedimiento psicológico y en el B el lógico. Para la evaluación de resultados, se utiliza un instrumento de medida, obteniendo los siguientes datos:

Tabla 1.

Resultados del rendimiento musical

A 16 12 22 16 14 10 20 18 10 22

B 4 18 10 14 12 14 10 12 4 12

¿Puede afirmar que hay que diferencias entre los dos grupos? (α = 0.05)

Ejemplo 2

Para determinar si la asistencia a un curso de filosofía, modifica el estilo cognitivo, se seleccionan dos grupos de 10 alumnos, uno de los cuales siguió el curso (grupo experimental) mientras que al otro no se le aplicó ningún tratamiento (grupo control). Tras la realización del curso, mediante una escala adecuada se midió el estilo cognitivo de-ambos grupos. ¿Podemos afirmar que los dos grupos son iguales en cuanto a estilo cognitivo después de haber finalizado el curso? (Use α = 0.05)

Tabla 1

Resultados del estado cognitivo de los alumnos

Grupo experimental 75 46 52 45 75 62 48 85 63 84

Grupo control 39 49 28 47 35 25 69 34 67 32

Ejemplo 3

Se realiza un experimento con grupos independientes, para ver si el tratamiento A es similar al B. Se asigna de manera aleatoria 8 sujetos al A y 7 al tratamiento B, se reúnen los siguientes datos:

Page 9: Prueba 157 Wilcoxon Mann Whitney

9

Tabla 1

Resultados de los tratamientos

Tratamiento A 30 35 34 40 19 32 21 23

Tratamiento B 14 8 25 16 26 28 9

Demostrar que el tratamiento A es equivalente al B, use α = 0.01.

Ejemplo 4

Un consejero universitario, cree que la hipnosis es más eficaz que el tratamiento usual, debido a que los estudiantes, tienen una alta ansiedad durante los exámenes. Para probar esto, divide al azar a los alumnos con alta ansiedad en dos grupos. Uno de ellos recibe el tratamiento de hipnosis y el otro el tratamiento usual. Al concluir los tratamientos, cada estudiante recibe un cuestionario para medir la ansiedad que le provoca los exámenes. Los puntajes altos del cuestionario indican una mayor ansiedad. Los siguientes son los resultados:

Tabla 1

Resultados de tratamientos aplicados a alumnos con ansiedad

Tratamiento de hipnosis 20 21 33 40 24 43 48 31 22 44 30

Tratamiento usual 42 35 30 53 57 26 37 30 51 62 59

Utilizar la prueba para probar la equivalencia de tratamientos, utilice α = 0.10

Ejemplo 5

Para comprobar si la velocidad con la que dos ordenadores ejecutan los programas es similar, se han seleccionado 9 programas de análoga dificultad, que se han ejecutado en estos ordenadores. Aleatoriamente el programa escogió lo que se va a ejecutar en cada ordenador. Los tiempos de ejecución son:

Tabla 1

Tiempos de ejecución de ordenadores

Ordenador B A A B A B B A B

Tiempo 8.52 8.00 8.61 8.67 8.23 8.69 8.68 8.12 8.82

¿Se pueden concluir que ambos ordenadores tardan el mismo tiempo en la ejecución de los programas? (α = 0.10)

Page 10: Prueba 157 Wilcoxon Mann Whitney

10

Ejemplo 6

Un equipo de psicólogos evolutivos, ha estudiado como adquieren los niños la capacidad para empatizar con otros. Para este fin, han desarrollado un tests para medir la empatía en niños pequeños. Los estudios preliminares, han mostrado que los chicos son más lentos en desarrollar esta capacidad y, además, la desarrollan en menor cuantía que las chicas.

En uno de estos estudios, se eligió a un grupo de niños al azar y las puntuaciones obtenidas fueron las siguientes:

Tabla 1

Puntuaciones obtenidas del test aplicado a niños

Hombres 25 6 1 11 18 20 16 17 5 29 17 20 6 13 16

Mujeres 25 19 12 23 10 27 3 20 19 22 10 17 19 15 18 27 28 29 11 20

Determine si estos resultados, apoyan la afirmación de que los niños tienen menor empatía que las chicas (α = 0.05)

Ejemplo 7

En una clase de una universidad, hay 48 alumnos varones, de los cuales 12 viven en el campo y 36 en la ciudad. Se desarrolló una prueba, para determinar la condición física de los alumnos. Se aplicó el test a los alumnos, y se les asignó a cada uno una puntuación, si era baja indicaba una nula condición física. Los resultados obtenidos son los siguientes:

Tabla 1

Resultados de la prueba de condición física

Determinar si los alumnos que viven en el campo y la ciudad tienen la misma condición física, use α = 0.10.

Ejemplo 8

Una enfermera del trabajo, desea conocer si el Índice de Masa Corporal (IMC) difiere entre dos grupos de trabajadores de su empresa, trabajadores de oficios y trabajadores de oficinas. El IMC se registra como variable cuantitativa en Kg/m2, use α = 0.01. Los resultados se resumen en la siguiente tabla:

Page 11: Prueba 157 Wilcoxon Mann Whitney

11

Tabla 1

Resultados de la prueba del IMC

Trabajadores de oficios 22.6 24.2 23.1 28.3 22.7 29.8 23.5

Oficinistas 24.3 26.1 21.9 28.8 24.2 25.1

Ejemplo 9

La Tabla 1 muestra el número de horas semanales, que los estudiantes, afirman dedicarse a estudiar las asignaturas de introducción a la economía financiera y a la contabilidad. Los datos proceden de muestras aleatorias de 10 estudiantes de economía

financiera y 12 de contabilidad.

¿Indican los datos, la existencia de una equivalencia en el numero horas semanales que dedican los estudiantes a estudiar las dos asignaturas? (use α = 0.10)

Tabla 1

Resultados del número de horas de estudio

Economía financiera 10 6 8 10 12 13 11 9 5 11

Contabilidad 13 17 14 12 10 9 15 16 11 8 9 7

Ejemplo 10

En una muestra aleatoria de 12 titulados en administración de empresas, de una universidad privada, y de 10 titulados de una universidad pública, los sueldos de partida después de egresar (en miles de pesos anuales) fueron los siguientes:

Tabla 1

Sueldos en miles de pesos anuales de egresados de universidades públicas y privadas

Privada 26.2 29.3 31.3 28.7 27.4 25.1 26.0 27.1 27.5 29.8 32.6 34.6

Pública 25.3 28.2 29.2 27.1 26.8 26.5 30.7 31.3 26.3 24.9

Determine si ambas muestras de egresados tienen los mismos sueldos, (use α = 0.10).

Ejemplo 11

Tras una intervención terapéutica, se pretende examinar si el grado de satisfacción con el resultado de la intervención es igual entre hombres y mujeres. La satisfacción, es valorada mediante un cuestionario validado de 10 items. La puntación del cuestionario

Page 12: Prueba 157 Wilcoxon Mann Whitney

12

oscila entre 0 (totalmente insatisfecho) y 10 (totalmente satisfecho), use α = 0.01. Los datos se presentan en la siguiente tabla:

Tabla 1

Resultados del grado de satisfacción de pacientes

Hombres 8 5 6 4 7 8 8 6 7

Mujeres 4 7 4 4 5 5 4 4 7

Ejemplo 12

Se desea comparar las calificaciones obtenidas, por estudiantes varones y mujeres de un mismo curso, en un determinado examen estándar. Dos muestras tomadas al azar de 20 estudiantes cada una dieron los siguientes resultados (en puntos):

Tabla 1

Calificaciones de la aplicación de un examen estándar

Varones 51 90 68 83 65 75 71 85 79 84 87 72 76 92 69 91 63 71 78 59

Mujeres 45 55 95 80 70 50 99 88 74 60 67 82 86 98 62 97 93 61 73 94

Pruebe si las calificaciones de estudiantes varones y mujeres son las mismas, con α= 0.05.

Referencia bibliográfica

Siegel, S. & Castellan, N. (2012) Estadística no paramétrica: aplicada a las ciencias de la conducta.México, Trillas, pp. 157-166.