PRUEBAS DE KRUSKAL - WALLIS y FRIEDMAN - DR. YALIL RODRÍGUEZ

Post on 14-Aug-2015

1.048 views 1 download

Transcript of PRUEBAS DE KRUSKAL - WALLIS y FRIEDMAN - DR. YALIL RODRÍGUEZ

MAESTRIA EN RADIOLOGIA BUCAL Y

MAXILOFACIAL

PRUEBA DE

KRUSKAL – WALLIS

Y

PRUEBA DE

FRIEDMAN

MAESTRANDO: YALIL RODRIGUEZ

Cuando la distribución de los datos no

presenta normalidad, y se requiere

comparar más de 3 grupos, se pueden

realizar varios tipos de pruebas:

- Si los grupos son independientes:

Prueba de Kruskal Wallis

Mediana

- Si los grupos están relacionados:

Prueba de Friedman

W de Kendall

Q de Cochran

Prueba de Kruskal Wallis

También es llamada prueba H

Es el equivalente a un ANOVA de una sola vía

Es la prueba más adecuada para comparar poblaciones cuyas distribuciones no son normales

Es una prueba no paramétrica, que utiliza rangos de datos muestrales de tres o más grupos independientes

Se utiliza para probar la hipótesis nula (Ho) de que las muestras independientes provienen de poblaciones con medianas iguales. La hipótesis alterna (H1) es la afirmación de que las poblaciones tienen medianas que no son iguales

Los valores de la muestra invariablemente difieren de

alguna manera, y la pregunta es si las diferencias entre

las muestras significan diferencias genuinas en la

población o si solo representan la clase de variaciones que

pueden esperarse en muestras que se obtienen al azar de la

misma población.

Requiere que las mediciones de las variable se encuentre al

menos en escala ordinal

Fue propuesta por William Henry Kruskal (1919- 2005) y W.

Allen Wallis (1912-1998), en el artículo ¨Use of ranks in one-

criterion varience analysis¨, publicado en en ¨Journal of

American Statistics Association¨, en 1952

Requisitos

Al menos 3 muestras independientes, las cuales se

seleccionan al azar

Cada muestra debe tener al menos 5 observaciones

La distribución de los datos no deber normal

Fórmula

N= número total de observaciones en todas las muestras

combinadas

K= número de muestras

R1= suma de los rangos de la muestra 1

N1= número de observaciones de la muestra 1

Gl (grados de libertad)= k-1

Pasos

1. Planteamiento de las hipótesis

2. Se ordenan las observaciones de menor a mayor, y se les

asignan rangos desde 1 hasta n

3. Se obtiene la suma de los rangos correspondientes a los

elementos de cada muestra, y se halla el rango promedio

4. Se calcula el estadístico de prueba

5. Se busca H en la Tabla de Chi cuadrado

6. Se extraen las conclusiones

Para aplicar la prueba, se calcula el estadístico de prueba H,

el cual tiene una distribución que puede aproximarse por

medio de la distribución Chi ², siempre y cuando cada

muestra tenga al menos 5 observaciones.

Cuando se utiliza Chi ² en este contexto, el número de

grados de libertad es k-1

Si las muestras tiene menos de 5 observaciones, hay que

remitirse a tablas de valores críticos

Se trabaja generalmente con un nivel de significancia de 0.05

Si el resultado que arroja H es mayor que 0.05, se acepta Ho.

Al aplicarse la prueba de Kruskal Wallis, existe un factor de

corrección que debe aplicarse siempre que existan muchos

empates:

T= L³- L. Donde L es el número de observaciones que está

empatada. Se calcula T para cada grupo, y luego se realiza la

sumatoria

N= Número de todas las observaciones

Ejemplo

Utilizaremos algunos datos de mi artículo titulado:

“ ANALISIS DE BJÖRK Y JARABAK

EN SUJETOS CON DIFERENTE RELACIÓN

ESQUELÉTICA, SOBRE CEFALOGRAMAS DERIVADOS

DE TOMOGRAFÍA COMPUTARIZADA CONE BEAM”.

El tamaño de la muestra fué de 15 sujetos para Clase I, 15

sujetos para Clase II, y 16 sujetos para Clase III.

A los 46 sujetos se les realizaron los trazos correspondientes al

análisis de Björk y Jarabak, más el ANB y el FMA (ángulo

mandibular)

Primero, aplico la prueba de normalidad de los datos. En este

caso, con SPSS. Los datos no tienen distribución normal o

paramétrica, si son < 0.05

En este caso, según la prueba de S-W, los ángulos NSAr, o ángulo de la silla, para Clase II,

el MeGoN, o ángulo goniaco inferior para Clase II, y laAltura Facial Anterior,

o NMe, para Clase III, fueron menores a 0.05, es decir, no tienen normalidad en

su distribución . Para estas medidas, usaremos la prueba de Kruskal Wallis.

Para la explicación del uso de la prueba de Kruskal Wallis,

usaremos los valores del ángulo NSAr, para los 3 grupos

Angulo SNAr

Clase I Clase II Clase III

121 124 133

128 122 114

130 125 119

115 124 113

127 123 114

128 121 128

134 116 127

121 124 123

114 135 119

117 126 122

125 118 114

116 133 123

117 102 127

116 126 119

125 122 123

128

En este caso, compararemos el comportamiento del ángulo SNAr en las 3 clases esqueléticas. Es decir, haremos la

comparación en 3 grupos.

Para el caso, plantearemos las siguientes hipótesis:

- Hipótesis nula (Ho): el comportamiento del ángulo SNAr en

las 3 clases esqueléticas, no difiere significativamente entre si.

- Hipótesis alterna(H1): el comportamiento del ángulo SNAr

en las 3 clases esqueléticas, difiere significativamente entre sí.

Se inicia con el ordenamiento de todas

las observaciones de los 3 grupos,

uniéndolas en uno solo, a partir del

valor más pequeño hasta el mayor, y la

detección de las ligas o empates.

Si se producen empates en los valores,

se aplica un factor de corrección, el

cual se observa en la columna “Cálculo

de rango en caso de empate””.

Orden

Valor de Ang.

SNAr en

descendente Rango

Calculo de rango en caso

de empate # de ligas

1 102 1

2 113 2

3 114 4,5 3+4+5+6/4=4,5 4

4 114 4,5

5 114 4,5

6 114 4,5

7 115 7

8 116 9 8+9+10/3=9 3

9 116 9

10 116 9

11 117 11,5 11+12/2=11,5 2

12 117 11,5

13 118 13

14 119 15 14+15+16/3=15 3

15 119 15

16 119 15

17 121 18 17+18+19/3=18 3

18 121 18

19 121 18

20 122 21 20+21+22/3=21 3

21 122 21

22 122 21

23 123 24,5 23+24+25+26/4=24,5 4

24 123 24,5

25 123 24,5

26 123 24,5

27 124 28 27+28+29/3=28 3

28 124 28

29 124 28

30 125 31 30+31+32/3=31 3

31 125 31

32 125 31

33 126 33,5 33+34/2=33,5 2

34 126 33,5

35 127 36 35+36+37/3=36 3

36 127 36

37 127 36

38 128 39,5 38+39+40+41/4=39,5 4

39 128 39,5

40 128 39,5

41 128 39,5

42 130 42

43 133 43,5 43+44/2=43,5 2

44 133 43,5

45 134 45

46 135 46

Explicación en la diapositiva siguiente

Para el valor del ángulo 114, hay 4 empates: el 3, 4, 5, y 6.

Para obtener el valor corregido, se suman y se dividen entre el

# de valores.

3+4+5+6=18. Dividido entre 4= 4.5. Este valor se usa para

los 4 empates

Así sucesivamente en todos los casos de empate

Se presentan 13 empates en valores

El número de ligas es el número de valores empatados para

cada rango. En este caso, es de 4, pues hay 4 valores

empatados en 114.

Orden

Valor de Ang.

SNAr en

descendente Rango

Calculo de rango en caso

de empate # de ligas

1 102 1

2 113 2

3 114 4,5 3+4+5+6/4=4,5 4

4 114 4,5

5 114 4,5

6 114 4,5

7 115 7

Una vez efectuado el ordenamiento en rangos,

volvemos a la primera tabla para organizar cada

observación con su correspondiente rango, y realizar

la sumatoria de rangos.

Cada sumatoria, la elevamos al cuadrado

Clase I Rangos Clase II Rangos Clase III Rangos

121 18 124 28 133 43,5

128 39,5 122 21 114 4,5

130 42 125 31 119 15

115 7 124 28 113 2

127 36 123 24,5 114 4,5

128 39,5 121 18 128 39,5

134 45 116 9 127 36

121 18 124 28 123 24,5

114 4,5 135 46 119 15

117 11,5 126 33,5 122 21

125 31 118 13 114 4,5

116 9 133 43,5 123 24,5

117 11,5 102 1 127 36

116 9 126 33,5 119 15

125 31 122 21 123 24,5

128 39,5

∑ R 352,5 379 349,5

R² 124256,25 143641 122150,25

Ahora se calcula el valor de ajuste de ligas con la

siguiente fórmula:

L= 1- ∑(Li³-Li)

N³-N

= ∑ (3³-3) + (4³-4)………

46³ - 46

=1- 306/97290

= 0.99

Donde Li corresponde al valor de cada liga, y N corresponde al número total de observaciones entre los 3 grupos.

Con el ajuste L, procedemos a calcular el valor

estadístico de prueba de Kruskal Wallis

12 124256,25 143641 122150,25

H = X + + - 3 (46 + 1)

46(46+1) 15 15 16

= 0,00555042 X (8283,75+9576,06667+7634,39063) - 141

= 0,00555042 X (25494,2073) – 141

= 141,503463 – 141

= 0,503. Al dividirlo con el ajuste L, que corresponde a 0,99 nos da

= 0,50. Este valor se compara con los valores de chi ², pues cada muestra tuvo al menos 5 observaciones, en este caso, 15 o 16. Teniendo en cuenta que los grados de libertad son k – 1, quiere decir que k=2 (fueron 3 grupos)

Tabla de Chi 2

La prueba H nos arroja un resultado de 0.50, el cual es menor a

5.99 de la tabla de Chi ², con 2 grados de libertad , con un nivel

de significancia de 0.05.

0.50 se encuentra entre el 0.8 y el 0.7 de probabilidad, lo cual no

es significativo

Este resultado de H es mayor de 0.05, lo cual quiere decir que

no hay diferencias significativas en las medianas de las 3 clases

esqueléticas para el ángulo SNAr.

Se acepta la hipótesis nula (Ho).

En SPSS

Nos arroja el mismo

resultado

Este valor es mayor a 0.05, lo

cual significa que no hay

diferencias significativas entre

las 3 clases esqueléticas para

el ángulo NSAr. Se acepta la

hipótesis nula (Ho).

Prueba de Friedman

Esta prueba puede considerarse como una extensión de la prueba de Wilcoxon para el caso de más de 2 muestras relacionadas. Es la prueba no paramétrica paralela al ANOVA de medidas repetidas, y al igual que éste, contrasta la hipótesis nula de igualdad de tres o más muestras relacionadas

Existen 2 situaciones en las que se aplica esta prueba:

- Para una misma muestra medida más de 2 veces. En este caso, k es el número de tratamientos, o las diferentes situaciones o tiempos en los que se mide al sujeto

- En una sola medición de más de 2 muestras relacionadas. En este caso, k es el número de muestras o grupos relacionados

En estadística la prueba de Friedman es una prueba no

paramétrica desarrollado por el economista Milton

Friedman. Esta prueba puede utilizarse en aquellas

situaciones en las que se seleccionan n grupos de k

elementos de forma que los elementos de cada grupo

sean lo más parecidos posible entre sí, el método

consiste en ordenar los datos por filas o bloques,

reemplazándolos por su respectivo orden.

Hipótesis

H0: No existen diferencias entre los grupos.

Ha: Existen diferencias entre los grupos.

Para resolver este contraste de hipótesis, Friedman propuso un

estadístico que se distribuye como una Chi-cuadrado con K - 1

grados de libertad, siendo K el número de variables

relacionadas; se calcula mediante la siguiente expresión.

Estadístico de Prueba

En la expresión anterior:

• X2r = estadístico calculado del análisis de

varianza por rangos de Friedman.

• H = representa el número de elementos o de bloques

(numero de hileras)

• K = el número de variables relacionadas

• ∑ Rc2 = es la suma de rangos por columnas al

cuadrado.

1. Hacer una tabla en la que las K variables, es decir, las K medidas estén en las columnas y los n elementos en las filas, de esta manera la tabla tendrá K columnas y n filas.

2. A los valores de cada fila se les asigna un número del 1 a K, según el orden de magnitud de menor a mayor; a este número se le denomina rango.

3. Se suman los respectivos rangos en función de las columnas.

4. Aplicar la fórmula de análisis de varianza de doble entrada por rangos de Friedman.

5. Comparar el valor de X2r de Friedman con tablas

de valores críticos de Chi-cuadrada.

Pasos

Ejemplo

Se escogen al azar 8 Maestrandos de la Maestría de Radiología Bucal y Maxilofacial de la UPC, para evaluar su criterio con respecto al grado de incomodidad que podria presentar un paciente con respecto a la toma de 3 tipos de radiografías intraorales: Periapical de zona molar posterior inferior, Oclusal inferior, y Bite wing de zona molar posterior. Este criterio se evalúa de acuerdo a una escala de 1 a 10, donde 1 es MUY INCÓMODO, y 10 corresponde a una MUY BUENA RESPUESTA DEL PACIENTE.

Ho, o Hipótesis nula: No hay diferencia entre las 3 técnicas.

H1, o Hipótesis alterna: Existe diferencia entre las 3 técnicas con respecto al grado de incomodidad en el paciente.

Primer paso: Hacer una tabla en la que las K variables

estén en las columnas y los n elementos en las filas, de

esta manera la tabla tendrá K (3) columnas y n (8) filas.

Maestrandos Periapical Oclusal BW

A 6 5 3

B 9 9 4

C 6 9 3

D 5 8 6

E 7 8 8

F 5 7 5

G 6 7 5

H 6 7 7

Segundo paso: A los valores de cada fila se les asigna un

número del 1 a K (3), según el orden de magnitud de

menor a mayor; a este número se le denomina rango.

Maestrandos Periapical Oclusal BW

A 6(3) 5(2) 3(1)

B 9(2.5) 9(2.5) 4(1)

C 6(2) 9(3) 3(1)

D 5(1) 8(3) 6(2)

E 7(1) 8(2.5) 8(2.5)

F 5(1.5) 7(3) 5(1.5)

G 6(2) 7(3) 5(1)

H 6(1) 7(2.5) 7(2.5)

Tercer paso: Se suman los respectivos rangos en función

de las columnas.

Las sumas de rangos correspondientes a cada aparato,

variable o columna son:

R1 = 14 R2 =21.5 R3 =12.5

A cada valor se le saca el cuadrado.

R1 = 196 R2 = 462.25 R3 = 156.25

Cuarto paso: Aplicar la fórmula de análisis de varianza

de doble entrada por rangos de Friedman.

= 12/ 96 196 + 462.25 + 156.25 - 96

= 0.125 (814.15) - 96

= 101.76 - 96

= 12/ 8x3 (4) (14)² + (21.5)² + (12.5)² - 3 (8) (3+1)

= 5.81

Debido a que se presentaron varios empates, hay

que dividir este valor por un factor de

corrección. Su fórmula es la siguiente:

Donde:

T ih = número de observaciones empatadas para un rango dado en una fila,

o bloque

h = numero de empates en cada bloque. Por ejemplo, en el bloque 2 hay un

solo empate (h=1), y hay 2 datos empatados (t 2h=2).

Entonces T 2= 2³-2=6. Igual para los bloques o filas 5, 6, y 8.

Entonces, ∑ T I = 24

k = número de variables, es decir, 3.

b=H = Número de filas o bloques, es decir , 8.

C = 1 – 24/24 X 8 = 0.875

Con la corrección, quedaría:

5.81 x 0.875 = 6.64

Este valor se compara con la tabla de Chi ².

Los grados de libertad corresponden a k -1, osea

3-1= 2

Para este caso, el valor de Chi ² es de 5.99.

Nuestro resultado es mayor a este valor, lo que

significa que si hay diferencias significativas en

el grado de incomodidad para el paciente, entre

las 3 técnicas. Se rechaza la hipótesis nula

En SPSS

El mísmo valor

Este valor es menor a 0.05,

lo cual nos confirma las

diferencias significativas

encontradas.

Se rechaza la Hipótesis nula

GRACIAZZZZZZZZZZ

ZZZZZZZZZZZZZZZZ

ZZZZZZZZZ……