168046869 s3-capitulo-iii-analisis-de-varianza

33
Capítulo III Análisis de varianza

Transcript of 168046869 s3-capitulo-iii-analisis-de-varianza

Page 1: 168046869 s3-capitulo-iii-analisis-de-varianza

Capítulo III

Análisis de varianza

Page 2: 168046869 s3-capitulo-iii-analisis-de-varianza

Introducción

• En el capítulo anterior se analizaron únicamente dos grupos, sin embargo, la realidad es usualmente más compleja que eso.

• Frecuentemente se requiere comparar tres, cuatro, cinco o más muestras de grupos.

• No es posible emplear la razón t para comparar por pares dichas muestras, ya que implicaría gran trabajo y errores (alpha), por ello existe el ANÁLISIS DE VARIANZA.

Page 3: 168046869 s3-capitulo-iii-analisis-de-varianza

La lógica del análisis de varianza

• Para efectuar dicho análisis se requieren dos conceptos:

– VARIACIÓN DENTRO DE LOS GRUPOS: Es la distancia entre los puntajes crudos y su media del grupo.

– VARIACIÓN ENTRE GRUPOS: La distancia entre las medias de los grupos.

Page 4: 168046869 s3-capitulo-iii-analisis-de-varianza

La lógica del análisis de varianza

• Dichas variaciones se pueden relacionar con la prueba de la razón t, así:

• Este análisis de varianza produce una razón F, cuyo numerador indica la variación entre los grupos, y cuyo denominador representa la variación dentro de los grupos.

dif

XXt

21

Variación entre grupos

Variación dentro de los grupos

Page 5: 168046869 s3-capitulo-iii-analisis-de-varianza

La sumas de cuadrados

• Este concepto se empleó al obtener la desviación estándar, cuando se elevaron al cuadrado las desviaciones de la media de una distribución. Dicho procedimiento eliminaba de manera matemática sólida, los signos negativos que pudieran existir.

• Existen distintas sumas de cuadrados: – SCTotal: Suma de cuadrados total.

– SCent: Suma de cuadrados entre grupos.

– SCdentro: Suma de cuadrados dentro de los grupos.

Page 6: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados dentro de los grupos (SCdentro)

• Por fórmula:

• Donde:

• X=Un puntaje de desviación (X-X)

• APLICANDO LA FÓRMULA PARA LOS SIGUIENTES DATOS:

• X1= 1,2,1,2

• X2= 1,3,2,2

2

4

2

3

2

2

2

1 XXXXSCdentro

Page 7: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados dentro de los grupos (SCdentro)

CONSERVADORES (N=4) MODERADOS (N=4)

X1 X=X-X X2 X2 X=X-X X2

1 -0.50 0.25 1 -1.00 1

2 0.50 0.25 3 1.00 1

1 -0.50 0.25 2 0 0

2 0.50 0.25 2 0 0

61 X

5.14

6X

00.12

1 X 82 X

0.24

8X

00.22

2 X

Page 8: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados dentro de los grupos (SCdentro)

LIBERALES (N=4) RADICALES (N=4)

X3 X=X-X X2 X4 X=X-X X2

1 -0.75 0.56 3 1.25 1.56

2 0.25 0.06 2 0.25 0.06

2 -0.25 0.06 1 -0.75 0.56

2 0.25 0.06 1 -0.75 0.56

71 X

75.14

7X

74.02

3 X 72 X

75.14

7X

74.22

4 X

2

4

2

3

2

2

2

1 XXXXSCdentro

74.274.000.200.1 SCdentro

48.6SCdentro

Page 9: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados entre los grupos (SCent)

NSCent totalXX 2)(

• La suma de cuadrados entre los grupos representa la suma de las desviaciones de cada media muestral de la media total elevadas al cuadrado.

• Por fórmula: • Donde: X=cualquier media muestral Xtotal= la media total (la media de los puntajes crudos

de la totalidad de las muestras combinadas) N=el número de puntajes de cualquier muestra SCent=la suma de cuadrados entre los grupos.

Page 10: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados entre los grupos (SCent)

• SCent= (1.50-1.75)2 4 + (2.0-1.75) 2 4 +

(1.75-1.75)2 4 + (1.75-1.75) 2 4

• SCent= (-0.25)2 4 + (0.25) 2 4 + (0)2 4 + (0) 2 4

• SCent= (0.06)4 + (0.06)4 + (0)4 + (0)4

• SCent= 0.24+ 0.24

• SCent= 0.48

Page 11: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma total de cuadrados (SCtotal)

• La suma total de cuadrados es igual a la combinación de sus componentes dentro y entre los grupos.

• Por fórmula:

• SCTotal= SCent + SCdentro

• SCTotal= 0.48 + 6.48

• SCTotal= 6.96

Page 12: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma total de cuadrados (SCtotal)

• También se puede hallar con la fórmula:

• Donde: • X=un puntaje crudo en cualquier muestra. • Xtotal= la media total (la media de todos los puntajes

crudos de todas las muestras combinadas). • SCTotal=la suma total de cuadrados. • Se suman todas las desviaciones al cuadrado con

respecto de la media total. Ver pág. 71.

2)( totalXXSCtotal

Page 13: 168046869 s3-capitulo-iii-analisis-de-varianza

Cómo calcular las suma de cuadrados

• Los procedimientos anteriores son en extremos tardados y difíciles, por ello existen fórmulas más simples para calcular las sumas de cuadrados.

• Donde:

• N total=el número total de puntajes de todas las muestras combinadas.

totalN

XtotaltotalXSCtotal

.

)( 22

Page 14: 168046869 s3-capitulo-iii-analisis-de-varianza

Cómo calcular las suma de cuadrados

CONSERVADORES (N=4) MODERADOS (N=4)

X1 X2 X2 X2

1 1 1 1

2 4 3 9

1 1 2 4

2 4 2 4

61 X

5.14

6X

82 X

0.24

8X

182

2 X102

1 X

Page 15: 168046869 s3-capitulo-iii-analisis-de-varianza

Cómo calcular las suma de cuadrados (SCtotal)

LIBERALES (N=4) RADICALES (N=4)

X3 X2 X4 X2

1 1 3 9

2 4 2 4

2 4 1 1

2 4 1 1

71 X

75.14

7X

132

3 X 72 X

75.14

7X

152

4 X

4444

)7786()15131810(

2

SCtotal

16

)28()56(

2

SCtotal

16

784)56( SCtotal 4956SCtotal 7SCtotal

totalN

XtotaltotalXSCtotal

.

)( 22

Page 16: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados entre los grupos (SCent)

Ntotal

Xtotal

N

XSCent

22 )()(

• En nuestro caso:

• Donde: = A la sumatoria de los puntajes de cada

muestra al cuadrado. = A la sumatoria de todos los puntajes al

cuadrado. • N=el número total de puntajes en cualquier muestra. • N total= el número total de puntajes en todas las

muestras combinadas.

2)( X

2)(Xtotal

Page 17: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados entre los grupos (SCent)

Ntotal

Xtotal

N

XSCent

22 )()(

• Sustituyendo:

16

)28(

4

)7(

4

)7(

4

)8(

4

)6( 22222

SCent

16

784

4

49

4

49

4

64

4

36SCent

4925.1225.12169 SCent

495.49 SCent

50.0SCent

Page 18: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados dentro los grupos (SCdentro)

SCentSCdentroSCtotal

• Se puede calcular por simple despeje:

SCentSCtotalSCdentro

50.000.7 SCdentro

50.6SCdentro

Page 19: 168046869 s3-capitulo-iii-analisis-de-varianza

La suma de cuadrados dentro los grupos (SCdentro)

N

XXSCdentro

2

2)(

)(

• Solo para verificar en busca de errores:

4

)7(15

4

)7(13

4

)8(18

4

)6(10

2222

SCdentro

4

4915

4

4913

4

6418

4

3610SCdentro

25.121525.12131618910 SCdentro

75.275.021 SCdentro

50.6SCdentro

Page 20: 168046869 s3-capitulo-iii-analisis-de-varianza

La media cuadrática

• La suma de cuadrados tiende a crecer conforme aumenta N, por lo cual, dichas medidas no se pueden considerar “puras”. Por ello, se requiere un medio de control que evite esto.

• Para eso existe la “media cuadrática”. Por fórmula:

• Donde:

=la media cuadrática entre los grupos.

SCent = la suma de cuadrados entre los grupos.

glent =los grados de libertad entre los grupos.

glent

SCentCent

Cent

Page 21: 168046869 s3-capitulo-iii-analisis-de-varianza

La media cuadrática

Y también:

Donde:

= la media cuadrática dentro de los grupos.

SCdentro = la suma de cuadrados dentro de los grupos.

gldentro = los grados de libertad dentro de los grupos.

gldentro

SCdentroCdentro

Cdentro

Page 22: 168046869 s3-capitulo-iii-analisis-de-varianza

La media cuadrática

• Pero primero hay que obtener los grados de libertad apropiados:

• Para la media cuadrática entre los grupos: glent= K-1 Donde: K= el número de muestras. Para encontrar la media cuadrática dentro de los

grupos. gldentro= N total – K Donde: N total= el número total de puntajes en

todas las muestras combinadas. K= el número de muestras.

Page 23: 168046869 s3-capitulo-iii-analisis-de-varianza

La media cuadrática

• Sustituyendo con los datos anteriores: glent= K-1 glent= 4-1 glent=3 Para encontrar la media cuadrática dentro de los

grupos. gldentro= N total – K gldentro= 16-4 gldentro= 12

Page 24: 168046869 s3-capitulo-iii-analisis-de-varianza

La media cuadrática

• Ahora solo falta obtener las medias cuadráticas:

glent

SCentCent

3

50.0Cent

17.0Cent

gldentro

SCdentroCdentro

12

50.6Cdentro

54.0Cdentro

Page 25: 168046869 s3-capitulo-iii-analisis-de-varianza

Razón o cociente F

• El análisis de varianza produce una razón f que sirve para comparar la variación entre los grupos y dentro de los grupos.

• Por fórmula:

• Para los datos vistos:

• Ahora estamos listos para rechazar o para aceptar la hipótesis nula. (Con la tabla D).

Cdentro

SCentF

54.0

17.0F 31.0F

Page 26: 168046869 s3-capitulo-iii-analisis-de-varianza

Razón o cociente F

• La tabla D se interpreta, para el numerador (glent: grados de libertad entre) se indican en la parte superior de la tabla; el denominador (gldentro) se indican al lado izquierdo.

• Para nuestro caso:

– glent =3

– gldentro =12

• Así se encuentra un valor de: 3.49.

Page 27: 168046869 s3-capitulo-iii-analisis-de-varianza

Razón o cociente F

• Así que la razón F de la tabla fue de 3.49.

• Y la razón F calculada fue de 0.31

• Por lo tanto la razón F calculada, debe ser igual o mayor que la de la tabla para rechazar la hipótesis nula; sin embargo, en este caso como fue de solo 0.31, debemos aceptar que no hay diferencias significativas entre los grupos y se acepta la hipótesis nula.

• PARA EL EJEMPLO COMPLETO. (Ver. Págs. 77-80).

Page 28: 168046869 s3-capitulo-iii-analisis-de-varianza

Comparación múltiple de medias

• Con el fin de averiguar dónde se encuentran exactamente las diferencias significativas entre los grupos, cuando F obtenida, es igual o mayor que la F de la tabla, se emplea una nueva prueba, a saber: la DSH (Honestly significant difference: diferencia honestamente significartiva) de Turkey.

Page 29: 168046869 s3-capitulo-iii-analisis-de-varianza

Comparación múltiple de medias

• Por fórmula:

• Donde:

qa = un valor de la tabla a un nivel de confianza dado para el número máximo de medias que se estén comparando.

= la media cuadrática dentro de los grupos.

n= el número de entrevistados en cada grupo (debe ser el mismo).

n

CdentroqaDSH

Cdentro

Page 30: 168046869 s3-capitulo-iii-analisis-de-varianza

Comparación múltiple de medias

• Paso 1: Construir una tabla de diferencias entre medias ordenadas. (Ver pág. 77).

• Paso 2: Encontrar qa en la tabla I. (Primero verificando en la columna los gl, y en los renglones K (el mayor número de medias).

(X3 )=97.0 (X2 )=114.4 (X1 )=125.4

(X3 ) - 17.4 28.4

(X2 ) - - 11.0

(X1 ) - - -

Page 31: 168046869 s3-capitulo-iii-analisis-de-varianza

Comparación múltiple de medias

• Paso 3: Encontrar la DSH.

• Paso 4: Comparar la DSH con la tabla de las diferencias entre medias.

n

CdentroqaDSH

5

37.4377.3DSH

5

37.4377.3DSH

67.877.3DSH

)94.2(77.3DSH

08.11DSH

Page 32: 168046869 s3-capitulo-iii-analisis-de-varianza

Comparación múltiple de medias

• Para que se le considere estadísticamente significativa, cualquier diferencia entre medias debe ser igual o mayor que la DSH.

• Por lo tanto se concluye las diferencias entre X1 y X3; X2 y X3, son estadísticamente significativas;

• No así entre X1 y X2, que solo es de 11.0, menor que 11,08 obtenido en el paso 3.

Page 33: 168046869 s3-capitulo-iii-analisis-de-varianza

Comparación múltiple de medias

• En tu equipo, analicen el ejemplo y resuelvan un ejercicio asociado (número 5 ó 7).

• REALICEN LOS PROBLEMAS DE LAS PÁGINAS: 83-85.