Tema_8

40
1 Tema 8. ANOVA de un factor 1. Introducción al ANOVA 1.1. Objetivo 1.2. Modelos de ANOVA 2. ANOVA de un factor de medidas independientes, efectos fijos (EF) 3. ANOVA de un factor con el SPSS

Transcript of Tema_8

1

Tema 8. ANOVA de un factor

1. Introducción al ANOVA

1.1. Objetivo

1.2. Modelos de ANOVA

2. ANOVA de un factor de medidas independientes, efectos

fijos (EF)

3. ANOVA de un factor con el SPSS

1. Introducción al Anova 1.1. Objetivo: someter a comprobación experimental la H0 acerca

de la igualdad de más de dos medias

ANOVA (Analysis of variance) = Análisis de Varianza

Se basa en la variabilidad de los datos

0

1

2

1 2 3 4 5 6 7 8 9 1011

0

1

2

1 2 3 4 5 6

0

1

2

1 2 3 4 5 6

0

2

1 2 3 4 5 6

3,5 2 2,9

3,5 2 2,9

3,5 2 2,9

0

1

2

1 2 3 4 5 6 7 8 9 10110

1

2

1 2 3 4 5 6 7 8 9 101112

6,5 2 11,9

3,5 2 2,9

9,5 2 2,9

Si tenemos dos poblaciones con varianzas iguales y las juntamos

Si la varianza no cambia medias iguales

Si la varianza cambia medias diferentes 2

1. Introducción al ANOVA

1.2. Modelos de ANOVA Conceptos previos:

• Factor: Variable Independiente

• Niveles: cada uno de los diferentes valores que puede tomar el

factor

Ej. Factor: Tratamiento

Niveles: 0,5 dosis; 1 dosis; 2 dosis

Criterios de clasificación:

a) Número de factores (VVII)

b) Tipo de aleatorización

c) Tipo de muestreo realizado sobre los niveles del factor

3

1.2: Modelos de ANOVA

Ej. 1. Un factor (VI): tratamiento

T1 T2 T3

1

2

.

.

.

nj

5

3

.

.

.

8

6

7

.

.

.

9

13

16

.

.

.

14

μ 5 7 15

E1 E2 E3

1

2

.

.

.

nj

12

11

.

.

.

14

2

4

.

.

.

5

10

7

.

.

.

12

μ 11 4 10

Ej. 2. Un factor (VI): enfermedad

Ej. 3. Dos factores (VVII):

enfermedad x tratamiento

Two-way anova

T1 T2 T3

E1 … … …

E2 … … …

E3 … … …

(a) Número de factores

One-way anova

4

1.2: Modelos de ANOVA

(b) Tipo de aleatorización

Forma de asignación de los sujetos a los niveles de los factores

Completamente aleatorizado (Medidas independientes) : cada sujeto

se asigna al azar a cada nivel de cada factor

Aleatorizado por bloques (Medidas relacionadas)

• Asignación aleatoria de los sujetos de cada bloque a los

diferentes niveles del factor

• El mismo sujeto pasa por los diferentes niveles del factor

(Medidas repetidas)

5

1.2: Modelos de ANOVA

(c) Tipo de muestreo sobre los niveles del factor

Selección de los niveles:

• Elección de los niveles que estamos interesados en estudiar

→Factor de efectos fijos o sistemáticos: las inferencias se limitarán a

estos niveles

• Selección aleatoria entre el conjunto de posibles niveles

→Factor de efectos aleatorios: las inferencias se pueden generalizar

a cualquiera de los posibles niveles

6

2. ANOVA de un factor de medidas independientes, efectos fijos (EF)

H0 :1 2 ...k

Objetivo: someter a comprobación experimental la H0 acerca

de la igualdad de más de dos medias

Estadístico de contraste que

permita comprobar esta hipótesis

Modelo de los valores

de la VD (Y)

2.1. Modelo

ANOVA de un factor de efectos fijos, completamente aleatorizado (A-EF-CA)

7

Valor

observado

en la VD

Efectos debidos

a factores

constantes = + Efectos debidos a factores

tenidos en cuenta (VVII) +

Efectos debidos a

factores no

controlados

ANOVA de un factor de medidas independientes efectos fijos

Yij j ij

2. AN0VA 1 factor, medidas independientes, EF

Modelo de la puntuación

Puntuación del

sujeto i sometido al

nivel j del factor

Efectos debidos a

factores comunes

en todos los sujetos

Efectos propios

del nivel j del

factor

Efectos debidos a

factores no tenidos

en cuenta

8

j1

K

Yij

i1

n j

N

j j

ij Yij j

2. AN0VA 1 factor, medidas independientes, EF

Yij j ij

Efectos debidos a

factores comunes

en todos los sujetos:

Media Total

Efectos propios del

nivel j del factor

Efectos debidos a

factores no tenidos en

cuenta (errores de

medida, variables

extrañas, factores

propios del sujeto…)

Media de la población

sometida al tratamiento j

j

Yij

i1

n j

n j 9

2. AN0VA 1 factor, medidas independientes (EF)

3. SUPUESTOS: 3.1 Independencia: k m.a.s: cada observación es aleatoriamente seleccionada

de su población y/o aleatoriamente asignada a cada uno de los k tratamientos

del factor Y1: v.a. Y de los sujetos sometidos al 1er nivel del factor

Y11,Y21,...,Yn11 m.a.s

Y2: v.a. Y de los sujetos sometidos al 2o nivel del factor

Y12,Y22,...,Yn2 2 m.a.s

Yk: v.a. Y de los sujetos sometidos al nivel k del factor

Y1k,Y2k,...,Ynkk m.a.s

Yij independientes

3.2 Normalidad

• La variable Y sigue una distribución Normal en las k poblaciones

• Los errores se distribuyen normalmente

ij (Yij Y j ) independientes: cov(ij , i j ) 0;E(ij ) 0

10

Yij independientes y N( j,2)

Y1 N(1,1

2)

Y2 N(2,2

2)

Yk N(k,k

2)

...

1

2 2

2 ...k

2

2. AN0VA 1 factor, medidas independientes (EF)

ij independientes entre sí y N(0, 2)

3. SUPUESTOS:

Comprobación: pruebas de bondad de ajuste a la distribución Normal

Comprobación:

Prueba de Levene

2

Kolmogorov-Smirnov

3.3. Igualdad de varianzas (homocedasticidad)

11

12 12

Robustez de F frente al incumplimiento de los supuestos

La distribución

muestral no

sufre mucha

alteración

Supuesto de Normalidad

Si las distribuciones son simétricas

Si las distribuciones son asimétricas pero en la

misma dirección y

2. AN0VA 1 factor, medidas independientes, EF

1

2 2

2 ...k

2

La distribución

muestral no sufre

mucha alteración

Si los tamaños muestrales son

distintos

La distribución

muestral no sigue

exactamente el

modelo propuesto

Supuesto de Homocedasticidad

Si los tamaños muestrales son iguales y

se cumple el supuesto de normalidad

j1

K

Yij

i1

n j

N

Valor

observado

en la VD

Efectos debidos

a factores

constantes

= + Efectos debidos a factores

tenidos en cuenta (VVII) +

Efectos debidos a

factores no

controlados

=

Yij

j

ij

j j

ij Yij j

Y j Y

Y j1

K

Yij

i1

n j

Njijij YYe

4. ESTADÍSTICO DE CONTRASTE

2. AN0VA 1 factor, medidas independientes (EF)

13

Yij j ij

(Y j Y )

(Yij Y ) (Y j Y ) (Yij Y j )

Desviación de

cada puntuación

respecto de la

media total

Desviación de la

media de cada

grupo respecto

de la media total

Desviación de

cada puntuación

respecto de la

media de su

grupo

Fuentes de variación

2. AN0VA 1 factor, medidas independientes, EF

4. ESTADÍSTICO DE CONTRASTE

TOTAL INTERGRUPOS

(FACTOR)

INTRAGRUPOS

(ERROR)

Yij Y

(Yij Y j )

14

i1

n j

j1

k

(Yij Y )2 n j

j1

k

(Y j Y )2 i1

n j

j1

k

(Yij Y j )2

SC INTER

K-1

SC TOTAL

N-1

SC INTRA O ERROR

N-K

MCTOTAL SCTOTAL

N 1

MCINTER SCINTER

K 1

MCINTRA SCINTRA

N K

2. AN0VA 1 factor, medidas independientes, EF

Sumas de cuadrados

F MCINTER

MCINTRA

1F k1, Nk

Estadístico de contraste

Medias cuadráticas

Grados de libertad

15

Fuentes de

variación

Sumas de

cuadrados

Grados

de

libertad

Medias

cuadráticas

E.C. Significación

p

Intergrupos

(factor)

SCINTER k-1

Intragrupos

(error)

SCINTRA

N-k

Total SCTOTAL

N-1

MCINTER SCINTER

k 1

MCINTRA SCINTRA

N k

F MCINTER

MCINTRA

P(F1,Fk1,Nk)

Tabla del ANOVA

2. AN0VA 1 factor, medidas independientes, EF

16

SCTOTAL (Yij Y )2

i1

n j

j1

k

Yij2NY

2

i1

n j

j1

k

Yij2

i1

n j

Yij

i1

n j

j1

k

2

N

j1

k

2. AN0VA 1 factor, medidas independientes, EF

Fuentes de variación: Fórmulas de cálculo

SCINTER n j (Y j Y )2

j1

k

n jY j2NY

2

j1

k

Yij

i1

n j

2

n j

Yij

i1

n j

j1

k

2

Nj1

k

SCINTRA (Yij Y j )2

i1

n j

j1

k

Yij2 n jY j

2

i1

n j

j1

k

(n j 1)S j2

j1

k

n j

j1

k

˜ S j2

(N 1)S2N˜ S

2

Yij2

i1

n j

Yij

i1

n j

2

n jj1

k

j1

k

17

2. AN0VA 1 factor, medidas independientes, EF

2. AN0VA 1 factor, medidas independientes, EF. Ejemplo

Se ha diseñado un estudio con tres grupos, todos ellos formados por 10 sujetos. A

cada grupo se le ha inducido un nivel de ansiedad distinto (bajo, medio y alto)

mientras realizaban una tarea de solución de problemas. Tras evaluar el

rendimiento de cada sujeto en una escala de 0 a 20 puntos ¿Es posible afirmar

que el rendimiento en la tarea no es el mismo bajo los tres estados de ansiedad

inducidos? (α = 0,05).

19

2. AN0VA 1 factor, medidas independientes, EF. Ejemplo

20

Tamaño del efecto

2. AN0VA 1 factor, medidas independientes, EF

21

2. AN0VA 1 factor, medidas independientes, EF

Interpretación:

→Si hay manipulación experimental: porcentaje de la variabilidad de la VD que

se debe al factor

→Si no hay manipulación experimental: porcentaje de la variabilidad de la VD

asociada al factor 22

Cohen: 0.10; 0.25; 0.40

Cohen: 0.01; 0.06; 0.14

Comparaciones múltiples

2. AN0VA 1 factor, medidas independientes, EF

- Rechazamos H0

- No todas las medias son iguales pero no sabemos qué medias

difieren entre sí

comparaciones múltiples Aproximaciones:

• Planificadas o “a priori”: se planifican antes de realizar la

investigación y recoger los datos y se basan en consideraciones

teóricas

• No planificadas o “a posteriori”: una vez rechazada la H0, para

comprobar entre qué medias la diferencia es estadísticamente

significativa

→se comparan todos los posibles pares de medias 23

Comparaciones planeadas o a priori

2. AN0VA 1 factor, medidas independientes, EF

1. Prueba de Dunn-Bonferroni.

2. Pruebas de tendencia.

3. Prueba de Dunnett.

24

Comparaciones post hoc o a posteriori 1. Prueba de Tukey.

2. Pruebas de Scheffé.

Si antes de la recogida de datos no se ha planificado efectuar ninguna comparación concreta,

entonces los procedimientos apropiados son el de Tukey para efectuar comparaciones por pares y

el de Scheffé para efectuar comparaciones de todo tipo (una media con otra, una media con

varias, varias medias con varias medias). Aunque el procedimiento de Scheffé puede utilizarse

para estudiar las posibles diferencias entre pares de medias, limitarlo a ese tipo de comparaciones

lo convierte en excesivamente conservador y poco potente. Tanto la prueba de Tukey como la de

Scheffé asumen que las varianzas poblacionales son iguales. Si no es posible asumir tal cosa,

entonces es preferible utilizar la prueba de Games-Howell.

Si antes de la recogida de datos se han planificado

unas pocas comparaciones, lo apropiado es utilizar la

prueba de Dunn-Bonferroni. Si las únicas que

interesan son las de cada GE con el GC, el

procedimiento idóneo es el de Dunnett. Y las

comparaciones de tendencia son apropiadas cuando

el objetivo es conocer el tipo de relación existente.

Comparaciones de tendencia

2. AN0VA 1 factor, medidas independientes, EF

25

3. AN0VA 1 factor con el SPSS

26

Vamos a ver cómo utilizar el SPSS para: (1) chequear los supuestos del

modelo de un factor, (2) contrastar la hipótesis global de igualdad de

medias con el estadístico F y con otros estadísticos robustos, (3) estimar

el tamaño del efecto y la potencia observada, (4) realizar comparaciones

múltiples post hoc y (5) realizar comparaciones planeadas o a priori.

Estas cinco tareas, que son las que suelen llevarse a cabo cuando se

aplica un ANOVA de un factor, no pueden realizarse con un único

procedimiento SPSS; es necesario utilizar varios. El procedimiento

Anova de un factor es, en principio, el procedimiento diseñado para

ajustar el modelo de un factor completamente aleatorizado, pero no

incluye algunos de los estadísticos que hemos estudiado.

3. AN0VA 1 factor con el SPSS

27

El procedimiento ANOVA de un factor:

1. Chequea el supuesto de igualdad de varianzas pero no el de normalidad. Y para

chequear el supuesto de igualdad de varianzas, ofrece la prueba de Levene (basada

en las medias) pero no la de Brown-Forsythe (basada en las medianas). Por tanto,

para chequear los supuestos del modelo de un factor lo recomendable es utilizar el

procedimiento Explorar, el cual permite chequear ambos supuestos y, además,

ofrece tanto la prueba de Levene como la de Brown-Forsythe.

2. Contrasta la hipótesis de igualdad de medias tanto con el estadístico F (que

asume varianzas poblacionales iguales) como con los estadísticos de Welch y

Brown-Forsythe (que no asumen varianzas poblacionales iguales).

3. No incluye ninguna medida del tamaño del efecto. Para esto puede utilizarse el

procedimiento Univariante, el cual ofrece las medidas de asociación

4. Tampoco incluye el cálculo de la potencia observada. Para esto puede utilizarse

el procedimiento Univariante.

3. AN0VA 1 factor con el SPSS

28

5. Ofrece todas las pruebas post hoc (el procedimiento Univariante ofrece las

mismas pruebas post hoc) y permite llevar a cabo comparaciones planeadas o a

priori, incluidas las comparaciones de tendencia (el procedimiento Univariante

ofrece esta misma posibilidad).

En lo relativo a las comparaciones planeadas o a priori, cada procedimiento tiene

sus peculiaridades. El procedimiento Anova de un factor ofrece dos estadísticos

para contrastar comparaciones planeadas: uno asumiendo varianzas poblacionales

iguales y otro sin asumir tal cosa; pero no calcula los intervalos de confianza de

las comparaciones solicitadas. El procedimiento Univariante sí calcula los

intervalos de confianza de las comparaciones planeadas, pero asume varianzas

poblacionales iguales tanto para evaluar las comparaciones como para construir

los intervalos de confianza.

3. AN0VA 1 factor con el SPSS

29

Supuestos

3. AN0VA 1 factor con el SPSS

30

Supuestos

3. AN0VA 1 factor con el SPSS

31

Analizar → Comparar medias → ANOVA de un factor

Hipótesis de igualdad de medias

3. AN0VA 1 factor con el SPSS

32

Hipótesis de igualdad de medias

ANOVA

Puntuaciones en rendimiento

260,000 2 130,000 9,915 ,001

354,000 27 13,111

614,000 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrática F Sig.

Pruebas robustas de igualdad de las medias

Puntuaciones en rendimiento

9,097 2 17,916 ,002

9,915 2 26,538 ,001

Welch

Brown-Forsy the

Estadíst icoa

gl1 gl2 Sig.

Distribuidos en F asintóticamente.a.

3. AN0VA 1 factor con el SPSS

33

Analizar → Modelo lineal general → Univariante

Tamaño del efecto y potencia observada

3. AN0VA 1 factor con el SPSS

34

Tamaño del efecto y potencia observada Factores inter-sujetos

Bajo 10

Medio 10

Alto 10

1

2

3

Nivel de

ansiedad

Et iqueta

del valor N

Pruebas de los efectos inter-sujetos

Variable dependiente: Puntuaciones en rendimiento

260,000b 2 130,000 9,915 ,001 ,423 19,831 ,972

3000,000 1 3000,000 228,814 ,000 ,894 228,814 1,000

260,000 2 130,000 9,915 ,001 ,423 19,831 ,972

354,000 27 13,111

3614,000 30

614,000 29

Fuente

Modelo corregido

Intersección

ansiedad

Error

Total

Total corregida

Suma de

cuadrados

tipo III gl

Media

cuadrática F Signif icación

Eta al

cuadrado

parcial

Parámetro de

no centralidad

Potencia

observadaa

Calculado con alfa = ,05a.

R cuadrado = ,423 (R cuadrado corregida = ,381)b.

3. AN0VA 1 factor con el SPSS

35

Analizar → Comparar medias → ANOVA de un factor

Comparaciones post hoc

3. AN0VA 1 factor con el SPSS

36

Comparaciones post hoc Comparaciones múltiples

Variable dependiente: Puntuaciones en rendimiento

HSD de Tukey

-5,000* 1,619 ,012 -9,01 -,99

2,000 1,619 ,443 -2,01 6,01

5,000* 1,619 ,012 ,99 9,01

7,000* 1,619 ,001 2,99 11,01

-2,000 1,619 ,443 -6,01 2,01

-7,000* 1,619 ,001 -11,01 -2,99

(J) Nivel de ansiedad

Medio

Alto

Bajo

Alto

Bajo

Medio

(I) Niv el de ansiedad

Bajo

Medio

Alto

Diferencia de

medias (I-J) Error típico Sig. Límite inf erior

Límite

superior

Interv alo de conf ianza al

95%

La diferencia de medias es signif icativa al nivel .05.*.

Puntuaciones en rendimiento

HSD de Tukeya

10 7,00

10 9,00

10 14,00

,443 1,000

Nivel de ansiedad

Alto

Bajo

Medio

Sig.

N 1 2

Subconjunto para alf a

= .05

Se muestran las medias para los grupos en los

subconjuntos homogéneos.

Usa el tamaño muestral de la media armónica =

10,000.

a.

3. AN0VA 1 factor con el SPSS

37

Analizar → Comparar medias → ANOVA de un factor

Comparaciones planeadas y de tendencia

3. AN0VA 1 factor con el SPSS

38

Comparaciones planeadas y de tendencia ANOVA

Puntuaciones en rendimiento

260,000 2 130,000 9,915 ,001

20,000 1 20,000 1,525 ,227

240,000 1 240,000 18,305 ,000

240,000 1 240,000 18,305 ,000

354,000 27 13,111

614,000 29

(Combinados)

Contraste

Desv iación

Término lineal

ContrasteTérmino cuadrático

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrática F Sig.

3. AN0VA 1 factor con el SPSS

39

Comparaciones planeadas y de tendencia

Coeficientes de los contrastes

1 0 -1

0 1 -1

Contraste

1

2

Bajo Medio Alto

Nivel de ansiedad

Pruebas para los contrastes

2,00 1,619 1,235 27 ,227

7,00 1,619 4,323 27 ,000

2,00 1,612 1,240 17,538 ,231

7,00 1,687 4,150 17,930 ,001

Contraste

1

2

1

2

Asumiendo igualdad

de varianzas

No asumiendo

igualdad de varianzas

Puntuaciones

en rendimiento

Valor del

contraste Error típico t gl Sig. (bilateral)

40

Lecturas de este tema

Capítulo 6 (pp. 185-246) del manual:

- Pardo, A.,y San Martín, R. (2010). Análisis de datos en

Ciencias Sociales y de la salud II. Madrid: Editorial Síntesis.