Tema_8
-
Upload
salma-quiroga -
Category
Documents
-
view
6 -
download
0
Transcript of Tema_8
1
Tema 8. ANOVA de un factor
1. Introducción al ANOVA
1.1. Objetivo
1.2. Modelos de ANOVA
2. ANOVA de un factor de medidas independientes, efectos
fijos (EF)
3. ANOVA de un factor con el SPSS
1. Introducción al Anova 1.1. Objetivo: someter a comprobación experimental la H0 acerca
de la igualdad de más de dos medias
ANOVA (Analysis of variance) = Análisis de Varianza
Se basa en la variabilidad de los datos
0
1
2
1 2 3 4 5 6 7 8 9 1011
0
1
2
1 2 3 4 5 6
0
1
2
1 2 3 4 5 6
0
2
1 2 3 4 5 6
3,5 2 2,9
3,5 2 2,9
3,5 2 2,9
0
1
2
1 2 3 4 5 6 7 8 9 10110
1
2
1 2 3 4 5 6 7 8 9 101112
6,5 2 11,9
3,5 2 2,9
9,5 2 2,9
Si tenemos dos poblaciones con varianzas iguales y las juntamos
Si la varianza no cambia medias iguales
Si la varianza cambia medias diferentes 2
1. Introducción al ANOVA
1.2. Modelos de ANOVA Conceptos previos:
• Factor: Variable Independiente
• Niveles: cada uno de los diferentes valores que puede tomar el
factor
Ej. Factor: Tratamiento
Niveles: 0,5 dosis; 1 dosis; 2 dosis
Criterios de clasificación:
a) Número de factores (VVII)
b) Tipo de aleatorización
c) Tipo de muestreo realizado sobre los niveles del factor
3
1.2: Modelos de ANOVA
Ej. 1. Un factor (VI): tratamiento
T1 T2 T3
1
2
.
.
.
nj
5
3
.
.
.
8
6
7
.
.
.
9
13
16
.
.
.
14
μ 5 7 15
E1 E2 E3
1
2
.
.
.
nj
12
11
.
.
.
14
2
4
.
.
.
5
10
7
.
.
.
12
μ 11 4 10
Ej. 2. Un factor (VI): enfermedad
Ej. 3. Dos factores (VVII):
enfermedad x tratamiento
Two-way anova
T1 T2 T3
E1 … … …
E2 … … …
E3 … … …
(a) Número de factores
One-way anova
4
1.2: Modelos de ANOVA
(b) Tipo de aleatorización
Forma de asignación de los sujetos a los niveles de los factores
Completamente aleatorizado (Medidas independientes) : cada sujeto
se asigna al azar a cada nivel de cada factor
Aleatorizado por bloques (Medidas relacionadas)
• Asignación aleatoria de los sujetos de cada bloque a los
diferentes niveles del factor
• El mismo sujeto pasa por los diferentes niveles del factor
(Medidas repetidas)
5
1.2: Modelos de ANOVA
(c) Tipo de muestreo sobre los niveles del factor
Selección de los niveles:
• Elección de los niveles que estamos interesados en estudiar
→Factor de efectos fijos o sistemáticos: las inferencias se limitarán a
estos niveles
• Selección aleatoria entre el conjunto de posibles niveles
→Factor de efectos aleatorios: las inferencias se pueden generalizar
a cualquiera de los posibles niveles
6
2. ANOVA de un factor de medidas independientes, efectos fijos (EF)
H0 :1 2 ...k
Objetivo: someter a comprobación experimental la H0 acerca
de la igualdad de más de dos medias
Estadístico de contraste que
permita comprobar esta hipótesis
Modelo de los valores
de la VD (Y)
2.1. Modelo
ANOVA de un factor de efectos fijos, completamente aleatorizado (A-EF-CA)
7
Valor
observado
en la VD
Efectos debidos
a factores
constantes = + Efectos debidos a factores
tenidos en cuenta (VVII) +
Efectos debidos a
factores no
controlados
ANOVA de un factor de medidas independientes efectos fijos
Yij j ij
2. AN0VA 1 factor, medidas independientes, EF
Modelo de la puntuación
Puntuación del
sujeto i sometido al
nivel j del factor
Efectos debidos a
factores comunes
en todos los sujetos
Efectos propios
del nivel j del
factor
Efectos debidos a
factores no tenidos
en cuenta
8
j1
K
Yij
i1
n j
N
j j
ij Yij j
2. AN0VA 1 factor, medidas independientes, EF
Yij j ij
Efectos debidos a
factores comunes
en todos los sujetos:
Media Total
Efectos propios del
nivel j del factor
Efectos debidos a
factores no tenidos en
cuenta (errores de
medida, variables
extrañas, factores
propios del sujeto…)
Media de la población
sometida al tratamiento j
j
Yij
i1
n j
n j 9
2. AN0VA 1 factor, medidas independientes (EF)
3. SUPUESTOS: 3.1 Independencia: k m.a.s: cada observación es aleatoriamente seleccionada
de su población y/o aleatoriamente asignada a cada uno de los k tratamientos
del factor Y1: v.a. Y de los sujetos sometidos al 1er nivel del factor
Y11,Y21,...,Yn11 m.a.s
Y2: v.a. Y de los sujetos sometidos al 2o nivel del factor
Y12,Y22,...,Yn2 2 m.a.s
Yk: v.a. Y de los sujetos sometidos al nivel k del factor
Y1k,Y2k,...,Ynkk m.a.s
Yij independientes
3.2 Normalidad
• La variable Y sigue una distribución Normal en las k poblaciones
• Los errores se distribuyen normalmente
…
ij (Yij Y j ) independientes: cov(ij , i j ) 0;E(ij ) 0
10
Yij independientes y N( j,2)
Y1 N(1,1
2)
Y2 N(2,2
2)
Yk N(k,k
2)
...
1
2 2
2 ...k
2
2. AN0VA 1 factor, medidas independientes (EF)
ij independientes entre sí y N(0, 2)
3. SUPUESTOS:
Comprobación: pruebas de bondad de ajuste a la distribución Normal
Comprobación:
Prueba de Levene
2
Kolmogorov-Smirnov
3.3. Igualdad de varianzas (homocedasticidad)
11
12 12
Robustez de F frente al incumplimiento de los supuestos
La distribución
muestral no
sufre mucha
alteración
Supuesto de Normalidad
Si las distribuciones son simétricas
Si las distribuciones son asimétricas pero en la
misma dirección y
2. AN0VA 1 factor, medidas independientes, EF
1
2 2
2 ...k
2
La distribución
muestral no sufre
mucha alteración
Si los tamaños muestrales son
distintos
La distribución
muestral no sigue
exactamente el
modelo propuesto
Supuesto de Homocedasticidad
Si los tamaños muestrales son iguales y
se cumple el supuesto de normalidad
j1
K
Yij
i1
n j
N
Valor
observado
en la VD
Efectos debidos
a factores
constantes
= + Efectos debidos a factores
tenidos en cuenta (VVII) +
Efectos debidos a
factores no
controlados
=
Yij
j
ij
j j
ij Yij j
Y j Y
Y j1
K
Yij
i1
n j
Njijij YYe
4. ESTADÍSTICO DE CONTRASTE
2. AN0VA 1 factor, medidas independientes (EF)
13
Yij j ij
(Y j Y )
(Yij Y ) (Y j Y ) (Yij Y j )
Desviación de
cada puntuación
respecto de la
media total
Desviación de la
media de cada
grupo respecto
de la media total
Desviación de
cada puntuación
respecto de la
media de su
grupo
Fuentes de variación
2. AN0VA 1 factor, medidas independientes, EF
4. ESTADÍSTICO DE CONTRASTE
TOTAL INTERGRUPOS
(FACTOR)
INTRAGRUPOS
(ERROR)
Yij Y
(Yij Y j )
14
i1
n j
j1
k
(Yij Y )2 n j
j1
k
(Y j Y )2 i1
n j
j1
k
(Yij Y j )2
SC INTER
K-1
SC TOTAL
N-1
SC INTRA O ERROR
N-K
MCTOTAL SCTOTAL
N 1
MCINTER SCINTER
K 1
MCINTRA SCINTRA
N K
2. AN0VA 1 factor, medidas independientes, EF
Sumas de cuadrados
F MCINTER
MCINTRA
1F k1, Nk
Estadístico de contraste
Medias cuadráticas
Grados de libertad
15
Fuentes de
variación
Sumas de
cuadrados
Grados
de
libertad
Medias
cuadráticas
E.C. Significación
p
Intergrupos
(factor)
SCINTER k-1
Intragrupos
(error)
SCINTRA
N-k
Total SCTOTAL
N-1
MCINTER SCINTER
k 1
MCINTRA SCINTRA
N k
F MCINTER
MCINTRA
P(F1,Fk1,Nk)
Tabla del ANOVA
2. AN0VA 1 factor, medidas independientes, EF
16
SCTOTAL (Yij Y )2
i1
n j
j1
k
Yij2NY
2
i1
n j
j1
k
Yij2
i1
n j
Yij
i1
n j
j1
k
2
N
j1
k
2. AN0VA 1 factor, medidas independientes, EF
Fuentes de variación: Fórmulas de cálculo
SCINTER n j (Y j Y )2
j1
k
n jY j2NY
2
j1
k
Yij
i1
n j
2
n j
Yij
i1
n j
j1
k
2
Nj1
k
SCINTRA (Yij Y j )2
i1
n j
j1
k
Yij2 n jY j
2
i1
n j
j1
k
(n j 1)S j2
j1
k
n j
j1
k
˜ S j2
(N 1)S2N˜ S
2
Yij2
i1
n j
Yij
i1
n j
2
n jj1
k
j1
k
17
2. AN0VA 1 factor, medidas independientes, EF. Ejemplo
Se ha diseñado un estudio con tres grupos, todos ellos formados por 10 sujetos. A
cada grupo se le ha inducido un nivel de ansiedad distinto (bajo, medio y alto)
mientras realizaban una tarea de solución de problemas. Tras evaluar el
rendimiento de cada sujeto en una escala de 0 a 20 puntos ¿Es posible afirmar
que el rendimiento en la tarea no es el mismo bajo los tres estados de ansiedad
inducidos? (α = 0,05).
19
2. AN0VA 1 factor, medidas independientes, EF
Interpretación:
→Si hay manipulación experimental: porcentaje de la variabilidad de la VD que
se debe al factor
→Si no hay manipulación experimental: porcentaje de la variabilidad de la VD
asociada al factor 22
Cohen: 0.10; 0.25; 0.40
Cohen: 0.01; 0.06; 0.14
Comparaciones múltiples
2. AN0VA 1 factor, medidas independientes, EF
- Rechazamos H0
- No todas las medias son iguales pero no sabemos qué medias
difieren entre sí
comparaciones múltiples Aproximaciones:
• Planificadas o “a priori”: se planifican antes de realizar la
investigación y recoger los datos y se basan en consideraciones
teóricas
• No planificadas o “a posteriori”: una vez rechazada la H0, para
comprobar entre qué medias la diferencia es estadísticamente
significativa
→se comparan todos los posibles pares de medias 23
Comparaciones planeadas o a priori
2. AN0VA 1 factor, medidas independientes, EF
1. Prueba de Dunn-Bonferroni.
2. Pruebas de tendencia.
3. Prueba de Dunnett.
24
Comparaciones post hoc o a posteriori 1. Prueba de Tukey.
2. Pruebas de Scheffé.
Si antes de la recogida de datos no se ha planificado efectuar ninguna comparación concreta,
entonces los procedimientos apropiados son el de Tukey para efectuar comparaciones por pares y
el de Scheffé para efectuar comparaciones de todo tipo (una media con otra, una media con
varias, varias medias con varias medias). Aunque el procedimiento de Scheffé puede utilizarse
para estudiar las posibles diferencias entre pares de medias, limitarlo a ese tipo de comparaciones
lo convierte en excesivamente conservador y poco potente. Tanto la prueba de Tukey como la de
Scheffé asumen que las varianzas poblacionales son iguales. Si no es posible asumir tal cosa,
entonces es preferible utilizar la prueba de Games-Howell.
Si antes de la recogida de datos se han planificado
unas pocas comparaciones, lo apropiado es utilizar la
prueba de Dunn-Bonferroni. Si las únicas que
interesan son las de cada GE con el GC, el
procedimiento idóneo es el de Dunnett. Y las
comparaciones de tendencia son apropiadas cuando
el objetivo es conocer el tipo de relación existente.
3. AN0VA 1 factor con el SPSS
26
Vamos a ver cómo utilizar el SPSS para: (1) chequear los supuestos del
modelo de un factor, (2) contrastar la hipótesis global de igualdad de
medias con el estadístico F y con otros estadísticos robustos, (3) estimar
el tamaño del efecto y la potencia observada, (4) realizar comparaciones
múltiples post hoc y (5) realizar comparaciones planeadas o a priori.
Estas cinco tareas, que son las que suelen llevarse a cabo cuando se
aplica un ANOVA de un factor, no pueden realizarse con un único
procedimiento SPSS; es necesario utilizar varios. El procedimiento
Anova de un factor es, en principio, el procedimiento diseñado para
ajustar el modelo de un factor completamente aleatorizado, pero no
incluye algunos de los estadísticos que hemos estudiado.
3. AN0VA 1 factor con el SPSS
27
El procedimiento ANOVA de un factor:
1. Chequea el supuesto de igualdad de varianzas pero no el de normalidad. Y para
chequear el supuesto de igualdad de varianzas, ofrece la prueba de Levene (basada
en las medias) pero no la de Brown-Forsythe (basada en las medianas). Por tanto,
para chequear los supuestos del modelo de un factor lo recomendable es utilizar el
procedimiento Explorar, el cual permite chequear ambos supuestos y, además,
ofrece tanto la prueba de Levene como la de Brown-Forsythe.
2. Contrasta la hipótesis de igualdad de medias tanto con el estadístico F (que
asume varianzas poblacionales iguales) como con los estadísticos de Welch y
Brown-Forsythe (que no asumen varianzas poblacionales iguales).
3. No incluye ninguna medida del tamaño del efecto. Para esto puede utilizarse el
procedimiento Univariante, el cual ofrece las medidas de asociación
4. Tampoco incluye el cálculo de la potencia observada. Para esto puede utilizarse
el procedimiento Univariante.
3. AN0VA 1 factor con el SPSS
28
5. Ofrece todas las pruebas post hoc (el procedimiento Univariante ofrece las
mismas pruebas post hoc) y permite llevar a cabo comparaciones planeadas o a
priori, incluidas las comparaciones de tendencia (el procedimiento Univariante
ofrece esta misma posibilidad).
En lo relativo a las comparaciones planeadas o a priori, cada procedimiento tiene
sus peculiaridades. El procedimiento Anova de un factor ofrece dos estadísticos
para contrastar comparaciones planeadas: uno asumiendo varianzas poblacionales
iguales y otro sin asumir tal cosa; pero no calcula los intervalos de confianza de
las comparaciones solicitadas. El procedimiento Univariante sí calcula los
intervalos de confianza de las comparaciones planeadas, pero asume varianzas
poblacionales iguales tanto para evaluar las comparaciones como para construir
los intervalos de confianza.
3. AN0VA 1 factor con el SPSS
31
Analizar → Comparar medias → ANOVA de un factor
Hipótesis de igualdad de medias
3. AN0VA 1 factor con el SPSS
32
Hipótesis de igualdad de medias
ANOVA
Puntuaciones en rendimiento
260,000 2 130,000 9,915 ,001
354,000 27 13,111
614,000 29
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrática F Sig.
Pruebas robustas de igualdad de las medias
Puntuaciones en rendimiento
9,097 2 17,916 ,002
9,915 2 26,538 ,001
Welch
Brown-Forsy the
Estadíst icoa
gl1 gl2 Sig.
Distribuidos en F asintóticamente.a.
3. AN0VA 1 factor con el SPSS
33
Analizar → Modelo lineal general → Univariante
Tamaño del efecto y potencia observada
3. AN0VA 1 factor con el SPSS
34
Tamaño del efecto y potencia observada Factores inter-sujetos
Bajo 10
Medio 10
Alto 10
1
2
3
Nivel de
ansiedad
Et iqueta
del valor N
Pruebas de los efectos inter-sujetos
Variable dependiente: Puntuaciones en rendimiento
260,000b 2 130,000 9,915 ,001 ,423 19,831 ,972
3000,000 1 3000,000 228,814 ,000 ,894 228,814 1,000
260,000 2 130,000 9,915 ,001 ,423 19,831 ,972
354,000 27 13,111
3614,000 30
614,000 29
Fuente
Modelo corregido
Intersección
ansiedad
Error
Total
Total corregida
Suma de
cuadrados
tipo III gl
Media
cuadrática F Signif icación
Eta al
cuadrado
parcial
Parámetro de
no centralidad
Potencia
observadaa
Calculado con alfa = ,05a.
R cuadrado = ,423 (R cuadrado corregida = ,381)b.
3. AN0VA 1 factor con el SPSS
35
Analizar → Comparar medias → ANOVA de un factor
Comparaciones post hoc
3. AN0VA 1 factor con el SPSS
36
Comparaciones post hoc Comparaciones múltiples
Variable dependiente: Puntuaciones en rendimiento
HSD de Tukey
-5,000* 1,619 ,012 -9,01 -,99
2,000 1,619 ,443 -2,01 6,01
5,000* 1,619 ,012 ,99 9,01
7,000* 1,619 ,001 2,99 11,01
-2,000 1,619 ,443 -6,01 2,01
-7,000* 1,619 ,001 -11,01 -2,99
(J) Nivel de ansiedad
Medio
Alto
Bajo
Alto
Bajo
Medio
(I) Niv el de ansiedad
Bajo
Medio
Alto
Diferencia de
medias (I-J) Error típico Sig. Límite inf erior
Límite
superior
Interv alo de conf ianza al
95%
La diferencia de medias es signif icativa al nivel .05.*.
Puntuaciones en rendimiento
HSD de Tukeya
10 7,00
10 9,00
10 14,00
,443 1,000
Nivel de ansiedad
Alto
Bajo
Medio
Sig.
N 1 2
Subconjunto para alf a
= .05
Se muestran las medias para los grupos en los
subconjuntos homogéneos.
Usa el tamaño muestral de la media armónica =
10,000.
a.
3. AN0VA 1 factor con el SPSS
37
Analizar → Comparar medias → ANOVA de un factor
Comparaciones planeadas y de tendencia
3. AN0VA 1 factor con el SPSS
38
Comparaciones planeadas y de tendencia ANOVA
Puntuaciones en rendimiento
260,000 2 130,000 9,915 ,001
20,000 1 20,000 1,525 ,227
240,000 1 240,000 18,305 ,000
240,000 1 240,000 18,305 ,000
354,000 27 13,111
614,000 29
(Combinados)
Contraste
Desv iación
Término lineal
ContrasteTérmino cuadrático
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados gl
Media
cuadrática F Sig.
3. AN0VA 1 factor con el SPSS
39
Comparaciones planeadas y de tendencia
Coeficientes de los contrastes
1 0 -1
0 1 -1
Contraste
1
2
Bajo Medio Alto
Nivel de ansiedad
Pruebas para los contrastes
2,00 1,619 1,235 27 ,227
7,00 1,619 4,323 27 ,000
2,00 1,612 1,240 17,538 ,231
7,00 1,687 4,150 17,930 ,001
Contraste
1
2
1
2
Asumiendo igualdad
de varianzas
No asumiendo
igualdad de varianzas
Puntuaciones
en rendimiento
Valor del
contraste Error típico t gl Sig. (bilateral)