Presentación de PowerPoint - uam.es · Análisis con más de 2 Factores J.F. Casanova ANOVA y...
Transcript of Presentación de PowerPoint - uam.es · Análisis con más de 2 Factores J.F. Casanova ANOVA y...
ANOVA y ANCOVA 1
J.F. Casanova ANOVA y ANCOVA 1
Análisis de la Varianza
y de la Covarianza
ANOVA y ANCOVA
J.F. Casanova ANOVA y ANCOVA 2
Esquema (1)
1. Análisis de la Varianza de 1 Factor(Muestras independientes)
2. Análisis de la Varianza de 1 Factor(Muestras relacionadas)
3. Análisis de la Varianza de 2 Factores
4. Análisis de la Covarianza
5. Análisis con más de 2 Factores
J.F. Casanova ANOVA y ANCOVA 3
Análisis de la Varianza de 1 Factor
Objetivos
Comparar varios grupos respecto a una variable cuantitativa.
Analizar la asociación entre una variable
cualitativa y una variable cuantitativa.
(Recordemos la equivalencia entre Comparación y Asociación)
J.F. Casanova ANOVA y ANCOVA 4
Análisis de la Varianza de 1 Factor
Pruebas utilizadas
A) Poblaciones Normales y Varianzas Homogéneas
La más conveniente es el Análisis de la Varianza.
B) No se cumple (A)
Tres opciones:
1) Transformar los datos para llegar a (A)
2) Si no se está lejos de (A), Análisis de la Varianza (es una prueba muy robusta)
3) Prueba no paramétrica de Kruskal-Wallis
J.F. Casanova ANOVA y ANCOVA 5
Análisis de la Varianza de 1 Factor
Comparación de más de 2 Varianzas
Pruebas utilizadas:
Prueba de Bartlett (conveniente para distribuciones Normales)
Prueba de Levene (conveniente para distribuciones No Normales)
J.F. Casanova ANOVA y ANCOVA 6
Análisis de la Varianza de 1 Factor
Planteamiento
Medir: el efecto estudiado (efecto factorial) mediante las desviaciones de las medias de cada muestra respecto a la media global.
Medir: el efecto residual (resto de efectos) mediante las desviaciones de los datos de cada muestra respecto a la media de esa muestra.
Comparar: Efecto factorial demasiado superior al residual como para explicarlo por el “azar” No todas las medias son iguales.
ANOVA y ANCOVA 2
J.F. Casanova ANOVA y ANCOVA 7
Análisis de la Varianza de 1 Factor
Efectos
x
x1
x2
x3
Residual
J.F. Casanova ANOVA y ANCOVA 8
Análisis de la Varianza de 1 Factor
Varianza Factorial:
1k
xxnV
2
ii
F
Procedimiento
•Numerador: “Dispersión Factorial”, DF
•Denominador: “Grados de Libertad Factoriales”, F
J.F. Casanova ANOVA y ANCOVA 9
Análisis de la Varianza de 1 Factor
Varianza Residual:
Procedimiento
•Numerador: “Dispersión Residual”, DR
•Denominador: “Grados de Libertad Residuales”, R
kn
xxV
2
ii
R
J.F. Casanova ANOVA y ANCOVA 10
Análisis de la Varianza de 1 Factor
Estadístico de Contraste:
Distribución para H0
(todas las medias grupales iguales):
F de Snedecor con 1 = F y 2 = R
• Si FEXP supera el valor teórico se rechaza H0
R
FEXP
V
VF
J.F. Casanova ANOVA y ANCOVA 11
Análisis de la Varianza: Terminología
“Análisis” = “Descomposición”
Puede demostrarse que la “Dispersión Total”
2
iT xxD
coincide con la suma de las Dispersiones Factorial y Residual.
Acrónimo: ANOVA (ANalysis Of VAriance)
J.F. Casanova ANOVA y ANCOVA 12
Comparaciones Múltiples
Situación
ANOVA estadísticamente significativo:Alguna media grupal es diferente
Para detectarla, se comparan las medias 2 a 2
No se usa directamente la t de Student: La probabilidad de encontrar alguna diferencia significativa por error se iría acumulando
Varias Soluciones
Una simple: Bonferroni
Una típica: Newman-Keuls
ANOVA y ANCOVA 3
J.F. Casanova ANOVA y ANCOVA 13
Método de Bonferroni
Como el error iría aproximadamente sumándose, se corrige este efecto
usando la t de Student
pero a un nivel de error / C, donde C es el número de comparaciones
INCONVENIENTE: Al aumentar el número de grupos, C crece mucho y baja la potencia.
J.F. Casanova ANOVA y ANCOVA 14
Método de Newman-Keuls
A) ORDEN DE LAS COMPARACIONES
1) Se numeran todas las medias de menor a mayor:
2) Se comparan las dos extremas:
3) Si es significativa, se toman dos grupos de k-1medias: y
4) Se comparan en cada grupo las dos extremas y, si son significativas, nuevamente se forman dos grupos, de k-2 medias
k1 x,...,x
k1 xconx
1k1 x,...,x k2 x,...,x
J.F. Casanova ANOVA y ANCOVA 15
Método de Newman-Keuls
A) ORDEN DE LAS COMPARACIONES
5) Se continúa el proceso hasta que llegamos a 2muestras o cuando alguna comparación resulta no significativa. En este caso, se declaran homogéneas todas las medias del grupo.
J.F. Casanova ANOVA y ANCOVA 16
Método de Newman-Keuls
NOTA:
Pueden darse “PARADOJAS”, como:
21 xaogéneahomx
32 xaogéneahomx31 xadiferentex>
EXPLICACIÓN: “Homogénea” no quiere
decir “igual”, sino que “no se ha demostrado
con suficiente probabilidad la diferencia.
J.F. Casanova ANOVA y ANCOVA 17
Método de Newman-Keuls
B) PROCEDIMIENTO DE CADA COMPARACIÓN
El estadístico de contraste es:
siendo:
ij
ji
ijs
xxq
ji
Rij
n
1
n
1
2
Vs
* Bajo la H0 ( ) sigue la distribución de Newman-
Keuls, que depende de R y de R, el “Rango” (número de
medias que hay en el grupo que se compara).
ji xx
J.F. Casanova ANOVA y ANCOVA 18
Tamaño del Efecto
No solo interesa saber si existe o no relación entre
el factor y la respuesta, sino también cuál es su
intensidad. Es decir, el “TAMAÑO DEL EFECTO”.
Uno de los índices para evaluarlo en ANOVA es
𝜂2 =𝐷𝐹𝐷𝑇
= 𝑅2
Representa la proporción de la variabilidad de la
respuesta atribuible a su relación con el factor.
ANOVA y ANCOVA 4
J.F. Casanova ANOVA y ANCOVA 19
Tamaño del Efecto
Es equivalente al Coeficiente de Determinación,
R2, en los modelos de regresión.
Este índice evalúa correctamente dicha proporción
de variabilidad en la muestra, pero resulta sesgado
para estimarla en la población.
Para corregir ese inconveniente, puede sustituirse
por este otro:
𝜔2 =𝐷𝐹 − (𝑘 − 1)𝑉𝑅
𝐷𝑇 + 𝑉𝑅
J.F. Casanova ANOVA y ANCOVA 20
Análisis de la Varianza de 1 Factor.
Muestras relacionadasPruebas utilizadas
A) Poblaciones Normales y Varianzas Homogéneas
La más conveniente es el Análisis de la Varianza.
B) No se cumple (A)
Tres opciones:
1) Transformar los datos para llegar a (A)
2) Si no se está lejos de (A), Análisis de la Varianza (es una prueba muy robusta)
3) Prueba no paramétrica de Friedman
J.F. Casanova ANOVA y ANCOVA 21
Ejemplo
Tenemos el mismo grupo de individuos en k situaciones distintas y queremos comparar los resultados en esas situaciones
* También llamado ANOVA con MEDIDAS REPETIDAS
Análisis de la Varianza de 1 Factor.
Muestras relacionadas
J.F. Casanova ANOVA y ANCOVA 22
Planteamiento
Tenemos n individuos y k valores distintos del factor cualitativo
Queremos estudiar la relación del factor cualitativo F con una variable cuantitativa X.
Al utilizar los mismos individuos en todas las mediciones, se elimina la influencia de la variable individuo (I) en X.
Suponemos que la influencia de F en X no depende del individuo (No hay “interacción).
Análisis de la Varianza de 1 Factor.
Muestras relacionadas
J.F. Casanova ANOVA y ANCOVA 23
Análisis de la Varianza de 1 Factor.
Muestras relacionadas
Descomposición de la Varianza
En el ANOVA simple se hacía la descomposición:
Dispersión: DT = DF + DR
Grados de Libertad: T = F + R
En el ANOVA de Muestras relacionadas:
Dispersión: DT = DF + DI + DR
Grados de Libertad: T = F + I + R
J.F. Casanova ANOVA y ANCOVA 24
Análisis de la Varianza de 1 Factor.
Muestras relacionadas
Efecto de desglosar la dispersión entre individuos (DI ):
Se reduce la dispersión residual (DR ), aumentando la potencia de la prueba.
Procedimiento de Análisis:
Análogo al ANOVA simple.
ANOVA y ANCOVA 5
J.F. Casanova ANOVA y ANCOVA 25
Análisis de la Varianza de 2 Factores
Objetivos
Estudiar la relación de cada una de dos
variables cualitativas (factores) con una
variable cuantitativa.
Estudiar la interacción entre ellas.
J.F. Casanova ANOVA y ANCOVA 26
Análisis de la Varianza de 2 Factores
Condiciones de Aplicación
Poblaciones normales y varianzas
homogéneas
(como todo ANOVA)
Para fácil interpretación número de
casos igual en cada combinación de factores
(o proporcional a los totales parciales)
Ejemplo
valores medios de glucosa
n = 6 datos / casilla
K = KA KB N = K n
MEDIOS DE CULTIVO
MEDIO1 MEDIO2 MEDIO3
CORTO 34 38 36
TIEMPO MEDIO 22 20 24
ALTO 14 8 12
J.F. Casanova ANOVA y ANCOVA 28
Análisis de la Varianza de 2 Factores
Descomposición de la Varianza
Efectos: T: Total
A: Factor Tiempo
B: Factor Medio
I: Interacción
R: Residual
DT = DA + DB + DI + DR
J.F. Casanova ANOVA y ANCOVA 29
Análisis de la Varianza de 2 Factores
Procedimiento
R
AA
V
VF ≶ F (KA -1, N-K) ⇘ = F (2, 45)
[COMO ANOVA 1 FACTOR]
R
BB
V
VF ≶ F (KB -1, N-K) ⇗ = F (2, 45)
R
II
V
VF ≶ F ((KA -1)(KB -1), N-K) = F (4, 45)
EN EL EJEMPLO
J.F. Casanova ANOVA y ANCOVA 30
Análisis de la Varianza de 2 Factores
Comparaciones Múltiples
Sí interacción
ANOVA 1 factor dentro de cada una de las categorías del otro
Comparar todas las combinaciones de factores entre sí.
No interacción
Comparar por separado las categorías de cada factor significativamente relacionado con la respuesta.
ANOVA y ANCOVA 6
J.F. Casanova ANOVA y ANCOVA 31
Análisis de la Covarianza (ANCOVA)
Objetivos
Estudiar la relación de una variable cualitativa (factor) con una variable cuantitativa.
Eliminando la influencia de una tercera variable (cuantitativa)
(llamada covariable)
J.F. Casanova ANOVA y ANCOVA 32
Condiciones de Aplicación
Los habituales del ANOVA
Existe relación lineal entre la variable respuesta y
la covariable
Para fácil interpretación
La pendiente de la relación es similar para
los distintos valores del factor cualitativo
(No hay interacción entre factor y covariable)
Análisis de la Covarianza (ANCOVA)
Ejemplo
dRC,AJ
T1
T2RCT1
RCT2
EDAD
RC
1T2T CRCR
·Podemos estudiar la relación entre el Tratamiento y la Reducción de
Concentración sin que afecte la Edad
(Como si la edad fuera la misma para ambos grupos)
·La diferencia ajustada dRC,AJ no coincide con la directa,
J.F. Casanova ANOVA y ANCOVA 34
Procedimiento
Análogo al ANOVA, sustituyendo las
dispersiones y grados de libertad directos
por los ajustados.
También en las comparaciones múltiples se
sustituye por los valores ajustados.
Medias ajustadas:
donde b es la pendiente de y = a + bx
Análisis de la Covarianza (ANCOVA)
ii xby
J.F. Casanova ANOVA y ANCOVA 35
Análisis con más de 2 Factores
Es posible cualquier número de
factores y covariables
Puede aparecer interacción de 2º orden:
La interacción entre 2 factores depende
del valor de un tercer factor.
Las interacciones de orden superior
suelen subsumirse en el efecto residual.