Post on 09-Apr-2020
Tests estadísticos habituales
Tests estadísticos habituales
Fco. Javier Burguillo
Universidad de Salamanca
Tema 7
Con variable cuantitativa
Tests estadísticos habituales
Antecedentes Bibliográficos
Diseño de experimentos
Obtención datos, calibrados, etc.
Exploración de datos
Análisis : tests estadísticos,
ajuste de curvas , A. multivariante….
Etapas de una investigación
Tests estadísticos habituales
PoblaciónConjunto todos los individuos
MuestraSubconjunto individuos
Inferencia estadística
(Tests estadísticos)
Media (m)
Desviación Estándar (s)
Media
Desviación Estándar (s)
x
Especificar población y muestra
Tests estadísticos habituales
Pasos en tests de contraste de hipótesis
2) Decidir el test a usar:Paramétrico (ej.: test “t” Student)
No Paramétrico (ej.: est U de Mann Whitney)
4) Aplicar el test
3) Fijar la probabilidad de equivocarse al rechazar H0 siendo ésta verdadera:
Riesgo de equivocarse del 5 ó 1 % 0 1.00 5.0 ór i e s g o
)( 21 mm H1= Las 2 medias son diferentes (test bilateral o de 2 colas)
1) Decidir hipótesis nula y alternativa a comparar, por ej. con 2 medias:
)( 21 mm H0= Las 2 medias poblacionales son iguales
(test unilateral ó 1 cola superior))( 21 mm H1= La media 1 es mayor que la 2
)( 21 mm H1= La media 1 es menor que la 2 (test unilateral ó 1 cola inferior)
Tests estadísticos habituales
Tests paramétricos y no paramétricos
“Requisitos” de los tests paramétricos:
La muestra pertenece a una población cuya distribución de probabilidad
es conocida (por ej. distribución normal).
Comparan los grupos a través de un “parámetro” de la distribución
(por ej: la media en la distribución normal).
Se utilizan con muestras no muy pequeñas en las que es posible
comprobar la distribución que siguen los datos.
“Requisitos” de los tests no paramétricos:
No se presupone que los datos sigan una distribución determinada.
Se realizan con procedimientos de ordenación, rangos y recuentos.
Se usan con muestras pequeñas (n < 10) en las que se desconoce la
distribución que siguen los datos.
Tests estadísticos habituales
Tests paramétricos: La
distribución normal
2
22
2
1)( s
m
s
x
exf
Normal:
2
2
2
1)(
z
ezf
Normal estandarizada:
s
m )( i
i
xz
:adosestandariz valores
Tests estadísticos habituales
Exploración de datos Otras distribuciones
Distribución t de Student:1 nlibertad de grados :
s
m )(:
xzvariablela eas
)( ss quecomprueba se
Otras distribuciones: Poisson,
Ji-cuadrado, binomial.
Distribución F de Snedecor :
11 2211
2
2
2
2
2
1
2
1
nn
s
sF" F" variable
s
s
;
:
11 2211 n nlibertad de grados :2
2
2
1 ss onc spoblacione 2Si
ns
xt" t" valores
n
nn
/:
m1
1 n
G.L.numerador G.L.denominador
G.L
Tests estadísticos habituales
Por ejemplo: comparación de 2 medias en
muestras pequeñas por el test “t de student”
Si... Si...
•Se quiere determinar si la presión sistólica en hombres y mujeres de Salamanca es la misma
Distribuciones normales
Misma varianza15.2, 16.3, 17.2, 16.1,...........15.7 14.1, 13.3, 14.2, 13.1,...........12.7
•Se toman 2 muestras al azar de hombres y mujeres de Salamanca:
Hombres Mujeres
Test “t” de datos independientes de tipo bilateral (2 colas)
21 21
2
22
2
11
nnnn
1)s-(n1)s-(n
XXT
11
2
21
Estadístico T
sigue distrib.
“t student”
tTc o l a s ) ) 0 .0 5 ( 2y 2-nc o n ( t a b l a sc
21
n
(Las medias en las poblaciones de
hombres y mujeres son iguales)H0 = No hay diferencia
(p<0.05)
tTc o l a s ) ) 0 .0 5 ( 2y 2-c o n ( t a b l a sc
21
nn
(Las medias en las poblaciones de
hombres y mujeres no son iguales)
H1 = Si hay diferencia
Requisitos
Tests estadísticos habituales
Test t student bilateral (2 colas)
o unilateral (1 cola)
Test bilateral con riesgo = 0.05
Test unilateral cola superior con = 0.05 Test unilateral cola inferior con = 0.05
tc- tc
tc - tc
tTc o l a s0 . 0 5,c 2
tT1 c o l a0 . 0 5,c
tT
c o l a 10 . 0 5,c
Curva distribución valores de “t” )( 21 mm
)( 21 mm
21 21
2
22
2
11
nnnn
1)s-(n1)s-(n
XXT
11
2
21
)( 21 mm
221 nn
221 nn 221 nn
Grados de libertad
Estadístico T
Tests estadísticos habituales
¿Cómo se decide el hacer un test
de 2 colas ó 1 cola?
• Las hipótesis bilaterales o de 2 colas son las más
habituales en investigación.
• Las hipótesis unilaterales o de 1 cola sólo se eligen
cuando hay evidencia empírica de que esa dirección a
contrastar es la única posible:
a) Porque se ha hecho un estudio piloto o está bien
documentado en bibliografía.
b) Porque la dirección contraria es imposible.
c) Se debe tomar la decisión antes de hacer el test.
Tests estadísticos habituales
Tabla de valores “tc” para test bilateral (2 colas) o
unilateral (1 cola) a diferentes riesgos
Riesgo 0.10 0.05 0.025 ------
Valor “ tc ”
(2 colas)1.73 2.10 2.44 ------
Valor “ tc ”
(1 cola)1.33 1.73 2.10 -------
Valores críticos de “t” para grados de libertad 18 ( = 10+10-2 = 18)
2 colas
1 cola
superior
2.10
1.73
Nota: Obsérvese que para el mismo valor de tc (2.10) , el riesgo pasa a ser el doble cuando se cambia de “1cola” a “2 colas” (la
mitad en cada cola).
Tests estadísticos habituales
Clasicamente: tablas de valores “tc” para 2 colas y 1 cola
Actualmente: ordenadores dan el p-valor exacto
2 colas
= 0.05
1 cola
superior
= 0.05
1.73
2.10
Degrees of freedom = n1 +n2-2 = 10 +10 - 2 =18
El doble
para 2 colas
que para 1
cola
Tests estadísticos habituales
• Los datos pueden refutarla
• Es la que se acepta si las pruebas no indican lo contrario
• El riesgo de rechazarla por error tiene graves consecuencias
Riesgos al tomar decisiones
• No debería ser aceptada sin una gran evidencia a favor.
• El riego de rechazarla por error tiene consecuencias consideradas menos graves que la anterior
Basado en: Fco. Javier Barón (U. Málaga)
• H1: Hipótesis alternativa
– Es culpable
• H0: Hipótesis nula
– Es inocente
Tests estadísticos habituales
Los dos riesgos asociados a un test de hipótesis:
Error tipo I (riesgo ) y tipo II (riesgo b)
Acierto
Acierto
Potencia del test = 1-b
Simil: declarar culpable a un
inocente () y viceversa (b).
Realid
ad
Decisión test
H0H0
H0
H0
Imaginemos un test de hipótesis para una media de una población de media m
Se tiene una
media muestral
m0 m1
Región de aceptación H0 Región de rechazo H0
Región de rechazo H1Región de aceptación H1
0.05 tipo Ib 0.20 tipo II
Línea de decisión
(riesgo):
Potencia del
test : 1-b 0.80
Tests estadísticos habituales
1 muestra Kolmogorov-Smirnov (comprobar qué distribución siguen los datos)
Datos independientes
Shapiro-Wilks (probar si los datos siguen la distribución normal)
2 muestras
“t de student” para comparar una media experimental con una media teórica
“t de student” de datos independientes para 2 medias)Paramétrico
Datos apareados
No paramétricoU de Mann Whitney para igualdad de medianas
“t de student” de datos apareados para 2 mediasParamétrico
No paramétrico Wilcoxon de rangos con signos para igualdad de medianas
n muestras
Independientes Test F para probar igualdad de varianzas
Datos independientes
ANOVA de 1 factor + test de TukeyParamétrico
No paramétrico Kruskal –Wallis para 1 factor
ANOVA de medidas repetidas de 1 factorParamétrico
No paramétrico Test de Friedman para “n” medianas
ANOVA de 2 factores factorial
Datos apareados
IndependientesTest de Bartlett o de Levene para probar igualdad de “n” varianzas
Paramétrico
No paramétrico
Kolmogorv-Smirnov 2 muestras (igualdad distribuciones)
Tests habituales con variable cuantitativa
Tests estadísticos habituales
Eligiendo el Test estadístico
•Test “t” de comparación de la media de los datos
(experimental) con una media teórica (Paramétrico)
•Test de Kolmogorov-Smirnov para probar si los datos
siguen una distribución determinada (No Paramétrico)
•Test de Shapiro Wilks para probar si los datos siguen una
distribución normal (No Paramétrico)
¿Qué tests se pueden hacer con 1 muestra?: 15.2, 16.3, 17.2, 16.1,...........15.7
Variables de tipo cuantitativo
Tests estadísticos habituales
Comparación de 1 media experimental con una
media teórica por el test paramétrico t-student
ns
XT
X
0m
•Se dispone de una muestra de 150 sujetos de una población que siguen dieta
mediterránea y tienen una media de colesterol de 221 y una desviación
estándar de 39.6; y se quiere probar que su colesterol a nivel poblacional es
inferior al colesterol medio de la población general que es de 235.
Hy H 0100 mmmm :: Hy H 235235 100 mmm ::
p<0.05
Conclusión: Se rechaza la hipótesis nula con una p < 0.05. La dieta mediterránea
produce en promedio un colesterol inferior a la dieta general con p < 0.05.
En este
ejemplo:3 34
1 5 063 9
2 3 52 2 1.
.
T 1T 1 c o l a0 . 0 51 4 9 , 6 6.
tT1 c o l a0 . 0 5,c
1 n
Si…(Test de 1 cola inferior)
Requisito:
Normalidad
Tests estadísticos habituales
d+
d-
Test no paramétrico de Kolmogorov Smirnov para probar si
unos datos siguen una distribución determinada
¿Siguen una
distribución
normal?
Para probar sólo si unos datos siguen una
distribución normal hay otro test llamado
de Shapiro-Wilks, pero no se debe utilizar
con muestras excesivamente pequeñas o
mayores de 5000.
Distancias entre
cdf exp. y la cdf
teóricaP > 0.05 (2 colas)
Los datos sí que
siguen una
distribución normal
Tests estadísticos habituales
Para probar sólo si unos datos siguen una
distribución normal hay otro test llamado
de Shapiro-Wilks, pero no se debe utilizar
con muestras excesivamente pequeñas o
mayores de 5000.
Test de Shapiro-Wilks
Tests estadísticos habituales
Eligiendo el Test estadístico (cont.)
•Test “t” de comparación de 2 medias con datos independientes
(Paramétrico)
•Test “U” de Mann-Whitney comparación 2 medianas de datos
independientes (No paramétrico)
•Test “t” de comparación de 2 medias con datos apareados (Paramétrico)
•Test de rangos con signo de Wilcoxon para comparación de 2 medianas
en datos apareados ((No paramétrico)
•Test de Bartlett de comparación de 2 varianzas (equivalente a test F)
(Paramétrico)
15.2, 16.3, 17.2, 16.1,...........15.7
14.1, 13.3, 14.2, 13.1,...........12.7
¿Qué tests se pueden hacer con 2 muestras?:
Variables de tipo continuo
Tests estadísticos habituales
Comparación de 2 medias con datos independientes
con el test paramétrico t-student (2 colas)
d i f e r e n c i ah a y n otTS i c o l a s ) ) ( 2 0 . 0 5,(c
21 21
2
22
2
11
nnnn
1)s-(n1)s-(n
XXT
11
2
21
d i f e r e n c i ah a y s i tTS i c o l a s ) ) ( 2 0 . 0 5 ,(c (p<0.05)
Normalidad
Varianzas iguales15.2, 16.3, 17.2, 16.1,...........15.7 14.1, 13.3, 14.2, 13.1,...........12.7
Requisitos
Tests estadísticos habituales
Caso particular: t-student de 2 medias con datos independientes con
varianzas desiguales (corrección de Welch)
Normalidad
Distinta varianza17.1, 16.8, 17.3, 15.1,...........16.7 13.1, 14.3, 13.2, 14.1,...........13.7
TW
(p<0.05)
d i f e r e n c i ah a y n otTS i c o l a s ) ) ( 2 0 . 0 5,(cW
d i f e r e n c i ah a y s i tTS i c o l a s ) ) ( 2 0 . 0 5 ,(cw
Requisitos
Grados de libertad
según Welsch
Tests estadísticos habituales
Ejemplo de t-Student de 2 medias en SIMFIT con
datos independientes asumiendo varianzas
iguales o desiguales (entre corchetes)
[Welsch]
Requisitos
test t student
Normalidad (se podría perdonar)
Varianzas iguales (o desiguales
haciendo Corrección de Welch).
Tests estadísticos habituales
Comparación de 2 medianas con datos independientes
por el test no paramétrico U de Mann-Whitney
No necesaria normalidad ni
varianzas iguales16, 11,14, 21, 18, 34, 22, 7,12,12 12, 14, 11, 30,10, 13
X (tamaño m) Y (tamaño n)
H0 = Las medianas son iguales ; H1= una muestra domina a la otra en distribución
1) Se ordenan conjuntamente todos los valores (x e y) de menor a mayor.
2) Se asigna un nº de orden a cada uno (rango).
3) Se suman los rangos de la muestra x:
4) Se calcula el estadístico U:
5) d i f e r e n c i ah a y n oU cUS i 0 . 0 5 ) ,n,( n 21
d i f e r e n c i ah a y s i U cUS i 0 . 0 5 ) ,n,( n 21 (p<0.05)U
Requisitos ninguno
(Estadístico U)
Tests estadísticos habituales
Ejemplo de: Comparación de 2 medianas con datos
independientes por el test U de Mann-Whitney
Tests estadísticos habituales
Td sigue una distribución t
con n-1 grados de libertad
Td
Comparación de 2 medias con datos
apareados por test t-Student
Normalidad
misma varianza17.1, 16.8, 17.3, 15.1,...........16.7 13.1, 14.3, 13.2, 14.1,...........13.7
x y
estadístico
Requisitos
d i f e r e n c i ah a y n otTS i 0 . 0 5 ),(cd
d i f e r e n c i ah a y s i tTS i 0 . 0 5 ) ,(cd
(p<0.05)1 n
Tests estadísticos habituales
Ejemplo de comparación de 2 medias con
datos apareados por test t-Student
TdTd
)Td)
Tests estadísticos habituales
Test no paramétrico de Wilcoxon de rangos con signo
de datos apareados, para probar si la mediana de las
diferencias es cero.
•Se calcula la diferencia para cada pareja de datos
con sus signos respectivos.
•Se ordenan las diferencias de menor a mayor
(rangos) sin tener en cuenta el signo.
•Se suman todos los rangos con signo negativo (suma1)
y lo mismo con los rangos positivos (suma2)
•La suma más pequeña de las dos es el estadístico W.
•El estadistico W sigue una distribución determinada
“W”, a partir de la cual se calcula el p-valor.
Tests estadísticos habituales
Ejemplo de comparación de 2 medias con datos
apareados por test de Wilcoxon de rangos con signo
Tests estadísticos habituales
Test de Kolmogorov-Smirnov para 2 muestras
Se trata de probar si 2 muestras son comparables o una tiende a ser más
pequeña o más grande que la otra.
Tests estadísticos habituales
Test F para igualdad de 2 varianzas con datos independientes ? (equivalente a test de Bartlett con 2 varianzas y mismo nº datos por muestra)
211
210
ss
ss
:
:
H
H
2
2
2
1
2
2
2
1
ssmín
ssmáxF
,
,exp
iguales varianzasldgglnFFSi c ).,,(exp 050
2
2
2
1 ssmáxden(gln
numerador libertad Grados
,
2
2
2
1 ssmínden(gld
rdenominado libertad Grados
,
distintas varianzasldgglnFFSi c ).,,(exp 050
Tests estadísticos habituales
Ejemplo de test F para igualdad de 2
varianzas con datos independientes
• Un laborator io desea comparar la prec is ión de 2 ba lanzas.
• Real iza 20 pesadas de una c ier ta masa con la ba lanza 1 y
ot ras 15 pesadas con una balanza 2.
• La balanza 1 t iene una desviac ión estándar de 0.009 mg y
la 2 de 0.013 mg.
Comprobar s i ex is te una d i ferencia de prec is ión entre las 2
ba lanzas (d i ferentes var ianzas) .
No hay diferencia
significativa entre las 2
varinzas
Basado en Domenech 1982, Bioestadística, Ed. Herder, pag. 378.
Tests estadísticos habituales
•ANOVA de una vía para comparación de n medias en grupos
independientes (Paramétrico).
•Test de Kruskal-Wallis para comparación de n medias en
grupos independientes (No paramétrico).
•ANOVA de 1 vía con medidas repetidas para comparación de n medias
en grupos apareados (Paramétrico).
•Test de Friedman (ANOVA una vía) para comparación de n medias en
grupos apareados (No paramétrico).
• Test de Barlett o Levene para comparación de n varianzas
¿Qué tests se pueden hacer con n muestras?:
15.2, 16.3, 17.2, 16.1,...........15.7
14.1, 13.3, 14.2, 13.1,...........12.7
11.1, 12.3, 17.2, 16.1,...........19.7
Eligiendo el Test estadístico (cont.)
Tests estadísticos habituales
Comparando “n” medias (ANOVA de 1 factor)
Dieta [colesterol total]
Carbohidratos 115, 130, 20,………..
Grasas 180, 194, 199,……….
Proteinas 125, 136, 134, ………
H0= Las 3 medias son iguales
H1= Al menos 2 medias son distintas
Planteamiento
Razonamiento
H0=Las 3 dietas producen el mismo colesterol,
los datos proceden una misma población con s2
Si H0 fuese verdad, entonces la varianza sb2
estimada a partir de las medias (between
(entre) las dietas) habría de ser
aproximadamente igual a la varianza sw2
estimada a partir de cada una de las dietas
(withing (dentro) de las dietas), ya que
ambas estiman la misma s2 de la población
Luego el cociente entre sb2 y sw
2 debería ser
aproximadamente 1:
12
2
w
b
s
sF
Dieta 1
3Y
2
1s
1Y 2
2s
2
3s
2
xs
Dieta 2
Dieta 3
mezclados
2Y
1Y
2Y3Y
n
n
n
N=3n
Ojo: los datos tienen que
seguir distribución
normal y con la misma
varianza entre grupos
b (between (entre))
w (withing (dentro))
Tests estadísticos habituales
Cálculos y tabla final de un ANOVA de 1 factor
(con J grupos o niveles del factor) (1/3)
El modelo ANOVA de 1 factor se establece con el llamado “modelo lineal general”:
e r r o r c o n t r o l a d oF a c t o r eD e p e n d i e n tV a r i a b l e
i j
F a c t o r
ji j eY mf a c t o r d e l n i v e l e s J l o s d e g l o b a lm e d i a e s m
f a c t o r d e l J n i v e l a l a t r i b u i b l e e f e c t o e l e s j
n i v e l ) s ud em e d i a m e n o s s u j e t oe n n( p u n t u a c i ó Ye ji ji j m
Si sustituimos lo parámetros anteriores por sus estimadores muestrales:
)()( ji jji j YYYYYY )()( ji jji j YYYYYY
Considerando todas las muestras con sumatorios y haciendo el cuadrado:
22 i j
ji jj
i j
i j YYYYY( Y )()()
Tests estadísticos habituales
Cálculos y tabla final de un ANOVA de 1 factor
(con J grupos o niveles del factor) (2/3)
22 i j
ji jj
i j
i j YYYYY( Y )()()
)()(2)()()(Y 22
i j
2ji j
i j
j
i j i j
ji jji j YYYYYYYYY
Es cero
Luego: i j i j
jijjij YYYYY 22
i j
2 )()()(Y
Total SSQ = SSQ (b) (entre grupos) + SSQ (w) (dentro grupos)
Cuadrados
medios (MSQ) :Jn
YY
wM S QJ
YY
bM S Qi j
ji j
i j
j
22
1
)(
)(
)(
)(
Haciendo el cuadrado de la suma:
Tests estadísticos habituales
Cálculos y tabla final de un ANOVA de 1 factor
(con J grupos o niveles del factor) (3/3)
Cuadrados
medios (MSQ):
Jn
YY
wMSQJ
YY
bMSQi j
ji j
i j
j
22 )(
)(1
)(
)(
.)(" j" nivel cada de medias las departir a
lpoblaciona varianzala deestimador un es )(
2
bs
bMSQ
.)( j nivel cada de varianzaslas de media la haciendo
lpoblaciona varianzala deestimador un es )(
2
ws
wMSQ
Se construye ahora el estadístico F como:
)(
)(
wM S Q
bM S QF
Si H0 es cierta F se aproximará a 1 y si H0 es falsa F >1
El estadístico F se distribuye según la distribución F de Snedecor
con grados de libertad (J-1 , N-J), obteniéndose el p-valor
Tests estadísticos habituales
Dieta [colesterol total]
Carbohidratos 115, 130, 20,………..
Grasas 180, 194, 199,……….
Proteinas 125, 136, 134, ………
H0= Las 3 medias son iguales
H1= Al menos 2 medias son distintas
Fuente de variación SSQ NDOF MSQ F p
Entre Grupos 3.898E+04 2 1.949E+04 1.278E+02 0.0000
Dentro grupos 3.203E+03 21 1.525E+02
Total 4.219E+04 23
Ejemplo de ANOVA de 1 factor (1/2)
Luego rechazamos H0 con riesgo p=0.0000 de equivocarnos (las 3
medias no son iguales, hay diferencia significativa entre ellas).
025251
049491
E
EF
.
.
Tests estadísticos habituales
Ejemplo: test de Tukey en ANOVA de 1 factor
Test de Tukey para comparaciones 2 a 2 a posteriori
Test Q de Tukey para 3 medias y 3 comparaciones
Columnas Q p 5% 1%
2 1 2.015E+01 0.0001 * *
2 3 1.895E+01 0.0001 * *
3 1 1.202E+00 0.6768 NS NS
Hay diferencias significativas (p<0.01) entre las medias
2 y 1 y 2 y 3, pero no entre las medias 3 y 1.
Tests estadísticos habituales
Dieta colesterol
Carbohidratos 115, 130, 20,………..
Grasas 180, 194, 199,……….
Proteinas 125, 136, 134, ………
H0= Las 3 medias son iguales
H1= Al menos 2 medias son distintas
Ejemplo de ANOVA no paramétrico de 1 factor por
Kruskal-Wallis (datos independientes)
KW
•Asignar rangos a los datos como
serie única.
•Sumar los rangos de cada muestra
y calcular el estadístico KW:
131
12
1
2
2
nkkRnkkn
KWk
j
j)(
Tests estadísticos habituales
H0= Las 3 medias son iguales
H1= Al menos 2 medias son diferentes
Ejemplo de ANOVA paramétrico de 1 factor
con medidas repetidas (datos apareados)
• Las columnas deben seguir normalidad y tener la misma varianza.
• Pero hay un requerimiento nuevo: homogeneidad de covarianzas,
que se comprueba con el test de esfericidad de Mauchly (existen
correcciones conservadoras a este test debidas a Geisser-Green-
House, Huynh-Feldt y Lower–bound que reducen los grados de
libertad del numerador y denominador del test F del ANOVA)
Tests estadísticos habituales
Requisito Previo:Test de homogeneidad de covarianzas
H0= Las 3 medias son iguales
H1= Al menos 2 medias son diferentes
Ejemplo de ANOVA paramétrico de 1 factor
con medidas repetidas (datos apareados)
Existe homogeneidad
de covarianzas
ANOVA de medidas repetidas
Con homogeneidad
P < 0.05
Tests estadísticos habituales
H0= Las 3 medianas son iguales
H1= Al menos 2 medianas son distintas
Test de Friedman no paramétrico para
medidas repetidas (datos apareados)
• Se asumen k filas y columnas y las puntuaciones de cada columna se
ordenan por rangos rij para la fila i y la columna j.
• Luego se hace la suma de los rangos como:
l
j i ji rt1
• Se calcula el estadistico de Friedman:
• Finalmente se calcula el p-valor en
base a la distribución: 2
1k
l
Estadístico de Friedman
Tests estadísticos habituales Ing. Felipe Llaugel
Comparando medias con más de un factor
(ANOVA de 2 factores o de 2 vías o ANOVA factorial)
Imaginemos un tratamiento para disminuir el colesterol, donde la variable
respuesta que se mide es la concentración de colesterol total en plasma, pero
ahora se quieren estudiar 2 factores: “Dieta” con 2 niveles(carbohidratos,
grasas) y “Ejercicio” con 2 niveles (poco, mucho).
Factor “dieta”
Carbohidratos
Carbohidratos
Carbohidratos
Carbohidratos
Grasas
Grasas
Grasas
Grasas
Factor “ejercicio”
220
190
154
167
188
181
124
154
[Colesterol]
Poco
Poco
Mucho
Mucho
Poco
Poco
Mucho
Mucho
Paciente
1
2
3
4
5
6
7
8
Datos ficticios con fines de ejemplo……etc
Tests estadísticos habituales Ing. Felipe Llaugel
Comparando medias con más de un factor
(ANOVA de 2 factores o ANOVA factorial)
Dieta x ejercicio
EjercicioDieta
En SIMFIT es: Factorial: 0 blocks, 2 factors
Tests estadísticos habituales
Tests de Bartlett para igualdad de n varianzas: (equivalente a test F en el caso de 2 varianzas y mismo nº de datos por muestra)
(Datos siguen una distribución Normal)
(Datos no siguen distribución Normal)
Si las series de datos no siguen
una distribución normal
usualmente se aplica el test de
Levene basado en la mediana
Tests estadísticos habituales
Test de Barlett de igualdad de n varianzas
de muestras con distribución normal
Si hay k grupos, de tamaño de muestra ni , con i= ni−1, y varianza s2i ,
entonces la varianza combinada (pooled) s2p y los parámetros B and C
se calculan así:
El estadísitico de Bartlett :
BC = B/C
sigue una distribución ji-cuadrado
con k−1 grados de libertad, a partir
de la cual se calcula el p-valor.
Tests estadísticos habituales
Ejemplo del test de igualdad de n varianzas
por test de Bartlett
28.2 39.6 46.3 41.0 56.3
33.2 40.8 42.1 44.1 54.1
36.4 37.9 43.5 46.4 59.4
34.6 37.1 48.8 40.2 62.7
29.1 43.6 43.7 38.6 60.0
31.0 42.4 40.1 36.3 57.3
Imaginemos las siguientes 5 series de datos con distribución normal:
Homogeneity of variance test by Bartlett test
Transformation = x (untransformed data)
B = 6.90064E-01
C = 1.08000E+00
B/C = 6.38948E-01
NDOF = 4
P(chi-square >= B/C) = 0.9586
Upper tail 1% point = 1.32767E+01
Upper tail 5% point = 9.48773E+00
P-valor > 0.05, luego
las 5 varianzas son
iguales (se acepta la
hipótesis nula).