mediciones_repetidas

33
etodos de Dise ˜ no y An ´ alisis de Experimentos Patricia Isabel Romero Mares Departamento de Probabilidad y Estad´ ıstica IIMAS UNAM mayo 2013 1 / 33

description

Estadistica

Transcript of mediciones_repetidas

Metodos de Diseno y Analisis deExperimentos

Patricia Isabel Romero Mares

Departamento de Probabilidad y EstadısticaIIMAS UNAM

mayo 2013

1 / 33

Mediciones repetidas

2 / 33

Bibliografıa

Statistical Methods for the Analysis of RepeatedMeasurements.Charles S.Davis. Springer Texts in Statistics. 2002.

Analysis of Repeated Measures.M.J. Crowder y D.J. Hand. Chapman & Hall Monographs onStatistics and Applied Probability 41. 1990.

B.S. Everitt (1995). The Analysis of repeated measures: apractical review with examples. The Statistician. 44, No.1 pp.113-135

Huyn Huyn & Leonard S. feldt (1970). Conditions under whichSquare Ratios in Repeated Measurements Designs have ExactF-Distributions. JASA Vol. 65, No 332

3 / 33

Introduccion

El termino mediciones repetidas se refiere a los datos en loscuales la respuesta en cada unidad experimental o sujeto seobserva en multiples ocasiones o bajo multiples condiciones.

El termino datos longitudinales se utiliza tambien paradescribir datos de mediciones repetidas.

Algunos autores usan este termino cuando se refieren a datosen los que el factor de mediciones repetidas es el tiempo. Bajoeste uso, se pueden ver los datos longitudinales como un casoespecial de las mediciones repetidas.

Otros autores usan el termino datos longitudinales parareferirse a datos medidos a traves de un periodo largo detiempo, mientras que el termino de mediciones repetidas loutilizan en datos medidos en un periodo relativamente corto detiempo, frecuentemente bajo condiciones controladas.

4 / 33

Introduccion

Ventajas.Es el unico tipo de diseno en el que se pueden estudiar lospatrones individuales de cambio.Economiza el numero de ue.Las ue pueden servir como sus propios controles dado que lavariable de respuesta se puede medir bajo las condiciones decontrol y experimental de cada ue.

Desventajas.El analisis de los datos de estudios de mediciones repetidas esmas complicado:

1 Por la dependencia entre las observaciones de la mismaue

2 El investigador, frecuentemente, no puede controlar lascircunstancias para obtener las mediciones, por lo que losdatos pueden ser desbalanceados o parcialmenteincompletos.

5 / 33

Introduccion

A pesar de que se ha estudiado el analisis de datos demediciones repetidas con muchos enfoques, casi todos losestudios se restringen al caso en que la variable de respuestase distribuye normalmente y los datos son balanceados ycompletos.

6 / 33

Estructuras

Mediciones (tiempo)Sujeto 1 2 3 ... k

1 . . . . .2 . . . . .. . . . . .. . . . . .n . . . . .

7 / 33

Estructuras

Mediciones (tiempo)Sujeto Tratamiento 1 2 3 ... k

1 1 . . . . .2 1 . . . . .3 2 . . . . .. . . . . . .. . . . . . .n t . . . . .

8 / 33

EstructurasSujeto Tiempo Respuesta Covariables

1 1 y11 x111 ... x11p. . . ... .

1 j y1j x1j1 ... x1jp. . . ... .

1 t1 y1t1 x1t11 ... x1t1p

i 1 yi1 xi11 ... xi1p. . . ... .

i j yij xij1 ... xijp

. . . ... .i ti yiti xiti1 ... xitip

n 1 yn1 xn11 ... xn1p. . . ... .

n j ynj xnj1 ... xnjp

. . . ... .n tn yntn xntn1 ... xntnp

9 / 33

Modelo ANOVA mediciones repetidas una muestra

Mediciones (tiempo)Sujeto 1 ... j ... t

1 y11 ... y1j ... y1t. . . . . .i yi1 ... yij ... yit. . . . . .n yn1 ... ynj ... ynt

yij = µ +πi + τj + eij

i = 1, . . . ,n j = 1, . . . , t

yij es la respuesta del individuo i en el tiempo jµ es la media generalπi es el efecto aleatorio del sujeto i y es constante para todaslas ocasionesτj es el efecto fijo del tiempo jeij es el componente del error aleatorio especıfico del sujeto ien el tiempo j.

10 / 33

Una muestra

Suposiciones:

Los efectos aleatorios πi son independientes y sedistribuyen N(0,σ2

π ).Los errores aleatorios eij son independientes y sedistribuyen N(0,σ2

e ).πi y eij son independientes.

Las varianzas y covarianzas de las observaciones son:

V(yij) = V(µ +πi + τj + eij) = σ2π +σ

2e

Cov(yij,yi′j) = 0, para i 6= i′

Cov(yij,yij′) = σ2π , para j 6= j′

11 / 33

Una muestra

La matriz de covarianzas del vector yi = (yi1, . . . ,yit)′esta dada

por:

Σ =

σ2π +σ2

e .. σ2π

..σ2

π .. σ2π +σ2

e

= (σ2

π +σ2e )

1 .. ρ

..ρ .. 1

donde

ρ =σ2

π

σ2π +σ2

e= Corr(yij,yij′)

12 / 33

Una muestra

Las observaciones repetidas de un mismo sujeto estancorrelacionadas.

La matriz de covarianzas anterior con elementos en la diagonaliguales y tambien los que estan fuera de la diagonal se diceque tiene simetrıa compuesta.

Esta estructura de covarianzas implica que la correlacion entrecualquier par de observaciones es la misma, sin importar elespaciamiento entre ellas.

Esta suposicion es muy poco realista, especialmente cuandolas mediciones repetidas se hacen a traves del tiempo.

La tabla de ANOVA para este modelo es la misma que para unmodelo mixto con dos factores sin interaccion y unaobservacion por celda.

13 / 33

Una muestraFV gl SC E(CM)

Tiempo t−1 SCT σ2e +nθ 2

τ

Sujetos n−1 SCS σ2e + tσ2

π

Error (n−1)(t−1) SCE σ2e

SCT = nt

∑j=1

(y.j− y..)2

SCS = tn

∑i=1

(yi.− y..)2

SCE =n

∑i=1

t

∑j=1

(yij− yi.− y.j + y..)2

Nota. Es lo mismo que un diseno de bloques donde los sujetos sonlos bloques, solo que no se aleatorizan los tiempos (tratamientos)dentro de bloques. Pero si hay simetrıa compuesta no hay problema.

14 / 33

Una muestra

La simetrıa compuesta es una condicion suficiente para quela estadıstica F, usada para probar la hipotesis nula de nodiferencias entre las observaciones en el tiempo, tenga unadistribucion Ft−1,(n−1)(t−1), mas no es una condicion necesaria.

La simetrıa compuesta es un caso especial de una situacionmas general, la esfericidad, bajo la cual la prueba F es valida.

La condicion de esfericidad se puede expresar de diferentesformas, una de ellas es que las varianzas de todas lasdiferencias entre las variables son iguales, esto es,V(yij− yij′) es constante para toda j, j′.

15 / 33

Una muestra

Un ejemplo de matriz que cumple la condicion de esfericidades:

Σ =

5.0 2.5 5.0 7.52.5 10.0 7.5 10.05.0 7.5 15.0 12.57.5 10.0 12.5 20.0

V(Y1−Y2) = 5+10−2(2.5) = 10

V(Y2−Y3) = 10+15−2(7.5) = 10

V(Y3−Y4) = 15+20−2(12.5) = 10

16 / 33

Una muestra

Una medida del grado en que se aleja de la simetrıacompuesta una matriz, se denota con ε, donde

ε =[traza(C′ΣC)]2

(t−1) [traza(C′ΣC)2]

con C una matriz ortonormal de coeficientes para expresar lanulidad de los efectos de tratamientos.

Se puede demostrar que 1/(t−1)≤ ε ≤ 1.

Cuando ε = 1 se tiene esfericidad. Se hace una correccion alos grados de libertad de la F a:

Fε(t−1),ε(t−1)(n−1)

17 / 33

Una muestra

Greenhouse and Geisser(1959)1 sugieren el siguienteprocedimiento para el uso de ANOVA en mediciones repetidas:

1 Haga una prueba F univariada asumiendo que lassuposiciones del ANOVA para mediciones repetidas sesatisfacen.

2 Si la prueba no es significativa, no rechace H03 Si la prueba es significativa, haga una prueba

conservadora usando ε = 1/(t−1), lo que lleva a ladistribucion F1,n−1

Si la prueba conservadora es significativa, rechace H0Si la prueba conservadora no es significativa, entoncesestime ε y haga una prueba aproximada

1Greenhouse, S.W. and Geisser, S.(1959). On methods in the analysis ofprofile data. Psychometrika, 24:95-112.

18 / 33

Ejemplo una muestra

Los siguientes datos son los pesos de 13 ratones machosmedidos cada 3 dıas desde el nacimiento hasta el destete.

DıaRaton 3 6 9 12 15 18 21

1 0.190 0.388 0.621 0.823 1.078 1.132 1.1912 0.218 0.393 0.568 0.729 0.839 0.852 1.0043 0.211 0.394 0.549 0.700 0.783 0.870 0.9254 0.209 0.419 0.645 0.850 1.001 1.026 1.0695 0.193 0.362 0.520 0.530 0.641 0.640 0.7516 0.201 0.361 0.502 0.530 0.657 0.762 0.8887 0.202 0.370 0.498 0.650 0.795 0.858 0.9108 0.190 0.350 0.510 0.666 0.819 0.879 0.9299 0.219 0.399 0.578 0.699 0.709 0.822 0.95310 0.225 0.400 0.545 0.690 0.796 0.825 0.83611 0.224 0.381 0.577 0.756 0.869 0.929 0.99912 0.187 0.329 0.441 0.525 0.589 0.621 0.79613 0.278 0.471 0.606 0.770 0.888 1.001 1.105

19 / 33

Ejemplo una muestra

Ejercicio 5.3 Davis.

Peso de 13 ratones

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 3 6 9 12 15 18 21

Día

ML

Med

ias

20 / 33

Ejemplo una muestra

Entre sujetos Prueba F < .001

Prueba de EsfericidadCriterio de Mauchly 0.0001189

ChiSquare 88.36df 20

Prob>Chisq 1.432e-10

Prueba Valor F exacta gl num gl den Prob>FF-test 142.685 166.4658 6 7 <0.0001Univar unadj Epsilon2 1 241.6672 6 72 <0.0001Univar G-G Epsilon 0.2387155 241.6672 1.4323 17.188 <0.0001Univar H-F Epsilon 0.2621163 241.6672 1.5727 18.872 <0.0001

2Bloques al azar21 / 33

Tratamientos y mediciones repetidas

Se realizo un experimento para probar tres drogas para elcorazon. De las 24 personas disponibles, se asignaron al azar8 a cada una de las drogas.Se midio el ritmo cardiaco en 4 ocasiones.

DrogaPersona A B C

T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T41 72 86 81 77 85 86 83 80 69 73 72 742 78 83 88 81 82 86 80 84 66 62 67 733 71 82 81 75 71 78 70 75 84 90 88 874 72 83 83 69 83 88 79 81 80 81 77 725 66 79 77 66 86 85 76 76 72 72 69 706 74 83 84 77 85 82 83 80 65 62 65 617 62 73 78 70 79 83 80 81 75 69 69 688 69 75 76 70 83 84 78 81 71 70 65 65

22 / 33

Ejemplo flebitis

Ejemplo 15.1 Kuehl

Se diseno un experimento para explorar los mecanismos parauna deteccion temprana de flebitis durante terapia deAmiodarone.

La flebitis es una inflamacion de las venas que puedepresentarse al administrar medicamentos por vıa intravenosa.

Se administraron tres tratamientos intravenosos a los animalesde prueba: (1) Amiodarone con una solucion vehıculo, (2) solola solucion vehıculo y (3) una solucion salina.

Los conejos usados como animales de prueba se asignaron alazar a los tres tratamientos en un diseno totalmentealeatorizado.

Una aguja insertada en la vena de la oreja del conejo fue elmedio de administracion del tratamiento.

23 / 33

Ejemplo flebitis

Se monitoreo la temperatura de ambas orejas por algunashoras. Un incremento en la temperatura de la oreja tratada eraconsiderado un posible indicador de flebitis.

La diferencia en las temperaturas de las orejas se uso como lavariable de respuesta. Durante el estudio se observaron lastemperaturas de cada conejo cada 30 minutos.

La solucion salina sirvio como tratamiento placebo de controlpara determinar si la sola administracion afectaba lainflamacion. La solucion excipiente sirvio como control paraseparar los efectos del vehıculo de los medicamentos.

24 / 33

Ejemplo flebitis

Tiempo de obs (min)Tratamiento Conejo 0 30 60 90Amiodarone 1 -0.3 -0.2 1.2 3.1

2 -0.5 2.2 3.3 3.73 -1.1 2.4 2.2 2.74 1.0 1.7 2.1 2.55 -0.3 0.8 0.6 0.9

Vehıculo 6 -1.1 -2.2 0.2 0.37 -1.4 -0.2 -0.5 -0.18 -0.1 -0.1 -0.5 -0.39 -0.2 0.1 -0.2 0.4

10 -0.1 -0.2 0.7 -0.3Salina 11 -1.8 0.2 0.1 0.6

12 -0.5 0.0 1.0 0.513 -1.0 -0.3 -2.1 0.614 0.4 0.4 -0.7 -0.315 -0.5 0.9 -0.4 -0.3

25 / 33

Mediciones repetidas glucosa

Efecto de tres alimentos en los niveles de glucosa en humanos.Cada alimento se asigno al azar a cuatro sujetos y se midio laglucosa en suero de cada sujeto a los 15, 30 y 45 min despuesde ingerir el alimento.

dieta sujeto glu15m glu30m glu45m1 1 28 34 321 2 15 29 271 3 12 33 281 4 21 44 392 5 22 18 122 6 23 22 102 7 18 16 92 8 25 24 153 9 31 30 393 10 28 27 363 11 24 26 363 12 21 26 32

26 / 33

Disenos Cruzados

Disenos Cruzados

Design of Experiments: Statistical Principles of ResearchDesign and Analysis. Robert O. Kuehl. Duxbury Press 2000,2a. ed.Design and analysis of cross-over trials. Byron Jones andMichael G. kenward. Chapman and Hall/CRC 2003, 2a. ed.

27 / 33

Introduccion

Los experimentos con disenos cruzados son aquellos en losque todos los tratamientos se administran en secuencia a cadaue.

Cada tratamiento se administra a una ue por un periodo detiempo, despues del cual otro tratamiento se administra a lamisma ue. Los tratamientos son administrados sucesivamentea la ue hasta que haya recibido todos los tratamientos.

Cuando se comparan los tratamientos en la misma ue, lavariacion entre-unidades se elimina del error experimental. Deesta manera la ue se usa como bloque en los disenoscruzados para disminuir el error experimental y aumentar laeficiencia del experimento.

28 / 33

Introduccion

Una desventaja de los disenos cruzados es la posibilidad deque un tratamiento administrado en un periodo influya larespuesta en el siguiente periodo de tratamiento. A estosefectos se les llama efectos acarreados.

Los tratamientos se administran por un periodo de tiempo losuficientemente grande para que se manifieste el efecto deltratamiento en los sujetos. Inmediatamente despues se le quitael tratamiento al sujeto y se le deja descansar por un periodode ”lavado”, antes de administrarle el siguiente tratamiento.Este periodo de ”lavado”se pretende que regrese al sujeto a suestado fisiologico o psicologico original.

29 / 33

Disenos cruzados

En un experimento con diseno cruzado cada unidadexperimental (sujeto) recibe dos o mas tratamientos diferentes.

El orden en el que cada sujeto recibe los tratamientos dependedel diseno particular escogido.

El diseno mas simple es el diseno 2×2 en el que cada sujetorecibe dos tratamientos diferentes, llamemosles A y B. La mitadde los sujetos recibe A primero y, despues de un periodo detiempo adecuado, cruza hacia B.

Los sujetos restantes reciben primero B luego cruzan hacia A.

30 / 33

Disenos cruzados

Diseno 1Secuencia Periodo

1 21 A A2 B B3 A B4 B A

Diseno 2Secuencia Periodo

1 2 31 A B B2 B A A

31 / 33

Disenos cruzados

Diseno 3Secuencia Periodo

1 2 3 41 A A B B2 B B A A3 A B B A4 B A A B

Diseno 4Secuencia Periodo

1 2 3 41 A B B A2 B A A B

32 / 33

Disenos cruzados

Diseno 5Secuencia Periodo

1 2 3 4 51 A B B A A2 B A A B B3 A A B B B4 B B A A A

33 / 33