8. mi ii sesión 8, 2008 met.investigacion

60
Metodología Metodología de la Investigación II de la Investigación II Domingo A. Lancellotti Domingo A. Lancellotti Facultad de Medicina Facultad de Medicina Universidad Católica del Universidad Católica del Norte Norte Coquimbo, 2008 Coquimbo, 2008

Transcript of 8. mi ii sesión 8, 2008 met.investigacion

Metodología Metodología de la Investigación IIde la Investigación II

Domingo A. LancellottiDomingo A. Lancellotti

Facultad de MedicinaFacultad de MedicinaUniversidad Católica del NorteUniversidad Católica del Norte

Coquimbo, 2008Coquimbo, 2008

Hipótesis de Múltiples Muestras

Análisis de la Varianza de 1 factor (ANDEVA - ANOVA)

(distribución F)

2

2

gruposdentro

gruposentre

ss

F

donde

es la varianza común para todos los k grupos (poblaciones) y es referida como Error, MS del error o MS dentro-grupos (cuadrados medios dentro grupos) (… varianza común)

k

ksssssss gruposdentro

...21

21 ...2

Hipótesis de Múltiples Muestras

Hipótesis de Múltiples Muestras

Aquí

la suma de los cuadrados,

con = n - 1

grados de libertad …

2 xxSS

... y

término definido como la cantidad de variación entre los k grupos (poblaciones) y es referido como MS entre-grupos (cuadrados medios entre grupos)

1

22

k

xxs iingruposentre

Hipótesis de Múltiples Muestras

Es importante entender que ambas “cantidad de variación” (MS del Error y MS entre-grupos) forman parte de una gran variabilidad debido al conjunto total de datos

Hipótesis de Múltiples Muestras

esto es,

referido como la suma de cuadrados total, a la que se le asocia

= n1 + n2 + ... nk – 1 = N - 1

grados de libertad (DF)

k

i

n

jijtotal

i xxss1 1

2

Hipótesis de Múltiples Muestras

cuadro resumen y fórmulas de cálculos análogas, ANOVA 1-factor

k

i

n

jij

i

Cx1 1

2

k

i i

n

jij

Cn

i x

1

2

1

NC

ijx 2)(

MS grupos

MS error

Entregrupos

error SS total - SS grupos

total

donde

k - 1

N - k

N - 1

SS grupos

DF gruposSS errorDF

error

Fuente devariación

SS DF MS F

En un estudio de control de parásitos, se les inyectó a ratas de diferentes camadas 500 larvas del gusano parásito Nippostrongylus muris. 10 días después, las ratas fueron sacrificadas y se les contó el número de parásitos adultos.

Se quiere establecer si existen diferencias en la resistencia a la infestación de parásitos entre camadas de ratas:

k = 4 camadasni = 5 ratas ·camada-1

Caso 4.1:Caso 4.1:

número de parásitos adultos · rata-1

c1 c2 c3 c4

179 378 272 381

138 375 235 346

134 412 235 340

198 365 282 421

103 286 250 368

Caso 4.1:Caso 4.1:

iv) cálculo de la probabilidad de F

Protocolo de análisis:i) H0:

HA: la resistencia a la infestación difiere entre camadas

(siempre prueba de 1-cola)

ii) nivel de significancia, = 0,05

iii) valor crítico para : numerador = k - 1 = 4 - 1 = 3denominador = N - k = 20 - 4 = 16

F0,05(1); 3; 16 = 3,24

Caso 4.1:Caso 4.1:

Caso 4.1:Caso 4.1:

número de parásitos adultos · rata-1

c1 c2 c3 c4

x 752 1.816 1.274 1.856

x2 118.854 668.274 326.458 693.142

n 5 5 5 5

N 20

Caso 4.1:Caso 4.1:

Fuente devariación

SS DF MS F

k

i

n

jij

i

Cx1 1

2

k

i i

n

jij

Cn

i x

1

2

1

NC

ijx 2)(

Entregrupos

error SS total - SS grupos

total

donde

Caso 4.1:Caso 4.1:

Entregrupos

error

total

donde

162.874,2

183.367,8

Caso 4.1:Caso 4.1:Fuente devariación

SS DF MS F

C = 1.623.360,2

20.493,6

Entregrupos

error 20.493,6

total

162.874,2

183.367,8

MS grupos

MS error

k - 1

N - k

N - 1

SS grupos

DF gruposSS errorDF

error

Caso 4.1:Caso 4.1:Fuente devariación

SS DF MS F

donde C = 1.623.360,2

Entregrupos

error 20.493,6

total

162.874,2

183.367,8

3 54.291,40 42,387

16 1.280,85

19

Caso 4.1:Caso 4.1:Fuente devariación

SS DF MS F

donde C = 1.623.360,2

conclusión:

como Fcalculado Ftabulado entonces, existen diferencias, estadísticamente significativas, en la resistencia a la infestación del parásito Nippostrongylus muris entre las camadas de ratas.

F0,05(1),(3),(16) = 3,24

Fcalculado = 42,387

Caso 4.1:Caso 4.1:

Sin embargo, el rechazo de H0 no implica que las medias de los k grupos sean todas distintas entre sí.

25 125 225 325 425 525

parásitos ∙ adulto -1

= 254,8 s 3 = 21,46

3x = 371,2

s 4 = 32,38

4x

= 150,4 s 1 = 39,92

1x = 363,2 s 2 = 46,64

2x

Hipótesisde Múltiples Muestras

PRUEBAS DE COMPARACIONES MÚLTIPLES (pruebas a posteriori)

Hipótesisde Múltiples Muestras

PRUEBAS DE COMPARACIONES MÚLTIPLES

Es realizada cuando el ANOVA indica diferencias estadísticamente significativas entre los grupos

Prueba de TUKEY

considera poner a prueba las hipótesis:

H0: B A vs. HA: B A

donde los subíndices A y B indican cada una de las posibles comparaciones de pares de grupos. El número de comparaciones corresponde a:

2

1

kknescomparacio

dondeSE

BA xxq

nerror MS

SE para k con n iguales

nn BA

error MS 11

2SE para k con n

distintos

Prueba de TUKEY

procedimiento

i) calcular el error estándarii) ordenar las k medias de mayor a menoriii) tabular todas las combinaciones de pares de grupos, de mayor a menor diferenciaiv) calcular qv) valor crítico para qk donde: DF error k número de grupos

Prueba de TUKEY

nerror MS

SE

procedimiento

i) calcular el error estándar

Prueba de TUKEY

procedimiento

i) calcular el error estándar

5

1.280,85SE

01,16SE

Prueba de TUKEY

c4 c2 c3 c1

371,2 363,2 254,8 150,4

Prueba de TUKEYprocedimiento

ii) ordenar las k medias de mayor a menor

procedimiento

iii) tabular todas las combinaciones de pares de grupos, de mayor a menor diferencia

Prueba de TUKEY

2

1

kknescomparacio

procedimiento

iii) tabular todas las combinaciones de pares de grupos, de mayor a menor diferencia

Prueba de TUKEY

2

144 nescomparacio

procedimiento

iii) tabular todas las combinaciones de pares de grupos, de mayor a menor diferencia

Prueba de TUKEY

6nescomparacio

procedimiento

iv) calcular q

Prueba de TUKEY

SEBA xxq

iii) y iv)comparación diferencia SE

q c4 vs. c1 c4 vs. c3 c4 vs. c2 c2 vs. c1 c2 vs. c3 c3 vs. c1

Prueba de TUKEY

iii) y iv)comparación diferencia SE

q 371,2 vs. 150,4 371,2 vs. 254,8 371,2 vs. 363,2 363,2 vs. 150,4 363,2 vs. 254,8 254,8 vs. 150,4

Prueba de TUKEY

comparación diferencia SE q 371,2 vs. 150,4 220,8 16,01 13,79 371,2 vs. 254,8 116,4 16,01 7,27 371,2 vs. 363,2 8,0 16,01 0,50 363,2 vs. 150,4 212,8 16,01 13,29 363,2 vs. 254,8 108,4

16,01 6,77 254,8 vs. 150,4 104,8 16,01 6,55

iii) y iv)comparación diferencia SE

q 371,2 vs. 150,4 371,2 vs. 254,8 371,2 vs. 363,2 363,2 vs. 150,4 363,2 vs. 254,8 254,8 vs. 150,4

Prueba de TUKEY

procedimiento

v) valor crítico para qk donde: 0,05

DF error k número de grupos

q0,05;16;4

Prueba de TUKEY

Prueba de TUKEY

procedimiento

v) valor crítico para qk donde: 0,05

DF error k número de grupos

4,046

Prueba de TUKEY

q0,05;16;4

conclusión

comparación q qtabulado

c4 vs. c1 13,79 4,046 c4 vs. c3 7,27 4,046 c4 vs. c2 0,50

4,046 c2 vs. c1 13,29 4,046 c2 vs. c3 6,77 4,046 c3 vs. c1 6,55 4,046

conclusión final

c4 c2 c3 c1

Prueba de TUKEY

rechazorechazoacepto

rechazorechazorechazo

sxt

m

m

xZ

xZ

sxxtmm 21

21

Algunas Pruebas Paramétricas

SEBA xxq

2

2

gruposdentro

gruposentre

ss

F

supuestos:i) las muestras deben provenir de

poblaciones que posean distribución normal

Estadística Paramétrica (Z, t-student, ANOVA, b & r)

supuestos:ii) las muestras deben ser tomadas al

AZAR y de manera INDEPENDIENTE (la toma de una muestra no debe estar condicionada por la toma de la muestra anterior, ni condicionar la elección de una tercera muestra)

Estadística Paramétrica (Z, t-student, ANOVA, b & r)

supuestos:iii)las varianzas de las muestras

deben ser HOMOGÉNEAS (homoscedasticidad)

Estadística Paramétrica (Z, t-student, ANOVA, b & r)

estrategia de análisis los supuestos i) y ii) debieran ser

considerados durante el diseño del estudio

el supuesto iii) debiera ser establecido después del experimento o toma de datos, pero previo a la prueba estadística

Estadística Paramétrica (Z, t-student, ANOVA, b & r)

Homogeneidad de las Varianzas

prueba de Bartlett

SS ip

k

ii

k

ii vvB 2

11*

2 lnln

donde

k

kp

sssssss

...21

21 ...2

es la varianza común (o MS del error o MS dentro-grupos),

in

j

iiji xxSS1

2

es la suma de los cuadrados,

Prueba de Bartlett

i = ni - 1

los grados de libertad, para cada uno de los k grupos

y

Prueba de Bartlett

La prueba de Bartlett se aproxima a una distribución X 2, aunque esta aproximación es mejor lograda con el siguiente factor de corrección

k

i

k

i

i

i vvkC

1

1

1113

11

Prueba de Bartlett

así, la prueba estadística corregida es:

C

BBC

con k - 1 grados de libertad

Prueba de Bartlett

25 125 225 325 425 525

parásitos ∙ adulto -1

= 254,8 s 3 = 21,46

3x = 371,2

s 4 = 32,38

4x

= 150,4 s 1 = 39,92

1x = 363,2 s 2 = 46,64

2x

Ejemplo

protocolo de análisis:

i) H0:

HA: las varianzas son heterogéneasii) nivel de significancia, = 0,05iii) valor crítico para :

X 2,k-1

X 20,05;3 =

Prueba de Bartlett (para el caso 4.1)

Ejemplo

Prueba de Bartlett (para el caso 4.1)

7,815

iv) cálculo de la probabilidad de BC

Ejemplo

protocolo de análisis:

i) H0:

HA: las varianzas son heterogéneasii) nivel de significancia, = 0,05iii) valor crítico para :

X 2,k-1

X 20,05;3

=

Prueba de Bartlett (para el caso 4.1)

SS ip

k

ii

k

ii vvB 2

11*

2 lnln

Prueba de Bartlett (para el caso 4.1)

Ejemplo

Prueba de Bartlett (para el caso 4.1)

c1 c2 c3 c4

SSi 5.753,2 8.702,8 1.842,8

4.194,8

i 4 4 4 4

Si2 1.438,3 2.175,7 460,7

1.048,7

lnSi2 7,271 7,685 6,137

6,955

ilnSi2 29,085 30,740 24,531

27,821

1/i 0,25 0,25 0,25

0,25

Ejemplo

SS ip

k

ii

k

ii vvB 2

11*

2 lnln

155,72ln S p

161

k

iiv

4444

8,194.48,842.18,702.82,753.52

ps

177,1122

1ln

S i

k

iiv

Prueba de Bartlett (para el caso 4.1)

Ejemplo

177,11216155,7 * B

303,2B

SS ip

k

ii

k

ii vvB 2

11*

2 lnln

Prueba de Bartlett (para el caso 4.1)

Ejemplo

k

i

k

i

i

ivv

Ck

1

1

11

13

11

16

11

143

11C

104,1C

Prueba de Bartlett (para el caso 4.1)

Ejemplo

C

BBC

104,1

303,2BC

086,2BC

Prueba de Bartlett (para el caso 4.1)

Ejemplo

conclusión:

como BCcalculado X2tabulado se acepta H0.

Entonces, las varianzas son homogéneas (homoscedásticas). Por lo tanto, sí procedía el análisis estadístico paramétrico.

X20.05,3 = 7,815

BCcalculado = 2,086

Prueba de Bartlett (para el caso 4.1)

Ejemplo