11. mi ii sesión 11, 2008 met.investigacion

70
Metodología Metodología de la Investigación II de la Investigación II Domingo A. Lancellotti Domingo A. Lancellotti Facultad de Medicina Facultad de Medicina Universidad Católica del Universidad Católica del Norte Norte Coquimbo, 2008 Coquimbo, 2008

Transcript of 11. mi ii sesión 11, 2008 met.investigacion

Page 1: 11. mi ii sesión 11, 2008 met.investigacion

Metodología Metodología de la Investigación IIde la Investigación II

Domingo A. LancellottiDomingo A. Lancellotti

Facultad de MedicinaFacultad de MedicinaUniversidad Católica del NorteUniversidad Católica del Norte

Coquimbo, 2008Coquimbo, 2008

Page 2: 11. mi ii sesión 11, 2008 met.investigacion

Prueba de Significancia para el Coeficiente de Regresión

para = 0

(prueba t de Student)

st

b

b

Page 3: 11. mi ii sesión 11, 2008 met.investigacion

siendo

el error estándar del coeficiente de regresión

nX

X ii

XYSSb

22

2

·

Page 4: 11. mi ii sesión 11, 2008 met.investigacion

la varianza de los residuos …

donde

2

2

2

2

2

2

·2

nn

nn X

X

YXYX

YY

i

i

XY

i

iiii

i

S

Page 5: 11. mi ii sesión 11, 2008 met.investigacion

... y

son los grados de libertad (n = número de pares de datos)

= n - 2

Page 6: 11. mi ii sesión 11, 2008 met.investigacion

iv) calcular la probabilidad de |t |

Procedimiento:

i) H0: HA: (prueba de 2-cola)

ii) nivel de significancia, = 0,05

iii) valor crítico para :

= n - 2 |t0,05(2),| =

Page 7: 11. mi ii sesión 11, 2008 met.investigacion

Prueba de Significancia para el Coeficiente de Correlación

para = 0

(prueba t de Student)

srrt

Page 8: 11. mi ii sesión 11, 2008 met.investigacion

siendo

el error estándar del coeficiente de correlación

2

21

nr

rS

Page 9: 11. mi ii sesión 11, 2008 met.investigacion

... y

son los grados de libertad (n = número de pares de datos)

= n - 2

Page 10: 11. mi ii sesión 11, 2008 met.investigacion

iv) calcular la probabilidad de |t |

Procedimiento:

i) H0: HA: (prueba de 2-cola)

ii) nivel de significancia, = 0,05

iii) valor crítico para :

= n - 2 |t0,05(2),| =

Page 11: 11. mi ii sesión 11, 2008 met.investigacion
Page 12: 11. mi ii sesión 11, 2008 met.investigacion

Pruebas para Datos Agrupados en

Unidades Discretas

– categorías -

Page 13: 11. mi ii sesión 11, 2008 met.investigacion

Pruebas parala Bondad de

Ajuste Propósito :

establece si la población conforma una distribución

teórica específica

Page 14: 11. mi ii sesión 11, 2008 met.investigacion

Proporción de pacientes por grupo de riesgo con diagnóstico positivo

0

0,2

0,4

0,6

0,8

1

G1 G2 G3

Grupos de Riesgo

Pro

babi

lidad

de

Con

trae

r C

ánce

r

Page 15: 11. mi ii sesión 11, 2008 met.investigacion

fobsi frecuencia observada en la categoría ifespi frecuencia esperada en la categoría ik número de categorías

k

i iesp

iespiobs

fff

1

22

Prueba del X2 (chi-cuadrado)

Page 16: 11. mi ii sesión 11, 2008 met.investigacion

el valor de fespi es calculado multiplicando el número total de observaciones, n, por la proporción que la hipótesis nula predice para la respectiva categoría i

el valor crítico de la prueba es X 2,

donde = k -1

Prueba del X2 (chi-cuadrado)

Page 17: 11. mi ii sesión 11, 2008 met.investigacion

Prueba del X2 (chi-cuadrado)

Page 18: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.1

Para tres grupos de pacientes con riesgo diferencial de contraer cáncer a la próstata (diferentes edades), se quiere establecer si dicho riesgo experimenta un aumento progresivo en relación al aumento de la edad.

Esto es, 1:2:4.

Page 19: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.1

Desde un registro regional de cáncer, fueron elegidos al azar 42 fichas de pacientes cuyas biopsias a la próstata indicaban presencia de células malignas (cáncer). Los pacientes fueron agrupados en los siguientes rangos de edades: (G1) de 40-49 años, (G2) de 55-64 años y (G3) de 70-79 años.

G1 G2 G3 n

fobsi 4 11 27 42

Page 20: 11. mi ii sesión 11, 2008 met.investigacion

Procedimiento:

i) H0: la muestra de pacientes viene de una población con una razón de riesgo 1:2:4 para los grupos

de edades G1:G2:G3

HA: la muestra de pacientes NO viene de una población con una razón de riesgo 1:2:4 para los grupos de edades G1:G2:G3

Caso 6.1

Page 21: 11. mi ii sesión 11, 2008 met.investigacion

iv) cálculo de la probabilidad de X 2

ii) nivel de significancia, = 0,05

iii) valor crítico para :

X 2,

X 20,05;2 = 5,991

Procedimiento:

Caso 6.1

Page 22: 11. mi ii sesión 11, 2008 met.investigacion

Número de pacientes por grupo de riesgo con diagnóstico positivo y frecuencia esperada

G1 G2 G3 n

fobsi 4 11 27 42

fespi

(1) (2) (4)

Caso 6.1

Page 23: 11. mi ii sesión 11, 2008 met.investigacion

Número de pacientes por grupo de riesgo con diagnóstico positivo y frecuencia esperada

G1 G2 G3 n

fobsi 4 11 27 42

fespi

(1/7) (2/7) (4/7)

Caso 6.1

Page 24: 11. mi ii sesión 11, 2008 met.investigacion

Número de pacientes por grupo de riesgo con diagnóstico positivo y frecuencia esperada

G1 G2 G3 n

fobsi 4 11 27 42

fespi

6 12 24 42

Caso 6.1

Page 25: 11. mi ii sesión 11, 2008 met.investigacion

24

2427

12

1211

6

64222

2

375,0083,0667,02

125,12

k

i iesp

iespiobs

fff

1

22

Caso 6.1

Page 26: 11. mi ii sesión 11, 2008 met.investigacion

conclusión:

como X 2calculado X 2

tabulado se acepta H0. Entonces, la muestra de pacientes proviene de una población en que el riego de padecer cáncer a la próstata aumenta en la proporción 1:2:4 para los respectivos grupos de edades.

X 20,05;2 = 5,991

X 2calculado = 1,125

Caso 6.1

Page 27: 11. mi ii sesión 11, 2008 met.investigacion

i) para k = 2, el X 2 requiere el siguiente factor de corrección

(corrección de continuidad de Yates)

k

i iesp

iespiobs

fff

1

22 5,0

restricciones:

Prueba del X2 (chi-cuadrado

Page 28: 11. mi ii sesión 11, 2008 met.investigacion

ii) el X 2 es sensible a valores de fespi menores que 5; de este modo, debe usarse un N suficientemente

grande para asegurar frecuencias esperadas mayores que 5

restricciones:

Prueba del X2 (chi-cuadrado

Page 29: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.2

Se quiere establecer si los bebés varones y mujeres nacidos en el 2005 en el Hospital San Pablo de Coquimbo siguen la proporción 1:1.

Page 30: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.2

Del total de 2308 bebés, el número por sexo fue el siguiente:

Varones Mujeres n

fobsi 1146 1162 2308

Page 31: 11. mi ii sesión 11, 2008 met.investigacion

Procedimiento:

i) H0: el sexo de los niños al nacer sigue la proporción 1:1

HA: el sexo de los niños al nacer NO sigue la proporción 1:1

Caso 6.2

Page 32: 11. mi ii sesión 11, 2008 met.investigacion

iv) cálculo de la probabilidad de X 2

ii) nivel de significancia, = 0,05

iii) valor crítico para :

X 2,

X 20,05;1 = 3,841

Procedimiento:

Caso 6.2

Page 33: 11. mi ii sesión 11, 2008 met.investigacion

Número de recién nacidos según sexo.

Varones Mujeres n

fobsi 1146 1162 2308

fespi

(1) (1)

Caso 6.2

Page 34: 11. mi ii sesión 11, 2008 met.investigacion

Número de recién nacidos según sexo.

Varones Mujeres n

fobsi 1146 1162 2308

fespi

(1/2) (1/2)

Caso 6.2

Page 35: 11. mi ii sesión 11, 2008 met.investigacion

Número de recién nacidos según sexo.

Varones Mujeres n

fobsi 1146 1162 2308

fespi

1154 1154

Caso 6.2

Page 36: 11. mi ii sesión 11, 2008 met.investigacion

1154

5,011541162

1154

5,01154114622

2

049,0049,02

098,02

k

i iesp

iespiobs

fff

1

22 5,0

Caso 6.2

Page 37: 11. mi ii sesión 11, 2008 met.investigacion

conclusión:

como X 2calculado X 2

tabulado se acepta H0. Entonces, el número de bebés varones y mujeres nacidos en el Hospital San Pablo de Coquimbo, año 2005, sigue la proporción 1:1.

X 20,05;1 = 3,841

X 2calculado = 0,098

Caso 6.2

Page 38: 11. mi ii sesión 11, 2008 met.investigacion

Tablas de Contingencia

para datos agrupados en unidades discretas

– categorías -, tomados simultáneamente para dos (ó

más) variables

Page 39: 11. mi ii sesión 11, 2008 met.investigacion

Tablas de Contingencia

Propósito :establecer si las frecuencias

observadas en las categorías de una variable son independientes a las frecuencias observadas en

las categorías de la otra variable (es decir, que las variables no

están relacionadas)

Page 40: 11. mi ii sesión 11, 2008 met.investigacion

prueba del X 2 para tablas de contingencia

Tablas de Contingencia

(considerar el factor de corrección de Yates para k = 2)

c

i

r

j ijesp

ijespijobs

fff

1 1

2

2

Page 41: 11. mi ii sesión 11, 2008 met.investigacion

Ri n total de observaciones en la filai

Cj n total de observaciones en la columnaj

n número total de datos

donde la frecuencia esperada - fespij - corresponde a

n

ji CRijespf

Tablas de Contingencia

Page 42: 11. mi ii sesión 11, 2008 met.investigacion

siendo el valor crítico de la prueba X

2, donde

= (r -1)*(c -1)

r = número de filasc = número de categorías

Tablas de Contingencia

Page 43: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.3

Se realizó un estudio para probar la hipótesis que la frecuencia de ocurrencia de los diferentes colores de pelo en hombres y mujeres son independientes.

Negro Café Rubio Rojo

Hombres 32 43 16 9

Mujeres 55 65 64 16

Page 44: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.3

i) H0: El color de pelo en humanos es independiente del sexo

HA: El color de pelo en humanos NO ES independiente del sexo

protocolo de análisis:

Page 45: 11. mi ii sesión 11, 2008 met.investigacion

iv) cálculo de la probabilidad de X 2

ii) nivel de significancia, = 0,05

iii) valor crítico para :

r = número de filas (♂♂ y ♀♀)c = número de categorías (negro, café, rubio y rojo)

X 2,

X 20,05;3 = 7,815

protocolo de análisis:

Caso 6.3

Page 46: 11. mi ii sesión 11, 2008 met.investigacion

Frecuencia observada del color de pelo para hombres y mujeres

Color de Pelo

Negro Café Rubio Rojo total

Hombres 32 43 16 9 100

Mujeres 55 65 64 16 200

Total 87 108 80 25 300

Sexo

Caso 6.3

Page 47: 11. mi ii sesión 11, 2008 met.investigacion

Ri n total de observaciones en la filai

Cj n total de observaciones en la columnaj

n número total de datos

cálculo de fespij

n

ji CRijespf

Caso 6.3

Page 48: 11. mi ii sesión 11, 2008 met.investigacion

Color de Pelo

Negro Café Rubio Rojo total

Hombres 87*100 108*100 80*100 25*100 100

Mujeres 87*200 108*200 80*200 25*200 200

Total 87 108 80 25 300

Cálculos de las frecuencias esperadas - fespij - para los colores de pelo

Sexo

300 300 300 300

300 300 300 300

Caso 6.3

Page 49: 11. mi ii sesión 11, 2008 met.investigacion

Color de Pelo

Negro Café Rubio Rojo total

Hombres 29 36 26,67 8,33

Mujeres 58 72 53,33 16,67

Total

Frecuencias esperadas - fespij – para los colores de pelo

Sexo

Caso 6.3

Page 50: 11. mi ii sesión 11, 2008 met.investigacion

33,8

33,89

67,26

67,2616

36

3643

29

29322222

2

67,16

67,1616

33,53

33,5364

72

7265

58

58552222

Caso 6.3

Page 51: 11. mi ii sesión 11, 2008 met.investigacion

0533,02667,43611,13103,020267,01333,26806,01552,0

987,82

Caso 6.3

Page 52: 11. mi ii sesión 11, 2008 met.investigacion

conclusión:

como X 2calculado X 2

tabulado se rechaza la H0 de independencia. Entonces, las proporciones del color de pelo no es la misma para ambos sexos (al menos en la población muestreada)

X 20,05;3 = 7,815

X 2calculado = 8,987

Caso 6.3

Page 53: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.4

Se quiere estudiar la posible asociación entre el hecho que una gestante fume durante el embarazo y que el bebé presente bajo peso al nacer. Esto es, probar si la probabilidad de tener bajo peso al nacer es diferente en gestantes que fuman vs. en gestantes que no fuman.

Page 54: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.4

Para responder a esta pregunta se realizó un estudio de seguimiento sobre una cohorte de 2000 gestantes, a las que se les preguntó sobre su hábito de fumar durante la gestación. Una vez que dieron a luz se determinó el peso del recién nacido.

Page 55: 11. mi ii sesión 11, 2008 met.investigacion

i) H0: Las variables son independientes, o sea, el bajo peso del recién nacido y el hecho de fumar durante la gestación no están asociados.

HA: Las variables NO son independientes, es decir, el bajo peso y el fumar durante la gestación están asociados.

Procedimiento:

Caso 6.4

Page 56: 11. mi ii sesión 11, 2008 met.investigacion

iv) cálculo de la probabilidad de X 2

ii) nivel de significancia, = 0,05

iii) valor crítico para :r = número de filas – Fumar durante el embarazo (SI y NO)c = número de categorías – Bajo Peso (SI y NO)

X 2,

X 20,05;1 = 3,841

Procedimiento :

Caso 6.4

Page 57: 11. mi ii sesión 11, 2008 met.investigacion

Resultados del estudio de seguimiento de 2000 gestantes

Bajo Peso RN

SI NO total

SI 43 207 250

NO 105 1645 1750

total 148 1852 2000

Fumadora

Caso 6.4

Page 58: 11. mi ii sesión 11, 2008 met.investigacion

Ri n total de observaciones en la filai

Cj n total de observaciones en la columnaj

n número total de datos

cálculo de fespij

n

ji CRijespf

Caso 6.4

Page 59: 11. mi ii sesión 11, 2008 met.investigacion

Frecuencias esperadas - fespij - para el Bajo Peso de RN y Gestante Fumadora:

Bajo Peso RN

SI NO total

SI 18,5 231,5

NO 129,5 1620,5

total

Fumadora

Caso 6.4

Page 60: 11. mi ii sesión 11, 2008 met.investigacion

355,0448,4488,2135,312

427,382

5,231

5,05,231207

5,18

5,05,184322

2

5,1620

5,05,16201645

5,129

5,05,12910522

Caso 6.4

Page 61: 11. mi ii sesión 11, 2008 met.investigacion

conclusión:

como X 2calculado X 2

tabulado se rechaza la H0 de independencia. Entonces, el bajo peso al nacer y el hábito de fumar durante la gestación están asociados

X 20,05;1 = 3,841

X 2calculado = 38,427

Caso 6.4

Page 62: 11. mi ii sesión 11, 2008 met.investigacion

Caso 6.5

En relación al riesgo de contraer cáncer a la próstata, se quiere establecer si con dos métodos independientes de examen se llega a la misma conclusión.

Del grupo de pacientes con mayor riesgo, estos es, el grupo G3 de 70-79 años (ver Caso 6.1), fueron elegidos al azar 301 pacientes. Cada individuo fue examinado mediante palpación rectal (DRE) y biopsia (BIOP).

Page 63: 11. mi ii sesión 11, 2008 met.investigacion

i) H0: los resultado de los exámenes DRE y BIOP son independientes

HA: los resultado de los exámenes DRE y BIOP NO son independientes

El que sean independientes (es decir, las variables no están relacionadas) significa que el resultado de un examen no nos dice nada sobre el resultado del otro examen ... en nuestro caso, el DRE no nos dice nada sobre el cáncer.

Procedimiento:

Caso 6.5

Page 64: 11. mi ii sesión 11, 2008 met.investigacion

iv) cálculo de la probabilidad de X 2

ii) nivel de significancia, = 0,05

iii) valor crítico para :r = número de filas - Presencia del cáncer (SI/NO)c = número de categorías – Resultado del examen (SI/NO)

X 2,

X 20,05;1 = 3,841

Procedimiento :

Caso 6.5

Page 65: 11. mi ii sesión 11, 2008 met.investigacion

Resultados de la Biopsia y del examen DRE, obtenidos simultáneamente

DRE

+ - total

+ 68 27 95

- 117 89 206

total 185 116 301

BIOP

Caso 6.5

Page 66: 11. mi ii sesión 11, 2008 met.investigacion

Ri n total de observaciones en la filai

Cj n total de observaciones en la columnaj

n número total de datos

cálculo de fespij

n

ji CRijespf

Caso 6.5

Page 67: 11. mi ii sesión 11, 2008 met.investigacion

DRE

+ - total

+ 185*95 116*95 95

301 301

- 185*206 116*206 206

301 301

total 185 116 301

Cálculos de las frecuencias esperadas - fespij - para la Biopsia y examen DRE

BIOP

Caso 6.5

Page 68: 11. mi ii sesión 11, 2008 met.investigacion

Frecuencias esperadas - fespij - para la Biopsia y examen DRE

DRE

+ - total

+ 58,4 36,6

- 126,6 79,4

total

BIOP

Caso 6.5

Page 69: 11. mi ii sesión 11, 2008 met.investigacion

043,1654,0263,2418,12

378,52

6,36

5,06,3627

4,58

5,04,586822

2

4,79

5,04,7989

6,126

5,06,12611722

Caso 6.5

Page 70: 11. mi ii sesión 11, 2008 met.investigacion

conclusión:

como X 2calculado X 2

tabulado se rechaza la H0 de independencia. Entonces, el resultado del examen DRE nos da alguna información acerca de la presencia del cáncer de próstata (están de algún modo relacionados)

X 20,05;1 = 3,841

X 2calculado = 5,378

Caso 6.5