Intervalos de confianza y pruebas de hipótesis

36
Tema: Intervalos de confianza y contraste de hipótesis Docente: A. Javier Pruñonosa Santana Datos de contacto: E-mail: [email protected]

description

Introducción a estadística inferencial

Transcript of Intervalos de confianza y pruebas de hipótesis

Page 1: Intervalos de confianza y pruebas de hipótesis

Tema: Intervalos de confianza y contraste de hipótesis

Docente: A. Javier Pruñonosa Santana

Datos de contacto: E-mail: [email protected]

Page 2: Intervalos de confianza y pruebas de hipótesis

Estadística inferencial

PoblaciónParámetros (μ, σ, etc)

MuestraEstimadores

(χ, s, etc)

Muestreo aleatorioInferencia

Conduce a 2 tipos de resultados:

-Valores “Valores “pp””

-Intervalos de confianzaIntervalos de confianza

Page 3: Intervalos de confianza y pruebas de hipótesis

Inferencia estadísticaRecordemos que un estimador es una función de los valores de la muestra que se elabora para indagar el valor de un parámetro de la población de la cual procede la muestra.

Los estimadores de la muestra permiten obtener un valor aproximado de alguna característica de la población (parámetro)

2 tipos de estimación:

Estimación puntual

Estimación por intervalo

Proporciona un valor único aproximado del parámetro desconocido, quedando sin especificar que de buena es esta aproximación. Ej: A partir de la muestra se estima que la prevalencia de fumadores en la población es del 20%.

Proporciona un rango de posibles valores, algunos de los cuales “confiamos” que sea el verdadero valor del parámetro desconocido, con una determinada seguridad de que la afirmación sea cierta. Ej: La prevalencia de fumadores en la población general se estima entre un 18% y un 22%, con un una nivel de confianza al 95%.

Page 4: Intervalos de confianza y pruebas de hipótesis

1.- Intervalos de confianza

Page 5: Intervalos de confianza y pruebas de hipótesis

Concepto de intervalo de confianza (IC)

“Es un rango de valores – calculado en nuestros estimadores de la muestra - en el que nosotros confiamos que se contenga el parámetro poblacional”

“Nos permiten presentar un resultado acompañándolo de un margen de error, con un límite superior y otro inferior”

Para calcularlo necesitamos utilizar el concepto de “Error estándar” del estimador calculado de la muestra: media, proporción, varianza, curtosis, etc.

Page 6: Intervalos de confianza y pruebas de hipótesis

Representación de 100 intervalos de confianza al 95%, calculados en 100 muestras distintas obtenidas de una misma población

Page 7: Intervalos de confianza y pruebas de hipótesis

Ejemplo: Interesa estimar la media de edad de la población a partir de una muestra aleatoria, y con distribución normal, n= 100. La media muestral obtenida fue de 39 años y se sabe que el error estándar de la media poblacional es de 2.n = 100 x = 39 EE μ = 2 EE μ = s / √ n

Cálculo del intervalo de confianza usando la normal

Paso 1.- Calcular el parámetro x = 39

Paso 2.- Comprobar las condiciones de aplicación n>60, ¿simetría? ¿Curtosis?

Paso 3.- Calcular el error estándar del parámetro EE μ = 2

Paso 4.- Asignar a “z” un valor adecuado al error alfa del intervalo de confianza que deseemos calcular. Si el intervalo es al 95%, alfa valdrá 0,025 en cada cola, es decir 0,05 a dos colas y z2 = 1,96

(ver tabla de distribución normal)

IC para el cálculo de medias

Page 8: Intervalos de confianza y pruebas de hipótesis

Tener en cuenta que:

-El error alfa en cada cola es (1 – el nivel de confianza del intervalo en tanto por uno) / 2

-El error alfa en ambas colas es (1 – el nivel de confianza del intervalo en tanto por uno).

Page 9: Intervalos de confianza y pruebas de hipótesis

Paso 5.- Sumar y restar al parámetro z veces el EE del parámetro

μ Е χ ± zα/2 EEμ

IC 95%: x ± zα/2 EEμ = 39 ± (1,96) (2) = (35,08 a 42,92)

Paso 6.- Conclusiones: Se puede afirmar con una confianza del 95% que la media de edad en la población estará situada entre 35 y los 42 años de edad.

Confiamos en que éste sea uno de los 95 intervalos de cada 100 que incluyen a la media poblacional y no sea uno de los 5 intervalos de cada 100 que no incluyen a la media poblacional.

Page 10: Intervalos de confianza y pruebas de hipótesis

OJO

Identifiquemos que en este ejemplo conocíamos un parámetro poblacional = error estándar de la media.

Si solo conocemos los estimadores muestrales, podemos hacer todo el procedimiento, pero le asignaremos un valor a “z” utilizando la tabla de distribución para la “t de student”.

Page 11: Intervalos de confianza y pruebas de hipótesis

Ejercicio 2: En una muestra aleatoria de la población menor de 18 años del Estado de Morelos (n = 1000), se encuentra a un total de 200 fumadores. Calcular la proporción de fumadores en la población general.

IC para el cálculo de proporciones

Cálculo del intervalo de confianza usando la normal

Paso 1.- Calcular el parámetro p = 200 / 1000 = 0,2 1-p = 0,8

Paso 2.- Comprobar las condiciones de aplicación

p>5/n 0,2 > 5/100 (Se cumple)

1- p > 5/n 0,8 > 5/100 (Se cumple)

Paso 3.- Calcular el error estándar del parámetro EEP = √ p(1-p) / n

EPP = √ (0,2 x 0,8) / 1000 = 0,01265

Si no cumpliera estos criterios, es mejor resolverlo a través de la binomial.

Page 12: Intervalos de confianza y pruebas de hipótesis

Paso 4.- Asignar a “z” un valor adecuado al error alfa del intervalo de confianza que deseemos calcular. Si el intervalo es al 95%, alfa valdrá 0,025 en cada cola, es decir 0,05 a dos colas y zα = 1,96

(ver tabla de distribución normal)

Paso 5.- Sumar y restar al parámetro z veces el EE del parámetro

IC 95%: π ± zα/2 EEP = 0,2 ± 1,96 x 0,01265 = (0,1752 a 0,2247)

Paso 6.- Conclusiones: Se puede afirmar con una confianza del 95% que la prevalencia de fumadores en menores de 18 años de edad, en el Estado de Morelos, se encuentra en el rango de valores entre el 17,5% y el 22,5%.Confiamos en que éste sea uno de los 95 intervalos de cada 100 que incluyen a la prevalencia poblacional y no sea uno de los 5 intervalos de cada 100 que no incluyen este parámetro poblacional.

Page 13: Intervalos de confianza y pruebas de hipótesis

2.- Estimación puntual

Test de chi cuadrado

Page 14: Intervalos de confianza y pruebas de hipótesis

Formulación de las hipótesis

Hipótesis nula (H0)

Es una afirmación acerca del valor de un parámetro en una población, o sobre la comparación de un parámetro en dos poblaciones.

Siempre incluye una igualdad (>= ; = ; <=)

Hipótesis alternativa (H1)

Es la negación de la hipótesis nula; Es en general la hipótesis de investigación

Page 15: Intervalos de confianza y pruebas de hipótesis

Ho

Región de

aceptación

1 - α

α = 0,05

Región de rechazo

0 3,84 167

Errores en el contraste de hipótesis

Distribución binomial y estimación del error alfa

Page 16: Intervalos de confianza y pruebas de hipótesis

Test de Chi cuadrado

Esperado

ObservadoEsperadoChi

2)(2

Planteamiento implícito en la fórmula: Los datos que encontré en mi estudio, qué tan diferentes son a los valores que esperaría en una población “teórica” que cumpla con el planteamiento de mi hipótesis nula

Veamos un ejemplo

Page 17: Intervalos de confianza y pruebas de hipótesis

EJERICICIO SOBRE MEDIDAS DE ASOCIACIÓNEJERICICIO SOBRE MEDIDAS DE ASOCIACIÓN

EjemploEn un estudio de una muestra de 450 personas se desea estudiar si existe asociación entre la obesidad y la Diabetes mellitus; se encontró que 250 personas eran obesas. Mediante pruebas de laboratorio se detectó que del total de la muestra 150 eran diabéticos. De los 200 no obesos 50 eran diabéticos y 150 ni eran obesos ni diabéticos

Page 18: Intervalos de confianza y pruebas de hipótesis

CASOS NO CASOSCASOS NO CASOS

ENFERMEDADENFERMEDAD

A B

C D

Mi Mo

Ni

No

TABLA CUADRICELULAR O DE 2 x2

Fx de

Riesgo

Fx de

Riesgo

N

EXPEXP

NO EXPNO EXP

Page 19: Intervalos de confianza y pruebas de hipótesis

CASOS NO CASOS CASOS NO CASOS DIABETES MELLITUSDIABETES MELLITUS

100 150

50 150

150 300

250

200

450

Obesidad

MEDIDAS DE ASOCIACIÓNMEDIDAS DE ASOCIACIÓN

EXPEXP

NO EXPNO EXP

Page 20: Intervalos de confianza y pruebas de hipótesis

Razón de Momios = Razón de Momios = R MR M

A X DRM = B X C

Este tipo de medida de asociación es usada para estudios de tipo trasversal, casos y controles

RM =Odss en expuestos (A / B)

Odds en No expuestos (C / D)

Page 21: Intervalos de confianza y pruebas de hipótesis

A X D 100 x 150

RM = = B X C 50 x 150

RM = 2.0

Las personas obesas tienen 2 veces más la posibilidad de presentar diabetes mellitus que las personas no obesas de este estudio.

¿Esta ventaja / posibilidad es estadísticamente significativa?

Page 22: Intervalos de confianza y pruebas de hipótesis

Test de Test de Chi 2 Chi 2

Paso 2: Calcular la distribución de casos esperados en una tabla 2 x 2

Paso 3.- Calcular el valor del estadístico

Esperado

EsperadoObservadoChi

2)(2

Paso 1: Construyamos la hipótesis de investigación (Ho y Hi)

Ho: La posibilidad (ventaja) de DM es igual en personas obesas y no obesasH1: La posibilidad (ventaja) de DM es diferente en personas obesas y no obesas

Paso 4.- Rechazamos o aceptamos la Ho

Page 23: Intervalos de confianza y pruebas de hipótesis
Page 24: Intervalos de confianza y pruebas de hipótesis

Ejercicio de Medidas de impactoEjercicio de Medidas de impactoMuertes de causas Cardiovasculares (CVC) en una cohorte seguida durante 5 años, según exposición o no a HTA grave.

Exposición a HTA grave

Muerte CVC Total

Si No

Si 588 4000 4588

No 235 4370 4605

IA Exp = 588 / 4588 = 0,128

IA NoExp = 235 / 4605 = 0,051

IA Total = 823 / 9193 = 0,0895

RR = 0,128 / 0,051 = 2,51

Estos resultados (diferencias entre IA exp e IA No exp)… ¿Son estadísticamente significativos? ¿Son realmente representativos de lo que pasa en la población? ¿Con qué probabilidad espero encontrarlos en la población de donde extraje la muestra? Resolverlo a través de la Chi cuadrada

Page 25: Intervalos de confianza y pruebas de hipótesis

Test de Test de Chi 2 Chi 2

Paso 2: Calcular la distribución de casos esperados en una tabla 2 x 2

Paso 3.- Calcular el valor del estadístico

Esperado

ObservadoEsperadoChi

2)(2

Paso 1: Construyamos la hipótesis de investigación (Ho y Hi)

Ho: La IA de MCV es igual en personas con i sin HTA graveH1: La IA de MCV en personas con HT grave es diferente que en personas sin HTA

Paso 4.- Rechazamos o aceptamos la Ho

Page 26: Intervalos de confianza y pruebas de hipótesis

Recordemos que…Recordemos que…

Desarrollar estudios con diseños de tipo prospectivo (ensayos clínicos, estudios cuasi experimentales, cohortes), nos permite realizar cálculos de incidencias acumuladas (o densidad de incidencias, según el diseño), situación que nos permite calcular una rica cantidad de estimadores de medidas de asociación e impacto.

Siguiendo con el ejemplo anterior, podríamos calcular las siguientes mediadas de asociación e impacto potencial:

Page 27: Intervalos de confianza y pruebas de hipótesis

Muertes de causa CVC en una cohorte, según exposición o no a HTA grave.

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

HTA Si NoIA Expuestos IA No expuestos

Riesgo atribuible en expuestos (RAE)

-Cantidad de DAÑO atribuible al FACTOR DE RIESGO en los Expuestos;-Porcentaje de muertes que se hubieran evitado si se hubiese evitado la exposición.

RAE = IA Exp – IA NoExp

RAE

Page 28: Intervalos de confianza y pruebas de hipótesis

RAE = IA Exp – IA NoExp

RAE = 0,128 – 0,051 = 0,077 = 7,7 %

Riesgo atribuible en expuestos (RAE)

De cada 100 personas expuestos a HTA, se habría evitado 7,7 muertes CVC evitando la exposición.

NNT: Número necesario a tratar

Si trato a 100 personas con HTA grave, podría evitar 7,7 muertes CVC: ¿Cuántas personas necesito tratar para evitar una muerte CVC?

NNT = (1 / RAE ) = 1 / 0,077

NNT = 13

Page 29: Intervalos de confianza y pruebas de hipótesis

Proporción Atribuible en Expuestos (PAE) o Fracción Etiológica en Expuestos (FEE)

Porcentaje del daño (mortalidad CVC) que es prevenible en los expuestos si se evitara / tratara la exposición (HTA grave)

FEE = ( IA Exp – IA NoExp) / IA Exp.

FEE = (1,128 – 0,051) / 0,128 = 0,60 = 60 %

El 60% de las muertes CVC que ocurren en pacientes con HTA grave se evitarían eliminando la exposición.

Page 30: Intervalos de confianza y pruebas de hipótesis

MEDIDAS DE IMPACTO POTENCIAL

FEE =FEE =

FEE =FEE =

Fracción Etiológica en Expuestos (FEE) en Fracción Etiológica en Expuestos (FEE) en estudios de cohorteestudios de cohorte

RR - 1RR - 1

R RR R

Page 31: Intervalos de confianza y pruebas de hipótesis

MEDIDAS DE IMPACTO POTENCIAL

FEE =FEE =

FEE =FEE =

Fracción Etiológica en Expuestos (FEE)Fracción Etiológica en Expuestos (FEE) en en estudios de cohorteestudios de cohorte

RM - 1RM - 1

R MR M

Page 32: Intervalos de confianza y pruebas de hipótesis

Riesgo Atribuible en la Población (RAP)

Cantidad de DAÑO atribuible al FR en toda la población

RAP = IA en la Población Total - IA en no expuestos

IA Expuestos IA NO Expuestos IA Población Total

RAP

Page 33: Intervalos de confianza y pruebas de hipótesis

RAP = IA en la Población Total - IA en no expuestos

Riesgo Atribuible en la Población (RAP)

RAP = 0,0895 – 0,051 = 0,0385 = 3,85%

Eliminando la HTA grave, en cada 100 personas de la población se habrían evitado 3,85 muertes CVC

Page 34: Intervalos de confianza y pruebas de hipótesis

Proporción Atribuible Poblacional (PAP) o Fracción Etiológica en la Población (FEP)

-Porcentaje de la cantidad de DAÑO atribuible al FR en toda la población;

- Porcentaje del daño que ocurre en la población que se evitaría eliminando / controlando el factor de riesgo

FEP = RAP / IT

FEP = 0,0385 / 0,0895 = 0,43 = 43 %

El 43% de las muertes CVC que ocurren en la población se evitarían eliminando la HTA grave

Page 35: Intervalos de confianza y pruebas de hipótesis
Page 36: Intervalos de confianza y pruebas de hipótesis

Fin de la presentación