Muestreo. Lic Henry Andrade

45
Muestreo Introducción a la Metodología de la Investigación Científica y Bioestadís 1. CONCEPTOS GENERALES. 2. ASPECTOS FUNDAMENTALES EN EL MUESTREO. 3. MUESTREO PARA ESTIMAR PARAMETROS. 4. MUESTREO PARA CONTRASTE DE HIPOTESIS. 5. CÁLCULO DEL TAMAÑO MUESTRAL EN ESTUDIOS DE CASOS Y CONTROLES. 6. CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA LA ESTIMACIÓN DE UN RIESGO RELATIVO. 7. EXPERIMENTOS DE UN FACTOR (ANÁLISIS DE VARIANZA PARA MÁS DE DOS MUESTRAS)

Transcript of Muestreo. Lic Henry Andrade

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

1. CONCEPTOS GENERALES.

2. ASPECTOS FUNDAMENTALES EN EL MUESTREO.

3. MUESTREO PARA ESTIMAR PARAMETROS.

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

5. CÁLCULO DEL TAMAÑO MUESTRAL EN ESTUDIOS DE CASOS Y CONTROLES.

6. CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA LA ESTIMACIÓN DE UN RIESGO RELATIVO.

7. EXPERIMENTOS DE UN FACTOR (ANÁLISIS DE VARIANZA PARA MÁS DE DOS MUESTRAS)

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

1. CONCEPTOS GENERALES.

Población

Conjunto total de unidades (individuos, elementos, mediciones)

existentes en un cierto lugar durante un periodo, que poseen una

característica común que se desea estudiar. El número de elementos

que la integran constituye el tamaño de la población

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

Una población adecuadamente

designada debe definirse en términos

de:1. Elementos2. Unidades de muestreo3. Alcance 4. Tiempo

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

Población.

Ejemplo.

Una encuesta de amas de casa para evaluar el consumo de alimentos procesados:

Elemento : Mujeres

Unidades de muestreo : Mujeres de 18-50

Alcance : Región los Andes

Tiempo : 1/11 al 10/11/ 2005

1. CONCEPTOS GENERALES.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

Marco muestral

Es una lista de todas las unidades de muestreo disponibles para su selección en la etapa del proceso de muestreo.

1. CONCEPTOS GENERALES.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

1. CONCEPTOS GENERALES.

MuestraGrupo generalmente reducido de unidades obtenidas de la población.

MuestreoProcedimiento estadístico para seleccionar la muestra a partir de la

población, con el objeto de estudiar en ella alguna característica, y

generalizar los resultados a la población de origen

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

1. CONCEPTOS GENERALES.

Procedimientos de selección de muestras

• Muestreo simple aleatorio• Muestreo sistemático en fases• Muestreo aleatorio estratificado

• Muestreo por conglomerados monoetápico• Muestreo por conglomerados bietápico• Muestreo por conglomerados bietápico estratificado

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

2. ASPECTOS FUNDAMENTALES EN EL MUESTREO.

2.1 En el cálculo de un tamaño de muestra es una contradicción

habitual tener que conocer en la fase de diseño el valor de un

parámetro que solo se podrá estimar una vez extraída la muestra.

Para resolver este problema hay dos opciones:

Estimar el parámetro a partir de una muestra piloto.

Obtener un valor aceptable a partir de las referencias que se

tengan de trabajos o experiencias similares ya realizados.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

2. ASPECTOS FUNDAMENTALES EN EL MUESTREO.

2.2 En la práctica, los estudios están generalmente diseñados para

estimar un conjunto grande de parámetros, y no uno solo. Sin

embargo, es necesario determinar un tamaño de muestra único. Esta

dificultad suele solventarse adoptando uno de los parámetros como

"el más importante", lo que implica otra decisión subjetiva en el

cálculo.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

Es el muestreo que se realiza para hacer inferencia a valores poblacionales (Parámetros) tales como la media (µ) y la proporción (P) a partir de una muestra.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Estimación de una característica específica

Los factores específicos que intervienen en el cálculo del tamaño de

muestra para estimar una proporción son:

El tamaño de la población (Finita o Infinita).

La proporción (p).

Nivel de Confianza (1-α)

Precisión del Estudio (d)

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra

2

22/

d

qpzn

qpzdN

qpzNn

22/

2

22/

)1(

POBLACIÓN INFINITA POBLACIÓN FINITA

donde:

Zα= Valor de la distribución normal al nivel de confianza dado

p = proporción esperada de la característica específica

q = 1-p

d = precisión del estudio

N = Tamaño de la población

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

Ejemplo. ¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?, con un nivel de confianza del 95% y precisión = 3%; se estima que la proporción esperada puede ser próxima al 5%

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

Tamaños de muestra y precisión para estimación de una proporción poblacional

Tamaño poblacional: 15000 Proporción esperada: 5,000% Nivel de confianza: 95,0% Efecto de diseño: 1,0

Precisión (%) Tamaño de muestra--------------- --------------------

3,000 201

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

qpzdN

qpzNn

22/

2

22/

)1(

POBLACIÓN FINITA

N

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

qpzdN

qpzNn

22/

2

22/

)1(

POBLACIÓN FINITA

N

P

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

qpzdN

qpzNn 22

2

)1(

POBLACIÓN FINITA

N

P

Se determina con el nivel de confianza

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

qpzdN

qpzNn

22/

2

22/

)1(

POBLACIÓN FINITA

N

P

d

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

Tomando el ejemplo anterior calcular n para una población infinita

Tamaños de muestra y precisión para estimación de una proporción poblacional

Proporción esperada: 5,000% Nivel de confianza: 95,0% Efecto de diseño: 1,0

Precisión (%) Tamaño de muestra--------------- --------------------

3,000 203

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.1 Estimación de una proporción (P) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

2

22/

d

qpzn

POBLACIÓN

INFINITA

Se deja por defecto (0) por ser población infinita

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Los factores específicos que intervienen en el cálculo del tamaño de

muestra para estimar una Media son:

El tamaño de la población (Finita o Infinita).

La varianza (S2) de la variable cuantitativa a estudiar

Nivel de Confianza (1-α)

Precisión del Estudio (d)

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Cálculo del tamaño de muestra

2

222/

d

Szn

222/

2

222/

)1( SzdN

SzNn

POBLACIÓN INFINITA POBLACIÓN FINITA

donde:

Zα= Valor de la distribución normal al nivel de confianza dado

S2 = Varianza de la variable cuantitativa a estudiar

d = precisión del estudio

N = Tamaño de la población

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

Ejemplo: Si deseamos conocer la media de la glicemia basal de una población, con una seguridad del 95% y una precisión de ± 3 mg/dl y tenemos información por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

Tamaños de muestra y precisión para estimación de una media poblacional

Desviación estándar esperada: 15,810 Nivel de confianza: 95,0% Efecto de diseño: 1,0

Precisión Tamaño de muestra------------ -------------------- 3,000 107

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

2

222/

d

Szn

POBLACIÓN INFINITA

Se deja por defecto (0) por ser población infinita

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

2

222/

d

Szn

POBLACIÓN INFINITA2SS

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

2

222/

d

Szn

POBLACIÓN INFINITA2SS

Se determina con el nivel de confianza

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

3.MUESTREO PARA ESTIMAR PARAMETROS.

3.2 Estimación de una Media (µ) poblacional.

Cálculo del tamaño de muestra con el software EPIDAT

2

222/

d

Szn

POBLACIÓN INFINITA

2SS

Se determina con el nivel de confianza

d

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

Este tipo de muestreo pretenden comparar si las medias o las

proporciones de las muestras son diferentes. Habitualmente el

investigador pretende comparar dos tratamientos. Para el cálculo del

tamaño muestral se precisa conocer:

a. Magnitud de la diferencia a detectar que tenga interés clínicamente

relevante. Se pueden comparar dos proporciones o dos medias.

b. Tener una idea aproximada de los parámetros de la variable que se

estudia (bibliografía, estudios previos).

c. Seguridad del estudio (riesgo de cometer un error α)

d. Poder estadístico (1 - β) (riesgo de cometer un error β)

e. Definir si la hipótesis va a ser unilateral o bilateral.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

El cálculo del tamaño de muestra para la comparación de medias de datos cuantitativos, cuando los dos grupos son independientes, asume que los datos siguen una distribución normal y se basa en la prueba t de Student. Los factores que intervienen en el cálculo son:

La diferencia de medias esperada entre los dos grupos (δ) La varianza (S2) o varianzas de la(s) variable(s) (del grupo control o

grupo de referencia) Nivel de Confianza (1-α) Potencia de la prueba (1-β)

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra

2

22)(2

Szz

n

donde:

Zα= Valor de la distribución normal al nivel de confianza dado

Zβ= Valor de la distribución normal para la potencia de la prueba

S2 = Varianza de la variable cuantitativa a estudiar

δ = Diferencia de medias esperada entre los dos grupos

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra

Ejercicio

En un ensayo clínico sobre el uso de una droga en embarazos gemelares,

un tocólogo desea demostrar que hay un aumento significativo en la

duración del embarazo al usar la droga frente a un placebo. El tocólogo

estima que la desviación estándar de la duración de los embarazos es de

1,75 semanas. ¿Cuántos embarazos debe observar como mínimo en cada

grupo si considera que una semana es un aumento clínicamente

importante en la duración del embarazo y quiere operar con una confianza

del 95% y una potencia del 80%?

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra

Tamaños de muestra y potencia para comparación de medias independientesDesviación estándar esperada Población A: 1,750 Población B: 1,750 Diferencia de medias esperada: 1,000 Razón entre muestras (B/A): 1,000 Nivel de confianza: 95,0%

Tamaño de muestra Potencia (%) Población A Población B--------------- ------------ ------------ 80,0 49 49

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra con el software EPIDAT

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra con el software EPIDAT

2

22)(2

Szz

n

2Ss

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra con el software EPIDAT

2

22)(2

Szz

n

2Ss

δ

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra con el software EPIDAT

2

22)(2

Szz

n

2Ss

δ

Se determina con el nivel de confianza

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4. MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra con el software EPIDAT

2

22)(2

Szz

n

2Ss

δ

Se determina con el nivel de confianza

Se determina con la potencia de la prueba

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4.MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra con el software EPIDAT

Para el ejercicio anterior al utilizar varianzas desconocidas pero iguales se obtienen los mismos resultados. Veamos

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4.MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Independientes

Cálculo del tamaño de muestra con el software EPIDAT

2

22)(2

Szz

n

57.0

75.1

1

S

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4.MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Emparejados

Requerimientos.

La mínima diferencia de medias entre los dos grupos que se

considere cualitativamente relevante.

La varianza (S2) o varianzas de la(s) variable(s)

Nivel de Confianza (1-α)

Potencia de la prueba (1-β)

El coeficiente de correlación de Pearson entre los valores de la

variable resultado en los dos grupos, que debe ser un valor entre –1

y 1.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4.MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Emparejados

Ejercicio

Un investigador quiere valorar la diferencia entre el valor de la presión

sistólica en sangre en personas de mediana edad, antes y después de la

práctica de ejercicio físico. Si el investigador aspira a poder declarar una

diferencia de 2,6 mm Hg como significativa, con un nivel de confianza del

95% y una potencia del 80% ¿cuántos pacientes deberá incluir en el

estudio? Suponga que se estima una desviación estándar de 11,0 mm Hg y

un coeficiente de correlación de 0,70 entre los valores de la presión

sistólica antes y después del ejercicio.

Muestreo

Introducción a la Metodología de la Investigación Científica y Bioestadística

4.MUESTREO PARA CONTRASTE DE HIPOTESIS.

4.1 Comparación de dos Medias Grupos Emparejados

Cálculo del tamaño de muestra con el software EPIDAT