26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio...

25
09/06/22 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón

Transcript of 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio...

Page 1: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

11/04/23 1

Escuela Nacional de Estadística e InformátiaMuestreo I

Muestreo Aleatorio Estratificado

Prof. Willer David Chanduvi Puicón

Page 2: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado

211/04/23

En muchas ocasiones es conveniente dividir a la población en grupos o estratos

para mejorar la eficiencia del muestreo o bien obtener resultados desagregados

por dominios de estudio.

La población de estudio, formada por N unidades, se divide en L estratos, los

cuales constituyen una población, es decir, no se solapan y la unión de todos ellos

es el total.

La muestra estratificada se obtiene seleccionando unidades de cada uno de

los L estratos de forma independiente en cada estrato.

Los estratos, para mejorar la eficiencia del diseño, se forman en función de

variables altamente correlacionadas con las variables en estudio, tales como nivel

socioeconómico, tamaño de la localidad, giro de empresas, etc.

hN

Page 3: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado

Si la selección en cada estrato es aleatoria simple, el muestreo se denomina Muestreo

Aleatorio Estratificado (MAE).

Su principal objetivo es mejorar la precisión de las estimaciones reduciendo los

errores de muestreo. Minimiza la varianza de los estimadores mediante la creación de

estratos lo más homogéneos posible entre sus elementos y lo más heterogéneo entre

estratos.

Es eficiente en poblaciones heterogéneas.

Reduce el costo del muestreo al reducir los tamaños de muestra sin perder precisión.

Forma parte de los diseños de muestras complejas.

Administrativamente el muestreo estratificado facilita la designación de supervisiones y

equipos de campo que controlen y ejecuten la encuesta de cada región o estrato.

311/04/23

Page 4: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

411/04/23

Población

........

n = n1 + n2 + n3 +.........+ nL

n1 n2 n3 nL-1 nL

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado

Page 5: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

511/04/23

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado

1

L

hh

N N

1

L

hh

n n

Page 6: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Supuestos del muestreo estratificadoSupuestos del muestreo estratificado

HOMOGENEIDAD:HOMOGENEIDAD: Entre elementos de un mismo estrato

HETEROGENEIDAD:HETEROGENEIDAD: Entre estratos

INDEPENDENCIA:INDEPENDENCIA: Entre estratos al seleccionar la muestra

611/04/23

Page 7: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

El número de estratos:El número de estratos:

No se debe pensar que aumentando notablemente el número de estratos se obtienen altos beneficios. En la práctica el aumento mas allá de 6 estratos produce pocas ganancias en la reducción de las varianzas.

Definido por criterio del investigador Calculado por fórmula teórica:

donde,

costo por unidad de muestra

costo por estratificación

711/04/23

e

n

C

2nCL

:nC:eC

Page 8: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Formación de los estratosFormación de los estratos

Método de DaleniusMétodo de Dalenius

Cuando se tiene una variable cuantitativa de estratificación, se puede determinar los límites de los intervalos para cada estrato.

Método ClusterMétodo Cluster

Cuando se tienen varias variables de estratificación, se puede formar estratos de elementos similares en base a las medidas de distancia entre elementos.

A criterio del investigadorA criterio del investigador

Cuando se forman estratos por dominios geográficos, por dominios temáticos, etc, que favorecen el análisis de la muestra.

811/04/23

Page 9: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Método de DaleniusMétodo de Dalenius

Dalenius (1957), diseñó un método para determinar los mejores límies para

estratos cuando se dispone de datos correspondientes a una variable cuantitativa

para toda la población.

Los resultados son muy buenos cuando la variable de estratificación está

altamente correlacionada con la variable de interés.

Este método tiende a minimizar la varianza del estimador.

Se requiere de manera preliminar contar con una gran cantidad de estratos

estrechos (intervalos de clase)

911/04/23

Page 10: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Método de DaleniusMétodo de Dalenius

Ejemplo: En un estudio de múltiples propósitos se

necesita seleccionar una muestra de 400 abonados de Lima Metropolitana. Una de las variables más importantes es el gasto en tráfico telefónico.

Se decidió por utilizar L=5 estratos.

Luego, obtenemos los límites:

706.62x2=1413.24

706.62x3=2119.86

706.62x4=2826.48

706.62x5=3533.11

1011/04/23

62.7065

3533.11

Page 11: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Procedimiento de Selección

1° Preparar el marco muestral tal que contenga la variable que identifica el estrato al que pertenece cada unidad del marco

2° Seleccionar la muestra aleatoria (simple con o sin reemplazo, sistemática, etc) de forma independiente en cada estrato

3° La muestra estratificada es la unión de todas las muestras obtenidas de cada estrato

1111/04/23

Page 12: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Muestreo Aleatorio EstratificadoMuestreo Aleatorio Estratificado

MASsr en cada estratoMASsr en cada estrato

1. En el estrato h, las selecciones no son independientes

2. El número de muestras posibles en el estrato h es:

3. Cada muestra posible de tamaño es seleccionada con

probabilidad

4. La fracción o tasa de muestreo en cada estrato es:

5. La probabilidad de inclusión de primer orden en cada estrato es

6. El peso muestral o factor de expansión en cada estrato es:1211/04/23

!

! !h

h

N hn

h h h

NC

n N n

hn

1h

h

NnC

hh

h

nf

N

hhi

h

n

N

hhi

h

Nw

n

Page 13: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

EjemploEjemplo

Considerando la variable sexo como variable de estratificación, seleccionar una

muestra estratificada de 200 fichas clínicas del archivo “sífilis”. Utilice MAS sr en

cada estrato, 100 fichas por cada estrato.

Procedimiento con SPSS:

Analizar / Muestras complejas / Seleccionar una muestra

1311/04/23

Page 14: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Procedimiento de EstimaciónProcedimiento de Estimación

El estimador del total poblacional esta dado por:

Debido a la independencia, la varianza es:

El estimador de la varianza es:

1411/04/23

1

L

h

h

T T

1

( ) ( )L

h

h

V T V T

1

( ) ( )L

h

h

V T V T

Page 15: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Procedimiento de estimación de mediasProcedimiento de estimación de medias

Un estimador general para la media poblacional esta dado por:

La varianza teórica del estimador anterior es:

La varianza estimada del estimador anterior es:

1511/04/23

1 1 1

1 1L L L

h h hh hh h h

TT N W

N N N

2

1

( ) ( )L

hhh

V W V

2

1

( ) ( )L

hhh

v W v

Page 16: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Procedimiento de estimación de proporcionesProcedimiento de estimación de proporciones

Un estimador general para la proporción poblacional P está dado por:

La varianza teórica del estimador anterior es:

La varianza estimada del estimador anterior es:

1611/04/23

1 1

1 L L

h hh hh h

P N P W PN

2

1

( ) ( )L

hhh

V P W V P

2

1

( ) ( )L

hhh

v P W v P

Page 17: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

EjemploEjemplo

Con la muestra aleatoria estratificada seleccionada en el ejemplo anterior ,

determine las siguientes estimaciones:

Promedio de días de curación de la enfermedad

Promedio de días de curación de la enfermedad, según sexo.

Promedio de días de curación de la enfermedad, según raza.

Proporción de pacientes con diagnóstico SRAS

Total de pacientes con diagnóstico SRAL

Total de pacientes con diagnóstico SRAL, según raza.

1711/04/23

Page 18: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestraTamaño de muestra

¿Cuál es el tamaño de muestra n? y ¿cómo afijar el tamaño de muestra a

cada estrato?

Existen muchas maneras de dividir el tamaño de muestra total entre los

estratos. (afijación de la muestra).

Cada división diferente puede originar una precisión diferente para el

estimador.

¿Qué factores influyen en el mejor esquema de afijación?

La variabilidad de las observaciones dentro de cada estrato.

El número total de elementos de cada estrato.

El costo de obtener una observación de cada estrato.

1811/04/23

Page 19: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestra: AfijacionesTamaño de muestra: Afijaciones

Afijación Óptima (costo, varianza y tamaño del estrato).

Afijación de Neyman (varianza y tamaño del estrato).

Afijación Proporcional (tamaño del estrato)

Afijación uniforme (igual en cada estrato)

Afijación Proporcional Valoral (Total X del estrato)

Afijación óptimo relativo (proporcional al coeficiente de variación del

estrato).

Afijación desproporcional (no proporcional)

1911/04/23

Page 20: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestra: Afijación de NeymanTamaño de muestra: Afijación de Neyman

Consiste en determinar los valores de tal que para un tamaño de muestra

, la varianza del estimador sea mínima.

También es llamada afijación de varianza mínima.

Con MASsr en cada estrato:

Se obtienen los valores óptimos de que minimiza la función:

2011/04/23

hnn

hn

2 2

2 2 2 2

1 1 1 1

(1 ) 1( ) ( )

L L L Lh h h

hh h h h hh h h hh h

f W SV W V W S W S

n n N

2 2

2

1 1 1 1

1( )

L L L Lh h

h h h hh h h hh

W SV n n W S n n

n N

Page 21: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestra . Afijación de Neyman:Tamaño de muestra . Afijación de Neyman:

El valor óptimo de resulta:

Con este se obtiene la varianza mínima del estimador:

El tamaño de muestra para un margen de error E con un nivel de confianza

es:

2111/04/23

hn

hn

n

h hh

h h

W Sn n

W S

2

2min

1 1

1 1L L

h h h hh h

V W S W Sn N

221

h h

h h

W Sn

D W SN

Page 22: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestra. Afijación de NeymanTamaño de muestra. Afijación de Neyman

Cuando se estiman proporciones o prevalencias se utilizan las fórmulas:

2211/04/23

2(1 )

1(1 )

h h h

h h h

W P Pn

D W P PN

(1 )

(1 )h h h

h

h h h

W P Pn n

W P P

Page 23: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestra. Afijación proporcionalTamaño de muestra. Afijación proporcional

Consiste en repartir el tamaño de muestra en forma proporcional al

tamaño de los estratos de la población. Es decir:

Con MASsrMASsr en cada estrato, el proporcional genera una varianza del

estimador dado por:

2311/04/23

n

hn

hh h

Nn n nW

N

2

2

1

1 1 L

h hh

Vprop W Sn N

Page 24: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestra. Afijación proporcionalTamaño de muestra. Afijación proporcional

El tamaño de muestra para un margen de error E con un nivel de confianza

es:

La afijación de Neyman es similar a la afijación proporcional, cuando las varianzas

en los estratos son iguales. Por lo tanto, la afijación proporcional es conveniente

cuando las varianzas son casi iguales en todos los estratos.

2411/04/23

n

2

21h h

h h

W Sn

D W SN

Page 25: 26/03/2015 1 Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.

Tamaño de muestra. Afijación proporcionalTamaño de muestra. Afijación proporcional

Cuando se estiman proporciones o prevalencias se utilizan las fórmulas:

2511/04/23

hh h

Nn n nW

N

(1 )

1(1 )

h h h

h h h

W P Pn

D W P PN