Sesión 2A Por favor, Simple conéctese al Canal...

13
1 Sesión 2A Las limitaciones del Muestreo Aleatorio Simple y La práctica del muestreo para encuestas de hogares Juan Muñoz, Sistemas Integrales Santiago, 12 de abril de 2013 Por favor, conéctese al Canal 50

Transcript of Sesión 2A Por favor, Simple conéctese al Canal...

Page 1: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

1

Sesión 2ALas limitaciones del Muestreo Aleatorio Simple yLa práctica del muestreo para encuestas de hogares

Juan Muñoz, Sistemas IntegralesSantiago, 12 de abril de 2013

Por favor, conéctese al Canal 50 

Page 2: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Limitaciones del Muestreo Aleatorio Simple• El MAS se adecua bien a muchos problemas de evaluación de impacto,

• pero puede no ser lo mejor cuando– se necesitan estimaciones para sub‐grupos de la población –especialmente si son pequeños

– no se dispone de un marco muestral adecuado para poner en práctica el MAS

– el MAS produciría una muestra territorialmente demasiado cara y difícil de visitar, por lo dispersa

• Se recurre entonces a otras técnicas– Estratificación– Muestreo por etapas

2

Page 3: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Encuesta electoral en un archipiélago

3

Page 4: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

¿Cómo distribuiría usted una muestra de 120 electores entre las tres islas?

1. Proporcionalmente a la cantidad de electores de cada isla

2. En forma equitativa entre las tres islas

3. De otra manera

1 2 3

0% 0%0%

Page 5: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Estratificación• La población se divide en sub‐grupos, llamados estratos.

• En cada estrato se elige una muestra por separado.

• Hay dos razones para estratificar:– Para reducir el error estándar, por la vía de controlar la composición de la muestra.

– Para asegurar la representación de ciertos grupos.

• Las probabilidades de selección pueden variar entre estratos.

5

Estos dos objetivos son contradictorios en 

la práctica

Esto impone el uso de ponderadores, para asegurar la validez externa de una 

evaluación de impacto

Page 6: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Encuesta electoral en dos etapas

6

Page 7: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Muestreo en dos etapas• En vez de elegir una MAS

• El territorio se divide en áreas pequeñas, llamadas Unidades Primarias de Muestreo (UPMs).– En la primera etapa, se eligen UPMs.

– En la segunda etapa, se eligen hogares dentro de las UPMs elegidas.

7

Page 8: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Muestreo en dos etapas• Resuelve los problemas del MAS

– Reduce los desplazamientos– Reduce los problemas de marco

• La muestra puede hacerse auto‐ponderada, eligiendo– Las UPMs con probabilidad proporcional al tamaño (Probability Proportional to Size, PPS)

– Una cantidad fija de hogares en cada UPM

• El precio a pagar es elefecto de conglomeración

8

Page 9: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Efecto de conglomeraciónEl error estándar aumenta si una muestra de 

tamaño n se elige en dos etapas, con kUPMs y m hogares por UPM (n=k•m)

Efecto de conglomeración

Coeficiente decorrelaciónintra‐clásica

11222 mee MASEM

Muestreo en 2 etapas Muestreo Aleatorio Simple

Page 10: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

1.03 1.06 1.15 1.30 1.601.05 1.10 1.25 1.50 2.001.07 1.14 1.35 1.70 2.401.11 1.22 1.55 2.10 3.201.14 1.28 1.70 2.40 3.801.19 1.38 1.95 2.90 4.801.29 1.58 2.45 3.90 6.801.39 1.78 2.95 4.90 8.801.59 2.18 3.95 6.90 12.801.79 2.58 4.95 8.90 16.802.19 3.38 6.95 12.90 24.80

1.151.251.351.551.701.952.452.953.954.956.95

1.19 1.38 1.95 2.90 4.80

Efecto de conglomeraciónPara un tamaño muestral total de 12,000 hogaresCantidad de UPMs

Hogares por UPM

3,000 42,000 61,500 81,000 12800 15600 20400 30300 40200 60150 80100 120

0.01 0.02 0.05 0.10 0.20Coeficiente de Correlación Intra-Clásica

1.95

Page 11: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Efecto de diseño

• En una muestra en dos etapasEfecto de conglomeración = e2M2E / e2MAS

• En un diseño más complejo(con dos o más etapas, estratificación, etc.)Efecto de diseño = Deff = e2Diseño Complejo / e2MAS

• Puede interpretarse como una aparente contracción del tamaño muestral, como resultado de la conglomeración y la estratificación

• Puede estimarse con software especial(por ejemplo, con los comandos svy de Stata)

11

Page 12: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Muestras de hogaresSelección de UPMs• Las UPMs son las Áreas de Empadronamiento 

Censal (AEC) generadas por el censo más reciente

• Las UPMs tienen habitualmente entre 50 y 200 hogares

• El marco muestral es un archivo relativamente pequeño. Conviene manejarlo en Excel

• Las UPMs de la muestra se eligen con probabilidad proporcional al tamaño (Probability Proportional to Size, PPS)– Ver cómo hacerlo en

http://unstats.un.org/unsd/publication/SeriesF/SeriesF_31S.pdfCapítulo XV

• Las UPMs elegidas deben ser reconocibles en el terreno

12

Requiere colaborar con la agencia 

estadística nacional

La presencia de UPMsmás pequeñas puede requerir algún trabajo 

previo 

El archivo informático no basta. También se requiere cartografía

Page 13: Sesión 2A Por favor, Simple conéctese al Canal 50pubdocs.worldbank.org/en/999061463422870756/Core-Sesion... · 3.95 4.95 6.95 1.19 1.38 1.95 2.90 4.80 Efecto de conglomeración

Muestras de hogaresSelección de hogares

• El marco muestral más adecuado es un listado de hogares. El listado debe incluir todos los hogares de cada una de las UPMs elegidas

• Esta es una operación de campo que requiere tiempo y dinero. El tiempo y el dinero son– Marginales, en relación con los presupuestos y 

calendarios del estudio, si se prevén adecuadamente– Lo suficientemente grandes como para convertirse 

en un problema serio, si se olvidan• Las UPMs demasiado grandes pueden requerir 

segmentación• Información a recoger en el listado

– Nombre del jefe y dirección, cómo mínimo– Información adicional requerida por la evaluación de 

impacto (como presencia de niños o embarazadas)• La selección de hogares a partir del listado no 

debería ser hecha por los mismos encuestadores13

No recoger más información que la necesaria

Desconfiar de los “caminos aleatorios”

El censo tampoco es una buena alternativa