CLAS 4A Tecnicas de Muestreo

40
Dr. ELMER LIMACHE SANDOVAL

description

tecnicas de muestreo

Transcript of CLAS 4A Tecnicas de Muestreo

Page 1: CLAS 4A Tecnicas de Muestreo

Dr. ELMER LIMACHE SANDOVAL

Page 2: CLAS 4A Tecnicas de Muestreo

El Muestreo

El Muestreo es la disciplina que trata con el conjunto de técnicas para tomar u obtener una muestra representativa de una población.

Una muestra es representativa de una población cuando reproduce las características de la población

Page 3: CLAS 4A Tecnicas de Muestreo

Tamaño N

Tamaño n

Parámetros

Estimadores

POBLACION

MUESTRA

Son teóricos o difíciles de medir

Los elementos de la población tienen características comunes, llamadas VARIABLES las cuales pueden ser cualitativas o cuantitativas

Page 4: CLAS 4A Tecnicas de Muestreo

Términos técnicos en el Muestreo 1 Población

Muestra

Page 5: CLAS 4A Tecnicas de Muestreo

Términos técnicos en el Muestreo

Unidad de muestreo

Unidad elemental

Unidad reportante

Page 6: CLAS 4A Tecnicas de Muestreo

Términos técnicos en el Muestreo

• Marco de muestreoEs la lista de los elementos de la población

Base de datos (Registros)Mapas

Page 7: CLAS 4A Tecnicas de Muestreo

Términos técnicos en el Muestreo

• Parámetro, estimador y estimación

),....,(ˆ21 nxxxf

700$ˆ

Page 8: CLAS 4A Tecnicas de Muestreo

Errores en la Encuesta por Muestreo

• Errores de Muestreo. Se controla, se formula y se estima

mediante el diseño de la muestra

• Errores de No Muestreo. Sólo se controla mediante un sistema de

prevención, capacitación e inspección en todo el proceso de la encuesta.

Page 9: CLAS 4A Tecnicas de Muestreo

Tamaño N

Tamaño n

Parámetros

800

Estimadores

750x

POBLACION

MUESTRA

Error muestral= 800-750 = 50

Page 10: CLAS 4A Tecnicas de Muestreo

La Investigación por Muestreo ETAPAS

Establecimiento de Objetivos Población Objetivo y Marco de Muestreo Diseño de la muestra Método de medición Instrumento de medición Capacitación de investigadores de

campo Prueba piloto Organización del trabajo de campo Análisis de los datos

Page 11: CLAS 4A Tecnicas de Muestreo

Diseño de la muestra

Plan de selección Tamaño de la muestra y distribución Plan de estimación de parámetros y del

error

Categorías del Muestreo

• Muestreo Probabilístico

• Muestreo No probabilístico

Page 12: CLAS 4A Tecnicas de Muestreo

Las Técnicas de Muestreo

Muestreo por conveniencia Muestreo por juicio Muestreo por cuotas Muestreo bola de nieve

• Técnicas No probabilísticas

• Técnicas probabilísticas– Muestreo Irrestricto Aleatorio (MIA)– Muestreo Sistemático– Muestreo PPT– Muestreo Estratificado– Muestreo de Conglomerados y Multietápico

(Polietápico)

Page 13: CLAS 4A Tecnicas de Muestreo

Muestreo Aleatorio Simple - MAS Con reposición

Sin reposición - MIA

Características: • Asigna probabilidades iguales de selección• Necesita listado de unidades (Marco de muestreo)• Utiliza tabla de números aleatorios, urnas con bolas,

generación de números aleatorios por computadora, etc.

• Eficiente sólo en poblaciones homogéneas• Aplicable en encuestas de pequeña escala• Forma parte de diseños de muestra más complejos

Page 14: CLAS 4A Tecnicas de Muestreo

Muestreo Sistemático

Asigna probabilidades iguales de selección No siempre necesita listado de unidades No requiere tabla de números aleatorios, ni urnas con bolas, ni

generación de números aleatorios por computadora, etc. Eficiente sólo en poblaciones homogéneas La muestra se distribuye uniformemente en toda la población,

siempre que exista una “buena” ordenación en el marco de muestreo Aplicable en encuestas de pequeña escala y en la selección en

campo Forma parte de diseños de muestra más complejos Es equivalente al MIA cuando la ordenación es “aleatoria”. Por tanto,

utiliza las mismas fórmulas.

• Simple• Circular

Características:

Page 15: CLAS 4A Tecnicas de Muestreo

Ejemplo 1: Selección sistemática simple

De una lista de 270 pacientes internos, se desea seleccionar una muestra sistemática de 30 pacientes. Entonces el intervalo de selección es:

k = 270/30 = 9, es exactamente entero.

Luego, se elige un número aleatorio entre 1 y 9 (arranque aleatorio) es a=5.

Los pacientes elegidos para la muestra son los que ocupan la posición:005, 014, 023, 032, 041, 050,

059, 068, 077, 086, 095, 104, 113,

122, 131, 140, 149, 158, 167, 176,

185, 194, 203, 212, 221, 230, 239,

248, 257, 266

No Teléfono Nombre Consult5 241-6733 Reátegui Diaz Olga 114 328-0446 Talavera Cruz Clara M. 123 476-8125 Alba Caballero Guillermo 232 495-1957 Tafur Documet Orlando 241 526-0930 Ramírez Valera Luis J. 250 485-9040 Tapia Torres Amador 359 295-1590 Raymundo Palomino 368 521-2173 Juárez Alvarez Camilo 377 474-1853 Martínez Romero Damián 486 425-1596 Burga Araujo Marcela 495 488-5125 Real Leiva Eugenio N. 4

104 568-7235 Jarra Lazo Verónica 4113 470-9334 Chucle Chumbe Juan E. 4122 574-4628 Morales Garcia Olimpia 5131 445-2746 Manrrique Angeles Livia 5140 392-6221 Yactayo Samán Juan de 5149 451-2431 Salcedo Escobar Angel 5158 458-6117 Fernández Aliaga Carlos 6167 471-8682 Cueto Arias Cirilo E. 6176 283-4416 Lázaro Villa Mario P. 6185 381-7542 Zamudio Buendía Ulises 6194 224-6670 Kegel Garcia Hene G. 7203 293-4892 Quiroga Guillermo 7212 465-4290 Temoche Romero Fanny 7221 459-3981 Rabanal Zelada Arístides 8230 451-4178 Espejo Morales Victor 9239 348-7368 Chirinos Alarcón Gloria J. 9248 446-8466 Demichelli Zevallos Ortiz 9257 547-4043 Espíritu Rojas Pedro 10266 444-9092 Mindreau Raquel E. 10

Page 16: CLAS 4A Tecnicas de Muestreo

Ejemplo 2: Selección sistemática circular

De la misma lista anterior de 270 pacientes, se desea seleccionar una muestra de 32 pacientes.

Entonces el intervalo de selección es:

k = 270/32= 8.44 8 (parte entera)

Luego,se elige un número aleatorio entre 1 y 270, es a=103.

Los pacientes elegidos para la muestra son los que ocupan la posición:103, 111, 119, 127, 135, 143, 151,

159, 167, 175, 183, 191, 199, 207,

215, 223, 231, 239, 247, 255, 263,

001, 009, 017, 025, 033, 041, 049,

057, 065, 073, 081

No Aleatorio Teléfono Nombre

(Mes anterior: S/.)

Miembros

103 442-4245 Zanetti Helena Gereda de 4

111 550-0712 Julián Marquina Marilú 4

119 446-3500 Alva Arce Eduardo P. 5

127 420-7454 Chuna Alaña Ricardo 5

135 254-0592 Layseca Carmen L. Aguilar de 5

143 441-7002 Pereira Pereira Orlando 5

151 264-5137 Deza Bringas Luis 5

159 354-4145 Laredo Osorio Claudio 6

167 471-8682 Cueto Arias Cirilo E. 6

175 421-1548 Campos Nieves Walther E. 6

183 485-9040 Tapia Torres Amador H. 6

191 474-5992 Giraldo Cano Carlos 6

199 461-0482 Revolledo Luisa Quinto de 7

207 368-2112 Ferrari Macher Jorge 7

215 442-4043 La Torre Cabrejos Norma E. 8

223 536-1199 Escobar Ccora Zócimo 8

231 464-6458 Galagarza Aponte María S. 9

239 348-7368 Chirinos Alarcón Gloria J. 9

247 553-3669 Zeta Correa Venancio 9

255 429-8214 Arce Correa Federico M. 10

263 421-6940 Bianchi Burga Mariela 10

001 365-1774 Garcia Rodriguez Juan D. 1

009 425-4039 Hurtado Flores Jorge 1

017 536-2160 Remuzgo TruJillo Helmer 1

025 479-8230 Uribe Montes Gustavo 2

033 472-8700 Vadillo Quijandría Antonio 2

041 526-0930 Ramírez Valera Luis J. 2

049 441-4692 Quevedo Mejia Manuel A. 3

057 464-7182 Dávila Briceño Juan M. 3

065 526-5318 Girao Sara Camacho de 3

073 336-8720 Farro Sonco María E. 4

081 295-1914 Urbano Ura Jessica V. 4

Page 17: CLAS 4A Tecnicas de Muestreo

Muestreo PPT

Con Reposición Sin reposición Sistemático

Características

• Asigna probabilidades desiguales a las unidades de muestreo

• Aplicable en la selección de unidades grandes (Ciudades, distritos, manzanas de viviendas, etc) que poseen medidas de tamaño

• Forma parte de los diseños complejos en encuestas a gran escala

• Requiere información auxiliar (medidas de tamaño) para su aplicación

Probabilidades Proporcionales Al Tamaño

Page 18: CLAS 4A Tecnicas de Muestreo

Ejemplo 3: Selección de localidadescon PPT Se tiene un listado de 40 localidades

y el numero de teléfonos públicos instalados (TPI) en cada localidad. Se desea seleccionar una muestra de 10 localidades con probabilidad proporcional al numero de TPI. (n=10)

Elegimos de la tabla de números aleatorios, 10 números entre 1 y 3100. Los números aleatorios son:

2242, 0559, 2883, 0483, 2566, 2998, 2795, 1884, 0699, 2049

Las 10 localidades seleccionadas son:

- Localidad 28 - Localidad 07

- Localidad 38 - Localidad 06

- Localidad 33 - Localidad 39

- Localidad 36 - Localidad 24

- Localidad 08 - Localidad 25

LOCALIDADES NUMERO DE TPI [ INTERVALOS ]

1 85 1 – 85 2 50 86 - 135 3 120 136 - 255 4 80 256 – 335 5 72 336 – 407 6 135 408 – 542 7 52 543 – 594 8 105 595 – 699 9 94 700 – 793

10 145 794 – 938 11 42 939 – 980 12 100 981 – 1080 13 60 1081 – 1140 14 81 1141 – 1221 15 53 1222 – 1274 16 70 1275 – 1344 17 68 1345 – 1412 18 45 1413 – 1457 19 86 1458 – 1543 20 51 1544 – 1594 21 112 1595 – 1706 22 63 1707 – 1769 23 54 1770 – 1823 24 190 1824 – 2013 25 44 2014 – 2057 26 67 2058 – 2124 27 49 2125 – 2173 28 82 2174 – 2255 29 48 2256 – 2303 30 56 2304 – 2359 31 118 2360 – 2477 32 62 2478 - 2539 33 74 2540 – 2613 34 55 2614 - 2668 35 110 2669 – 2778 36 40 2779 – 2818 37 57 2819 – 2875 38 71 2876 – 2946 39 58 2947 – 3004 40 96 3005 – 3100

TOTAL 3100

Page 19: CLAS 4A Tecnicas de Muestreo

Ejemplo 4: Selección sistemática PPT

De las 40 localidades, seleccionamos ahora 10 localidades bajo muestreo sistemático con probabilidad proporcional al número de TPI.Calculamos el intervalo de selección:

k = 3100 / 10 = 310 Elegimos de la tabla de números

aleatorios un arranque aleatorio (entre 1 y 310). El arranque aleatorio es a = 265, entonces los números aleatorios son:

265, 575, 885, 1195, 1505, 1815, 2125, 2435, 2745, 3055

Por lo tanto, las 10 localidades seleccionadas son:

- Localidad 04 - Localidad 07- Localidad 10 - Localidad 14- Localidad 19 - Localidad 23- Localidad 27 - Localidad 31- Localidad 35 - Localidad 40

LOCALIDADES NUMERO DE TPI [ INTERVALOS ]

1 85 1 – 85 2 50 86 - 135 3 120 136 - 255 4 80 256 – 335 5 72 336 – 407 6 135 408 – 542 7 52 543 – 594 8 105 595 – 699 9 94 700 – 793

10 145 794 – 938 11 42 939 – 980 12 100 981 – 1080 13 60 1081 – 1140 14 81 1141 – 1221 15 53 1222 – 1274 16 70 1275 – 1344 17 68 1345 – 1412 18 45 1413 – 1457 19 86 1458 – 1543 20 51 1544 – 1594 21 112 1595 – 1706 22 63 1707 – 1769 23 54 1770 – 1823 24 190 1824 – 2013 25 44 2014 – 2057 26 67 2058 – 2124 27 49 2125 – 2173 28 82 2174 – 2255 29 48 2256 – 2303 30 56 2304 – 2359 31 118 2360 – 2477 32 62 2478 - 2539 33 74 2540 – 2613 34 55 2614 - 2668 35 110 2669 – 2778 36 40 2779 – 2818 37 57 2819 – 2875 38 71 2876 – 2946 39 58 2947 – 3004 40 96 3005 – 3100

TOTAL 3100

Page 20: CLAS 4A Tecnicas de Muestreo

Las fórmulas de tamaño de muestra que se generan son:

Bajo la teoría de normalidad asintótica, para muestras grandes:

2

2

1)D(NN

nP)P(11)D(N

P)NP(1-n

Tamaño de muestra

) E( ˆ P )ˆ(V Z E

2

ZE

D

Mediciones cuantitativa

s

Mediciones cualitativas

Page 21: CLAS 4A Tecnicas de Muestreo

Ne

PQze

PQz

2

2

2

2

1 n

Ne

ze

z

2

22

2

22

1

n

Para el caso de la estimación de la Media Poblacional

Para el caso de la estimación de una Proporción Poblacional

Que son similares a:

Donde Z: valor de la distribución normal a una confianza determinada.

E: error o precisión 2: varianza poblacional

N: tamaño de la población.

P: proporción de individuos que poseen determinada característica.

Q: 1-P

Page 22: CLAS 4A Tecnicas de Muestreo

Tamaño de muestra en mediciones cualitativas

Margen de P (%)Error (%) 1 5 10 20 25 35 45 50

0.1 39,600 190,000 360,000 640,000 750,000 910,000 990,000 1,000,000

0.5 1,584 7,600 14,400 25,600 30,000 36,400 39,600 40,000

1.0 396 1,900 3,600 6,400 7,500 9,100 9,900 10,000

2.0 99 475 900 1,600 1,875 2,275 2,475 2,500

3.0 44 211 400 711 833 1,011 1,100 1,111

4.0 25 119 225 400 469 569 619 625

5.0 16 76 144 256 300 364 396 400

10.0 4 19 36 64 75 91 99 100

Page 23: CLAS 4A Tecnicas de Muestreo

Muestreo Estratificado

Directo de elementos en cada estrato Por conglomerados (con o sin submuestreo)

en cada estrato

• Requiere información auxiliar de una o mas variables para estratificar la población

• Es eficiente en poblaciones heterogeneas

• Reduce el costo del muestreo al reducir los tamaños de muestra sin perder precisión

• Forma parte de los diseños de muestras complejas

Características

Page 24: CLAS 4A Tecnicas de Muestreo

PROBLEMA: Heterogeneidad de las unidades

Page 25: CLAS 4A Tecnicas de Muestreo

SOLUCION: Estratificación de la población

Page 26: CLAS 4A Tecnicas de Muestreo

Muestreo Estratificado

........

Población

n1 n2 n3 nL

n = n1 + n2 + n3 +.........+ nL

Page 27: CLAS 4A Tecnicas de Muestreo

Criterio para estratificación

HOMOGENEIDAD: Entre elementos de un mismo

estrato HETEROGENEIDAD:

Entre estratos INDEPENDENCIA:

Entre estratos al seleccionar la muestra

Page 28: CLAS 4A Tecnicas de Muestreo

El número de Estratos

Criterio del investigador Fórmula teórica:

donde,

Cn= costo por unidad de muestra

Ce= costo por estratificación

Formación de los Estratos• Criterio del investigador• Método de Dalenius

e

n

C

2nCL

Page 29: CLAS 4A Tecnicas de Muestreo

Afijación de la muestra

Afijación Optima (costo, varianza y tamaño del estrato)

Afijación de Neyman ( varianza y tamaño del estrato)

Afijación proporcional (tamaño del estrato)

Afijación proporcional valoral (total X del estrato)

Afijación desproporcional ( no proporcional)

Afijación optimo relativo (proporcional al coef. De

variación del estrato)

Afijación Uniforme (igual en cada estrato)

Page 30: CLAS 4A Tecnicas de Muestreo

Muestreo de Conglomerados

• Características• Las unidades de muestreo suelen ser un grupo de elementos que

comúnmente es llamado conglomerado de elementos. El muestreo de estas unidades es llamado muestreo de conglomerados.

• El marco de muestreo es una lista de conglomerados

• La medición se realiza a todos los elementos del conglomerado seleccionado.

• Se utiliza en las investigaciones por muestreo a gran escala

• Ventajas- Reduce el costo del muestreo, al no utilizar una lista de elementos de la población (marco) y sólo una lista de conglomerados que es más fácil y más barato de obtener.

- Reduce el tiempo de la organización y ejecución del trabajo de campo.

Page 31: CLAS 4A Tecnicas de Muestreo

Esquema grafico de una muestra por conglomerados

Conglomerado no seleccionado

Conglomerado seleccionado

Page 32: CLAS 4A Tecnicas de Muestreo

Criterio para la conglomeración

Homogeneidad: (Entre)Entre elementos de diferentes conglomerados

Heterogeneidad: (Dentro)Entre elementos del mismo conglomerado

Page 33: CLAS 4A Tecnicas de Muestreo

Ejemplo 5: Encuesta “Conteo rápido”

• Selección de una muestra sistemática de mesas de sufragio, inmediatamente después del proceso de elecciones.

• Población: Los electores que participaron en la votación

• Conglomerado: mesa de sufragio

• Elemento: elector

• Unidad reportante: Acta electoral

• Marco de muestreo: Listado de mesas de sufragio ordenados por ubicación geográfica

Page 34: CLAS 4A Tecnicas de Muestreo

Problema en el muestreo de conglomerados

• En los conglomerados compactos se espera que los elementos de un mismo conglomerado tengan características similares (pero no puede ser así)

• Puede no ser necesario entrevistar a todos los elementos de un mismo conglomerado compacto.

• El exceso de información al entrevistar a todos los elementos del conglomerado, incrementa el costo del muestreo.

Page 35: CLAS 4A Tecnicas de Muestreo

Muestreo multietápico

• Características• Selecciona primero una muestra de conglomerados. Luego,

selecciona una submuestra de elementos en cada conglomerado seleccionado. Este tipo de muestreo se le denomina muestreo en dos etapas o bietápico.

• La generalización de este muestreo a más etapas se llama muestreo Multietápico o Polietápico (Mahalanobis).

• Ventajas• Las mismas ventajas del muestreo de conglomerados, es decir,

reducción del costo y tiempo

• La muestra se distribuye mejor que en el muestreo de conglomerados.

Page 36: CLAS 4A Tecnicas de Muestreo

Esquema gráfico de una muestra bietápica

UPM no seleccionada

UPM seleccionada

USM seleccionadaUSM no

seleccionada

Page 37: CLAS 4A Tecnicas de Muestreo

Selección de unidades

• Unidades Primarias– Listados y mapas con estadísticas de manzaneo– Selección con PPT simple y PPT sistemático

• Unidades Finales– Selección sistemática con conteo rápido – Rutas aleatorias– Tablas de Kish (selección de personas)

Page 38: CLAS 4A Tecnicas de Muestreo

Ejemplo 6: Muestreo bietápico (Manzanas y viviendas)

• Diseño 1: – Selección de manzanas con probabilidades iguales

• fracción de muestreo constante en cada manzana seleccionada

– Selección de viviendas con probabilidades iguales en cada manzana seleccionada

• Diseño 2: – Selección de manzanas con probabilidades desiguales

• número constante de viviendas en cada manzana seleccionada

– Selección de viviendas con probabilidades iguales en cada manzana seleccionada

Page 39: CLAS 4A Tecnicas de Muestreo

Tamaños de muestra

Tamaños óptimos Minimizan la varianza del estimador para un costo

de muestreo fijo Requiere los costos de muestreo por unidad

encada etapa Requiere estimación de varianzas en cada unidad

de muestreo y entre unidades de etapas diferentes Regla práctica

Utilizar diseño auto ponderado Obtener el tamaño de muestra de unidades finales bajo

fórmulas de MIA o MAE Distribuir el tamaño de muestra de unidades finales a todas

las etapas, según las condiciones de la auto ponderación.

Page 40: CLAS 4A Tecnicas de Muestreo

Fin