MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

47
Muestreos Introducción a la evaluación de la calidad de la información geográfica INTRODUCCIÓN. TIPOS DE MUESTREOS. DISEÑO MUESTRAL. MUESTREO ALEATORIO SIMPLE (MAS). TAMAÑO MUESTRAL EN MAS. MUESTREO ALEATORIO ESTRATIFICADO. MUESTREO POR CONGLOMERADOS.

Transcript of MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Page 1: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Muestreos

Introducción a la evaluación de la calidad de la información geográfica

INTRODUCCIÓN.TIPOS DE MUESTREOS.DISEÑO MUESTRAL.MUESTREO ALEATORIO SIMPLE (MAS).TAMAÑO MUESTRAL EN MAS.MUESTREO ALEATORIO ESTRATIFICADO.MUESTREO POR CONGLOMERADOS.

Page 2: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INTRODUCCIÓN

¿Por qué evaluamos?

Page 3: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INTRODUCCIÓN

Existen 2 estrategias para obtener información de una población: - Censo: Observar todas las unidades de esa población.

• Descripción perfecta de la población.• Cobertura total.• Mayor aceptación.• No se requieren mayores conocimiento de estadística.

- Muestreo: Examinar una parte de la población.

• Extrapolación – Riesgo.• Menor costo.• Mayor rapidez.• Exactitud aceptable.

Page 4: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INTRODUCCIÓN

Otras razones de porque hacer un muestreo cuando el censo nos da total certeza de la variable de estudio.

• Menor costo.• Mayor rapidez.• Mayor exactitud o mejor calidad en la información (menos

trabajo, mayor control, mejor formación al relevador, menor probabilidad de cometer errores).

• Población muy grande.• Población homogénea que permite una buena

representación de la misma tomando algunos elementos de ella.

• Procedimiento destructivo. La información a obtener depende del número de elementos de la muestra y la dispersión de la misma.

Page 5: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INTRODUCCIÓN

Los censos también tienen sus ventajas

• Cubre toda la población.

• Tiene mayor aceptación.

• No se requieren grandes conocimientos de estadística.

Page 6: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INTRODUCCIÓN

“El objetivo de un muestreo en poblaciones finitas es desarrollar

técnicas que permitan seleccionar muestras o subgrupos del

conjunto finito de unidades objeto de estudio, a partir de las cuales

se puede inferir, con ciertas garantías, la característica de

interés de la población.” Para esto debemos especificar dos cosas:

● El procedimiento de selección de la muestra.

● El estimador de la característica de estudio.

Page 7: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

TIPOS DE MUESTREOS

Muestreos no probabilísticos:– Puede mostrar adecuadamente las características de la

población en determinadas circunstancias – No representativa.

Muestreos probabilísticos:

– Todos los elementos de la población tienen una probabilidad de ser seleccionados.

– Se conoce la probabilidad de seleccionar una muestra.– Permite controlar el error en la estimación.– Determinar el mejor estimador.

Page 8: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

TIPOS DE MUESTREOS

Las ventajas de un muestreo probabilístico son:

● Todos los elementos de la población tienen una probabilidad concreta de ser seleccionados.

● Se conoce la probabilidad de obtener una muestra con una composición concreta.

Esto nos permite controlar el error en la estimación y

seleccionar el mejor estimador para la característica de interés.

Page 9: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

DISEÑO MUESTRAL

Espacio muestral: Conjunto de muestras posibles del caso de estudio. Diseño muestral: Procedimiento por el cual se selecciona una muestra de manera que cada una de ellas tiene una probabilidad de ser seleccionada.

Muestreos probabilísticos.– Aleatorio simple.– Estratificado.– Sistemático.– Conglomerado.

Muestreos no probabilísticos.– Intencional o selección de expertos.– Casual o errático.– Cuotas.– “Bola de nieve”

Diseño muestral = Espacio muestral + probabilidad de cada muestra

Page 10: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

ERRORES DE MUESTREO

ERRORES DEBIDO AL MUESTREO o DE MUESTREO: es el resultado de trabajar con una muestra y está asociado a la forma de seleccionar esa muestra. Cuanto menor sea este error la estimación tendrá una precisión mayor.

ERRORES AJENOS AL MUESTREO: aparecen tanto en muestreos como en censos y afectan más a estos y tienen menos posibilidad de corregirlos.

● Errores de observación (aparatos mal calibrados, errores al transcribir, etc.)

● Errores que no son de observación (marcos no actualizados, preguntas no contestadas).

Page 11: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

ETAPAS

– Identificación del problema y determinación de objetivos.– Hipótesis de estudio y variables involucradas.– Plan de muestreo.

– Población de estudio.– Cómo se selecciona la muestra.– Número de elementos de la muestra.– Cómo se mide el error de la estimación.

– Recopilación de la información.– Procesamiento de datos y análisis de los resultados.

Page 12: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INFERENCIA

Cuando hacemos inferencia (deducir algo o sacarlo como conclusión de otra cosa. RAE) nos interesa conocer una característica de la población a través de una función de los valores de esa característica medida en la muestra. Esa función se denomina parámetro.

Comúnmente si la variable es cuantitativa será la media o el total y si es cualitativa la proporción o la cantidad de elementos que presentan determinado atributo.

Esta estimación puede ser puntual o por intervalos.

Page 13: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INFERENCIA

La estimación puntual es una función (estimador) de los datos observados. Esto nos dará un valor al que llamaremos estimación.

Para que la estimación sea buena el estimador debe ser insesgado y preciso.

Para esto se basa en el ERROR CUADRÁTICO MEDIO el cual aúna ambos conceptos. Por lo tanto entre dos estimadores del mismo parámetro será mejor el que menor error cuadrático medio tenga.

Page 14: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

INFERENCIA

La estimación por intervalos se determina un rango de valores entre los que se encuentra el verdadero valor del parámetro desconocido con una determinada probabilidad.

Esto es el conocido intervalo de confianza y al cual se le asocia un nivel de confianza.

Esta estimación completa a la estimación puntual indicando una dispersión de la misma.

Page 15: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

MUESTREO ALEATORIO SIMPLE

Page 16: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

MUESTREO ALEATORIO SIMPLE

“Procedimiento de selección de una muestra de n elementos de entre los N de la población, con probabilidades iguales, sin reposición y sin tener en cuenta el orden de colocación de cada unidad dentro de la muestra”

Espacio muestral: Combinaciones sin repetición de N elementos tomados de a n (Cn

N).

Cada muestra tiene una probabilidad de 1/CnN de ser seleccionada.

Y cada elemento tiene una probabilidad de n/N de pertenecer a una muestra.

Page 17: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

ESTIMADORES

MEDIA

Donde s es la cuasi-varianza muestral.La raíz cuadrada de la varianza (V techo) es la estimación del error del muestreo o sea la precisión de la estimación del parámetro del diseño muestral aplicado.

Page 18: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

ESTIMADORES

TOTAL

Page 19: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

ESTIMADORES

PROPORCIÓN

DONDE Ai ES 1 SI EL ELEMENTO DE LA MUESTRA CUMPLE LA CONDICIÓN Y 0 SI NO LA CUMPLE.

DONDE p ES LA PROPORCIÓN MUESTRAL DE INDIVIDUOS QUE CUMPLEN CON LA CONDICIÓN.

Page 20: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

ESTIMADORES

TOTAL DE CLASE

Page 21: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

TAMAÑO MUESTRAL

TODO MUESTREO IMPLICA UNA SOLUCIÓN DE COMPROMISO ENTRE LA PRECISIÓN (RIESGO QUE ESTOS DISPUESTO A ASUMIR) Y ESFUERZO (TIEMPO, DINERO, ETC.).

ENTONCES HAY QUE PLANTEARSE LA SIGUIENTE PREGUNTA

¿QUÉ TAMAÑO DE MUESTRA SERÍA NECESARIO PARA REALIZAR UNA ESTIMACIÓN DEL PARÁMETRO CON UN MÁXIMO ERROR DE ESTIMACIÓN ADMISIBLE ε Y MANTENIENDO UN NIVEL DE CONFIANZA DE (1-α)%?

ε SIEMPRE ESTÁ EN LAS MISMAS UNIDADES DE LA VARIABLE DE ESTUDIO.

Page 22: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

TAMAÑO MUESTRAL

EL VALOR DE ε DEBE ESTAR EN CONSONANCIA CON EL PARÁMETRO QUE SE ESTÁ ESTIMANDO. DEBE DECIDIRSE TOMANDO EN CUENTA FACTORES COMO EL CARÁCTER CUANTITATIVO O CUALITATIVO DE LA VARIABLE O LA UNIDAD DE MEDIDA DE LA VARIABLE.

NO ES LO MISMO EQUIVOCARSE EN MEDIO METRO EN LA UBICACIÓN DE UNA COLUMNA DE ALUMBRADO PÚBLICO QUE MEDIO METRO EN EL LÍMITE DE UNA PROPIEDAD.

Page 23: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

TAMAÑO MUESTRAL

PARTIMOS DE LA SIGUIENTE ECUACIÓN PARA DETERMINAR EL TAMAÑO DE LA MUESTRA:

Page 24: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

TAMAÑO MUESTRAL

EL TAMAÑO MUESTRAL QUEDA DETERMINADO POR LA SIGUIENTE EXPRESIÓN:

Page 25: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

TAMAÑO MUESTRAL

CONSIDERACIONES GENERALES:- Si N tiende a infinito se toma n = n0- Si P y S2 no son conocidas se deben utilizar p y s2 las cuales deben ser obtenidas de un estudio previo.- Si no conocemos p debemos tomar el caso más desfavorable que es el caso de p= 0,5. Esto requerirá el tamaño muestral mayor. Este valor maximiza el producto p(1-p).

Page 26: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

MUESTREO ALEATORIO SIMPLE ESTRATIFICADO

El objetivo es disminuir el esfuerzo de la muestra dividiendo la población de forma más homogénea donde cada parte hace un mínimo de esfuerzo muestral. La población en cada estrato debe ser homogénea internamente en cuanto a la variable que se desea investigar.

Page 27: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Si tomamos un MAS en cada estrato la precisión del estimador combinado es mejor que el que se obtendría de un MAS común. En resumen el tamaño muestral va a ser menor y mejor la precisión en la estimación.

Las condiciones son que toda la población sea parte de un estrato y que cada elemento sólo forme parte de uno de los estratos.

MUESTREO ALEATORIO SIMPLE ESTRATIFICADO

Ni = Población de cada estrato N = Suma de cada Ni mi = es la cantidad de muestras que se pueden extraer de cada estrato con un tamaño ni, donde ni el tamaño muestral en cada estrato. El tamaño muestral n es la suma de los ni.

Page 28: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

VENTAJAS:– Tiende a representar mejor a la población con las muestras

seleccionadas en función de la definición de los estratos.– Se obtienen estimaciones más precisas en poblaciones

heterogéneas que las que se obtienen de una MAS.

MUESTREO ALEATORIO SIMPLE ESTRATIFICADO

DESVENTAJAS:– Es necesario conocer más información de la población a los

efectos de poder definir los estratos. – Suele ser frecuente la necesidad de recurrir a estudios piloto

para conocer la variable sobre la que se van a construir los estratos.

Page 29: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Tamaño muestral en cada estratoAFIJACIÓN

La afijación es el procedimiento por el cual se eligen y se asignan los tamaños muestrales en cada estrato.

TIPOS DE AFIJACIÓN: - Afijación Uniforme: Es aquella que asigna a cada estrato el mismo número de elementos en la muestra. No requiere conocer muchas información de la población.

ni = n / L para todo i

- Afijación Proporcional: Es aquella que distribuye el tamaño de la muestra de forma proporcional al tamaño de cada estrato. No requiere conocer muchas información de la población pero si la cantidad de elementos de cada estrato.

ni = K*Ni donde K = n / N

Page 30: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Tamaño muestral en cada estratoAFIJACIÓN

TIPOS DE AFIJACIÓN: - Afijación de Mínima Varianza o de Neyman: Consiste en asignar los tamaños de muestra por estrato, para un tamaño de muestra fija, de forma tal que la varianza del estimador de la media o del total sea mínima.

Esta afijación requiere que se conozca o se tenga una aproximación de la varianza del estimador en cada estrato.

Page 31: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Tamaño muestral en cada estratoAFIJACIÓN

TIPOS DE AFIJACIÓN: - Afijación Óptima: Consiste en asignar los tamaños de muestra por estrato, para un tamaño de muestra fija, de forma tal que se minimiza la varianza del estimador de la media para un coste fijo.

Esta afijación requiere que se conozca o se tenga una aproximación de la varianza del estimador en cada estrato.

Page 32: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Tamaño muestral en cada estratoAFIJACIÓN

TIPOS DE AFIJACIÓN: - La afijación uniforme no usa ninguna información disponible.

- La afijación proporcional hace uso sólo del conocimiento del tamaño de población en cada estrato. - La afijación de mínima varianza hace uso del conocimiento del tamaño de la población en cada estrato y de las cuasi-varianzas muestrales de la variable de estudio por estratos en una situación o tiempos anteriores, o bien, obtenidas a partir de un estudio piloto. - La afijación óptima usa la misma información que la de mínimas varianzas y además incorpora el costo de inspeccionar cada unidad.

Page 33: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Tamaño muestral en cada estratoAFIJACIÓN

SI COMPARAMOS LAS VARIANZAS VEMOS QUE A MAYOR INFORMACIÓN SOBRE LA POBLACIÓN LOS RESULTADOS SERÁN MÁS EFICIENTES YA QUE LA VARIANZA DEL ESTIMADOR DISMINUYE.

Page 34: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

El objetivo es disminuir el esfuerzo de la muestra dividiendo la población de grupos o conglomerados y tomar unos pocos de ellos. La muestra final es la compuesta por todos los elementos de los conglomerados seleccionados. Los conglomerados deben ser heterogéneos a la interna y homogéneos entre sí.

MUESTREO POR CONGLOMERADOS

Page 35: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

VENTAJAS- No necesita de un marco muy específico a diferencia del muestreo aleatorio simple, en el que se necesita disponer de un listado de las unidades. En este caso solo se necesita disponer del listado de las unidades de los conglomerados seleccionados.- Se pueden utilizar como conglomerados las divisiones territoriales ya establecidas ya que si se concentran las unidades disminuyen los costos.- Se ahorra coste y tiempo al efectuar visitas a las unidades seleccionadas ya que la concentración de unidades disminuye el costo de desplazamiento.

MUESTREO POR CONGLOMERADOS

Page 36: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

DESVENTAJAS- Menor precisión en las estimaciones debido a que, aunque lo ideal de la heterogeneidad dentro de los conglomerados, existe siempre un grado de homogeneidad en los mismos.- La eficiencia de este tipo de muestreo disminuye al aumentar el tamaño de los conglomerados.

MUESTREO POR CONGLOMERADOS

Page 37: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

Si partimos de una población de tamaño M que se puede dividir en N conglomerados de forma que no se solapan y cubren toda la población. Llamaremos Mi al número de unidades elementales que contiene el conglomerado y lo llamaremos tamaño del conglomerado. Pueden ser de igual o distinto tamaño.

MUESTREO POR CONGLOMERADOSEN UNA ETAPA

Page 38: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

MUESTREO POR CONGLOMERADOSEN DOS ETAPAS O BIETÁPICO

En el caso anterior se necesita contar con el total para la variable de estudio en cada conglomerado de la muestra.

Como esto suele ser inviable, se plantea un nuevo esquema de muestreo. Este consiste en, en los conglomerados seleccionados se seleccionan sub muestras para poder estimar los totales de la variable en los conglomerados de muestra inicial.

Entonces se estima Xi mediante Mi en cada i conglomerado de la muestra.

Page 39: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

MUESTREO POR CONGLOMERADOSEN DOS ETAPAS O BIETÁPICO

PASOS: 1) Del conjunto de N conglomerados que forman la población se selecciona una muestra de n conglomerados mediante una MAS.

2) En cada uno de los conglomerados de la muestra anterior que tienen un tamaño Mi se seleccionan sub muestras a través de un MAS de tamaños mi de manera independiente en cada conglomerado. El resultado es una muestra de tamaño m que es la suma de los mi

Page 40: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

RECOPILACIÓN

POBLACIÓN DE INTERÉS- La población de interés condiciona todo el trabajo.Ej: en un control posicional en principio todos los puntos serían parte de nuestra población, pero cuando lo llevamos al campo tenemos que tomar punto bien definidos, identificables y accesibles.

- Para que todo lo enunciado para los distintos muestreos respecto del error de estimación sea válido, el error de procedimiento tiene que tender a 0. Esto implica personal formado y especificaciones claras que no queden libradas a las interpretaciones.

- El tamaño de la población es un parámetro que se necesita pero es muy difícil de conocer. Si no se conoce se puede realizar un muestreo para estimarlo o si es muy grande simplificar considerando que N tiende a infinito.

Page 41: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

RECOPILACIÓN

CARACTERÍSTICA A ESTIMAR - Hay que definir correctamente la característica a estudiar. - Hay que conocer el comportamiento variacional de la característica a estimar a los efectos de poder determinar correctamente el tamaño muestral. - Si no se conoce hay que tomar el caso más desfavorable aunque sea a un costo mayor.

Page 42: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

RECOPILACIÓN

NIVEL DE CONFIANZA - Se debe establecer un nivel de confianza para las estimaciones que se obtengan del proceso de muestreo. - Estos niveles establecen la amplitud del intervalo de confianza con el que se trabaja. Por lo tanto a mayor nivel de confianza la probabilidad de que el valor real esté incluido en el mismo es mayor.

Page 43: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

RECOPILACIÓN

PRECISIÓN DE LA ESTIMACIÓN- La estimación de un parámetro por medio de muestreos se realiza asumiendo una cierta precisión o incertidumbre en el proceso de estimación. Esta estimación es en las unidades del parámetro.

- Estas precisiones deben ser realistas ya que este factor repercute directamente en el tamaño muestral y por lo tanto en costos.

- Como puede pasar que no conozca el tamaño muestral hasta la ejecución final del muestreo luego de una fase piloto puede pasar que: 1) Se obtiene una precisión suficiente con la fase piloto. 2) que no se tenga la precisión suficiente, en este caso se actualizará la selección de la muestra y el diseño hasta alcanzar la precisión deseada.

Page 44: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

RECOPILACIÓN

ESQUEMA DE MUESTREO- El esquema de muestreo es la forma de obtener las muestras.

Page 45: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

RECOPILACIÓN

TAMAÑO DE LA MUESTRA- El tamaño es sinónimo de representatividad siempre y cuando la distribución de las muestras sea adecuada. - A mayor tamaño mayor eficiencia de los resultados y mayor la representatividad pero tiene costos mayores. EJECUCIÓN DE LOS TRABAJOS- Deben realizarse fielmente al diseño realizado y tomando las precauciones para minimizar los errores que pudieran ocurrir en el mismo.

Page 46: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

RECOPILACIÓN

ANÁLISIS DE LOS RESULTADOS- Hay que analizar el comportamiento de los valores como ser agrupamientos. - Hay que determinar las precisiones realmente alcanzadas en el muestreo para todos los parámetros estudiados. - Para lograr una buena representatividad es necesario: 1) Un tamaño de muestra adecuado. 2) Una distribución espacial adecuada a la realidad territorial. 3) Un histograma de la muestra que capture adecuadamente el histograma de la población.

Page 47: MUESTREO POR CONGLOMERADOS. MUESTREO ALEATORIO ...

BIBLIOGRAFÍA

Alba, M. V. (2009) Muestreos. En 2ª Edición del Curso de Experto Universitario en Evaluación de la Información Geográfica. Universidad de Jaén.