Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En...

35
Muestreo en Poblaciones Finitas Diseños Muestrales Complejos José A. Mayor Gallego Departamento de Estadística e Investigación Operativa Universidad de Sevilla Curso 2014-2015 MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados. Diseños Muestrales Complejos CB 1/35

Transcript of Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En...

Page 1: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestreo en Poblaciones FinitasDiseños Muestrales Complejos

José A. Mayor Gallego

Departamento de Estadística e Investigación OperativaUniversidad de Sevilla

Curso 2014-2015

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 1/35

Page 2: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Contenidos

1 Introducción

2 Diseños muestrales complejos y muestras complejas

3 Cálculo de los pesosMuestreo Aleatorio Simple BásicoMuestreo con Probabilidades Variables BásicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

4 Variables de Estructura. Error de Muestreo. Efecto del DiseñoVariables de EstructuraError de MuestreoEfecto del Diseño

5 Bibliografía

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 2/35

Page 3: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Introducción. Objetivos

Vamos a describir los diseños muestrales complejos, como diseñosgenerados por la composición de otros, y lo haremos en paralelo a ladescripción del “software” existente para generar estos diseños yprocesar los datos muestrales obtenidos. Estos procesos estáníntimamente relacionados con,

El diseño de una encuesta por muestreo: Se parte de una seriede objetivos y condiciones poblacionales para decidir como seobtendrá la muestra.

El análisis de los datos: A partir de los datos obtenidos en lamuestra, se obtienen las estimaciones de los parámetros. Es elobjetivo final en este tipo de investigaciones.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 3/35

Page 4: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

“Sofware para Diseños Complejos

SPSS. Módulo de Muestras Complejas.

R. Librería Survey.

SAS. Rutinas surveyselect, surveymeans, surveyfrec,surveyreg y surveylogistic.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 4/35

Page 5: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestras Complejas

Los programas que realizan las tareas relacionadas con elmuestreo se denomina genéricamente de procesamiento deMuestras Complejas, lo que es una traducción de laterminología inglesa Complex Samples, es decir, muestrascomplejas.

Para justificar esta denominación y también a modo de revisiónde los conceptos de la Teoría del Muestreo en PoblacionesFinitas que se van a manejar en relación a este programa,vamos a ver a continuación una descripción genérica,empleando ejemplos conectados con la realidad, de los diseñosmuestrales complejos.

Dedicaremos la máxima atención a las probabilidades deinclusión, pues a partir de ellas se derivará el concepto depeso, que como veremos es fundamental para la aplicación delos distintos programas.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 5/35

Page 6: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Diseños muestrales complejos y muestras complejas

Diseño Muestral. Definición formalUn conjunto de muestras potenciales, y una distribución deprobabilidad sobre las mismas.

Diseño Muestral. Concepto aplicado

Un conjunto de especificaciones y reglas para seleccionar unamuestra (aleatoria) de una población.

Diseño Muestral Complejo

Es un diseño muestral, o sea, un procedimiento aleatorio paraseleccionar una muestra a partir de una población, en el cualintervienen distintas estructuras poblacionales, ya sean naturales,artificiales de tipo administrativo, etc.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 6/35

Page 7: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Diseños muestrales básicos

En su aspecto más básico, el proceso de muestreo y estimacióncomienza seleccionando de una población, U, un conjunto deelementos que determinan una muestra m. Esta selección esaleatoria y se puede hacer de muchas formas,

Muestreo Aleatorio Simple.

Muestreo de Bernoulli.

Muestreo Sistemático Uniforme.

Muestreos con Probabilidades Variables: Sampford, Madow, etc.

Y un largo etcétera.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 7/35

Page 8: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

La iniciación al Muestreo y la realidad

En su forma más simple, los muestreos se estudian como si lamuestra se extrajera directamente de la población, es decir, como sila población U fuera un marco directamente accesible, y loselementos de la muestra se seleccionaran de dicho marco medianteun procedimiento que se aplica directamente sobre este.

Esto que puede ser factible en algunas ocasiones, y de hecho sehace a veces, es problemático, difícil o imposible en muchas otras.Veamos dos situaciones paradigmáticas.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 8/35

Page 9: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Situación 1: Gran variabilidad o dispersión

Los elementos de la población presentan mucha variabilidad enrelación a la característica que se estudia, lo que produce que lasestimaciones presenten un ELEVADO ERROR DE MUESTREO. Unaforma de disminuir este error es dividir la población en partes máshomogéneas y realizar muestreos en todas y cada una de estaspartes.

Las muestras obtenidas se unen o juntan para producir una únicamuestra final, m. Como puede verse, aquí los elementos no seseleccionan directamente, mediante un muestreo, de la poblaciónoriginal, sino que esta se estructura en partes, y la selección serealiza en cada parte. Como vemos, en esta situación lo que sepretende es disminuir el error.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 9/35

Page 10: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Situación 2: Accesibilidad a los elementos

De forma directa, los elementos de la población no son fácilmenteaccesibles, no dándose las circunstancias adecuadas para construiruna muestra pues no necesariamente se dispone de un marco oámbito bien definido de los elementos de los que se quiereseleccionar aquella.

Ejemplo

Si un encuestador es enviado a una urbanización formada por Mbloques de apartamentos, para hacer una encuesta a las familiasque allí habitan, puede tener problemas para seleccionar la muestraya que con seguridad no va a disponer de una lista bien elaborada delas unidades familiares.Una solución sería seleccionar previamente mediante un muestreoen el conjunto de bloques, por ejemplo tres de los mismos, y acontinuación estudiar cada uno de estos tres bloques seleccionados,ya sea mediante un análisis exhaustivo de los mismos, ya searealizando nuevamente muestreos en cada uno.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 10/35

Page 11: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Situación 1: Muestreo Estratificado

En una provincia geográfica dividida en siete se quiere realizar unestudio de la producción de cereal mediante la selección de unamuestra de granjas en toda la provincia. Para ello, en cada comarcase realiza un muestreo seleccionando 10 granjas por comarca. Alfinal, tenemos una muestra de 70 granjas formada por la unión de lasmuestras obtenidas en cada comarca. Se supone que los sietemuestreos básicos son independientes.

Esto es un caso típico de MUESTREO ESTRATIFICADO y lasmencionadas divisiones se denominan ESTRATOS. El muestreo selleva a cabo de forma que en todas y cada una de las divisiones oestratos se realiza un muestreo.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 11/35

Page 12: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Situación 2: Muestreo por Conglomerados. Una Etapa

En un distrito municipal de una gran ciudad se desea realizar unaencuesta entre la población joven de entre 16 y 25 años, paraestudiar sus hábitos de lectura. Dicho distrito está dividido en 47secciones censales no muy extensas.Indiquemos que las secciones censales de un municipio son areasgeográficas de tipo administrativo delimitadas o definidas por ejemplopor ciertas calles o plazas. Por ejemplo, el Distrito Sur de Sevillacuenta con 82 secciones censales.Para seleccionar la muestra de jóvenes, se selecciona previamenteuna muestra de cuatro secciones censales. A continuación, esascuatro secciones se estudian de forma exhaustiva o completa, esdecir, todos los jovenes de las mismas son entrevistados. Así, si lassecciones censales de la muestra tienen respectivamente 200, 350,120 y 250 jóvenes, la muestra final tendrá 920 jóvenes.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 12/35

Page 13: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Situación 2 :Muestreo por Conglomerados. DosEtapas

Es una variación del ejemplo anterior. En un distrito municipal de unagran ciudad se desea realizar una encuesta entre la población jovende entre 16 y 25 años, para estudiar sus hábitos de lectura. Dichodistrito está dividido en 75 secciones censales cada una de lascuales con un número considerable de jóvenes.Para seleccionar la muestra de jóvenes, se selecciona previamenteuna muestra de seis secciones censales. A continuación, en cadauna de esas seis secciones se realiza un muestreo para seleccionarun conjunto de jóvenes.Nótese que ahora el muestreo global está compuesto de 1 + 6 = 7muestreos distintos. En una primera fase o etapa se obtiene lamuestra de secciones, y en una segunda fase o etapa, en cadasección de la muestra anterior, se obtienen muestras de jóvenes.Aquí tenemos un caso típico de lo que se denomina MUESTREOPOR CONGLOMERADOS EN DOS ETAPAS, pues hay dos etapas ofases de muestreo, como se describe en el párrafo anterior.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 13/35

Page 14: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Ideas Fundamentales de los Diseños Complejos

Primera Idea Fundamental.

Existen dos estructuras básicas: ESTRATOS yCONGLOMERADOS

Segunda Idea Fundamental.

Estructuralmente, los ESTRATOS y los CONGLOMERADOS son lasmismas cosas: PARTES DE LA POBLACIÓN. La diferencia consisteen:

Su diferente tratamiento muestral. Se hace muestreo en TODOSY CADA UNO DE LOS ESTRATOS. Por contra, Se seleccionansólo ALGUNOS CONGLOMERADOS a partir de los existentes.

Su diferente finalidad. Los ESTRATOS, supuestos máshomogéneos, REDUCEN ERROR DE ESTIMACIÓN. LosCONGLOMERADOS PERMITEN y/o FACILITAN el acceso a loselementos que se van a estudiar.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 14/35

Page 15: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Ideas Fundamentales de los Diseños Complejos

Tercera Idea FundamentalEn la práctica no nos vamos a encontrar, usualmente, con unmuestreo básico o directo de los elementos.

Pero tenemos que decir que ni siquiera nos vamos a encontrar consituaciones menos simples como un muestreo estratificado o unmuestreo por conglomerados.

Muy al contrario, lo más usual será tener una COMBINACIÓN OMEZCLA DE DIFERENTES ESTRUCTURAS Y DISEÑOSMUESTRALES.

Además, a todo esto, hay que añadirle las múltiples posibilidades quehay al realizar los muestreos básicos, en los que podemos emplearMuestreo Aleatorio Simple, Muestreo Sistemático Uniforme,Muestreo con probabilidades variables en sus variadas formas, y unlargo etcétera

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 15/35

Page 16: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Algunos Ejemplos de Mezclas de Diseños

Un muestreo estratificado, en el cual, en cada estrato, se realizaun muestreo por conglomerados en dos etapas, seleccionandolos conglomerados mediante Probabilidades Variables, y loselementos posteriores con Muestreo Aleatorio Simple.

Un muestreo por conglomerados en dos etapas, en el cual, lasegunda etapa se realiza mediante Muestreo Aleatorio Simpleestratificado en cada conglomerado.

Un muestreo por conglomerados en dos etapas, en el cual, en laprimera etapa se seleccionan los conglomerados MuestreoSistemático, y la segunda etapa es a su vez un muestreo porconglomerados en dos etapas, ambas mediante MuestreoAleatorio Simple.

Un muestreo estratificado, en el cual, en cada estrato, se realizaun muestreo por conglomerados en dos etapas, y en el cual, asu vez, la segunda etapa se realiza mediante muestreoestratificado en cada conglomerado.

Y un largo etcétera de muchas más combinaciones.MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 16/35

Page 17: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Diseños Muestrales Complejos

En cualquiera de estas situaciones, sea cual sea la combinación deprocedimientos, al final tenemos como resultante UN DISEÑOMUESTRAL que es el producto final de la mezcla de todos losdiseños muestrales que intervienen.

Un diseño muestral de este tipo se denomina diseño muestralcomplejo. Las muestras obtenidas con tales diseños se pueden porello denominar muestras complejas. Los programas deprocesamiento de muestras complejas nos permiten,

Construir este tipo de muestras, mediante distintas opciones demuestreo, y suponiendo que intervienen diferentes estructuras,posiblemente combinadas: estratos y conglomerados.

Analizar los datos muestrales para obtener estimaciones deparámetros.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 17/35

Page 18: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Conceptos Fundamentales: Probabilidades de Inclusión y Pesos

Probabilidades de InclusiónSi queremos estimar parámetros a partir de un muestreo realizadocon un diseño complejo, por complicado que sea, al final nos vamosa encontrar con una muestra de elementos, y la clave consiste,básicamente, en calcular las probabilidades de inclusión.

Estimación de un Total PoblacionalSi queremos estimar el total de la variable Y a partir de una muestram, aplicamos el estimador de Horvitz-Thompson,

tyπ =∑i∈m

yi

πi=

∑i∈m

ωiyi siendo ωi =1πi∀i ∈ m

Pesos o Ponderaciones

ωi =1πi

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 18/35

Page 19: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Estimación de la Media Poblacional

Si lo que queremos estimar es la media poblacional de la variable, esdecir, el parámetro y , podemos emplear nuevamente el estimador deHorvitz-Thompson,

yUπ =1N

∑i∈m

yi

πi

o también el estimador de Hájek,

yUHH =

∑i∈m

yi/πi∑i∈m

1/πi

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 19/35

Page 20: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Estimadores empleados.

Los programas realizan la estimación de un total poblacionalmediante el estimador de HorvitzThompson,

tyπ(Y ) =∑i∈m

yi

πi=

∑i∈m

ωiyi

siendo yi la variable que se estudia, y ωi = 1/πi los pesos quesuministraremos al programa.

La media poblacional y las proporciones, mediante el estimadorde Hájek,

yUHJ =

∑i∈m

yi/πi∑i∈m

1/πi

=

∑i∈m

ωiyi∑i∈m

ωi

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 20/35

Page 21: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Cuarta Idea Fundamental

Para realizar estimaciones tenemos que,

Calcular las Probabilidades de Inclusión

y a partir de las mismas Calcular los Pesos

IMPORTANTECuando la muestra a analizar ha sido previamente diseñada yobtenida mediante SPSS u otro programa, es usual que contengainformación sobre los pesos. Si no tenemos los pesos, ya sea porque la muestra ha sido obtenida por otros medios, o por otrasrazones, tendremos que calcularlos. A continuación vemos algunassituaciones.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 21/35

Page 22: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestreo Aleatorio Simple Básico

Si N es el tamaño de la población, y n es el tamaño de la muestra,las probabilidades de inclusión son,

πi =nN

por lo que los pesos son,

ωi =Nn

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 22/35

Page 23: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestreo con Probabilidades Variables Básicos

Estos muestreos se realizan empleando una variable de TAMAÑO,de tal forma que los elementos “MÁS GRANDES” tengan másprobabilidad de ser seleccionados. Si denotamos Xi a dicha variable,T (X ) a la suma, sobre la población, de todos los tamaños, y n altamaño de la muestra, las probabilidades de inclusión son,

πi =nXi

T (X )por lo que los pesos son ωi =

T (X )

nXi

Uno de los procedimientos de este tipo más empleados es el métodode Sampford. Dicho método permite obtener n elementosmuestrales sin reemplazamiento y con probabilidades de inclusiónvariables y proporcionales a Xi . SPSS tiene implementado estemétodo.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 23/35

Page 24: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestreo Aleatorio Simple Estratificado

Para simplificar supongamos dos estratos, de tamaños N1 y N2, enlos que se seleccionan respectivamente n1 y n2 elementos mediantesendos muestreos aleatorios simples en cada estrato. Lasprobabilidades de inclusión son,

πi =n1

N1en el estrato 1 y πi =

n2

N2en el estrato 2

por lo que los pesos son,

ωi =N1

n1en el estrato 1 y ωi =

N2

n2en el estrato 2

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 24/35

Page 25: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestreo por Conglomerados en Una Etapa. Selección deConglomerados mediante Muestreo Aleatorio Simple

Supongamos que hay M conglomerados, y se seleccionan g. Laprobabilidad de inclusión de un elementos será la del conglomeradosal que pertenece, es decir,

πi =gM

por lo que los pesos son,

ωi =Mg

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 25/35

Page 26: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestreo por Conglomerados en Dos Etapas. Selección deConglomerados y Elementos mediante Muestreo Aleatorio Simple

Supongamos que hay M conglomerados, y se seleccionan g. Encada conglomerado k , con Nk elementos, seleccionamos nkelementos finales también mediante muestreo aleatorio simple. Laprobabilidad de inclusión de un elementos será la del conglomeradosal que pertenece multiplicada por la del elemento dentro delconglomerado, es decir,

πi =gM

nk

Nk

por lo que los pesos son,

ωi =Mg

Nk

nk

En general, habrá tantos pesos distintos como conglomerados.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 26/35

Page 27: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Muestreo por Conglomerados en Dos Etapa. Selección deconglomerados con Probabilidades Variables, y de Elementosmediante Muestreo Aleatorio Simple

Supongamos que hay M conglomerados, y se seleccionan g. Laselección se hace, por ejemplo mediante el método de Sampford,empleando el tamaño de los conglomerados como variable tamaño.Supongamos que la suma de todos los tamaños es NEn el conglomerado k , con Nk elementos, seleccionamos nkelementos finales mediante muestreo aleatorio simple. Laprobabilidad de inclusión de un elementos será la del conglomeradosal que pertenece multiplicada por la del elemento dentro delconglomerado, es decir,

πi =gNk

Nnk

Nk=

gnk

N

por lo que los pesos son,

ωi =N

gnk

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 27/35

Page 28: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Variables de Estructura

EstratosPara definir y manejar una estructura de estratos los progamasemplearán una o varias variables, cuyos diferentes nivelesdeterminarán dichos estratos.

Conglomerados

Iguamente, para definir y manejar una estructura de conglomeradosse emplearán también una o varias variables, cuyos diferentesniveles determinarán dichos conglomerados.

Subpoblaciones

Es usual, al realizar las estimaciones de los parámetros, hacerlotanto para la población total, como para partes o subpoblaciones dela misma. Iguamente, para definir subpoblaciones se emplearán unao varias variables, cuyos diferentes niveles determinarán dichosconglomerados.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 28/35

Page 29: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Variables de Estructura

Ejemplo

En una población de individuos los conglomerados están definidospor secciones censales, SC, y los estratos por el cruce deSEXO:[H,M] y grupos de EDAD:[A,B,C]. A:jóvenes, B:intermedios,C:Mayores. Tendremos múltiples variables, y tres de ellas serán lasanteriores,

VAR01 VAR02 ...... SEXO EDAD SC VAR09--------------------------------------------------.... .... ...... V B 23 ........ .... ...... M A 23 ........ .... ...... M B 34 ........ .... ...... V B 34 ........ .... ...... V A 53 ........ .... ...... ... ... .... ....--------------------------------------------------

Las variables SEXO y EDAD definen pues una estructura de seis estratos.La variable SC define la estructura de conglomerados. Además, la variableSEXO podría ser utilizada para desagregar las estimaciones.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 29/35

Page 30: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Error de Muestreo

Error, Intervalo de Confianza, ContrastesLa estimación de parámetros a partir de una muestra es un procesoinferencial, y por consiguiente conlleva un error.El “software” usual proporciona una medida del error de muestreodenominándolo error típico, cuyo significado es la desviación típicaestimada de la estimación, es decir, si θ es el parámetro que seestima, el error típico o “standard error” [SE en el “package”SURVEY],

Error Típico =

√V [θ] = σ

También proporcionan un intervalo de confianza, basado en ladistribución normal o la distribución t de Student, de la forma porejemplo,

(θ − σ tg.l.1−α/2 , θ + σ tg.l.

1−α/2)

Siendo g.l . los grados de libertad calculados como la diferencia entreel número de unidades muestrales y el de estratos, en la primeraetapa.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 30/35

Page 31: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Cálculo del Error de Muestreo

Probabilidades de inclusión de segundo orden, πij

Las fórmulas matemáticas que permiten calcular el error de muestreocuando se realiza un muestreo usual, sin reemplazamiento, necesitancomo datos las probabilidades de inclusión de segundo orden, πij .En procesos de selección basados en muestreo aleatorio simple,estas probabilidades son muy sencillas y los programas las puedencalcular mediante una fórmula del tipo,

πij =n(n − 1)

N(N − 1)

siendo n el tamaño muestral y N el tamaño poblacional.

El problema se presenta si nuestro muestreo complejo contiene unaprimera etapa de selección de conglomerados mediante unprocedimiento muestral sin reemplazamiento, con probabilidadesvariables pues en tal caso, el cálculo de la πij no es tan simple, yademás depende del método empleado.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 31/35

Page 32: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Cálculo del Error de Muestreo

Caso A: Disponemos de un fichero con las πij

Esto sería lo ideal, pues podemos calcular el error de muestreo deforma exacta. Esta situación es la que tendremos usualmente cuandola muestra haya sido construida también mediante SPSS, pues en talcaso este programa se crea automáticamente un fichero con las πij .

En este caso, sólo será necesario indicarle a SPSS el mencionadofichero con las πij , con lo que el programa realizará los cálculos deforma automática.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 32/35

Page 33: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Cálculo del Error de Muestreo

Caso B: No tenemos las πij , ni podemos o no queremos calcularlas.

En esta situación, existe la posibilidad de indicar a SPSS, aunque nosea cierto, que el muestreo de conglomerados en la primera etapa seha realizado CON reemplazamiento. La teoría del Muestreo pruebaque para este tipo de muestreos, basta con probabilidades de primerorden para estimar el error. Para muchos diseños muestralesusuales, esto produce una ligera sobrestimación del error.IMPORTANTE: no es que el error aumente, es que SPSS da un valoralgo mayor [Enfoque conservador].

El “package” SURVEY, por defecto, supone que la muestra se haobtenido con reemplazamiento, aunque permite también laposibilidad de calcular el error de muestreo a partir de fórmulasaproximadas para las πij , e incluso emplear fórmulas exactassuministrando las probabilidades de inclusión de segundo orden.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 33/35

Page 34: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Efecto del Diseño

Comparación con el Muestreo Aleatorio Simple Básico

Cuando se emplea un diseño complejo es interesante comparar elerror que se obtiene con el que se obtendría aplicando MuestreoAleatorio Simple Básico.SAS, SPSS y R[survey] pueden realizar esta comparación,calculando el efecto del diseño, que no es otra cosa que,

EFD =Vnuestro diseñoVM.A.S. básico

es decir, el cociente entre las varianzas estimadas de nuestreodiseño y del Muestreo Aleatorio Simple Básico. Aunque es másindicativo calcular

√EFD pues el error típico viene dado a partir de la

desviación típica.INTERPRETACIÓN: Según sea menor o mayor que 1, indica sinuestro diseño produce menos o más error que un MuestreoAleatorio Simple Básico, que se emplea como referencia.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 34/35

Page 35: Muestreo en Poblaciones Finitas - personal.us.espersonal.us.es/jmayor/ficheros/mu_iea_07.pdf · En su aspecto más básico, el proceso de muestreo y estimación comienza seleccionando

Bibliografía

Fernández García, F.R. y Mayor Gallego, J.A. (1995). Muestreo enpoblaciones finitas: Curso básico. E.U.B. Ediciones Universitarias deBarcelona.

Lohr, S.L. (2010). Sampling: Design and Analysis. 2nd. Edition.Brooks/Cole. International Edition.

Särndal, C., Swensson, B. and Wretman, J. (1992). Model AssistedSurvey Sampling. Springer-Verlag. New York, Inc.

MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.Diseños Muestrales Complejos CB � 35/35