SPSS. Módulo de Muestras Complejaspersonal.us.es/jmayor/ficheros/spss_mc_iea09p.pdf · Dedicarmeos...

33
Introducci ´ on Dise ˜ nos muestrales complejos y muestras complejas alculo de los pesos Variables de Estructura. Error de Muestreo. Efecto del Dise˜ no SPSS. M ´ odulo de Muestras Complejas Jos´ e Antonio Mayor Gallego Departamento de Estad´ ıstica e Investigaci´ on Operativa Universidad de Sevilla. Facultad de Matem´ aticas I.E.A. Curso de SPSS Mayo de 2009 Prof. Jos´ e A. Mayor Gallego. Dpto. Estad´ ıstica e I.O. Universidad de Sevilla SPSS. M ´ odulo de Muestras Complejas 1/33

Transcript of SPSS. Módulo de Muestras Complejaspersonal.us.es/jmayor/ficheros/spss_mc_iea09p.pdf · Dedicarmeos...

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

SPSS. Modulo de Muestras Complejas

Jose Antonio Mayor Gallego

Departamento de Estadıstica e Investigacion Operativa

Universidad de Sevilla. Facultad de Matematicas

I.E.A. Curso de SPSSMayo de 2009

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 1/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Contenidos

1 Introduccion

2 Disenos muestrales complejos y muestras complejas

3 Calculo de los pesosMuestreo Aleatorio Simple BasicoMuestreo con Probabilidades Variables BasicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

4 Variables de Estructura. Error de Muestreo. Efecto del DisenoVariables de EstructuraError de MuestreoEfecto del Diseno

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 2/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Introduccion. Objetivos

En este curso, describiremos la aplicacion del programa estadıstico SPSS en el ambitodel muestreo en poblaciones finitas, en su doble vertiente de obtener muestras yanalizarlas para calcular estimaciones de parametros como medias, proporciones, etc.Estos procesos estan ıntimamente relacionados con,

El diseno de una encuesta por muestreo: Se parte de una serie de objetivos ycondiciones poblacionales para decidir como se obtendra la muestra.

El analisis de los datos: A partir de los datos obtenidos en la muestra, se obtienenlas estimaciones de los parametros. Es el objetivo final en este tipo deinvestigaciones.

SPSS y Muestreo en Poblaciones Finitas

SPSS es un clasico Programa Estadıstico de amplio espectro: analisis de datos,inferencia, analisis multivariante, series temporales, y un larguısimo etcetera.

A partir de la Version 13, incorpora el modulo de aplicacion al muestreo objetivode este curso.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 3/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

SPSS. Muestras Complejas

El modulo que realiza las tareas relacionadas con el muestreo se denominaMuestras Complejas , lo que es una traduccion de la terminologıa inglesaComplex Samples , es decir, muestras complejas.

Para justificar esta denominacion y tambien a modo de introduccion a losconceptos de la Teorıa del Muestreo en Poblaciones Finitas que se van a manejaren relacion a este programa, vamos a ver a continuacion una descripciongenerica, empleando ejemplos conectados con la realidad, de los disenosmuestrales complejos.

Dedicarmeos la maxima atencion a las probabilidades de inclusi on , pues apartir de ellas se derivara el concepto de peso , que como veremos esfundamental para la aplicacion de este potente software.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 4/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Disenos muestrales complejos y muestras complejas

Diseno Muestral. Definicion formal

Un conjunto de muestras potenciales, y una distribucion de probabilidad sobre lasmismas.

Diseno Muestral. Concepto aplicado

Un conjunto de especificaciones y reglas para seleccionar una muestra (aleatoria) deuna poblacion.

Diseno Muestral Complejo

Es un diseno muestral, o sea, un procedimiento aleatorio para seleccionar unamuestra a partir de una poblacion, en el cual intervienen distintas estructuraspoblacionales, ya sean naturales, artificiales de tipo administrativo, etc.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 5/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Disenos muestrales basicos

En su aspecto mas basico, el proceso de muestreo y estimacion comienzaseleccionando de una poblacion, U, un conjunto de elementos que determinan unamuestra m. Esta seleccion es aleatoria y se puede hacer de muchas formas,

Muestreo Aleatorio Simple.

Muestreo de Bernoulli.

Muestreo Sistematico Uniforme.

Muestreos con Probabilidades Variables: Sampford, Madow, etc.

Y un largo etcetera.

Referencia

La referencia,

Fernandez Garcıa, F.R. y Mayor Gallego, J.A. (1995a). Muestreo en poblacionesfinitas: Curso basico. E.U.B. Ediciones Universitarias de Barcelona.

contiene informacion pormenorizada sobre estos procedimientos.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 6/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

la iniciacion al Muestreo y la realidad

En su forma mas simple, y para que los estudiantes primerizos lo vayan entendiendo,los muestreos se estudian como si la muestra se extrajera directamente de lapoblacion, es decir, como si la poblacion U fuera un marco directamente accesible, ylos elementos de la muestra se seleccionaran de dicho marco mediante unprocedimiento que se aplica directamente sobre este.

Esto que puede ser factible en algunas ocasiones, y de hecho se hace a veces, esproblematico, difıcil o imposible en muchas otras. Veamos dos situacionesparadigmaticas.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 7/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Gran variabilidad o dispersion

Los elementos de la poblacion presentan mucha variabilidad en relacion a lacaracterıstica que se estudia, lo que produce que las estimaciones presente muchoerror de muestreo. Una forma de disminuir este error es dividir la poblacion en partesmas homogeneas y realizar muestreos en todas y cada una de estas partes.

Las muestras obtenidas se unen o juntan para producir una unica muestra final, m.Como puede verse, aquı los elementos no se seleccionan directamente, mediante unmuestreo, de la poblacion original, sino que esta se estructura en partes, y laselecci on se realiza en cada parte . Como vemos, en esta situacion lo que sepretende es disminuir el error .

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 8/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Accesibilidad a los elementos

De forma directa, los elementos de la poblacion no son facilmente accesibles pordeterminadas circunstancias.

Las cosas no son tan simples en la vida real, y muchas veces no se dan lascircunstancias adecuadas para construir una muestra pues no necesariamente sedispone de un marco o ambito bien definido de los elementos de los que se quiereseleccionar aquella. Veamos un ejemplo.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 9/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Accesibilidad a los elementos

Muestreo en Jardines de Hercules

Si un encuestador es enviado a Jardines de Hercules [una urbanizacion formada porun considerable numero de grandes torres de apartamentos, en las afueras de Sevilla,cerca del barrio exterior de Bellavista] para hacer una encuesta a las familias queallı habitan, puede tener problemas para seleccionar la muestra pues con seguridadno va a disponer de una lista bien elaborada de las unidades familiares.

Una solucion serıa seleccionar previamente mediante un muestreo en el conjunto detorres, por ejemplo tres de las mismas, y a continuacion estudiar cada una de estastres torres seleccionadas, ya sea mediante un analisis exhaustivo de las tres, ya searealizando nuevamente muestreos [serıan tres] en cada una de ellas.

No cabe duda de que el problema se ha simplificado bastante. Como vemos, en estasituaci on lo que se pretende es facilitar, o incluso a veces hacer posible, elmuestreo .

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 10/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo Estratificado

En una provincia geografica, con gran actividad agrıcola y dividida en siete comarcasde similar tamano, se quiere realizar un estudio de la produccion de cereal mediante laseleccion de una muestra de granjas en toda la provincia. Para ello, en cada comarcase realiza un muestreo seleccionando 10 granjas por comarca. Al final, tenemos unamuestra de 70 granjas formada por la union de las muestras obtenidas en cadacomarca. Se supone que los siete muestreos basicos son independientes.En este caso, las unidades que se van a estudiar son las granjas de la provincia. Lasdivisiones que se utilizan, es decir, las comarcas, son de tipo administrativo. Esto esun caso tıpico de MUESTREO ESTRATIFICADO y las mencionadas divisiones sedenominan ESTRATOS. El muestreo se lleva a cabo de forma que en todas y cadauna de las divisiones o estratos se realiza un muestreo.Notese que el muestreo es complejo en el sentido de que para obtener la muestra finalse ha aplicado una estructura especial de la poblacion como son las comarcas, y elmuestreo se he realizado realmente en cada una. Al final tenemos una muestra finalde 70 granjas que NO se han obtenido directamente de la poblacion provincial degranjas, sino a traves de las comarcas.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 11/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo por Conglomerados. Una Etapa

En un distrito municipal de una gran ciudad se desea realizar una encuesta entre lapoblacion joven de entre 16 y 25 anos, para estudiar sus habitos de lectura. Dichodistrito esta dividido en 47 secciones censales no muy extensas.Indiquemos que las secciones censales de un municipio son areas geograficas de tipoadministrativo delimitadas o definidas por ejemplo por ciertas calles o plazas. Porejemplo, el Distrito Sur de Sevilla, en el cual se ubica nuestra Facultad deMatematicas, cuenta con 82 secciones censales.Para seleccionar la muestra de jovenes, se selecciona previamente una muestra decuatro secciones censales. A continuacion, esas cuatro secciones se estudian deforma exhaustiva o completa, es decir, todos los jovenes de las mismas sonentrevistados. Ası, si las secciones censales de la muestra tienen respectivamente200, 350, 120 y 250 jovenes, la muestra final tendra 920 jovenes.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 12/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo por Conglomerados. Una Etapa

En este caso, las unidades que se van a estudiar son los jovenes del distrito, pero elmuestreo se hace inicialmente sobre las secciones, que son divisiones de tipoadministrativo.Esto es un caso tıpico de MUESTREO POR CONGLOMERADOS. Las seccionescensales son los conglomerados. Notese la diferencia entre este ejemplo y el anterior.En los dos ejemplo, la poblacion esta dividida en partes, pero en el anterior, se haceun muestreo EN cada parte, mientras que ahora se hace un muestreo DE partes.Notese tambien que una vez construida la muestra de conglomerados, estos seestudian AL COMPLETO, por ello, este proceso se denomina MUESTREO PORCONGLOMERADOS EN UNA ETAPA, por que solo hay una etapa o fase de muestreo,la de los conglomerados.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 13/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo por Conglomerados. Dos Etapas

Es una variacion del ejemplo anterior. En un distrito municipal de una gran ciudad sedesea realizar una encuesta entre la poblacion joven de entre 16 y 25 anos, paraestudiar sus habitos de lectura. Dicho distrito esta dividido en 75 secciones censalescada una de las cuales con un numero considerable de jovenes.Para seleccionar la muestra de jovenes, se selecciona previamente una muestra deseis secciones censales. A continuacion, en cada una de esas seis secciones serealiza un muestreo para seleccionar un conjunto de jovenes.Notese que ahora el muestreo global esta compuesto de 1 + 6 = 7 muestreos distintos.En una primera fase o etapa se obtiene la muestra de secciones, y en una segundafase o etapa, en cada seccion de la muestra anterior, se obtienen muestras de jovenes.Aquı tenemos un caso tıpico de lo que se denomina MUESTREO PORCONGLOMERADOS EN DOS ETAPAS, pues hay dos etapas o fases de muestreo,como se describe en el parrafo anterior.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 14/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Ideas Fundamentales de los Disenos Complejos

Primera Idea Fundamental.

Existen dos estructuras b asicas: ESTRATOS y CONGLOMERADOS

Segunda Idea Fundamental.

Estructuralmente, los ESTRATOS y los CONGLOMERADOS son las mismas cosas:PARTES DE LA POBLACION. La diferencia consiste en:

Su diferente tratamiento muestral. Se hace muestreo en TODOS Y CADA UNODE LOS ESTRATOS. Se seleccionan solo ALGUNOS conglomerados de entre losexistentes.

Su diferente finalidad. Los ESTRATOS, supuestos mas homogeneos, REDUCENERROR DE ESTIMACION. Los CONGLOMERADOS PERMITEN y/o FACILITANel acceso a los elementos que se van a estudiar.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 15/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Ideas Fundamentales de los Disenos Complejos

Tercera Idea Fundamental

En la practica no nos vamos a encontrar, usualmente, con un muestreo basico odirecto de los elementos.

Pero tenemos que decir que ni siquiera nos vamos a encontrar con situaciones menossimples como un muestreo estratificado o un muestreo por conglomerados.

Muy al contrario, lo mas usual sera tener una COMBINACION O MEZCLA DEDIFERENTES ESTRUCTURAS Y DISENOS MUESTRALES.

Ademas, a todo esto, hay que anadirle las multiples posibilidades que hay al realizarlos muestreos basicos, en los que podemos emplear Muestreo Aleatorio Simple,Muestreo Sistematico Uniforme, Muestreo con probabilidades variables en susvariadas formas, y un largo etcetera

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 16/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Algunos Ejemplos de Mezclas de Disenos

Un muestreo estratificado, en el cual, en cada estrato, se realiza un muestreo porconglomerados en dos etapas, seleccionando los conglomerados medianteProbabilidades Variables, y los elementos posteriores con Muestreo AleatorioSimple.

Un muestreo por conglomerados en dos etapas, en el cual, la segunda etapa serealiza mediante Muestreo Aleatorio Simple estratificado en cada conglomerado.

Un muestreo por conglomerados en dos etapas, en el cual, en la primera etapa seseleccionan los conglomerados Muestreo Sistematico, y la segunda etapa es a suvez un muestreo por conglomerados en dos etapas, ambas mediante MuestreoAleatorio Simple.

Un muestreo estratificado, en el cual, en cada estrato, se realiza un muestreo porconglomerados en dos etapas, y en el cual, a su vez, la segunda etapa se realizamediante muestreo estratificado en cada conglomerado.

Y un largo etcetera de muchas mas combinaciones.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 17/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Disenos Muestrales Complejos

En cualquiera de estas situaciones, sea cual sea la combinacion de procedimientos, alfinal tenemos como resultante UN DISENO MUESTRAL que es el producto final de lamezcla de todos los disenos muestrales que intervienen.

Un diseno muestral de este tipo se denomina dise no muestral complejo . Lasmuestras obtenidas con tales disenos se pueden por ello denominar muestrascomplejas . El modulo de SPSS denominado precisamente Muestras Complejas nospermite,

Construir este tipo de muestras, mediante distintas opciones de muestreo, ysuponiendo que intervienen diferentes estructuras, posiblemente combinadas:estratos y conglomerados.

Analizar los datos muestrales para obtener estimaciones de parametros, tanto sihemos obtenido la muestra ayudandonos con el propio SPSS como si no.

IMPORTANTE

Mediante SPSS podemos analizar una muestra que haya sido disenada o construidacon el propio SPSS. Pero tambien podemos analizar muestras obtenidas o construidasde otra forma, siempre que dispongamos de la informacion adecuada.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 18/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Conceptos Fundamentales: Probabilidades de Inclusion y Pesos

Probabilidades de Inclusion

Si queremos estimar parametros a partir de un muestreo realizado con un disenocomplejo, por complicado que sea, al final nos vamos a encontrar con una muestra deelementos, y la clave consiste, basicamente, en calcular las probabilidades deinclusi on .

Estimacion de un Total Poblacional

Si queremos estimar el total de la variable Y a partir de una muestra m, aplicamos elestimador de Horvitz-Thompson,

THT(Y ) =∑i∈m

yi

πi=

∑i∈m

ωi yi siendo ωi =1

πi∀i ∈ m

Pesos o Ponderaciones

ωi =1

πi

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 19/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Estimacion de la Media Poblacional

Si lo que queremos estimar es la media poblacional de la variable, es decir, elparametro Y , podemos emplear nuevamente el estimador de Horvitz-Thompson,

Y HT =1

N

∑i∈m

yi

πi

o tambien el estimador de Hajek,

Y HJ =

∑i∈m

yi/πi∑i∈m

1/πi

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 20/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Estimadores empleados por el SPSS

SPSS estima un total poblacional mediante el estimador de HorvitzThompson,

THT(Y ) =∑i∈m

yi

πi=

∑i∈m

ωi yi

siendo yi la variable que se estudia, y ωi = 1/πi los pesos que suministraremos alprograma.

SPSS estima una media poblacional, o una proporcion, mediante el estimador deHajek,

Y HJ =

∑i∈m

yi/πi∑i∈m

1/πi

=

∑i∈m

ωi yi∑i∈m

ωi

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 21/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Cuarta Idea Fundamental

Para realizar estimaciones mediante SPSS tenemos que,

Calcular las Probabilidades de Inclusi on

y a partir de las mismas Calcular los Pesos

IMPORTANTE

Cuando la muestra a analizar ha sido previamente disenada y obtenida medianteSPSS, es usual que contenga informacion sobre los pesos. Si no tenemos los pesos,ya sea por que la muestra ha sido obtenida por otros medios, o por otras razones,tendremos que calcularlos. A continuacion vemos algunas situaciones

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 22/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo Aleatorio Simple BasicoMuestreo con Probabilidades Variables BasicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

Muestreo Aleatorio Simple Basico

Si N es el tamano de la poblacion, y n es el tamano de la muestra, las probabilidadesde inclusion son,

πi =n

N

por lo que los pesos son,

ωi =N

n

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 23/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo Aleatorio Simple BasicoMuestreo con Probabilidades Variables BasicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

Muestreo con Probabilidades Variables Basicos

Estos muestreos se realizan empleando una variable de TAMANO, de tal forma quelos elementos “MAS GRANDES” tengan mas probabilidad de ser seleccionados. Sidenotamos Xi a dicha variable, T (X) a la suma, sobre la poblacion, de todos lostamanos, y n al tamano de la muestra, las probabilidades de inclusion son,

πi =nXi

T (X)por lo que los pesos son ωi =

T (X)

nXi

Uno de los procedimientos de este tipo mas empleados es el metodo de Sampford .Dicho metodo permite obtener n elementos muestrales sin reemplazamiento y conprobabilidades de inclusion variables y proporcionales a Xi . SPSS tiene implementadoeste metodo.

IMPORTANTE

Sin reemplazamiento, SPSS solo contempla este tipo de muestreo cuando seseleccionan conglomerados, y exclusivamente en la primera etapa.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 24/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo Aleatorio Simple BasicoMuestreo con Probabilidades Variables BasicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

Muestreo Aleatorio Simple Estratificado

Para simplificar supongamos dos estratos, de tamanos N1 y N2, en los que seseleccionan respectivamente n1 y n2 elementos mediante sendos muestreosaleatorios simples en cada estrato. Las probabilidades de inclusion son,

πi =n1

N1en el estrato 1 y πi =

n2

N2en el estrato 2

por lo que los pesos son,

ωi =N1

n1en el estrato 1 y ωi =

N2

n2en el estrato 2

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 25/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo Aleatorio Simple BasicoMuestreo con Probabilidades Variables BasicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

Muestreo por Conglomerados en Una Etapa. Seleccion de Conglomerados medianteMuestreo Aleatorio Simple

Supongamos que hay M conglomerados, y se seleccionan g. La probabilidad deinclusion de un elementos sera la del conglomerados al que pertenece, es decir,

πi =g

M

por lo que los pesos son,

ωi =M

g

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 26/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo Aleatorio Simple BasicoMuestreo con Probabilidades Variables BasicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

Muestreo por Conglomerados en Dos Etapas. Seleccion de Conglomerados yElementos mediante Muestreo Aleatorio Simple

Supongamos que hay M conglomerados, y se seleccionan g. En el conglomerado k ,con Nk elementos, seleccionamos nk . La probabilidad de inclusion de un elementossera la del conglomerados al que pertenece multiplicada por la del elemento dentro delconglomerado, es decir,

πi =g

M

nk

Nk

por lo que los pesos son,

ωi =M

g

Nk

nk

En general, habra tantos pesos distintos como conglomerados.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 27/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Muestreo Aleatorio Simple BasicoMuestreo con Probabilidades Variables BasicoMuestreo Aleatorio Simple EstratificadoMuestreo por Conglomerados en Una Etapa. M.A.S.Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.

Muestreo por Conglomerados en Dos Etapa. Seleccion de conglomerados conProbabilidades Variables, y de Elementos mediante Muestreo Aleatorio Simple

Supongamos que hay M conglomerados, y se seleccionan g. La seleccion se hace,por ejemplo mediante el metodo de Sampford, empleando el tamano de losconglomerados como variable tamano. Supongamos que la suma de todos lostamanos es NEn el conglomerado k , con Nk elementos, seleccionamos nk mediante muestreoaleatorio simple. La probabilidad de inclusion de un elementos sera la delconglomerados al que pertenece multiplicada por la del elemento dentro delconglomerado, es decir,

πi =gNk

N

nk

Nk=

gnk

N

por lo que los pesos son,

ωi =N

gnk

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 28/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Variables de EstructuraError de MuestreoEfecto del Diseno

Variables de Estructura

Estratos

Para definir y manejar una estructura de estratos en SPSS se emplearan una o variasvariables, cuyos diferentes niveles determinaran dichos estratos.

Conglomerados

Iguamente, para definir y manejar una estructura de conglomerados en SPSS seemplearan una o varias variables, cuyos diferentes niveles determinaran dichosconglomerados.

Subpoblaciones

Es usual, al realizar las estimaciones de los parametros, hacerlo tanto para lapoblacion total, como para partes o subpoblaciones de la misma. Por ejemplo, alestimar los ingresos medios en una poblacion de familias, podemos hacerlo tanto parala poblacion total, como desagregando para las familias numerosas o no.Iguamente, para definir subpoblaciones en SPSS se emplearan una o varias variables,cuyos diferentes niveles determinaran dichos conglomerados.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 29/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Variables de EstructuraError de MuestreoEfecto del Diseno

Variables de Estructura

Ejemplo

Supongamos que se consideran en una poblacion de individuos conglomeradosdefinidos por secciones censales, SC, y estratos definidos por el cruce de SEXO:[H,M]y grupos de EDAD:[A,B,C]. A:jovenes, B:intermedios, C:Mayores. Tendremos multiplesvariables, y tres de ellas seran las anteriores,

VAR01 VAR02 ...... SEXO EDAD SC VAR09 .......---------------------------------------------------------------.... .... ...... V B 23 .... ........... .... ...... M A 23 .... ........... .... ...... M C 23 .... ........... .... ...... V B 34 .... ........... .... ...... V C 34 .... ........... .... ...... M B 34 .... ........... .... ...... V B 34 .... ........... .... ...... V A 53 .... ........... .... ...... ... ... .... .... .......---------------------------------------------------------------

Las variables SEXO y EDAD definen pues una estructura de seis estratos. La variableSC define la estructura de conglomerados. Ademas, la variable SEXO podrıa serutilizada para desagregar las estimaciones.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 30/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Variables de EstructuraError de MuestreoEfecto del Diseno

Error de Muestreo

Error, Intervalo de Confianza, Contrastes

La estimacion de parametros a partir de una muestra es un proceso inferencial, y porconsiguiente conlleva un error. No se concibe una estimacion que no vayaacompanada de su margen de error.El programa SPSS proporciona una medida del error de muestreo denominandoloerror tıpico , cuyo significado es la desviacion tıpica estimada de la estimacion, esdecir, si θ es el parametro que se estima, el error tıpico es,

Error Tıpico =

√V [θ] = σ

Tambien proporciona un intervalo de confianza, basado en la distribucion t de Student,de la forma,

(θ − σ tg.l.1−α/2 , θ + σ tg.l.

1−α/2)

Siendo g.l. los grados de libertad calculados como la diferencia entre el numero deunidades muestrales y el de estratos, en la primera etapa.

Tambien es posible realizar contrastes de hipotesis sobre medias, totales y razones.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 31/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Variables de EstructuraError de MuestreoEfecto del Diseno

Efecto del Diseno

Comparacion con el Muestreo Aleatorio Simple Basico

Cuando se emplean diferentes estructuras de estratos y conglomerados, ası comoseleccion de la muestra distinta del Muestreo Aleatorio Simple, es interesantecomparar el error que se obtiene con el que se obtendrıa aplicando Muestreo AleatorioSimple Basico.

SPSS puede realizar esta comparacion, calculando el efecto del diseno, que no es otracosa que,

EFD =Vnuestro disenoVM.A.S. basico

es decir, el cociente entre las varianzas estimadas de nuestreo diseno y del MuestreoAleatorio Simple Basico. Aunque es mas indicativo calcular

√EFD pues el error tıpico

viene dado a partir de la desviacion tıpica.

INTERPRETACION: Segun sea menor o mayor que 1, indica si nuestro disenoproduce menos o mas error que un Muestreo Aleatorio Simple Basico, que se empleacomo referencia.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 32/33

IntroduccionDisenos muestrales complejos y muestras complejas

Calculo de los pesosVariables de Estructura. Error de Muestreo. Efecto del Diseno

Variables de EstructuraError de MuestreoEfecto del Diseno

FIN DE LA EXPOSICION TEORICA.

Prof. Jos e A. Mayor Gallego. Dpto. Estadıstica e I.O. Universidad de Sevilla SPSS. Modulo de Muestras Complejas C B � 33/33