Tecnicas de muestreo PROBABILISTICO

86
 CURSO DE MUESTREO PROBABILISTICO PARA ENCUESTAS  Francis co Sánchez Villarreal. Facultad de Cienci as UNAM 2010

description

MUESTREO ALEATORIO SIMPLEESTRATIFICADOCONGLOMERADOSPROBABILIDAD PROPORCIONAL AL TAMAÑOSISTEMATICOAFIJACION DE NEYMAN, OPTIMA, PROPORCIONAL E IGUAL EN CADA ESTRATO

Transcript of Tecnicas de muestreo PROBABILISTICO

Page 1: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 1/86

 

CURSO DE MUESTREO

PROBABILISTICO

PARA ENCUESTAS 

Francisco Sánchez Villarreal.Facultad de Ciencias UNAM 2010

Page 2: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 2/86

Introducción al Muestreo Probabilistico

Francisco Sánchez Villarreal

Facultad de Ciencias UNAM

1

1. GENERALIDADES

1.1 Introducción. 

La recolección de información mediante encuestas sobre diversos fenómenos sociales, económicos ypolíticos se ha popularizado notablemente en todo el mundo. Revistas y periódicos publicandiariamente resultados de sondeos de opinión sobre diversos temas de actualidad. Los planificadoresy evaluadores de programas educativos, económicos y de salud pública recurren a la encuesta comoinstrumento fundamental. Los investigadores de mercados y publicistas aplican encuestas para medirla aceptación del público a un nuevo producto o medir el impacto de una campaña publicitaria. Enépoca de elecciones, instituciones de diversa orientación política realizan encuestas predictivas delvoto, encuestas a la salida de las casillas y conteos rápidos sobre resultados electorales. Losorganismos responsables de las estadísticas de fenómenos demográficos y macroeconómicoscomplementan la información recolectada a partir de censos o registros administrativos con datos deencuestas por entrevista directa, telefónicas, sitios de Internet.

En las encuestas se utilizan diversas metodologías de muestreos probabilísticos, de cuota ointencionales y ello ha dado origen también a el abuso de prácticas inadecuadas que reducennotablemente la confianza del público en sus resultados; pero la encuesta, cuyos orígenes seremontan a los de nuestra cultura es un producto desarrollado fundamentalmente en los últimos 50años, ha llegado para quedarse como la mejor alternativa para obtener datos específicos einmediatos. Las innovaciones tecnológicas en metodologías de diseño, instrumentos electrónicospara la recolección de datos y software mejorado para el proceso de resultados tienden a incrementarel campo de sus aplicaciones.

1.2 Población y Muestra.

El primer paso en la realización de una investigación, consiste en establecer los objetivos que sepretenden alcanzar. Los objetivos se deben plantear tan clara y específicamente como sea posiblepara establecer los límites del estudio. Ello permitirá hacer una elección adecuada del universo quese someterá a observación. Desde el punto de vista del muestreo, se entenderá por población ouniverso cualquier colección finita de personas u otro tipo de elementos que posean ciertascaracterísticas en común. Los elementos de la población o universo, son las unidades de las que sebusca información y se determinan en función de los objetivos del estudio. Es posible en este sentidohacer referencia a una población de fábricas de artículos electrónicos, de vehículos de carga del

autotransporte federal, de predios agrícolas dedicados al cultivo de algodón, etc.

La definición de la población o universo en estudio se debe precisar en términos de:

El Contenido. Es decir, el tipo de elementos constitutivos, por ejemplo: estudiantes, hogares,predios, empresas, etc.

La Extensión. Se refiere a las atribuciones geográficas y/o administrativas asociadas a loselementos, por ejemplo: los estudiantes de la Facultad de Ciencias de la UNAM, las fábricasde prendas de vestir del área metropolitana de la ciudad de México, los predios ejidales delestado de Puebla, los productores de aguacate del estado de Michoacán, etc.

El Tiempo. La mayor parte de las poblaciones presentan cambios función del tiempo y unaencuesta es una medición transversal, vigente durante un período relativamente corto, portanto, se debe referir el momento en el que se hace el estudio. Por ejemplo, los estudiantes dela Facultad de Ciencias de la UNAM en el período escolar 2007-II, Las fábricas de prendas devestir del área metropolitana de la ciudad de México en abril de 2005, etc.

1.3 Definiciones Operacionales.

Page 3: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 3/86

Introducción al Muestreo Probabilistico _ 

Francisco Sánchez Villarreal

Facultad de Ciencias UNAM.

2

 Los aspectos de la población que se pretenden medir conducen a la definición de conceptos yprocedimientos de medición. En este punto se suelen presentar frecuentes discrepancias que no sonatribuibles a las técnicas de muestreo, sino a las bases conceptuales. Los investigadores suelendefinir los conceptos en función de los intereses y alcances de su proyecto, pero es convenientehacer algunos comentarios para profundizar un poco en este punto.

En 1927 Percy W. Bridgman, físico norteamericano que obtuvo el premio Novel en 1945, escribió un

libro llamado “Lógica de la Física Moderna” en el que propuso que los conceptos se definieran por lasoperaciones con que se acostumbra medirlos. Según él, por ejemplo, "el concepto de longitudinvolucra, ni más ni menos, al conjunto de operaciones con que se determina la longitud". Significa,por ejemplo, que si medimos algo de dos maneras diferentes, tenemos en realidad dos conceptosdiferentes. En los siguientes años surgieron muchos entusiastas y críticos del "Operacionalismo",como se le llamó esta corriente científica. Se afirmaba que las definiciones operacionales ayudarían aevitar nociones ambiguas e incluso contradictorias. El campo de aplicación del operacionalismotrascendió a las operaciones físicas y se extendió a operaciones lógicas. El operacionalismo hatenido sus detractores ante los abusos que se puedan hacer en la aplicación de las definiciones, perosin duda ha permitido que en el muchos ámbitos se puedan definir claramente conceptos, nonecesariamente con aceptación universal, sino solamente en el consenso de un reducido círculo deinteresados en los temas de su especialidad.

Definir en forma clara y precisa es condición previa para posteriormente medir.

Por ejemplo, si se desea contar el número de localidades urbanas en una entidad federativa, anteshay que definir el concepto de localidad urbana. La definición operacional de localidad urbanautilizada con mayor frecuencia en los medios oficiales: "Localidad urbana es aquella que tiene 2500habitantes o más" ha sido motivo de frecuentes discusiones, pues no refleja los aspectos asociadosal urbanismo, como son alumbrado, agua potable, drenaje, pavimento, vigilancia, servicios médicos,servicios educativos, etc. Así, una localidad rural con 2,499 habitantes puede cambiar a urbana de undía para otro con el solo nacimiento de un bebé.

El lector podrá percibir la dificultad de definir si intenta definiciones operacionales de conceptos tanfamiliares como: habitación, silla, predio, familia, etc.

Las discrepancias conceptuales perturban frecuentemente los resultados estadísticos, pero

desafortunadamente se responsabiliza a la estadística y no a las actividades conceptuales.

1.4 Ventajas y Limitaciones del Muestreo.

Los atributos de una muestra se infieren a la población, ello implica un proceso de generalización quedebe apoyarse en técnicas estadísticas para tener una medida del error en que se incurre y unagarantía de objetividad.

El estudio de la población completa (censo), en muchas ocasiones resulta impráctico o costoso y elloobliga al análisis mediante muestras. Azorín Poch, menciona las siguientes situaciones típicas en elempleo de muestras:

Cuando la población sea tan grande que el análisis completo o censo exceda las

posibilidades económicas del organismo investigador.Cuando la población presente uniformidad en su definición y una muestra de tamañoadecuado proporcione una buena representación de la misma y por tanto carezca de sentidoexaminar la población completa.

Cuando el proceso de medida o investigación de las características sea destruct ivo o puedamodificar en alguna forma a las unidades observadas.

Por otra parte, se pueden mencionar como las principales ventajas del muestreo, las siguientes:

Page 4: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 4/86

Introducción al Muestreo Probabilistico

Francisco Sánchez Villarreal

Facultad de Ciencias UNAM

3

 Bajos costos. Es evidente que la obtención de información de una fracción de la poblaciónrequiere de menores recursos que los necesarios para un censo, pero no es barata. Esimportante destacar que la información por cualquier método que sea recolectada es unproducto caro, de utilización limitada y de vigencia muy corta.

Poco tiempo. La recolección y procesamiento de datos de una fracción de la población serealiza en menor tiempo.

 Actualidad de datos . Los datos recolectados a partir de una encuesta proceden de un tiempocercano a su análisis y por tanto las conclusiones de ese análisis tendrán referencias másactuales de la población.

Oportunidad de resultados. Los datos recolectados se utilizan en el momento que sonrequeridos para su análisis y evitan retrasos en los procesos de producción de resultados.

Desagregación ajustada a necesidades. La desagregación de las estadísticas que se puedelograr a partir de una encuesta puede ser refinada tanto como el investigador lo desee y losrecursos disponibles lo permitan.

Mejor capacitación del personal de campo. Las personas que recolectan la informaciónpara una encuesta pueden ser capacitadas y supervisadas con más cuidado debido a sureducido número y verificados los datos que recolectan. Todo ello se refleja en notablesmejoras en la integridad y precisión de los datos recolectados.

Ante las ventajas señaladas para el muestreo, es conveniente mencionar también sus principaleslimitaciones:

El riesgo que tienen las muestras de sufrir serios desvíos o sesgos motivados pormetodologías o prácticas de campo inadecuadas y que desde luego se reflejan en lasestimaciones de las características de la población que se desean estimar.

Al trabajar con una fracción de la población no se puede ser concluyente en afirmacionespues siempre existe la probabilidad de errores de muestreo, aunque esa probabilidad de

errores importantes sea baja.

La necesidad de personal especializado para diseñar la muestra, efectuar la aplicación decuestionarios y el proceso estadístico de datos.

1.5 El Muestreo Probabilístico .

El procedimiento por el cual se seleccionan elementos de la población, para su incorporación a lamuestra, define el que se trate o no, de un muestreo probabilístico. En un muestreo probabílistico, esposible definir el espacio muestral o conjunto de todas las muestras posibles. Además de que, esposible asociar a cada muestra una probabilidad conocida y distinta de cero de ser seleccionada.

Con el fin de evitar posibles sesgos en el proceso de selección, se incorporan a éste prácticas dealeatorización que hac en independiente del diseñador la muestra seleccionada.

Finalmente, en el muestreo probabilístico, se define un método de estimación que proporciona unresultado único para cada muestra.

El desarrollo de la teoría de muestreo se refiere al muestreo probabilístico, aunque en la práctica noes la única alternativa pues también se recurre frecuentemente a muestreos intencionales y de cuota,cuya limitante es la frecuente falta de objetividad y el no cumplimiento de los supuestos de lastécnicas de inferencia. También hay que considerar situaciones de riesgo en muestras para ensayosclínicos y entonces la muestra es autoselectiva pues se recurre a voluntarios.

Page 5: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 5/86

Introducción al Muestreo Probabilistico _ 

Francisco Sánchez Villarreal

Facultad de Ciencias UNAM.

4

 1.6 El Marco de Muestreo.

A la definición conceptual de la población objetivo debe corresponder una forma práctica de teneracceso a todos los elementos que la constituyen. En forma simple, la relación de todos los elementosque integran una población o universo de estudio se le conoce como marco de muestreo. Esfrecuente el empleo de marcos que hacen referencia a superficies rurales o urbanas, tales comomapas de terrenos de cultivos o planos de traza urbana de localidades. Estas últimas formas de

marcos se identifican genéricamente como marcos área.

La disposición de marcos adecuados suele ser una problemática frecuente para el investigador. Losarchivos administrativos que usualmente se utilizan como marco de muestreo frecuentementepresentan serias omisiones de elementos de la población objetivo, repeticiones o inclusiones deelementos extraños. Una conducta deseable para el investigador es la de evaluar los problemas quepueda tener un marco mediante la verificación en campo de los datos que aparecen en los registrosadministrativos. Idealmente construir específicamente un marco sería la mejor opción, pero su costosuele estar fuera de los presupuestos.

1.7 Etapas en el Desarrollo de una Encuesta.

La realización de una encuesta involucra una serie de actividades de planeación y organización cuya

complejidad puede variar notablemente. Por ejemplo, una encuesta de opinión entre los estudiantesde una preparatoria de 1200 alumnos, supone una situación muy diferente a una encuesta deproducción agropecuaria en todo el país. Sin embargo, existen una serie de actividades quepodríamos considerar comunes en toda encuesta:

Identificación del Problema. La necesidad de información para un nuevo proyecto,usualmente se presenta en forma poco clara y precisa, hay necesidad entonces de delimitarlos alcances del estudio.

Formulación de Objetivos. Una vez delimitado el alcance de la encuesta se puedenconcretar los objetivos e hipótesis a probar.

Conceptualización. La definición operacional de las variables involucradas, así como laescala de medición empleada surgen del marco teórico del proyecto.

Diseño de Tabulaciones. Los criterios de clasificación y grado de agregación de datos soncondicionantes que el diseñador de la muestra debe conocer para determinar tamaños demuestra.

Diseño del Cuestionario. Involucra una actividad más compleja de lo que aparenta pues sepueden cometer muchos errores e inducir otros más si el cuestionario no tiene una estructuraadecuada. La redacción de las preguntas del cuestionario o instrumento de recolección debenser congruentes las definiciones operacionales y con el marco teórico adoptado.

Evaluación del marco. Se debe verificar el grado de actualización y consistencia de los datosde las unidades de la población para determinar porcentajes de exclusión de elementos de lapoblación e inclusión de elementos extraños.

Diseño de Muestra. Resume los procedimientos de selección y estimación asociados amárgenes de errores con probabilidades conocidas.

Prueba Piloto. Es frecuente la aplicación de una prueba piloto para verificar si los supuestosplanteados en los estudios de gabinete se cumplen adecuadamente. La prueba piloto permitecorregir cuestionario, estimar varianzas, ajustar presupuestos y precisar tiempos derealización de trabajo de campo.

Page 6: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 6/86

Introducción al Muestreo Probabilistico

Francisco Sánchez Villarreal

Facultad de Ciencias UNAM

5

Cartografía de Enumeración. Las cargas de trabajo, requerimientos de viáticos y transportesse pueden planear eficazmente si se dispone de una buena cartografía. La cartografía esesencial para marcos definidos por áreas.

Edición de Documentos de trabajo. Manuales, insructivos y formatos de control permitenhomogeneizar criterios de solución de las diversas situaciones problemáticas que sepresentan en la logística de una encuesta.

Capacitación de personal de campo. Ningún diseño de muestra por bueno que sea puedeagregar calidad a datos mal registrados. La capacitación cuidadosa del personal de campo esgarantía de eliminación de fuentes de error ajenas al muestreo.

Controles de campo y programación de captura. Es necesaria una excelente comunicaciónentre el personal de las áreas de muestreo, control de documentos en campo y los analistas yprogramadores responsables del proceso de datos para obtener los resultados que seesperan de una encuesta.

Codificación y captura de datos. La disposición o construcción de catálogos adecuadospara una correcta codificación y captura- verificación de datos darán como resultado archivosconfiables para procesos posteriores.

Proceso Estadístico de datos. La obtención de resultados mediante software específico ypaquetería facilitan esta labor, pero los tabulados y reportes requieren de edición adicionalpara su presentación definitiva.

Edición de Informe y Anexos. Un reporte que analice resultados e incluya una memoriatécnica y anexos con cuestionarios y otros documentos permitirán al usuario explotar almáximo la información.

1.8 El Cuestionario.

Los aspectos teóricos del muestreo que se comentarán en el curso suponen que se dispone de unbuen instrumento para la recolección de datos, sin embargo, toda la labor desarrollada por el equipode diseño, dirigida a lograr un buen diseño de la muestra, un adecuado control de las operaciones decampo y estimaciones óptimas, puede verse invalidada por no disponer de un cuestionario elaborado

cuidadosamente.

La elaboración del cuestionario debe responder a los objetivos planteados por el proyecto. Significa laprecisión de muchos aspectos, cuya conceptualización se presentaba poco clara.

En la manufactura de un cuestionario se deben tomar en cuenta las siguientes recomendaciones:

1. Evitar el afán de información. Cuando se elabora un cuestionario, se suele exceder elnúmero de preguntas necesarias para alcanzar los objetivos iniciales. El exceso de preguntasfatiga al entrevistado y lo induce a falsear sus respuestas.

2. Redactar las preguntas en lenguaje claro para el entrevistado. Se debe considerar laheterogeneidad de capacidades, idiosincrasias y niveles culturales de los entrevistados.

3. Hacer las preguntas concisas, sin que ello signifique un sacrificio de la claridad.

4. Las preguntas deben redactarse de modo que el entrevistador no tenga que participar  en la aclaración de un concepto pues puede distorsionar su intención original.

5. Evitar preguntas que obliguen al entrevistado a realizar cálculos.

Page 7: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 7/86

Introducción al Muestreo Probabilistico _ 

Francisco Sánchez Villarreal

Facultad de Ciencias UNAM.

6

6. Evitar preguntas que molesten al entrevistado. En ocasiones no se puede evitar el tocartemas escabrosos para el entrevistado, en estos casos se debe redactar la pregunta con elmayor tacto posible o recurrir a mecanismos de respuesta aleatorizada.

7. Evitar preguntas que induzcan la respuesta. El emitir en forma implícita un juicio de valorconduce respuestas inducidas y que indudablemente falsean los resultados.

8. Considerar las tabulaciones y sus niveles de agregación para definir las alternativas derespuesta en preguntas de opción múltiple. Clasificaciones muy amplias darán lugar atabulaciones con celdas vacías.

9. Presentar formatos que faciliten posteriormente la captura y proceso de datos, concódigos claros y bien definidos.

10. No realizar dos preguntas en una.

Tipos de Preguntas.

Las preguntas de un cuestionario pueden clasificarse en la forma siguiente:

. Cerradas dicotómicas. Preguntas cuya respuesta suele ser SI o NO y que sirven para

condicionar la aplicación de bloques del cuestionario.

. Cerradas de opción múltiple excluyente. La respuesta se limita a un número determinadode respuestas que mutuamente se excluyen.

. Cerradas de opción múltiple no excluyente. La respuesta se limita a un númerodeterminado de respuestas, pero el entrevistado puede seleccionar una o más respuestassimultáneamente.

. Abiertas. La respuesta textual del entrevistado se transcribe para posteriormente definircriterios que permitan su codificación y proceso.

1.9 Niveles de medición .

Los niveles de medición de las variables involucradas en una pregunta constituyen otra alternativa declasificación:

. Categóricas. Su respuesta está asociada a un criterio de clasificación de dos o más clases.Los valores de las variables categóricas funcionan como elementos de identificación y no esfactible realizar operaciones aritméticas con ellos. Las variables categóricas se sometenprocesos estadísticos que involucran frecuencias absolutas o relativas.

. Ordinales. Los valores de las escalas ordinales permiten asociar un orden, pero lasdiferencias entre valores consecutivos de la escala no son consistentes. Son frecuentesescalas de diferencial semántico con extremos tales como totalmente de acuerdo y totalmenteen desacuerdo.

. Intervalares. Los datos de escalas intervalares se pueden someter a operacionesaritméticas diversas. Tienen la particularidad de que el cero de la escala no representaausencia de la característica, sino solamente es un punto de referencia arbitrario. El caso másilustrativo es el de la medición de la temperatura.

.Razón. En esta escala son válidas todas las operaciones aritméticas y el cero representaausencia de la característica. Por ejemplo las medidas de distancia, superficie o volumen.

Page 8: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 8/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

7

 2 MUESTREO SIMPLE ALEATORIO PARA MEDIAS Y TOTALES.

2.1 Definición

El muestreo aleatorio simple no solamente es el más sencillo de aplicar, sino que constituye

la unidad elemental de diseño a partir de la cual se suelen plantear muestras complejas. También es el que se apoya en el menor número de supuestos y en esa sencillez reside suflexibilidad y capacidad de aplicación a todo tipo de poblaciones.

Suponga que se tiene una población con las siguientes características:

a) El tamaño de la población es N.

a) El tamaño de la muestra es n.

b) Las unidades se seleccionan sin reemplazo, lo que equivale a selecciones sucesivascon probabilidades asociadas a las unidades no seleccionadas en cada extraccióniguales a

1

 N i−para i= 0,1,2,3,.....,n-1

c) Las muestras que tengan las mismas unidades aunque el orden de extracción seadistinto se consideran iguales y por tanto una muestra es diferente de otra, cuando almenos existe una unidad diferente.

Page 9: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 9/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

8

 Puesto que se seleccionan sin reemplazo (b) y el orden no importa (c), el número total demuestras está dado por todas las formas posibles de seleccionar n unidades de N en total.Este número de formas corresponde a las combinaciones de los N elementos de la poblacióntomados n a la vez:

2.2 NotaciónLa notación que se empleará en el muestreo aleatorio simple (M.A.S.) será la siguiente:

N Tamaño de la población

n Tamaño de la muestra

yi El valor de la variable estudiada en la i-ésima unidad de lamuestra ó de la población.

f Fracción de Muestreo

 f n

 N =  

 Y Total de la población

Y  Media de la población

( ) !!

!

nn N 

 N 

n

 N 

−=⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ 

∑=

= N 

i

i yY 1

 N 

 y

 N 

i

i∑== 1

Page 10: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 10/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

9

  y Media de la Muestra

$Y  Estimador de la Media

$Y  Estimador del Total

( )

 N 

Y  y N 

i

i∑=

= 1

2

2σ   Varianza poblacional

( )

1  1

2

2

=

∑=

 N 

Y  y

 N 

i

i

Cuasivarianza poblacional

2.3 Números AleatoriosPara el proceso de selección de la muestra se han elaborado, con la finalidad de obtener lasventajas de la aleatorización y eliminar posibles sesgos, las llamadas Tablas de NúmerosAleatorios. Estas vinieron a sustituir algunos dispositivos físicos como las urnas.

La primera tabla de números aleatorios de la que se tiene noticia fue "Random Samplingnumbers"; Tracts for Computers editada por la Universidad de Cambridge.

El procedimiento de elaboración consistió en tomar números a partir de resultados censales,con ellos se integró una tabla de 41,600 dígitos. Otras tablas conocidas son las de Fisher y Yates, quienes en 1943 construyeron su tabla de 100,000 dígitos (Statistical Tables for use inBiological Agricultural and Medical Research).

Una de las más extensas, pues comprende 1,000,000 de dígitos, es la de la RandCorporation, elaborada en 1955.

Las tablas se suelen presentar en columnas de 3,4 ó 5 dígitos. Para el empleo correcto deéstas, se deben seguir unas sencillas reglas:

a) Conocer previamente el tamaño de la población N y de la muestra n

b) Se toma una página de las tablas y se parte de cualquier posición tomando el númerode dígitos que convenga. El arranque puede darse por coordenadas aleatorias deacuerdo al número de columnas y renglones de la página.

n

 y

 y

n

i

i∑== 1

Page 11: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 11/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

10

c) Se procede a tomar consecutivamente números en columna o renglón, conservandoaquellos menores o iguales a N y suprimiendo los mayores o repetidos en caso demuestreo sin reemplazo hasta completar n.

Generadores de Números AleatoriosActualmente, las computadoras cuentan con la función Random que genera números con

comportamiento aleatorio basado en algoritmos de congruencias, y aunque los dígitosgenerados no son estrictamente aleatorios, tienen las propiedades de éstos, lo cual severifica con diversas pruebas estadísticas, como de uniformidad, rachas, etc. Esta función seincluye en hojas de cálculo y diversos modelos calculadoras de bolsillo.

Las funciones de generación de números seudoaleatorios usualmente devuelven un númerocon distribución uniforme en el intervalo (0,1). El argumento puede ser falso o corresponder auna semilla de arranque para la secuencia. Por ejemplo, Excel cuenta con la funciónALEATORIO(), la cual se puede utilizar de la siguiente fórmula para generar una muestra unvalor entre 1 y N=500. La fórmula asegura la misma probabilidad de aparición para todos losnúmeros enteros en el intervalo.

 A=ENTERO(ALEATORIO()*500)+1)

En otra plataforma de cálculo se utilizaría una instrucción equivalente.

2.4 Número de Muestras y Probabilidad estar en la Muestra

La probabilidad de una muestra particular está dada por:1

 N 

n

⎛ 

⎝ ⎜

 ⎠⎟

 

Una forma sencilla de verificar esto es la siguiente:

Si las unidades de una muestra particular toman los valores y1,y2,...,yn; la probabilidad deobtenerlas en ese orden procediendo sin reemplazo, está dada por:

( )1 1

1

1

2

1

1 N N N N n

 N n

 N . . ...

!

!− − − +=

− 

Como el orden no importa, entonces se multiplica por todas las posibles formas de ordenar opermutar n elementos tomados todos a la vez, es decir n! 

( ) N n n

 N  N 

n

−=

⎛ 

⎝ ⎜

 ⎠⎟

! !

!

Page 12: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 12/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

11

Si cada unidad se toma con reemplazo, entonces la probabilidad de una muestra particularestá dada por

1 1 1 1

 N N N N n

n. ...1 24 34 

=  

En un muestreo aleatorio simple sin reemplazo, la probabilidad de que una unidad, enparticular con valor yo, sea elemento de la muestra, está dada por la probabilidad deseleccionar dicho elemento en la primera extracción, esto es 1/N. En la segunda, suprobabilidad está condicionada a extraer cualquiera de las N-1 restantes y enseguida extraerla que interesa con probabilidad 1/(N-1). En todos los casos se concluye que la probabilidadde cada extracción es 1/N. A continuación se expone esta secuencia:

1ª Extracción N 

1=  

2ª Extracción N  N  N 

 N  1

1

11=

− 

3ª Extracción N  N  N 

 N 

 N 

 N  12

1121 =

−−−−  

…………………. ……………………………………

nª Extracción N n N  N 

 N 

 N 

 N  1

)1(

1...........

1

21=

−−−

−− 

Como son eventos mutuamente excluyentes, la probabilidad de la unión está dada por lasuma de las probabilidades, es decir, la probabilidad de observar la unidad en la 1ª, 2ª, ónésima extracción estará dada por

1 1 1

 N N N 

n

 N n

+ + + =...1 244 344 

 

Por lo tanto, la probabilidad de que cualquier elemento pertenezca a la muestra es elcociente

 N 

2.5 Estimadores para Medias y Totales

El estimador usual de la media poblacional Y  es la media muestral.

$Y y=  

El estimador del total Y se obtiene de la siguiente forma:

Recuerde que el total de una población se puede expresar con la fórmula:

Page 13: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 13/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

12

  Y yii

 N 

==

∑1

Si esta expresión se multiplica y se divide con N, la relación no se altera:

 N 

 y N 

 N 

i

i∑== 1 y, por definición de Y , se tiene: Y NY =  

Para estimar el total se adopta una forma lógica, basta conocer N y una estimación de lamedia Y :

$ $Y NY =  

Como la media muestral  y es el estimador adoptado de Y  tendremos como estimador deltotal:

2.6 Esperanza y Varianza de los Estimadores.Para obtener expresiones para la esperanza y varianza del estimador  y se recurrirá a unmodelo de aleatorización, conocido como método de Cornfield.

Sea i X  una variable aleatoria dicotómica tal que:

⎩⎨⎧

∈=

muestralaenynobservaciólaSi 0

muestralaenynobservaciólaSi 1

i

i

i X   

Por la forma como se definió Xi, se trata de una variable aleatoria que se distribuye Bernoulli,de modo que: ( ) ( )

 N 

n X 

 N 

n X  ii −==== 10Pr  1Pr   

 También el hecho de que X se distribuye Bernoulli permite expresar fácilmente su esperanzay varianza:

( ) ( ) ⎟ ⎠

 ⎞⎜⎝ 

⎛ −====

 N 

n

 N 

nPQ X V 

 N 

nP X  E 

ii 1 

 También involucraremos a la covarianza, la cual en este caso se considera:

( ) ( ) ( ) ( ) ji ji ji X  E  X  E  X  X  E  X  X COV  −=  

 y N Y  =ˆ

Page 14: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 14/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

13

 Se debe obtener una expresión para ( )

 ji X  X  E   

⎪⎩

⎪⎨

−∈

=

1

1

 N

n

 -1casostresaasociadaad  probabilid conmuestralaenyySi 0

 1

1

 N

n ad  probabilid conmuestralaenyySi 1

 ji

 ji

 N 

n N 

n

 X  X   ji  

De aquí se obtiene: ( ) ( ) ( ) ⎟ ⎠

 ⎞⎜⎝ 

⎛ 

−−+⎟

 ⎠

 ⎞⎜⎝ 

⎛ 

−=

1

110

1

11

 N 

n

 N 

n

 N 

n

 N 

n X  X  E   ji  

( )1

1

−=

 N 

n

 N 

n X  X  E   ji  

Ahora se sustituye en la expresión de la covarianza

( )

( )( )

( )

( )⎟

 ⎠

 ⎞⎜

⎝ 

⎛ +−

⎟ ⎠

 ⎞⎜⎝ 

⎛ +−−

⎟ ⎠

 ⎞⎜⎝ 

⎛ −−−

⎟ ⎠

 ⎞⎜⎝ 

⎛ −

−=

 N 

n

 N 

n

 N 

nN n

 N  N 

nn

 N 

n

 N 

n

 X  E  X  E  X  X  E  X  X COV   ji ji ji

1

1- N N

n= 

11- N N

n= 

111- N N

n= 

1

1

 N

n= 

2

 

( )( )

⎟ ⎠

 ⎞⎜⎝ 

⎛ −

−−=

 N 

n

 N  N 

n X  X COV   ji 1

Ahora bien, de acuerdo a la definición de i X  , podemos expresar a la media muestral como

una suma de todos los valores de la población multiplicados por una variable indicadora queadopta solamente los valores (0,1) y que por tanto apunta solamente a los valorescorrespondientes a las unidades en muestra.

n

 y X 

n

 y

 y

 N 

i

ii

n

i

i ∑∑== == 11  

Page 15: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 15/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

14

 Se verifica a continuación que la media muestral es un estimador insesgado.

⎟⎟⎟

 ⎠

 ⎞

⎜⎜⎜

⎝ 

⎛ 

=∑

=

n

 y X 

 E  y E 

 N 

i

ii

1)(  

( )

n

 y X  E  N 

i

ii∑== 1  

n

 y N 

n N 

i

i∑== 1  

Y  N 

 y N 

i

i

==∑

=1  

Como resultado inmediato, el estimador del total también es un estimador insesgado.

( ) ( ) Y Y  N  y NE  y N  E Y  E  ==== )(ˆ  

Para abordar el problema de la varianza del estimador se definen a continuación dosestadísticas que involucran a toda la población. La varianza y la cuasivarianza parametrales.

( ) ( )σ  

2

2

1 2

2

1

1=

=

−= =

∑ ∑ y Y 

 N S 

 y Y 

 N 

ii

 N 

ii

 N 

,

Los desarrollos algebraicos se suelen simplificar con el empleo de S2, sobre todo bajo elenfoque de análisis de varianza, de ahí su presencia más frecuente en todo tipo dedesarrollos.

Se aplica el modelo de aleatorización para obtener la varianza del estimador.

Entonces su varianza se expresa: ⎟ ⎠

 ⎞⎜⎝ 

⎛ =

⎟⎟⎟⎟

 ⎠

 ⎞

⎜⎜⎜⎜

⎝ 

⎛ 

= ∑∑

=

= N 

i

ii

 N 

i

ii

 y X V nn

 y X 

V  yV 1

2

1 1)( 

Page 16: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 16/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

15

 Por otra parte, recuérdese que la varianza de una suma de variables aleatorias es:

( ) ( ) ( )∑ ∑∑∑<

+=i j

 ji x xCOV  xV  xV  2 

Con los resultados anteriores se obtiene la varianza de  y  

( )

( ) ( )

( )

( )

( )

( )

( )⎥⎦

⎤⎢⎣

⎡−

⎥⎦

⎤⎢⎣

⎡−

⎡⎟

 ⎠

 ⎞⎜

⎝ 

⎛ 

−−

⎥⎥⎦

⎢⎢⎣

⎭⎬⎫

⎩⎨⎧

+−

−−

⎥⎦

⎤⎢⎣

−−

⎥⎦

⎤⎢⎣

⎡−

−⎟ ⎠

 ⎞⎜⎝ 

⎛  −

⎥⎦

⎤⎢⎣

⎡⎟ ⎠

 ⎞⎜⎝ 

⎛ −

−−⎟

 ⎠

 ⎞⎜⎝ 

⎛ −

⎥⎦

⎤⎢⎣

⎡+=

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ +

∑∑

∑ ∑ ∑∑

∑∑∑

∑∑∑

∑∑∑

∑∑∑

∑∑∑

=

=

==

= =

<

<=

<=

<=

<=

<=

 N 

i

i

 N 

i

 N 

i

i

 N 

i

 N 

i

 N 

i

 N 

i

 N 

 j

 jii

i j

 ji

 N 

i

i j

 ji

 N 

i

i j

 ji

 N 

i

i j

 ji ji

 N 

i

i

 N 

i

 N 

 j

 j jii

 N 

i

ii

Y  y N 

 N 

 N 

 N 

 N 

 y N  N 

 N 

 y y y N  N 

 N 

 y y N  N 

 N 

 y y N  N 

n

 N 

n

 N  N 

n y y

 N 

n

 N 

n

 X  X COV  y y X V 

 y X  y X COV  y X V 

1

22

2

1

2

i

2

11

2

i

1 1

122

i

1

2

i

1

2

i

1

2

i2

1

2

i2

1

12

1 Nn

f -1= 

y1 Nn

f -1= 

1

1y

1 Nn

f -1= 

21

1y

1 Nn

f -1= 

1

2y

1

1

 Nn

f -1= 

1

2y1

nN

1= 

11

21yn

1= 

2yn

),(2)(n

1=yV

 

( ) ( )n

S  f  yV 

2

1  −=  

De donde se deriva fácilmente la varianza del estimador del total $Y Ny= , la cual tiene lasiguiente expresión:

( ) V Y N n

 N 

n$ = −

⎛ 

⎝ ⎜

 ⎠⎟2

2

1  

Page 17: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 17/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

16

 Su verificación Se sabe que si K es una constante y X es una variable aleatoria:

( ) ( )  V KX K V X  = 2  

Aplicando el resultado a nuestro caso:

( ) ( )( )

  V Y V Ny

 N V y

 N n

 N 

n

$ =

=

= −⎛ 

⎝ ⎜

 ⎠⎟

2

2

2

1

 

( ) V Y N n

 N 

n$ = −

⎛ 

⎝ ⎜

 ⎠⎟2

2

1  

 Tanto la varianza de  y como la de Y  se expresan en función de S2, parámetro generalmente

desconocido. En la práctica se procede con estimaciones de las varianzas de  y y Y  calculadas en base al estimador de S2 el cual será s2:

( )s

 y y

n

ii

n

2

2

1

1=

−=

∑ 

El estimador s2 de la S2 poblacional es un estimador insesgado.

( ) E s S 2 2=  

Recuérdense las siguientes expresiones y sus equivalencias:

( )

( ) ( )[ ] ( ) 222

1 1

222

   X  X  E  X  X  E  X V 

 X  N  X  X  X  N 

i

 N 

i

ii

−=−=

−=−∑ ∑= =  

Debido a que  y es una variable aleatoria se tendrá: ( ) ( ) E y V y Y n

 N 

nY 2 2

2

21= + = −⎛ 

⎝ ⎜

 ⎠⎟ +  

Por lo tanto si se recurre nuevamente al modelo de aleatorización se verifica suinsesgamiento.

Page 18: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 18/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

17

( )( )

( )⎭⎬⎫

⎩⎨⎧

−−

=

⎭⎬⎫

⎩⎨⎧

−−

=

⎭⎬⎫

⎩⎨⎧

−−

=

⎭⎬⎫

⎩⎨⎧

−−

=

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

=

∑∑

=

=

=

=

=

 N 

i

ii

 N 

i

ii

 N 

i

ii

n

i

i

n

i

i

 ynE  y X  E n

 yn y X  E n

 yn y X  E n

 yn y E n

n

 y y

 E s E 

1

222

1

222

1

22

1

22

1

2

2

)(1

1

)(1

1

1

 

( )

( ) ( )

2

2

22

2

1

22

1

222

1

22

2

1

22

2

 

11

)1( 

1

)1( 

11

)1( 

11

11

1

1

nn N  N 

n N 

nS 

n

 N 

n N S 

 N 

 N 

n

n

n

 N 

nY  N  y

 N n

n

n

 N 

n

 N 

Y  N  y

 N n

n

Y n

 N 

n y

 N n

n

n

 N 

nn y

 N 

n

n

 N 

i

i

 N 

i

i

 N 

i

i

 N 

i

i

=

⎭⎬⎫

⎩⎨⎧

−−−−

=

⎭⎬⎫

⎩⎨⎧

⎟ ⎠

 ⎞⎜⎝ 

⎛  −−

=

⎭⎬⎫

⎩⎨⎧

⎟ ⎠

 ⎞⎜⎝ 

⎛ −−⎟

 ⎠

 ⎞⎜⎝ 

⎛ −

−=

⎭⎬⎫

⎩⎨⎧

⎟ ⎠

 ⎞⎜⎝ 

⎛ −−−

−=

⎭⎬⎫

⎩⎨⎧

−⎟ ⎠

 ⎞⎜⎝ 

⎛ −−

−=

⎬⎫

⎨⎧

⎥⎦

⎤⎢⎣

⎡+⎟

 ⎠

 ⎞⎜

⎝ 

⎛ −−

=

=

=

=

=

 

Por tanto se trata de un estimador insesgado.

( ) E s S 2 2=  

Al aplicar los resultados previos se tendrán los estimadores de las varianzas insesgados de y y Y  dados por:

( )  $V yn

 N 

s

n= −

⎛ 

⎝ ⎜

 ⎠⎟1

2

  ( )  $ $V Y N n

 N 

s

n= −

⎛ 

⎝ ⎜

 ⎠⎟2

2

1  

Page 19: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 19/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

18

 2.7 Muestreo con reemplazoEl muestreo aleatorio simple supone selección aleatoria sin reemplazo, pero ¿qué ventajaofrece seleccionar la muestra sin reemplazo? Se analizan a continuación las consecuenciasde seleccionar una muestra con reemplazo. Seleccionar la muestra con reemplazo esequivalente a disponer de una serie de N casillas vacías colocadas en línea y arrojar n bolas.

Habrá casillas en las que caigan cero bolas y otras que podrán tener 1,2,….n bolas. Ladistribución asociada es una multinomial con los siguientes parámetros: ( ) )/1( N nnP X  E  ii == ,

( ) )/11)(/1()1( N  N nPnP X V  iii −=−= y ( ) 2/, N nPnP X  X Cov  ji ji −=−= . El estimador de la media

con reemplazo es insesgado y la diferencia está en su varianza.

( )

⎥⎦

⎤⎢⎣

⎡+=

⎟ ⎠

 ⎞⎜⎝ 

⎛ =

∑ ∑∑

=

<

=

 N

1i

12

2

12

),(2)(n

1

1

 N 

i

 N 

 j

 ji jiii

 N 

i

ii R

 X  X Cov y y X V  y

 X  yV n

 yV 

 

( )

( )

n

Y  y

 y N 

 N  y N 

nN 

 y N 

 N  y N 

 N 

n

 y y y y N  N 

n

 y y N  y N 

n

 N 

n y y

 N 

 N 

 N 

n y

 X  X Cov y y X V  y

i

 N 

i

ii

 N 

i

ii

 N 

i

 N 

 j  ji

 N 

i ii

 N 

i

 N 

 j

 jii

 N 

i

 N 

 j

 jii

 N 

i

 N 

 j

 ji jiii

2

 N

1i

22

 N

1i

2

1

2

22

 N

1i

2

12

22

22

 N

1i

1

1

22

22

 N

1i

12

22

 N

1i

1

2

2

2

 N

1i

12

2

nN

1

1

n

1

n

1

2n

1

21n

1

21

n

1

),(2)(n

σ  

=

⎥⎦

⎤⎢⎣

⎡−=

⎥⎥⎦

⎢⎢⎣

⎡⎟ ⎠

 ⎞⎜⎝ 

⎛ −=

⎥⎥⎦

⎢⎢⎣

⎡⎟ ⎠

 ⎞⎜⎝ 

⎛ −=

⎥⎥⎦

⎢⎢⎣

⎡⎥⎦

⎤⎢⎣

⎡+−=

⎥⎦

⎤⎢⎣

⎡−−=

⎥⎦

⎤⎢⎣

⎡−⎟

 ⎠

 ⎞⎜⎝ 

⎛  −=

⎥⎦

⎤⎢⎣

⎡+=

∑ ∑

∑ ∑

∑ ∑∑∑

∑ ∑∑

∑ ∑∑

∑ ∑∑

=

= =

= =

=

<=

=

<

=

<

=

<

 

Expresión conocida en el caso de la varianza de la media para poblaciones infinitas. Esevidente que el estimador calculado a partir de una muestra sin reemplazo tiene una menorvarianza que el calculado a partir de una muestra con reemplazo.

Page 20: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 20/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

19

 2.8 Intervalos de Confianza para Medias y TotalesGeneralmente se supone que los estimadores de la mediaY  y el total Y  se distribuyen enforma normal en torno a los parámetros. Esta suposición se basa en ciertos resultadosanálogos al Teorema Central del Límite, el cual es válido para poblaciones infinitas. Hájekencontró que la condición necesaria y suficiente para que se considere que la distribución de

 y tiende a la normalidad es:

Sin embargo, influye de manera definitiva el conocimiento previo que se tenga de la variable,ya que variables con un comportamiento francamente asimétrico, como son: los tamaños delas ciudades, de empresas ó tiendas, el ingreso de la población, etc.; requieren tamañosmayores de muestra para su convergencia a la normalidad que los requeridos para variablesde comportamiento simétrico, como son las medidas antropométricas y sus equivalentes encualquier tipo de organismos.

Las muestras relativamente pequeñas de poblaciones asimétricas suelen conservarparcialmente esa asimetría en la distribución de sus correspondientes medias.

Considere como ejemplo la distribución de tamaños de población de 153 AreasGeoestadísticas Básicas de la Delegación de Coyoacán según el censo de población yvivienda del año 2000. La distribución de sus tamaños tiene un comportamiento claramenteasimétrico. El tamaño promedio de las 153 AGEBs es de 4,185.8 personas.

Mediante simulación de Montecarlo se extrajeron 200 muestras de tamaño 15 y 200muestras de tamaño 30. En la siguiente gráfica se presentan las distribuciones empíricas deambas simulaciojnes. Puede observarse que en la muestras de tamaño 15 hay claros rastrosde asimetría. En la distribución de las muestras de tamaño 30 la presencia de la asimetría esmenor y desde luego con una menor varianza en torno al valor promedio y aproximación a lanormalidad. El error estándar calculada empíricamente para n =15 en base a las 200

( )

( )0

1 2

1

2

=−

∞→

∑=

vV 

n

i

vvi

S n

Y  y

v

 Lím

v

Page 21: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 21/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

20

muestras fue de 628.2 y el correspondiente a n = 30 fue de 419.4. Ambos valores seaproximan a los valores poblacionales de 637.5 y 417.2 respectivamente.

Si se supone que  y N Y n

 N 

n≈ −

⎛ 

⎝ ⎜

 ⎠⎟

⎛ 

⎝ ⎜

 ⎠⎟, 1

2

y por otro lado recordamos que para una variable

aleatoria Z→N (0,1) un intervalo del 100 (1-α)% de confianza se obtiene de la siguienteforma:

( ) ( )P Z Z Z  − < <

⎡⎣

⎤⎦ = −

− −1 2 1 21

α α 

α   

Se estandariza la media  Z   y Y 

n

 N 

n

= −

−⎛ 

⎝ ⎜

 ⎠⎟1

2y se obtienen los límites del intervalo.

( ) ( )

( ) ( )

− <−

−⎛ 

⎝ ⎜

 ⎠⎟

<

⎢⎢⎢⎢

⎥⎥⎥⎥

= −

− −⎛ ⎝ ⎜

⎞ ⎠⎟ < < + −

⎛ ⎝ ⎜

⎞ ⎠⎟

⎣⎢

⎦⎥ = −

− −

− −

  P Z  y Y 

n

 N 

n

 Z 

P y Z n

 N 

nY y Z 

n

 N 

n

1 2 2 1 2

1 2

2

1 2

2

1

1

1 1 1

α α 

α α 

α 

α 

/ /

/ /

 

Así, los límites del intervalo buscado serán:

( ) y Z n

 N 

n± −

⎛ 

⎝ ⎜

 ⎠⎟

−1 2

2

1α  /

 

Page 22: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 22/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

21

 

Debido a que $Y Ny= , se tiene como corolario que los límites para un intervalo de 100(1-α)

para el total Y, serán:

( )$

/Y NZ 

n

 N 

n± −

⎛ 

⎝ ⎜

 ⎠⎟

−1 2

2

1α 

 

Al desconocer S2 se puede utilizar su estimador s2. En sentido estricto la distribución a utilizarsería la t de Student con n-1 grados de libertad, pero si n>50 resulta indistinto para efectosprácticos utilizar valores percentilares de la normal estándar.

En la siguiente gráfica se presenta una serie de intervalos de 95% de confianza para lamedia calculados a partir de las primeras 40 muestras de tamaño n = 30 de las AGEBs deCoyoacán. Los intervalos de las posiciones 29 y 32 no cubren al parámetro. Las amplitudesvarían debido a los diferentes valores de la estimación de S2.

Ejemplo 2.1En una biblioteca se han puesto los libros en 130 anaqueles de tamaño semejante. Elnúmero de libros de 15 estantes seleccionados al azar fue registrado en la siguiente forma:

28,23,25,33,31,18,22,29,30,22,26,20,21,28,25

Estime el total de libros en la biblioteca y calcule un intervalo de confianza de 95% para el

total.N = 130  y

 yii= ==

∑1

15

15254.  

Page 23: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 23/86

  Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM.

22

n = 15

( )s

 y yi

i2

2

1

15

1419 257143=

==

∑.  

Como n es relativamente pequeña, se utiliza el valor percentilar de t para 97.5% y 14 gradosde libertad.

t97.5%, 14 gl = 2.145 s=4.3882961 $Y NY =   $Y  = 130 (25.4) = 3302

Intervalo de confianza:

( ) Ny NZ n

 N 

n± −

⎛ 

⎝ ⎜

 ⎠⎟

−1 2

2

1α  /

 

165.2903302

15

257143.19

130

151)145.2)(130(3302

±

⎟ ⎠

 ⎞⎜⎝ 

⎛ −±

 

El intervalo solicitado de 95% de confianza para el total Y es (3005,3599)

Page 24: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 24/86

Introducción al Muestreo Probabilístico 

23

2.9 Determinación del tamaño de Muestras para Medias y Totales

Elementos a Considerar en el tamaño de muestra.La pregunta con la que inicialmente se inician los trabajos de una encuesta es casiinevitablemente la referencia al tamaño de muestra necesario, sin embargo la respuesta no se

puede dar a la ligera, pues requiere de la determinación de varios aspectos.

a) Tener al menos una idea aproximada de la magnitud del error permisible en laestimación.

b) Elegir el nivel de confianza, esto es, la probabilidad de ubicarse dentro del margen deerror permisible.

c) Disponer información sobre la varianza de las principales variables que son objetivo dela encuesta el origen de esta información puede ser una prueba piloto, datos deencuestas similares aplicadas con anterioridad o incluso conjeturas sobre las

distribuciones y varianzas asociadas a las variables de interés.

d) Plantear una función que involucre todos estos elementos para obtener el valor deltamaño de muestra n.

e) Debido a que las encuestas usualmente tienen muchas preguntas, se debe determinarcual ó cuales son las más importantes para que en base a ellas, se calculen tamañosopcionales de muestra.

f) Cuando se desean presentar resultados por subdivisiones de la población, se debecalcular por separado el tamaño de muestra para cada subdivisión y tomar el tamaño

de muestra total como la suma de los valores de los tamaños calculados para lassubdivisiones.

Error de Muestreo

La diferencia entre el valor del parámetro de la población y el valor que toma el estimador sedenomina error de muestreo.

Error de Muestreo =θ θ − $ 

Como el error de muestreo está en términos de un parámetro desconocido, no es posible conocer

este error.

Sin embargo, es posible establecer una relación probabilística en torno a un error máximoadmisible d, de la siguiente manera siguiente.

( )

( )

  P Y y d  

P Y y d  

− > =

∴ − ≤ = −

α 

α 1 

Page 25: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 25/86

Introducción al Muestreo Probabilístico 

24

∴ =−

−⎛ ⎝ ⎜

⎞ ⎠⎟

−⎛ ⎝ ⎜

⎞ ⎠⎟

⎨⎪⎪

⎩⎪⎪

⎬⎪⎪

⎭⎪⎪

= −

∴ = −

−⎛ ⎝ ⎜

⎞ ⎠⎟

≤−

−⎛ ⎝ ⎜

⎞ ⎠⎟

−⎛ ⎝ ⎜

⎞ ⎠⎟

⎨⎪⎪

⎩⎪⎪

⎬⎪⎪

⎭⎪⎪

= −

  PY y

n

 N 

s

n

n

 N 

s

n

Pd 

n

 N 

s

n

Y y

n

 N 

s

n

n

 N 

s

n

1 1

1

1 1 1

1

2 2

2 2 2

α 

α 

 

Si se considera el supuesto de normalidad para  y , se plantea la siguiente igualdad:

( ) Z 

n

 N 

s

n

1 2 2

1

−=

−⎛ ⎝ ⎜

⎞ ⎠⎟

α  

Donde ( ) Z 

1 2−α es el valor tal que

( ) ( )P Z Z = ≤⎛ ⎝ ⎠ = −

−1 21 2α 

α  si Z ≈ N(0,1). De aquí se llega a la

siguiente expresión que define una varianza deseada por el investigador y que se define en elcociente del miembro izquierdo:

( )

 Z 

n

 N 

s

n

2

21 2

2

1−

= −⎛ ⎝ ⎜

⎞ ⎠⎟

α 

 

De esta expresión se despeja n

( )

( ) ( )

( ) ( )

d Z n

 N 

s

n

 Nnd Z N n s

 Z s N Z s n

2 2

1 2

2

2 21 2

2

21 2

2 21 2

2

1= −

⎛ 

⎝ ⎜

 ⎠⎟

= −

= −

− −

α 

α 

α α  

( )

( )

=+

−  n

 NZ s

 Nd Z s

21 2

2

2 21 2

2

α 

α 

 

Se dividen numerador y denominador entre Nd2:

( )

( ) n

 Z s

 Z s

 Nd 

=

+

2 1 22

2

21 2

2

21

α 

α  

Page 26: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 26/86

Introducción al Muestreo Probabilístico 

25

La expresión( ) Z s

21 2

2

2

−α 

corresponde al tamaño de muestra para una población infinita o una

selección con reemplazo y se identifica como no  para sustituirla en la fórmula anterior.

( )

nn

n

 N 

n Z s

o

o

=

+

=−

10

21 2

2

2

α 

 

Note que n < no y que para N muy grande n converge a no.

Ejemplo 2.2Se desea estimar el peso promedio de una población de 5000 cerdos con una precisión de d=2 kg.Se supone S2= 380 y se desea una confianza de 95%. Calcule el tamaño de muestra necesario.

d = 5 = 1.96 N=5000 S2

= 380

( ) ( ) ( )95.364

4

38096.12

2

2

21

2

===−

s Z no

α 

  12.340

5000

954.3651

954.364

1 0

=+

=+

=

 N 

n

nn o   n = 341

El tamaño de muestra es particularmente sensible a la precisión. En la siguiente tabla sepresentan tamaños de muestra en función de la precisión. Tamaño de la población N = 5000,varianza S2 = 620 y coeficiente de confianza de 95% Z = 1.96. Se ha variado la precisión d desde1 hasta 6. El tamaño de n oscila entre 66 y 1614 y no entre 66 y 2382.

2.10 Muestreo Aleatorio Simple para Proporc iones

( )21 α −

 Z 

Page 27: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 27/86

Introducción al Muestreo Probabilístico 

26

Frecuentemente se desea estimar a proporción o el total de unidades en una población queposeen determinada característica o atributo.

Supóngase que la población consta de dos clases C y C*. Los elementos de interés pertenecen ala clase C. La población consta de N elementos de los cuales A son de la clase C y N-A delcomplemento C*, la muestra aleatoria simple tiene n elementos con a pertenecientes a la clase C.

El parámetro de interés es la proporción definida por el cociente

El estimador natural de la proporción P es la proporción muestral  pa

n=  

El estimador del total de elementos de la clase de interés A, es el producto $ A Np= .

La estimación de proporciones se puede ver como un caso particular de la estimación de mediasque involucran variables que adoptan valores 0 y 1 de acuerdo a la siguiente regla.:

Sea yi =1

0

si la unidad C

si la unidad C

⎧⎨⎩

 

De aquí se concluye de manera inmediata que la proporción es equivalente a la media de ydefinida como variable dicotómica.

P N 

 A

 N 

 y

 N 

i

i

===∑

=1  

Además debido a la dicotomía de yi se tiene el siguiente resultado.

∑∑==

== N 

i

i

 N 

i

i y y A1

2

1

semejante para la muestra ∑∑==

==n

i

i

n

i

i y ya1

2

1

 

La S2 también adopta una forma particular en razón de la dicotomía.

PQ −= 1

 N 

 AP =

Page 28: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 28/86

Introducción al Muestreo Probabilístico 

27

( )

[ ])1(

1

1

 

1

1

1

2

1

22

1

22

PP N 

 N 

 NP NP N 

Y  N  y N 

Y  y N 

 N 

i

i

 N 

i

i

−−

=

−−=

⎥⎦

⎤⎢⎣

⎡−

−=

⎥⎦

⎤⎢⎣

⎡−

−=

=

=

 

La varianza del estimador de la proporción adopta una forma alternativa:

( )

)1(1

11 

12

PP N 

 N 

n N 

n

n

 N 

n pV 

−−

 ⎠

 ⎞⎜

⎝ 

⎛  −=

⎟ ⎠

 ⎞⎜⎝ 

⎛  −=

 

Al hacer las cancelaciones adecuadas se obtiene la fórmula de la varianza de p

( )n

PQ

 N 

n N  pV 

−−

= y su error estándar ( )n

PQ

 N 

n N  p EE 

−−

=  

De modo semejante al caso de  y cuya varianza está en función de S2 la cuál es desconocida lamayoría de las veces, se observa que la V(p) está en función precisamente del parámetro P.

En vista de ello lo que se hace es utilizar el estimador p para estimar su varianza.

El estimador insesgado de la S2 en términos de p adopta la siguiente expresión :

snpq

n

2

1=

−donde q = 1-p

Así al sustituir el estimador s2 en la fórmula para la estimación de la varianza de la media, para pen nuestro caso se obtiene el estimador insesgado de la varianza de p.

( )  $V pn

 N 

s

n= −

⎧⎨⎩

⎫⎬⎭

12

 

Finalmente se tendrá la fórmula para un estimador insesgado: ( ) N 

 pq

n

n N  pV 

1ˆ 

−−

=  

El error estándar estimado de p se calcula: ( ) N 

 pq

n

n N  p

1EE 

−−

=  

Page 29: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 29/86

Introducción al Muestreo Probabilístico 

28

Como resultado inmediato se tiene el estimador del total de la población con la característica deinterés y su varianza.

( ) ( ) ( ) pV  N  NpV  AV  2ˆ ==  

( )  N 

PQ

n

n N 

 N  AV  1ˆ 2

=  

Cuyo estimador es: ( ) ( ) pq

n

n N  N  AV 

1ˆˆ

−−

=  

2.11 Efecto de P en la varianza del estimador p

Si se ignora el factor de corrección por finitud en la varianza de p, se tiene ( ) V pPQ

n=  

Se toma esa expresión como una función de P

( ) ( )21PP

nn

PQP −==φ   

Se deriva φ(P) respecto a P y se iguala a cero para obtener el valor de P que maximiza a φ(P)

∂ φ 

∂ 

( )P

P

P

n=

−=

1 20 de donde

Por lo tanto, V(p) es máxima cuando P =1

Varianza del estimador de proporciones en func ión de P

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00

Valores de P

 V(p)

 

2

1=P

Page 30: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 30/86

Introducción al Muestreo Probabilístico 

29

Este resultado se suele utilizar para tener una cota máxima de la varianza y en función de ellacalcular un tamaño de muestra conservador.

2.12 La distribución Hipergeométrica en relación al estimador p.

Para el caso de p es posible conocer su distribución exacta de al vincularla a una variable aleatoriaX que representa el número de elementos de la muestra que pertenecen a la clase de interés. Elmodelo se enfoca como el caso de una urna con A elementos de la clase C y N-A elementos de laclase complementaria C*. La probabilidad de que al extraer una muestra, sin reemplazo seobtengan X = a elementos de la clase C responde a una distribución hipergeométrica. En estecontexto se considera la relación p=a/n de donde X=np.

Si se considera A/N = P son inmediatos los siguientes resultados:

nP N 

nA X  E  ==)(  

)1(

)()1(

)1(

)()()(

2 −−

−=−−−

= N 

n N PnP

 N 

n N 

 N 

 A N nA X V   

Como V(X) = V(np) = n2V(p). La varianza de p se obtiene al dividir V(X) entre n2 y se llega a la

misma fórmula que se obtuvo para V(p) como caso particular de la media de una muestra aleatoriasimple.

)1(

)(

n

P)-P(1V(p)

−−

= N 

n N  

La hipergeométrica se puede aproximar mediante la Binomial cuando A y N-A son grandes enrelación al tamaño de muestra n. Mediante la distribución Hipergeométrica y la Binomial se hanelaborado tablas y gráficas como las de Chung y De Lury (Confidence limits for the hipergeometricdistribution, University of Toronto Press; 1950) para establecer intervalos de confianza para P al

90, 95 y 99% de confianza con N=500, 2500 y 10000. La capacidad de las computadoraspersonales actuales permite construir estos intervalos para tamaños moderados de los valoresparametrales de la población.

 A N an

 Aa

na

n

 N 

an

 A N 

a

 A

a X P

−<−

<

=

⎟⎟

 ⎠

 ⎞⎜⎜

⎝ 

⎛ 

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −

−⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ 

==  

,...,2,1,0

 )(

Page 31: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 31/86

Introducción al Muestreo Probabilístico 

30

2.13 Intervalos de confianza para P mediante la aproximación normal.Si suponemos que una p se distribuye aproximadamente normal es fácil construir intervalos deconfianza basados en esta propiedad. La pregunta fundamental es ¿cuándo se puede suponer lanormalidad de p en presencia de determinados valores de N, n, P y el nivel de confianzaseleccionado? Se ha verificado que el error de aproximación es más sensible respecto a n y P. La

conclusión es que si n es moderadamente grande y P está cercano a 0.5 se puede suponernormalidad para p sin problema, pero para valores alejados de 0.5 la asimetría en la distribuciónde p juega un papel pernicioso.

W. Cochran da los siguientes valores mínimos de n requeridos para suponer la normalidad de p:

Muestra

Menor a Mayor a Requerida

0.40 0.60 50

0.30 0.70 80

0.20 0.80 200

0.10 0.90 600

0.05 0.95 1400

Valores de P

 

Si se puede suponer la normalidad, los límites de confianza para p se pueden obtener de laexpresión siguiente:

( )⎭⎬⎫

⎩⎨⎧

+−−

±− n N 

 pq

n

n N  Z  p

2

1

121 α   

En esta expresión el cociente1

2nes un factor de corrección por continuidad cuyo efecto es un

intervalo más conservador. Sin la aplicación de esta corrección, el intervalo resulta ligeramente

más angosto.

Ejemplo 2.3

Supóngase que en una muestra de n =500 estudiantes de una universidad con 20,000 alumnos,150 de ellos se transportan en auto propio. Construya un intervalo de confianza de 95% para P.

( ) ⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ +

−−

±− n N 

 pq

n

n N  Z  p

2

1

121 α   

040702.030.0

)001.0)02025637.0(96.1(30.0

)500(2

1

000,20

)7.0)(3.0(

1500

100000,20

96.130.0

±

⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ 

+−

±

 

El intervalo requerido es (0.259277, 0.340702)

Page 32: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 32/86

Introducción al Muestreo Probabilístico 

31

2.14 Tamaño de Muestra para Proporciones

Si se supone la normalidad se puede obtener una expresión para n, análoga a la obtenida para elcaso  y con una precisión d y confianza 100(1-α)%

( )

( )

( ) ( )( )

( ) ( )

( )( ) ( )

( )

( )2

2-122

2-1

2

2-1

222

2-1

2

2-1

2

2-1

222

2-1

22

2-1

22

 p2

-1

Z

Z

ZZ

ZZ

Z1

1Z 

d PQ N d 

 NPQn

 NPQnd  N d PQ

nPQ NPQnd  Nnd 

PQn N n N d 

n

PQ

 N 

n N d 

 EE d 

−+

=

=−+

−=−

−=−−−

=

=

α 

α 

α α 

α α 

α 

α 

α 

 

Se divide numerador y denominador entre d2N:

( )

( )n

PQ

PQ

 Nd  N 

=

+ −

Z

Z

21- 2

21- 2

α 

α 

2

211

 

( )

( )n

PQ

PQ

d  N 

=

+ −⎛ 

⎝ ⎜

 ⎞

 ⎠⎟

Z

Z

21- 2

21- 2

α 

α 

2

21 11

 

Si se identifica( )

n Z PQ

d o =−

21 2

2

α 

que corresponde al tamaño de una muestra con reemplazo

Finalmente se tiene el tamaño de muestra en función de no:nn

n

 N 

o=+ −

10 1

 

Page 33: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 33/86

Introducción al Muestreo Probabilístico 

32

Ejemplo 2.4

En una muestra preliminar de n = 50 estudiantes seleccionada de una población de N=4000 seencuentra que a = 30 fuman. ¿Qué tan grande debe ser la muestra para estimar p con unaprecisión de 5% con una confianza de 99%?.

N = 4000

n = 50 nn

n

 N 

o=+ −

10 1

 

p=0.6q=0.4Z=2.58

d = 0.05 (absoluta)( ) ( ) ( )( )

( )n

 Z pq

d o = = =

−2

1 2

2

2

2

2 58 0 6 0 4

0 05639 0144

α  . . .

..  

n =+

− =6390144

1639 0144 1

4000

55111032.

..  

n = 552

Ejemplo 2.5

Unos antropólogos desean estimar la proporción de personas de una región de 6,000 habtantesque presentan cierta característica de tipo hereditario. No disponen de datos de una prueba piloto

y simplemente conjeturan que la característica se presente en la mitad de los habitantes paratener un tamaño conservador de la muestra. Calculan tamaño de muestra para estimar lacaracterística con una precisión de 0.03 y 95% de confianza.

P = q = 0.5

d = 0.03

Z = 1.96 1.906

6000

111.10671

11.1067=

−+

=n  

Se redondea al entero mayor o igual y por lo tanto n = 907 

( ) ( ) ( )( )( )

11.106703.0

5.05.096.12

2

2

21

2

===−

 pq Z no

α 

Page 34: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 34/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

32

 3. MUESTREO ESTRATIFICADO

3.1 Definición y NotaciónHasta este momento se ha considerado a la población y a la muestra como conjuntos de

elementos con cierta homogeneidad, sin embargo, en ocasiones es conveniente dividir a lapoblación en subpoblaciones ó estratos. Los estratos se forman en función de variables altamentecorrelacionadas con las variables en estudio, como nivel socioeconómico, tamaño de la localidad,giro de empresas, etc.

Los elementos que se incluyen en cada estrato, se procura que sean homogéneos con respecto alas características que se investigan para obtener mayor eficiencia en el diseño.

Las principales ventajas que se tienen con la estratificación son las siguientes:

a) Utilizar información previa a la población para reducir el error de muestreo, esto es, ganar precisión en las estimaciones debido a que los elementos en cada estrato tienen cierto gradode homogeneidad.

Page 35: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 35/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

33

b) Es posible dividir la población en estratos que coincidan con divisiones geográficas oadministrativas para las cuales se requieren estimaciones separadas del total, esto es quelos estratos pueden ser dominios de estudio.

c) La estratificación permite hacer compensaciones en diseños de muestreo menos eficientes,

como por ejemplo el muestreo por conglomerados.

d) Desde el punto de vista logístico se pueden designar delegados que supervisen y controlenla encuesta en cada región ó estrato.

La notación correspondiente al muestreo estratificado es la siguiente:

N = ∑=

 L

h

h N 1

Total de unidades en la población

L Número de estratos

Nh Total de unidades en el estrato h

n = ∑=

 L

h

hn1

Tamaño total de la muestra

nh Total de unidades en la muestra del estrato h

yhi El valor de la característica investigada en la i-ésima unidad del estrato h

Wh = N 

 N h El peso ó ponderación del estrato h

f h =h

h

 N 

nFracción de muestreo en el estrato h

Yh = ∑=

 Nh

i

hi y1

Total del estrato h

h

 Nh

i

hi

 N 

 y

Y ∑

== 1 Media del estrato h

∑∑= ==

 L

h

 Nh

ihist  yY 

1 1Total de la población

 N 

 y

 L

h

 Nh

i

hi

st 

∑∑= == 1 1 Media de la población total

Page 36: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 36/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

34

 h

nh

i

hi

n

 y

h y∑

== 1 Media muestral del estrato h.

( )1

1

2

2

−= ∑=

h

 Nh

i

hhi

h N 

Y  yS  Medida de variación del h-ésimo estrato

( )

1

1

2

2

=∑

=

h

nh

i

hhi

hn

 y y

s Medida de variación de la muestra en el h-ésimo estrato

3.2 Estimadores en Muestreo Estratificado para Medias y Totales.

La media de la población total Y  se puede expresar como la suma ponderada de las medias de

todos los estratos:

∑ ∑

∑∑

=

= =

= =

=

=

=

 L

h

hh

 L

h

 Nh

i h

hih

 L

h

 Nh

i

hi

st 

Y  N 

 N 

 N 

 y N 

 N 

 N 

 y

1

1 1

1 1

 

∑=

= L

h

hhY W Y 

1

 

Para obtener el estimador de Y  se sustituyen hY  por sus correspondientes estimadores h y  

∑=

= L

h

hhst  yW Y 1

ˆ  

En ocasiones tomaremos la notación alternativa de st Y  como  yst . Debe notar que el estimador 

anterior, en general, no coincide con la media de la muestra total, la cual tendría la siguienteexpresión:

∑∑= ==

 L

h

n

ihi

h

 yn y 1 1

1

 

El estimador   y coincidiría con  yst  sólo en el caso de que se cumpla la siguiente relación de

proporcionalidad para todos los estratos.

 N 

 N 

n

n hh =  

Page 37: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 37/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

35

Si en cada uno de los L estratos  yh es un estimador insesgado de Y h entonces  yst  es un

estimador insesgado de Y st .

( )

( )

st 

 L

h

hh

 L

h

hh

 L

h

hh

 L

h

hh

st 

Y W 

Y  N 

 N 

 y E  N 

 N 

 y N 

 N  E  y E 

=

=

=

=

=

=

=

=

=

 

1

1

1

1

 

Como las muestras se obtienen de manera independiente en cada estrato, entonces la varianzadel estimador de la media total se obtiene mediante la suma de los ponderadores de los estratos al

cuadrado por las varianzas de los estimadores de las medias en los estratos.

( )

( )

( )∑

=

=

=

=

=

⎟ ⎠

 ⎞⎜⎝ 

⎛ =

 L

h

hh

h

 L

h

h

 L

h

h

h

st 

 yV W 

 yV  N 

 N 

 y N 

 N V  yV 

1

2

12

2

1

 

Si se utiliza muestreo aleatorio simple en todos los estratos, la varianza del estimador de la mediatotal st  y tiene la expresión siguiente, a la cual se designará como Forma General:

( ) V y N 

 Nh Sh

nh N  NhShst 

h

 L

h

 L

= −= =

∑ ∑1 1

2

2 2

12

2

1

 

( ) ( )

∑ ∑

= =

=

=

=

−=

⎭⎬⎫

⎩⎨⎧

=

⎬⎫

⎨⎧

=

=

 L

h

 L

h

hh

h

hh

h

h L

h

h

 L

h h

hh

 L

h

hhst 

S  N  N n

S  N 

 N 

n

 N 

 N n

S W 

 yV W  yV 

1 1

2

2

22

2

2

h

h

12

2

1

2

h

h2

1

2

11 

 N

n-1 

 N

n-1 

Page 38: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 38/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

36

Si se ignora el factor de corrección por finitud⎭⎬⎫

⎩⎨⎧

−h

h

 N 

n1 la expresión se simplifica.

( ) ∑=

= L

h h

hhst 

n

S  N 

 N  yV 

1

22

2

Como en general Sh2 es desconocido, para estimar la varianza se le sustituye por sh2 muestral enlas fórmulas mencionadas.

El error estándar se obtiene como la raíz cuadrada de la varianza y los intervalos de confianzapara la media estratificada se calculan en forma análoga al caso de muestreo aleatorio simple.

)(ˆ2/1 st st  y E  E  Z  y α −±  

El estimador del total Yst se obtiene mediante la multiplicación del estimador de la media total por 

el tamaño de la población. $Y Nyst st  =  

La varianza del estimador del total se calcula mediante el producto del cuadrado del tamaño de lapoblación total por la varianza de la media.

( ) ( ) V Y N V yst $ = 2

 

Ejemplo 3.1En una región hay 12,789 productores de cereal. Los predios han sido divididos en función del usode tecnología dominante en 3 estratos: Uso intensivo de tecnología, Uso medio de tecnología yUso bajo de tecnología. Se tomó una muestra de 31 predios divididos como lo indica la tabla. Encada predio se midió el rendimiento en Toneladas por Ha.

a) Estimar el rendimiento medio por Ha. en la región y construir un intervalo de 90% de confianza.b) Estimar la producción total en la región y construir un intervalo de 90%.

Número Estrato 1 Estrato 2 Estrato 3

1 5.06 1.6 1.28

2 3.66 2.33 2.43

3 4.02 3.46 4.48

4 4.82 3.67 1.195 4.27 1.93 4.23

6 3.32 2.55 0.23

7 2.19 1.58 4.10

8 4.1 4.09 2.99

9 1.93 2.26 3.62

10 4.35 6.36

11 2.82

12 2.27  

Page 39: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 39/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

37

( ) ∑∑==

−= L

h

 L

h

st  NhSh N nh

Sh Nh

 N  yV 

1

2

21

22

2

11 

Estrato nh

 Alt o 3,253 0.2543592 9 4.020 0.47920 1.0225 563,433.19 1,558.84 

Medio 4,234 0.3310658 10 3.436 0.66632 1.1375 1,194,487.64 2,821.18 

Bajo 5,302 0.4145750 12 2.543 0.88204 1.0544 2,066,272.88 4,676.59 

Total 12,789 1.0000000 31 3.2145 3,824,193.71 9,056.61 

Cuadro de Cálculos

h y2ˆh

S  hh yW 2ˆhhS  N 

hhh nS  N  /ˆ 22

h N hW 

 

La media se obtiene mediante la fórmula ∑=

= L

h

hhst  yW Y 1

ˆ = 3.2145 

Como la asignación de muestra en los estratos es arbitraria, se utiliza la fórmula general de lavarianza.

El error estándar se calcula al aplicar raíz cuadrada a la varianza estimada.

1527279.002333.0)(ˆ ==st  y E  E   

Para construir el intervalo de 90% de confianza se utiliza el valor percentilar 1.645 de la

distribución normal considerando que n tiene el mínimo de unidades necesario para la aplicaciónde la normal estándar.

)(ˆ2/1 st st  y E  E  Z  y α −± Al sustituir se obtiene el intervalo 3.2145 ± 1.645(0.1527279)

El intervalo solicitado para el rendimiento tiene los límites: (2.9632 , 3.4657)

La estimación del total se obtiene al multiplicar la media general estimada por el tamaño de lapoblación.

est  y N Y  =ˆ 12,789(3.2145) = 41,110.24

Los límites del intervalo se obtienen al sumar y restar al total estimado el producto del error estándar de la media por la población y el coeficiente de confianza

))(ˆ(ˆ2/1 st  y E  E  N  Z Y  α −± 41,110.24 ± 3,213.08

( ) ( )61.056,9)789,12(

171,193,824,3

)789,12(

122

−= 02333.0=

Page 40: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 40/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

38

3.3 Fuentes de variación en muestreo estratif icado. Al tener a la población dividida es estratos, la variación total de la característica de interés sepuede atribuir a dos fuentes: la variación dentro de estratos y la variación entre estratos.Esto se puede observar mediante el siguiente análisis:

( )

( ) ( )[ ]

( ) ( )( ) ( )[ ]

( ) ( )

( )( )

( )4 4 4 34 4 4 2143421

EstratosEntre

1

2

EstratosdeDentro

1

2

h

1

2

1 1

2

1 1

2

1 1

2

1 1

22

1 1

2

1 1

22

11 

11 

21

 

∑∑

∑∑ ∑

∑∑∑∑

∑∑

∑∑

∑∑

==

== =

= == =

= =

= =

= =

−+=

−+

=

−+−=

−+−−+−=

−+−=

−=

 L

h

hh

 L

h

h

 L

h

hh

 L

h

 Nh

i h

hih

 L

h

 Nh

i

h

 L

h

 Nh

i

hhi

 L

h

 Nh

i

hhhhihhi

 L

h

 Nh

i

hhhi

 L

h

 Nh

i

hist 

Y Y  N  N 

 N  N 

Y Y  N  N  N 

hY  y N  N 

Y Y  N 

Y  y N 

Y Y Y Y Y  yY  y N 

Y Y Y  y N 

Y  y N 

σ 

σ 

 

3.4 Afijación de la Muestra.El objetivo siguiente es calcular el tamaño total de muestra n y distribuir este tamaño de muestraentre los L estratos. A este proceso se le conoce también como afijación de la muestra.

Si se supone que n es conocida, la pregunta que surge es: ¿Qué es una buena afijación?. Seentenderá por una buena afijación, aquella que proporcione máxima precisión para un nivel deconfianza dado y de ser posible con el mínimo costo. Como la precisión está relacionada con lavarianza, el se buscará minimizar la varianza.

 Af ijación de Igual Número en cada Estrato.La forma más simple para asignar el tamaño de muestra correspondiente a cada estrato, es dividir el tamaño total de la muestra entre los L estratos. De este modo la expresión de nh sería lasiguiente:

La asignación de igual número en cada estrato es ineficiente, pero puede haber razones de otrotipo para su empleo.

Si se considera que la muestra total n se asigna según éste criterio, la fórmula de la varianza delestimador de la media total toma una expresión particular.

 L

nnh =

Page 41: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 41/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

39

Se parte de la Forma General:

( ) ∑∑==

−= L

h

hh

 L

h h

hhst  S  N 

 N n

S  N 

 N  yV 

1

2

21

22

2

11 

 Al sustituir  L

nnh = , se tendrá la fórmula particular para la varianza:

( ) ∑∑==

−= L

h

hh

 L

h

hhst  S  N 

 N n

S  N 

 N 

 L yV 

1

2

21

22

2

Determinación del tamaño de Muestra Total n para una Varianza fija D2 Hasta este punto se ha supuesto que se conoce el tamaño de muestra n y no se ha mencionado laforma de obtenerlo. Para ello, se parte de la fórmula que relaciona precisión, confianza y varianza:

( )( )d Z V yst  

2

1 2

2=−α 

 

Se despeja la varianza y se asignan valores a la precisión d y al coeficiente de confianza( )

 Z 1 2

2

−α .

La varianza se iguala a una constante que se llamará D2, la varianza deseada.

( )( )

  V yd 

 Z  Dst  = =

2

1 2

2

2

α 

 

Se despejará n al sustituir  ( ) V yst  por D2 según el criterio de afijación igual para cada estrato.

∑∑==

−= L

h

hh

 L

h

hh S  N  N n

S  N 

 N 

 L

1

2

21

22

2

2 1D 

∑∑==

=+∴ L

h

hh

 L

h

hh S  N n

 LS  N 

1

22

1

222D N 

=

=

+

= L

h

hh

 L

h

hh

S  N  D N 

S  N  L

1

222

1

22

 Af ijación Proporcional al Tamaño del Estrato.

Page 42: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 42/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

40

Se parte de una relación de proporcionalidad que iguala la razón del tamaño del estrato respectoal tamaño de la población con la razón del tamaño de muestra en el estrato respecto al tamañototal de la muestra.

De donde, al despejar nh se tiene la fórmula de afijación: n N 

 N n h

h =  

 A continuación se obtendrá la expresión correspondiente a la varianza de  yst  al suponer afijación

proporcional de la muestra.

Nuevamente se parte de la Forma General de la varianza de  yst .

( ) ∑∑ ==

−= L

hhh

 L

h h

hh

st 

S  N  N n

S  N 

 N  yV 

1

2

21

22

2

11 

En ella se sustituye:

n N 

 N n h

h =  

( ) ∑∑==

−= L

h

hh

 L

h h

hhst  S  N 

 N n

 N 

 N 

S  N 

 N  yV 

1

2

21

22

2

11 

( ) ∑∑==

−= L

h

hh

 L

h

hhst  S  N 

 N n

S  N 

 N  yV 

1

2

21

2 11 

El tamaño de muestra total n, se obtiene en forma semejante al caso anterior mediante unavarianza deseada D2 y se despeja n de la fórmula de la varianza de  yst  con el criterio de afijación

proporcional.

∑∑==

−= L

h

hh

 L

h

hh S  N  N n

S  N 

 N  1

2

21

22 11

∑∑==

=+∴ L

h

hh L

h

hhn

S  N  N S  N 

1

2

1

222D N 

=

=

+

= L

h

hh

 L

h

hh

S  N  D N 

S  N  N 

1

222

1

2

Ejemplo 3.2

 N 

 N 

n

n hh =

Page 43: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 43/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

41

Una fábrica de productos alimenticios tiene 1,921 empleados en sus plantas y oficinas en todo elpaís y requiere estimar la antigüedad de sus empleados de las diferentes áreas. Se ha estimado lavarianza a partir de archivos incompletos. Calcule el tamaño de muestra necesario para estimar laantigüedad promedio de los empleados toda la fábrica con una precisión de 0.5 años y un nivel deconfianza de 95%. Utilice afijación proporcional al tamaño del estrato y distribuya la muestra

resultante.

Estrato

Producción 1,250 16.0000

Distribución 531 49.0000

 Administ ración 140 36.0000

Total 1,921 

2ˆhS h N 

 

Como se desea calcular inicialmente el tamaño total de la muestra se aplicará la siguiente fórmula

y para ello se complementará el cuadro anterior con cálculos adicionales.

=

=

+

= L

h

hh

 L

h

hh

S  N  D N 

S  N  N 

1

222

1

2

Estrato

Producción 1,250 16.0000 20,000.000

Distribución 531 49.0000 26,019.000

 Administración 140 36.0000 5,040.000 

Total 1,921 51,059.000

2ˆhS h N 

2ˆhhS  N 

 

La varianza deseada D2 se obtiene con el cociente del cuadrado de la precisión deseada d = 0.5entre el cuadrado del coeficiente de confianza Z = 1.96:

2

22

 Z 

d  D = =

2

96.1

5.0⎟ ⎠

 ⎞⎜⎝ 

⎛ = 0.067057

Se sustituye en la fórmula y se obtiene el tamaño de muestra requerido.

( ) ( ) 00.059,51067057.0921,1

)00.059,51(192122

+=n = 336.817

Page 44: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 44/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

42

Se redondea al entero mayor y por tanto n = 337. La distribución proporcional al tamaño delestrato se presenta en la siguiente tabla.

Estrato nh

Producción 1,250 16.0000 20,000.000 0.650703 219 

Distribución 531 49.0000 26,019.000 0.276419 93 

 Admin is tración 140 36.0000 5,040.000 0.072879 25 

Total 1,921 51,059.000 1.000000 337 

2ˆhS h N 

hW 2ˆhhS  N 

 

 Af ijación OptimaEs posible incorporar una función de costos cuando se conoce la cantidad que cuesta levantar uncuestionario en cada uno de los estratos. Una función de uso frecuente es la siguiente:

C C Ch nhh

 L

= +=

∑01

 

Donde Co representa la suma de costos fijos y Ch el costo de levantar un cuestionario en elestrato h.

Se considera que C1 es el costo total de levantamiento de cuestionarios:

C Ch nhh

 L

11

==

∑  

Dado un presupuesto fijo C1 se pretende distribuir n en los L estratos de manera que la varianza

de la media poblacional ( ) V yst  sea mínima. Se supone muestreo aleatorio simple en cada estrato.

Se parte de la expresión general:

( ) ∑∑==

−= L

h

hh

 L

h h

hh

st  S  N  N n

S  N 

 N  yV 

1

2

21

22

2

11 

Se define una función φ(nh) y utilizando multiplicadores de Lagrange se minimizará φ(nh), esto esencontrar la nh que minimice la varianza sujeta a la restricción de costos. Estrictamente nh es

entero, pero para aplicar la técnica, se supone que nh

es cualquier real y así se tendrá φ(nh) 

continua.

( ) ⎟ ⎠

 ⎞⎜⎝ 

⎛ −+−= ∑∑∑

===

L

1

1

1

2

21

22

11 

h

hh

 L

h

hh

 L

h h

hh

h C nC S  N  N n

S  N 

 N n λ φ   

Se deriva φ(nh) respecto a nh (una en especial y el caso se generaliza para cualquier h) y se igualaa cero:

Page 45: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 45/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

43

 

( )

(a) 

2

222

22

22

22

22

 N C 

S  N n

 N C 

S  N 

n N 

S  N C 

C n N 

S  N 

n

n

h

hh

h

h

hh

h

h

hh

h

h

h

hh

h

h

λ 

λ 

λ 

λ ∂ 

∂φ 

=

=

=∴

=+−=

 

Esta expresión está en función de h a la cual se ha dado una equivalencia en término deelementos conocidos.

Si se suma (a) para toda h hasta L:

n  1L

1=h

h N 

C S  N  h

 L

h

hh

λ ∑∑ ==  

Pero recuérdese que: ∑=

= L

h

h nn1

 

1

 N 

C S  N 

n

h

 L

h

hh

λ 

∑==  

De donde:

( )  b 1

nN 

C S  N h

 L

h hh

∑==λ   

Se sustituye (b) en (a): n

1

h

 L

h

hh

hhh

h

C S  N 

C S  N n

∑=

=  

Se observa que el tamaño de la muestra es proporcional directamente al producto NhSh e

inversamente proporcional a Ch  

Varianza del estimador de la Media con Af ijación Optima

Sabemos que: ( ) ∑∑==

−= L

h

hh

 L

h h

hh

st  S  N  N n

S  N 

 N  yV 

1

2

21

22

2

11 

En afijación óptima tenemos la siguiente expresión para nh:

Page 46: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 46/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

44

  n

1

h

 L

h

hh

hhh

h

C S  N 

C S  N n

∑=

=  

 Al sustituir en la expresión general de ( ) V yst   

∑∑

==

=

−=⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛  L

h

hh

 L

h

h

 L

h

hh

hhh

hh

op

st  S  N  N 

n

C S  N 

C S  N 

S  N 

 N  yV 

1

2

21

1

22

2

11 

∑∑∑===

−⎭⎬⎫

⎩⎨⎧

⎪⎬⎫

⎪⎨⎧

=⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛  L

h

hhh

 L

h

hh

 L

h

hhh

op

st  S  N  N 

C S  N n

C S  N 

 N  yV 

1

2

211

2

11 

Tamaño de Muestra Total para una Varianza deseada D2 en Afijación Optima.

Se sustituye en la fórmula anterior la varianza deseada:

∑∑∑===

−⎭⎬⎫

⎩⎨⎧

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

= L

h

hhh

 L

h

hh

 L

h

hhhS  N 

 N C S  N 

n

C S  N 

 N  D

1

2

211

2

2 11 

∑∑

∑∑∑

∑∑∑

=

==

===

===

+

⎭⎬⎫

⎩⎨⎧

⎭⎬⎫

⎩⎨⎧

=

⎭⎬⎫

⎩⎨⎧

⎭⎬⎫

⎩⎨⎧

=⎭⎬⎫

⎩⎨⎧

+

−⎭⎬⎫

⎩⎨⎧

⎭⎬⎫

⎩⎨⎧

=

 L

h

hh

h

 L

h

hh

 L

h

hhh

h

 L

h

hh

 L

h

hhh

 L

h

hh

 L

h

hhh

 L

h

hh

 L

h

hhh

S  N  N  D

C S  N C S  N 

n

C S  N C S  N S  N  N  Dn

S  N nC S  N C S  N n N  D

1

222

11

111

222

1

2

11

22

 

Tamaño de Muestra para un presupuesto fijo C1 

Se parte de considerar que el costo de operación está limitado a un presupuesto C1 y a partir deello calcular el tamaño total de muestra.

∑=

= L

h

hh nC C 1

1  

Se sustituye la expresión de nh correspondiente a la afijación óptima:

Page 47: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 47/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

45

 

∑∑=

=

= L

h

h

 L

h

hh

hhh

h n

C S  N 

C S  N C C 

1

1

1  

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

=

=

= n

C S  N 

C S  N C 

h

 L

h

hh

 L

h

hhh

1

11  

=

== L

h

hhh

h

 L

h

hh

C S  N 

C S  N C 

n

1

1

1

 

 Af ijación de Neyman y otros cri ter ios como casos part iculares de la afi jación óptima.La afijación de Neyman se puede considerar un caso particular de la afijación óptima en el que elcosto de cada entrevista es igual en todos los estratos, es decir Ch = K1 para toda h. Se parte dela fórmula de nh para la afijación óptima.

n

1

1

1

K S  N 

K S  N n

 L

h

hh

hh

h

∑=

=  

Se obtiene la fórmula de Neyman n

1

∑=

=  L

h

hh

hhh

S  N 

S  N n  

La fórmula para la varianza del estimador de la media se obtiene mediante un procedimientoanálogo de sustitución.

V y N 

 NhSh

n N  NhShst 

ney

h

 L

h

 L⎛ 

⎝ ⎜⎜

 ⎞

 ⎠⎟⎟ =

⎛ 

⎝ ⎜

 ⎠⎟

−=

=

∑∑

1 12

1

2

2

2

1

 

Finalmente la fórmula para el tamaño general de muestra con afijación de Neyman.:

2

n

 NhSh

 D N NhSh

h

 L

h

 L=

⎛ 

⎝ ⎜

 ⎠⎟

+

=

=

1

2

2 2

1

 

Page 48: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 48/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

46

  Ahora se parte de la fórmula de afijación de Neyman y considérese el caso de desviacionesestándares iguales en todos los estratos. Esto es Sh = K2

n

2

2

1∑

=

= L

h

h

h

h

K  N 

K  N n  

n

1

∑=

= L

h

h

h

h

 N 

 N n  

nn h N 

 N h=  

Pero esta última expresión corresponde a la afijación proporcional. Así la afijación proporcional seconsidera un caso particular de la afijacion óptima en el que tanto los costos, como las varianzasen los estratos son iguales.

Finalmente se parte de la fórmula de afijación proporcional y ahora considérese que los tamañosde los estratos son iguales, Nh = K3.

n

3

3

1

∑=

= L

h

h

K n  

n1

 Lnh =  

Resulta la afijación de muestra igual en todos los estratos. En conclusión el asignar tamaños demuestra iguales a todos los estratos resulta en varianza mínima, solamente que costos, varianzasy tamaños de los estratos sean homogéneos. En la medida que uno o más supuestos no secumplan, la afijación igual en cada estrato resulta menos eficiente para estimar el parámetroglobal. Hay que insistir en que con frecuencia hay conflicto de intereses entre la estimación delparámetros global y las estimaciones para los estratos cuando éstos son dominios de estudio. Enestos casos se sacrifica un poco la precisión en la estimación global para lograr precisioneshomogéneas en los estratos.

Page 49: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 49/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

47

 

3.5 Comparación del Muestreo Estratificado con Afijación Proporcional y el Muestreo Aleatorio Simple. 

 Al inicio de este capítulo se argumentó que el muestreo estratificado brinda estimadores máseficientes que los que se obtienen por muestreo aleatorio simple. Se verificará a continuación quela varianza del estimador de la media es menor mediante el muestreo estratificado con afijaciónproporcional al compararla con la varianza del estimador de la media resultante del muestreoaleatorio simple.

Si el factor de corrección por finitud es ignorado se pueden tomar las siguientes expresiones de lavarianza:

( )

( )

  V yS 

n

V y NhSh

nN 

m a s

st 

h

 L

. . . =

= =∑

2

2

1

 

Se parte de la expresión que corresponde a S2 para toda la población.

( )

1

1 1

2

2

=∑∑

= =

 N 

Y  yh

 L

h

 Nh

i

i

 

( ) ( )

( )

( ) ( )∑ ∑∑∑

∑∑

∑∑

= = ==

= =

= =

−+−=

−+−=

−=−∴

 L

h

 L

h

 Nh

i

 Nh

i

i

 L

h

 Nh

i

i

 L

h

 Nh

ii

Y hY hY  yh

Y hY hY  yh

Y  yhS  N 

1 1 1

2

1

2

1 1

2

1 1

22

 

Si se considera válida la aproximación Nh ≈ Nh-1 y Nh ≈ Nh-1 para valores grandes de Nh, setendrá:

( )

( )

N

 S

= +

2

S NhSh Y h Y  

n

 NhSh

nN 

Y h Y 

nN 

i

 Nh

h

 L

h

 L

h

 L

i

 Nh

h

 L

2 2 2

111

2

1

2

11

= + −

===

= ==

∑∑∑

∑ ∑∑ 

Page 50: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 50/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

48

  ( )( )

  V y V y

Y h Y 

nN m a s st  

 prop

i

 Nh

h

 L

. . . =⎛ 

⎝ ⎜⎜

 ⎞

 ⎠⎟⎟ +

−==

∑∑ 2

11 

La varianza del muestreo aleatorio simple es entonces igual a la del muestreo con afijaciónproporcional más la variación entre estratos. Ello ilustra la mayor eficiencia del muestreoestratificado en la medida en que se logran estratos que maximicen la varianza entre estratos yminimicen la varianza dentro de estratos.

( )∴ ≥⎛ 

⎝ ⎜⎜

 ⎠⎟⎟  V y V ym a s st  

 prop

. . .  

3.6 Comparación del Muestreo Estratificado con Afijación Proporcional y el MuestreoEstratificado con Afijación de Neyman

Nuevamente, si se ignora el factor de corrección por finitud las expresiones de la varianza de lamedia se toman de la manera siguiente:

V y

 NhSh

nN 

V y

 NhSh

nN 

st 

 prop

h

 L

st 

ney

h

 L

⎛ 

⎝ ⎜⎜

 ⎞

 ⎠⎟⎟ =

⎛ 

⎝ ⎜⎜

 ⎞

 ⎠⎟⎟ =

⎛ 

⎝ ⎜

 ⎠⎟

=

=

2

1

1

2

2

 

Se parte de la expresión de la varianza de la media proporcionala la cual se le suma y resta lavarianza de Neyman.

111 

2

1

2

2

1

2

1

2

n

 NhSh

 N n

 NhSh

 N n

 NhSh

 N  yV 

 L

h

 L

h

 L

h

 prop

st 

⎟ ⎠

 ⎞⎜⎝ 

⎛ 

⎟ ⎠

 ⎞⎜⎝ 

⎛ 

+=⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛  ∑∑∑===  

Page 51: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 51/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

49

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟ ⎠

 ⎞⎜⎝ 

⎛ −+

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ =

⎪⎪

⎪⎪⎬

⎪⎪

⎪⎪⎨

⎟ ⎠

 ⎞⎜⎝ 

⎛ −+

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ =

∑∑

∑∑

==

=

=

2

11

2

2

12

1

2

11 

 L

h

 L

hney

st 

 L

h

 L

h

ney

st 

 NhSh N 

 NhShnN 

 yV 

 NhShn N nN 

 NhSh

 yV   

⎪⎪

⎪⎪

⎪⎪

⎪⎪

⎧⎟ ⎠

 ⎞⎜⎝ 

⎛ 

+

⎟ ⎠

 ⎞⎜⎝ 

⎛ ⎟ ⎠

 ⎞⎜⎝ 

⎛ 

−+⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ =

⎪⎪⎭

⎪⎪

⎪⎪⎩

⎪⎪

⎟ ⎠

 ⎞⎜⎝ 

⎛ +⎟ ⎠

 ⎞⎜⎝ 

⎛ −+⎟⎟

 ⎠

 ⎞

⎜⎜⎝ 

⎛ 

=

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟ ⎠

 ⎞⎜⎝ 

⎛ +⎟

 ⎠

 ⎞⎜⎝ 

⎛ −+

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ =

∑∑∑∑∑

∑∑

∑∑∑

====

=

=

=

==

===

2

2

1111

1

2

2

12

1

2

11

2

2

1

2

11

2

21

 

21 

121 

 N 

 NhSh Nh

 N 

 NhSh NhSh

 NhShnN 

 yV 

 NhSh N 

 Nh

 NhSh N 

 NhShnN 

 yV 

 NhSh N 

 NhSh N 

 NhShnN 

 yV 

 L

h

 L

h

 L

h

 L

h L

hney

st 

 L

h

 L

h

 L

h

 L

hney

st 

 L

h

 L

h

 L

hney

st 

 

=⎛ 

⎝ ⎜⎜

 ⎞

 ⎠⎟⎟ + − +

⎛ 

⎝ ⎜

 ⎠⎟

⎨⎪⎪

⎪⎪

⎬⎪⎪

⎪⎪

=⎛ 

⎝ ⎜⎜

 ⎞

 ⎠⎟⎟ + −

⎨⎪⎪

⎩⎪⎪

⎬⎪⎪

⎭⎪⎪

= = =

= =

∑ ∑ ∑

∑ ∑

V y Nh

nN Sh

Sh NhSh

 N 

 NhSh

 N 

V y

 Nh

nN Sh

 NhSh

 N 

st 

ney

h

 L

h

 L

h

 L

st 

ney

h

 L

h

 L

1 2 1 1

2

2

1 1

2

Por lo tanto

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ ≥

⎟⎟

 ⎠

 ⎞

⎜⎜

⎝ 

⎛ 

ney

st 

 prop

st  yV  yV  

Se concluye que la varianza del estimador de la media con afijación proporcional es igual a lavarianza del estimador con afijación de Neyman más una cantidad que solamente se anula cuandolas desviaciones estándares de los estratos son todas iguales.

Page 52: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 52/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

50

Se cumple entonces la triple desigualdad:

( ) ) ) Ney propmas yV  yV  yV  ≥≥  

Ejemplo 3.3

Utilice los datos por estratos del Ejemplo 3.2 y calcule el tamaño de muestra necesario paraalcanzar una precisión d = 0.5 en la estimación de la media global, con una confianza del 95% .Considere en este caso afijación de Neyman.

Se aplicarán las fórmulas siguientes

Estrato nh

Producción 1,250 16.000 20,000.000 0.6507 5,000.000 164

Distribución 531 49.000 26,019.000 0.2764 3,717.000 122

 Admin is tración 140 36.000 5,040.000 0.0729 840.000 28

Total 1,921 51,059.000 1.0000 9,557.000 314 

2ˆhS h N 

hW 2ˆhhS  N  hhS  N  ˆ

 

Z = 1.96

d = 0.5D2 = 0.067057 n = 313.64

Note que el tamaño de muestra obtenido mediante Neyman es más pequeño en 23 unidadescomparado con el calculado para afijación proporcional al tamaño con las mismas condiciones deprecisión y nivel de confianza.

n

1

∑=

=L

h

hh

hhh

S  N 

S  N n

 2

n

 NhSh

 D N NhSh

h

 L

h

 L=

⎛ 

⎝ ⎜

 ⎠⎟

+

=

=

1

2

2 2

1

Page 53: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 53/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

52

4 MUESTREO POR CONGLOMERADOS 

4.1 Definición y Notación El muestreo por conglomerados se considera como una opción de gran utilidad en situaciones enlas que por limitaciones prácticas no se dispone de un marco de unidades elementales de

observación o por razones económicas resulta más conveniente recolectar datos enagrupamientos naturales de la población, como lo son empresas, escuelas, hospitales,municipios, localidades, etc.

Se considera que la población se forma de M conglomerados como unidades de primera etapa(UPM) de las cuales se toma una muestra aleatoria simple de tamaño m. Cada conglomeradotiene Ni elementos de los cuales se toma una muestra aleatoria simple de tamañoni .

Notación

M Número de conglomerados en la población

m Número de conglomerados en muestra

Ni Tamaño del conglomerado i.

∑=

= M 

i

i N  N 1

Tamaño de la población

in Tamaño de la muestra en conglomerado i.

Page 54: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 54/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

53

∑=

=m

i

inn

1

Tamaño total de muestra

ij y Valor de la característica del j del conglomerado i.

 y

nii

iji

ni

= =

∑1 Media muestral del conglomerado i.

 Nii

iji

 Ni

= =

∑1 Media total del conglomerado i.

$Y N yi i i

=   Estimador del total del conglomerado i.

∑=

= M 

i

iC  Y  M 

Y 1

1Media de totales por conglomerado en la población

∑=

=m

i

iC  Y m

Y 1

ˆ1ˆ Media de totales por conglomerado en la muestra.

( )2

1

2

1

1

∑=

−−

= M 

i C ie

Y Y  M 

S  Cuasivarianza entre totales por conglomerados en la población. 

( )2

1

2 ˆˆ1

1ˆ ∑

=

−−

=m

i

C ie Y Y m

S  Cuasivarianza entre totales por conglomerados en la muestra 

( )2

1

2

1

1∑

=

−−

= Ni

 j

iij

i

i Y Y  N 

S  Cuasivarianza de elementos dentro del conglomerado i de la población. 

( )2

1

2 ˆ

1

1ˆ ∑

=

=ni

 j

iij

i

i Y Y 

n

S  Cuasivarianza de elementos dentro del conglomerado i de la muestra. 

Page 55: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 55/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

54

4.2 Estimador del TotalEl estimador se basa en el cálculo del promedio por unidad elemental dentro de cadaconglomerado el cual se expande al total del conglomerado al multiplicar por Ni. A continuación sepromedian estos totales para los m conglomerados en muestra y luego se expanden por el númeroM de conglomerados en la población para así tener una estimación del total de la variable.

$Y  M 

m

 Ni

niY ij

 j

ni

i

m

===

∑∑11

 

En forma alternativa, cada unidad en muestra se multiplica por un factor de expansión que es iguala los recíprocos de las probabilidades de selección en cada etapa.

∑∑∑∑= == =

==m

i

ni

 j

iji

m

i

ni

 j

ij Y F Y ni

 Ni

m

 M Y 

1 11 1

ˆ  

Propiedades del Estimador El estimador del total es un estimador insesgado.

Se prueba fácilmente al tomar esperanzas condicionales en cada etapa.

( ) ( )

 

ˆˆ

1

1

1 1

⎥⎥⎥⎥

⎢⎢⎢⎢

⎟⎟⎟⎟⎟

 ⎠

 ⎞

⎜⎜⎜⎜⎜

⎝ 

⎛ 

=

⎥⎦

⎤⎢⎣

⎡=

=

∑ ∑

∑ ∑

=

=

= =

m

i

ni

 j

ij

 ji

m

i

ni

 j

ij ji

i

ni

 y

 E  Nim

 M  E 

 yni

 Ni

m

 M  E  E 

Y  Ej E Y  E 

 

Y  M 

Y m

 M  E 

Y  Nim

 M  E 

m

i

ii

m

i

ii

==

⎥⎦

⎤⎢⎣

⎡=

⎥⎦

⎤⎢⎣

⎡=

=

=

 

1

1

 

La varianza del estimador del total se puede descomponer fácilmente en sus dos fuentes: lavarianza entre conglomerados y la varianza dentro de conglomerados. Se suma la varianza de lamuestra aleatoria simple de conglomerados en primera etapa y la varianza de las muestrasaleatorias dentro de conglomerados en la segunda etapa.

Page 56: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 56/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

55

( )4 4 4 4 34 4 4 4 214 4 34 4 21

dosConglomerade Dentro

 M 

i

i

i

dosConglomera Entre

e

ni

 Ni

ni Ni N 

m

 M 

m

 M 

m M  M Y V 

 

1

22

22ˆ  ∑

=

⎟ ⎠

 ⎞⎜⎝ 

⎛  −+

−=  

La varianza del estimador del total está en función de las cuasivarianzas entre y dentro de

conglomerados:( )

( )2

1

2

2

1

2

1

1

1

1

=

=

−−

=

−−

=

 Ni

 j

iij

i

i

 M 

i

C ie

Y Y  N 

Y Y  M 

 

La siguiente fórmula permite su estimación insesgada.

( )4 4 4 4 34 4 4 4 214 4 34 4 21

dosConglomerade Dentro

m

i

i

i

dosConglomera

 Entre

e

ni

 Ni

ni Ni N 

m

 M 

m

 M 

m M  M Y V 

 

1

22

22

ˆˆˆˆ  ∑

=

⎟ ⎠

 ⎞⎜⎝ 

⎛  −+

−=  

El mayor aporte a la varianza se da entre conglomerados, usualmente más del 90%. Ello sugiereque entre más conglomerados tenga la muestra, el estimador resulta más eficiente. Si se requiereincrementar la muestra, conviene más incrementar el número de conglomerados en muestra queincrementar el número de unidades elementales en muestra dentro de los conglomerados.

4.3 Relación del Muestreo por Conglomerados y el Muestreo EstratificadoSi el tamaño de muestra de conglomerados, (unidades de primera etapa UPM) es igual al total deconglomerados en la población, esto es m = M, lo cual equivale a un censo de UPMs, el estimadordel total por conglomerados coincide con el estimador del total por muestreo estratificado.

La varianza del estimador del total obviamente coincidirá con la forma general de la varianza paramuestreo estratificado.

∑ ∑= =

= M 

i

n

 j

ij

i

ii

Y n

 N 

 M 

 M Y 

1 1

ˆ

∑ ∑= =

= M 

i

n

 j

ij

i

ii

Y n N 

 N  N 

1 1

1

∑=

= M 

i

ii  y

 N 

 N  N 

1

∑=

= M 

i

ii yW  N 1

∑=

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=

m

i i

i

i

ii

e

n

 N 

n N 

m

 M 

m

 M 

m M Y V 

1

22

22

ˆ1

ˆ1)ˆ(ˆ

Page 57: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 57/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

56

 

Se concluye que el muestreo estratificado es equivalente a un censo de conglomerados.

Por otra parte, si todas las unidades dentro de los conglomerados en muestra son seleccionadas,entonces la contribución de la varianza se reduce a la contribución entre conglomerados.

( )m

 M 

m M  M Y V  e

22

ˆˆˆ 

−=  

Se mencionó que la proporción de la varianza entre conglomerados es mayor que la varianzadentro de conglomerados y que por ello es más eficiente incrementar el número de conglomeradosen muestra que incrementar el número de elementos dentro de conglomerados. Esto se debe a laredundancia informativa que se presenta dentro de cada conglomerado al estar formados porunidades con alto grado de homogeneidad.

Por simplicidad en los siguientes análisis, considérese el caso de tamaños de conglomeradosiguales y tamaños de muestra iguales dentro de cada conglomerado.

El estimador de la media poblacional se resulta ser equivalente al promedio simple de todas lasunidades en muestra.

∑=

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=

 M 

i i

i

i

ii

e

n

 N 

n N 

 M 

 M 

m

 M 

 M  M 

1

22

22

ˆ1

ˆ1

∑= ⎟⎟

 ⎠

 ⎞

⎜⎜⎝ 

⎛ −=

 M 

i i

i

i

i

i n

 N 

n N 

 N 

 N 

1

22

2

2 ˆ1

∑=

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −=

 M 

i i

i

i

ii

n

 N 

n

 N 

 N  N 

1

2

2

22

ˆ1

∑=

= M 

i

ii yV W  N Y V 1

22 )()ˆ(ˆ

 M 

 N  N  N i == m

nnni ==

∑ ∑= =

=m

i

n

 j ij

 yn

 N 

m

 M 

 N Y 

1 1

∑∑= =

=m

i

n

 j

ij yn

 N 

m

 M 

 N  1 1

1

∑∑= =

=m

i

n

 j

ij ynm 1 1

1

Page 58: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 58/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

57

El estimador de la varianza también experimenta un cambio sustancial.

Donde

La varianza de la media queda expresada en otros términos por:

( )mn

 N 

n N 

m

 M 

mY V  ie

2

2

2

11ˆ ⎟ ⎠

 ⎞⎜⎝ 

⎛  −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=  

Pero alternativamente se puede expresar:

( ) ∑=

⎟ ⎠

 ⎞⎜⎝ 

⎛  −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=

 M 

i

ie

mn

 M  N 

n N 

m

 M 

mY V 

1

22

1 11ˆ  

4.4 Coeficiente de Correlación Intraclase.Las unidades de análisis dentro de un mismo conglomerado presentan semejanzas que sonmedidas a través del coeficiente de correlación calculado entre todas las parejas posibles de

unidades dentro de un mismo conglomerado ⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ 

2

i N =Ni(Ni-1)/2. El coeficiente de correlación

intraclase mide la relación lineal entre las parejas de un mismo conglomerado, pero también se

puede interpretar como el incremento en la probabilidad de que dos unidades seleccionadas alazar dentro de un mismo conglomerado tengan el mismo valor para la variable de análisisrespecto de una selección no conglomerada.

⎥⎦

⎤⎢⎣

⎡⎟ ⎠

 ⎞⎜⎝ 

⎛ −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −= ∑

=

 M 

i

ie

n

 N 

n N 

m

 M 

m

 M 

m M 

 N Y V 

1

22

22

2

ˆ1

ˆ1

1)ˆ(ˆ

∑=

⎟ ⎠

 ⎞⎜⎝ 

⎛  −⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ +⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=

 M 

i

ie

n

 N 

n N 

 M 

 N 

m

 M 

 N m

 M 

m M 

 N  1

2

2

2

2

22

2

ˆ1ˆ1

1

∑=

⎟ ⎠

 ⎞⎜⎝ 

⎛  −⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ +⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=

 M 

i

ie

 M 

 N 

n N 

 M 

 N 

nm

 M 

 N m

 M 

m M 

 N  1

22

2

22

2

ˆ1ˆ1

1

∑=

⎟ ⎠

 ⎞⎜⎝ 

⎛  −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=

 M 

i

ie

 M 

 N 

n N 

mnm

 M 

m

 N  1

22

2

ˆ1ˆ1

1

mn

 N 

n N 

m

 M 

m ie22

211 ⎟

 ⎠ ⎞⎜

⎝ ⎛  −+⎟

 ⎠ ⎞⎜

⎝ ⎛  −=

∑=

= M 

i

ii

 M 

S S 

1

22

2

ˆ

2

22

1 N 

S S  e

e =

2)(

))((

Y Y  E 

Y Y Y Y  E r 

ij

ik ij

−−=

Page 59: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 59/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

58

 

4.5 Relación del Muestreo por Conglomerados y el Muestreo Aleatorio SimpleSe ha argumentado que el muestreo por conglomerados resulta más económico que el muestreoaleatorio simple, pues abarata costos al tomar unidades cercanas dentro de un mismoconglomerado, el cual puede ser una manzana como conglomerado de viviendas, una escuelacomo conglomerado de estudiantes, una fábrica como conglomerado de obreros, etc. ¿Pero cuáles el costo en eficiencia estadística?. Para dar respuesta, se Inicia con la revisión de la varianzatotal, la cual queda reflejada en la siguiente fórmula:

Esta se relaciona con y con de la siguiente forma:

Donde r es el coeficiente de correlación intraclase.

Al sustituir estas expresionaes en la fórmula de la varianza de la media se obtiene la relación de lavarianza del muestreo aleatorio simple con la del muestreo por conglomerados . Se observafácilmente que la varianza del estimador de la media por conglomerados es mayor que la delmuestreo aleatorio simple y que la diferencia se incrementa con el valor del coeficiente decorrelación y el tamaño medio de muestra dentro de cada conglomerado.

( )( )

∑∑

∑∑∑

= =

=

<

−−−

=M 

i

 N 

 j

ij

 M 

i

 N 

 j

 N 

ik ij

 N  M Y Y 

 N  N  M Y Y Y Y 

1 1

2

1

1

/)(

)2/)1(/(

( )( )

∑∑

∑∑∑

= =

=

<

−−−

−−−

=M 

i

 N 

 j

ij

 M 

i

 N 

 j

 N 

ik ij

 N  M  N  M Y Y  N  M 

 N  N  M Y Y Y Y 

1 1

2

1

1

))1((/)()1(

)2/)1(/(

( )( )

 N  M S  N  M 

 N  N  M Y Y Y Y  M 

i

 N 

 j

 N 

ik ij

/)1(

)2/)1(/(

2

1

1

−−−

=∑∑∑

=

<

( )( )

( )( ) 2

1

1

11

2

S  N  M  N 

Y Y Y Y 

 M 

i

 N 

 j

 N 

ik ij

−−

−−

=∑∑∑

=

<

( )∑∑

= = −

−=

 M 

i

 N 

i

iji

 N 

Y  yS 

1 1

2

2

1

2S 

2

1eS 2

2iS 

[ ]r  N S  M  N 

 N  M S  e )1(1

)1(

1 2

2

2

1 −+−

−= )1(

1 22

2 r S  N  M 

 N  M S  i −

−=

Page 60: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 60/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

59

 

( )mn

 N 

n N 

m

 M 

mY V  ie

2

2

2

11ˆ ⎟ ⎠

 ⎞⎜⎝ 

⎛  −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=  

El efecto de diseño fue definido por Kish (Design Effect abreviado Deff) como el cociente de lavarianza del estimador con el modelo seleccionado, entre la varianza del estimadorcorrespondiente con muestreo aleatorio simple . Algunos autores hacen referencia a la raízcuadrada del Deff identíficándolo como Deft y que daría como consecuencia el cociente análogoentre errores estándares.

De donde ( ) )Deff YV(YV  mas= esta relación es frecuentemente aprovechada para calcular el

tamaño de muestra por conglomerados a partir del cálculo del tamaño por muestreo aleatoriosimple y posteriormente multiplicándolo por el efecto de diseño.

Si se conoce el efecto de diseño y el tamaño de muestra medio por conglomerado, se puedecalcular el coeficiente de correlación intraclase en forma más simple que a partir del Deff.

1

−=

n

 Deff r   

4.6 Asignación de MuestraUna vez que se ha decidido efectuar un muestreo por conglomerados se debe determinar cuántasunidades primarias de muestreo (UPM) o conglomerados (m) hay que seleccionar en una primeraetapa y cuántas unidades de segunda etapa hay que seleccionar como promedio en cadaconglomerado. Para tener una menor varianza y costo.

Como función de costo se supondrá una que involucre los costos unitarios por acceder a unaunidad de primera etapa y a una de segunda etapa multiplicados por los respectivos tamaños. Eltotal será igual al costo variable del proyecto.

( ) ( )[ ]r nY V Y V   MAS  )1(1ˆˆˆˆ −+=

( )( )

[ ]r nY V 

Y V  Deff 

 MAS 

)1(1ˆˆ

ˆˆ−+==

n

( )mn

 N 

n N 

m

 M 

mY V  ie

2

2

2

11ˆ ⎟ ⎠

 ⎞⎜⎝ 

⎛  −+⎟

 ⎠

 ⎞⎜⎝ 

⎛ −=

nmcmccV  21 +=

Page 61: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 61/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

60

Se procede a definir una función que involucra la varianza y la restricción de la función de costospara minimizarla con la técnica del Multiplicador de Lagrange ya utilizada en muestreoestratificado.

Se procede a derivar la función respecto de m y n media e igualar a cero.

La primera ecuación se multiplica por y la segunda por

Se despeja en la segunda ecuación y se sustituye en la primera

Se distribuye el producto y se efectúan las cancelaciones necesarias

( )V ie cnmcmc

mn

 N 

n N 

m

 M 

m M −++⎟

 ⎠

 ⎞⎜⎝ 

⎛  −+⎟

 ⎠

 ⎞⎜⎝ 

⎛  −= 21

2

2

2

1 λ ϕ 

( ) 0212

2

2

2

2

2

2

2

1 =+++−−=∂

∂ncc

m N 

nm

m

m

iie λ ϕ 

022

2

2 =+−=∂

∂mc

nm

m

i λ ϕ 

2m m

( ) 021

22

2

2

22

1 =+++−− nccm N 

n

S S  ii

e λ 

02

22

2

2 =+− mcn

S  i λ 

2mλ 

2

2

2

22

nc

S m i=λ 

( ) 0212

2

2

2

2

2

2

22

1 =+++−− nccnc

 N 

n

S S  iii

e

02

2

2

2

1

2

2

2

2

2

22

1 =+++−−n

nc

cS 

 N 

n

S S  iiii

e

02

2

1

2

2

2

22

1 =++−nc

cS 

 N 

S S  ii

e

Page 62: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 62/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

61

Finalmente se despeja el tamaño medio de muestra en cada conglomerado.

Una forma alternativa de expresar el tamaño medio por conglomerado es mediante el coeficientede correlación intraclase. Se observa fácilmente que a mayor costo por UPM se incrementa lamuestra dentro de los conglomerados y que al aumentar el coeficiente de correlación intraclase, setiende a disminuir el tamaño de muestra dentro de los conglomerados.

El ahorro económico en los diseños por conglomerados trae aparejada la disminución en laprecisión que provoca el efecto de conglomeración. Ello da lugar para que los diseñadoresmezclen el muestreo por conglomerados con otros recursos como el muestreo estratificado y eluso de variables con información adicional incorporada vía procedimientos de selección conprobabilidades no homogéneas, estimadores de razón, regresión, etc.

 N 

S S 

S c

c

n

ie

i

2

22

1

2

2

2

1

=

c

cn

−=

1

2

1nmcmccT  21 +=

)( 21 ncc

cm T 

+=

Page 63: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 63/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

62

5. MUESTREO SISTEMATICO

5.1 Introducción

Suponga que una empresa con 10,000 trabajadores desea extraer una muestra de 500 de ellospara conocer su opinión sobre aspectos contractuales.

Una muestra aleatoria simple puede ser la respuesta inmediata, pero ello implica un tiempoexcesivo para la selección. Si el archivo de personal está grabado en medios magnéticos, otraopción es solicitarle al departamento de informática que emita un listado utilizando un saltosistemático cada 20 registros.

El muestreo ofrece ventajas notables por su facilidad de selección, sin embargo, hay que guardarciertas precauciones con el marco para seleccionar la muestra, pues se puede incurrir en sesgosnotables debidos a un ordenamiento relacionado con las variables objetivo de la investigación.

En principio se supone que la muestra es un submúltiplo de la población, esto es que existe una K 

entera tal que el tamaño de la población se puede expresar por el producto de K y el tamaño demuestra:

N = K*n

Cuando la proporcionalidad se cumple en forma estricta, esto es K es un entero, el procedimientode selección consiste en los siguientes pasos:

• Seleccionar un número aleatorio A entero en el intervalo 1≤ A ≤K.

• Tomar el elemento A de la población como primera unidad en muestra

• Sumar K al aleatorio A y el número obtenido será la siguiente unidad en muestra.

• Repetir el procedimiento de suma para extraer la unidad A+2K, A+3K,...,A+(n-1)K 

Suponga que se tiene una población con 12 elementos cuyos valores para la variable de interésson:

 Y1,Y2,......Y12

Se toma una muestra de tamaño n = 4 y por tanto K = 3

En función del número aleatorio de arranque A en el intervalo [1, 3]. Existen 3 posibles muestrassistemáticas.

 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12

Page 64: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 64/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

63

 Cada muestra tiene probabilidad 1/K = 1/3 de ser seleccionada. Si A=1 se incluyen en la muestra Y1,Y4,Y7 y Y10.

Si se toma una muestra n = 3 entonces K = 4 y las diferentes muestras se configuran como sigue:

 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12

Suponga que en lugar de seleccionar cada 3 o cada 4, elementos se selecciona uno de cada 5,esto es N ahora es diferente del producto nk. Las 5 muestras resultantes serían:

 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 Y11 Y12

Cada una de ellas con probabilidad 1/5 y se tendrían entonces dos muestra de tamaño 3 y tresmuestras de tamaño 2.

Ahora se verificará que el estimador de la media mediante el muestreo sistemático es insesgado sise cumple la relación de proporcionalidad.

 E yK 

 y y ysis k  ( ) ( ..... )= + + +1

1 2 

= + + +1 1

1 2 12

K n

 y y y( ..... )

 

= ==

∑1

1 N  y Y i

i

 N 

 

Claramente si K por n no es igual a N el estimador resulta sesgado. En la práctica el sesgo es muypequeño y no se suele tomar en cuenta.

Una de las alternativas que se utilizan en la práctica es tomar K no entera.

El procedimiento con la ayuda de una calculadora de bolsillo sería como sigue:

Suponga que se tiene una población de tamaño N = 1000 y se desea tomar una muestra detamaño n= 145 esto implica K=N/n = 1000/145=6.8955

• Guarde en la memoria de su calculadora el valor de K =6.8955

• Se toma un número aleatorio A en el intervalo de uno a la parte entera de K, esto es en elintervalo [1,6] 

Page 65: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 65/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

64

 • Suponga que el número aleatorio que se obtiene es A = 4.

• Seleccione el elemento que ocupa la posición A en el archivo como primera unidad enmuestra..

• Sume al aleatorio A = 4 el valor K=6.8955 lo cual le da el valor 10.8995

• Tome la parte entera del valor obtenido para incluir la unidad 10 en muestra.

• A 10.8995 súmele el valor K=6.8995 que tiene en la memoria y el resultado ahora es17.7990

• Tome la parte entera (17) y seleccione el elemento correspondiente.

• Continúe sumando hasta que la suma supere el tamaño N. En ese punto habrá concluido la

selección y tendrá en muestra n = 145 elementos.

• El procedimiento no tiene saltos sistemáticos estrictamente del mismo tamaño, pero elefecto de sesgo se puede considerar despreciable.

5.2 Varianza del Est imador de la Media

A partir de la definición de varianza se obtiene la expresión para el estimador que parte de unamuestra sistemática.

∑=

−=K 

i

isis Y  yk 

 yV 1

2)(1)( 

Puesto que hay K muestras distintas, cada una con probabilidad 1/K 

Esta sencilla fórmula encierra, sin embargo, la dificultad de no contar con un estimador de lavarianza del estimador, pues solamente disponemos de una de las K muestras.

A continuación se procede a analizar la varianza de la media estimada por muestreo sistemático.

Se parte de la suma de cuadrados total, la cual se podrá expresar como la suma de cuadradosdentro de cada muestra sistemática y la suma de cuadrados entre las K muestras sistemáticas.

( ) [ ]∑∑∑∑= == =

−+−=−K 

1i

n

1 j

ij

1i

n

1 j

2

ij )()(yy Y Y Y Y  ii

 

[ ]∑∑= =

−−+−+−=K 

1i

n

1 j

22

ij ))((2)()(y Y Y Y  yY Y Y  iiijii

 

Page 66: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 66/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

65

 

∑∑ ∑∑ ∑∑= = = = = =

−−+−+−=K 

1i

n

1 j 1 1 1 1

22

ij ))((2)()(yK 

i

n

 j

i

n

 j

iiijii Y Y Y  yY Y Y 

 

∑∑ ∑ ∑ ∑= = = = =

−−+−+−=K 

1i

n

1 j 1 1 1

22

ij )()(2)()(yK 

i

i

n

 j

iijiii Y  yY Y Y Y nY 

 

∑∑ ∑= = =

−+−=K 

1i

n

1 j 1

22

ij )()(yK 

i

ii Y Y nY 

 

Por tanto, si se despeja el segundo sumando se tendrá

( )∑∑ ∑∑∑= = = ==

−−−=−K 

1i

n

1 j 1 1

22

ij

1

2 )(y)(K 

i

n

 j

iiji

i

i Y  yY Y Y n

 

El miembro derecho se multiplica y divide por K y se tiene la varianza de la media por muestreosistemático.

( )∑∑∑∑∑= == ==

−−−=−K 

i

n

 j

iiji

i

i Y  yY Y Y K 

nK 1 1

2K 

1i

n

1 j

2

ij

1

2 )(y)(1

 

( ) ( )∑∑∑∑= == =

−−−=K 

i

n

 j

iijisis Y  yY  ynKV 1 1

2K 

1i

n

1 j

2

ij )(y

 

( ) ( )∑∑∑∑= == =

−−=K 

i

n

 j

iijisis Y  ynK 

Y nK 

 yV 1 1

2K 

1i

n

1 j

2

ij

1)(y

Se multiplica y divide el segundo sumando por N-1 para obtener una expresión en función de S2.

( )∑∑∑∑= == =

−−−−

−=

i

n

 j

iiji Y  y N 

Y  N  N 

 N 

1 1

2K 

1i

n

1 j

2

ij

1)(y

1

11

 

( ) ( )∑∑= =

−−−

=K 

i

n

 j

iijsis Y  y

 N 

 N 

 N  yV 

1 1

22 11

 

El primer sumando se puede considerar constante en cualquier población. El término que se restadepende de la varianza dentro de cada muestra, entonces en la medida en que cada muestra seamás diversa, esto es, que tenga mayor varianza, tendrá como efecto que la varianza de la mediadel muestreo sistemático será menor.

Page 67: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 67/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

66

Esta característica se suele aprovechar al ordenar las unidades a seleccionar en el marco demuestreo en función de una variable correlacionada con la variable objetivo o la misma variablecon datos correspondientes a una medición previa. Entonces se puede proceder con la selecciónsistemática. A este procedimiento se le conoce como inducción de una Estratificación Implícita. Esequivalente a tomar una sola observación de los K estratos homogéneos dentro de sí y por tanto

no es estimable la varianza dentro de cada estrato.

5.3 Coeficiente de Correlación Intramuestras.

Otra forma de medir la heterogeneidad de las muestras sistemáticas es a través del coeficiente decorrelación intramuestras. Este coeficiente se calcula de manera similar al coeficiente decorrelación intraclase del muestreo por conglomerados y la varianza del muestreo sistemático serelaciona con el muestreo aleatorio simple y el coeficiente de correlación intramuestras de formaanáloga a la relación de muestreo por conglomerados con el aleatorio simple.

( ) ( )[ ]r n yV  yV   MAS sis )1(1 −+=  

De donde se puede despejar el valor de r.

( )( )

1

1

=n

 yV 

 yV 

r  MAS 

sis

o bien en términos del efecto de diseño

Se nota fácilmente que si r = 0 la varianza del estimador de la media sistemática es equivalente ala del MAS, pero si r es grande, entonces la varianza del muestreo sistemático será tambiéngrande. Pero si r<0 entonces se logra mayor eficiencia.

Para la estimación de varianzas en la práctica se tienen dos alternativas:

Suponer que la muestra se ha extraído por muestreo aleatorio simple y aplicar la fórmula deestimación de varianza que ya conocemos a partir de S2 estimada con una muestra. Si se adoptóuna estimación implícita, esta opción será conservadora, se espera que la varianza seasensiblemente menor que la del muestreo aleatorio simple.

 Tomar varios (m) arranques aleatorios de modo que m = n/L para estimar en cada uno de ellos lamedia del grupo y a partir de las desviaciones de las medias de grupo respecto de la media globalsistemática y así estimar la varianza de la media global como varianza de la media de las msubmuestras.

( )

( )1)(ˆ 1

2

=∑

=

mm

 y y

 yV 

m

i

sisi

sis  

1

1

−=

n

 Deff r 

Page 68: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 68/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

67

6. ESTIMADORES DE RAZON

6.1 IntroduccionEs muy frecuente que a partir de los datos de una encuesta se requiera la estimación de razonesde variables que corresponden a la estructura de una clasificación o unión de categorías. Por 

ejemplo a un banco le interesa conocer del monto total de créditos que otorga, cuántocorresponde a la compra de automóviles. A un economista le interesa saber la proporción delgasto destinado a alimentos respecto del ingreso total de los hogares. A un demógrafo le interesaconocer la razón de trabajadores que ganan dos salarios mínimos o menos entre todos los que sededican a la construcción. A un organismo de capacitación agropecuaria le interesa conocer laproporción de la superficie de tierras que permanecen ociosas respecto del la superficie total detierras cultivables. En todos los casos el parámetro que se desea estimar es una razón:

=

== N 

ii

 N 

i

i

 x

 y

 R

1

1  

La estimación del parámetro se realiza a través de la razón muestral de las sumas para las dosvariables o de la razón de sus medias:

 x

 y

 x

 y

 Rn

i

i

n

i

i

==

=

=

1

1ˆ  

El cociente de estas dos medias se debe analizar en forma especial, pues los valores de las

sumas o promedios muestrales, varían de muestra a muestra. Se tiene el cociente de dosvariables aleatorias y el estimador resulta ligeramente sesgado. Por otra parte en el cálculo de lavarianza de este estimador hay que considerar la presencia de covarianzas entre las varables quese involucran en el cociente.

La estimación de razones, también es un recurso muy utilizado para lograr estimadores máseficientes cuando se dispone de una variable auxiliar fuertemente correlacionada con la variableobjetivo. Por ejemplo, se dispone del número de viviendas censadas de un grupo de localidades yse desea estimar el total de viviendas con niños en edad escolar que requieren de becas.

Para comprender de manera más simple a este tipo de estimador, considérense los datos a nivel

de AGEB de población total y población económicamente activa (PEA) de la Delegación deCoyoacán según el censo del 2000. La población total de las 153 AGEBs es 643,623 personas yde ellas 287,911 pertenecen a la PEA. La razón de la PEA a la población total es R=0.4495638.

 Ambas variables están fuertemente correlacionadas. Su correlación es r = 0.993112 .

Page 69: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 69/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

68

6.2 Interpretación Geométrica del Estimador de Razón.La razón R se interpreta geométricamente como la pendiente de una recta que pasa por el origeny que describe, en nuestro ejemplo, una relación lineal entre la población total y la PEA. Puestoque la R no es constante para todas las AGEBs, hay que considerar un término de error y elmodelo forzado a pasar por el origen se expresa como sigue:

ε += Rx y  

Se procede a continuación a estimar el valor de Y correspondiente a cada valor de X observadoscomo el producto de la razón por la población total en cada AGEB.

ii Rx y =ˆ para i = 1,2,……,n. Los valores observados y estimados se presentan en el siguiente

gráfico de dispersión:

Población Total vs Población Económicamente Activa y Razón por Población Total

 AGEBs de Coyoacán

-

1,000

2,000

3,000

4,000

5,000

6,000

7,000

- 2,000 4,000 6,000 8,000 10,000 12,000 14,000

Población Total de AGEB

      P      E      A

PEA y

R*x

Coeficiente de Correlación

r = 0.99311298

Razón PEA/PTOTAL

R = 0.4495638

 

De acuerdo con el modelo expuesto, es factible obtener un estimador de la razón por mínimoscuadrados ordinarios para el modelo forzado al origen, el cual adopta la siguiente forma:

=

==n

i

i

n

i

ii

 x

 y x

 R

1

2

1ˆ 

Page 70: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 70/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

69

Pero la varianza de iY  dado un valor de i X  adopta la forma i x2σ  , esto es, es proporcional a i X  .

Para evitar este inconveniente se utilizan mínimos cuadrados ponderados y se adopta la variable

transformada ii X Y  / , cuya varianza 2σ  no depende de i X  . Así entonces, se minimiza la suma

de cuadrados ponderada y estimador resulta ser de mínimos cuadrados ponderados :

( )∑=

−n

i i

ii x

 Rx y1

2 1 

( ) ( ) 01

21

1

2

1

2=−−=− ∑∑

==

n

i i

iii

n

i i

ii x

 Rx y x x

 Rx ydR

d  

De donde se tiene

( ) 01

=−∑=

n

i

ii Rx y y por lo tanto

 x

 y

 x

 y

 Rn

i

i

n

i

i

==

=

=

1

1ˆ  

6.3 Sesgo y Varianza del Estimador de Razón.El estimador de la razón expuesto no es un estimador insesgado, pero su sesgo disminuyesensiblemente para valores moderadamente altos de la muestra n. Se procederá, sin embargo, aun análisis más detallado del sesgo.

Primero considérense las siguientes igualdades:

( ) ( )⎟ ⎠ ⎞⎜

⎝ ⎛  −+=−+=

Y Y  yY Y  yY  y 1  

( )( )

⎟ ⎠

 ⎞⎜⎝ 

⎛  −+=−+=

 X 

 X  x X  X  x X  x 1  

Entonces el estimador de razón adopta la siguiente forma:

( ) ( ) ( ) ( )11

1111ˆ

−−

⎟ ⎠

 ⎞

⎜⎝ 

⎛  −

+⎟ ⎠

 ⎞

⎜⎝ 

⎛  −

+=⎟ ⎠

 ⎞

⎜⎝ 

⎛  −

+⎟ ⎠

 ⎞

⎜⎝ 

⎛  −

+==  X 

 X  x

Y  y

 R X 

 X  x

Y  y

 X 

 x

 y

 R  

El segundo paréntesis se puede expresar en términos de un desarrollo en serie de Taylor 

( ) ( ) ( )⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −

−+

−−⎟

 ⎠

 ⎞⎜⎝ 

⎛  −+== .........11ˆ

2

2

 X 

 X  x

 X 

 X  x

Y  y R

 x

 y R  

Page 71: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 71/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

70

De donde al efectuar el producto se obtiene:

( ) ( ) ( ) ( )( )⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛  −−−

−+

−−

−+== .........1ˆ

2

2

 X Y 

 X  xY  y

 X 

 X  x

 X 

 X  x

Y  y R

 x

 y R  

 A continuación se toma valor esperado de  R para los primeros 5 términos de la serie

( ) ( ) ( ) ( ) ( )( )⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛  −−−

−+

−−

−+= .........ˆ

2

2

 X Y 

 X  xY  y R

 X 

 X  x R

 X 

 X  x R

Y  y R R E  R E   

( ) ( ) ( ) ( )( )⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛  −−−

−+

−−

−+= .........

2

2

 X Y 

 X  xY  y E  R

 X 

 X  x E  R

 X 

 X  x E  R

Y  y E  R R  

( ) ( ) ⎟ ⎠

 ⎞⎜⎝ 

⎛ −+−+= ........,)0()0(

2x yCov

 X Y 

 R xV 

 X 

 R R R R  

n

S S 

 N 

n N 

 X Y 

 R

n

 N 

n N 

 X 

 R R

x y x  ρ ⎟ ⎠

 ⎞⎜⎝ 

⎛  −−⎟

 ⎠

 ⎞⎜⎝ 

⎛  −+≈

2

n

S S 

 N 

n N 

 X 

 X Y n

 N 

n N 

 X 

 R R

x y x  ρ ⎟ ⎠

 ⎞⎜⎝ 

⎛  −−⎟

 ⎠

 ⎞⎜⎝ 

⎛  −+≈

12

n

S S 

 N 

n N 

 X n

 N 

n N 

 X 

 R R

x y x  ρ ⎟ ⎠

 ⎞⎜⎝ 

⎛  −−⎟

 ⎠

 ⎞⎜⎝ 

⎛  −+≈

2

2

2

[ ] x y x S S  RS 

 X n N 

n N  R ρ −⎟

 ⎠

 ⎞⎜⎝ 

⎛  −+≈ 2

2

Entonces el sesgo aproximado del estimador es:

[ ] x y x S S  RS 

 X n N 

n N  R R E  ρ −⎟

 ⎠

 ⎞⎜⎝ 

⎛  −≈− 2

2

1)ˆ(  

El sesgo se anula si se cumple la siguiente condición o se reduce en la medida que sea mínima ladiferencia.

0=− y x S  RS  ρ   

Page 72: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 72/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

71

Varianza del estimador de la razón:

La varianza del estimador de razón se puede interpretar como la dispersión de rectas muestralesen torno a la recta poblacional.

( ) ( )2

ˆˆ R R E  RV  −=  

Si se supone que la diferencia entre la media muestral de x y la media poblacional de la mismavariable es pequeña, entonces  X  x = y la diferencia entre estimador de la razón y el parámetro

se puede expresar:

 X 

 x R y R R

−=−ˆ  

( )⎥⎦

⎤⎢⎣

⎡−= ∑

=

n

i

ii Rx yn X  1

11 

Si ahora se definen nuevas variables como diferencias:

iii Rx yd  −=  

La expresión anterior se expresa como promedio de diferencias.

( ) n

 X  Rx yn X 

n

i

in

i

ii

∑=

= =⎥⎦

⎢⎣

−=1

1

111 

La media parametral de las variables de diferencias es nula

( )∑∑

=

= =−=−== N 

i

ii

 N 

i

i

 X  RY  Rx y N  N 

 D1

1 01

 

Entonces la varianza de la razón se puede expresar como la varianza de la media muestral de lasdiferencias

( ) ( )2

2 1ˆ

⎥⎦

⎤⎢⎣

⎡−=− Dd 

 X  E  R R E   

( )

)1(

1 1

2

2 −

⎟ ⎠

 ⎞⎜⎝ 

⎛  −=

∑=

 N n

 Dd 

 N 

n N 

 X 

 N 

i

i

Se define

( )

1

1

2

2

=∑

=

 N 

 Dd 

 N 

i

i

d   

Page 73: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 73/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

72

 

n

 N 

n N 

 X 

2

2

1⎟ ⎠

 ⎞⎜⎝ 

⎛  −=  

De donde se concluye

( )( )

)1(

1ˆ 1

2

2 −

⎟ ⎠

 ⎞⎜⎝ 

⎛  −=

∑=

 N n

 Rx y

 N 

n N 

 X  RV 

 N 

i

ii

 

Una forma alternativa de la varianza de uso frecuente se obtiene en función del coeficiente decorrelación. Se parte de una expresión alternativa de la suma de cuadrados.

( ) ( )∑∑==

−−−=− N 

i

ii

 N 

i

ii X  RY  Rx y x R y1

2

1

2)()ˆ Por construcción del parámetro 0=− X  RY   

( )∑=

−−−= N 

i

ii X  x RY  y1

2)()(  

( )∑=

−−−−+−= N 

i

iiii X  xY  y R X  x RY  y1

222 ))((2)()(  

)()(2)()(1 11

222 X  xY  y R X  x RY  y i

 N 

i

 N 

i

i

 N 

i

ii −−−−+−= ∑ ∑∑= ==

 

 x y x y x y S S  RS  RS  N  y x RCovS  RS  N  ρ 2)1(),(2)1( 222222 −+−=−+−=  

Por lo tanto la varianza de la razón se expresa alternativamente:

La varianza del estimador de razón se puede estimar con la siguiente fórmula sustituyendo el

parámetro por su estimación a partir de la muestra:

( )( )

)1(

ˆ1

ˆˆ 1

2

2 −

⎟ ⎠

 ⎞⎜⎝ 

⎛  −=

∑=

nn

 x R y

 N 

n N 

 X  RV 

n

i

ii

 

( ) [ ] x y x y S S  RS  RS 

n N 

n N 

 X  RV  ρ 2

11ˆ 222

2−+⎟

 ⎠

 ⎞⎜⎝ 

⎛  −=

Page 74: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 74/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

73

En forma alternativa, en este caso, en función del coeficiente de correlación, varianzas ydesviaciones estándares muestrales:

6.4 Tamaño de Muestra

Se parte de la expresión de la varianza en función de la 2d S  de las desviaciones:

n

 N 

n N 

 X  RV  d 

2

2

1)ˆ( ⎟

 ⎠

 ⎞⎜⎝ 

⎛  −=  

 Apoyados en el supuesto de normalidad, la varianza se iguala al cociente del cuadrado de laprecisión deseada δ entre el cuadrado del coeficiente de confianza Z correspondiente al valor 

percentilar (1-α/2) de la normal estándar. Este cociente se identifica como varianza deseada D 2.

D2=n

 N 

n N 

 X  Z 

2

22

2/1

2 1⎟ ⎠

 ⎞⎜⎝ 

⎛  −=

−α 

δ  

 A continuación se despeja el tamaño global de muestra n

22

2/1

22

22

2/1

S  Z  N  X 

 NS  Z n

α 

α 

δ  −

+=  

Se divide numerador y denominador entre 2

2/1

22

α δ  −+ Z  N  X   

 N  X 

S  Z 

 X 

S  Z 

nd 

22

22

2/1

22

22

2/1

1δ 

δ 

α 

α 

+

= Se define22

22

2/1

 X 

S  Z n d 

oδ 

α −= el tamaño de muestra para poblaciones no acotadas.

El tamaño de muestra final queda en función de la no y del tamaño de la población.

 N 

nnn

o

o

+=

1

 

( ) [ ] x y x y S S  RS  RS 

n N 

n N 

 X  RV  ˆˆˆˆ2ˆˆˆ

11ˆˆ 222

2ρ −+⎟

 ⎠

 ⎞⎜⎝ 

⎛  −=

Page 75: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 75/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

74

6.5 Estimador de Razón en Muestreo Estratificado.

Si la población está estratificada, existen dos alternativas para estimar la razón:

a) Estimador de Razón Combinado

En este caso se estiman las medias poblacionales para ambas variables en forma independiente apartir de las medias por estrato y la razón se calcula como el cociente de estas dos estimaciones:

∑=

= L

h

hh yW  y1

r

  ∑=

= L

h

hh xW  x1

r

 

st 

st 

 L

h

hh

 L

h

hh

C  x

 y

 xW 

 yW 

 R ==

=

=

1

1ˆ  

Cuya varianza se puede aproximar con el supuesto usual de igualdadst st  X  x = de la siguiente

forma:

[ ]),(2)()(1

)ˆ( 2

2 st st st st C  x y RCov xV  R yV  X 

 RV  −+=  

Tamaño de Muestra.Se procede a desagregar la fórmula para expresar la varianza en términos de nh 

⎥⎥⎦

⎢⎢⎣

⎡⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −−⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −+⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −= ∑∑∑

=== h

hihi

h

hh L

h

h

h

 xh

h

hh L

h

h

h

 yh

h

hh L

h

hC n

 x yCov

 N 

n N W  R

n

 N 

n N W  R

n

 N 

n N W 

 X  RV 

),(2

1)ˆ(

1

2

2

,

1

22

2

,

1

2

2  

 Al factorizar y simplificar se llega a la siguiente fórmula:

[ ]),(211

)ˆ( 2

,

22

,

1

2

2 hihi xh yh

hh

hh L

h

hC  x y RCovS  RS n N 

n N W 

 X  RV  −+⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −= ∑

=

 

Equivalente a

( )

( )1

1)ˆ( 1

2

1

2

2 −

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛  −=

∑∑ =

= hh

 N 

i

hihi

h

hh L

h

hC  N n

 Rx y

 N 

n N W 

 X  RV 

h

 

 Af ijación de la Muestra para Razones

Page 76: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 76/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

75

 Nuevamente partamos de la primera expresión de la varianza para involucrar los criterios deafijación de la muestra.

[ ]),(211

)ˆ( 2

,

22

,

1

2

2 hihi xh yh

hh

hh L

h

hC  x y RCovS  RS n N 

n N W 

 X  RV  −+⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −= ∑

=

 

Por simplificación se designará: ( ) )1/(),(21

22

,

22

,

2 −−=−+= ∑=

h

 N 

i

hihihihi xh yhdh N  Rx y x y RCovS  RS S h

 

h

dh

h

hh L

h

hC n

 N 

n N W 

 X  RV 

2

1

2

2

1)ˆ( ⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −= ∑

=

 

h

dh

h

hh L

h

h

n

 N 

n N 

 N 

 N 

 X 

2

12

2

2

1⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −= ∑

=

 

( )h

dhhh

 L

h

h

n

S n N 

 N 

 N 

 X 

2

122

1−= ∑

=

 

Finalmente se tiene una forma general de la varianza del estimador de razón combinado.

⎥⎦

⎤⎢⎣

⎡−= ∑∑

==

 L

h

dhh

 L

h h

dhh

C  S  N n

S  N 

 N  X  RV 

1

2

1

22

22

1)ˆ(  

Se adopta esta expresión y a continuación se define una función de nh con la adición de unmultiplicador de Lagrange aplicado la restricción del tamaño de muestra y se deriva respecto de

una nh para obtener la expresión para afijación de muestra con el criterio de Neyman.

( ) ⎟ ⎠

 ⎞⎜⎝ 

⎛ −+⎥

⎤⎢⎣

⎡−=Φ ∑∑∑

===

 L

h

h

 L

h

dhh

 L

h h

dhhh nnS  N 

n

S  N 

 N  X n

11

2

1

22

22

1λ   

( )0

222

22

=+−=Φ

λ h

dhh

h

h

n N  X 

S  N 

dn

nd  

Se despeja nh de la anterior expresión

λ  N  X 

S  N n dhhh = ………………………. (a)

Considerando que siempre se cumple nn L

h

h =∑=1

 

Page 77: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 77/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

76

 

∑=

= L

h

dhh

 N  X 

S  N n

1 λ ……………………….(b)

De esta expresión se despejaλ 

de (b) y se sustituye en (a) para obtener la expresión denh

 

∑=

= L

h

dhh

 Nn X 

S  N 

1

λ   

Por lo tanto se obtiene finalmente la form de nh para afijación de Neyman.

n

S  N 

S  N n

 L

h

dhh

dhh

h

∑=

=

1

 

Cálculo de la Varianza del Estimador de Razón Combinado con Afijación de Neyman.

S comienza por sustituir la nh encontrada en la forma general de la varianza

⎥⎦

⎤⎢⎣

⎡−= ∑∑

==

 L

h

dhh

 L

h h

dhhC  S  N 

n

S  N 

 N  X  RV 

1

2

1

22

22

1)ˆ(  

Finalmente la fórmula para la varianza de la razón bajo el supuesto de afijación de Neyman

∑∑==

−⎟

 ⎠

 ⎞⎜

⎝ 

⎛ =

 L

h

dhh

 L

h

dhh Ney S  N  N  X n

S  N  N  X 

 RV 

1

2

22

2

1

22

111)ˆ(  

Tamaño General de MuestraEsta expresión de varianza se iguala a una varianza deseada D2 y se despeja n, se dispondráentonces de la fórmula para calcular un tamaño de muestra global bajo afijación de Neyman.

=

=

+

⎟ ⎠

 ⎞⎜⎝ 

⎛ 

= L

h

dhh

 L

h

dhh

S  N  N  X  D

S  N 

n

1

2222

2

1

 

En caso de utilizar afijación de muestra proporcional al tamaño del estrato, por un procedimientoanálogo se obtienen las siguientes fórmulas para afijar la muestra, calcular varianzas y determinar tamaño global de la muestra:

n N 

 N n h

h =  

Page 78: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 78/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

77

 

∑∑==

−= L

h

dhh

 L

h

dhhop S  N 

 N  X n

S  N 

 N  X  RV 

1

2

221

2

2Pr 

11)ˆ(  

=

=

+

= L

h

dhh

 L

h

dhh

S  N  N  X  D

S  N  N n

1

222

1

2

 

b) Estimador de Razón Separado.

El estimador global de razón se obtiene como la suma ponderada de las estimaciones separadasde las razones de los estratos. Es de utilidad cuando los estratos son dominios de estudio y serequieren estimaciones de razones separadas para cada estrato, las cuales pueden diferir sensiblemente.

∑=

= L

h

hhS  RW  R1

ˆˆ Dondeh

h

n

i

hi

n

i

hi

h x

 y

 x

 y

 Rh

h

==

=

=

1

1ˆ  

Puesto que las muestras son independientes

∑=

= L

h

hhS  RV W  RV 1

2 )ˆ()ˆ(  

Donde

Como se puede observar, la varianza depende de las varianzas, razones y los coeficientes decorrelación de cada estrato.

El sesgo del estimador de razón, que es muy pequeño en la estimación del estimador combinado,puede ser de magnitud peligrosa al estimar cada razón por separado, pues se tiene unaacumulación de sesgos en lugar de uno sólo, sobretodo ante la presencia de muchos estratos conpequeños tamaños de muestra. Si se toma la diferencia de varianzas entre ambos estimadores, sepude observar que coinciden, solamente en el caso de que medias, razones y coeficientes decorrelación de los estratos, sean iguales a las globales.

( ) [ ]hxhyhhhxhhy

hh

hh

h

h S S  RS  RS n N 

n N 

 X  RV  ρ 2

11ˆ 222

2−+⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛  −=

( ) [ ]∑=

−+⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛  −=

 L

h

hxhyhhhxhhy

hh

hh

h

hS  S S  RS  RS n N 

n N 

 X W  RV 

1

222

2

2 211

ˆ ρ 

( ) ( ) ( ) ( )[ ]∑=

−−−+⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛  −

⎥⎥⎦

⎢⎢⎣

⎡−=−

 L

h

hxhyhhhC hxhC hy

hh

hh

h

S C  S S  R RS  R RS n N 

n N 

 X  X  RV  RV 

1

222

222

111ˆˆ ρ  ρ 

Page 79: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 79/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

78

 

En cuanto a cálculos de tamaño de muestra globales y afijación de muestra, se pueden utilizar los

mismos resultados vistos para el estimador combinado, excepto que la S

2

dh adopta la siguienteforma al estar en función de la razón en cada estrato y no en función de la razón global:

( )∑=

−−=−+=h N 

i

hhihhihxhyhhhxhhydh N  x R yS S  RS  RS S 1

22222 )1/(2 ρ   

6.6 Estimador Insesgado de la Razón.

H. Hartley y A. Ross publicaron en 1954 en la revista Nature un artículo sobre estimadoresinsesgados de razón. Su método parte del estimador sesgado calculado como promedio derazones elemento a elemento a partir de una muestra aleatoria simple.

∑=

=n

i i

i

 X 

n R

1

1ˆ  

Se verifica a continuación que éste es un estimador sesgado.

( ) ⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑

=

n

i i

i

 X 

n E  R E 

1

1ˆ  

⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ 

= ∑=

 N 

i

i

i

i

W  X 

n E 1

( )∑=

= N 

i

i

i

i W  E  X 

n 1

∑=

= N 

i i

i

 N 

n

 X 

n 1

∑=

= N 

i i

i

 X 

 N  1

1Pero este cociente es en general diferente de

=

== N 

i

i

 N 

i

i

 X 

 R

1

1  

El sesgo del estimador promedio de razones queda expresado de la manera siguiente:

Page 80: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 80/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM 

79

( ) X 

Y  R E Sesgo −= ˆ Por otra parte, un estimador insesgado de

 X 

 X 

 N 

 N 

i i

i −= ∑=1

es (Teorema 2.3 Cochran)

 X 

Y  X 

 N  X 

 N 

i i

i∑=

= 1

1

 

 X 

 X  X 

 N  X 

 N  X 

 N 

i

 N 

i

i

i

i

i

i∑ ∑= =

= 1 1

11

 

( )

 X 

 X  X  X 

 N 

 N 

i

i

i

i∑=

−−

= 1

1

 

( )∑=

−−= N 

i

ii X  X  R X  N  1

( )∑=−−

−−=

 N 

i

ii X  X  R N  X  N 

 N 

11

11 

Entonces un estimador insesgado del sesgo, aunque la frase suene redundante, combinandoambos resultados es:

( ) x R yn

n

 X  N 

 N  ˆ1

1−

−−=  

El estimador insesgado de Hartley y Ross se expresa finalmente como la siguiente diferencia:

( ) x R yn

n

 X  N 

 N  R R HR ˆ

1

1ˆˆ −−

−−=  

Existen otras propuestas para estimadores insesgados y para funciones de razones, tales comococientes de razones, productos y diferencias.

( )∑=

−−

 N 

i

ii X  X  R N  11

1

( )∑=

−−

n

i

ii x x Rn 11

1

( )∑=

−−

=n

i

ii x x Rn

n

n 11

1

( )∑=

−−

=n

i

 x R yn

n

1

ˆ1

Page 81: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 81/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM. 

80

7. ESTIMADORES CON PROBABILIDADES PROPORCIONALES AL TAMAÑO(PPT) CON REEMPLAZO.

7.1 Introducc iónSupongamos que se desea seleccionar una muestra de empresas dedicadas al ramo textil para

conocer el valor de la producción en el ramo. Si se dispone de una lista de empresas se puedeproceder a seleccionar una muestra aleatoria a partir de la lista. Las empresas de este ramo, enforma semejante a lo que sucede con otros ramos, suelen tener distribuciones muy asimétricas enlo que se refiere a su tamaño. Las empresas de gran tamaño y medianas, que de hecho son lasque dominan el mercado, son poco numerosas y muy numerosas las pequeñas y microempresas.En consecuencia una muestra aleatoria de la lista estaría dominada por empresas pequeñas y esfactible que ninguna de las 10 empresas más grandes apareciera en muestra. Desde luego, si sedispone de datos sobre su capital social o del número de trabajadores que trabajan en ellas, esposible adoptar esa información para estratificarlas o efectuar una estimación indirecta vía unestimador de razón, pues lógicamente estas variables se espera que guarden una fuertecorrelación positiva con la producción. Otra alternativa frecuentemente utilizada es adoptar la

variable como medida de tamaño y utilizarla para definir probabilidades de selecciónproporcionales a esa medida de tamaño (PPT). Esto es las probabilidades de selección serándesiguales.

7.2 Estimador de Hansen y Hurwi tzEl diseño de muestras con reemplazo y probabilidades desiguales fue propuesto inicialmente porHansen y Hurwitz y se plantea en los siguientes términos:

Una vez definido un tamaño de muestra n, si la selección se hace con reemplazo, cada una de lasN unidades en la población puede ser seleccionada 0,1,2,……n veces. Esta situación es análoga atener una serie de N cajas y arrojarles n bolas. En cada caja puede suceder que no caiga unasola bola, que caiga una o más de 1. El caso extremo sería que las n bolas arrojadas cayeran enla misma caja. En otra perspectiva, cada una de las N cajas puede acumular 0,1,2,…..n bolas.

Sea Pi la probabilidad de que una bola caiga en la caja i-ésima en cada evento de arrojar unabola y sea Xi el número de bolas acumuladas en cada caja. La distribución conjunta de las Xicorresponde a una multinomial:

Page 82: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 82/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM. 

81

( ) N  x

 N 

 x x

 N 

 N  PPP x x x

n x x x f  .......

!!......!,......, 21

21

21

21 = 

La función de probabilidad multinomial tiene los siguientes valores esperados:

( )ii

nP X  E  =   ( ) ( )iiiPnP X V  −= 1    ji ji PnP X  X Cov −=),(  

El estimador del total para la variable Y propuesto por Hansen y Hurwitz adopta la siguiente forma:

∑=

= N 

i i

ii

 HH  X  E 

 xY Y 

1 )(ˆ  

∑==

 N 

i i

ii

nP

 xY 

1  

∑=

=n

i i

i

P

n 1

1Una vez eliminadas las unidades no seleccionadas y con inclusión posibles

repeticiones de las seleccionadas.

Considérese el caso particular en el que N 

Pi1

= , esto es que las probabilidades para todas las

cajas son homogéneas. El estimador adoptará entonces la forma del conocido estimador del total:

∑∑∑===

====n

i

i

n

i

in

i i

i

 HH  y N Y n

 N 

 N 

nP

nY 

111 /1

11ˆ  

Si Yi tiene probabilidades que guardan una relación de proporcionalidad con el total, esto esPiY=Yi, entonces el estimador coincide con el parámetro para cualquier muestra.

∑ ∑∑= ==

====n

i

n

ii

in

i i

i

 HH  Y Y nY Y 

nP

nY 

1 11

1

/

11ˆ  

Esta propiedad sugiere que si se tiene una variable de tamaño correlacionada con la variable

objetivo que guarde cierta relación de proporcionalidad con la variable objetivo y comoconsecuencia con una fuerte correlación positiva, entonces esa variable de tamaño se puedeutilizar para definir probabilidades proporcionales al tamaño y que redundaría en una mejorestimación del total que con una muestra aleatoria simple.

Page 83: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 83/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM. 

82

7.3 Varianza del Estimador de Hansen y HurvitzLa varianza del estimador de Hansen y Hurvitz se obtiene a continuación:

( ) ( ) ( ) 222ˆˆˆ Y Y  E Y Y  E Y V   HH  HH  −=−=  

=−⎟⎟

 ⎠

 ⎞⎜⎜

⎝ 

⎛ +=−⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑ ∑∑∑

=

<=

2

1

1

22

22

2

22

1

211Y 

P

 X Y 

P

 X Y 

nP

 X Y 

n E Y 

P

 X Y 

n E 

 N 

i

 N 

i

 N 

 j j

 j j

i

ii

i

ii N 

i i

ii  

=−+⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑ ∑∑

=

<

2

1

1

2

2

2

2)(

2)(

1Y  X  X  E 

PP

Y Y 

n X  E 

P

n

 N 

i

 N 

i

 N 

 j

 ji

 ji

 ji

i

i

i  

Ahora se vuelve la atención a las propiedades de la multinomal:

( ) ( ) ( ) ( ) ( )iiiiiii PnPPn X  E  X  E  X  E  X V  −=−=−= 122222  

De donde

( ) 222222 )1( iiiiiiiPnnPnPPnPnP X  E  +−=+−=  

 ji ji ji ji jiiiii ji PnPPPn X  X  E  X  E  X  E  X  X  E  X  E  X  X  E  X  E  X  X Cov −=−=−=−−= 2)()()()())()((((,(  

De donde

 ji ji ji PnPPPn X  X  E  −= 2)(  

Por lo tanto al sustituir en la expresión de la varianza

2

1

1

2

2

2

2)(

2)(

1)ˆ( Y  X  X  E 

PP

Y Y 

n X  E 

P

nY V 

 N 

i

 N 

i

 N 

 j

 ji

 ji

 ji

i

i

i

 HH  −+⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑ ∑∑

=

<

 

( ) ( ) 2

1

12

2

222

2

2

21Y PnPPPn

PP

Y Y 

nPnnPnP

P

n

 N 

i

 N 

i

 N 

 j

 ji ji

 ji

 ji

iii

i

i −−++−⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑ ∑∑

=

<

 

21

21

12

2

22

1

2

2

2

1

2

2

2

2

22111Y PnP

PP

Y Y 

nPPn

PP

Y Y 

nPn

P

nnP

P

nnP

P

n

 N 

i

 N 

 j

 ji

 ji

 ji N 

i

 N 

i

 N 

 j

 ji

 ji

 ji

i

 N 

i i

i

i

 N 

i i

i

i

i

i −−+⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ +⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ −⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑∑∑ ∑∑∑∑

<=

<==

 

21

1

1

1

2

1

2

2

2

22

11Y Y Y 

nY Y Y Y 

nnP

P

n

 N 

i

 N 

 j

 ji

 N 

i

 N 

i

 N 

 j j ji

 N 

i

i

 N 

i

ii

i

i −−++−⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑∑∑ ∑∑∑∑

<=

<==

 

Page 84: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 84/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM. 

83

21

1

2

1

2

2

2

211Y Y Y 

nY Y 

nnP

P

n

 N 

i

 N 

 j

 ji

 N 

i

 N 

i

ii

i

i −−+−⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ = ∑∑∑ ∑

<= =

 

∑∑∑ ∑

<= =

−−⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ =

1

1 1

2

2

211 N 

i

 N 

 j ji

 N 

i

 N 

iii

i

i

Y Y nY nPP

n  

∑ ∑ ∑∑= =

<⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ +−⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ =

 N 

i

 N 

i

 N 

i

 N 

 j

 jiii

i

i Y Y Y n

PP

n 1 1

12

2

211

 

∑=

−⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ =

 N 

i

i

i

i

n

Y P

P

n 1

22

De donde finalmente se tiene la varianza:

∑=

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −=

 N 

i

i

i

i

 HH  PY P

nY V 

1

2

1)ˆ(  

Si se torna al estimador con probabilidades iguales Pi= 1/N y con reemplazo, su varianza estaríadada por:

( ) ∑=

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −=

 N 

i

i

 HH  N 

Y  N 

nY V 

1

2

1

/1

1ˆ  

( )∑=

−= N 

i

i N 

Y  NY n 1

2 11 

( )∑=

−= N 

i

i N 

Y  NY n 1

2 11 

∑=

⎟ ⎠

 ⎞⎜⎝ 

⎛ −=

 N 

i

i N  N 

 NY  NY 

n 1

211

 

∑=

⎟ ⎠ ⎞⎜

⎝ ⎛  −=

 N 

i

i N 

 N 

 N 

Y Y n 1

22

1  

( )

n N 

 N 

Y Y 

n

 N 

 N 

i

i 221

2

2σ  

=

=∑

=  

Page 85: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 85/86

Introducción al Muestreo Probabilístico

Profr. Francisco Sánchez VillarrealFacultad de Ciencias UNAM. 

84

Varianza que resulta familiar, ya que corresponde al estimador del total para una muestra aleatoriacon reemplazo.

Un estimador insesgado de la varianza del estimador de Hansen y Hurwitz se calcula mediante lasiguiente fórmula:

)1(

ˆ

)ˆ(ˆ 1

2

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −

=

∑=

nn

Y P

Y V 

n

i i

i

 HH   

Este es un estimador muy fácil de calcular y como se mencionó, es insesgado, lo cual se verifica acontinuación:

)1(

ˆ

)ˆ(ˆ1

2

⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −

=

∑=

nn

Y P

Y V 

n

i

 HH 

i

i

 HH   

⎥⎥

⎢⎢

⎡−⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ 

−= ∑

=

n

i

 HH 

i

i Y nP

nn 1

2

2

ˆ)1(

1Por una relación de frecuente uso en estadística.

Como la varianza de una variable más la suma algebráica de una constante no se altera,V(X)=V(X±K). Se suma y resta el valor parametral del total en la expresión anterior.

⎥⎥⎦

⎢⎢⎣

−−⎟⎟ ⎠

 ⎞⎜⎜⎝ 

⎛ −−= ∑=

2

1

2

)ˆ()1(

1 Y Y nY PY 

nnHH 

n

i i

i  

A continuación se agrega la variable indicadora de selección de la unidad correspondiente y elrecorrido de la suma se extiende a N

⎥⎥

⎢⎢

⎡−−⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ −

−= ∑

=

2

1

2

)ˆ()1(

1Y Y n X Y 

P

nnHH i

 N 

i i

i  

Enseguida se procede a tomar esperanza matemática de toda la expresión y se concluye elinsesgamiento.

[ ]⎥⎥

⎢⎢

⎡−−⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ −

−= ∑

=

2

1

2

)ˆ()()1(

1))ˆ(ˆ( Y Y nE  X  E Y 

P

nnY V  E   HH i

 N 

i i

i

 HH   

Page 86: Tecnicas de muestreo PROBABILISTICO

7/16/2019 Tecnicas de muestreo PROBABILISTICO

http://slidepdf.com/reader/full/tecnicas-de-muestreo-probabilistico 86/86

Introducción al Muestreo Probabilístico

( )⎥⎥

⎢⎢

⎡−⎟⎟

 ⎠

 ⎞⎜⎜⎝ 

⎛ −

−= ∑

= HH 

 N 

i

i

i

i Y nV nPY P

nnˆ

)1(

1

1

2

 

( )

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

−⎟⎟ ⎠

 ⎞

⎜⎜⎝ 

⎛ 

−= ∑=

 HH 

 N 

i

i

i

i

Y nV n

PY P

nnn

ˆ)1(

1 1

2

2  

( )[ ] HH  HH  Y nV Y V nnn

ˆ)ˆ()1(

1 2 −−

=  

)ˆ(  HH Y V =