Muestreo de Encuestas

23
Capítulo 16 16. Estudios de muestreo 1 16.1. Por qué tomar sólo una muestra cuando la población es finita? Los estudios de muestreo son empleados por el ecólogo que desea obtener información para construir mapas de comunidades de plantas, por el silvicultor que desea conocer el rendimiento de madera de un bosque, y por el gerente de un servicio de evaluación (Rating) que desea determinar la popularidad de programas de TV entre los televidentes. Los estudios también se usan para pronosticar la recolección de la cosecha, identificar las condiciones sociales y económicas prevalecientes, como desempleo, cuidado de la salud, e inflación, y para examinar las actitudes de personas hacia la legislación propuesta. Un barómetro de opiniones públicas, tan importante para una democracia, se proporciona prontamente por los estimativos basados en una muestra de la reacción pública a los efectos de tales eventos como una nueva regulación salarial, un cambio mayor en políticas de comercio, o las acciones de líderes mundiales. Cuando cualquier característica de la población es de interés, un censo o una evaluación completa de todos los miembros de la población puede proporcionar razonablemente toda la información deseada. Sin embargo, las circunstancias a menudo no hacen posible una evaluación tan extensa. Tanto consideraciones de costo como la falta de personal calificado y, si se requiere, los equipos altamente especializados pueden limitar severamente el tamaño de un estudio propuesto. Por estas razones y/o cuando se desea obtener rápidamente información bastante exacta, es prudente renunciar a un censo y estudiar una muestra "representativa" de la población en cuestión. El propósito principal de este capítulo es presentar al lector los procedimientos para recoger tal muestra y los métodos para analizar los datos muestreados. Cuando se planea y se ejecuta adecuadamente el estudio, muestras consistentes de unos pocos centenares de unidades pueden proporcionar información exacta acerca de una población de centenares de miles. Las técnicas de la inferencia examinadas en este capítulo no son diferentes de los procedimientos discutidos anteriormente, excepto que los últimos han estado basados principalmente en el supuesto de una población infinita donde una muestra aleatoria está conformada de variables aleatorias distribuidas independiente e idénticamente. Los problemas del estudio de muestras tratados aquí involucran poblaciones finitas (aunque a menudo bastante grandes) y con la excepción del caso de muestreo simple con reemplazamiento, las observaciones en estudios de encuestas no pueden, estrictamente hablando, ser consideradas independientes. Para facilitar una comprensión de la naturaleza del estudio muestral, que es común a muchos campos de aplicación, empezamos con unas pocas definiciones y luego discutimos la idea de sesgo y el método de selección de muestras aleatorias. Seguidamente introducimos el concepto de estratificación, que nos lleva a un método ligeramente más complejo pero muy útil de obtener una muestra representativa de una población. 16.2. La especificación de la población y la característica de interés Una vez que se ha tomado la decisión de obtener información por medio de un estudio muestral, nos enfrentamos inmediatamente con dos tareas: definir cuidadosamente la población que deseamos estudiar, y seleccionar la característica o características para ser tomadas en cuenta. La población objetivo es la población sobre la que nosotros deseamos hacer inferencias con base en una muestra. 1 Traducción del capítulo 16 “Sample Surveys” del libro “Statistical Concepts And Methods”, Gouri K. Bhattacharyya and Richard A. Jhonson. John Wiley and Sons, Inc. 1977. Traducción por parte de estudiantes del curso de “Estadística Matemática I” (semestre 02 de 2000) del Departamento de Ingeniería Industrial de la Facultad de Ingeniería de la Universidad de Antioquia, con la recopilación, corrección y adaptación del profesor Bernardo A. Calderón C.

description

estudios de muestreo empleados ecólogos. cap16

Transcript of Muestreo de Encuestas

  • Captulo 16 16. Estudios de muestreo1

    16.1. Por qu tomar slo una muestra cuando la poblacin es finita? Los estudios de muestreo son empleados por el eclogo que desea obtener informacin para construir mapas de comunidades de plantas, por el silvicultor que desea conocer el rendimiento de madera de un bosque, y por el gerente de un servicio de evaluacin (Rating) que desea determinar la popularidad de programas de TV entre los televidentes. Los estudios tambin se usan para pronosticar la recoleccin de la cosecha, identificar las condiciones sociales y econmicas prevalecientes, como desempleo, cuidado de la salud, e inflacin, y para examinar las actitudes de personas hacia la legislacin propuesta. Un barmetro de opiniones pblicas, tan importante para una democracia, se proporciona prontamente por los estimativos basados en una muestra de la reaccin pblica a los efectos de tales eventos como una nueva regulacin salarial, un cambio mayor en polticas de comercio, o las acciones de lderes mundiales. Cuando cualquier caracterstica de la poblacin es de inters, un censo o una evaluacin completa de todos los miembros de la poblacin puede proporcionar razonablemente toda la informacin deseada. Sin embargo, las circunstancias a menudo no hacen posible una evaluacin tan extensa. Tanto consideraciones de costo como la falta de personal calificado y, si se requiere, los equipos altamente especializados pueden limitar severamente el tamao de un estudio propuesto. Por estas razones y/o cuando se desea obtener rpidamente informacin bastante exacta, es prudente renunciar a un censo y estudiar una muestra "representativa" de la poblacin en cuestin. El propsito principal de este captulo es presentar al lector los procedimientos para recoger tal muestra y los mtodos para analizar los datos muestreados. Cuando se planea y se ejecuta adecuadamente el estudio, muestras consistentes de unos pocos centenares de unidades pueden proporcionar informacin exacta acerca de una poblacin de centenares de miles. Las tcnicas de la inferencia examinadas en este captulo no son diferentes de los procedimientos discutidos anteriormente, excepto que los ltimos han estado basados principalmente en el supuesto de una poblacin infinita donde una muestra aleatoria est conformada de variables aleatorias distribuidas independiente e idnticamente. Los problemas del estudio de muestras tratados aqu involucran poblaciones finitas (aunque a menudo bastante grandes) y con la excepcin del caso de muestreo simple con reemplazamiento, las observaciones en estudios de encuestas no pueden, estrictamente hablando, ser consideradas independientes. Para facilitar una comprensin de la naturaleza del estudio muestral, que es comn a muchos campos de aplicacin, empezamos con unas pocas definiciones y luego discutimos la idea de sesgo y el mtodo de seleccin de muestras aleatorias. Seguidamente introducimos el concepto de estratificacin, que nos lleva a un mtodo ligeramente ms complejo pero muy til de obtener una muestra representativa de una poblacin.

    16.2. La especificacin de la poblacin y la caracterstica de inters Una vez que se ha tomado la decisin de obtener informacin por medio de un estudio muestral, nos enfrentamos inmediatamente con dos tareas: definir cuidadosamente la poblacin que deseamos estudiar, y seleccionar la caracterstica o caractersticas para ser tomadas en cuenta. La poblacin objetivo es la poblacin sobre la que nosotros deseamos hacer inferencias con base en una muestra.

    1 Traduccin del captulo 16 Sample Surveys del libro Statistical Concepts And Methods, Gouri K.

    Bhattacharyya and Richard A. Jhonson. John Wiley and Sons, Inc. 1977. Traduccin por parte de estudiantes del curso de Estadstica Matemtica I (semestre 02 de 2000) del Departamento de Ingeniera Industrial de la Facultad de Ingeniera de la Universidad de Antioquia, con la recopilacin, correccin y adaptacin del profesor Bernardo A. Caldern C.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 2

    Aunque especificar una poblacin puede parecer procedimiento sencillo, algunos casos dudosos pueden presentar dificultades en estudios incluso muy simples. Para dirigir un estudio de las actividades de ocio de estudiantes de la universidad, por ejemplo, tendramos que decidir si incluir o no los estudiantes de tiempo parcial y estudiantes que estn tomando menos del nmero mnimo especificado de crditos porque cancelaron cursos durante el semestre. La poblacin a ser muestreada debe coincidir con la poblacin objetivo. Cuando la poblacin muestreada difiere substancialmente siendo ms restrictiva, debe tenerse en cuenta que cualquier conclusin alcanzada slo podra aplicarse a la poblacin muestreada. Una dificultad prctica mayor encontrada en esta fase puede ser la construccin de una lista de todos los miembros de la poblacin a ser muestreada. Los miembros individuales de la poblacin son llamados unidades de muestreo o unidades, y una lista de todos los miembros de la poblacin se llama una estructura (o marco). Construir una estructura es una parte bsica de cualquier proceso objetivo de seleccin de la muestra. Puede Usted imaginar las dificultades de construir una estructura (marco) para gatos que viven en una ciudad o para las personas que beben excesivamente?, Sin embargo normalmente es posible desarrollar una estructura razonablemente buena dedicndole algn tiempo e imaginacin al problema de la estructura de la poblacin objetivo.

    La caracterstica es la informacin bsica de inters acerca de las unidades de muestreo. La caracterstica puede ser la opinin de una persona sobre los programas de bienestar o la cantidad de dlares gastados en obras de caridad. Nuestra discusin en Seccin 16.3 ilustra los conceptos subyacentes de estudio muestral (muestreo de encuestas) en trminos de una sola caracterstica, aunque varias caractersticas se estudien simultneamente en la mayora de estudios a gran escala.

    16.3. Muestreo Probabilstico

    Una vez se han especificado la poblacin objetivo y las caractersticas, se enfoca la atencin en escoger un mtodo para obtener una muestra que ser representativa de toda la poblacin en cuanto concierne a la caracterstica particular de inters. Para ser capaces de emplear correctamente los mtodos estadsticos para deducir inferencias sobre una poblacin a partir de una muestra, es esencial que la aleatoriedad entre en el proceso de seleccin de una manera explcita. Especficamente, antes de que se haga la eleccin a partir de la estructura, el mtodo de seleccin debera especificar la probabilidad de que cualquier miembro particular o grupo de miembros sea incluido en la muestra. Todos los mtodos de muestreo que satisfacen este criterio son llamados muestreos probabilsticos. Las probabilidades conocidas de las unidades de ser incluidas en la muestra permiten determinar estimativos puntuales y de intervalos de confianza para el valor de una cantidad (parmetro) de la poblacin. Las dos formas ms bsicas de muestreo probabilstico denominadas Muestreo Aleatorio Simple y Muestreo Estratificado son examinados en este captulo. Una muestra que no es al menos aproximadamente una muestra probabilstica se llama muestra no probabilstica (no aleatoria). Los mtodos de muestreo no probabilsticos tienen el serio inconveniente de que no puede darse ninguna valoracin de la varianza o de la incertidumbre del estimativo. Siempre que sea posible, deben evitarse los mtodos de seleccin no probabilsticos.

    16.4. Sesgo y sus fuentes En el muestreo probabilstico, se define el sesgo como la diferencia entre el valor esperado del estimador y la cantidad de poblacin que est siendo estimada.

    Sesgo = E ( estimador) (valor de la poblacin objetivo) Cuando esta diferencia es cero, se dice que el estimador es insesgado. Cuando se escoge un estimador hay que tener cuidado para estar seguro de que no est subestimando o sobrestimando sistemticamente la cantidad poblacional. El criterio de no sesgo se usa para salvaguardar contra este problema indeseable. En la literatura de estudios muestrales, la palabra sesgo tiene implicaciones ms amplias que las incorporadas en las propiedades de la distribucin de un estimador. Cualquier fuente o causa que tienda a hacer que el estimativo de la muestra difiera sistemticamente de la cantidad de la poblacin objetivo se llama una fuente de sesgo. Escoger, por ejemplo, una frmula equivocada para un estimador puede ser una fuente de sesgo, pero esto est lejos de ser la fuente ms importante de sesgo. Debido a un dispositivo de medida

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 3

    defectuoso, las observaciones mismas de la muestra pueden diferir de lo que se intenta medir. Aunque se use la frmula adecuada para un estimador insesgado, la muestra puede producir estimativos sesgados. Al estimar el peso medio de una poblacin de nios, puede demostrarse que el peso medio muestral es un estimador insesgado bajo el muestreo aleatorio simple. Pero si el nivel cero de la balanza del peso est en error, cada medida ser afectada por este error constante y el estimativo ser sesgado. Los cuestionarios pobremente redactados tambin pueden ser fuente de observaciones distorsionadas, debido a que los encuestados pueden contestar frecuentemente las preguntas incorrectamente. Preguntas que son demasiado tcnicas pueden generar muchas respuestas que son puras adivinanzas. Aparte del sesgo introducido por un dispositivo de medida defectuoso, una fuente mayor de sesgo es a menudo la existencia de una diferencia sustancial entre la poblacin muestreada y la poblacin objetivo. Una de las situaciones ms dramticas en que se present este problema fue el fracaso de la encuesta de Literary Digest para predecir un ganador en la eleccin en Estados Unidos 1936 entre los candidatos presidenciales F. D. Roosevelt y A. Landon. Aunque se realiz una encuesta a gran escala, estos encuestadores sacaron su muestra de fuentes tales como directorios telefnicos y listados de dueos de automvil. En esos das, tales lujos eran mucho ms comunes entre los grupos de ingresos altos, y la muestra por consiguiente fall al no representar adecuadamente los grupos de ingresos bajos. Dado que el apoyo para el candidato Republicano era ms fuerte en clases de ingresos altos, la encuesta predijo errneamente la derrota para Roosevelt. Adems, el muestreo fue no probabilstico; y no se poda establecer ningn lmite de error en el porcentaje estimado de votos, incluso para la poblacin muestreada. La metida de pata fue realzada an mas por ignorar el 75% de quienes no respondieron. Otra fuente primaria de sesgo surge cuando hay un nmero grande de personas que no contestan la encuesta. Quienes no contestan difieren tpicamente de los que responden con respecto a la caracterstica estudiada, haciendo que la poblacin realmente muestreada sea bastante diferente de la poblacin objetivo. A menudo se realiza un estudio de seguimiento de quienes no contestan para rectificar esta posible fuente de sesgo. Adems, el sustituir unidades que estn convenientemente disponibles por unidades que no responden puede introducir sesgo. Un entrevistador que no encuentra nadie en casa en la residencia designada puede decidir entrevistar los vecinos, quines pueden tener un estilo de vida completamente diferente de los sujetos designados inicialmente.

    16.5. Usando una tabla de nmeros aleatorios Estamos ahora listos para examinar los aspectos tcnicos de la extraccin de una muestra aleatoria. Dada una lista de miembros de la poblacin, podemos numerarIos de 1 a N y tambin podemos numerar un juego de bolas pequeas de 1 a N. Estas balotas pueden ponerse entonces en una urna, mezcladas, y sacadas una a la vez hasta que hayamos seleccionado n balotas donde n es el tamao deseado de la muestra. Los miembros de la poblacin que correspondan a los nmeros de las bolas muestreadas pueden entonces ser incluidos en la muestra, y las caractersticas de estas unidades pueden ser medidas. Como se ilustra en la Seccin 16.6, se prefiere usar muestreo sin reemplazar una bola sacada antes de sacar la prxima. Sin embargo, recordemos por el momento, los dos tipos principales de muestreo originalmente xaminados en el Captulo 5: e

    Muestreo aleatorio con reemplazamiento: Las balotas se reemplazan despus de cada extraccin individual

    Muestreo aleatorio sin reemplazamiento: Las balotas no se reemplazan despus de cada extraccin individual Si la poblacin es bastante grande, este mtodo mecnico de seleccin aleatoria puede ser difcil o prcticamente imposible de implementar. Esto nos lleva a la consideracin de la tabla de nmeros aleatorios. La Tabla 14 del apndice contiene 5000 dgitos. Idealmente, estos nmeros son generados por un mecanismo tal que cada dgito es el resultado de un ensayo que consiste en una extraccin de un nmero de 0,1... ,9 con una probabilidad igual a 1/10; los dgitos en posiciones diferentes son los resultados de repeticiones independientes de tales ensayos. Como un primer procedimiento conceptual simple, suponga que las 10 balotas idnticas numeradas de 0, 1,...,9 son colocadas en una urna. Despus de mezclar las balotas, se saca una a ciegas y su dgito es registrado. La pelota se devuelve a la urna, y el procedimiento se repite. Debido a consideraciones prcticas, las tablas de nmeros aleatorios son generadas mediante un computador que simula aproximadamente este procedimiento, y el conjunto resultante de nmeros son chequeados cuidadosamente para verificar la conformidad con los requerimientos de independencia y de igual probabilidad.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 4

    El modelo en que est basada la tabla de nmeros aleatorios asegura que todos los dgitos simples tienen la misma probabilidad de ocurrencia de 1/10, que todos los pares de dgitos 00, 01, ...,99 tienen una probabilidad de ocurrencia igual a 1/100, y as sucesivamente. Cmo puede ayudarnos tal tabla a escoger una muestra aleatoria de una poblacin finita especfica? Para ilustrar el uso de la tabla de nmeros aleatorios, suponga que tenemos 40 latas de sopas deshidratadas para acampar, y que deseamos tomar una muestra de tamao n = 4 para estudiar su condicin. Nuestro primer paso es numerar las cajas de 1 a 40 o apilarlas en algn orden de tal forma que puedan ser identificadas. En la tabla 14 del apndice, los dgitos deben escogerse de a dos a la vez porque la poblacin de tamao N =40 es un nmero de dos dgitos. Empezamos seleccionando arbitrariamente una pgina, una fila, y una columna de la tabla. Suponga que nuestra seleccin es fila 60, y la columna 4. Leemos los pares de dgitos en las columnas 4 y 5,

    13 02 18 74 39 13 74 33 Ignoramos los nmeros mayores que 40 y tambin cualquier nmero repetido cuando aparezca una segunda vez, como el 13. Se contina leyendo pares de dgitos hasta que cuatro unidades diferentes hayan sido seleccionadas.

    13 2 18 33 Entonces se examinan los contenidos de las latas seleccionadas2. Para muestreos a gran escala o las aplicaciones frecuentes, se recomienda usar la tabla Un milln de nmeros aleatorios, publicada por la Rand Corporation, o un generador de nmero aleatorios de un computador, adecuadamente probado.

    16.6. Muestreo aleatorio simple

    Segn la terminologa establecida para muestreo de encuestas, el muestreo sin reemplazamiento es conocido como muestreo aleatorio simple. Para ver por qu este mtodo siempre es preferido al muestreo con reemplazamiento, suponga que tenemos N = 4 unidades1, 2, 3, y 4 en la poblacin, y que las correspondientes medidas de las caractersticas son:

    5x*1= 3x*2 = 1x*3 = 2x*4 =

    Para los propsitos de esta discusin, los valores podran ser el nmero de las personas que viven en cada una de cuatro unidades habitacionales que constituyen una poblacin. Se realizar una comparacin entre el muestreo aleatorio con y sin reemplazamiento para una muestra de tamao n = 2. Primero se listan todas las posibles muestras no ordenadas de tamao n = 2, de acuerdo a los valores que pueden tomar las variables: CON REEMPLAZAMIENTO SIN REEMPLAZAMIENTO (5, 5) (3, 3) (1, 1) (2, 2) (3, 1) (1, 2) (5, 3) (3, 1) (1, 2) (5, 1) (3, 2) (5, 1) (3, 2) (5, 2) (5, 2) En esta tabla, podemos observar que cualquier muestra que se pueda obtener en muestreo sin reemplazamiento, tambin es posible obtenerla con reemplazamiento. Sin embargo, las muestras que contienen valores repetidos no se pueden obtener al realizar el muestreo sin reemplazamiento. Dado que al medir una unidad ms de una vez no se est obteniendo informacin adicional, es de esperase que con un

    2 Se define un nmero aleatorio R como una variable aleatoria distribuida uniformemente entre cero y uno (0r

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 5

    muestreo sin reemplazamiento tiende a recogerse mas informacin sobre la poblacin de la que puede obtenerse con muestreo con reemplazamiento . Continuando con nuestro ejemplo, podramos preguntarnos que tanto se acerca la media muestral de X =(X1+ X2)/2, a la media poblacional (5 + 3 + 1 + 2)/4 =2.75 en cada uno de los dos casos. Aunque en este

    ejemplo conocemos la media de la poblacin, en aplicaciones reales no podra conocerse sin un censo completo. Muestreo con reemplazamiento La muestra no ordenada (5,3) consta de la unin de [5 primero, luego 3] y [3 primero, luego 5]. La probabilidad de cada una de estos dos ltimos eventos es 1/16, porque cada uno de los cuatro valores tiene igual probabilidad de aparecer en cada experimento. Por consiguiente, para esta muestra, x =(5+3)/2=4 tiene una probabilidad asociada de 2/16. Procediendo de esta manera, podemos obtener la distribucin completa de x ; a partir de esta distribucin, se calculan la esperanza y la varianza.

    Distribucin de 2

    21 XXX+=

    Valor de x 1 1.5 2 2.5 3 3.5 4 5 Probabilidad 1/16

    2/16

    3/16 2/16 3/16 2/16 2/16 1/16

    ( ) 75.21615...

    1625.1

    1611 =+++=XE

    ( ) ( ) 656.81615...

    1625.1

    1611 2222 =+++=XE

    ( ) 094.175.2656.8)( 2 ==XVar Muestreo sin reemplazamiento Cada una de las seis muestras es igualmente probable al realizar el muestreo sin reemplazamiento.

    Distribucin de 2

    21 XXX+=

    Valor de x 1.5 2 2.5 3 3.5 4 Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6

    ( ) 75.2614...

    612

    615.1 =+++=XE

    ( ) ( ) 292.8614...

    612

    615.1 2222 =+++=XE ( ) 729.075.2292.8)( 2 ==XVar

    Usando cualquiera de los 2 mtodos de muestreo, la media muestral X presenta un valor esperado igual a la media poblacional. Sin embargo, la varianza de X es ms pequea cuando se realiza el muestreo sin reemplazamiento, de manera que la distribucin de X se concentra ms alrededor de la media. Estas conclusiones, que pueden demostrarse que son vlidas sin importar el tamao de la poblacin o de la muestra, han respaldado el mtodo de muestrear sin reemplazamiento, es decir al muestreo aleatorio simple. Antes de estudiar los estimadores, definamos las cantidades bsicas poblacionales dentro de un marco conceptual general. La poblacin consista de N unidades donde la caracterstica tiene un valor de en la

    unidad u

    *ix

    1, en la unidad u*2x 2,...*Nx en la unidad uN . La media poblacional es entonces el promedio de las

    caractersticas de todas las unidades:

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 6

    =

    == N1ix*in

    1lpoblacionaMedia

    Cuando definimos la varianza poblacional sobre una poblacin finita, usamos el divisor N, y no N1, en analoga con la frmula para varianza muestral. Estrictamente hablando, el trmino varianza poblacional debera reservarse para la expresin con el divisor de N, pero aqu nos hemos tomado la libertad para evitar la introduccin de la ltima cantidad3.

    ( )=

    ==N

    1ixi

    2N12lpoblacionaVarianza

    Un propsito principal del muestreo es tratar de obtener la media poblacional . Las inferencias acerca de la media poblacin estn basadas en la media muestral X , calculada a partir de las n unidades seleccionadas por el muestreo aleatorio simple. Por otra parte, la varianza poblacional desconocida puede estimarse usando la varianza muestral S2

    Muestra aleatoria simple: X1, X2,..., Xn

    =

    == n1i

    iXn1XmuestralMedia

    ( ) =

    == n1i

    22 XXS i1n1muestralVarianza

    Afirmamos, sin probar, que E( X )= (la media poblacional), por lo cual X es un estimador insesgado de . Tambin, E(S2)=2, de tal manera que la varianza muestral es un estimador insesgado de 2. La varianza de X viene dada por:

    ( )1N1nfdonde,f1

    n

    2

    1N)1n(1N

    n

    2

    1NnN

    n

    2)X(V

    ==

    =

    =

    donde f = (n 1)/(N 1) es aproximadamente igual a la proporcin de la poblacin incluida en la muestra. Es importante observar que el tamao finito de la poblacin reduce la varianza de X desde el valor para poblacin infinita 2/n hasta 2(1- f)/n. El factor (1 - f) es llamado factor de correccin para poblacin finita. Cuando la proporcin de muestreo f es menor que 0.1 puede ser ignorado.

    Propiedades de X y S2 con muestreo aleatorio simple ( ) =XE ( )

    1N1nfdonde,f1

    n

    2)X(V

    == ( ) = 2S2E

    )f1(n

    XdeestimadaestndarDesviacin = Para aquellos que no estn muy familiarizados con el asunto, puede parecerles sorprendente que de informacin muestreada de un pequeo porcentaje de la poblacin, se pueda determinar con una buena 3 En la versin original del libro, se calcula la varianza poblacional usando N-1 en el divisor y no N, y como factor de correccin para poblacin finita se usa (N-n)/N y no (N-n)/(N-1).

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 7

    precisin, un valor de la poblacin. La inspeccin de la expresin para Var( X ), proporciona una explicacin para ello, porque muestra que la desviacin estndar de X decrece esencialmente como 1/ n . Por consiguiente, una muestra de unos pocos miles, produce un valor pequeo para la desviacin estndar del estimativo X , cualquiera que sea el tamao de la poblacin.

    Inferencias acerca de bajo muestreo aleatorio simple Estimador puntual: X

    Lmite aproximado del error al 95%: 1N1nf,)f1(

    nS2

    =

    donde nXX

    X n++= ...1 y

    ( )( )1n

    XXs

    n

    1

    2i

    2

    =

    El lmite de error nfs /12 es aproximado, pero esta aproximacin es bastante buena cuando tanto el tamao de la muestra n como N-n son muy grandes. Bajo estas circunstancias, la distribucin de X es casi normal y nfsX /12 puede considerarse como un intervalo de confianza del 95% para ..4 Ejemplo 16.1 Alguien que est interesado en determinar como gastan su tiempo los directores de escuelas primarias, realiza un muestreo aleatorio simple usando 12 escuelas de las 30 que hay en un distrito particular. A los 12 directores se les pregunta cuanto tiempo a la semana necesitan para manejar problemas de disciplina. De las respuestas se concluye que

    X =9.1 horas S2=22.3 Obtenga un lmite aproximado del error al 95% para estimar , el nmero medio de horas semanales que dedican a solucionar problemas disciplinarios todos los directores del distrito. El estimativo es x =9.1, y el factor f=(n-1/(N-1) = 11/29=.38. El valor de f es demasiado grande para ser ignorado, y el limite aproximado del error es:

    ( )fns 12 = 15.262.012

    3.222 = Ejemplo 16.2 Se manifiesta el inters en conocer la cantidad de dinero que gastan los estudiantes cada mes en alojamiento. Una muestra aleatoria de 160 estudiantes de una universidad que tiene una poblacin de 32,400 da las siguientes estadsticas, en US$:

    X =$105.30 S2=453.6 Encuentre un intervalo de confianza aproximado del 95% para la cantidad media poblacional. El intervalo de confianza aproximado es

    fnsx 12 =

    323991591

    1606.45323. 105 = (101.94, 108.66)

    El factor de correccin finita puede ser ignorado porque es extremadamente pequeo. Ignorando este factor, el intervalo de confianza ser (101.93, 108.67), que es casi igual al que calculamos antes. Un resumen completo de la informacin obtenida de la muestra, requiere algo ms que el clculo de X y el lmite del error. Los mtodos descriptivos discutidos en el Captulo 2 se aplican igualmente aqu. Debera

    4 Para calcular el intervalo exacto se reemplaza 2 por t . Si n 30 el intervalo es exacto. 1n,2/1

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 8

    construirse un histograma para obtener una visin de la manera en que los valores se distribuyen sobre la poblacin. Tambin es aconsejable el registro de cualquier valor extremo y calcular otras medidas descriptivas si la distribucin no parece ser simtrica.

    16.7. Muestreo para determinar una proporcin

    Algunas veces deseamos estimar en la poblacin la proporcin de unidades que tengan cierto atributo. sta puede ser la proporcin de personas desempleadas o la proporcin de electores que apoyan un asunto particular. El valor 1 se le asigna a las unidades que tienen el atributo de inters, y el valor 0 a las restantes unidades. De este modo, la poblacin se divide en dos grupos o tipos, segn el valor numrico de la caracterstica. Bajo el muestreo aleatorio simple, referido como "muestreo sin reemplazamiento", se sabe que la distribucin hipergeomtrica describe el nmero de unidades X en la muestra que poseen el atributo en cuestin. La tabla siguiente presenta las composiciones de la poblacin y de la muestra:

    La proporcin muestral es un estimador insesgado

    Cantidad Poblacin Muestra Total numero de unidades N N Nmero de unidades con el atributo dado M X

    Proporcin de unidades con el atributo dado NM=

    nxp=

    =

    =nXE)P(E

    y la varianza est dada por

    ( ) ( )

    =

    1NnN

    n1PVar

    Por supuesto, podramos estimar esta varianza reemplazando por . Sin embargo, generalmente se emplea el siguiente estimador insesgado

    n/X

    ( )

    1NnN

    1nP1P

    Los procedimientos de inferencia para proporciones y para totales pueden resumirse en:

    Los resultados para la poblacin total M se derivaron de:

    Muestreo aleatorio simple: Inferencia sobre proporciones.

    Estimador puntual de p: nXP =

    Lmite aproximado del error al 95% para p: ( ) ( )

    )1N(nN

    )1n(P1P2

    Estimador puntual del total de la poblacin M =Np: PNnXNM ==

    Lmite aproximado del error al 95% para M:

    1NnN

    1n)P1(P2 N2

    =

    =

    NnXNE

    nXNE

    y

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 9

    ( ) ( ) ( )( )1NnN

    1nP1PPVarN

    nXVarN

    nXNVar N222

    ==

    =

    En el captulo 5, concluimos que el muestreo sin reemplazamiento es casi lo mismo que el muestreo con reemplazamiento cuando el tamao de la poblacin N es grande y la fraccin de muestreo (n1)/(N-1) es pequea. Para muestreo con reemplazamiento se aplica la distribucin binomial, y la varianza de X/n es (1-)/n, la cual difiere de la expresin anterior por la ausencia del factor (N - n)/(N - 1). Este factor hace la varianza ms pequea para muestreo aleatorio simple. En todo caso, incrementando el tamao de la muestra n, la varianza del estimador X/n decrece a la tasa 1/n. Una conclusin es que la varianza de la proporcin de votos a favor basada en un tamao de muestra de 5000 es aproximadamente igual para poblaciones de 100.000 y un milln. Este resultado, que no es intuitivo, explica parcialmente por qu las predicciones de elecciones modernas basadas en solamente una pequea fraccin del electorado a menudo son tan exitosas en pronosticar los resultados de la eleccin. Ejemplo 16.3. Suponga que tenemos una poblacin de tiendas de campaa u1, u2, u3, u4, u5, u6, donde u2 y u4 no son hermticas. Consideremos estimar la proporcin de tiendas de campaa defectuosas en la poblacin con base en una muestra aleatoria simple de 2. Cada una de las siguientes muestras son igualmente probables; los valores para X = nmero de tiendas de campaa defectuosas en la muestra estn dados en parntesis:

    u1 ,u 2(1) u 2,u 3(1) u3 ,u 4(1) u4 ,u 5(1) U5,u 6(0) u1 ,u 3(0) u2 ,u 4(2) u3 ,u 5(0) u4 ,u 6(1) u1 ,u 4(1) u2 ,u 5(1) u3 ,u 6(0) u1 ,u 5(0) u2 ,u 6(1) u1 ,u 6(0)

    La distribucin de X y la media para esta poblacin son:

    X 0 1 2 E(X)= 0 x 6/15 + 1x 8/15 + 2x 1/15 = 2/3

    P(X=x) 6/15 8/15 1/15 E(X/n)= 1/2 x 2/3 = 1/3

    Observe que E (X/n) = 1/3, que corresponde a la proporcin de la poblacin. El estudiante interesado tambin

    debera verificar que P [X = x] est dada por la distribucin hipergeomtrica:

    26

    /x2

    4x2

    Si nuestra muestra consta de u2 y u5, entonces nuestra estimacin de la proporcin poblacional es 1/2, y la varianza estimada de la proporcin de la muestra es: ( )

    ( )12

    112

    6 26 2 1

    16

    =

    Ejemplo 16.4. Para investigar irregularidades electorales, una muestra aleatoria simple de tamao 60 es tomada de la lista de 1024 votantes inscritos en un barrio particular. Se encuentra en la muestra que 12 personas se registraron en direcciones inexistentes. Qu podemos estimar para el barrio? Tenemos que: N = 1024, n = 60, y x = 12, de tal manera que

    2.06012

    nxP ===

    es una estimacin de la proporcin poblacional. La varianza de P es estimada por:

    ( )( ) ( ) 0026.0)160(1023

    6010248.02.0)P(Var ==

    El lmite del error al 95% es 10.00026.02 = . De modo semejante, (0.2)(1024)=204.8 es una estimacin del nmero total registrado en direcciones inexistentes.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 10

    16.8. Muestreo aleatorio estratificado

    El objetivo principal de un diseo muestral es hacer uso eficiente del presupuesto asignado para un estudio obteniendo un estimativo tan preciso como sea posible de una cantidad de la poblacin. El muestreo aleatorio simple es la tcnica de muestreo ms bsica que no slo asegura una muestra representativa sino que tambin produce una estimacin de la cantidad de una poblacin y una especificacin de la precisin. Muchas ramificaciones han evolucionado a partir de este concepto central del muestreo aleatorio simple que permite alcanzar inferencias ms precisas para diferentes tipos de poblaciones. Uno de los diseos prcticamente ms tiles, llamado muestreo aleatorio estratificado, primero divide la poblacin en segmentos homogneos y despus toma muestras aleatorias simples de esas subpoblaciones individuales. Al principio, puede parecer sorprendente que la tcnica del muestreo aleatorio simple pueda ser mejorada. Para clarificar este punto, consideremos una ciudad en la cual los distritos del norte son predominantemente reas con altos ingresos y los distritos del sur son primariamente reas con bajos ingresos. Para determinar el costo promedio de vivienda en toda la ciudad, es intuitivamente aparente que muestras aleatorias simples relativamente pequeas tomadas separadamente de cada uno de los distritos, es probable que muestren informacin ms exacta que un nico muestreo tomado en toda la ciudad. La esencia de la estratificacin es que sta saca provecho de la homogeneidad conocida de las subpoblaciones, de tal forma slo se requieran muestras relativamente pequeas para estimar las caractersticas de cada subpoblacin. Estas estimaciones individuales pueden entonces ser fcilmente combinadas para producir una estimacin de toda la poblacin. Adems de la economa en el tamao de la muestra, un valioso subproducto del esquema de muestreo estratificado es que las estimaciones obtenidas para diferentes partes de la poblacin se pueden usar posteriormente para hacer comparaciones. Para una descripcin general del muestreo aleatorio estratificado y los mtodos de inferencia asociados con este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos conocidos N1, N2,...,Nh tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza desconocidas para el i-simo estrato son denotadas por i y i2, espectivamente. r

    Estructura de poblacin

    Estrato 1 2 ........ h Tamao (conocido) N1 N2 ........ Nh Media 1 2 ........ h Varianza i2 22 ........ h2 Tamao de toda la poblacin:

    == h

    1iiNN

    Media de toda la poblacin: =

    =h

    1iN/iNi

    El muestreo aleatorio estratificado consiste en tomar muestras aleatorias simples independientes de tamaos predeterminados n1, n2,...,nh de los estratos 1, 2, 3,...., h, respectivamente, y medir la caracterstica para cada unidad muestreada. Denotando la j-sima observacin del i-simo estrato por Xij podemos registrar el resumen de estadsticas:

    Estructura de la muestra Estratos 1 2 ... h Tamao de cada muestra n1 N2 nh Media muestral X1 X2 Xh Varianza muestral S21 S

    22

    S2h

    Donde =

    = ni1j

    Xijni

    1Xi ( )= =

    ni

    1jXiXij

    21ni

    1S2i

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 11

    Aplicando la propiedad del muestreo aleatorio simple a las subpoblaciones individuales, la media muestral X i un estimador insesgado de ui y su varianza es

    Var ( X i ) = ni

    2i

    Nn

    i

    i1

    porque la media global de la poblacin es el promedio ponderado:

    +++= hNNh...2N

    N21N

    N1

    donde cada Ni es un tamao de subpoblacin conocida, un estimador insesgado de se obtiene como: XNXNXNX hh2211st N...NN +++=

    El sufijo st indica el hecho de que el estimador es construido a partir de muestras estratificadas. Adems, debido a la independencia de las muestras, la varianza de Xst es la suma de las varianzas de las componentes, donde:

    ( )

    ==

    1Ni

    1ni1ni

    2i

    N2N2iXiVar

    N2N2iXi

    NNiVar

    Al establecer los limites de error y los intervalos de confianza, la varianza desconocida puede estimarse por la correspondiente varianza muestral simple s .

    2i

    2i

    Estimacin de por muestreo estratificado

    Estimador puntual: XNXNXNXNX ih

    1iih

    h2

    21

    1st N

    1N

    ...NN ==+++= =)(E Xst

    ( ) ( ) ( ) ( )

    ++

    +=

    nh

    2h

    1NhnhNhN2h...n2

    22

    1N2n2N2N22n1

    21

    1N1n1N1N21N2

    1XstVar

    ni

    2i

    1Ni

    )niNi(h

    1iN2iN2

    1

    ==

    Lmite aproximado del error al 95% para : nS

    NnNNX

    i

    2i

    i

    iih

    1i

    2ist 1

    )(N2

    =

    Incidentalmente, debera observarse que el estimador insesgado Xst es generalmente diferente de la media muestral combinada

    =

    =+++= h1i

    ihh

    22

    11 nXnXnXn ndonde,n...nnX

    Sin embargo, X y X st coinciden cuando los tamaos de muestra de los estratos prueban cumplen que

    Nn,...,

    Nn,

    NnNnNnNn hh2211 ===

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 12

    Esta situacin se la denomina asignacin proporcional debido al hecho de que el tamao de la muestra total n es asignado a los diferentes estratos en forma proporcional al tamao del estrato. Ejemplo 16.5 Cada rbol en el huerto de manzanas mostrado en la figura 16.1 est marcado con su cosecha medido en fanegas (medida para granos equivalente a 38.23 litros). Los rboles de las tres ltimas filas son ms jvenes que los otros. Estime la cosecha media de la poblacin por rbol, basado en muestras estratificadas de tamao 6 para la subpoblacin de las primeras cinco filas y de tamao 2 de la subpoblacin de las ltimas tres filas.

    Produccin del Huerto de Manzanas 7 8 5 6 6 10 7 6 5 4 4 7 6 6 3 8 4 7 8 10 8 4 6 6 6 4 6 4 8 7 9 8 6 3 9 9 7 8 11 9

    6 3 4 3 5 2 4 3 5 3 3 4 5 4 3 4 4 5 4 3 3 4 3 6

    Figura 16.1 La huerta de manzanas del ejemplo 16.5, indicando la cosecha en fanegas para cada rbol Aqu, N1 = 40, N2 = 24, n1 = 6, n1 = 2. Leyendo parejas de nmeros de una tabla de nmeros aleatorios, uno por fila y uno por columna, seleccionamos rboles con los valores: __ Estrato 1: 6 4 7 6 7 9 X1 = 6.5, s12 = 2.7 __ Estrato 2: 5 4 X2 = 4.5 s22 = 0.5 Nuestro estimador puntual de es:

    5.75 4.5 6424 6.5

    6440

    NN XNXNX 2211st =+=+=

    con un lmite del error del 95% de:

    86.025.0

    124)224(

    67.2)

    140640( 2/1

    642

    n2

    S221

    )N2(n1

    S211

    )N1(2/1

    N2

    2440NnNN

    nN 222

    222

    1

    121 =

    +=

    +

    Comenzamos esta discusin declarando que pueden hacerse inferencias ms precisas con respecto a las diferentes poblaciones usando muestreo estratificado que usando muestreo aleatorio simple. Consideremos ahora una situacin ideal para ver por qu esto es verdad. Suponga que deseamos obtener informacin sobre salarios y que la oficina de nmina nos dice que N1=20 obreros estn en un nivel salarial y N2=4 estn en otro. Claramente, dada esta estratificacin, tomando una muestra de tamao 1 de cada estrato se mantendra el sueldo medio correcto con respecto a la poblacin de 24 obreros. Si se tomara una muestra aleatoria simple, la media de las dos observaciones de la muestra sera todava insesgada. Sin embargo es posible que las dos observaciones pudieran seleccionarse del mismo estrato. Si los niveles de salario de los dos estratos fueran $100 y $400, por ejemplo, entonces la media de la muestra seria $100, $250 $400. Esta estimacin variar en repetidas observaciones de la muestra, mientras que el muestreo estratificado proporciona un resultado exacto. Una comparacin similar se extiende a situaciones ms prcticas cuando la poblacin se divide internamente en estratos homogneos. Ejemplo 16.6. Compare la varianza de [, basada en una muestra aleatoria simple de tamao 8, con la varianza de [st para el huerto de manzanas dado en la figura 16.1. Los clculos que involucran los registros de produccin de N = 64 rboles en la poblacin entera nos da:

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 13

    Media de la poblacin: = 5.5625 Varianza de la poblacin: 2 = 4.66

    y clculos por separado para los primeros 40 rboles del primer estrato y para el segundo estrato de 24 rboles nos da:

    Media i Varianza 2iEstrato 1 6.635 3.984 Estrato 2 3.795 0.781

    Por consiguiente, con Muestreo Aleatorio Simple Muestreo Aleatorio Estratificado

    +

    =n2

    2212

    )n2N2(n1

    211

    )n1N1(

    N21)Xst(V NNN

    22

    1

    21 )1N

    1n1(n

    2)X(V

    =

    Var ([) = )6371(

    866.4 Var ([st) =

    +

    2781.0

    23)224(

    698.3

    39)640(1

    244064

    222

    = 0.52 = 0.28 y el estimador basado en muestreo estratificado tiene una menor varianza.

    16.9. Asignacin de tamaos de muestras Aunque el tamao total de la muestra n est generalmente limitado por el presupuesto disponible para el estudio, la asignacin del tamao de la muestra de cada estrato depende del criterio del investigador. Intuitivamente, la opcin ms plausible es la asignacin proporcional que relaciona los tamaos de las muestras de los estratos en proporcin a los tamaos de las subpoblaciones.

    Asignacin proporcional: n nNN

    ii= i = 1..h

    La asignacin proporcional est motivada por el concepto de una muestra representativa: si un estrato comprende una gran porcin de la poblacin total, deber contribuir en buena proporcin a la muestra. Debido a que nuestra principal meta es mejorar la precisin de nuestra estimacin (es decir reducir su varianza), un criterio ms importante de asignacin de los tamaos de muestras debe ser la minimizacin de ( )XstVar . Esto es factible cuando las varianzas de los estratos son conocidas, o al menos cuando hay disponibles algunas estimaciones de stas mediante una prueba piloto. Especficamente, la asignacin n

    2i1, ,

    nk con (n1 + + nk ) = n fijo que minimiza ( )XstVar est dado por:

    =

    =j

    h

    1jN j

    iNinni:ptimaAsignacin

    Esto requiere que el tamao de la muestra sea proporcional al producto del tamao del estrato y la desviacin estndar del estrato. Cuando todas las desviaciones estndares de los estratos son iguales, la asignacin ptima coincide con la asignacin proporcional.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 14

    Ejemplo 16.7 Los tamaos de tres pequeos pueblos son: N1 = 40,000, N2 = 20,000 y N3 = 30,000. Se va a tomar una muestra aleatoria estratificada aleatoria con un tamao total de muestra de n = 400. Determine el tamao de la muestra que debe ser tomada de cada pueblo utilizando (a) asignacin proporcional y (b) asignacin ptima cuando de un estudio previo se conocen estimativos burdos de las desviaciones estndares, que son 1 = 20, 2 = 12 y 3 = 14. (a) asignacin proporcional:

    n n = 400(4/9) = 178 NNi

    1 = n n

    NNi

    2 = = 400(2/9) = 89 n n

    NNi

    3 = = 400(3/9) = 133

    (b) asignacin ptima: N11 = 800,000 N22 = 240,000 N33 = 420,000 Total = 1,460,000

    n1 = nNNi i1 1

    400800

    1460219

    =

    = n2 = n

    NNi i2 2

    400240

    146066

    =

    =

    n3 = n NNi i3 3

    400420

    1460115

    =

    =

    Concluimos esta discusin planteando las situaciones para las cuales la estratificacin es una tcnica de muestreo beneficiosa. Primero, la estratificacin generalmente crea una reduccin en la varianza del estimador de una caracterstica de una poblacin. Esta reduccin puede ser sustancial si cada estrato es homogneo pero difiere de los otros con respecto a la caracterstica. Segundo, si se requieren estimativos para ciertas subdivisiones de una poblacin, puede ser til tratar las subdivisiones como estratos para obtener estos estimativos. Por ejemplo, podemos querer estimar los ingresos de los miembros de cierto grupo minoritario mientras realizamos un estudio de los ingresos de una poblacin urbana.

    16.10. Muestreo estratificado para determinar una proporcin Las tcnicas de estratificacin tambin proveen estimaciones mejoradas de la proporcin de la poblacin. La notacin y la estructura son:

    Estratos 1 2 .... h Combinado

    Poblacin Tamao N1 N2 .... Nh =

    = h1i

    iNN

    Proporcin 1 2 .... h == h

    1i NpiNi

    Muestra Tamao n1 n2 .... nh =

    = h1i

    inn

    Conteo X1 X2 .... Xh

    Proporcin nXP

    1

    11= n

    XP2

    22= .... n

    XPh

    hh =

    Las frmulas para el estimador insesgado de la proporcin de la poblacin y su error estndar se obtienen exactamente de la misma forma que se obtiene el estimador de la media de la poblacin.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 15

    Muestra estratificada: Inferencia sobre una proporcin

    Estimador puntual: PiN

    1iNiN

    1PhN

    Nh...P2NN2P1N

    N1st =

    =+++=P

    Lmite del error aproximado al 95%: =

    h1i 1ni

    )Pi1(Pi1Ni

    )niNi(N2iN2 =

    =

    h

    1i 1ni

    )Pi1(Pi1Ni

    )niNi(NNi

    22

    Con relacin a la asignacin de los tamaos muestrales, la distribucin proporcional ni=n(Ni/N) puede implementarse convenientemente. La asignacin ptima que minimiza la varianza de P requiere que nst i sea proporcional a )i1(iiN , o

    Asignacin optima

    =

    = h

    1j)j1(jjN

    )i1(iiNnin

    Obviamente, una implementacin de la asignacin ptima requiere algn conocimiento previo acerca del valor aproximado de la proporcin de cada estrato i. Muchos estudios, particularmente los que consisten en enviar un cuestionario por correo a un nmero de personas seleccionadas, son frecuentemente puestos en peligro porque hay un gran nmero de personas que no responden. Si un estudio requiere informacin sobre el salario actual de los que se han graduado alrededor de 1975, las personas que ganan bajos salarios estn menos dispuestos a responder que las personas que ganan salarios altos. El estimativo muestral estar entonces seriamente sesgado hacia el lado de los de altos salarios. Para remediar esto, podramos considerar los que no responden como un estrato e iniciar algn tipo de entrevistas de seguimiento hasta obtener la informacin necesaria de al menos unos pocos de los que no responden. Podramos entonces combinar esta informacin con los datos obtenidos previamente para llegar al estimador de toda la poblacin. Ejemplo 16.8 Ciertos estudiantes que van a una gran universidad del medio oeste, y viven en apartamentos, son encuestados por telfono. Una de las preguntas de la encuesta es si se les exigi o no un depsito de seguridad para el apartamento. Originalmente, 200 estudiantes fueron seleccionados de un directorio del campo universitario, ignorando aquellos estudiantes que viven en otras residencias. Los depsitos de seguridad fueron requeridos para 108 de 160 estudiantes que respondieron en tres intentos de la encuesta. Los 40 que no respondieron fueron tratados como un estrato y 4 fueron seleccionados aleatoriamente para ser tenidos en cuenta en un estudio de seguimiento. De los 4 estudiantes, a uno se le solicit hacer un deposito de seguridad. Estime la proporcin de estudiantes que viven en apartamentos a quienes se les solicit hacer un depsito de seguridad. Podemos suponer que la poblacin se divide en dos estratos en las mismas proporciones que aquellas que se observaron en la muestra. En otras palabras, asumimos que N1/N es lo mismo proporcin que 160/200 =.8, y que N2/N es lo mismo que 40/200=.2. El estimador se convierte entonces en

    59.0412.0

    1601088.0

    NNpNpNp 2211st =

    +

    =+=

    Tomando los factores 1 (n1-1)/(N1-1) y 1 (n2-1)/(N2-1) como 1, el lmite aproximado del error con una confiabilidad del 95% puede escribirse

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 16

    ( ) ( )116.0

    343

    4122.0

    1596052

    16010828.0

    2/1

    2 =+

    16.11. Otros mtodos de muestreo

    La aleatorizacin y la estratificacin constituyen los conceptos bsicos del muestreo. Sin embargo, se han diseado muchos otros mtodos bien sea para explotar estructuras especficas de la poblacin o por conveniencia administrativa. Aqu describiremos algunos de estos mtodos adicionales y discutiremos sus ventajas y desventajas. 16.11.1. El Muestreo Sistemtico Como el nombre lo sugiere, el muestreo sistemtico, implica seleccionar las unidades de manera sistemtica y por lo tanto de una manera no aleatoria. El propsito de esta tcnica es usualmente seleccionar unidades de manera uniforme por toda la poblacin. Especficamente si k = N/n, donde N es el tamao de la poblacin y n es el tamao de la muestra deseado, este mtodo toma una unidad de los primeros k elementos de la poblacin y a partir de ah cada k-simo elemento. Generalmente se introduce un factor aleatorio, escogiendo la primera unidad al azar. Sin embargo, la seleccin de la primera unidad determina el resto de los elementos escogidos en la muestra. La mayor ventaja del muestreo sistemtico es su conveniencia operacional, especialmente cuando la muestra debe ser seleccionada de una lista, como una lista de estudiantes, un directorio telefnico o un grupo de tarjetas. El muestreo sistemtico puede mirarse como una aproximacin al muestreo aleatorio simple si el orden en la lista no es relevante a la caracterstica en cuestin, como por ejemplo la "edad del estudiante" cuando la lista est organizada en orden alfabtico segn el apellido. Tambin, si se miran los conjuntos consecutivos de k unidades como estratos, un muestreo sistemtico tendr la apariencia de un muestreo estratificado. Sin embargo, el rendimiento de una muestra sistemtica puede ser muy inferior al de un muestreo estratificado correctamente ejecutado, debido a que en este caso los estratos son construidos arbitrariamente sin considerar la homogeneidad interna. A pesar de todo lo atrayente que pueda parecer, el muestreo sistemtico a menudo produce una muestra no representativa cuando la lista contiene alguna periodicidad escondida. Por ejemplo, en una lista de jugadores de ftbol, organizados por equipo, un muestreo sistemtico de cada primer lugar podra contener solo los nombres de los arqueros. 16.11.2. El Muestreo por Conglomerados En muchas situaciones puede lograrse un ahorro substancial en los costos haciendo un anlisis con grupos o conglomerados de unidades muestrales seleccionados al azar, en lugar de hacer un muestreo aleatorio simple de toda la poblacin. Suponga que se va a seleccionar una muestra de la poblacin de todos los estudiantes de quinto grado de una regin en particular. Podemos ver cada escuela en dicha regin como un conglomerado de las unidades muestrales bsicas, los estudiantes de quinto grado. En el muestro por conglomerados, primero escogemos una muestra aleatoria de unas pocas escuelas en la regin y luego se entrevistan todos los estudiantes de quinto en dichas escuelas. Recolectar una muestra aleatoria simple de un tamao comparable, es excesivamente costoso por dos razones. Primero, para construir una poblacin, debemos hacer una lista de todos los estudiante de quinto grado en todas las escuelas de la regin. Segundo, los elementos seleccionados en un muestreo aleatorio simple estarn tpicamente distribuidos por toda la regin, y los gastos de los viajes de los entrevistadores sern considerablemente altos. El muestro por conglomerados evita la necesidad de construir una poblacin objetivo con todos los elementos posibles, lo cual es generalmente un trabajo extenuante y costoso en s mismo. Adicionalmente, debido a que las unidades en los conglomerados son adyacentes entre s y por la misma razn, fciles de localizar, el proceso de muestreo es notablemente rpido. Sin embargo el precio que hay que pagar es la reduccin en la precisin de los estimativos. Una muestra aleatoria simple de 400 estudiantes generalmente representa mejor una poblacin, y por consiguiente provee mejor informacin sobre

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 17

    la poblacin, que un grupo de 100 estudiantes analizados en cada una de las cuatro escuelas especificadas. Por eso la eleccin entre los dos mtodos de muestreo debe ser guiada por consideraciones de costo y por el grado de precisin deseada en los estimativos. La mayora de los resultados de las encuestas de muestreo, tales como la encuesta Gallup, los ndices de precios al consumidor, y las cifras de desempleo que aparecen regularmente en los peridicos y otros medios de informacin masivos, no solo emplean estratificacin y muestreo aleatorio sin reemplazamiento sino que tambin utilizan estratos dentro de estratos o incluso una combinacin de muestreo por conglomerados y muestreo estratificado. A veces se usan mtodos ms sofisticados como el muestreo doble y el muestreo probabilstico proporcional al tamao para obtener muestras representativas y estimadores precisos. Las ideas presentadas aqu ofrecen tan solo una introduccin a algunos de los conceptos bsicos que definen el la planeacin de un muestreo por encuestas. Cochran[2] es una excelente referencia para estudiantes interesados en familiarizarse con tcnicas de muestreo avanzadas. Cuando se emplea un mtodo de muestreo no probabilstico, deben tomarse precauciones extras para evitar el sesgo. Si al entrevistador se le da demasiada amplitud, puede incluir en la muestra los individuos fciles de contactar. Las opiniones de la gente que camina al medio da en las calles de una gran ciudad, pueden diferir de aquellas que estn en sus casas al medio da; un estimativo de la proporcin de los estudiantes que no trabajan en vacaciones, ciertamente no puede estar basada en las muestras recogidas en una playa.

    16.12. Planeacin de un estudio muestral En las secciones previas presentamos unos pocos mtodos bsicos de muestreo y de procedimientos de inferencia asociados con el muestreo aleatorio simple y estratificado. Planear y elaborar un estudio muestral es usualmente un proceso mucho ms intrincado que requiere cuidadosa reflexin de las complejidades involucradas en la estructura de una poblacin, en la factibilidad prctica de los mtodos de muestreo, en la coordinacin y supervisin del trabajo de campo, y finalmente, en el procesamiento y anlisis de los datos. Para presentar brevemente estos elementos, analizaremos a continuacin los pasos principales involucrados en la planeacin y la ejecucin de una encuesta. Debido a la diversidad de poblaciones al igual que a las facilidades y que el personal disponibles para un muestreo pueden presentar diversas dificultades al ejecutar un estudio; nuestra exposicin tratar de ser ilustrativa en lugar de exhaustiva. Propsito del Estudio La necesidad de una clara definicin del propsito del estudio no puede ser sobredimensionada. Sin establecer el objetivo de una investigacin, incluyendo lo que esperamos aprender de los datos, cualquier deliberacin acerca de la eleccin de diferentes mtodos de muestreo no tendra ningn significado. Si no se sabe lo que se est buscando, no se sabr donde buscar. La recompensa, por el cuidado y la planeacin invertidos en la definicin inicial del propsito de un estudio tan especficamente como sea posible, es que la informacin vital no ser pasada por alto cuando las unidades sean muestreadas. Poblacin Objetivo La poblacin de la cual se hacen las inferencias, llamada poblacin objetivo, debe ser definida tan claramente como sea posible. En el transcurso del desarrollo de un estudio, debe tenerse cuidado en asegurar que la poblacin muestreada no se desve drsticamente de la poblacin objetivo. Cuando la poblacin muestreada se restringe por conveniencia prctica, debemos ser precavidos al extender las inferencias a la poblacin objetivo. Que Datos Deberan Recogerse? Guiado por la declaracin del propsito, debemos determinar la naturaleza de los datos que se han de recoger de las unidades muestreadas. Debe tenerse cuidado especial para incluir todos los datos esenciales y, al mismo tiempo, evitar recoger datos que son irrelevantes al propsito del estudio. Al muestrear poblaciones humanas, el vehculo primario para obtener los datos es el cuestionario, y un cuestionario bien diseado es crucial para el xito de la encuesta. Frecuentemente hay una tendencia a preparar cuestionarios demasiado largos, pensando errneamente que darn mucha ms informacin. Por el contrario, una cantidad inusualmente grande de preguntas puede aburrir al encuestado y puede disminuir la calidad de los datos recolectados sobres puntos vitales. El propsito del estudio debe ser tenido en mente mientras se disea el cuestionario y las preguntas deben ser cuidadosamente pensadas para evitar guiar las respuestas en cualquier direccin. Una pregunta no debe indicar la respuesta deseada (Evite preguntas como: "No cree usted que...?"). Por otro lado una pregunta no debe ser redactada de una manera ambigua. La pregunta "Cuantas personas que no trabajan hay en su familia?", no indica si deben incluirse o no los nios,

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 18

    estudiantes o jubilados. Por encima de cualquier otra consideracin, las preguntas deben limitarse a puntos relevantes, y la brevedad debe ser una consideracin primaria. Cada pregunta debe pasar esta prueba: Qu informacin pertinente dar la respuesta?. Qu mtodo de Muestreo debe ser Utilizado? Determinar el mtodo de muestreo a ser usado y la escogencia del tamao de la muestra son elementos importantes en la planeacin de un estudio. La seleccin de una mtodo de muestreo apropiado se basa en factores como la estructura de la poblacin, el tipo de informacin buscada y, las facilidades administrativas y el personal disponible para ejecutar el estudio. Junto con la eleccin del mtodo apropiado de muestreo, debe determinarse el tamao de la muestra especificando el grado de precisin deseado en los estimadores. Tambin debe verificarse si el tamao elegido de la muestra es factible con el presupuesto destinado para el estudio. Estudio Piloto Con frecuencia, es conveniente gastar una porcin del presupuesto en realizar un estudio a pequea escala llamado prueba piloto o pre-test. Una prueba piloto es la oportunidad de poner a prueba el cuestionario para detectar y corregir cualquier irregularidad seria o situacin inadecuada. Una encuesta piloto tambin puede dar informacin o sugerencias para mejorar el diseo del estudio. En el muestreo estratificado, por ejemplo, la informacin sobre las varianzas puede obtenerse a partir del estudio piloto, informacin que puede ser utilizada para lograr una eleccin ms adecuada (cerca de la ptima) de los tamaos muestrales en el estudio a gran escala. Anlisis de los Datos Una vez que se ha completado la encuesta, la fuerza de las tcnicas grficas y numricas puede ser empleada en su totalidad para interpretar los resultados. Histogramas y tablas de frecuencia conjuntas ayudan a mostrar la correlacin entre las respuestas. Inventiva en crear grficos puede sugerir interesantes relaciones y conclusiones. En el reporte de los estimativos de las cantidades poblacionales, debe darse la informacin sobre la incertidumbre en trminos de errores probabilsticos o intervalos de confianza. Referencias 1.- A Million Random Digits with 100,000 Normal Deviates. The RAND Corporation. The Free Press, New York, 1995. 2.- Cochran, W. G., Sampling Techniques, 2nd Ed., JohnWiley & Sons, New York, 1963.

    EJERCICIOS

    1. Discutir las alternativas apropiadas para hacer un muestreo y el marco o estructura en cada uno de los

    estudios siguientes: (a) Un departamento de justicia estatal desea estimar, en un rea metropolitana en particular, la duracin

    promedio de detencin antes del juicio de las personas que son arrestadas por cometer un delito grave. (b) La divisin de mercadeo de una compaa farmacutica desea determinar el porcentaje de hospitales en

    el pas que usa su marca de solucin desinfectante para esterilizar equipo quirrgico. (c) Un cuerpo de gobierno universitario est interesado en estudiar opinin estudiantil sobre un cambio

    reciente en el calendario acadmico propuesto por un comit de facultad. (d) Un juez elegido desea determinar cmo se siente su distrito electoral sobre un artculo propuesto en la

    legislacin contra la obscenidad. (e) Una agencia de salud pblica estatal est emprendiendo un proyecto para evaluar la calidad del cuidado

    de la salud en el estado. Parte del proyecto est diseado para estimar el promedio del gasto anual para el cuidado dental en el que incurren las familias.

    2. Para cada estudio (encuesta) en el Ejercicio 1, discuta: (a) La construccin de la estructura o marco y cualquier dificultad que podra encontrarse en el proceso. (b) Los mtodos apropiados para realizar el muestreo: por telfono, mandando por correo una encuesta, u

    otros mtodos pertinentes. (c) Las ventajas y las posibles desventajas de usar su mtodo propuesto 3. Identifique las causas principales de sesgo en cada una de las situaciones siguientes: (a) Se realiza una encuesta para estudiar la extensin del uso de comidas convenientes (como las cenas

    ofrecidas en la Televisin y las comidas enlatadas) en las casas de una comunidad. Se selecciona una

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 19

    muestra aleatoria de casas, y los datos son recogidos mediante entrevistas realizadas por telfono hechas durante las horas de trabajo (De 8 AM a 5 PM). Los que no responden son ignorados.

    (b) Para estudiar la participacin de residentes en una ciudad particular en actividades deportivas al aire libre, los datos se recogen por entrevistadores que visitan las casas (de la muestra), normalmente durante las tardes de fines de semana. Si los residentes de una casa no estn presentes, se visita en cambio una casa vecina.

    (c) Una agencia decide usar un mtodo conveniente y barato de muestreo para realizar una encuesta de opinin pblica. Los entrevistadores, estacionados en los supermercados ms importantes durante tardes de das laborales, recogen la informacin de los compradores cada tres minutos cuando se preparan para entrar en las tiendas.

    (d) Una estacin de radio realiza una encuesta de opinin pblica sobre un tema poltico transmitiendo a sus oyentes una solicitud para que llamen a la estacin y expresen sus opiniones.

    4. Un sitio de descanso tiene 32 moteles, que se toman colectivamente como una poblacin. La

    caracterstica a ser estudiada es el cargo por da para los cuartos dobles. Los valores de la poblacin son las siguientes tasas por da, en dlares: 25, 20, 35, 21, 22, 22, 24, 25, 30, 28, 24, 20, 20, 25, 20, 19, 25, 23, 20, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23. Usando los nmeros aleatorios en la tabla 14 del apndice, tome una muestra aleatoria simple de tamao 10 de esta poblacin.

    5. Refirindose al Ejercicio 4, use la muestra aleatoria simple que se tom para calcular la media muestral.

    Tambin estime la varianza de la media de una muestra aleatoria simple de tamao 10. 6. La varianza de la poblacin en ejercicio 4 es 2 = 13.97. Cul es la varianza de X basada en una

    muestra aleatoria simple de tamao 10? De tamao 20? De tamao 30? 7. Suponga que 588 granjas localizadas en una rea particular constituyen una poblacin y que el gasto de

    capital de su ltimo ao en maquinaria y en equipo de la hacienda es la caracterstica a ser estudiada. El registro completo para la poblacin entera aparece en la Tabla 16-1 dividida en tres conjuntos de datos de acuerdo a una clasificacin segn el tamao de las granjas (cortesa de Harlan Hughes). De la poblacin entera de 588 granjas, tome una muestra aleatoria simple de tamao 60 usando los nmeros aleatorios del Apndice de la Tabla 14. Registre las unidades de gasto y guarde sus datos para usarlos en el Ejercicio 8.

    8. Refirindose al Ejercicio 7, suponga que el valor de la poblacin no es conocido y que usted tiene slo los

    datos proporcionados por la muestra de tamao 60. Estime el gasto promedio de la poblacin por hacienda y establezca un error lmite al 95% para su estimacin.

    9. Una muestra aleatoria simple de tamao 350 se toma de una poblacin de 4000 obreros emigrantes de las

    granjas en un estado particular, y se registran los datos de sus sueldos horarios. La media muestral y la desviacin estndar son $3.45 y $1.07, respectivamente. Construya un intervalo de confianza del 90% para el sueldo promedio horario de esta poblacin.

    10. Los errores que se presentan en las cuentas por cobrar son de importancia vital para los interventores. Un

    interventor que trabaja para una compaa de transportes desea estimar la proporcin de casos en los que clientes reciben facturas defectuosas. Suponga que durante un periodo dado de tiempo, se archivan 2325 cuentas por cobrar en la oficina del interventor. Una muestra aleatoria simple de 500 de estas cuentas se toman, y se encuentran que 48 de ellas involucran facturacin defectuosa. Construya un intervalo de confianza del 95% para la proporcin de cuentas por cobrar con facturacin defectuosa que involucran a clientes.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 20

    TABLA 16 - 1 GASTOS IMPORTANTES EN MAQUINARIA Y EQUIPO (EN MILES DE DOLARES)

    GRANJAS PEQUEAS

    17 38 9 7 11 14 17 10 31 24 22 21 9 41 19 9 13 26 36 18 8 11 23 19 16 14 14 17 20 20 9 18 6 19 52 14 5 27 14 14 28 17 9 11 12

    25 19 28 15 18 24 23 27 24 20 21 27 21 34 26 21 9 29 22 10 18 45 24 16 95 40 42 11 17 17 13 14 23 17 27 18 34 18 16 17 20 23 18 42 22 18 23 16 26 11 37 23 32 24 16 24 34 37 31 29 15 41 38 21 34 23 24 27 34 5 34 29 22 26 30 26 27 39 30 31 28 39 28 34 28 24 44 22 23 40 16 5 19 36 36 17 21 43 21 19 14 14 31 27 39 30 41 28 19 32 18 19 33 27 28 26 23 32 36 21 24 32 19 18 31 25 26 21 18 36 29 47 26 31 26 32 27 43 45 45 25 17 30 27 28 16 44 20 15 31 21 42 27 32 33 21 35 44 24 26 38 57 54 24 37 21 33 19 20 32

    GRANJAS MEDIANAS

    37 30 41 17 38 29 32 21 39 41 28 33 35 24 36 28 20 23 27 34 33 36 25 28 39 36 22 25 54 53 36 14 22 32 21 35 35 39 32 40 24 48 41 30 42 20 38 23 17 38 16 23 28 32 18 60 28 47 61 25 22 25 48 53 35 25 23 44 18 56 42 55 39 24 38 42 27 30 34 43 29 35 43 62 25 15 66 34 25 11 45 28 40 32 38 33 48 46 54 45 35 31 30 42 22 23 46 14 42 33 31 75 50 44 33 41 32 45 44 51 39 35 22 44 35 24 29 23 32 30 35 50 28 21 21 12 30 28 60 35 49 33 22 58 25 23 39 40 44 41 14 37 32 22 27 23 37 59 50 46 40 47 41 38 48 40 32 31 22 24 25 33 54 36 52 39 61 46 36 16 37 38 51 25 35 49 9 46 35 53 43 59 41 52 51 47 72 46 29 25 42 42 43 46 43 29 58 47 85 52 48 23 39 40 43 52 36 35 27 56 47 39 51 48 48 23 24 39 30 59 35 39 32 51 18 27 38 36 41 11 42 42 65 27 34 72 49 39 44 57 64 51 53 55 63 39 31 48

    GRANJAS GRANDES

    53 63 44 66 40 42 48 44 27 56 37 39 37 40 66 49 39 54 30 68 36 42 28 29 41 57 30 39 28 80 79 61 81 53 57 54 29 94 77 52 61 49 52 67 36 35 57 63 32 48 57 50 62 51 52 59 55 22 18 84 57 86 50 54 96 45 28 59 64 42 41 77 76 83 36 42 39 72 84 34 55 51 66 96 63 88 87 63 91 117

    107 48 56 71 54 64 45 61 59 68 50 74 100 144 80 64 101 105 77 85 60 63 66 36 95

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 21

    11. Un guardabosque desea estimar la proporcin de rboles en un bosque de tierras bajas que tienen infecciones de madera mojada. Estas infecciones pueden descubrirse por la presencia de una bacteria particular en el jugo extrado de los agujeros taladrados. Se sabe que hay aproximadamente 5000 rboles en el bosque. Pruebas realizadas a una muestra aleatoria simple de 400 rboles indican que hay 139 rboles afectados. Construya un intervalo de confianza del 95% para la proporcin de la poblacin de rboles que tienen infecciones de madera mojada.

    12. Un estudio de nutricin es dirigido para determinar la calidad de la comida ingerida por nios en una

    escuela primaria. De un total de 1500 nios en escuelas primarias en una ciudad en particular, se selecciona una muestra aleatoria simple de 80, y se les pide a los padres llevar un registro de los alimentos comidos por sus nios para un periodo de una semana. Para cada nio se determina la ingestin media calrica por da. De los datos obtenidos para la muestra de 80 nios, se obtiene que la media muestral y la desviacin estndar de ingestin calrica es de 752 y 138, respectivamente. Basado en esta informacin, construya un intervalo de confianza del 95% para el promedio diario calrico ingerido por la poblacin.

    13. Refirindose al Ejercicio 7, suponga que los tres grupos de granjas son tratados como tres estratos.

    Usando los nmeros aleatorios del Apndice Tabla 14, tome muestras aleatorias simples e independientes de tamaos 22, 26, y 12 de los estratos de granjas pequeas, medianas, y grandes, respectivamente, y registre sus datos para usarlos en el Ejercicio 14.

    14. Usando su informacin de la muestra de Ejercicio 13 y la informacin sobre los estratos clasificados de los

    tamaos de los estratos, estime el gasto medio capital de la poblacin por granja. Tambin construya un intervalo de confianza del 95% para la media poblacional.

    15. Un departamento de transporte de una ciudad est dirigiendo una encuesta para determinar los usos de

    gasolina de sus residentes. Se va a usar el muestreo aleatorio estratificado, y los cuatro distritos de la ciudad se tratan como los estratos. La cantidad de gasolina comprada en la ltima semana se registra para cada una de las casas de la muestra. Los tamaos de los estratos y la informacin resumen obtenida de la muestra son:

    ESTRATO I II III IV

    Tamao del estrato 3750 3272 1387 2475 Tamao de la muestra 50 45 30 30 Media muestral (en galones) 12,6 14,5 18,6 13,8 Varianza muestral 2,8 2,9 4,8 3,2

    Estime el uso medio semanal de gasolina para las casas de la poblacin de la ciudad y construya un lmite del error al 95% para su estimativo.

    16. El editor de una revista de las noticias est realizando una encuesta para determinar los puntos de vista

    de los subscriptores con respecto al cubrimiento de la revista de asuntos internacionales. Debido a que se llevan registros del suscriptor que cubren partes diferentes del pas en tres oficinas principales de la regin, es conveniente tomar una muestra aleatoria estratificada tratando las tres regiones como los estratos. A los subscriptores muestreados de cada estrato se les pregunta: "Est usted satisfecho con el cubrimiento que hace la revista de los asuntos internacionales"?. Los datos sumarios obtenidos son:

    ESTRATO I II III

    Tamao del estrato 2 millones 5 millones 3 millones Tamao de la muestra 500 600 600 Respondieron "Si" (total) 225 336 286

    Estime la proporcin de la poblacin de subscriptores que estn satisfechos con el cubrimiento de la revista de asuntos internacionales y construye un lmite del error del 90% para su estimativo. 17. Refirindose al ejercicio 15, suponga que deseamos seleccionar una muestra aleatoria estratificada de un

    tamao total de la muestra de 1000 casas. Determine el tamao de la muestra para los estratos individuales segn una asignacin proporcional.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 22

    18. Refirindose al Ejercicio 15, suponga que el muestreo actual es realmente un estudio piloto designado para estimar las varianzas de los estratos con el propsito de determinar la asignacin ptima de un estudio a gran escala para ser realizado con un tamao de muestra total de 1000. Usando la informacin sobre los tamaos de los estratos y los estimativos de la varianza de los estratos del Ejercicio 15, determine la asignacin ptima para el tamao de la muestra total de 1000.

    19. Asignacin ptima con costo (Asignacin de Neyman): En el muestreo estratificado, el costo de muestrear

    una unidad a menudo vara de un estrato a otro. Por ejemplo, los gastos de viaje para los entrevistadores pueden ser substancialmente menores para unidades localizadas en ciudades mayores que para unidades localizadas en reas rurales remotas. Si el costo del muestreo vara de estrato a estrato, esto debera tenerse en cuenta al determinar la asignacin ptima de los tamaos de la muestra.

    Sea Ci el costo de probar una unidad del estrato i, i=1,... ,h, donde C representa el presupuesto total para el estudio, y sea Co un costo fijo independiente del tamao de la muestra. La asignacin ptima, aquella que minimiza Var ( Xst ) para el presupuesto total C, es entonces

    =

    =

    k

    1jCj/jNj

    Ci/iNinni

    donde el tamao total de la muestra n es

    =

    = kj

    Cjj

    Cii

    j

    i

    N

    NCCn

    1

    0

    /

    /)(

    Ahora suponga que se conoce que la poblacin se divide en tres estratos: Tamao: 10001N = 50002N = 20003 =NDesviacin Estndar: 201 = 322 = 403 =Costo: 11 =C 25.02 =C 43 =C

    y que el costo fijo es 10C0 =a) Determine la asignacin ptima aproximada cuando el desembolso mximo segn el presupuesto total

    es 200. b) Cul es la Var ( Xst ) dada su asignacin? 20. Refirindose al ejercicio 19, la misma asignacin tambin minimizar el costo total para un valor V02

    especificado por la Var( Xst ). En este caso el tamao de la muestra total dado por n es:

    =

    +

    ==

    = kj

    j

    j

    k

    jj

    jk

    jjj

    j

    jNN

    NV

    CNNC

    NN

    n

    10

    11

    22 1

    /

    a) Usando los valores entregados por el ejercicio 19, determine la asignacin ptima si V02 = 4. c) Cul es el costo total de este estudio? (NOTA: El costo total es ) kknCnCCC +++= ...110 Proyectos de clase 1. Organice una encuesta usando muestreo aleatorio simple. (Sugerencias: Una encuesta sobre pago de

    alquiler de renta por parte de los estudiantes, o una encuesta de opinin; si es tiempo de eleccin, puede pensar en predecir el resultado). Escoja un problema que requiera tanto la estimacin de una proporcin y la estimacin de la media de una poblacin.

    2. En el contexto de la encuesta escogido, discuta la factibilidad y las ventajs esperadas de a estratficacin vs otros tipos de muestro.

  • Mtodos y Conceptos Estadsticos. Muestreo de encuestas. 23

    Tabla de nmeros aleatorios

    6017 2438 3828 2161 6601 8762 8166 3756 6483 7405 6595 8695 3268 5788 5965 4427 9227 8468 1298 4343 1346 0861 5400 5286 0632 5878 0726 5624 7813 7905 9611 3839 6226 3452 7352 9818 0372 1222 1781 0216 5798 5805 3719 3155 6336 4710 7311 5553 3132 3375 7801 2782 1500 4249 4702 1799 9587 2788 7421 3631 3213 0670 1158 0562 6208 6641 5057 1747 7559 548 9614 6265 6075 7161 6505 0599 1398 2947 7797 0038 4414 3904 8021 5093 2009 3799 8336 8189 8441 5748 3587 9128 2088 8840 6838 5810 8964 8261 1914 4651 9081 3202 9692 5605 7902 9525 4932 9719 7080 9448 0848 8331 9069 4214 3824 2350 4986 8556 5394 1971 4098 6758 9526 6559 5435 6428 6362 7876 7746 3562 1567 7828 3328 3604 7368 9744 8842 0456 6317 0218 3826 6603 4549 2501 9976 8845 6219 2593 8337 2222 7455 1587 2778 6178 6670 4229 6420 0204 3168 5283 6869 1675 408 7816 9054 1931 1771 3513 6523 7018 0413 5606 2869 5234 5344 5181 2457 9569 6402 9317 7475 2647 8714 6275 9693 5937 0516 1304 1156 4133 3926 1961 4928 3235 0889 1701 3778 4803 3637 6609 1152 6832 9422 8956 8355 2702 0780 5091 6964 6693 7576 9651 3543 2515 6981 4808 0084 7215 6568 4753 0215 4797 2589 2416 4746 2469 2613 7049 6319 5007 4973 3050 7658 6044 3277 2416 5823 0871 2378 0150 7335 6191 6314 2974 2783 6280 8045 6139 1575 7728 4264 4703 0164 0416 8561 4309 6759 1658 1085 6807 4425 7435 5645 4685 8751 7452 7483 5945 2360 3542 7421 9632 5936 9718 3034 7107 6070 4807 2681 1311 2724 4979 6886 2426 4486 2350 1654 4411 8094 4307 6627 6067 2654 2265 9557 4753 3174 2253 1168 2303 2778 6633 6219 4301 5528 2485 3996 5792 1741 4351 5324 4159 7672 7480 2976 3952 3061 8719 4613 2271 8921 0848 8062 1366 1449 3173 4095 2528 6684 9596 4762 1133 1784 9004 9366 1677 2984 3961 0226 3491 5758 6907 6856 1359 2532 8928 2850 3798 7555 6049 9829 9473 2554 3600 7892 5033 3341 9106 1410 8797 3396 2295 4353 3021 2301 2286 3185 3869 8153 4610 1727 7306 3918 7558 0051 2230 4406 3649 3782 0904 9778 0665 1244 7495 6409 0063 7009 8758 0165 6838 8588 5394 3374 5671 1602 7046 8988 1154 5907 4063 5507 4041 9653 4945 7381 3262 0685 9314 2707 4234 8884 2974 2233 1364 7361 3152 7014 2511 1262 8569 9142 2225 5394 5404 8837 5374 1564 7192 8456 8702 1522 0684 4761 7781 7083 3070 5232 1600 3057 8561 7477 6097 0544 3517 4826 4927 7133 9985 3409 8105 0989 2252 2316 8041 0427 0619 8877 9409 3631 3490 5633 5940 5279 1804 1161 5940 4524 0521 1704 4912 6705 0872 8505 7423 2394 5924 9999 2517 5588 9043 2082 1149 1280 6903 8462 0362 0947 9180 8758 4187 8528 9004 4009 2840 7902 2616 8351 9548 1005 5891 2025 7829 6113 9015