Muestreo Aleatorio Arvelo.pdf

51
. ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área de Probabilidad y Estadística, con más de 40 años de experiencia en las más reconocidas universidades del área metropolitana de Caracas. Universidad Católica “Andrés Bello”: Profesor Titular Jubilado 1970 a 2003 Universidad Central de Venezuela: Profesor por Concurso de Oposición desde 1993 al presente Universidad Simón Bolívar: Profesor desde 2005 al presente Universidad Metropolitana: Profesor desde 1973 a 1987 Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004 Sus datos personales son: Lugar y Fecha de Nacimiento: Caracas, 16-02-1947 Correo electrónico: [email protected] Teléfono: 58 416 6357636 Estudios realizados: Ingeniero Industrial. UCAB Caracas 1968 Máster en Estadística Matemática CIENES, Universidad de Chile 1972 Cursos de Especialización en Estadística No Paramétrica Universidad de Michigan 1982 Doctorado en Gestión Tecnológica: Universidad Politécnica de Madrid 2006 al Presente El Profesor Arvelo fue Director de la Escuela de Ingeniería Industrial de la Universidad Católica “Andrés Bello” (1974-1979) , Coordinador de los Laboratorios de esa misma Universidad especializados en ensayos de Calidad, Auditor de Calidad, y autor del libro “Capacidad de Procesos Industriales” UCAB 1998. En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en el área de “Estadística General” y “Control Estadístico de Procesos”. Otras publicaciones del Prof. Arvelo, pueden ser obtenidos en la siguiente página web: www.arvelo.com.ve

description

Conceptos de muestreo. Error de muestreo. Tamaño de la muestra. Estimación de la media y del total poblacional

Transcript of Muestreo Aleatorio Arvelo.pdf

  • . ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Lujn es un Profesor Universitario Venezolano en el rea de Probabilidad y Estadstica, con ms de 40 aos de experiencia en las ms reconocidas universidades del rea metropolitana de Caracas. Universidad Catlica Andrs Bello: Profesor Titular Jubilado 1970 a 2003 Universidad Central de Venezuela: Profesor por Concurso de Oposicin desde 1993 al presente Universidad Simn Bolvar: Profesor desde 2005 al presente Universidad Metropolitana: Profesor desde 1973 a 1987 Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004 Sus datos personales son: Lugar y Fecha de Nacimiento: Caracas, 16-02-1947 Correo electrnico: [email protected] Telfono: 58 416 6357636 Estudios realizados: Ingeniero Industrial. UCAB Caracas 1968 Mster en Estadstica Matemtica CIENES, Universidad de Chile 1972 Cursos de Especializacin en Estadstica No Paramtrica Universidad de Michigan 1982 Doctorado en Gestin Tecnolgica: Universidad Politcnica de Madrid 2006 al Presente El Profesor Arvelo fue Director de la Escuela de Ingeniera Industrial de la Universidad Catlica Andrs Bello (1974-1979) , Coordinador de los Laboratorios de esa misma Universidad especializados en ensayos de Calidad, Auditor de Calidad, y autor del libro Capacidad de Procesos Industriales UCAB 1998. En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en el rea de Estadstica General y Control Estadstico de Procesos. Otras publicaciones del Prof. Arvelo, pueden ser obtenidos en la siguiente pgina web: www.arvelo.com.ve

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    2

    I INTRODUCCION

    I.1 Poblacin y Muestra La Estadstica tiene por objeto el estudio de los colectivos, y de las relaciones que existen entre ellos, entendiendo por colectivo, o universo, a un conjunto de elementos, personas o cosas, donde cada uno de ellos posee un carcter, que se denomina la variable estadstica. La variable estadstica puede ser cualitativa o cuantitativa. As por ejemplo, en el caso de un estudio electoral, la variable estadstica se refiere al candidato preferido por cada elector (variable cualitativa), mientras que en un estudio de calidad, la variable estadstica se refiere a la longitud en milmetros de una cierta pieza (variable cuantitativa). El conjunto de valores de la variable estadstica en cada uno de los elementos del universo se denomina la poblacin. Un mismo universo puede tener varias poblaciones, ya que puede ocurrir que sobre cada elemento se definan varias variables estadsticas. As por ejemplo, sobre un universo de personas podemos definir las variables estadsticas, sexo, edad, estatura y peso, lo que ocasiona que tengamos cuatro poblaciones diferentes en el mismo universo. El elemento sobre el cual se realiza la medicin se denomina la unidad de muestreo, mientras que el nmero de unidades de muestreo existentes en la poblacin se denomina tamao de la poblacin La Estadstica no estudia casos individuales, como el ingreso de una persona, o la preferencia de un elector, sino conjuntos numerosos de personas en lo referente a su ingreso, o de electores en lo referente a la preferencia de cada uno de ellos. Una poblacin puede tener un nmero finito de unidades de muestreo, o puede ser tan grande, que puede ser tratada como si fuera infinita. En Estadstica Matemtica por lo general, la poblacin se considera infinita, pues el experimento puede ser repetido una y otra vez, y por lo tanto es posible coleccionar un nmero infinito de observaciones para la variable en estudio. Se llama Parmetro Poblacional a un valor que depende que los caracteres de cada uno de los elementos que forman la poblacin, como por ejemplo, el porcentaje de elementos que posee un cierto atributo, o la suma de todos los caracteres asociados a cada uno de los elementos, en el caso de que ste sea un valor numrico, como por ejemplo el total de habitantes que residen en una localidad, que es la suma de los habitantes que residen en cada una de las viviendas ubicadas en esa localidad. Para obtener el valor de un parmetro poblacional, es necesario conocer el carcter de cada uno de los elementos de la poblacin, y como la observacin de todos ellos resulta prcticamente imposible por el elevado costo que representa, se procede a analizar slo una parte de ella, con el objeto de inferir de ella el valor del parmetro poblacional.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    3

    Esta parte de la poblacin se denomina muestra; de manera que en un sentido amplio, una muestra es un subconjunto cualquiera de la poblacin. El objetivo de la Inferencia Estadstica tal como se dijo antes, es analizar esta muestra, y de all obtener conclusiones para la poblacin.

    Figura N 1: Relacin entre la muestra y la poblacin La forma como se haga la seleccin de los elementos de la poblacin para integrar la muestra se denomina el plan de muestreo, y determina la metodologa estadstica a seguir para hacer la inferencia. Segn sea el Plan de muestreo, las muestras se clasifican de la siguiente forma:

    Tipos de muestras

    No ProbabilisticasAleatoriaEstratificada

    Pr obabilisticasSistematicaConglomerados

    Una muestra es no probabilstica cuando la seleccin de los elementos de la poblacin que pasan a formar parte de la muestra se hace a criterio de la persona que est tomando la muestra, sin que medie ningn tipo de procedimiento aleatorio para su seleccin. Los procedimientos de Inferencia Estadstica no son aplicables a este tipo de muestras. Una muestra se dice probabilstica cuando la seleccin de los elementos que intervienen en ella se hace a travs de algn procedimiento aleatorio, o sorteo, que le concede a cada uno de los elementos de la poblacin, un cierto chance de caer en ella. Existen diversos tipos de muestras probabilsticas: Muestra aleatoria simple: Es aquella en donde todas las muestras posibles son igualmente probables, y en consecuencia cada elemento de la poblacin tiene idntica probabilidad de caer en la muestra.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    4

    Muestra Estratificada: Es aquella en donde antes de tomar la muestra se divide a la poblacin en grupos excluyentes llamados estratos, y posteriormente dentro de cada estrato se toma una muestra aleatoria simple. Muestra Sistemtica: En este tipo de muestras, la metodologa es como sigue: Se divide la poblacin en bloques de k elementos cada uno, y se numeran desde 1 hasta k. Se elige un nmero entero al azar entre 1 y k. Dentro de cada uno de los bloques se elige el elemento que corresponda al nmero aleatorio seleccionado. La muestra queda formada por los elementos elegidos, uno en cada uno de los bloques. Ejemplo: Supongamos que en una poblacin de 3.000 elementos queremos tomar una muestra sistemtica de 10 elementos. Para definir los elementos que van a formar parte de la muestra dividimos a la poblacin en 10 bloques de 300 elementos cada uno. A continuacin se elige un nmero al azar entre 1 y 300, digamos 158. La muestra quedar conformada por los elementos que ocupen el puesto N 158 en cada uno de los diez bloques. Muestra por Conglomerados: Este tipo de muestreo consiste en dividir tambin a la poblacin en grupos que se denominan conglomerados, y luego elegir aleatoriamente algunos de ellos. En los conglomerados que resulten seleccionados se realiza un censo, es decir, son examinados la totalidad de los elementos que lo conforman. La eleccin del Plan de Muestreo a utilizar en cada situacin depende de varios factores tales como:

    La homogeneidad o heterogeneidad de la poblacin en estudio. La factibilidad de poder identificar a todos los elementos que conforman a

    un determinado grupo, estrato o conglomerado. El costo del muestreo.

    Antes de proceder a seleccionar el Plan de Muestreo a seguir, es necesario ponderar cada uno de estos factores, as como tambin la precisin del muestreo. I.2 Variables Estadsticas y su clasificacin Hemos visto que el universo est formada por elementos, y que cada uno de estos elementos posee un carcter, que vara de un elemento a otro. El conjunto de todos estos caracteres se denomina la poblacin. Este carcter puede ser de muy variada ndole; puede ser la estatura de cada uno de los habitantes de un pas, el canal de televisin que en un momento determinado estn siendo sintonizados en cada hogar de una ciudad, etc. Este carcter en estudio, y que puede ser diferente para cada uno de los elementos del universo se denomina la variable estadstica. Las variables estadsticas se clasifican de la siguiente forma:

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    5

    Variables Estadsticas:Cualitativas

    NominalesOrdinales

    CuantitativasDiscretasContinuas

    Se dice que una variable estadstica es cualitativa cuando representa una cualidad o un atributo, como por ejemplo la ciudad en que reside un habitante de un pas, o la religin que profesa una persona. Las variables cualitativas se clasifican en: Variables Nominales o Categricas. Este es el caso en que entre los distintos valores de la variable no existe ninguna relacin de orden o de jerarqua. Tal es el caso por ejemplo, en que la variable estadstica en estudio es el estado civil de los empleados de una empresa. Aqu los posibles valores de esta variable son: Soltero, Casado, Viudo y Divorciado. En algunos casos, a ciertas variables nominales, por comodidad en el tratamiento de los datos se les asignan valores numricos, sin que este artificio le haga perder su condicin de Variable Nominal. Por ejemplo, en una encuesta se podra presentar la siguiente situacin: Pregunta: Cual canal de televisin prefiere Ud.? Respuestas: 1- El Canal 2. 2- El Canal 4. 3- El Canal 5. 4- El Canal 8. 5- El Canal 10. En este caso ni los nmeros que identifican a la respuesta del encuestado (1,2,3,4 o 5) , ni los nmeros que corresponden a cada uno de los canales de televisin (2,4,5,8 o 10), cuantifican una magnitud en s, sino que representan una cualidad como es la preferencia del televidente. De forma pues que esta variable, a pesar de tomar valores numricos, es una Variable Cualitativa, y adems Nominal, puesto que los nmeros mencionados no sugieren una relacin de orden, debido a que no podemos decir que el televidente de un determinado canal, es mejor o peor que el televidente de otro canal, porque el nmero que identifica al canal es mayor o menor que el otro. b) Variables Ordinales. Este es el caso en que entre las diferentes cualidades existe una relacin de orden jerrquico entre ellas, y es posible decir que cierta categora es mayor o menor, o mejor o peor, que otra. Por ejemplo, al clasificar a un grupo de personas segn sus edades en infantes, adolescentes, adultos, maduros y ancianos , es posible establecer un orden , o tambin al clasificar a los miembros del ejrcito segn su rango, es posible establecer un orden , y decir que ser General de Divisin es ms que ser Coronel, etc. Algunas veces, variables estadsticas que pueden ser medidas numricamente por comodidad de trabajo, son tratadas como variables cualitativas ordinales.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    6

    Tal es el caso por ejemplo, de la clasificacin socio - econmica que se suele hacer en grupos familiares , tomando nicamente como elemento de juicio su nivel de ingresos, y clasificarla as en Clase Alta, Media Alta, Media, Media Baja o Marginal . Aqu se est tomando en cuenta una variable numrica, como es el ingreso familiar, para decidir acerca de una cualidad como es la condicin de vida de la familia. En estos casos se presenta el problema de definir cules son las fronteras numricas, para ubicar a un elemento en una u otra escala. Las variables cuantitativas son aquellas que se refieren a magnitudes numricas, tales como la estatura de un grupo de personas, o el nmero de personas que residen en una vivienda. Las variables cuantitativas se clasifican en discretas y continuas. Una variable es discreta cuando el conjunto de valores que puede tomar es finito o infinito numerable, es decir que puede ponerse en correspondencia con el conjunto de los nmeros naturales. Por ejemplo, si en una determinada investigacin estamos analizando el nmero de vehculos que posee cada una de las residencias de una urbanizacin, el resultado de nuestras observaciones sern nmeros naturales, o cero; sta es pues una variable discreta. Otros ejemplos de investigaciones que dan lugar a variables discretas son: Nmero de hijos que posee un matrimonio, nmero de clientes que acuden diariamente a un comercio, etc... Se dice que una variable es continua cuando puede tomar cualquier valor dentro de un intervalo real. As por ejemplo, si consideramos el peso de una persona, el resultado de nuestra observacin ser un nmero real positivo, sin limitacin en el nmero de cifras decimales. Hay que advertir que una variable continua no puede ser jams medida en su exacto valor, pues por ms pequea que sea la unidad de medida que utilicemos, siempre podremos encontrar valores ms pequeos que esa unidad. As por ejemplo cuando decimos que un bombillo fall a las 532 horas de uso, esto no significa que la falla ocurri en el preciso instante en que cumpla las 532 horas. Lo que significa es que fall en algn instante entre las 532 y las 533 horas, lo que representa un intervalo de tiempo. La variable discreta por el contrario, si puede ser medida en su valor exacto, y as por ejemplo, cuando decimos acudieron 532 clientes a un banco durante un da determinado, sta cifra representa un valor exacto, y es puntual. Las variables continuas ms frecuentes suelen ser el tiempo, longitud, rea, volumen, etc. I.3 Escalas de Medicin Una vez que ha sido definida la variable estadstica que va a ser analizada, nos encontramos con el problema de cmo medirla. En muchas oportunidades este asunto no presenta ninguna dificultad, pues la variable considerada ya tiene una unidad de medida perfectamente definida.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    7

    Tal es el caso por ejemplo, de una longitud, en donde ya existen varias unidades de medicin universalmente aceptadas, como pudieran ser el metro, la pulgada, el milmetro, etc. En otros casos sin embargo, la situacin no es tan clara, pues no existe tal unidad de medida, y se hace necesario definir una escala de medicin. Por ejemplo, si el universo es el conjunto de clientes de una empresa de servicios, y lo que se quiere estudiar es el nivel de satisfaccin de cada uno de ellos por el servicio prestado, inmediatamente nos preguntaremos: cmo medir ese nivel de satisfaccin? La seleccin de una escala de medicin adecuada es una decisin importante en cualquier investigacin, pues de ella depender la metodologa estadstica a seguir, y las conclusiones que se deriven de la investigacin. En 1948, el cientfico S.S. Stevens propuso una clasificacin lgica para los tipos de medicin, con la que no todos los estadsticos concuerdan, pero que es la ms divulgada y conocida. Stevens seal que si no existieran mediciones el mundo sera catico, y no existira ciencia estadstica, y si las mediciones fuesen totalmente exactas, habra una demanda mucho ms reducida para emplear la Estadstica. Stevens reconoce cuatro tipos de escalas de medicin: nominal, ordinal, de intervalos, y de razn. Las escalas nominales se emplean para medir variables cualitativas nominales, y se utilizan como medidas de identidad. Una escala de este tipo tendra que ser necesariamente usada para representar los distintos valores de variables como sexo, religin, etc. En una escala nominal, los diferentes valores de la variable se suelen numerar por orden alfabtico de las categoras, y los nmeros asignados no corresponden a ninguna medicin, ni entre ellos existe relacin jerrquica alguna. La escala ordinal refleja orden o jerarqua entre los distintos niveles de la variable, y se disponen de la ms alta a la ms baja, o viceversa. El ejemplo clsico de este tipo de escala es el empleado para evaluar la dureza de los minerales. Esta propiedad se define como el grado de resistencia a la abrasin, y en esta escala el nmero 1 corresponde a un material muy suave y fcil de desmenuzar como el talco, mientras que el nmero 10 en el extremo opuesto de la escala, corresponde al diamante, que puede rayar a todos los dems, y no puede ser rayado por ninguno. Con relacin a este tipo de escalas, hay dos comentarios importantes que hacer: Iguales diferencias entre los nmeros de la escala, no necesariamente reflejan iguales diferencias de intensidad para la variable medida. Consideremos por ejemplo, el siguiente caso: Supongamos que para medir el grado de satisfaccin de los clientes por un determinado servicio, se propone la siguiente escala nominal: 1. Totalmente insatisfecho. 2. Bastante insatisfecho. 3. Medianamente satisfecho. 4. Bastante satisfecho.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    8

    5. Totalmente satisfecho. En esta escala, a pesar de que la diferencia 5 - 3 = 3 -1, no podemos decir que la diferencia entre el grado de satisfaccin entre los clientes del nivel 5 y los del nivel 3, es la misma que entre los clientes del nivel 3 y el nivel 1. En una escala nominal tampoco podemos hacer comparaciones de razn entre los diferentes niveles o nmeros de la escala. As por ejemplo, en el caso anterior sera absurdo decir que como 4 es el doble de 2, entonces los clientes del nivel 4 estn doblemente satisfechos que los del nivel 2. La escala de intervalos es para variables cuantitativas, y por lo tanto proporciona valores numricos .En este tipo de escala hay que seleccionar una unidad de medida, y la medicin expresa el nmero de unidades que posee el elemento medido. En una escala por intervalos hay tres caractersticas fundamentales:

    El cero es completamente arbitrario, y no significa necesariamente la ausencia de la cantidad medida.

    Diferencias iguales reflejan idnticas diferencias, entre los niveles de la variable en estudio.

    No se pueden hacer comparaciones de razn. Un ejemplo de escala por intervalos es la utilizada para medir la hora del da. En esta escala el cero que corresponde a la medianoche, es completamente arbitrario, el tiempo transcurrido entre las 5:00 y las 8:00, es el mismo que entre las 14:00 y las 17:00, y no se puede decir que 8:00 a.m. es el doble de 4:00 am. Otro ejemplo de escala por intervalos es la utilizada para medir la temperatura, bien sea en C o en F. En la escala centgrada el cero es arbitrario, y corresponde a la temperatura de congelacin del agua, y la diferencia de temperatura entre 10C y 14C es la misma que entre 25C y 29C. En una escala por intervalos no se pueden hacer comparaciones de razn entre los valores de la variable, y as por ejemplo si en un da la temperatura fue de 15C y en otro de 30C, es incorrecto decir que en el segundo da hizo el doble de calor que en el primero. La escala de razn o de cociente es tambin para variables cuantitativas, y se diferencia de la de intervalos en que en ella el cero no es arbitrario, y corresponde realmente a una total ausencia de la propiedad estudiada. En una escala de razn, lo mismo que en una de intervalos, a iguales diferencias entre los nmeros asignados corresponden iguales diferencias de intensidad de la variable en estudio, pero ahora si es posible hacer comparaciones de razn entre los elementos, y decir que en un elemento A el valor de la variable es tres veces o cuatro veces el valor de otro elemento "B. El peso y la estatura son ejemplos claros de una escala de razn, pues una persona que pese 90 Kg., pesa el triple que un nio que pese 30 Kg.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    9

    I.4 Etapas de una Investigacin por Muestreo El muestreo es una herramienta fundamental en cualquier investigacin, bien sea cientfica o social, y su aplicacin requiere de una cierta metodologa. Por lo general los problemas ms frecuentes que hay que resolver a la hora de aplicar tcnicas de muestreo en una investigacin, son en este orden los siguientes: Formulacin del problema: Esta es la fase conceptual de la investigacin , y consiste en definir en primer lugar el objetivo de la investigacin que se va a realizar , las hiptesis que se pretenden probar , la definicin de la poblacin a considerar, y la seleccin de las variables a medir . En muchas oportunidades, esta fase tambin exige la creacin de una escala de medicin, porque la misma no existe para algunas de las variables que van a ser analizadas. Esta es quizs la fase ms importante en la investigacin, pues es la que condiciona todas las posteriores, y la validez de las conclusiones. Diseo del experimento: Una vez que ha sido definido el problema, el investigador debe decidir si estudiar toda la poblacin o slo una muestra. En caso de que decida hacer un muestreo, habr que definir el tipo de muestreo a utilizar, si aleatorio simple, estratificado, por conglomerados, etc. Tambin ser necesario calcular el tamao de muestra requerido, el cual depender de la precisin que se le quiera dar al muestreo; y tambin ser necesario disear un cuestionario, o formato para ser llenado por la personas que van posteriormente a recoger la informacin. El diseo de la encuesta y la redaccin de las preguntas es un aspecto muy importante en esta fase, pues de la sinceridad de las respuestas depender la validez de la investigacin. Este es un problema ms de carcter psicolgico que estadstico, pues la Estadstica supone que la respuesta obtenida es sincera, y en la prctica no necesariamente esto es cierto. La apariencia fsica del encuestador, el momento de realizar la encuesta, y la forma de hacer las preguntas son aspectos muy importantes a considerar aqu. En el caso de investigaciones en un laboratorio, esta fase exige tambin la seleccin de los instrumentos de medicin, su calibracin y la metrologa. Otro aspecto que tambin debe ser analizado en esta fase es el relativo a los programas de computacin que van a ser utilizados posteriormente para procesar la informacin recogida en el muestreo. Recoleccin de datos. Esta es la fase de campo propiamente dicha, en la que el investigador hace el sorteo aleatorio de las unidades de la poblacin que van a pasar a formar parte de la muestra, y posteriormente las entrevista, o las ensaya en caso de que se trate de una investigacin hecha en un laboratorio. En esta fase, el investigador debe poner especial cuidado en que la muestra quede conformada por estrictamente las unidades que resultaron sorteadas, y no por otras que le resulten ms cmodas al encuestador.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    10

    Cualquier error en este sentido hara que la investigacin pierda fuerza, y podra incluso invalidar sus conclusiones. Tabulacin y Descripcin de los resultados. Esta es la fase descriptiva de la investigacin, en donde los datos tomados en la fase anterior son organizados y resumidos en tablas estadsticas, y tambin representados en grficas que de una manera rpida permitan visualizar su comportamiento. En esta fase es indispensable el manejo de las tcnicas de Estadstica Descriptiva, y debe contarse con la ayuda del programa de computacin seleccionado en la fase de diseo. Inferencia Estadstica y Conclusiones: Esta es la fase final de la investigacin, en donde los resultados obtenidos en la muestra son analizados con los mtodos de la Inferencia Estadstica, y se obtienen conclusiones para la poblacin. Las conclusiones obtenidas en esta fase se refieren a las hiptesis que haban sido formuladas en la fase inicial, o tambin a la estimacin del valor de ciertos parmetros poblacionales que eran desconocidos al comienzo de la investigacin.

    II. ESTIMACION II.1 Concepto de estimador Un parmetro poblacional es un valor que se calcula en base a todos y cada uno de los elementos de la poblacin. As por ejemplo, si en el universo de estudiantes inscritos en una Universidad, consideramos la variable estadstica estatura de cada uno de ellos, la poblacin ser el conjunto de valores numricos que representan sus respectivas estaturas. Si llamamos N al nmero de estudiantes en esta Universidad (Tamao de la poblacin), el conjunto de valores numricos de sus estaturas {1, 2 , } representa a la poblacin. Sobre esta poblacin podemos definir al siguiente parmetro poblacional:

    = 1+2++

    = =1

    = Media Poblacional Resulta obvio, que en la gran mayora de las situaciones prcticas, este valor resultar desconocido, porque para calcularlo necesitaramos conocer las estaturas de todos los estudiantes de la referida Universidad. El objetivo principal del muestreo es justamente, estimar el valor de estos parmetros poblacionales, a partir del resultado arrojado por una muestra de esta poblacin; y de all la necesidad de introducir el concepto de estimador. Un estimador es un valor calculado sobre la base del resultado muestral obtenido, y que se utilizar para estimar a un parmetro poblacional. En el ejemplo anterior, al tomar una muestra de n estudiantes (tamao de la muestra), y medir sus estaturas, encontraremos un conjunto de valores numricos {1,2 ,}, sobre los cuales podemos definir la siguiente funcin: = 1+2++

    = =1

    = Media muestral

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    11

    Este valor, como veremos ms adelante, va a ser utilizado para estimar a su correspondiente poblacional, y diremos que es el estimador de , lo que se designar mediante la siguiente notacin: = Para una mejor comprensin de los problemas del muestreo, es importante resaltar las diferencias bsicas entre el parmetro poblacional y su estimador: El valor del parmetro poblacional es una constante desconocida, mientras que el de su estimador es conocido para una muestra particular, pero variable entre las diferentes muestras posibles En efecto, regresando al ejemplo, la media poblacional es una constante cuyo valor no conocemos, mientras que el valor de la media muestal lo conocemos para la muestra particular tomada, pero pudo haber sido otro, si el azar hubiese dispuesto que la muestra seleccionada hubiese sido otra. De lo anterior se desprende que un estimador es una variable aleatoria, pues puede variar de una muestra a otra, y que lo que obtenemos al tomar una muestra, es un valor particular de dicha variable aleatoria. Inmediatamente surgen las siguientes preguntas: 1. Cmo hacemos para obtener el mejor estimador para un parmetro poblacional cualquiera? 2. Si el estimador es una variable aleatoria, cul es su distribucin de probabilidad? 3. Cmo hacemos para inferir el valor del parmetro poblacional a partir de ese valor particular del estimador? La respuesta a estas preguntas no es sencilla, y no constituye el objetivo de este humilde resumen, pues representa la esencia de lo que se denomina Inferencia Estadstica; sin embargo, aqu haremos uso de algunos de los resultados que all se obtienen, y se demuestran, por lo que se recomienda al lector interesado en profundizar en estos aspectos consultar un texto de Estadstica Matemtica e Inferencia Estadstica El siguiente cuadro resume las diferencias entre Parmetro Poblacional y Estimador:

    Se calcula: Comportamiento Conocimiento Parmetro Poblacional

    Sobre toda la poblacin

    Constante Desconocido

    Estimador Sobre la muestra

    Aleatorio Conocido solo un valor particular

    II.2 Propiedades de un buen estimador Un problema muy frecuente en Inferencia Estadstica es el de comparar estimadores, pues a pesar de que existen diversos mtodos y criterios para hacer la estimacin, no siempre todos ellos conducen al mismo estimador, y por lo tanto, se hace necesario decidir cul es el mejor. Con el objeto de facilitar las definiciones, adoptemos la siguiente nomenclatura: = Valor verdadero de un parmetro poblacional desconocido = Estimador de Al ser una variable aleatoria, tendr una cierta Distribucin de Probabilidad, y en consecuencia un determinado valor esperado, y una cierta varianza

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    12

    E ( ) = Valor Esperado de Var ()= Varianza de Las siguientes propiedades nos permiten reconocer a un buen estimador, y sern explicadas de una manera intuitiva, sin el tratamiento riguroso propio de la Estadstica Matemtica 1 Estimadores insesgados: Se dice que un estimador es insesgado, cuando su valor esperado coincide con el parmetro poblacional que pretende estimar, es decir cuando E ( ) = ; caso contrario, se dice que es sesgado. Para entender mejor desde un punto de vista prctico lo que significa sesgar una muestra consideremos el siguiente caso hipottico. Imaginemos que para realizar una encuesta electoral seleccionamos la muestra entre los asistentes a una concentracin a favor de un candidato. Resulta obvio, que en esa muestra no esperamos encontrar un reflejo de lo que realmente opina la poblacin. En este caso diremos que la muestra est sesgada, es decir adulterada. Un estimador sesgado es como un arma que no tiene la mira calibrada, que pretende dar en un blanco pero est apuntando a otro; mientras que un estimador insesgado es uno que realmente apunta hacia al blanco, en el caso de muestreo el parmetro poblacional , y que espera dar en l. Suponiendo que tenemos dos estimadores 1 y 2 que siguen cada uno, una distribucin normal, el primero insesgado y el segundo no, la siguiente grfica nos muestra como con el primer estimador estamos en condiciones de hacer una mejor estimacin que con el segundo, debido a que se espera que el primero coincida con el parmetro poblacional a estimar, mientras que con el segundo se esperar caer en un punto alejado de l

    Figura N 2: Comparacin entre un estimador insesgado y otro sesgado

    Un estimador puede presentar un sesgo negativo, cuando se espera tome un valor a la izquierda del parmetro poblacional a estimar, es decir lo subestime; o puede presentar un sesgo positivo, cuando se espera caiga a su derecha y lo sobreestime como en el ejemplo de la encuesta electoral antes mencionada. 2. Estimadores consistentes: Un estimador se dice consistente, cuando a medida que el tamao de muestra es mayor, el estimador nos recompensa, proporcionndonos una mejor estimacin; es decir, que a mayor tamao de

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    13

    muestra existe una mayor probabilidad de que el estimador caiga muy cercano al parmetro poblacional que pretende estimar. Un estimador que carezca de esta propiedad queda prcticamente descalificado, pues no devuelve en precisin el esfuerzo de tomar un mayor tamao de muestra. Resulta fcil intuir que es un estimador consistente para , pues a medida que ms grande sea el tamao de muestra, ms elementos de la poblacin se incorporan a ella, y por lo tanto el valor de se acercar ms al de . De hecho cuanto n = N (censo), podemos afirmar con certeza que = 3. Estimadores suficientes: Se dice que un estimador es suficiente cuando utiliza toda la informacin contenida en la muestra, es decir, cuando no desperdicia informacin y toma en cuenta a todas las observaciones mustrales. As por ejemplo es un estimador suficiente puesto que para calcular su valor, necesitamos conocer el valor de todas las observaciones que cayeron en la muestra; si falta por determinar alguna de ellas, ya no podremos calcular . La mediana de una muestra es un ejemplo tpico de un estimador que no es suficiente, pues para calcularla slo tomamos en cuenta a los valores centrales, descartando a los extremos. 4. Estimadores de mnima varianza: Resulta frecuente que al comparar dos estimadores, ambos sean insesgados. En estos casos, el de menor varianza resulta ser el mejor, pues los valores que toma estn ms concentrados alrededor del parmetro que se desea estimar. La siguiente figura nos seala que con el estimador de menor varianza, se tiene una mayor probabilidad de realizar una mejor estimacin debido a que presenta una menor dispersin.

    Figura N 3: Comparacin entre dos estimadores insesgados

    La Estadstica Matemtica proporciona una herramienta conocida como lo cota de Cramer - Rao, que permite reconocer al estimador insesgado con la mnima varianza; de manera que cuando lo encontremos, estaremos en presencia del mejor estimador posible para el parmetro poblacional que deseamos estimar.

    En lo sucesivo, vamos a suponer que los estimadores propuestos en los diferentes casos que estudiaremos son los ptimos, y omitiremos el anlisis

    de sus propiedades.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    14

    II.3 Errores en el muestreo Resulta natural que a la hora de hacer una estimacin por muestreo no podamos pretender que sta coincida exactamente con el verdadero valor del parmetro que queremos estimar, y que en consecuencia aparezcan errores. Las causas que ocasionan estos errores pueden ser clasificados en dos categoras: asignables y aleatorias Las causas asignables son aquellas que se pueden identificar y corregir, y que son responsabilidad del investigador, tales como errores en el diseo de la encuesta, preguntas mal redactadas, entrenamiento inadecuado a los encuestadores, imprecisiones en la escala de medicin, o fallas en la calibracin de los instrumentos de medicin. Lamentablemente, muchas veces este tipo de fallas son detectadas despus que se ha tomado la muestra, lo que ocasiona un atraso en los estudios por muestreo y una prdida de los recursos invertidos en la toma de la muestra. De all la importancia de tomar muestras preliminares o pilotos, que permitan detectar de manera temprana tales errores. Las causas aleatorias son producto de la variabilidad propia del estimador. En efecto, hemos visto que todo estimador es una variable aleatoria, y que por lo tanto su valor vara de una muestra a otra. El valor que toma el estimador en una muestra especfica representa un valor particular de esa variable que no necesariamente tiene que ser igual al parmetro que se quiere estimar. Se define como error de muestreo a la diferencia absoluta entre el valor que tom el estimador en la muestra y el verdadero valor del parmetro poblacional, es decir: Error de muestreo = - Por ejemplo, si estimamos que un parmetro vale 1251 y despus resulta que su verdadero valor es 1280, hemos cometido un error de 1251-1280= 29 unidades El valor absoluto se debe a que el error de estimacin puede ser negativo en caso de una subestimacin, o positivo si se trata de una sobrestimacin. Cuando se realiza un estudio por muestreo, el investigador debe establecer cul es el mximo error que est dispuesto a tolerar en la muestra, y este se designa designar por = Mximo error absoluto tolerado La fijacin del valor de depender del orden de magnitud del parmetro que se pretende estimar. As por ejemplo, si se quiere estimar un parmetro que pensamos est en el orden de los millones, sera absurdo fijar en el orden de las unidades, pues le estaramos exigiendo a la muestra un nivel de precisin tal, que seguramente redundar en un tamao de muestra prcticamente igual a un censo. En caso de que el investigador no tenga idea alguna sobre el orden de magnitud del parmetro que est estimando, lo ms prudente es fijar el error tolerado de muestreo en forma relativa o porcentual, definido por la siguiente expresin:

    Error porcentual de estimacin =

    100%

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    15

    En el ejemplo anterior, si un parmetro cuyo verdadero valor es 1280 fue estimado con un error absoluto de 29 unidades, entonces el error relativo de estimacin es de

    29

    1280 100% = 2,27%

    Al analizar el informe de la muestra, el lector debe estar atento acerca del margen de error de la muestra, e identificar si el error de muestreo est expresado de manera absoluta o de manera relativa. Una regla muy simple para hacer esta identificacin es la siguiente:

    Esta regla presenta una nica excepcin:

    Por ejemplo, si una encuesta electoral predice que un cierto candidato obtendr un 32% de la votacin, y una vez celebrada las elecciones resulta que obtuvo el 34% de los votos, entonces el error de estimacin fue del 2% , y se trata una cifra absoluta, no relativa. Es prctica comn en los estudios por muestreo fijar el mximo error relativo tolerado en 1%, 2,5% o 5% en el caso general, y en esos mismos valores porcentuales para el error absoluto, cuando se trate de la estimacin de porcentajes. Lo anterior significa que cuando un estudio por muestreo concluye en una cierta estimacin para un parmetro, el lector debe interpretar que el verdadero valor es anunciado el porcentaje de error; de manera que si se lee en el informe, = 1251 unidades, =2,5 % entonces se debe inferir que el verdadero valor de est en el 1251 (2,5% de 1251) = 1251 31,275, es decir dentro del intervalo [1219,725 ; 1282,275] , mientras que si el informe se refiere a la estimacin de un porcentaje, como en el caso de una encuesta electoral, que dice =32%, =2,5 %, entonces la inferencia es que = Verdadero Porcentaje Poblacional, est en el intervalo 32% 2,5%, es decir dentro del intervalo [29,5%; 34,5%] II.4 Riesgo y Confianza en una estimacin por muestreo Tal como hemos visto en la seccin anterior, cuando se hace una estimacin por muestreo, lo ideal es que el error de estimacin resulte como mximo igual al tolerado. Esto sucede cuando - Sin embargo, en el momento de tomar la muestra no se puede garantizar que esto realmente va a ocurrir as, pues al ser el estimador una variable aleatoria, existe una cierta probabilidad de que el error de estimacin sea mayor que el

    El error absoluto viene expresado en las mismas unidades que el parmetro a estimar, mientras que el error relativo siempre

    viene expresado en porcentaje

    Cuando el parmetro a estimar es un porcentaje, el error absoluto viene expresado tambin como un porcentaje, y no se trata de una cifra relativa

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    16

    tolerado, y que por lo tanto, la muestra no satisfaga nuestras expectativas. Esta probabilidad se define como el riesgo del muestreo, y la designaremos por Para ilustrar mejor esta idea, tomemos el siguiente caso: Si se efectan 100 lanzamientos de una moneda legal, existe una probabilidad de aproximadamente 95% de que el nmero de caras obtenidas caer en el intervalo 50 10, sea en el intervalo [40; 60]. Sin embargo, si tomamos una muestra de este experimento, es decir, si lo realizamos una sola vez, tendremos una probabilidad de aproximadamente 5% de que la prediccin no se cumpla, lo representa el riesgo de hacer la prediccin. De igual manera en el muestreo, cuando tomamos una muestra de una poblacin, sta es una de las tantas muestras diferentes que pudieran ser tomadas, tantas como combinaciones podamos hacer entre los elementos que conforman el universo, y por lo tanto, es posible tener la mala suerte que resulte conformada por elementos extremistas, y en consecuencia se cometa un error mayor que el tolerado. En sntesis:

    El complemento del riesgo, es decir, la probabilidad de que el error absoluto en la estimacin resulte menor o igual que el mximo tolerado se define como la confianza que proporciona la muestra.

    1 - = P ( - ) Suponiendo que el estimador es insesgado y que sigue una Distribucin Normal, el siguiente grfico explica los conceptos de riesgo y confianza del muestreo:

    = Riesgo del muestreo = P( - > )

    1-= Confianza= P( - )

    Si el estimador se sale de la zona de buena estimacin, se incurre en un error

    mayor que el tolerado

    La zona de buena estimacin es: -

    Figura N 4: Riesgo y Confianza del muestreo

    A partir del concepto de confianza, la Inferencia Estadstica desarrolla la teora de estimacin por intervalos, y obtiene los llamados intervalos de confianza para un parmetro poblacional. Dado que en las diferentes metodologas de muestreo que analizaremos ms adelante se utilizar este concepto, se recomienda al lector que consulte en textos

    El riesgo del muestreo representa la probabilidad de que el error absoluto en la estimacin sea mayor que el mximo tolerado

    = P( - > )

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    17

    de Inferencia Estadstica, los procedimientos a seguir para obtener un intervalo de confianza

    Para facilitar la comprensin de este concepto, consideremos el siguiente ejemplo: Supongamos que una persona anuncia tener 10 billetes, uno de los cuales es falso, y se selecciona al azar uno de ellos. Antes de hacer la seleccin podra decirse que la probabilidad de seleccionar un billete bueno es del 90%; pero despus de hecha la seleccin, ya no se podra decir lo mismo, pues el hecho aleatorio que era la seleccin del billete ya se realiz. Lo que cabra decir despus de hecha la seleccin es que al billete seleccionado le tenemos una confianza del 90%. Lo mismo ocurre con el muestreo, existen muchas muestras posibles, y cada una de ellas arrojar intervalos de confianza distintos. Algunos de ellos contienen al parmetro y otros no. Antes de tomar la muestra, la probabilidad de seleccionar a una que contenga al parmetro es 1-, pero despus de tomada la muestra, lo que le tenemos al intervalo seleccionado es una confianza de 1- Para finalizar estas secciones introductorias, y comenzar a estudiar las diferentes metodologas de muestreo, es importante aclarar que muchas veces se oye decir la siguiente frase: la muestra debe ser representativa de la poblacin para no incurrir en los errores del muestreo. Esta frase establece un principio que en la prctica resulta difcil de garantizar, pues se supone que no conocemos a los elementos de la poblacin, ya que si los conociramos no estaramos muestreando, y por lo tanto, no sabemos si todos ellos van a quedar representados en la muestra. De all que siempre tengamos el riesgo de realizar una estimacin errnea. Para ilustrar esta idea, supongamos que queremos estimar la estatura media de los alumnos de un colegio, en donde hay nios y adolescentes, y lo que disponemos es de una lista de los alumnos inscritos en el colegio. Si la muestra la tomamos haciendo un sorteo entre todos los alumnos del colegio (muestreo aleatorio simple como veremos en la prxima seccin) resulta obvio que existe el riesgo de que solo caigan nios o solo adolescentes, lo que nos va a conducir a una estimacin errnea de la media poblacional. Pudiramos disminuir este riesgo, si ahora en lugar de tener una lista general, obtenemos una en donde aparezcan solo los alumnos de primaria por un lado, y los de secundaria por el otro, y ahora tomamos la muestra seleccionando al azar

    Un Intervalo del (1-) de confianza para un parmetro poblacional desconocido , se define como un intervalo aleatorio 1;2 con 1 < 2 donde 1 2 dependen exclusivamente del resultado de la muestra, y que antes de tomarla, tiene una probabilidad (1-) de contener al parmetro , es decir:

    P1 2 = 1-

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    18

    alumnos de uno y otro grupo (muestreo aleatorio estratificado). Este nuevo procedimiento tampoco est exento de riesgo, porque es posible que en cada una de las dos muestras, caigan solo alumnos de los primeros aos de primaria y de secundaria, o exclusivamente de los ltimos aos de cada nivel. Se puede continuar afinando nuestra estimacin, y decir que ahora vamos a conseguir las listas de cada uno de los salones de clase, y que tomaremos la muestra seleccionando al azar un cierto nmero de alumnos en cada saln; pero tambin nos encontramos que en dichas muestras existe el riesgo de que caigan en ella solo los ms bajos, o solo los ms altos de cada saln. Llegado este punto, no faltar alguien que sugiera que entonces lo mejor es que se estratifique a los alumnos por niveles de estatura, bajos, medianos y altos y se tome una muestra al azar en cada categora, y pronto caeremos en cuenta que esto no es posible porque para hacer dicha clasificacin, necesitaramos conocer la estatura de cada uno de los alumnos, y el muestreo ya no tendra sentido.

    III. MUESTREO ALEATORIO SIMPLE

    Existen numerosas tcnicas de muestreo, que se diferencian unas de otras, en la manera de seleccionar la muestra; en el muestreo aleatorio simple, la muestra debe ser tomada de manera que cada una de todas las posibles muestras, tenga la misma probabilidad de ser seleccionada. El principio de igualdad de probabilidad para todas las posibles muestras, es quizs el ms violado a la hora de seleccionar la muestra; debido a que el investigador generalmente clasifica a la poblacin en grupos, y luego toma la muestra de manera que en ella caigan representantes de cada grupo, pensando que de esa manera, la muestra es ms representativa. Esta manera de tomar la muestra no es que sea incorrecta, por el contrario, por lo general conduce a resultados ms precisos, que los que se obtendran, aplicando muestreo aleatorio simple; lo que si no es correcto, es pretender aplicar las frmulas y principios del muestreo aleatorio simple, a una muestra tomada de forma estratificada; ya que las frmulas correspondientes al muestreo aleatorio simple , son obtenidas bajo la premisa de que todas las muestras son igualmente probables; principio que obviamente no se cumple , cuando la muestra se toma de forma estratificada, ya que una muestra formada por elementos de un mismo

    Conclusin; El riesgo es inherente al muestreo Al igual que en una rifa, la nica manera de garantizar que ganaremos el premio es comprando todos los boletos. Desde el mismo momento en que decidimos realizar un estudio por muestreo debemos estar conscientes de que estamos asumiendo un riesgo, y de all la importancia de conocer el margen de error y el nivel de confianza que nos ofrece la muestra

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    19

    grupo, tendra una probabilidad nula de ser tomada, mientras que una muestra formada por elementos de grupos diferentes tendra una probabilidad muy alta de ser tomada. En caso de que la muestra se tome de forma estratificada, las frmulas y principios a aplicar, son otros, diferentes a los que se vern en esta seccin Los pasos a seguir para obtener una muestra aleatoria simple son los siguientes: Paso 1: En primer lugar es necesario definir el universo sobre el cual se va a tomar la muestra Paso 2: En segundo lugar es necesario conseguir una lista numerada del 1 al N que contenga a todos los elementos del universo. La numeracin puede ser hecha por cualquier criterio, alfabtico, por el nmero de la cedula de identidad, etc. Si no es posible obtener esta lista, entonces se debe establecer previo a la muestra, una regla de conteo que permita identificar a cada elemento del universo. Ejemplo 3.1: En los estudios de calidad, es comn que se deba examinar para su aceptacin, lotes de piezas las cuales vienen empacadas dentro de una caja. Para tomar una muestra aleatoria, se deben enumerar las cajas, o en su defecto establecer una regla de numeracin. Si estn colocadas sobre el suelo, decir por ejemplo que la caja ms a la izquierda es la No 1, luego la No 2, y as sucesivamente hasta la ltima. Posteriormente se debe tambin establecer otra regla de numeracin dentro de la caja, que permita identificar cada pieza. Supongamos que se debe tomar una muestra de botellas para medir su contenido, y que estas se encuentran distribuidas en 100 cajas cada una de las cuales contiene 36 botellas. En este caso N = 100 x 36 = 3600 botellas Para identificar cada una de las botellas del universo, debemos asignarle un nmero a cada caja, y otro nmero a cada posicin dentro de la caja, y as sabremos que la botella No 1 es la que ocupa la posicin No 1 dentro de la caja No 1, la botella No 40 es la que ocupa la posicin No 4 dentro de la caja No 2, la botella No 348 la que ocupa la posicin No 24 dentro de la caja No 10, etc., y la botella No 3600, la que ocupa la posicin No 36 de la caja No 100. Paso 3: Hacer un sorteo sin reemplazo, seleccionando al azar y con igual probabilidad, n nmeros cualesquiera dentro de los N que existen en el universo. Para efectuar este sorteo, existen varios procedimientos. El ms antiguo es escribir N papeles con los nmeros del 1 al N, colocarlos dentro de un sombrero, y seleccionar uno a uno, los n elementos que conformarn la muestra. Otro procedimiento un poco ms moderno para hacer el sorteo, es mediante la tabla de nmeros aleatorios, la cual se construye seleccionando con reemplazo los dgitos del 0 al 9, y segn vayan apareciendo se colocan en filas y columnas. Con la aparicin de las calculadoras electrnicas esta tabla cay en desuso, y hoy en da, el procedimiento ms usado es el de la generacin de nmero aleatorios,

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    20

    que consiste en un sorteo simulado, en donde se le pide a la calculadora que genere nmeros enteros al azar entre 1 y N, y a travs de un algoritmo interno, la calculadora lo selecciona segn una distribucin uniforme discreta. Paso 4: Una vez seleccionados los nmeros que conforman la muestra, debemos ir a los elementos de la poblacin identificados con esos nmeros, y medir o preguntarles el valor de la variable estadstica asociada a cada uno de ellos. Es importante destacar que el nmero de muestras posibles en un muestreo aleatorio simple es Nn = N !n! (Nn)! , y que al ser cada una igualmente probable, la probabilidad de seleccionar una de ellas en particular es 1

    Nn

    Por ejemplo, si el universo est formado por los 5 elementos {a, b, c, d, e}, y se va a tomar una muestra de 2 de ellos, entonces existen 52 = 5 !2! 3!!= 10 muestras posibles, que son {ab, ac, ad, ae, bc, bd, be, cd, ce, de}, y la probabilidad de seleccionar cualquiera de ellas es 1/10 Segn sea el parmetro que se quiera estimar en la poblacin, debemos distinguir entre "Muestreo aleatorio para Variables, "Muestreo aleatorio para Proporciones y Porcentajes, Muestro aleatorio para Razones III.1 Muestreo Aleatorio para Variables: En este caso, la poblacin est formada por un conjunto de valores numricos asociados a cada uno de los elementos del universo; tal como puede ser un grupo de personas, en donde estamos observando el peso de cada uno de ellos, o un conjunto de residencias que cada una tiene un nmero variable de habitantes, o una produccin de cigarrillos, en donde cada uno tiene una longitud, o un dimetro distinto. La variable estadstica en este caso es cuantitativa, y la poblacin est formada por el conjunto de valores numricos que ella toma sobre cada uno de los elementos del universo. La nomenclatura seguir es la siguiente: N = Tamao de la Poblacin Poblacin = {x1, x2, x3 , xN} xi = Valor de la variable estadstica asociado al i-simo elemento de la poblacin (i=1, 2,3...N); Cada xi es un nmero real

    = i N

    ii 1

    x=

    = = Total Poblacional. =

    = = =i n

    ii i

    x

    N N= Media Poblacional.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    21

    i N2

    i2 i 1

    (y )

    N

    =

    =

    =

    = Varianza Poblacional.

    n = Tamao de la muestra. Muestra= {y1, y2, y3 , yn} yj = Valor de la variable estadstica asociado al j-simo elemento de la muestra (j=1, 2,3...n)

    j n

    jj 1

    yy

    n

    =

    ==

    = Media muestral =

    = Estimador de

    T =

    = N y = Estimador de j n

    2j

    j 12

    (y y)s

    n 1

    =

    =

    =

    = Varianza muestral = 2

    = Estimador de 2

    f = nN

    = Fraccin de muestreo.

    La notacin convencional en muestreo consiste en designar a los parmetros poblacionales con letras griegas, mientras que a sus correspondientes estimadores mustrales con letras latinas. Cabe destacar que se emplean diferentes letras, y para designar a los valores mustrales , x para los poblacionales, puesto que estos no tienen por qu coincidir; de hecho por ejemplo ,el dcimo elemento de la poblacin puede no salir en la muestra, o si sale, puede ser que ocupe otro lugar. Usualmente los valores poblacionales son desconocidos, puesto que para conocerlos habra que conocer los valores numricos asociados a cada uno de los elementos de la poblacin, lo que dejara al muestreo sin sentido. Los parmetros poblacionales a estimar suelen ser la media poblacional y / o, el total poblacional. En lo que se refiere a los valores mustrales, estos son conocidos para la muestra tomada, pero deben ser vistos como valores particulares de una variable aleatoria; puesto que el valor que ellos toman, depende obviamente de los elementos que formen la muestra, los cuales se seleccionan aleatoriamente. Una vez tomada la muestra, es posible definir intervalos de confianza tanto para la media poblacional, como para el total poblacional, los cuales vienen dados por las siguientes expresiones:

    Intervalo de confianza para : y z/2 sn1 f Intervalo de confianza para : N N z/2 sn1 f

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    22

    z/2 = Abscisa que en la Normal Tipificada deja a la derecha un rea /2 El valor de z/2, depende del nivel de confianza (1-) deseado, siendo los ms frecuentes 90%, 95% o 99% de confianza, para los cuales el valor de z/2 puede ser ledo en las tablas de La Distribucin Normal, encontrndose:

    Confianza z/2 90 % 1,645 95 % 1,960 99 % 2,576

    Figura N 5: Abscisas de la Distribucin Normal para un nivel de confianza dado

    Es costumbre que los intervalos de confianza sean simtricos y que por lo tanto el riesgo se reparta por mitad entre las dos colas de la Distribucin Normal. El trmino sin multiplica por la abscisa z/2, se suele llamar el error estndar de la estimacin, mientras que una vez multiplicarlo por la abscisa, representa el error de muestreo para el nivel de confianza establecido. As por ejemplo

    1 es el error estndar en la estimacin de , mientras

    que z/2 sn1 f representa el radio del intervalo de confianza, es decir el margen de error tolerado, para un nivel del (1-) de confianza Un comentario importante en las expresiones para el intervalo de confianza es el que se refiere a la relacin entre el radio del intervalo y el nivel de confianza. Fcilmente se puede observar que cuanto mayor sea la confianza, mayor ser el radio del intervalo, y viceversa; lo cual es completamente lgico, pues si al hacer un disparo sobre un blanco, queremos aumentar la probabilidad de acierto, se debe aumentar el radio del blanco. Ejemplo: Una de las reas en donde las tcnicas de muestreo han encontrado un gran campo de aplicacin, es en las auditoras contables. En efecto, as como el contador debe preocuparse para que las cuentas cuadren al cntimo, el auditor debe certificar que el estado financiero refleja cifras crebles, y en este sentido, el muestreo constituye una herramienta muy til, pues si la cifra dada en el estado financiero cae dentro del intervalo de confianza obtenido por muestreo, el auditor puede validar esa cifra, sin necesidad de examinar la totalidad de documentos. Consideremos el siguiente caso: Se quiere estimar el monto total de las ventas de una empresa durante un periodo de tiempo dado. Existen 32.500 facturas de venta emitidas durante ese lapso. Una muestra aleatoria simple de 100 facturas los siguientes montos expresados en unidades monetarias: 1.565,81 1.681,15 1.569,50 2.179,82 1.448,19 3.202,97 1.791,71 1.652,48 1.538,34 2.225,79 1.272,97 2.160,39 1.426,80 1.797,69 1.572,99 1.151,57 2.326,23 2.722,45 1.618,40 1.565,78 1.589,60 2.554,25 2.145,41 2.387,37 1.966,96 999,62 1.415,03 1.652,15 1.810,55 1.554,80

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    23

    1.712,11 2.413,25 2.085,90 1.599,76 2.393,09 1.443,49 1.967,46 1.944,56 1.098,63 1.928,56 2.120,34 1.781,19 2.530,04 1.662,57 1.956,70 2.081,10 1.494,16 1.099,40 2.428,79 1.681,24 1.164,33 1.819,62 782,58 2.476,30 1.942,82 2.166,43 817,62 1.132,65 1.671,05 2.342,90 1.894,14 1.772,66 1.192,46 2.362,04 1.877,08 2.002,05 1.793,70 2.249,14 1.546,75 674,06 2.130,09 2.095,72 2.239,11 1.960,13 1.593,56 1.398,05 1.832,01 1.467,12 1.372,94 1.719,57 948,98 1.587,10 1.900,94 2.428,22 1.727,20 778,04 2.098,32 1.209,68 2.797,18 2.363,02

    1.077,25 876,39 1.628,44 1.150,14 2.565,92 1.061,72 842,67 2.091,25 1.825,83 2.389,28

    Para inferir en base a esta muestra el monto total de las ventas (Total poblacional) hay que calcular la media y la desviacin estndar de la muestra, que dan por resultado: y = 1.776,90; s = 505,35 En base a esta informacin, el intervalo del 95% de confianza para el monto promedio de estas 32.500 facturas resulta ser:

    1.776,90 1,96 505,35100

    1 10032500

    = 1.776,90 98,90

    Mientras que para el total poblacional, el intervalo del 95% de confianza es:

    32500 x 1.776,90 32500 x1, 96 505,35100

    1 10032500

    = 57.749.250,00 3.214.123,25

    Esto significa que con 95% de confianza, se puede afirmar que las ventas totales estn dentro del intervalo [54.535.126,75; 60.963.373,25], de manera que si estado financiero reporta un monto comprendido dentro del intervalo, el auditor considerar aceptable esta cifra, caso contrario har una investigacin ms exhaustiva. 3.214.123,25 representa el error absoluto en la estimacin, mientras que (3.214.123,25/ 57.749.250,00) 100% = 5,57% el error relativo Ejemplo: De un lote de 10.000 pilas, se tom una muestra de 25, y se observ su duracin en horas, encontrndose los siguientes resultados:

    Duracin (horas)

    Frecuencia

    10-40 2 40-70 4 70-100 8

    100-130 5 130-160 6

    Obtngase un intervalo del 95% de confianza, para la duracin media de las pilas del lote. Solucin: En primer lugar, es necesario calcular la media y la desviacin estndar de la muestra. Estas resultan ser: y = 95,80 s= 37,63 Se tiene n = 25, y Z0.025 = 1,96 para 95% de confianza Reemplazando, se obtiene que el intervalo del 95 % de confianza para es:

    95,80 1,96 37,63 2511000025

    = 95,80 14,73 = [81,07; 110,53]

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    24

    Determinacin del tamao de la muestra: En la estimacin de parmetros a travs del muestreo, la pregunta clave siempre suele ser el tamao de la muestra que es necesario tomar. Responder esta pregunta no es fcil, y para ello, es necesario definir con anterioridad dos conceptos: Cuando se va a estimar un parmetro desconocido, como lo es , a travs de un valor aleatorio muestral, como lo es y , no podemos esperar que ambos coincidan, y por lo tanto aparece un error de estimacin definido por la diferencia absoluta entre ellos. Tenemos entonces que: Error absoluto de estimacin = | y - | Evidentemente, este error de estimacin es una medida de la precisin del muestreo, y cuanto menor sea el error que estamos dispuestos a aceptar, mayor ser el tamao de la muestra; hasta el punto, que si no estamos dispuestos a tolerar ningn error, no nos quedar ms remedio, que hacer un censo de la poblacin. El mximo error que estamos dispuestos a tolerar, lo designaremos por "", y representa entonces, la precisin con que estamos trabajando en el muestreo. = Error mximo tolerado = Max | y - | Es frecuente, que en lugar de definir al error en trminos absolutos, tal como se hizo anteriormente, se haga en trminos relativos, dividiendo al error absoluto entre el verdadero valor del parmetro, y expresndolo en trminos porcentuales:

    Error relativo en la estimacin de = y

    % 100%

    =

    Fijar el error mximo que estamos dispuestos a tolerar, no basta para poder calcular el tamao de la muestra, porque siendo sta aleatoria, siempre tendremos un cierto riesgo de que este formada por elementos extremos, que nos lleven a una falsa inferencia; es por ello, que el otro trmino que hace falta fijar, para poder definir el tamao de la muestra, es el riesgo del muestreo, que se define como la probabilidad de tomar una muestra que nos haga cometer un error de estimacin mayor que el mximo tolerado; es decir:

    = Riesgo del muestreo = P( | y - | > )

    Figura N 6: Confianza en la estimacin de una media poblacional

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    25

    Es tambin evidente, que cuanto menor sea el riesgo que estemos dispuestos a correr, mayor ser el tamao de muestra necesario, y que en el caso =0, se necesitar un censo, es decir: n = N. Usualmente el riesgo se fija en 1%, 5% o 10%. Una vez definido el error mximo tolerado, y el riesgo del muestreo, el tamao de la muestra puede ser calculado mediante la aplicacin de la siguiente frmula: n = N z/22 2z/22 2 + (N 1) 2 En donde: N = Tamao de la poblacin. 2= Varianza Poblacional. = Mximo error absoluto tolerado. = Riesgo del muestreo z/2 = Abscisa que en la normal estndar deja a la derecha un rea "/2". Con relacin a la frmula anterior, es importante hacer las siguientes observaciones: a) Una de las creencias ms arraigadas, es la de pensar que para un nivel de riesgo y de error fijos, el tamao de muestra es siempre un porcentaje fijo de la poblacin. La frmula anterior, nos muestra que esta creencia es falsa, puesto que si graficamos la forma como varia el tamao de muestra al variar el tamao de la poblacin, manteniendo fijos el error tolerado, y el riesgo, encontramos una curva como la siguiente:

    En esta curva podemos fcilmente ver, que el tamao de muestra no crece linealmente con el tamao de poblacin; por el contrario, crece mucho ms lentamente, hacindose asinttica a la recta horizontal:

    = z/22 2 2

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    26

    Debido a que : lim N z/22 2z/22 2+(N1) 2 = z/22 2 2 lo que nos indica que en una poblacin infinita, no necesitamos una muestra infinita. Es aqu donde radica la gran importancia del muestreo, puesto que cuanto mayor es la poblacin, ms econmico es el muestreo en comparacin con el censo; mientras que en poblaciones pequeas, es posible que la muestra represente una proporcin muy apreciable de ella. Una consecuencia prctica de este resultado es que cuando en una poblacin no sabemos exactamente cul es su tamao, perfectamente podemos suponer que es infinita, y esto no ocasionara un incremento significativo en el tamao de muestra requerido b) La segunda observacin que es necesario plantear, con relacin a la frmula para obtener el tamao de muestra, es la que se refiere al desconocimiento acerca del valor de la varianza poblacional 2 ; en efecto, todos los trminos que intervienen en la frmula : N, z/2 y son conocidos o fijados, a excepcin de 2, el cual ni se conoce , ni se podr conocer, puesto que para calcularla, sera necesario conocer los valores numricos de la poblacin, lo cual obviamente, dejara sin objetivos al muestreo. Este detalle hace que no exista una solucin matemticamente exacta para resolver el problema del tamao de muestra, y que la solucin sugerida a continuacin, solo nos brinde una aproximacin. En la seccin anterior vimos la conveniencia de realizar muestras preliminares o pilotos, para detectar de manera temprana posibles errores en el diseo de la encuesta. Este tipo de muestras tambin pueden ser utilizadas para obtener una estimacin preliminar de 2 , que sustituida dentro de la frmula del tamao de muestra, dar una solucin aproximada al problema. La estimacin preliminar de 2 a partir de la muestra piloto, puede hacerse a travs del su varianza muestral s2, o como sugieren algunos autores, estimando tomando la cuarta parte del rango de la muestra piloto (el rango es la diferencia entre el mayor y el menor valor de la muestra), es decir: =

    4

    Sin embargo, ahora aparecen dos nuevas preguntas, que no estaban planteadas inicialmente, que son: de qu tamao debe ser esta muestra piloto? , y Qu garanta tenemos de que la estimacin hecha de 2, a travs de s2, o a travs del rango de la muestra piloto, es satisfactoria? Lamentablemente, la solucin a toda esta problemtica nos conduce a un proceso iterativo de ensayo y error, que comienza asumiendo un tamao de muestra piloto, que no debera exceder del 1% del tamao de la poblacin, o del 0,5% en el caso de poblaciones grandes; una vez tomada esta primera muestra piloto, se estima el valor de 2, y se calcula "n. Si este valor de nsi resulta inferior al de la muestra piloto nos indica que con esta basta, y si resulta mayor, es necesario completar la muestra, hasta que al recalcular el valor de "n, el tamao resulte igual o menor que el tomado. La siguiente grfica resume la metodologa a seguir:

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    27

    Figura N 6: Etapas en la investigacin por muestreo Para ms detalle sobre estas etapas, se recomienda ir a la seccin I.4 c) Una tercera observacin con relacin a la frmula del tamao de muestra, es la que se refiere a la seleccin del "" (error mximo tolerado), el cual tiene que ser fijado en trminos absolutos, para poder ser sustituido en la frmula. Obviamente la fijacin de un "" inadecuado, redundar negativamente en el tamao de muestra a tomar, puesto que si "" es muy grande entonces el muestreo ser impreciso y la estimacin ser poco confiable, y si "" es muy pequeo, entonces el tamao de muestra resultar gigantesco, aproximndose casi a un censo, perdiendo as las ventajas del muestreo. Mucho ms prudente, es fijar el error mximo tolerado en trminos relativos, es decir como un porcentaje del parmetro a estimar; pero a la hora de sustituir dentro de la frmula, ste debe ser absoluto, y entonces se plantea la pregunta de cmo calcularlo, si ignoramos el verdadero valor del parmetro. Es decir, si por ejemplo, decimos que la estimacin de la media poblacional, debe ser con un error mximo del 5%, entonces estamos diciendo = 0,05 , pero "" lo ignoramos, y entonces cmo lo sustituimos dentro de la frmula? Esta situacin se resuelve, fijando el error mximo tolerado en trminos relativos, y a la hora de tomar la muestra piloto, entonces se utiliza el valor estimado del parmetro, que en el caso de la media poblacional sera, la media de la muestra piloto, para calcular el error mximo tolerado, en trminos absolutos, el cual es sustituido dentro de la frmula del tamao de muestra, a lo fines de determinar si la muestra piloto fue insuficiente o no. Por supuesto, que ahora se plantea un nuevo elemento en la iteracin, puesto que cada vez se complete la muestra, se necesita recalcular el valor estimado del parmetro, y por ende, del error mximo tolerado en trminos absolutos. Ejemplo: En un lote de 20.000 bombillos, se quiere estimar su duracin media con un error mximo del 1%, y un riesgo del 5%. Si una muestra piloto de 50 bombillos, arroj una duracin media de 5.200 horas, con una desviacin tpica de 350 horas. a) Qu tamao de muestra se necesita? b) Si la nueva muestra anterior arroja una duracin media de 5640 horas con una desviacin tpica de 320 horas, es suficiente con esa muestra? c) Obtenga un intervalo del 95% de confianza, para la duracin media del lote Solucin: a) Tomando la informacin de la muestra piloto, tenemos que = 350 = 5200 Adems = 1% de 5200 = 52 horas, z/2= 1,96

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    28

    Sustituyendo encontramos: = 20000 1,962 35021,962 3502+ 19999 522 = 172,54

    Es decir, que se necesita una muestra de 173 bombillos. Como la muestra piloto era de solo 50 bombillos, es necesario examinar 123 adicionales (en teora deberan ser otros 173 bombillos) b) Con la informacin de la nueva muestra se tiene: que = 320 = 5640 Adems = 1% de 5640 = 56,40 horas, z/2= 1,96

    Sustituyendo encontramos: = 20000 1,962 32021,962 3202+ 19999 56,402 = 122,91 < 173

    Esto significa que la muestra con n= 173 es suficiente. Si n hubiese resultado mayor que 173, en teora se debera continuar iterando, pero en la prctica se suele detener el proceso aqu, a pesar de que la estimacin va a resultar con un margen de error mayor que el previsto. c) El intervalo de confianza para ser entonces

    5640 1,96 320173

    1 17320000

    = 5640,00 47,48

    En caso de que el parmetro a estimar, sea el total poblacional, la frmula anterior del tamao de muestra, y los procedimientos iterativos descritos, siguen teniendo vigencia, pero distinguiendo dos casos: Caso 1. Si el error mximo tolerado para estimar al total poblacional esta fijado de manera relativa, la frmula para el tamao de muestra se aplica sin modificaciones, pues estimar al total poblacional con un determinado porcentaje de error equivale a estimar la media poblacional con ese mismo porcentaje de error. Caso 2. Si el error mximo tolerado para estimar al total poblacional esta fijado de manera absoluta, la frmula para el tamao de muestra se aplica pero tomando al error absoluto para el total poblacional dividido entre el tamao de poblacin. Esta modificacin se debe a que en la dicha frmula para el tamao de muestra, representa el error tolerado en la estimacin de , no en la estimacin de , y =

    Ejemplo N2: En un almacn en donde existen 5000 objetos diferentes, se quiere estimar el valor total de ellas, con un error no mayor del 5%, y un nivel de riesgo del 10%. Una muestra piloto de 20 piezas seleccionadas al azar arroj los siguientes valores, segn la opinin de un perito auditor:

    134 276 784 756 503 1076 432 178 675 987 654 860 906 398 187 1655 543 765 534 610

    a) Calcule el tamao de la muestra que es necesario tomar.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    29

    b) Si la muestra calculada anteriormente da una media de Bs. 685, con una desviacin tpica de Bs. 346. Cree Ud. que la muestra tomada fue suficiente? c) Encuentre un intervalo del 90% de confianza para el valor total de las piezas almacenadas. Solucin: a) En primer lugar, es necesario estimar , y para ello tenemos dos opciones, a partir de la desviacin estndar de la muestra, o a partir de la cuarta parte del rango. Si lo hacemos a partir de la desviacin estndar de la muestra: = s= 359,81 Si lo hacemos a partir de la cuarta parte del rango: = 1655134

    4 = 380,25

    Cuanto mayor sea , mayor ser el tamao de muestra requerido, por lo tanto si se quiere un clculo de n que evite futuras iteraciones, se deber tomar la estimacin mayor, en este caso =380,25 Hay que calcular tambin la media de la muestra piloto = = 645,65 Adems N = 5000 = 5% de 645,55 =32,28, z/2= 1,645 para 90 % de confianza Ntese que a pesar de que se desea estimar un total poblacional, se procede de la misma manera como si se tratara de una media poblacional. Esto es debido a que estimar un total poblacional con un error relativo del 5% es equivalente a estimar la media poblacional con ese mismo error relativo

    = 5000 1,6452 380,2521,6452 380,252+ 4999 32,282 = 349,23 > 20 la muestra piloto fue insuficiente

    b) Si tomada ahora la muestra con n= 350 objetos, se encuentra =346 = 685, se tiene entonces = 5% de 685= 34,25, y sustituyendo:

    = 5000 1,6452 34621,6452 3462+ 4999 34,252 = 261,76 < 350 la muestra es suficiente

    c) El intervalo del 90% de confianza para el total poblacional resulta:

    5000 x 685 5000 x 1,645 346350

    1 3505000

    = 3.425.00, 00 146.696,40

    III.2 Muestreo Aleatorio para proporciones y porcentajes: En numerosas oportunidades, el parmetro que se quiere estimar, es el porcentaje de elementos que en una poblacin determinada, poseen una cierta caracterstica o atributo. Este atributo puede ser cualquier cualidad que divida al universo en dos categoras, los que lo poseen, y los que no lo poseen; como por ejemplo, un universo de piezas que pueden ser clasificadas como buenas o defectuosas, o un universo de consumidores que prefieren o no prefieren una cierta marca. En tales casos, es posible aplicar el muestreo aleatorio simple, tomando por supuesto, la muestra de la misma manera como se describi al principio, con igualdad de chance para todas las muestras posibles.

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    30

    Este caso es un caso particular del anterior por variables. En efecto, en el muestreo por variables, la poblacin est constituida por un conjunto de valores numricos {x1, x2, x3 , xN} en donde cada xi es un nmero real cualesquiera. En el muestreo por atributos:

    i

    0 ; si el i-simo elemento de la poblacin no posee el atributox

    1 ; si el i-simo elemento de la poblacin posee el atributo

    =

    La nomenclatura a seguir es la siguiente: N = Tamao de la poblacin. = Total de elementos que en la poblacin, poseen una cierta caracterstica. =

    N= Proporcin de elementos con la caracterstica, en la poblacin.

    n = Tamao de la muestra. t = Total de elementos que en la muestra, poseen una cierta caracterstica. p =

    = Proporcin de elementos con la caracterstica, en la muestra.

    = n

    N= Fraccin de muestreo

    En vista de que los xi de la poblacin son ceros o unos, y los yi de la muestra

    tambin, el total poblacional = i N

    ii 1

    x=

    = resulta ser el nmero de unos existentes en

    la poblacin, pues evidentemente una suma de ceros y unos da por resultado el total de unos, es decir el total de elementos con el atributo en la poblacin,

    mientras que t =i n

    ii 1

    y=

    = representa el nmero de elementos con el atributo

    presentes en la muestra. Con este simple argumento, resulta fcil caer en cuenta, que en el muestreo por atributos, desempea el papel de , mientras que p el de Los parmetros a estimar por muestreo, suelen ser "" y/o , siendo sus correspondientes intervalos de confianza:

    Ejemplo: Si de un lote de 7.000 piezas, se toma una muestra aleatoria de 150 piezas, encontrndose 12 defectuosas. Halle un intervalo del 95% de confianza, para el porcentaje de defectuosas, y para el total de defectuosas en el lote.

    Intervalo del (1-) de confianza para ": z/2p(1p)n1 1 f Intervalo del (1-) de confianza para: Nz/2p(1p)n1 1 f

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo

    31

    Solucin: = 12150

    = 0,08 N = 7000 z0,025 = 1,96 n= 150 Intervalo para ": 0.08 1,96 (0,08) (0,92)

    1491 150

    7000 = 0,0800 0,0431

    Es decir, que con 95% de confianza, se puede afirmar que el porcentaje de defectuosos en el lote est entre 3,69% y 12,31%

    Intervalo para :7000 (0.08) 7000 (1,96) (0,08) (0,92)149

    1 1507000

    =

    580 301,70 Es decir, que con 95% de confianza, se puede afirmar que el nmero de defectuosos en el lote est entre 278 y 882 Determinacin del tamao de la muestra en muestreo para proporciones y porcentajes: Los conceptos anteriormente definidos de error y riesgo, siguen siendo necesarios en este tipo de muestreo, sin embargo, como este caso el parmetro a estimar es ", tenemos que:

    Es importante aclarar, que en este tipo de estimacin jams se trabaja con errores relativos; siempre que se d un error, este debe interpretarse como absoluto. As por ejemplo, cuando decimos que se quiere estimar el porcentaje de votos que va a obtener un candidato en unas elecciones, con un error del 1%; este 1% debe interpretarse como la diferencia absoluta, entre la estimacin hecha, y el verdadero porcentaje de votos a favor del candidato. Una vez definido el error mximo tolerado y el riesgo, el tamao de la muestra puede ser calculado mediante la aplicacin de la siguiente frmula:

    = /22 (1 )( 1)2 + /22 (1 ) Para poblaciones infinitas, el tamao de muestra requerido resulta ser:

    = lim

    /22 (1 )( 1)2 + /22 (1 ) = /22 (1 )2 Nuevamente aqu, se presenta la misma situacin descrita antes, ya que como el valor de "", es desconocido, el mismo debe ser estimado a travs de una muestra piloto, lo que conduce a un proceso iterativo, que consiste en ir completando la muestra, hasta que al recalcular el valor de "n", se obtenga un valor igual o menor al ya tomado.

    Error de estimacin = | p - | Error mximo tolerado = = Mxima diferencia tolerada de | p - |

    Riesgo = = Probabilidad (| p - | > )

  • Muestreo Aleatorio Pag. Angel Francisco Arvelo