7 Muestreo y distribuciones muestrales

30
División de Ciencias Sociales y Humanidades Maestría en Desarrollo y Planeación de la Educación Seminario Estadística aplicada Tema: Capítulo 7 Muestreo y distribuciones muestrales Maestra: Edith Ariza Gómez 1

Transcript of 7 Muestreo y distribuciones muestrales

Page 1: 7 Muestreo y distribuciones muestrales

División de Ciencias Sociales y Humanidades

Maestría en Desarrollo y Planeación de la Educación

Seminario

Estadística aplicada

Tema:

Capítulo 7 Muestreo y distribuciones muestrales

Maestra: Edith Ariza Gómez

PresentanMaría Isabel Pérez Ornelas

Armando Tapia ChávezMéxico, D.F. a 24 de enero de 2011

1

Page 2: 7 Muestreo y distribuciones muestrales

Muestreo y distribuciones muestrales

Contenido

Introducción

7.1 El problema de muestreo en Electronics Associates

7.2 Muestreo aleatorio simpleMuestreo para poblaciones finitasMuestreo para poblaciones infinitas

7.3 Estimación puntual

7.4 Introducción a las distribuciones muestrales

7.5 Distribuciones muestrales de xValor esperado de xDesviación estándar de xTeorema de límite centralValor práctico de la distribución muestral de xRelación entre el tamaño de la muestra y la distribución muestral de x

7.6 Distribución muestral de pValor esperado de pDesviación estándar de pForma de la distribución muestral de pValor práctico de la distribución muestral de p

7.7 Propiedades de los estimadores puntualesInsesgadezEficiencia Consistencia

7.8 Otros métodos de muestreoMuestreo aleatorio estratificadoMuestreo por conglomeradosMuestreo sistemáticoMuestreo por convenienciaMuestreo por juicio

Referencias consultadas

2

Page 3: 7 Muestreo y distribuciones muestrales

Introducción

El presente trabajo tiene el propósito de ubicar la importancia del muestreo y

distribuciones en estadística aplicada. Para ello se recurre tanto a conceptos centrales

recuperados del libro Estadística para administración y economía y de otros referentes

bibliográficos para complementar aspectos conceptuales y de procedimiento.

A manera de apertura del capítulo muestreo y distribuciones muestrales

En la estadística inferencial se requiere información acerca de grupos grandes de

elementos (individuales, empresas, votantes, etc.), pero por cuestiones de tiempo, costo,

entre otros aspectos, solamente se puede recolectar datos de una pequeña parte de este

grupo, a lo que llamamos muestra, por lo tanto, para inferir información estadística es

importante tener claros dos aspectos importantes:

- Población que es el conjunto de todos los elementos de interés en un estudio

determinado, y

- Muestra que es un subconjunto de la población.

Por lo anterior, se tiene que la inferencia estadística tiene como propósito construir

estimaciones y pruebas de hipótesis acerca de las características de una población por

medio de la información obtenida en una muestra.

Se puede emplear el muestreo y los resultados de una muestra para obtener estimaciones

de las características de una población. Es importante tener en cuenta que los resultados

de la muestra sólo dan estimaciones de los valores de las características de la población.

Con lo métodos adecuados de muestreo, los resultados muestrales darán “buenas”

estimaciones de las características de la población.

Una buena muestra reproduce las características de interés que existen en la población de la manera más cercana posible. Esta muestra será representativa, en el sentido de que cada unidad muestreada representará las características de una cantidad conocida de unidades en la población.

Definiciones para precisar el concepto de una buena muestra:

- Unidad de observación. Es el objeto sobre el cual se realiza una medición. Esta es la unidad básica de observación, a veces llamada elemento.

- Población objetivo. Es la colección completa de observación que deseamos estudiar. La definición de la población es una parte importante, y con frecuencia difícil, del estudio. Por ejemplo, en una encuesta escolar ¿la población objetivo deberían ser todos los alumnos que pueden votar?

3

Page 4: 7 Muestreo y distribuciones muestrales

- Muestra. Es una fracción o subconjunto de cualquier tamaño de la población de la cual proviene. Las muestras se escogen por diversos procedimientos (sean apropiados o no) para realizar las observaciones o recogida de datos. El método de muestreo aplicado y el tamaño de la muestra que se decida, determinan su grado de representatividad.

- Población muestreada. Es la colección de todas las unidades de observación posibles que podrían extraerse en una muestra, es la población de donde se extrae la muestra.

- Unidad de muestreo. Es la unidad donde se realiza la muestra. Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los individuos que pertenecen a la población objetivo. En vez de esto, las familias sirven como las unidades de muestreo y las unidades de observación son los individuos que viven en una familia.

Según Sharon Lohr,1 existen tres justificaciones principales para el uso del

muestreo, las cuales se apuntan a continuación:

- El muestreo puede proporcionar información confiable con costos mucho menores que los de un censo. Con las muestras probabilísticas se puede cuantificar el error de muestreo a partir de una encuesta. En algunos casos, una unidad de observación debe ser destruida para ser observada, como cuando una galleta debe pulverizarse para determinar el contenido de grasa.

- Los datos se pueden reunir más rápido, de modo que las estimaciones se pueden publicar de una manera programada.

- Las estimaciones basadas en las encuestas y sus respectivas muestras son, con frecuencia, más precisas que las basadas en un censo pues los investigadores pueden tener más cuidado al reunir los datos. Un censo completo necesita, por lo regular, de una gran organización administrativa e implica a muchas personas en la recolección de datos.

7.1 El problema de muestreo en Electronics AssociatesPara dar un seguimiento a lo que plantea el libro base del Seminario de Estadística

Aplicada, se considera importante, recuperar los ejemplos que en éste se desarrollan,

además de complementarlos.

Para dar cuenta de la importancia de la muestra en un estudio estadístico es importante

conocer la población a la que se va a estudiar y las características que se desean

identificar, por ejemplo, en el caso de la empresa Elecronics Electronics Associates,

Inc. (EAI) el director de personal tiene que elaborar un perfil de 2500 gerentes que

trabajan en dicha empresa. Le interesa dos características a identificar: el sueldo anual

1 Lohr, Sharon, Muestreo: Diseño y análisis, México, Internacional Thomson Editores, 2000. Trad. de Óscar Alfredo Palmas Velasco.

4

Page 5: 7 Muestreo y distribuciones muestrales

promedio y la proporción de gerentes que concluyeron un programa de adiestramiento

de la empresa.

Para calcular la media poblacional y la desviación estándar de la población para los

datos anuales de salarios se recurre a las siguientes formulas:

Media poblacional µ= ∑xi (xi= x1+x2+xn) N (Donde N es el símbolo para denotar la población)

Y

Desviación estándar poblacional σ =√ σ2

Desviación estándarEs la raíz cuadrada positiva de la varianza. s denota la desviación estándar muestral s=√s2 yσ la desviación estándar poblacional σ =√ σ2

La desviación estándar se mide en las mismas unidades que los datos originales.

Donde

Media de la población: µ = 51 800 dólares2

Desviación estándar de la población: σ = 4000 dólares

Recordemos que para obtener la varianza que está basada en la diferencia entre el valor

de cada observación (xi) y la media, se recurre a la siguiente formula

σ2=∑( x i - µ) N

Cuando los datos son de una población las elevaciones son al cuadrado y se denota

varianza poblacional y se denota con la letra griega σ2

A la diferencia entre cada valor xi y la media se le llama desviación estándar respecto de

la media. Para calcular la varianza, las desviaciones respecto a la media se elevan al

cuadrado.

Cuando se calcula una muestra lo que interesa es estimar la varianza poblacional σ2. La

suma de los cuadrados de las desviaciones respecto de la media se divide entre n- 1, en

2 Datos recuperados del capítulo 7. Muestreo y distribuciones muestrales en Estadística para administración y economía. 10ª edición, México, CENGAGE Learning, pp. 241- 283.

5

Page 6: 7 Muestreo y distribuciones muestrales

lugar entre n, la varianza muestra que se obtiene constituye un estimador no sesgado de

la varianza poblacional.

Varianza muestral: s2=∑( x i - )

n -1En todo conjunto de datos, la suma de las desviaciones respecto de la media será siempre igual a cero.

Para obtener la proporción de gerentes que terminaron el programa, se calcula la

proporción de la población que terminó el programa. De los 2500 gerentes 1500

terminaron el programa de capacitación, p representa la proporción de la población que

terminó el programa, entonces tenemos que p = 1500/2500 =0.60.

Con los estadísticos anteriores tenemos los parámetros de la población que se está

estudiando: la media del salario anual de la población (µ = 51 800), su desviación

estándar (σ = 4000) y la proporción que terminó el programa de adiestramiento (p=

0.60) son parámetros de la población de los gerentes de EAI. Por lo anterior, se puede

decir que un parámetro es una característica numérica de una población.

Con lo anterior se demuestra que es común que la información de una muestra se pueda

usar para elaborar estimaciones de los parámetros poblacionales de interés.

7.2 Muestreo aleatorio simpleSe puede usar varios métodos para seleccionar una muestra a partir de una población; uno del os métodos más comunes es el muestreo aleatorio simple. La definición de este método y el proceso de seleccionar una muestra aleatoria simple siempre dependen de si la población es finitia o infinita.

Muestreo para poblaciones finitiasUna muestra aleatoria simple de tamaño n, de una población finita de tamaño N, se define como sigue:

Una muestra aleatoria simple de tamaño n, de una población finita de tamaño N, es una muestra seleccionada de tal manera que cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada.

Un procedimiento para identificar una muestra aleatoria simple a partir de una población finita es seleccionar por uno los elementos que constituyen a la muestra, de tal modo que cada uno de los elementos que aún queden en la población tengan la misma probabilidad de ser seleccionados. Al muestrear n elementos en esa forma, se satisfará la definición de una muestra aleatoria simple de una población finita.

6

Page 7: 7 Muestreo y distribuciones muestrales

Al realizar este proceso para la selección de una muestra aleatoria simple, es posible que un número que haya sido usado se encuentre de nuevo, a este tipo de selección se le conoce como muestreo con reemplazo. Cualquier número aleatorio que ya ha sido usado se ignora se esta muestreando con reemplazo. Muestrear con reemplazo es una forma válida de identificar una muestra aleatoria simple. Sin embargo el muestreo sin reemplazo es el procedimiento de muestreo más usado.

Muestreo de una población infinita

En algunas situaciones la población o bien es infinita o tan grande que, para fines prácticos, se considera infinita.

Una muestra aleatoria simple de una población infinita es una muestra seleccionada de manera que se satisfagan las condiciones siguientes:

1. Cada uno de los elementos seleccionados proviene de la población2. Cada elemento se selecciona independientemente.

En poblaciones infinitas un procedimiento para la selección de una muestra debe de ser concebido especialmente para cada situación, de manera que permita seleccionar los elementos de manera independientemente y evitar así un sesgo en la selección que de mayores probabilidades de selección a ciertos tipos de elementos.

Dichos sesgos se evitan haciendo que la selección de un elemento no influya en la selección de cualquier otro elemento.

Las poblaciones infinitas suelen asociarse con un proceso que opera continuamente a lo largo del tiempo. En tales casos un procedimiento de muestreo creativo garantiza que no haya sesgos de selección y que los elementos de la muestra sean seleccionados en forma independiente.

7.3 Estimación puntualEn la estimación puntual se usan los datos de la muestra para calcular un valor de un

estadístico de la muestra que sirva como estimación de un parámetro de población.

Se dice que:

es estimador puntual de la media población µ

s es el estimador puntual de la desviación estándar poblacional σ

es el estimador puntual de la proporción p poblacional.

Para estimar el valor de un parámetro de población se calcula una correspondiente

característica de la muestra, que se denomina estadístico de la muestra o media

muestral.

7

Page 8: 7 Muestreo y distribuciones muestrales

A los valores numéricos obtenidos para , s o en una determinada muestra

se les llama estimaciones puntuales del parámetro.

Por ejemplo, si elegimos una muestra aleatoria de 30 gerentes para estimar la media de

la población µ y la desviación estándar de la población σ del salario anual para calcular

los estadísticos de la muestra que son la media de la muestra y la desviación

estándar de la muestra s.

Formulas

Media muestral

=∑xi (xi= x1+x2+xn) = 1554 420 = 51 814.00 dólares n 30

Desviación estándar de la muestra

s=√ ∑( x i - ) 2 = √325 009 260 = 3347.72 dólares n-1 29Al calcular la proporción de gerentes que contestaron que Sí en la muestra, podemos estimar la proporción de gerentes, en la población, que terminaron el programa de adiestramiento gerencial. De los 30 gerentes de la muestra terminaron el adiestramiento 19.

La proporción de la muestra, representada por es

= 19 = 0.63

30

Este valor se usa como estimación de la proporción p de la población.

Las estimaciones puntuales no son exactamente iguales a los parámetros poblacionales

correspondientes, por lo que se tiene un error de muestreo que es el valor absoluto de la

diferencia entre una estimación puntual insesgada y el parámetro poblacional

correspondiente, es decir, es la diferencia entre la estimación puntual y el parámetro

poblacional, cuando el estimador puntual es insesgado. Para una media muestral, la

desviación estándar y la proporción muestrales, los errores de muestreo son │ -

µ│, │ s - σ│ y │ - p│

8

Page 9: 7 Muestreo y distribuciones muestrales

En una aplicación real de muestreo no se puede calcular de manera exacta el error de

muestreo porque no se conocerá el valor del parámetro poblacional.

7.4 Introducción a las distribuciones muestrales

Ahora suponga que el proceso de seleccionar una muestra aleatoria simple de 30 administradores se repite una y otra vez y que cada vez que se calculan los valores de

y de .

Si el proceso de seleccionar una muestra aleatoria simple se considera como un

experimento, la media muestral tiene una media o valor esperado, una desviación

estándar y una distribución de probabilidad. Como los distintos valores que toma son resultados de distintas muestras aleatorias simples, a la distribución de probabilidad

de se le conoce como distribución muestral de . Conocer esta distribución muestral y sus propiedades permitirá hacer declaraciones de probabilidad de que tan

cerca está la media muestral de la media poblacional

Como ocurre con , es una variable aleatoria. Si se tomara cada muestra posible

de tamaño de 30 y para cada muestra se calculara el valor de , la distribución de

probabilidad que se obtuviera sería la distribución muestra de

7.5. Distribuciones muestrales de Uno de los estadísticos más comunes es usar la media de la muestra para hacer

inferencias acerca de una media de la población µ. El siguiente diagrama muestra el

proceso:

9

Page 10: 7 Muestreo y distribuciones muestrales

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para administración y economía. 10ª edición, México, CENGAGE Learning. P. 256

En cada repetición del proceso se puede anticipar la obtención de un valor distinto de la

media de la muestra . Entonces tenemos que la distribución muestral de

es la distribución de probabilidad de todos los valores posibles de la media de la

muestra se llama distribución muestral de la media de la muestra .

A continuación se describen las propiedades de la distribución muestral de : valor

esperado o media de , desviación estándar y la forma de distribución.

Valor esperado de

Distintas muestras aleatorias simples dan como resultado varios valores de la media de

la muestra . El valor esperado de es la media de todos los valores

posibles de que se pueden generar mediante las diversas muestras aleatorias simples.

Valor esperado de

E( ) = µ

donde

E( ) = valor esperado de

µ = media de la población

Con muestreo aleatorio simple, el valor esperado o media de es igual a la media

10

Page 11: 7 Muestreo y distribuciones muestrales

de la población. Por ejemplo, el sueldo anual promedio de la población de gerentes es µ

51 800 dólares, entonces, la media de todas las posibles medias de la muestra son 51

8000 dólares.

Desviación estándar

Para la desviación estándar de la distribución normal de se usa la siguiente

notación:

= desviación estándar de la distribución muestral de

σ = desviación estándar de la población

n= tamaño de la muestra

N = tamaño de la población

Con muestreo aleatorio simple, la desviación estándar de depende de si la

población es finita o infinita. Las ecuaciones de la desviación estándar son:

Desviación estándar de

Población finita

= N-n σ N -1 √n

Población infinita

= σ √n

La población finita requiere un factor de corrección para la población finita que es √(N-

n)/ (N-1). Cuando la población es grande y el tamaño de la muestra pequeño el factor de

corrección del a población finita es cercano a 1.

Una regla general para calcular la desviación estándar de es usar la ecuación:

= σ √n

siempre que

1. La población sea infinita

2. La población sea finita y también el tamaño de la muestra sea menor o igual

que el 5% del tamaño de la población, n/N≤ 0.05

11

Page 12: 7 Muestreo y distribuciones muestrales

Para poblaciones finitas que contengan casos en que n/N > 0.05 se debe usar la ecuación

para Población finita.

Teorema del límite central

El paso final para identificar las características de la distribución muestral de es

determinar la forma de la distribución de probabilidad de .

Cuando no es conocida la distribución de la población se recurre al Teorema del límite

central, el cual señala que al seleccionar muestras aleatorias simples de tamaño n de una

población, la distribución muestral de la media muestral se puede aproximar con

una distribución de probabilidad normal, cuando el tamaño de la muestra es grande.

La distribución muestral de se puede aproximar mediante una distribución de

probabilidad normal siempre que el tamaño de la muestra sea grande. Se puede suponer

que la condición de muestra grande se cumple para muestras aleatorias simples de

tamaño 30 o mayor.

Cuando en casos de muestreo se supone que la población tiene distribución normal, la

distribución muestral de tiene una distribución de probabilidad normal para

cualquier tamaño de la muestra.

La importancia del teorema se debe a que la media de una muestra aleatoria

procedente de cualquier distribución con varianza finita σ2 y media µ, se distribuye

aproximadamente como una variante normal de media µ y varianza σ2/n.3

Valor práctico de la distribución muestral de

La razón práctica de que interese la distribución muestral de es que se puede usar

para determinar información probabilística acerca del tamaño del error muestral.

Tomando el ejemplo de los gerentes de la empresa, si se quiere saber la probabilidad de

que la media de la muestra que se obtenga de una muestra aleatoria simple de 30

gerentes esté dentro del intervalo de 500 dólares alrededor de la media poblacional. Si

se quiere saber sobre la probabilidad de que la media de la muestra esté entre 51300 y

52 300 dólares y si el valor de la media de la muestra de está en este intervalo, se

aproximará a 500 dólares de la media de la población. Para obtener esta información se

3 Mood, Alexander y Franklin Graybill, “Muestreo”, en Introducción a la teoría de la estadística, España, Aguilar s a ediciones, 1978, p. 172.

12

Page 13: 7 Muestreo y distribuciones muestrales

recurre a la siguiente formula

Z = x -µ σ

Figura 7.7 Probabilidad de que una media muestral quede a 500 dólares o menos de la

media poblacional

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para administración y economía. 10ª edición, México, CENGAGE Learning, pp. 275.

Relación entre el tamaño de la muestra y la distribución muestral de

Para la relación entre el tamaño de la muestra y la distribución muestral de ,

observe primero que E( ) = µ independientemente del tamaño de la muestra. La

media de todos los valores posibles de es igual a la media de la población, µ,

independientemente del tamaño de la muestra n. También se puede apreciar que el error

estándar de la media = σ /√n está relacionado con la raíz cuadrada del tamaño

de la muestra. Siempre que aumente el tamaño de la muestra disminuye el error estándar

de la media . Por ejemplo:

Figura 7.8 Comparación de las distribuciones muestrales de para muestras aleatorias simples de n =30 y n =100 Gerentes de EAI.

13

Page 14: 7 Muestreo y distribuciones muestrales

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para administración y economía. 10ª edición, México, CENGAGE Learning, p. 262.

7.6 Distribución muestral de

La proporción muestral es el estimador puntual de la proporción poblacional . la fórmula para calcular la proporción muestral es:

La proporción muestral de es una variable aleatoria y su distribución de probabilidad

se conoce como distribución muestral de .

La distribución muestral de es la distribución de probabilidad de todos los posibles

valores de la proporción muestral de .

Para determinar qué tan cerca está la proporción muestral de de la proporción

poblacional , se necesita entender las propiedades de la distribución muestral de ;

el valor esperado de , la desviación estándar de y la forma de la distribución

muestral de .

14

Page 15: 7 Muestreo y distribuciones muestrales

Valor esperado de

El valor esperado de , la media de todos los posibles valores de , es igual a la

proporción poblacional de .

Desviación estándar de

Como en el caso de la desviación estándar de la desviación estándar de obedece a si la población es finita o infinita. Las dos fórmulas para calcular la desviación

estándar de son:

Como en el caso de la media poblacional , la diferencia entre las expresiones para una población finita y para una infinita es despreciable si el tamaño de la población finita es grande en comparación con el tamaño de la muestra.

Es decir, si la población es finita y se usara .

Pero si la población es finita y entonces se deberá de usar el factor de coerción para una probabilidad finita. También, a menos que se especifique otra cosa, en este libro se supondrá que el tamaño de la población es grande en comparación al tamaño de la muestra y por tanto, el factor de coerción para una población finita no será necesario.

15

Page 16: 7 Muestreo y distribuciones muestrales

En el caso de proporciones se usa el error estándar de la proporción para referirse a la

desviación estándar de .

Forma de la distribución muestral de

Ahora que se conoce la media y la desviación estándar de la distribución muestral de , el último paso es determinar la forma de la distribución muestral. La proporción

muestral es . En una muestra aleatoria simple de población grande, el valor de

es una variable aleatoria binomial que indica el número de los elementos de la

muestra que tiene la característica de interés. Como es una constante, la

probabilidad es la misma probabilidad de , lo cual significa que la distribución

muestral de también es una distribución de probabilidad discreta y que la

probabilidad de cada es la misma que la probabilidad de .

Una distribución binomial se aproxima mediante una distribución normal siempre que el tamaño de la muestra sea lo suficientemente grande para satisfacer las dos condiciones siguientes.

Suponiendo que satisfagan estas dos condiciones, la distribución de probabilidad de

en la proporción muestral, puede aproximarse por medio de una distribución

normal. Y como es una constante, la distribución muestral de también se aproxima mediante una distribución normal. Esta aproximación se formula como sigue:

La distribución muestral de se aproxima mediante una distribución normal siempre

que

El valor práctico de la distribución muestral de es que permite obtener información probabilística acerca de la diferencia entre proporción muestral y la proporción poblacional.

Par lograr este comparativo entre estos dos valores de probabilidad, es necesario hacer uso de lo que anteriormente estudiamos llamado valores de z, lo cuales se pueden calcular haciendo uso de la siguiente fórmula.

16

Page 17: 7 Muestreo y distribuciones muestrales

zi =xi − x

s

7.7 Propiedades de los estimadores puntualesPara utilizar algún estadístico de muestra como estimador puntual, se debe comprobar si

tiene ciertas propiedades asociadas con los buenos estimadores puntuales: insesgadez,

eficiencia y consistencia.

Debido a que pueden emplearse diversos estadísticos de muestra como estimadores puntuales

de distintos primeros poblacionales, se usa la siguiente notación:

θ = parámetro poblacional de interés (letra griega, theta)

θ4 = estadístico de muestra o estimador puntual de θ (theta con sombrero)

La letra θ representa cualquier parámetro de la población: media poblacional,

desviación estándar poblacional, proporción poblacional.

La theta con sombrero θ4 representa el estadístico de la muestra correspondiente como

la media de la muestra, la desviación estándar de la muestra y la proporción muestral.

Insesgadez El estimador insesgado del parámetro poblacional se da cuando el valor esperado del

estadístico de muestra es igual al parámetro poblacional que se estima.

El estadístico de muestra θ4 es un estimador insesgado del parámetro poblacional θ si

V︢E (θ4) = θ

donde E (θ4 ) = valor esperado del estadístico de muestra θ4

Por ejemplo, sea x1, x2… una muestra aleatoria de una densidad cuya media es µ. En tal

caso E( )=µ; asimismo, E(x1)= µ, por tanto y x1 son estimadores

insesgados de µ.4

Figura 7.13 Ejemplos de estimadores puntuales insesgado y sesgado

4 Ejemplo tomado de Spiegel, Murray et al. Teoría y problemas de Probabilidad y Estadística, Colombia, McGrawHill, 2003, p. 209.

17

Page 18: 7 Muestreo y distribuciones muestrales

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para administración y economía. 10ª edición, México, CENGAGE Learning, p. 272.

EficienciaSe habla de eficiencia relativa cuando en un estimador puntual tiene menor desviación

estándar. Si las distribuciones muestrales de dos estadísticos tienen la misma media, el

estadístico con la varianza menor es el estimador más eficiente de la media, por

ejemplo, para una población normal, la distribución normal de la media y la mediana

tiene la misma media de la población, sin embargo, la varianza de la distribución

muestral de medias es más pequeña que la varianza muestral de medianas, entonces, la

media provee un estimador más eficiente que la mediana.

Figura 7. 14 Distribuciones muestrales de dos estimadores puntuales insesgados

18

Page 19: 7 Muestreo y distribuciones muestrales

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para administración y economía. 10ª edición, México, CENGAGE Learning, p. 2723

En la figura se muestra que la desviación estándar de θ4 1 es menor que la θ4 2, los valores

de θ4 1 tienen mayor probabilidad de estar cerca del parámetro θ que los valores de θ4 2.

Consistencia Un estimador puntual es consistente si sus valores tienden a acercarse al parámetro de

población conforme se incrementa el tamaño de la muestra, es decir, el estimador es

mejor cuando se basa en una muestra de de 20 observaciones que si se basa en dos.

La condición de consistencia establece que para muestras grandes θ4 n tiende a

aproximarse a θ, es decir, un tamaño grande de muestra tiende a proporcionar un mejor

estimador puntual que un tamaño pequeño.

Por ejemplo, para la media muestral , se demuestra que su desviación estándar es

= σ /√n. Como se relaciona con el tamaño de muestra, de tal manera

que las muestras mayores dan valores de , se llega a la conclusión de que un

tamaño de muestra mayor tiende a producir estimaciones puntuales más cercanas a la

media de la población µ, entonces la media de la muestra es un estimador

consistente de la media de la población µ, lo mismo sucede con la proporción muestral

p.

19

Page 20: 7 Muestreo y distribuciones muestrales

7.8 Otros métodos de muestreo

Muestreo aleatorio estratificadoEn el muestreo aleatorio estratificado los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que pueden ser departamento, edad, tipo de industria, etc., está a discreción de la persona que diseña la muestra. Sin embargo, se obtienen mejores resultados cuando los elementos que forma un estrato son lo más parecidos posible.

Una vez formados los estratos, se toma una muestra aleatoria simple de cada estrato. Existen fórmulas para combinar los resultados de las muestras de los varios estratos en una estimación del parámetro poblacional de interés. El valor aleatorio estratificado depende de qué tan homogéneos sean los elementos dentro de cada estrato. Si los elementos de un estrato son homogéneos, el estrato tendrá una varianza pequeña. Por tanto, con muestras relativamente pequeñas de los estratos se obtienen buenas estimaciones de las características de los estratos. Si los estratos son homogéneos, el muestreo aleatorio estratificado, proporciona resultados tan precisos como los de un muestreo aleatorio simple, pero con una muestra de tamaño total menor.

Muestreo por conglomeradosEn el muestre o por conglomerados los elementos de la muestra primero se dividen en grupos separados, llamados conglomerados. Cada elemento de la población pertenece a uno y sólo a un conglomerado. Se toma una muestra aleatoria simple de los conglomerados. La muestra está formada por todos los elementos dentro de cada uno de los conglomerados que forman la muestra. El muestreo por conglomerados tiende a proporcionar mejores resultados cuando los elementos dentro de conglomerados no son semejantes. Lo ideal es que cada conglomerado sea una representación, a pequeña escala, de la población. Si todos los conglomerados son semejantes en este aspecto, tomando en la muestra un número pequeño de conglomerados se obtendrá una buena estimación de los parámetros poblacionales.

Una de las principales aplicaciones del muestreo por conglomerados es el muestreo de áreas en el que los conglomerados son las manzanas de una ciudad y otras áreas bien

20

Page 21: 7 Muestreo y distribuciones muestrales

definidas. El muestreo por conglomerados requiere, por lo general, tamaños de muestra mayores que los requeridos en el muestreo aleatorio simple o en el muestreo aleatorio estratificado.

Muestreo sistemáticoPara ciertos muestreos, en especial en aquellos con poblaciones grandes, se necesita mucho tiempo para tomar una muestra aleatoria simple. Una alternativa al muestreo aleatorio simple es el muestreo sistemático. Por ejemplo, si se quiere una muestra de tamaño de 50 de una población que tiene 500 elementos, se muestra uno de cada 5000/50= 100 elementos de la población, en este caso, un muestreo sistemático consiste en forma aleatoria uno de los primeros elementos de la lista de la población. Los otros elementos se identifican contando a partir del primer elemento de 100 elementos para tomar el elemento que tenga la posición 100 en la lista de la población, a partir de este elemento se cuentan otros 100 y así se continua.

Muestreo de convenienciaEl muestreo de conveniencia es una técnica de muestreo no probabilístico. Como el nombre lo indica, la muestra se determina por conveniencia. Los elementos se incluyen en la muestra sin que haya una probabilidad previamente especificada o conocida de que sean incluidos en la muestra. Por ejemplo, un profesor que realiza una investigación en una universidad puede usarse estudiantes voluntarios para que constituyan una muestra ¿la razón para elegirlos? Simple, los tienen al alcance y participarán como sujetos a un costo bajo o sin costo.

Muestreo subjetivoOtra técnica de muestreo no probabilístico es el muestreo subjetivo. En este método la persona que más sabe sobre un asunto selecciona elementos de la población que considera los más representativos de la población. Este método suele ser una manera relativamente fácil de seleccionar un muestra.

Referencias consultadas

Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para administración y economía. 10ª edición, México, CENGAGE Learning, pp. 241- 283.

Lohr, Sharon, Muestreo: Diseño y análisis, México, Internacional Thomson Editores, 2000. Trad. de Óscar Alfredo Palmas Velasco.

Mood, Alexander y Franklin Graybill, “Muestreo”, en Introducción a la teoría de la estadística, España, Aguilar s a ediciones, 1978, p. 172.

Spiegel, Murray et al. Teoría y problemas de Probabilidad y Estadística, Colombia, McGrawHill, 2003.

21