SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

25
GILBERTH PESANTES CALDERON MUESTREO Y DISTRIBUCIONES MUESTRALES

Transcript of SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Page 1: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

GILBERTH PESANTES CALDERON

MUESTREO Y DISTRIBUCIONES

MUESTRALES

Page 2: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

TIPOS DE MUESTREOA. MUESTREO PROBABILÍSTICO. Cuando cada unidad o elemento de la población tienen una determinada probabilidad de ser incluida en la muestra. Los principales muestreos de este tipo son:

A1. MUESTREO ALEATORIO SIMPLE (M.A.S.). Cuando todos y cada uno de los elementos de la población tienen igual probabilidad debe ser incluidos en la muestra.  Ventajas• Sencillo y de fácil comprensión• Cálculo rápido de las medias y varianzas Desventajas• Se requiere de antemano un listado completo de toda la población• Cuando se trabaja con muestras pequeñas es posible que no

represente a la población adecuadamente

Page 3: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

MUESTREO ESTRATIFICADOA2. MUESTREO ESTRATIFICADO. El procedimiento consiste en dividir a la población en grupos llamados Estratos. Dentro de cada estrato los elementos deber ser lo mas homogéneo posibles con respecto a las características de la(s) variable(s) en estudio. Los estratos deben ser homogéneos dentro de sí y heterogéneos entre ellos  Ventajas• Tiende a asegurar que la muestra represente adecuadamente a la

población en función de las variables seleccionadas• Se obtiene estimaciones mas precisas. Desventajas• Se ha de conocer la distribución en la población de las variables

utilizadas para la estratificación• Los análisis son complicados, en muchos casos la muestra tiene que

ponderarse (asignar pesos a cada elemento)   

Page 4: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

MUESTREO SITEMÁTICOA3. MUESTREO SISTEMÁTICO: (K=N/n). Es un procedimiento de selección por el cual el primer elemento de la muestra es elegida al azar entre las K primeras unidades poblacionales y luego el resto de las unidades se seleccionan cada K-ésima unidad o elemento de la población.  Ventajas• Rapidez y facilidad de selección de la muestra• No siempre es necesario tener un listado de toda la población• Cuando la población está ordenada siguiendo una tendencia conocida,

asegura una cobertura de unidades de toda la población• El error de muestreo suele ser menor que el M.A.S. e incluso que el del

estratificado. Desventajas• La posibilidad de aumento en la varianza si existe periodicidad en la

población. • En general sólo hay selección aleatoria para la primera unidad de la

muestra.

Page 5: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

MUESTREO POR CONGLOMERADOS

A4. MUESTREO POR CONGLOMERADOS. Es un sistema de muestreo en el que las unidades de análisis de la población se consideran conglomerados o unidades primarias. Se considera como unidad de muestreo al conglomerado y extraemos una muestra de conglomerados a partir del cual se estimará los parámetros poblacionales. El número de unidades elementales se denomina tamaño del conglomerado. Los conglomerados deben ser heterogéneos dentro de sí y homogéneos entre ellos.  Ventajas*Es muy eficiente cuando la población es muy grande y dispersa*Reduce costos.*No es necesario tener un listado de toda la población, solo de las unidades primarias.*Se puede utilizar como marco como áreas geográficas cuyas características ya están ya muy delimitas.  Desventajas*Menor precisión de las estimaciones*El Error estándar es mayor que el M.A.S. o sistemático*El cálculo del error estándar es complejo.

Page 6: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

MUESTREO NO PROBABILISTICO

B. MUESTREO NO PROBABILÍSTICO. Se basa en opinión (criterio o juicio) personal del investigador. Aquí se desconoce la probabilidad de las unidades seleccionadas y no se puede construir intervalos de confianza de los estimadores, solo sepuede hacer estimaciones puntuales. Los Muestreos no probabilsticos pueden ser:

B1.Muestreo a juicio, intencional u opinático.Donde los elementos se seleccionan a juicio o en opinión del investigador; se podría decir que prima la intención de que estas unidades sean incluidas dentro de la muestra.  B2. Muestreo por conveniencia. Se eligen los elementos que están más al alcance del investigador. • Muestreo voluntario. El informante, voluntariamente,

suministra información sin ser seleccionado. • Muestreo por cuota. Es un número de entrevistas ó cuotas

que se le fijan al encuestador para que a su vez seleccione los elementos en la forma que considere oportuno.

Page 7: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

ESTADISTICO Y SU DISTRIBUCION

Definición. Supongamos que se ha extraído una muestra aleatoria de una población y que se desea hacer inferencia sobre ciertas características de la distribución de la población. Esta inferencia se basará en algún ESTADÍSTICO MUESTRAL, es decir, en alguna función particular de la información muestral.

Definición. La distribución de un estadístico muestral recibe el nombre de DISTRIBUCION MUESTRAL O DISTRIBUCION EN EL MUESTREO y se define como la distribución de probabilidades de los valores que puede tomar el estadístico a lo largo de todas las posibles muestras con el mismo número de observaciones que pueden ser extraídas de la población.

Page 8: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

DISTRIBUCION MUESTRAL DE LA MEDIA

Supongamos que la población en donde se hace el muestreo es finita de tamaño N.• Cuando el muestreo se hace con reemplazo, entonces:

• La media de la distribución muestral es igual a la media de la población en que se toma la muestra, es decir,

• La varianza de la distribución muestral es igual a la varianza de la población dividida por el tamaño de la muestra, es decir,

X X

X

2

X

22

X n

Page 9: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

• Cuando el muestreo se hace sin reemplazo, entonces:• La media de la distribución muestral es igual a la media

de la población en que se toma la muestra, es decir,

• La varianza de la distribución muestral es igual a2

2

1X

N n

n N

Ejemplo. Supongamos una población de tamaño 3 con valores 0, 2 y 4, se eligen muestras de tamaño 2.a. Si el muestreo se hace con reemplazo.b. Si el muestreo es sin reemplazo.

Page 10: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

y cuando la población es normal con conocida. X 2

X 2

X Población finita Población infinita

Muestreo con reemplazo

Muestreo sin

reemplazo

22

X n

2

2

X n

22

1X

N n

n N

22

X n

Page 11: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

El caso para muestras grandes

En este caso, denominaremos la forma de la distribución muestral de la media muestral suponiendo que se cumple alguna de tres condiciones:• La población es normal con varianza conocida.• La población es normal con varianza desconocida y el

tamaño de la muestra es grande.• La forma de la población es desconocida (o no normal), su

varianza es conocida o desconocida y el tamaño de la muestra es grande.

Page 12: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Definición. Sea la media de una muestra aleatoria de tamaño «n» tomada de una población con media y varianza . Supongamos que se cumple alguna de las siguientes condiciones:

a. La población es normal y la varianza es conocida (no importa el tamaño de n).

b. La población es normal, con varianza desconocida y n=>30.

c. La forma de la población es desconocida (o no normal), la varianza es conocida o desconocida y n=>30.

Entonces la v.a. tendrá una distribución normal con media 0 y varianza 1.

X 2 0

X

X

XZ

Page 13: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Ejemplo. Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las corporaciones medianas se distribuyen siguiendo una normal con media 12.2% y desviación típica 3.6%. Si se toma una muestra aleatoria de nueve observaciones de esta población según los incrementos porcentuales de salario. ¿Cuál es la probabilidad de que la media muestral sea mayor del 10%?

¿Qué este entre un 9% y 11%?

Page 14: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Distribución muestral de la media muestral para muestras pequeñas

Definición. Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces, la distribución muestral de la media muestral es la t de Student con n-1 grados de libertad. X

X

X

Xt

Ejemplo. Suponga que una población normal con media 20 se toma una muestra de tamaño 16. Si la desviación estándar muestral es 4, encuentre la probabilidad de que la media muestral sea estrictamente mayor que 21,753.

Page 15: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Distribución muestral de una proporción

Definición. Sea X el número de éxitos en una muestra binomial de n observaciones, donde la probabilidad de éxito es p. Entonces, la proporción de éxitos en la muestra recibe el nombre de PROPORCION MUESTRAL.

xp

n

Media y varianza de proporciones muestrales

1E X np y V X np p

22

1

11

p

xE p E E X p

n n

p pxV p V V X

n n n

Con esto obtenemos que:

Page 16: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Si el número N de individuos en la población no es demasiado grande, comparado con el número de individuos de la muestra, será necesaria una CORRECCION POR POBLACION FINITA en la expresión de la varianza de la proporción muestral. La varianza será entonces:

2 1

1p

p pN n

N n

Sea la proporción de éxitos en una muestra aleatoria de n observaciones. Si se cumple alguna de las dos condiciones siguientes:• n=>30 o• Np=>5 y n(1-p)=>5.Entonces la distribución muestral de la proporción se puede aproximar a una distribución normal.

p

p

p

p

pZ

Page 17: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Ejemplo. Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas de este tipo cuya instalación eléctrica resulta insegura. Supongamos que, de hecho, el 30% de los edificios de esta población tiene una instalación insegura. ¿Cuál es la probabilidad de que la proporción de edificios de la muestra con instalación insegura se encuentre entre 0,25 y 0,35?

Page 18: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Distribución muestral de la diferenciade dos proporciones

1 21 2 1 2

1 1 2 21 2 1 2

1 2

1 21 2

1 1 2 2

1 2

1 1

1 1

E p p E p E p p p

p p p pV p p V p V p

n n

p p p pZ

p p p p

n n

Ejemplo. Los hombres y mujeres adultos radicados en una ciudad grande de cierto país difieren en sus opiniones sobre el establecimiento de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que solo el 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres, su opinión al respecto, determine la probabilidad de que el porcentaje de los hombres a favor sea al menos 3% mayor que el de mujeres.

Page 19: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Distribución muestral de diferencia de medias

Datos pareados (muestras dependientes)

Estadístico Media Varianza

D X Y 1 2D 2

2 dD

s

n

D

D

Dt

Ejemplo. La tabla siguiente una muestra aleatorirecoge los datos de consumo de gasolina correspondientes aa de 8 automóviles americanos de dos modelos diferentes. Se formaron pares con las dos muestras y cada elemento de un determinado par fue conducido por la misma ruta y por el mismo piloto:

xi (auto A) 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4

yi (auto B) 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2

a. Determine la media y la desviación muestral de las diferencias en el consumo.b. Suponiendo que la distribución de las diferencias poblacionales es normal con

media -0,807, encuentre la probabilidad de que el consumo promedio de gasolina del auto A sea mayor que el del auto B.

Page 20: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Muestras Independientes

Primer Caso. Varianza poblacionales conocidas o desconocidas y muestras grandes.

1 2 1 2 1 2

2 21 2

1 2 1 21 2

1 2 1 2

2 21 2

1 2

E X X E X E X

V X X V X V Xn n

X XZ

n n

Ejemplo. Para comparar los pesos promedios de niños y niñas del sexto grado en una escuela de instrucción media, se usará una muestra aleatoria de 20 niños y otra igual de 25 niñas. Se sabe que, en niños y niñas, los pesos siguen una distribución normal. En concreto, el promedio de los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14,142, mientras que el promedio de los pesos de todas las niñas es de 85 libras y su desviación es de 12,247. Encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las niñas.

Page 21: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Segundo caso: varianzas poblacionales desconocidas, iguales y muestras pequeñas.

1 2 1 2

1 22 2

1 2

2 21 1 2 22

1 2

; 2 .

1 1

2

X Xt con n n grados de libertad

s sn n

n s n ss

n n

Ejemplo. Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de respuesta de las ratas a determinado estímulo, se están comparando en un experimento de laboratorio. El experimentador sabe que en las respectivas poblaciones los tiempos de respuesta al estímulo están distribuidos normalmente. Se administra la droga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento, la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga A es 30,45 milisegundos con una desviación de 5. Los datos correspondientes a la droga B son 24,9 y 6. ¿Cuál es la probabilidad de que la diferencia entre la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga A y la de las ratas que están recibiendo la droga B sea menor o igual a la observada en el experimente?

Page 22: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Tercer caso: varianzas poblacionales desconocidas, diferentes y muestras pequeñas.

22 2

1 2

1 2 1 2 1 22 22 2 2 2

1 2 1 2

1 2 1 2

1 21 1

s sX X n n

t vs s s sn n n n

n n

Ejemplo. Retomemos el ejemplo anterior, pero suponiendo que las poblaciones tienen distribución normal, que los tamaños muestrales son menores que 30 (12 y 13) y que las varianzas poblacionales son diferentes.

Page 23: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Distribución muestral de la varianza y razón de varianzas

Distribución muestral de la varianza muestral. Si es la varianza de una muestra aleatoria de tamaño «n» de una población, distribuida normalmente con media y varianza , entonces, la distribución muestral de es una distribución con n – 1 grados de libertad.

2s 2

2

2

1n s

2

2

22

1; 1 .

n scon n grados de libertad

Ejemplo. Cuando un proceso de producción está funcionando correctamente, la resistencia en ohmios de los componentes que produce sigue una distribución normal con desviación típica de 3,6. Si toma una muestra aleatoria de cuatro componentes, ¿Cuál es la probabilidad de que la varianza muestral sea mayor que 27?

Page 24: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES

Distribución muestral de la razón de dos varianzas.Si y son las varianzas de varianzas de muestras aleatorias independientes de tamaño y tomadas de poblaciones normales con varianzas y respectivamente, entonces la variable aleatoria.

21s

22s

21 2

21n 2n

2121

1 1 2 22222

; 1 1 .

s

F F de Fisher con v n y v n grados de libertads

Ejemplo. En una prueba sobre la efectividad de dos tipos de píldoras para dormir, A y B, se utilizarán dos grupos independientes de personas con insomnio. A un grupo de tamaño 61se le administrará la píldora A y al otro grupo, de tamaño 41, se le administrará la B, registrándose el número de horas de sueño de cada individuo participante en el estudio. Suponiendo que el número de horas de sueño de quienes usan cada tipo de píldora se distribuye normalmente y que las varianzas son iguales, calcule la probabilidad de que la razón de las varianzas muestrales de A y B sea mayor que 1,64.

Page 25: SESION 03 :MUESTREO Y DISTRIBUCIONES MUESTRALES