LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

25
LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo

Transcript of LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Page 1: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

LABORATORIOSesión 1

Distribuciones en la población y en el muestreo

Page 2: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

• DIRECCIÓN DE LA PÁGINA WEB DEL LABORATORIO DE ESTADISTICA www.cec.uchile.cl/~ma34blab

• El test de la sesión 1 y el Programa de ejecución (*.xls), deben ser bajados de la página

Page 3: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

OBJETIVOSEstudiar a través de simulaciones:

• La variabilidad de la estimación de un parámetro debido al muestreo, usando el error estándar (cuadrático medio), gráficos e intervalos.

• La influencia del tamaño de la muestra sobre la variabilidad de la estimación.

• La influencia del tamaño de la población sobre la variabilidad de la estimación.

• La influencia de la varianza en la población sobre la variabilidad de la estimación.

Page 4: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Muestreo en una Población Finita para Estimar una

Proporción• Si conocemos totalmente la población, se puede

definir totalmente la distribución del porcentaje observado (porcentaje estimado) en las muestras de una tamaño dado.

• En particular se conoce la expresión exacta de la media y de la desviación estándar (llamado error estándar o en SAMPLING “error cuadrático medio”) del porcentaje observado en la muestra

Page 5: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

DISTRIBUCION DE BERNOULLI

En la población:

)1()( ,)(

1)0( ,)1(

}{0,1X ),(

ppXVarpXE

pXPpXP

pBernoulliX

Page 6: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

DISTRIBUCION DE BERNOULLI

• En el muestreo: M.a.s. sin reemplazo de tamaño n obtenida de

una población de tamaño M:

1

)1()( )(

1

M

nM

n

ppXVarpXEX

nX nn

iin

M

n1

n

)p1(pestandar Error

Page 7: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

EN LAS SIMULACIONES

• En la muestra k se obtiene:

– la proporción estimada

– el error de estimación (muestral)

• De la repetición de L muestras se obtiene:

– el error promedio

– el error estándar o cuadrático medio

Page 8: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

CONVERGENCIA

• Si se hacen todas las muestras posibles de tamaño n

)1()1(

)(1

y 0 1 2

)()( M

n

n

ppee

Le

Le

kk

kk

• Si se repiten muchas muestras de tamaño n

0 1

L)( k

keLe

)1()1(

)(1

2

)( M

n

n

ppee

L Lk

k

Page 9: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

SIMULACIONES

• Se hace usando un programa desarrollado para este efecto:

Sesion1.xls

• en el cual se puede cambiar

– El tamaño de la población: M– El porcentaje en la población: 100p– El tamaño de las muestras: n– El número de muestras simuladas: L

Page 10: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Parámetros de la simulación

Tamaño de la población ..............................................900

Frecuencia del atributo en la población ……450 (50.00%)

Tamaño de la muestra ................................................100

Para elegir un parámetro, presione [PgUp] o [PgDn] Para modificar el parámetro elegido, presione [ ] [ ]

Para iniciar la simulación, presione [Enter]

Para abandonar la simulación, presione [Esc]

Page 11: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Primera Actividad• Comprender los resultados presentados en el programa

de simulación Sesion1.xls

• El programa ejecutado toma una muestra de tamaño n (n=100) y estima la proporción de fumadores a partir de lo obtenido en la muestra. La repetición de este experimento permite obtener una mejor estimación.

• Observe: Al costado derecho encontrará un esquema de la población, en el cual se indica los fumadores (rojo), no fumadores (verde). En cada muestreo el programa tomará n individuos de esa población estimará la población de fumadores (ver gráfico) y entregará el error asociado

)1(e

Page 12: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Se saca una segunda muestra y se obtiene:

El porcentaje de fumadores de la segunda muestra Se agrega en el histograma el porcentaje de la segunda muestra Diferencia entre el segundo porcentaje muestral y el porcentaje verdadero de la población

El error promedio

El error cuadrático medio (Error Estándar) para las 2 muestras

Número y porcentaje de los 2 casos con |error| < 1% |error| < 5% |error| < 2% |error| < 10%

)ee(2

1e )2()1(

])ee()ee([2

1 2)2(

2)1(

Page 13: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Se sacan muchas muestras (con la tecla F2 o F3) y pare (con F1)

Anote el número de experimentos hechos (>400 por ejemplo)

Observe

El histograma El error promedio (ANÓTELO) El error cuadrático medio (Error Estándar) de todas las muestras

Número y porcentaje de los casos con |error| < 1% |error| < 2% |error| < 5% |error| < 10%

e

Page 14: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

RESPONDE LA PREGUNTA

1

Page 15: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

ERROR CUADRÁTICO MEDIO TÉORICO (%)

M: Tamaño de la población

n: Tamaño de la muestra

p: Proporción en la población

100p: Porcentaje la población

M

n

n

pp1

)1(*100

Page 16: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

ERROR CUADRÁTICO MEDIO TÉORICO (%)

Si hiciera todas las muestras posibles

M = 900, n =100, p = 0.5

7166.41

)1(*100

M

nM

n

pp

Page 17: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Interpretamos:

Si tenemos 400 repeticiones de muestras y encontramos

|error| < 5% en 280 casos (70%)

Significa que se encontró 70% de las muestras con un porcentaje observado f con un error menor que 5% con respecto del valor real 100p.

Se deduce de esta forma un intervalo tal que:

Prob (f observada en [100p-5,100p+5]) = 0.70

Page 18: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

RESPONDE LA PREGUNTA

2

Page 19: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Segunda Actividad

Salga del programa (Esc) y entre de nuevo

Mantenga el tamaño de la población: 900 Cambie el tamaño de la muestra: 200 Repita lo anterior con el mismo número de repeticiones Observe el histograma

Anote el error cuadrático medio y compare con el anterior. Concluya.Anote el número y porcentaje de los casos con |error| < 1% |error| < 2% |error| < 5% |error| < 10%

Page 20: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

RESPONDE LA PREGUNTA

3

Page 21: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Tercera Actividad

Salga del programa (Esc) y entre de nuevo

Cambie el tamaño de la población: 1300 Mantenga el tamaño de la muestra: 100 Repite lo anterior con el mismo número de repeticiones Observe el histograma

Anote el error cuadrático medio y compare con el anterior. Concluya.Anote el número y porcentaje de los casos con: |error| < 1% |error| < 2% |error| < 5% |error| < 10%

Page 22: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

RESPONDE LA PREGUNTA

4

Page 23: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Cuarta ActividadSalga del programa (Esc) y entre de nuevo

Mantenga el tamaño de la población: 900 Cambie la frecuencia del atributo en la población: por ejemplo 630

(p=0.7) Mantenga el tamaño de la muestra: 100 Repita lo anterior con el mismo número de repeticiones

Observe el histograma

Anote el error cuadrático medio y compare con el anterior. Concluya.Anote el número y porcentaje de los casos con: |error| < 1% |error| < 2% |error| < 5% |error| < 10%

Page 24: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

RESPONDE LA PREGUNTA

5

Page 25: LABORATORIO Sesión 1 Distribuciones en la población y en el muestreo.

Envíe su trabajo a : [email protected]

No olvide ponerle nombre y guardar su archivo con su login (e.g. ajulio.doc)