Tema 5. Muestreo y distribuciones...

21
1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribuci´ on de la media muestral: Esperanza y varianza. Distribuci´ on exacta en el caso normal. Distribuci´ on aproximada en el caso general (teorema central del l´ ımite). Distribuci´ on de la varianza muestral: Esperanza. Distribuci´ on en el caso normal. Estad´ ıstica I. Grado en Administraci´on de Empresas 08/09 Tema 5

Transcript of Tema 5. Muestreo y distribuciones...

Page 1: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

1

Tema 5. Muestreo y distribuciones muestrales

En este tema:

• Muestreo y muestras aleatorias simples.

• Distribucion de la media muestral:

• Esperanza y varianza.

• Distribucion exacta en el caso normal.

• Distribucion aproximada en el caso general (teorema central del lımite).

• Distribucion de la varianza muestral:

• Esperanza.

• Distribucion en el caso normal.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 2: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

2

Muestreo

Motivacion• En muchos casos se desea obtener informacion estadıstica sobre

poblaciones numerosas:

• Situacion laboral de las personas en edad de trabajar en Espana.

• Fiabilidad de un modelo de automovil en un ano.

• Precipitacion anual en la Comunidad de Madrid.

• Puede ser imposible (por falta de recursos) obtener la informacion relativaa todos los individuos.

• Se estudia una muestra significativa de la poblacion.

• Un subconjunto de la poblacion que permita obtener informacion fiablesobre el total de dicha poblacion.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 3: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

3

Muestras aleatorias simples

Como seleccionar una muestra

• Tamano reducido.

• Ausencia de sesgos.

• Conclusiones obtenidas de la muestra son validas para la poblacion.

• Facilidad en la definicion de la muestra.

• Mejor alternativa: Muestras aleatorias simples

• Cada miembro de la poblacion tiene la misma probabilidad de pertenecer ala muestra.

• La seleccion se realiza de manera independiente.

La seleccion de un individuo concreto no afecta a la probabilidad deseleccionar cualquiera de los otros.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 4: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

4

Procedimiento de inferencia• Partiendo de la distribucion de la variable aleatoria en la muestra• Obtener informacion sobre distribucion de la variable en la poblacion• Valores de interes: calculo de estadısticos para la media, varianza,

proporciones

Parámetros población, !

Parámetros muestra, l

!

!

Muestreo

Inferencia

0

3,75

7,50

11,25

15,00

DATOS POBLACIÓN

0

2,5

5,0

7,5

10,0

1,50,8

0,2

1,6

4,5

9,5

3,8

DATOS MUESTRA

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 5: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

5

Ejemplo de muestreo e inferencia

Ejemplo

Consideremos el ejemplo de la figura anterior:

• Poblacion compuesta por 24 individuos.

• Variable aleatoria de interes:

• Tiempo para completar una consulta medica.

• Valores:

Poblacion 5,1 1,0 0,9 3,8 10,2 2,1 9,5 4,51,0 2,2 1,5 4,8 1,6 8,8 4,3 1,09,0 5,1 0,2 2,3 0,8 7,8 7,7 1,5

• Promedio de la poblacion: 4, 0

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 6: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

6

Ejemplo de muestreo e inferencia

Muestra 1

• Muestra seleccionada en la figura, tamano 7:

Muestra 3,8 9,5 4,8 1,6 0,2 0,8 1,5

• Estadıstico de interes: promedio de la muestra 3, 1.

• Error (sesgo) relativo: (4, 0− 3, 1)/4, 0 = 0, 225.

Cambios en el muestreo

• Selecciones alternativas de los elementos de la muestra.

• Aumento del tamano de la muestra.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 7: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

7

Ejemplo de muestreo

Cambios en el tamano muestral

• Si a la muestra del ejemplo anterior le anadimos nuevos elementos, elpromedio muestral cambia.

• Se aproxima al valor de la media poblacional

0

1,5

3,0

4,5

6,0

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

4,04,24,0

4,34,34,44,44,14,24,4

4,64,6

4,14,0

3,63,9

3,33,1

CAMBIO EN EL PROMEDIO CON EL TAMAÑO MUESTRAL

Tamaño muestral

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 8: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

8

Ejemplo de muestreo

Seleccion de observaciones• Si seleccionamos las primeras 7 observaciones: 5,1 1,0 0,9 3,8 18,2 2,1 9,5.

• Promedio de la muestra: 5, 8.

Cambios para diferentes selecciones

• Todas las selecciones posibles de 7 observaciones (346.104 posibilidades):

0

5000

10000

15000

20000

25000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 9: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

9

Distribuciones en el muestreo

Distribucion de la media muestral

• Para todas las muestras de tamano 7 y 17 obtenemos:

0

5000

10000

15000

20000

25000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7

0

15000

30000

45000

60000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 17

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 10: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

10

Distribuciones en el muestreo

Distribucion de la varianza muestral

• Se obtienen resultados similares para otros estadısticos

• Para la desviacion tıpica de muestras de tamano 7 obtenemos:

0

7500

15000

22500

30000

0,5 0,7 0,9 1,1 1,2 1,4 1,6 1,8 1,9 2,1 2,3 2,5 2,6 2,8 3,0 3,2 3,3 3,5 3,7 3,9 4,0 4,2 4,4 4,6 4,7

DESVIACIONES TIPICAS MUESTRAS TAMAÑO 7

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 11: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

11

Distribuciones en el muestreo

Conclusiones

• Una muestra aleatoria simple de tamano n de una v.a. X es un conjuntode v.a. independientes, todas con la misma distribucion que X :

{Xi}ni=1 i.i.d.

• El valor del promedio muestral es una variable aleatoria (los estadısticosson variables aleatorias).

• Depende de la seleccion (aleatoria) de los individuos en la muestra:

• Distribucion muestral del estadıstico: distribucion de probabilidad del

valor de interes para todas las muestras del mismo tamano.

• La distribucion muestral cambia con el tamano de la muestra.

• La variabilidad de los estadısticos muestrales disminuye con el tamano dela muestra.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 12: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

12

La distribucion de la media muestral

El problema de interes

• La media poblacional es un parametro de gran interes en muchassituaciones practicas.

• Por ejemplo, queremos conocer el promedio de:

• los ingresos familiares en Espana el ano 2007.

• la proporcion de prestamos morosos el ultimo mes.

• el precio de compra de viviendas en la Comunidad de Madrid el pasadomes.

• A partir de una muestra (reducida) de valores queremos calcular:

• Una buena aproximacion al valor correcto (inevitablemente con error).

• Y una estimacion del error en la aproximacion.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 13: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

13

La distribucion de la media muestral

Ejemplo• Informacion sobre el gasto familiar en Espana

• Disponemos de los datos siguientes (gasto anual por hogar, EPF)

Gasto 32545,76 3140,24 25205,64 2474,28 10242,34 721,164855,80 7449,74 3466,50 4400,80 4740,00 10830,00

16240,88 9840,12 14534,96 14960,00

0

10000

20000

30000

40000

GASTO ANUAL

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 14: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

14

La distribucion de la media muestral

Algunas respuestas

• Muestra de tamano n, {Xi}ni=1, de una variable aleatoria X (gasto de hogares).

• Queremos estimar la media nacional (esperanza de X ) a partir de la muestra.

• Se define el estadıstico media muestral como

X =1

n

n∑i=1

Xi

LA MEDIA MUESTRAL ES UNA VARIABLE ALEATORIA

• El valor esperado de la media muestral es la media de la poblacion

E

[1

n

n∑i=1

Xi

]= E[X ]

• Estimamos la media de la poblacion a partir de la media de la muestra.

• En nuestro ejemplo: 10353,01 euros

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 15: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

15

La distribucion de la media muestral

Mas datos de la distribucion• Media de una muestra en general diferente de la media de la poblacion

• ¿Podemos conocer la magnitud del error que estamos cometiendo?

• Depende de la distribucion de la media muestral• En particular, de su variabilidad (desviacion respecto de la media)• ¿En cual de los casos siguientes tenemos menos error?

0

5000

10000

15000

20000

25000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

MEDIAS MUESTRA TAMAÑO 7 - MEDIA = 4,0

0

15000

30000

45000

60000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

MEDIAS MUESTRA TAMAÑO 17 - MEDIA = 4,0

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 16: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

16

Distribucion de la media muestral

La variabilidad de la media muestral

• La varianza de la media muestral, X , (una medida del error) es

Var[X ]def .= Var

[1

n

n∑i=1

Xi

]=

1

nσ2

• En el ejemplo anterior, Var[x ] = 76.458.643 y σ[x ] = 8.744 euros.

• El valor de la varianza decrece si n aumenta.

• Podemos reducir el error aumentando el tamano de la muestra.

• La reduccion en el error es lenta.

• Para reducir el error (medido por la desviacion tıpica) a la mitad debemosaumentar el tamano de la muestra 4 veces.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 17: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

17

Distribucion de la media muestral

La distribucion de la media muestral

• El valor de la varianza de la media muestral solo nos dice si el error puedeser grande o pequeno.

• Para obtener una respuesta mas precisa deberıamos conocer ladistribucion de la media muestral.

• Si la variable X tiene una distribucion normal, entonces

X =1

n

n∑i=1

Xi ∼ N(E[X ],√σ2/n)

(por ser combinacion lineal de v.a. indep. con dist. normal, ver Tema 4)

Luego,X − E[X ]√

σ2/n∼ N(0, 1)

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 18: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

18

Distribucion de la media muestral

El teorema central del lımite• Distribucion de la media muestral si X no es normal

• Si cumple ciertas condiciones: Teorema central del lımite (ver Tema 3)

Dada una muestra aleatoria simple {Xi}ni=1 de tamano n obtenida deuna variable aleatoria X con media E[X ] y varianza σ2 finitas, se cumpleque

1n

∑ni=1 Xi − E[X ]√

σ2/n→ N(0, 1)

cuando n→∞.

• La distribucion de la media muestral se parece a una distribucion normalpara muestras grandes.

• Aplicacion similar al caso anterior cuando se tienen muestras grandes.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 19: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

19

La distribucion de la varianza muestral

La varianza muestral

• En muchos casos es importante conocer el valor de la varianza de lapoblacion.

• Para aplicar el teorema central del lımite.

• Para estimar riesgos en inversiones (el riesgo depende de la varianza).

• Para estimar desigualdades en ingresos, rentas, etc.

• Se define el estadıstico varianza muestral como

X =1

n − 1

n∑i=1

(Xi − X )2

LA VARIANZA MUESTRAL ES UNA VARIABLE ALEATORIA

• Queremos relacionar su media y su varianza con las de la poblacion.

• Y si es posible, identificar su distribucion.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 20: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

20

La distribucion de la varianza muestral

La esperanza de la varianza muestral

• Si X denota la media muestral, se tiene que

E

[1

n

n∑i=1

(Xi − X )2

]=

n − 1

nσ2

• El valor esperado de esa v.a. no es la varianza de la poblacion.

• OJO: la varianza de la media muestral tampoco es la varianza de la poblacion.

• Por eso definimos la varianza muestral como

S2 =1

n − 1

n∑i=1

(Xi − X )2

dividiendo entre n − 1 y no entre n.

• Con esta definicion, tenemos E[S2] = σ2.

• El valor muestral de S2 (s2) se puede emplear como una aproximacion dela varianza de la poblacion.

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5

Page 21: Tema 5. Muestreo y distribuciones muestraleshalweb.uc3m.es/esp/Personal/personas/bmbarrag/esp/... · 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras

21

La distribucion de la varianza muestral

Distribucion de la varianza muestral• Nos gustarıa tener mas informacion sobre la distr. de la varianza muestral.

• La varianza muestral es no negativa.

• La distribucion de la varianza muestral es asimetrica a la derecha.

• Ademas, si la variable X tiene distribucion normal (ver Tema 3)

n − 1

σ2S2 =

1

σ2

n∑i=1

(Xi − X )2 ∼ χ2n−1

distribucion χ2 (chi-cuadrado) con n − 1 grados de libertad.DENSIDAD CHI CUADRADO

2,5% 2,5%95%

!!"#"!$ !!"#%&$

Funcion de distribucion enlas tablas

Estadıstica I. Grado en Administracion de Empresas 08/09 Tema 5