DISTRIBUCIÓN DE ESTADÍSTICOS...

Post on 14-Oct-2018

216 views 0 download

Transcript of DISTRIBUCIÓN DE ESTADÍSTICOS...

Ensayo de Rendimiento

DISTRIBUCIÓN DE

ESTADÍSTICOS MUESTRALES

Objetivo: conocer propiedades de una población a partir de una muestra

Muestreo

Propiedades Parámetros

Los estadísticos muestrales sirven como estimación (aproximación) de los

parámetros

Muestreo

Los parámetros son constantes

Los estadísticos son variables aleatorias y poseen distribución

asociada

Distribución de estadísticos muestrales: objetivos

• Comprender la naturaleza aleatoria de los estadísticos muestrales.

• Estudiar las propiedades estadísticas de la media y la varianza muestrales.

• Adquirir destrezas en el cálculo de probabilidades asociadas a estos estadísticos.

Distribución de estadísticos muestrales

Las distribuciones de los estadísticos muestrales se estudian suponiendo poblaciones de tamaño infinito.

Distribución de los estadísticos muestrales

Muestreo aleatorio con reposición: las unidades seleccionadas pueden repetirse dentro de la muestra y entre muestras.

Muestreo aleatorio sin reposición: las unidades seleccionadas no se repiten dentro de la muestra y entre muestras.

Distribución del estadístico media muestral: ejemplo

Se tiene una población (finita) de cuatro plantas de zapallos (N=4), donde la característica de interés es el número de zapallos por planta.

Se realizará un muestreo aleatorio simple con reposición, para muestras de tamaño 2.

Objetivo: estudiar la distribución de la media muestral.

Distribución del estadístico media muestral

Planta X = Nº de

frutos

f(xi)

P1 3 1/4

P2 2 1/4

P3 1 1/4

P4 4 1/4

1 2 3 4 Número de frutos

0.00

0.25

0.50

f(x)

Función de densidad del número de frutos en una población de 4 plantas de zapallo.

Distribución del estadístico media muestral

( )i iifx x

1 1 1 1 1 2 3 41 2 3 4 2.5

4 4 4 4 4

La esperanza será:

Distribución del estadístico media muestral

2

2 ( )i iix f x

2 2 22

2

1 1 11 2.5 2 2.5 3 2.5

4 4 4

14 2.5 1.25

4 = +

La varianza será:

Distribución del estadístico media muestral

Tomando muestras de dos plantas con reposición, hay N2 muestras posibles para extraer, esto es 42=16 muestras.

Distribución del estadístico media muestral

Muestra Plantas Nro. de

frutos

Media

muestral

Muestra Plantas Nro. de

frutos

Media

muestral

1 P1P1 3; 3 3.0 9 P3P1 1; 3 2.0

2 P1P2 3; 2 2.5 10 P3P2 1; 2 1.5

3 P1P3 3; 1 2.0 11 P3P3 1; 1 1.0

4 P1P4 3; 4 3.5 12 P3P4 1; 4 2.5

5 P2 P1 2; 3 2.5 13 P4P1 4; 3 3.5

6 P2 P2 2; 2 2.0 14 P4P2 4; 2 3.0

7 P2 P3 2; 1 1.5 15 P4P3 4; 1 2.5

8 P2 P4 2; 4 3.0 16 P4P4 4; 4 4.0

Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo.

Distribución del estadístico media muestral

Valores que asume la variable aleatoria “media muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.

Media Muestral

1,0 1.(1/16) = 0,0625

1,5 2.(1/16) = 0,1250

2,0 3.(1/16) = 0,1875

2,5 4.(1/16) = 0,2500

3,0 3.(1/16) = 0,1875

3,5 2.(1/16) = 0,1250

4,0 1.(1/16) = 0,0625

Distribución del estadístico media muestral

1.0 1.5 2.0 2.5 3.0 3.5 4.0

Medias muestrales

0.05

0.10

0.15

0.20

0.25

f(x)

Función de densidad de la variable aleatoria media muestral del número de frutos.

Distribución del estadístico media muestral

2.5x

2

2 1.250.625

2x

n

22

xEE

n

Error Estándar Error Estándar

Distribución del estadístico media muestral

Si se hubieran utilizado muestras de mayor tamaño, se vería que la función de densidad se aproxima más aún a la gráfica de una densidad normal, con idéntica esperanza y varianza inversamente proporcional al tamaño muestral.

Este comportamiento no es casual sino la consecuencia de un importantísimo resultado que se resume en el siguiente teorema: 1.0 1.5 2.0 2.5 3.0 3.5 4.0

Medias muestrales

0.05

0.10

0.15

0.20

0.25

f(x)

Sea X una variable aleatoria con esperanza µ y varianza finita 2. Sea la media muestral de una muestra aleatoria de tamaño n y Z la variable aleatoria definida como:

XZ

n

Teorema Central del Límite

entonces, la distribución de Z se aproxima a la distribución normal estándar cuando n se aproxima a infinito.

Ejemplo de un muestreo aleatorio sin reposición desde una población finita

Rendimientos de un híbrido de maíz (N=15)

99.04 94.98 101.52

95.74 96.42 85.44

102.64 111.75 112.86

107.66 103.49 104.93

104.48 101.24 104.31

= 101.77 2 = 44.67 Sin reposición

Muestreo

Muestreo: todas las muestras posibles de tamaño n

Estadísticos: media y varianza muestrales

Distribución de las medias de muestras con n=2

89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00

Media (n=2)

0.00

0.09

0.19

0.28

0.37fr

ecu

en

cia

re

lativaAjuste: Normal(101.766,20.940)

Distribución de las medias de muestras con n=3

90.8993.22

95.5697.90

100.24102.57

104.91107.25

109.59111.92

Media (n=3)

0.00

0.06

0.13

0.19

0.26fr

ecu

en

cia

re

lativa

Ajuste: Normal(101.766,12.792)

Distribución de las medias de muestras con n=5

89.091.0

93.095.0

97.099.0

101.0103.0

105.0107.0

109.0111.0

113.0

Media (n=5)

0.00

0.05

0.10

0.15

0.20fr

ecu

en

cia

re

lativa

Ajuste: Normal(101.766,6.384)

Distribución de las medias de muestras con n=8

89.0092.43

95.8699.29

102.71106.14

109.57113.00

Media (n=8)

0.00

0.04

0.09

0.13

0.18fr

ecu

en

cia

re

lativaAjuste: Normal (101.766, 2.792)

Distribución del estadístico media muestral

Cuando se hace un muestreo aleatorio sin reposición desde una población finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son:

x

2

2

1x

n

N n

N

Corrección por finitud

En síntesis:

2

2

1

44.67 15 2

2 15 12 101.766 20.94

x x

N n

n N

n

2

2

1

44.67 15 3

3 15 13 101.766 12.76

x x

N n

n N

n

2

2

1

44.67 15 5

5 15 15 101.766 6.38

x x

N n

n N

n

2

2

1

44.67 15 8

8 15 18 101.766 2.76

x x

N n

n N

n

En síntesis:

90.8993.22

95.5697.90

100.24102.57

104.91107.25

109.59111.92

Media (n=3)

0.00

0.06

0.13

0.19

0.26

fre

cu

en

cia

re

lativa

Ajuste: Normal(101.766,12.792)

89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00

Media (n=2)

0.00

0.09

0.19

0.28

0.37

fre

cu

en

cia

re

lativa

Ajuste: Normal(101.766,20.940)

89.091.0

93.095.0

97.099.0

101.0103.0

105.0107.0

109.0111.0

113.0

Media (n=5)

0.00

0.05

0.10

0.15

0.20

fre

cu

en

cia

re

lativa

Ajuste: Normal(101.766,6.384)

89.0092.43

95.8699.29

102.71106.14

109.57113.00

Media (n=8)

0.00

0.04

0.09

0.13

0.18

fre

cu

en

cia

re

lativa

Ajuste: Normal (101.766, 2.792)

n=3 n=2

n=5 n=8

Conclusión

Cuando el tamaño de la muestra aumenta, la varianza de las medias disminuye

22

xEE

n

Error Estándar

Recordando…

Ejemplo

El diámetro de las tortas de girasol se distribuye normalmente con media 18 cm y desviación estándar de 6 cm.

En una muestra de 10 tortas, ¿cuál es la probabilidad de encontrar tortas con diámetro promedio inferior a 16 cm?

Ejemplo

16 18

16 1.05 0.14885 0.156

10

P X P Z P Z

¿Cuál es la probabilidad, en una muestra con n=10, de encontrar tortas con diámetro inferior a 16 cm. si la distribución del diámetro se aproxima a una N (18;36/10)?

0 4 7 11 14 18 21 25 28 32 3516

Ejemplo

Tabla de Cuantiles de la Distribución Normal

z área z área z área quantil z

-3.25 0.00058 -1.00 0.15866 1.25 0.89435 0.00001 -4.265

-3.20 0.00069 -0.95 0.17106 1.30 0.90320 0.0001 -3.719

-3.15 0.00082 -0.90 0.18406 1.35 0.91149 0.001 -3.090

-3.10 0.00097 -0.85 0.19766 1.40 0.91924 0.00 -2.576

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

-1.20 0.11507 1.05 0.85314 3.30 0.99952 0.995 2.576

-1.15 0.12507 1.10 0.86433 3.35 0.99960 0.999 3.090

-1.10 0.13567 1.15 0.87493 3.40 0.99966 0.9999 3.719

-1.05 0.14686 1.20 0.88493 3.45 0.99972 0.99999 4.265

Área: P(Zz)

Distribución del estadístico media muestral

1

n

XT

S

n

T

Observación: los grados de libertad de la T se corresponden con el tamaño de la muestra con la que se calculó S.

Cuando no se conoce la varianza poblacional:

Grados de

libertad

Distribución T de Student

-5 -4 -3 -2 -1 0 1 2 3 4 5

0.00

0.11

0.23

0.34

0.45D

ensid

ad

Dist. Normal

Dist. T

Ejemplo

Si la producción diaria de leche se aproxima a una distribución normal y se tiene la siguiente muestra de producciones diarias de leche (en litros):

67.9 69.3 70.0 74.8 75.3 69.6 67.3 65.8 70.5

¿Cuál es la probabilidad que una variable T, con los grados de libertad apropiados para este problema, exceda el valor de T obtenido a partir de los datos anteriores, si se supone que la producción promedio de leche en la población es de 67 litros?

Ejemplo

70.06 67

2.87 0.013.19

9

XP T P T P T

Sn

70.0556 lts.

S = 3.1887 lts.

n = 9

= 67 lts.

X

-5.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 5.0

Ejemplo

Tabla de Cuantiles de la Distribución T

0.700 0.725 0.750 0.775 0.800 0.825 0.850 0.875 0.900 0.925 0.950 0.975 0.990 0.995

1 0.727 0.854 1.000 1.171 1.376 1.632 1.963 2.414 3.078 4.165 6.314 12.71 31.82 63.66

2 0.617 0.713 0.816 0.931 1.061 1.210 1.386 1.604 1.886 2.282 2.920 4.303 6.965 9.925

. . . . . . . . . . . . . . .

8 0.546 0.624 0.706 0.794 0.889 0.993 1.108 1.240 1.397 1.592 1.860 2.306 2.896 3.355

9 0.543 0.621 0.703 0.790 0.883 0.986 1.100 1.230 1.383 1.574 1.833 2.262 2.821 3.250

10 0.542 0.619 0.700 0.786 0.879 0.980 1.093 1.221 1.372 1.559 1.812 2.228 2.764 3.169

11 0.540 0.617 0.697 0.783 0.876 0.976 1.088 1.214 1.363 1.548 1.796 2.201 2.718 3.106

. . . . . . . . . . . . . . .

49 0.528 0.602 0.680 0.762 0.849 0.944 1.048 1.164 1.299 1.462 1.677 2.010 2.405 2.680

50 0.528 0.602 0.679 0.761 0.849 0.943 1.047 1.164 1.299 1.462 1.676 2.009 2.403 2.678

0.300 0.275 0.250 0.225 0.200 0.175 0.150 0.125 0.100 0.075 0.050 0.025 0.010 0.005

Distribución asociada al estadístico varianza muestral

Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo.

Muestra Plantas Nº de

frutos

Varianza Muestra Plantas Nº de

frutos

Varianza

1 P1P1 3-3 0.0 9 P3P1 1-3 2.0

2 P1P2 3-2 0.5 10 P3P2 1-2 0.5

3 P1P3 3-1 2.0 11 P3P3 1-1 0.0

4 P1P4 3-4 0.5 12 P3P4 1-4 4.5

5 P2P1 2-3 0.5 13 P4P1 4-3 0.5

6 P2P2 2-2 0.0 14 P4P2 4-2 2.0

7 P2P3 2-1 0.5 15 P4P3 4-1 4.5

8 P2P4 2-4 2.0 16 P4P4 4-4 0.0

Distribución del estadístico varianza muestral

Valores que asume la variable aleatoria “varianza muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.

Varianza Muestral

0 4.(1/16) = 0.25

0.5 6.(1/16) = 0.375

2 4.(1/16) = 0.25

4.5 2.(1/16) = 0.125

22P S s

Distribución del estadístico varianza muestral

Función de densidad de la variable aleatoria varianza muestral del número de frutos.

0.00 1.50 3.00 4.50

S2

0.00

0.10

0.20

0.30

0.40

F(s2)

Distribución de las varianzas de muestras con n=3

0.028.1

56.284.3

112.4140.4

168.5196.6

224.7252.8

VarianzaC(n=3)

0.00

0.13

0.27

0.40

0.54

fre

cu

en

cia

re

lativa

Estadística descriptiva

Variable Media Var(n)

VarianzaC(n=3) 44.67 1977.49

Distribución de las varianzas de muestras con n=5

0.012.6

25.237.9

50.563.1

75.788.4

101.0113.6

126.2138.8

VarianzaC(n=5)

0.00

0.06

0.12

0.18

0.24

fre

cu

en

cia

re

lativa

Estadística descriptiva

Variable Media Var(n)

VarianzaC(n=5) 44.67 873.27

Para calcular probabilidades asociadas a varianzas muestrales se utiliza la distribución de la variable:

Distribución Ji-cuadrado (2)

2

2

2

1

( 1)

n

S n

Grados de

libertad

Distribución Ji-cuadrado

0 4 8 11 15

0.00

0.12

0.24

0.36

0.48D

en

sid

ad

2 gl

4 gl

6 gl

Ejemplo

Un fitomejorador desea controlar la variabilidad de los brotes comerciales de espárrago, ya que las normas de embalaje establecen una longitud máxima de cajas de 23,5 cm.

La variable largo del brote de espárrago sigue una distribución normal, con una varianza de 2,25 cm2.

Ejemplo

¿Cuál es la probabilidad que una muestra de 5 cajas, tenga una desviación estándar que exceda a 2 cm, si la verdadera desviación estándar es de 1,5 cm?

2

2 2 2

2

1 4 42 4

2.25

S nP S P S P P

2 27.11 1 7.11 1 0.85 0.15P P

0.0 2.0 4.0 6.0 8.1 10.1 12.1 14.1 16.1 18.1

Ejemplo

Tabla de Cuantiles de la Distribución Chi-Cuadrado

0.010 0.025 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

1 0.0002 0.0010 0.0039 0.0158 0.0358 0.0642 0.1015 0.1485 0.2059 0.2750 0.3573 0.4549

. . . . . . . . . . . . .

4 0.2971 0.4844 0.7107 1.0636 1.3665 1.6488 1.9226 2.1947 2.4701 2.7528 3.0469 3.3567

. . . . . . . . . . . . .

49 28.9407 31.5549 33.9303 36.8182 38.8588 40.5344 42.0104 43.3664 44.6491 45.8895 47.1114 48.3350

0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.999

1 0.5707 0.7083 0.8735 1.0742 1.3233 1.6424 2.0723 2.7055 3.8415 5.0239 6.6349 10.8278

. . . . . . . . . . . . .

4 3.6871 4.0446 4.4377 4.8784 5.3853 5.9886 6.7449 7.7794 9.4877 11.1433 13.2767 18.4670

. . . . . . . . . . . . .

49 49.5796 50.8659 52.2186 53.6697 55.2653 57.0786 59.2411 62.0375 66.3386 70.2224 74.9194 85.3511