DISTRIBUCIONES MUESTRALES mio

22
DISTRIBUCIONES MUESTRALES

Transcript of DISTRIBUCIONES MUESTRALES mio

Page 1: DISTRIBUCIONES MUESTRALES mio

DISTRIBUCIONES MUESTRALES

Page 2: DISTRIBUCIONES MUESTRALES mio

El concepto de distribución muestral, es el concepto más básico de la inferencia estadística y se puede definir como una distribución de probabilidad, que consta de todos los valores posibles de un estadístico de la muestra de tamaño n (con o sin reemplazo).

Page 3: DISTRIBUCIONES MUESTRALES mio

En cada muestra, se suele calcular un estadístico, como la media o la desviación estándar, que varía de una muestra a otra. De esta forma se obtiene una distribución del estadístico denominada distribución muestral. Si por ejemplo, el estadístico utilizado es la MEDIA MUESTRAL, entonces la distribución se llama distribución del muestreo de medias o distribución muestral de la media. De forma similar, se puede obtener distribuciones muestrales de las desviaciones estándar, las varianzas, las medianas, etcétera

Page 4: DISTRIBUCIONES MUESTRALES mio

• DISTRIBUCIÓN MUESTRAL DE MEDIAS

Page 5: DISTRIBUCIONES MUESTRALES mio

Con el propósito de familiarizarnos con la forma de estudiar estos problemas, analizaremos un caso muy simple. Supongamos que tenemos una población de N = 5 niños y que nuestras muestras son de tamaño n = 2.

(Es claro que para un problema de este tamaño simplemente tomamos las alturas de los cinco

niños, las sumamos, dividimos entre 5 y se acabó.)

Page 6: DISTRIBUCIONES MUESTRALES mio

El objetivo de éste análisis, es entender algunos aspectos importantes de la distribución muestral de medias a través de este ejemplo.

La media poblacional de las alturas es: 1.20 1.18 1.32 1.23 1.281.24

5

Y su desviación estándar poblacional es:

Niño 1 2 3 4 5

Altura 1.20 1.18 1.32 1.23 1.28

2 2 2(1.20 1.24) (1.18 1.24) ... (1.28 1.24)0.0514

5

Page 7: DISTRIBUCIONES MUESTRALES mio

• Ahora ¿Cuántas muestras posibles hay en una población( N ) de 5 niños y queremos muestras (n) de tamaño 2, sin reemplazo? O dicho de otra manera, ¿Cuáles son todas las muestras de tamaño igual a 2, que pueden obtenerse sin reemplazo de la población de 5 niños?

• • Como es sin reemplazo, hay un total de 5C2 = (5)(4) / 2! = 10

muestras posibles.• Que son los NIÑOS: • {1,2}, {1,3}, {1,4}, {1,5}, {2,3}, {2,4}, {2,5}, {3,4}, {3,5}, {4,5}.

Page 8: DISTRIBUCIONES MUESTRALES mio

Estas 10 muestras posibles, se pueden observar en la siguiente tabla:

TABLA DE DISTRIBUCIÓN MUESTRAL DE MEDIAS

“Muestras del tamaño igual a 2 sin reemplazo de población de 5 niños”

Niño

( altura )

1 (1.20)

2 (1.18)

3 (1.32)

4 (1.23)

5 (1.28)

1 ( 1.20 )

(1.20; 1.18)

(1.20; 1.32)

(1.20; 1.23)

(1.20; 1.28)

2 ( 1.18 )

(1.18;1.32)

(1.18; 1.23)

(1.18; 1.28)

3 ( 1.32 )

(1.32; 1.23)

(1.32; 1.28)

4 ( 1.23 )

(1.23; 1.28)

5 ( 1.28 )

x

Page 9: DISTRIBUCIONES MUESTRALES mio

Para cada una de estas muestras, tenemos una media 𝑥ҧ . Por ejemplo, para la muestra {1,2}

Su media es 𝑥ҧ= ሺ1.20 + 1.18ሻ2 = 1.19

Para la muestra {3,5};

Su media es 𝑥ҧ= 1.32 + 1.282 = 1.30, etc.

Según se muestra en la siguiente tabla de medias.

Page 10: DISTRIBUCIONES MUESTRALES mio

MEDIAS DE LA DISTRIBUCIÓN MUESTRAL DE MEDIAS

Niño

(altura)

2 (1.18)

3 (1.32)

4 (1.23)

5 (1.28)

Total

1 ( 1.20 )

(1.20+1.18)

= 1.19

(1.20+1.32)

= 1.26

(1.20+1.23)

= 1.215

(1.20+1.28)

= 1.24

4.905

2 ( 1.18 )

(1.18+1.32)

= 1.25

(1.18+1.23)

= 1.205

(1.18+1.28)

= 1.23

3.685

3 ( 1.32 )

(1.32+1.23)

= 1.275

(1.32+1.28)

= 1.30

2.575

4 ( 1.23 )

(1.23+1.28)

= 1.255

1.255

Total =

1.19

2.51

3.695

5.025

12.42

Page 11: DISTRIBUCIONES MUESTRALES mio

Ahora calculemos dos aspectos importantes de esta variable aleatoria, como son la MEDIA Y LA DESVIACIÓN ESTÁNDAR de la

distribución muestral de medias.

12.421.24

10x

x

N

La media que denotamos por Xഥ la llamamos MEDIA DE LA DISTRIBUCIÓN MUESTRAL que es la media de las medias de cada muestra. Su fórmula es El resultado 1.24 es igual a la media poblacional obtenida.

Esto es:

LA MEDIA DE LA POBLACIÓN, ES IGUAL A LA MEDIA DE LA DISTRIBUCIÓN MUESTRAL DE MEDIAS (1.24)

Page 12: DISTRIBUCIONES MUESTRALES mio

Ahora, la desviación estándar, que denotamos 𝜎𝑥ҧ y llamaremos ERROR ESTÁNDAR DE LA MEDIA, que es la desviación estándar de la distribución muestral de medias. Calculemos la desviación estándar, siguiendo los datos de la tabla y posteriormente analizaremos otra manera más fácil….

ERROR ESTÁNDAR DE LA MEDIA

Muestra n

Medias 𝑥ҧ Medias al cuadrado 𝑥ҧ2

{1,2} 1.19 1.4161 {1,3} 1.26 1.58761 {1,4} 1.215 1.476225 {1,5} 1.24 1.5376 {2,3} 1.25 1.5625 {2,4} 1.205 1.452025 {2,5} 1.23 1.5129 {3,4} 1.275 1.625625 {3,5} 1.30 1.69 {4,5} 1.255 1.575025 Total = 12.42 15.4356

Page 13: DISTRIBUCIONES MUESTRALES mio

Con los datos anteriores, podemos utilizar una fórmula y obtener el error estándar de la media que es.

Hasta aquí, hagamos un espacio de reflexión:

Hay dos resultados muy importantes, que describen la distribución de la variable aleatoria de la distribución muestral de medias.

031560100

421243561510 2

2

22

.).().()()(

N

xxNx

Page 14: DISTRIBUCIONES MUESTRALES mio

• El primero de ellos nos dice, que la media de la distribución muestral de medias, siempre coincide con la media de la población y que el error estándar de la media, es siempre menor que la desviación estándar de la población, o igual a ella, si la dividimos entre la raíz cuadrada del tamaño de la muestra.

Page 15: DISTRIBUCIONES MUESTRALES mio

Si tomamos muestras de tamaño n de una población de tamaño N con media μ y desviación estándar σ, y se simbolizan la media y la desviación estándar de la distribución muestral de medias por 𝜇𝑥ҧ y 𝜎𝑥ҧ, respectivamente, entonces: Las medias 𝜇𝑥ҧ= μ, Y las desviaciones 𝜎𝑥ҧ= 𝜎ξ𝑛

O bien 𝜎𝑥ҧ= 𝜎ξ𝑛ට𝑁−𝑛𝑁−1

Más precisamente:

Page 16: DISTRIBUCIONES MUESTRALES mio

Para el ejemplo que venimos desarrollando, utilizaremos la última fórmula para estimar la desviación estándar de las medias muestrales o el error estándar de la media.

0.05154 5 2 0.05154 3. . . 0.03156

1 5 1 42 2x

N n

Nn

Coincide con el valor que obtuvimos antes para la desviación estándar de la distribución muestral de medias.

Page 17: DISTRIBUCIONES MUESTRALES mio

Pero es preciso indicar que el factor 1

N n

N

de la segunda fórmula, se conoce como factor de

corrección de la población finita (cpf), ya que sin éste, las dos fórmulas (para poblaciones infinitas y finitas) son las mismas. Una regla de uso muy frecuente, establece que el factor de corrección de población finita (cpf), se puede pasar por alto cuando n/N es menor o igual a 0.05, esto es, cuando la muestra contiene el 5% o menos de la población. Por lo tanto, si la población es infinita; o el muestreo se hace de una población infinita con reemplazamiento; o cuando N > 20n la fórmula para encontrar el error estándar se reduce a Para encontrar el error estándar de la media cuando la población es finita y el muestreo se hace sin reemplazo; o cuando N <20n es:

x n

.1x

N n

Nn

Page 18: DISTRIBUCIONES MUESTRALES mio

Como se señaló en el ejemplo anterior, en lugar de decir "la desviación estándar de la distribución de las medias de la muestra" nos referimos al error estándar de la media. De manera similar, la "desviación estándar de la distribución de las proporciones de la muestra" se abrevia como error estándar de la proporción.

ERROR ESTÁNDAR O TÍPICO

Page 19: DISTRIBUCIONES MUESTRALES mio

El término error estándar se utiliza porque da a entender que la variabilidad en los estadísticos de la muestras, provienen de un error de muestreo debido al azar; es decir, hay diferencias entre cada muestra y la población, y además entre las diversas muestras debido únicamente a los elementos que decidimos escoger para las muestras. Por lo tanto, mide el grado en el que se puede esperar que fluctúen o varíen los estadísticos de una muestra como consecuencia del azar, pero no solo mide el error de azar que se ha cometido, sino también la probable precisión que obtendremos si utilizamos una estadística de muestra para estimar un parámetro de población.

Page 20: DISTRIBUCIONES MUESTRALES mio

Si el error estándar es bajo, hay buenas posibilidades de que el estadístico de una muestra se aproxime al de la población; en cambio…

Entonces analicemos un problema, para

comprender mejor todo lo estudiando hasta aquí

¿sale?Compañeros, urge hacer un ejercicio para

practicar

Si el error estándar es alto es más probable que obtengamos una muestra que difiera considerablemente de la población.

Page 21: DISTRIBUCIONES MUESTRALES mio

Supóngase que la estatura de 3,000 estudiantes universitarios hombres, se distribuye normalmente, con una media de 68 pulgadas. y una desviación estándar de 3.0 pulgadas. Si se obtienen 80 muestras de 25 estudiantes cada una. Cuáles serían las medias y las desviaciones estándar (error

estándar) esperadas de la distribución muestral de medias, si los muestreos se hubieran hechoa) Con reemplazamiento y b) sin reemplazamiento.

3 3000 25. . 0.59759 0.6 lg

1 3000 125x

N npu

Nn

a) Con reemplazamiento 68.0 lgx

pu . y 30.6 lg.

25xpu

n

b) Sin reemplazamiento 68.0 lgx

pu y

Page 22: DISTRIBUCIONES MUESTRALES mio

profundicemos un poco más; ahora queremos saber…

¡Momento! para esto, antes debemos repasar aunque sea someramente, la famosa distribución normal y el teorema del límite central, ¿sale?