Distribuciones muestrales. -...

6
Matemáticas aplicadas a las CCSS II Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife +34 922 276 056 - Fax: +34 922 278 477 [email protected] COLEGIO HISPANO INGLÉS Distribuciones muestrales. Recuerda: Población: conjunto de todos los elementos que poseen una determinada característica. Muestra: parte de la población que se observa (para extraer información de la población). - Representativa: - Debe tener un tamaño adecuado. - Sus elementos son elegidos de forma aleatoria. - Sesgada: - Si sus elementos no son elegidos de forma aleatoria. Muestreo: selección de la muestra. Teorema Central del Límite: El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se distribuye según una distribución normal . Si se seleccionan muestras aleatorias de n observaciones de una población con media μ y desviación típica σ , entonces, cuando n es grande, la distribución muestral de medias tendrá aproximadamente una distribución normal con una media igual a μ y una desviación típica de σ n . La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.

Transcript of Distribuciones muestrales. -...

Page 1: Distribuciones muestrales. - romanfyq.wikispaces.comromanfyq.wikispaces.com/file/view/Distribuciones_muestrales.pdf/... · probabilidad de que la media muestral de sus niveles de

Matemáticas aplicadas a las CCSS II

Rambla de Santa Cruz, 94 -

38004 – Santa Cruz de Tenerife +34 922 276 056 - Fax: +34 922 278 477

[email protected]

COLEGIO HISPANO INGLÉS

Distribuciones muestrales. Recuerda: Población: conjunto de todos los elementos que poseen una determinada característica. Muestra: parte de la población que se observa (para extraer información de la población).

- Representativa:  

- Debe tener un tamaño adecuado. - Sus elementos son elegidos de forma aleatoria.

- Sesgada:  

- Si sus elementos no son elegidos de forma aleatoria. Muestreo: selección de la muestra. Teorema Central del Límite: El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se distribuye según una distribución normal.

Si se seleccionan muestras aleatorias de n observaciones de una población con media µ y desviación típica σ , entonces, cuando n es grande, la distribución muestral de medias tendrá

aproximadamente una distribución normal con una media igual a µ y una desviación típica de

σn

.

La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.

Page 2: Distribuciones muestrales. - romanfyq.wikispaces.comromanfyq.wikispaces.com/file/view/Distribuciones_muestrales.pdf/... · probabilidad de que la media muestral de sus niveles de

- 2 / 6 -

Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife +34 922 276 056 - Fax: +34 922 278 477

[email protected]

COLEGIO HISPANO INGLÉS

Distribuciones en el muestreo más importantes: - Distribución en el muestreo de una proporción (o distribución muestral de proporciones):

Cada una de las distintas muestras elegidas tendrán una proporción

ˆ p , el conjunto de todas ellas darán lugar a una variable aleatoria que se representa por

ˆ P y se llama estadístico. La distribución de los valores de

ˆ P se llama distribución en el muestreo de la proporción, para la cual la variable aleatoria

ˆ P tiene las siguientes características: 1º Media: µ = p (proporción de la población).

2º Desviación típica:

σ =p(1− p)n

3º Cuando n crece la distribución

ˆ P se aproxima a la normal

N p, p(1− p)n

⎝ ⎜

⎠ ⎟ siempre que p no se

acerque a 0 ó 1.

Ejemplo: El 46% de la población de una ciudad está descontento con la gestión realizada por el ayuntamiento. Si extraemos una muestra aleatoria de tamaño 200, ¿cuál es la probabilidad de que al menos 100 de ellos estén descontentos? Por un lado, p = 0,46, y nos piden calcular la probabilidad de que el total muestral de descontentos T200 sea mayor o igual que 100, o lo que es lo mismo, que

ˆ p ≥ 100200

→ ˆ p ≥ 0,5 como cuando n ∞

ˆ P →N p, p(1− p)n

⎝ ⎜

⎠ ⎟

Por lo que podemos aproximar la probabilidad pedida por:

P( ˆ p ≥ 0,5) → tipificando la variable para convertirla en

N 0,1( )

P( ˆ p ≥ 0,5) ≈ P Z ≥0,5 − 0,460,46⋅ 0,54

200

⎜ ⎜ ⎜ ⎜

⎟ ⎟ ⎟ ⎟

= P Z ≥1,14( ) =1− P(Z <1,14) = 0,1271

-

Page 3: Distribuciones muestrales. - romanfyq.wikispaces.comromanfyq.wikispaces.com/file/view/Distribuciones_muestrales.pdf/... · probabilidad de que la media muestral de sus niveles de

- 3 / 6 -

Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife +34 922 276 056 - Fax: +34 922 278 477

[email protected]

COLEGIO HISPANO INGLÉS

- Distribución en el muestreo de la media: Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria

X podemos estudiar su distribución que llamaremos distribución muestral de medias o distribución en el muestreo de la media.

1º Media: tiene la misma que la población, µ .

2º Desviación típica:

σn

3º Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la distribución muestral de medias sigue también una distribución normal

N µ, σn

⎝ ⎜

⎠ ⎟

• Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del límite la distribución muestral de medias se aproxima también a la normal anterior.

Ejemplo:

Los niveles de colesterol en la sangre de una población de trabajadores tiene media 202 y desviación típica 14. Se selecciona una muestra de 36 trabajadores y queremos aproximar la probabilidad de que la media muestral de sus niveles de colesterol esté comprendida entre 198 y 206. Según el TCL,

X se distribuye aproximadamente como una

N µ = 202, σn

=1436

⎝ ⎜

⎠ ⎟

N 202, 73

⎝ ⎜

⎠ ⎟ que podemos convertir en

N 0,1( ) tipificando la variable, de

este modo,

P(198 ≤ X ≤ 206) = P 198 − 20273

≤ Z ≤206 − 202

73

⎜ ⎜ ⎜

⎟ ⎟ ⎟ ≈ P −1,71≤ Z ≤1,71( )

P −1,71≤ Z ≤1,71( ) = P Z ≤1,71( ) − 1− P Z ≤1,71( )[ ] = 0,9128

Page 4: Distribuciones muestrales. - romanfyq.wikispaces.comromanfyq.wikispaces.com/file/view/Distribuciones_muestrales.pdf/... · probabilidad de que la media muestral de sus niveles de

- 4 / 6 -

Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife +34 922 276 056 - Fax: +34 922 278 477

[email protected]

COLEGIO HISPANO INGLÉS

Intervalos de confianza.

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza o coeficiente d confianza, y se denota 1-α . La probabilidad de equivocarnos se llama nivel de significancia o de riesgo y se simboliza α .

Llamaremos valor crítico al valor de la abcisa que dja a su derecha un área igual a

α2 ,

siendo 1-α el coeficiente de confianza. Se representa por

Zα2

.

El margen de error es la diferencia entre los extremos superior e inferrior del intervalo de confianza. - Intervalo de confianza para para el parámetro p de una binomial B(n,p):

IC = ˆ p ± Zα2

ˆ p 1− ˆ p ( )n

⎝ ⎜ ⎜

⎠ ⎟ ⎟ , es decir,

IC = ˆ p − Zα2

ˆ p 1− ˆ p ( )n

, ˆ p + Zα2

ˆ p 1− ˆ p ( )n

⎝ ⎜ ⎜

⎠ ⎟ ⎟

donde:

ˆ p es la proporción de la muestra.

Zα2

es el vallor crítico para el nivel de confianza α.

n es muy grande, es decir, np>5 y n(1-p)>5

ˆ P se aproxima a la normal

N p, p(1− p)n

⎝ ⎜

⎠ ⎟ .

Ejemplo: En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas. Halla, con un nivel de confianza del 95% un intervalo para la proporción de mujeres hipertensas en la Región Metropolitana.

ˆ p = 0,176 → 1− ˆ p ( ) = 0,824

1−α = 0,95→α =1− 0,95 = 0,05→α2

= 0,025

Page 5: Distribuciones muestrales. - romanfyq.wikispaces.comromanfyq.wikispaces.com/file/view/Distribuciones_muestrales.pdf/... · probabilidad de que la media muestral de sus niveles de

- 5 / 6 -

Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife +34 922 276 056 - Fax: +34 922 278 477

[email protected]

COLEGIO HISPANO INGLÉS

1− 0,025 = 0,975 esto es para Z=1,96

Zα2

=1,96 (buscado en la tabla)

luego:

IC = ˆ p ± Zα2

ˆ p 1− ˆ p ( )n

⎝ ⎜ ⎜

⎠ ⎟ ⎟ = 0,176 ±1,96⋅ 0,176⋅ 0,824

412

⎝ ⎜

⎠ ⎟ = 0,176 ± 0,037( ) = 0.139,0.213( )

- Intervalo de confianza para para el parámetro media µ de una N(µ ,σ): Co un nivel de confianza 1-α viene dado por:

IC = x ± Zα2

σn

⎝ ⎜

⎠ ⎟ , es decir,

IC = x − Zα2

σn,x + Zα

2

σn

⎝ ⎜

⎠ ⎟

Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional , la varianza poblacional σ es desconocida, por lo que el intervalo para µ construido anteriormente es muy poco práctico.

Si en el intervalo se reemplaza la desviación típica poblacional por la desviación típica muestral s (cuasidesviación típica), el intervalo de confianza toma la forma:

IC = x ± Zα2

sn

⎝ ⎜

⎠ ⎟ , es decir,

IC = x − Zα2

sn,x + Zα

2

sn

⎝ ⎜

⎠ ⎟

Ejemplo: Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión)

Halla un intervalo de confianza al 95%.

2 5 6 8 8 9 9 10 11 11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20

Page 6: Distribuciones muestrales. - romanfyq.wikispaces.comromanfyq.wikispaces.com/file/view/Distribuciones_muestrales.pdf/... · probabilidad de que la media muestral de sus niveles de

- 6 / 6 -

Rambla de Santa Cruz, 94 - 38004 – Santa Cruz de Tenerife +34 922 276 056 - Fax: +34 922 278 477

[email protected]

COLEGIO HISPANO INGLÉS

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con desviación típica poblacional σ desconocida. Como σ es desconocido, lo estimamos por s = 4,3. La media la calculamos y es

x =14,5 .

1−α = 0,95→α =1− 0,95 = 0,05→α2

= 0,025

1− 0,025 = 0,975 esto es para Z=1,96

Zα2

=1,96 (buscado en la tabla)

IC = x ± Zα2

sn

⎝ ⎜

⎠ ⎟ = 14,5 ±1,96⋅ 4,3

45⎛

⎝ ⎜

⎠ ⎟ = 14,5 ±1,3( ) = 13.2,15.8( )

Luego, el intervalo de confianza para µ es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.