soluciones_inferencia.pdf

14
SOLUCIONES REPASO 2º BACH. INFERENCIA ESTADÍSTICA Ejercicio nº 1.- Las ventas diarias, en euros, en un determinado comercio siguen una distribución N(950, 200). Calcula la probabilidad de que las ventas diarias en ese comercio: a) Superen los 1200 euros. b) Estén entre 700 y 1000 euros. Solución: [ ] [ ] = > = > = > 25 , 1 200 950 1200 200 950 1200 a) z p x p x p [ ] 1056 , 0 8944 , 0 1 25 , 1 1 = = = z p [ ] = < < = < < 200 950 1000 200 950 200 950 700 1000 700 b) x p x p [ ] [ ] [ ] = < < = < < = 1 25 , 0 25 , 0 1 z p z p z p [ ] [ ] [ ] [ ] ( ) = < = > < = 1 1 25 , 0 1 25 , 0 z p z p z p z p ( ) 44 , 0 8413 , 0 1 5987 , 0 = = Ejercicio nº 2.- En una distribución N (5, 2), obtén un intervalo centrado en la media, (μ k, μ + k), tal que: P [μ k < x < μ + k] = 0,95 Solución: Tenemos que hallar el intervalo característico correspondiente a una probabilidad de 0,95. Este intervalo es de la forma: (μ z α/2 · σ, μ + z α/2 · σ) donde z α/2 es tal que P [z α/2 < z < z α/2 ] = 1 α, con z N (0, 1). Para una probabilidad de 0,95, tenemos que:

Transcript of soluciones_inferencia.pdf

Page 1: soluciones_inferencia.pdf

SOLUCIONES REPASO 2º BACH. INFERENCIA ESTADÍSTICA

Ejercicio nº 1.- Las ventas diarias, en euros, en un determinado comercio siguen una distribución N(950, 200). Calcula la probabilidad de que las ventas diarias en ese comercio: a) Superen los 1200 euros. b) Estén entre 700 y 1000 euros. Solución:

[ ] [ ] =>=⎥⎦⎤

⎢⎣⎡ −

>−

=> 25,1200

9501200200

9501200 a) zpxpxp

[ ] 1056,08944,0125,11 =−=≤−= zp

[ ] =⎥⎦⎤

⎢⎣⎡ −

<−

<−

=<<200

9501000200

950200

9507001000700 b) xpxp

[ ] [ ] [ ] =−<−<=<<−= 125,025,01 zpzpzp

[ ] [ ] [ ] [ ]( ) =≤−−<=>−<= 1125,0125,0 zpzpzpzp

( ) 44,08413,015987,0 =−−=

Ejercicio nº 2.- En una distribución N (5, 2), obtén un intervalo centrado en la media, (μ − k, μ + k), tal que:

P [μ − k < x < μ + k] = 0,95

Solución:

Tenemos que hallar el intervalo característico correspondiente a una probabilidad de 0,95. Este intervalo es de la forma:

(μ − z

α/2 · σ, μ + zα/2 · σ)

donde z

α/2 es tal que P [−zα/2 < z < z

α/2] = 1 − α, con z ∼ N (0, 1).

Para una probabilidad de 0,95, tenemos que:

Page 2: soluciones_inferencia.pdf

1 − α = 0,95 → z

α/2 = 1,96

Por tanto, el intervalo será:

(5 − 1,96 · 2; 5 + 1,96 · 2), es decir:

(1,08; 8,92)

Esto significa que el 95% de los individuos están en este intervalo. Ejercicio nº 3.- La edad de los miembros de una determinada asociación sigue una distribución N (μ, σ). Sabemos que la distribución de las medias de las edades en muestras de tamaño 36 tiene como media 52 años y como desviación típica 0,5. a) Halla la media y la desviación típica de la edad de los miembros de la asociación. b) ¿Cuál es la probabilidad de que un miembro de la asociación, elegido al azar, sea mayor de 60 años? Solución:

a) Por el teorema central del límite, sabemos que las medias muestrales se distribuyen según

una normal de media y de desviación típica .nσμ

Como tenemos que:

⎪⎪⎩

⎪⎪⎨

==σ→=σ

⎪⎪⎪

⎪⎪⎪

=

36·5,05,036

52

:Entonces

36

5,0

52

n

n

Por tanto, la edad de los miembros de la asociación tiene una media de 52 años y una desviación típica de 3 años, es decir, se distribuye N (52, 3).

b) Por lo obtenido en el apartado anterior, tenemos que, si z es N (0, 1):

[ ] [ ] [ ] 0038,09962,0167,2167,23

526060 =−=≤−=>=⎥⎦⎤

⎢⎣⎡ −

>=> zPzPzPxP

La probabilidad pedida es de 0,0038.

Ejercicio nº 4.- En un test de matemáticas que se pasó a 1 000 alumnos de 2o de Bachillerato, se observó que las puntuaciones obtenidas seguían una distribución N (67, 20).

Page 3: soluciones_inferencia.pdf

Nombre: Grupo:

Si consideramos muestras de 15 alumnos de los que hicieron el test, halla un intervalo en el que se encuentren el 99,73% de las puntuaciones medias de los alumnos de cada muestra. Solución:

Por el teorema central del límite, sabemos que las medias muestrales se distribuyen

.1520;67 ⎟⎟

⎞⎜⎜⎝

⎛N

El intervalo característico es de la forma:

⎟⎟⎠

⎞⎜⎜⎝

⎛ σ+μ

σ−μ αα

nz

nz ·;· 2/2/

Para el 99,73%, tenemos que:

[ ] →=+=≤→=α

→=α− α 99865,000135,09973,000135,02

9973,01 2/zzP

→ z

α/2 = 3

Así, el intervalo será:

:decir es;1520·367;

1520·367 ⎟⎟

⎞⎜⎜⎝

⎛+−

(51,51; 82,49)

Por tanto, en el 99,73% de las muestras, las medias están comprendidas entre 51,51 y 82,49 puntos. Ejercicio nº 5.- La estatura de los habitantes mayores de edad de una determinada ciudad sigue una distribución normal de media desconocida y varianza 36 cm2. En una muestra aleatoria de 80 individuos de esta ciudad, hemos obtenido una estatura media de 172 cm. Determina un intervalo de confianza del 95,44% para la estatura media de los habitantes mayores de edad de dicha ciudad. Solución:

Queremos estimar la media de la población, μ, mediante una muestra de tamaño 80, con un nivel de confianza del 95,44%.

Como la varianza es conocida, σ2 = 36 cm2, tenemos que la desviación típica es:

Page 4: soluciones_inferencia.pdf

cm 636 ==σ

El intervalo de confianza es de la forma:

⎟⎟⎠

⎞⎜⎜⎝

⎛+− αα

nszx

nszx ·;· 2/2/

Para un 95,44%, tenemos que:

0228,02

9544,01 =α

→=α−

P [z ≤ z

α/2] = 0,9544 + 0,0228 = 0,9772 → zα/2 = 2

Por tanto, el intervalo será:

( )34,173;66,170 decir, es ;806·2172;

806·2172 ⎟⎟

⎞⎜⎜⎝

⎛+−

Tenemos una confianza del 95,44% de que la estatura media de toda la población está entre 170,66 y 173,34 cm. Ejercicio nº 6.- La edad de los alumnos que se presentan a las pruebas de acceso a la universidad sigue una distribución normal con varianza 0,36. Deseamos estimar la edad media de dichos estudiantes con un error menor de 0,2 años y con una confianza del 99,5%. ¿De qué tamaño, como mínimo, debemos seleccionar la muestra? Solución:

.· es admisible máximo error El 2/n

zE σ= α

Para una confianza del 99,5%, tenemos que:

9975,02

10025,02

995,01 =α

−→=α

→=α−

P [z ≤ z

α/2] = 0,9975 → zα/2 = 2,81

años. 36,036,0 será típica desviación la entonces, ;36,0 es varianza la Si 2 ==σ=σ

Page 5: soluciones_inferencia.pdf

Nombre: Grupo:

Sabemos, además, que E = 0,2. Por tanto, si sustituimos en la expresión anterior, tenemos que:

06,7143,82,0

6,0·81,26,0·81,22,0 =→==→= nnn

Debemos seleccionar, como mínimo, una muestra de 72 estudiantes. Ejercicio nº 1.- Un examen de 100 preguntas admite como respuesta en cada una de ellas dos posibilidades, verdadero o falso. Si un alumno contesta al azar, calcula la probabilidad de que acierte más de 60 respuestas. Solución: Si llamamos x = "número de respuestas acertadas", entonces x es una binomial con n = 100,

1, en la que tenemos que calcular:2

p =

[ ] ).5 es típica desviación Su . 50 np es x de media (La60 ==> npqxp

La calculamos aproximando con una normal:

( ) ( 1,0 es 5,50 es '21,100 es NzNxBx →→⎟⎠

⎞⎜⎝

⎛ )

[ ] [ ] [ ] =≥=⎥⎦⎤

⎢⎣⎡ −

≥=≥=> 1,25

505,605,60'60 zpzpxpxp

[ ] [ ] 0179,0600179,09821,011,21 =>→=−=<−= xpzp

Ejercicio nº 2.- En un instituto de 900 alumnos, la proporción de chicas es de 585/900. a) ¿Cuál es la distribución de la proporción de chicas en muestras de 30 alumnos? b) Halla la probabilidad de que, en una muestra de 30, haya entre 20 y 25 chicas (ambos incluidos). Solución:

a) La proporción de chicas, pr, en muestras de 30, se distribuye según una normal de

.087,030

35,0·65,0 típica desviación de y 65,0900585 media ====

npqp

Es decir, pr es una N (0,65; 0,087).

Page 6: soluciones_inferencia.pdf

b) Es una B (30; 0,65), tenemos que calcular P [20 ≤ x ≤ 25]. Como np ≥ 5 y nq ≥ 5, podemos aproximar por

una normal de media μ = np = 19,5 y de desviación típica si Así,.61,235,0·65,0·30 ===σ npq

x es B (30; 0,65) → x' es N (19,5; 2,61) → z es N (0, 1), entonces:

[ ] [ ] [ ] =≤≤=⎥⎦

⎤⎢⎣

⎡ −≤≤

−=≤≤=≤≤ 30,20

61,25,195,25

61,25,195,195,25'5,192520 zPzPxPxP

[ ] [ ] 4893,05,09893,05,030,230,20 =−=−≤=≤≤= zPzP

La probabilidad pedida es de 0,4893. Ejercicio nº 3.- La proporción de alumnos de cierto instituto que aprueban matemáticas es de 560/800. Halla el intervalo característico para la proporción de aprobados en matemáticas, en muestras de 30 alumnos, correspondiente al 99%. Solución:

La proporción de aprobados en matemáticas, en muestras de 30 alumnos, se distribuye según

560 0,7 0,3una normal de media 0,7 y de desviación típica 0,084.800 30

pqpn

⋅= = = =

Una probabilidad del 99% significa 1 − α = 0,99 → z

α/2 = 2,575. El intervalo característico será:

(0,7 − 2,575 · 0,084; 0,7 + 2,575 · 0,084); es decir: (0,48; 0,92)

Esto significa que, en el 99% de las muestras de 30 alumnos, la proporción de aprobados en matemáticas está entre 0,48 y 0,92. Ejercicio nº 4.- En una encuesta realizada a 150 familias de una determinada población, se encontró que en 25 de ellas había tres o más hijos. Halla el intervalo de confianza para estimar la proporción real de las familias en las que hay tres o más hijos, con un nivel de confianza del 90%. Solución:

Queremos estimar la proporción en la población, p, mediante una muestra de tamaño 150, con un nivel de confianza del 90%.

El intervalo de confianza es de la forma:

⎟⎟⎠

⎞⎜⎜⎝

⎛ −+

−− αα n

prprzprn

prprzpr )1(·;)1(· 2/2/

Page 7: soluciones_inferencia.pdf

Nombre: Grupo:

Para un nivel de confianza del 90%, tenemos que 1 − α = 0,9 → z

α/2 = 1,645 El valor de pr es el de la proporción obtenida en la muestra:

17,015025

==pr

Por tanto, el intervalo con confianza será:

:decir es ;150

83,0·17,0·645,117,0;150

83,0·17,0·645,117,0 ⎟⎟⎠

⎞⎜⎜⎝

⎛+−

(0,12; 0,22)

Esto significa que tenemos una confianza del 90% de que la proporción en la población está comprendida entre 0,12 y 0,22. Ejercicio nº 5.- Queremos estimar, con un nivel de confianza del 99%, la proporción de alumnos de cierto instituto que tienen dos o más hermanos. ¿De qué tamaño mínimo tendremos que seleccionar la muestra si admitimos un error máximo de 0,1? (En otro estudio reciente se obtuvo que esta proporción era de 0,4). Solución:

.)1(· es admisible máximo error El 2/ nprprzE −

= α

Para un nivel de confianza del 99%, tenemos que 1 − α = 0,99 → z

α/2 = 2,575 El error máximo que admitimos es E = 0,1. Para pr tomaremos el valor del estudio anterior, es decir, pr = 0,4. Así, sustituyendo en la expresión anterior, tenemos que:

→=→=nn

6,0·4,0575,2

1,06,0·4,0·575,21,0

14,15961,121,0

575,2·24,0=→=→=→ nnn

Deberemos tomar, como mínimo, una muestra de 160 alumnos. Ejercicio nº 1.- Un fabricante garantiza a un laboratorio farmacéutico que sus máquinas producen comprimidos con un

Page 8: soluciones_inferencia.pdf

diámetro de 25 mm. Una muestra de 100 comprimidos dio como media de los diámetros 25,18 mm. Suponiendo que el diámetro de los comprimidos es una variable aleatoria con distribución normal, de desviación típica 0,89 mm, se desea contrastar, con un nivel de significación del 5%, si el diámetro medio que afirma el fabricante es correcto. Para ello: a) Plantea la hipótesis nula y la hipótesis alternativa del contraste. b) Realiza el contraste al nivel de significación indicado. Solución:

a) Queremos contrastar la hipótesis nula:

H0: μ = 25 mm

frente a la hipótesis alternativa:

H1: μ = 25 mm

b) Si H0 fuera cierta, puesto que el tamaño de la muestra es n = 100 ≥ 30 (y además, es una distribución normal; luego no sería necesario que n ≥ 30), las medias muestrales se

( )0,89distribuirían según una 25; ; es decir, 25; 0,089 .100

N N⎛ ⎞⎜ ⎟⎝ ⎠

Por tanto, el intervalo de aceptación será:

⎟⎟⎠

⎞⎜⎜⎝

⎛ σ+μ

σ−μ αα

nz

nz ·;· 2/02/0

Para un nivel de significación del 5%, tenemos que:

α = 0,05 → zα/2 = 1,96

Por tanto, el intervalo es:

( ).17,25;83,24 decir, es ,10089,0·96,125;

10089,0·96,125 ⎟⎟

⎞⎜⎜⎝

⎛+−

Como hemos obtenido una media muestral 25,18 mm, que queda fuera de la zona dex = aceptación, rechazamos H0, es decir, no podemos dar por válido que el diámetro medio sea de 25 mm.

Ejercicio nº 2.- Hace un año, 3 de cada 10 familias de una determinada población realizaba sus compras habituales en hipermercados. En una encuesta realizada este año entre 105 familias de la localidad escogidas al azar, 34 de ellas afirman que compran habitualmente en hipermercados. Con un nivel de significación del 5%, contrasta la hipótesis de que el porcentaje no ha aumentado (es decir, que permanece igual o menor que el del año anterior). Solución:

1er paso: hipótesis:

Queremos contrastar la hipótesis nula:

Page 9: soluciones_inferencia.pdf

Nombre: Grupo:

H0: p ≤ 0,3

frente a la hipótesis alternativa:

H1: p > 0,3

2o paso: zona de aceptación:

El intervalo de aceptación sería:

⎟⎟⎠

⎞⎜⎜⎝

⎛+∞− α n

qpzp 00

2/0 ·,

Para un nivel de significación del 5%, tenemos que zα/2 = 1,645. El intervalo será:

( ).37,0; decir, es ;105

7,0·3,0·645,13,0; ∞−⎟⎟⎠

⎞⎜⎜⎝

⎛+∞−

3er paso: verificación:

.32,010534 es muestra la en obtenida proporción La ==pr

4o paso: decisión:

Como la proporción muestral queda dentro de la zona de aceptación, no podemos rechazar H0; es decir, aceptamos que no ha aumentado.

Ejercicio nº 1.- El concejal de cultura de una determinada localidad afirma que el tiempo medio dedicado a la lectura por los jóvenes entre 15 y 30 años, residentes en dicha localidad, es, como mucho, de 8 horas semanales. Tomando una muestra aleatoria de 100 jóvenes entre 15 y 30 años, se obtuvo que la media de horas semanales que dedicaban a leer era de 8,3, con una desviación típica igual a 1. Con un nivel de significación del 5%, ¿podemos aceptar la afirmación del concejal? Solución:

1er paso: hipótesis:

Queremos contrastar la hipótesis nula:

H0: μ ≤ 8

frente a la hipótesis alternativa:

H1: μ > 8

2o paso: zona de aceptación:

La zona de aceptación sería el intervalo:

Page 10: soluciones_inferencia.pdf

⎟⎟⎠

⎞⎜⎜⎝

⎛ σ+μ∞− α

nz ·; 0

Para un nivel de significación del 5%, tenemos que zα = 1,645. Por tanto, el intervalo es:

( ).16,8; decir, es ;1001·645,18; ∞−⎟⎟

⎞⎜⎜⎝

⎛+∞−

3er paso: verificación:

.3,8 es obtenida muestral media La =x

4o paso: decisión:

Como la media muestral obtenida queda fuera del intervalo de aceptación, rechazamos H0; es decir, rechazamos que la afirmación del concejal sea cierta

Ejercicio nº 2.- Hemos realizado 300 lanzamientos con un dado, que sospechamos que está trucado, y hemos obtenido un seis en 71 ocasiones. Con un nivel de significación del 1%, contrasta la hipótesis de que la probabilidad de obtener seis no es mayor de 1/6. Solución:

1er paso: hipótesis:

Queremos contrastar la hipótesis nula:

61:0 ≤pH

frente a la hipótesis alternativa:

61:1 >pH

2o paso: zona de aceptación:

El intervalo de aceptación será:

⎟⎟⎠

⎞⎜⎜⎝

⎛+∞− α n

qpzp 00

2/0 ·,

Para un nivel de significación del 1%, tenemos que zα/2 = 2,33. Por tanto, el intervalo será:

( ).217,0; decir, es ;300

65·

61

·33,261; ∞−

⎟⎟⎟⎟

⎜⎜⎜⎜

+∞−

3er paso: verificación:

Page 11: soluciones_inferencia.pdf

Nombre: Grupo:

.237,030071 es muestra la en obtenida proporción La ==pr

4o paso: decisión:

Como la proporción muestral no está dentro de la zona de aceptación, rechazamos H0; es decir, admitimos que la probabilidad de obtener un seis con ese dado es mayor de 1/6.

Ejercicio nº 3.- Un laboratorio afirma haber encontrado un medicamento que reduce considerablemente los síntomas de cierta enfermedad en el 95% de los casos. Tras probarlo en una muestra aleatoria de 125 enfermos, 116 de ellos notaron mejoría. Realizado un contraste de hipótesis para ver si la afirmación del laboratorio era cierta, en un nivel de significación del 1%, hemos aceptado que p = 0,95. Explica, en el contexto del problema, en qué consisten cada uno de los errores del tipo I y II. Solución:

• El error de tipo I consiste en rechazar H0, siendo cierta. La probabilidad de cometerlo es α. En este caso

concreto, lo hubiéramos cometido si hubiéramos obtenido una muestra que nos hubiera llevado a rechazar H0, siendo cierta.

• El error de tipo II consiste en aceptar H0, siendo falsa. En este caso concreto consistirá en aceptar que el

porcentaje era del 95%, siendo falso.

19

La duración de la bombillas de 100 W que fabrica una empresa sigue una distribución

normal con una desviación típica de 120 horas de duración. Su vida media está garantizada

durante un mínimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y,

después de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de

significación de 0,01, ¿habría que rechazar el lote por no cumplir la garantía?

1 Enunciamos las hipótesis nula y alternativa:

H0 : µ ≥ 800

H1 : µ <800

2Zona de aceptación

Page 12: soluciones_inferencia.pdf

α = 0.01; zα = 2.33

Determinamos el intervalo de confianza:

3Verificación.

x = 750

4Decisión

Rechazamos la hipótesis nula H0. Con un nivel de significación del 1%.

20

Un fabricante de lámparas eléctricas está ensayando un nuevo método de producción que

se considerará aceptable si las lámparas obtenidas por este método dan lugar a una población

normal de duración media 2400 horas, con una desviación típica igual a 300. Se toma una

muestra de 100 lámparas producidas por este método y esta muestra tendrá una duración

media de 2320 horas. ¿Se puede aceptarr la hipótesis de validez del nuevo proceso de

fabricación con un riesgo igual o menor al 5%?

1 Enunciamos las hipótesis nula y alternativa:

H0 : μ = 2400

H1 : μ ≠2400

2Zona de aceptación

Page 13: soluciones_inferencia.pdf

Nombre: Grupo:

α = 0.05 zα = 1.96.

Determinamos el intervalo de confianza para la media:

3Verificación.

Valor obtenido de la media de la muestra: 2320 .

4Decisión

Rechazamos la hipótesis nula H0, con un nivel de significación del 5%.

21

El control de calidad una fábrica de pilas y baterías sospecha que hubo defectos en la

producción de un modelo de batería para teléfonos móviles, bajando su tiempo de duración.

Hasta ahora el tiempo de duración en conversación seguía una distribución normal con media

300 minutos y desviación típica 30 minutos. Sin embargo, en la inspección del último lote

producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 baterías el

tiempo medio de duración en conversación fue de 290 minutos. Suponiendo que ese tiempo

sigue siendo Normal con la misma desviación típica:

¿Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de

significación del 2%?

1 Enunciamos las hipótesis nula y alternativa:

Page 14: soluciones_inferencia.pdf

H0 : µ ≥ 300

H1 : µ < 300

2Zona de aceptación

α = 0.02; 1- α = 0. 98; P(1.96)= 0. 98; zα = 1.96 .

Determinamos el intervalo de confianza:

3Verificación.

µ = 290

4Decisión

Rechazamos la hipótesis nula H0. Con un nivel de significación del 2%.