Libro Ejercicios Jimenez y Olea Tomo I

217
Ejercicios Resueltos y Propuestos Cursos EYP2214 y EYP2216 Primera Edici´ on Trabajo de Recopilaci´ on, Organizaci´ on y Elaboraci´ on Patricia Jim´ enez P. & Ricardo Olea O. Departamento de Estad´ ıstica - Facultad de Matem´ aticas Pontificia Universidad Cat´ olica de Chile Santiago, Diciembre 2004

description

Ejercicios Resueltos Estadistica UC

Transcript of Libro Ejercicios Jimenez y Olea Tomo I

Page 1: Libro Ejercicios Jimenez y Olea Tomo I

Ejercicios Resueltos y PropuestosCursos EYP2214 y EYP2216

Primera Edicion

Trabajo de Recopilacion, Organizacion y ElaboracionPatricia Jimenez P. & Ricardo Olea O.

Departamento de Estadıstica - Facultad de MatematicasPontificia Universidad Catolica de Chile

Santiago, Diciembre 2004

Page 2: Libro Ejercicios Jimenez y Olea Tomo I
Page 3: Libro Ejercicios Jimenez y Olea Tomo I

Prefacio

Con la intencion de apoyar la labor docente que desarrolla el Departamento de Estadısticade la Facultad de Matematicas de la Pontificia Universidad Catolica de Chile, se ha realizadoun trabajo de recopilacion y elaboracion de ejercicios resueltos y propuestos para los cursoEYP2216 y EYP2214, algunos de los cuales fueron desarrollados en ayudantıas y han sidoparte de interrogaciones en semestre anteriores.

Queremos agradecer muy en especial a FONDEDOC, por haber confiado en este proyectoy habernos entregado todo su apoyo para poder ver realizada esta necesidad tanto para elDepartamento de Estadıstica, como para todos los alumnos y alumnas que son beneficiadosde los cursos de servicio que ofrece el mismo.

Este trabajo ha sido fruto de la labor que desarrollaron docentes y ayudantes que dictaronel curso entre los anos 2001 y 2004.

Especıficamente deseamos agradecer a los profesores

Claudio Beltran

Rolando de la Cruz

Hector Gomez

Patricia Jimenez

Ricardo Olea

Alexis Rojas

Ademas quisieramos agradecer el aporte de Jorge Gonzalez y Mario Tagle, tanto por elmaterial donado, como por la revision de este libro.

Atentamente.

DireccionDepartamento de EstadısticaFacultad de Matematicas

Santiago, Diciembre 2004

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 4: Libro Ejercicios Jimenez y Olea Tomo I

II

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 5: Libro Ejercicios Jimenez y Olea Tomo I

Indice general

1. Analisis Descriptivo 1

1.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. Probabilidad 27

2.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3. Variables Aleatorias Discretas 45

3.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4. Variables Aleatorias Continuas 59

4.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5. Sensibilidad y Especificidad 73

5.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6. Estimacion 79

6.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7. Intervalos de Confianza y Test de Hipotesis 105

7.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

7.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

8. Test de Homogeneidad, Independencia y Bondad de Ajuste 131

8.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

8.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

9. Analisis de Regresion 151

9.1. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

9.2. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 6: Libro Ejercicios Jimenez y Olea Tomo I

IV INDICE GENERAL

A. Formulario de Distribuciones I

B. Formulario de Analisis de Regresion Simple III

C. Tablas de distribucion VIIC.1. Distribucion t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VIIC.2. Distribucion χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VIIIC.3. Distribucion F (α = 0,05) . . . . . . . . . . . . . . . . . . . . . . . . . . . . IXC.4. Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XI

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 7: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 1

Analisis Descriptivo

1.1. Ejercicios Resueltos

EJERCICIO 1

Unos transductores de temperatura de cierto tipo se embarcan en lotes de 50. Se selec-ciono una muestra de 60 lotes y se determino la cantidad de transductores en cada lote queno se apegaban a las especificaciones de diseno y resultaron los siguientes datos:

2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 30 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 15 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3

(a) Diga que tipo de datos son estos.

(b) Construya una tabla de distribucion de frecuencias adecuada para los valores dex: cantidad de transductores defectuosos en un lote.

(c) ¿Que proporcion de lotes en la muestra tienen cuando mas cinco transductores defec-tuosos?

(d) ¿Que proporcion tienen cuando menos cinco unidades defectuosas?

(e) Trace un histograma de los datos con la frecuencia relativa en el eje vertical y comentesus propiedades.

(f) Calcule e interprete la media aritmetica a partir de la tabla de frecuencias.

(g) Obtenga e interprete la mediana por medio de la tabla de frecuencias.

SOLUCION

(a) Datos Discretos.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 8: Libro Ejercicios Jimenez y Olea Tomo I

2 Capıtulo 1. Analisis Descriptivo

(b) Tabla de distribucion de frecuencias: Considerando que son datos discretos, la formacorrecta de hacer esta tabla es dejando una clase por numero de transductores que nose apegaban a las especificaciones. Resultando la siguiente:

Clase Frec. Frec. Relativa Frec. Acumulada Frec. Relativa Acumulada0 7 0.12 7 0.121 12 0.20 19 0.322 13 0.21 32 0.533 14 0.23 46 0.764 6 0.10 52 0.865 3 0.05 55 0.916 3 0.05 58 0.967 1 0.02 59 0.988 1 0.02 60 1.0

(c) Aquı debemos considerar todos aquellos lotes que tenıan 0, 1, 2, 3, 4, o 5 transductoresdefectuosos

55

60= 0,917

(d) Analogamente a la parte (c), aquı debemos considerar todos aquellos lotes que tenıan5, 6, 7 o 8 transductores defectuosos

8

60= 1− 52

60= 1− 0,867 = 0,133

(e) El Histograma tiene una asimetrıa positiva apreciable. Se dispersa bastante respecto asu centro.

Figura 1.1: Histograma

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 9: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 3

(f) La media es:

X =1

n

m∑i=1

xifi

Donde m es el numero de clases, xi el valor de la clase i, y fi frecuencia de la clase i.

∴ X =1

8

8∑i=1

xifi =152

60≈ 2,5

Aunque esta no es una medida de posicion adecuada para este caso, en promedio hay2.5 traductores que no se apegaban a las especificaciones del diseno.

(g) El calculo de la mediana para este caso es obvio por la composicion de las clases, yaque cada clase esta compuesta de un solo valor, es decir, lo mas simple serıa ver enque frecuencia acumulada se encuentra el valor n

2= 60

2= 30 y a que clase corresponde,

para este caso el valor 30 se encuentra en la frecuencia acumulada de la clase 2, por loque la Me = 2.

De una manera mas formal serıa por el procedimiento para el caso de datos tabuladosy discretos, siendo este como sigue:

i. Observemos en la tabla de la parte (a) la columna de las Frecuencias acumuladas(”menor que”).

ii. Se determina la menor frecuencia acumulada Nj que supera a n2.

Es decirn

2< Nj

En esta situacion puede ocurrir que n2≥ Nj−1. O sea que se puede tener

Nj−1 ≤n

2< Nj

1. Cuando n2

> Nj−1, entonces la mediana es:

Me = yj

2. Cuando n2

= Nj−1, en esta situacion se acostumbra a tomar como valor de lamediana:

Me =yj−1 + yj

2

∴ Como n2

= 30, N2 = 32 tenemos que

Me = y2 = 2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 10: Libro Ejercicios Jimenez y Olea Tomo I

4 Capıtulo 1. Analisis Descriptivo

EJERCICIO 2

Un Constructor Civil visita 25 villas en una ciudad y en cada una anoto el numero de casasque han sufrido danos ocasionados por un terremoto, de lo cual resultaron los datos:

15 20 25 15 1816 17 18 20 1818 18 19 16 1719 16 17 17 1719 18 19 18 15

(a) Diga que tipo de datos son estos.

(b) Construya una tabla de distribucion de frecuencias adecuadas a este conjunto de datos.

(c) ¿Cuantas villas tienen a lo mas 20 casas que han sufrido danos?

(d) ¿Que proporcion de villas tienen por lo menos 17 casas que han sufrido danos?

(e) ¿Que proporcion de villas tienen 18 casas que han sufrido danos?

(f) ¿Que proporcion y que porcentaje de villas tienen 18 o menos casas que han sufridodanos?

(g) Calcular e interpretar la media aritmetica de los datos a partir de la tabla que construyoen la parte (b)

(h) Obtenga e interprete la mediana de los datos agrupados a partir de la tabla que con-struyo en la parte (b)

(i) Construya un grafico adecuado y haga comentarios.

SOLUCION

(a) Discretos.

(b) Como son datos discretos, la tabla de frecuencias presentara una clase por cada valoren los datos, resultando la siguiente tabla

Clase Frecuencia Frecuencia Acumulada15 3 316 3 617 5 1118 7 1819 4 2220 2 2425 1 25

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 11: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 5

(c) Considerando la frecuencia acumulada hasta 20, tenemos que el numero de villas quetienen a lo mas 20 casa con danos es 24.

(d) Para contestar esto, nos sirven todas las villas que tuvieron 17 casa o mas con danos

5 + 7 + 4 + 2 + 1

25= 0,76 ≈ 76 %

(e) De la tabla de frecuencias rescatamos que son 7 de un total de 25, esto es

7

25= 0,28 ≈ 28 %

(f) Para contestar esto, nos sirven todas las villas que tuvieron 18 casa o menos con danos

18

25= 0,72 ≈ 72 %

(g) La media es:

X =

5∑i=1

xi · fi

5∑i=1

fi

=15 · 3 + 16 · 3 + 17 · 5 + 18 · 7 + 19 · 4 + 20 · 2 + 25 · 1

25=

445

25= 17,8

(h) Del Ejercicio 1, tenemos que n2

= 12,5, entonces la clase que contiene a Nj (La frecuen-cia acumulada que supera a n

2) es la 4, es decir N4 = 7.

∴ como n2

= 12,5 > N3 = 11 tenemos que

Me = y4 = 18

(i) Del Histograma de la figura siguiente se aprecia que lo que se dio con mayor frecuenciaen las villas, fueron 18 casas con danos, seguidas por 17 y 19, manteniendose las otrasclases relativamente semejantes.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 12: Libro Ejercicios Jimenez y Olea Tomo I

6 Capıtulo 1. Analisis Descriptivo

Figura 1.2: Histograma

EJERCICIO 3

La siguiente distribucion de frecuencias es el resultado de registros sobre la duracion de 220lamparas (o focos) de 60 watts.

Lımites de Clase Frecuencia[500− 600) 3[600− 700) 7[700− 800) 14[800− 900) 28[900− 1000) 64[1000− 1100) 57[1100− 1200) 23[1200− 1300) 13[1300− 1400) 7[1400− 1500] 4

(a) Construya un histograma para estos datos, cuyo eje vertical corresponda a las frecuen-cias relativas.

(b) Obtenga la duracion media.

(c) Obtenga la desviacion estandar.

(d) Encuentre e interprete un intervalo que contenga el 60% central de los datos.

(e) Mas o menos, ¿Cual es la mediana de la duracion de las ampolletas?

SOLUCION

(a) tenemos la siguiente tabla tabulada:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 13: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 7

Clase Frecuencia Frecuencia Relativa Frecuencia Acumulada

[500− 600) 3 0.014 3[600− 700) 7 0.032 10[700− 800) 14 0.064 24[800− 900) 28 0.127 52[900− 1000) 64 0.291 116[1000− 1100) 57 0.259 173[1100− 1200) 23 0.105 196[1200− 1300) 13 0.059 209[1300− 1400) 7 0.032 216[1400− 1500] 4 0.018 220

luego el histograma queda de la siguiente forma

Figura 1.3: Histograma

(b) La media es:

X =

10∑i=1

yi · fi

10∑i=1

fi

=219100

220= 995,91

donde yi es la marca de clase o punto medio de la i-esima clase y fi la frecuenciaabsoluta de la misma clase.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 14: Libro Ejercicios Jimenez y Olea Tomo I

8 Capıtulo 1. Analisis Descriptivo

(c) La varianza para datos tabulados se calcula de la siguiente manera:

S2 =

n∑i=1

fi(yi −X)2

n− 1

en este casoS2 = 28613,325

∴ La desviacion estandar es:

S =√

S2 =√

28613,325 = 169,15

(d) El intervalo pedido es:[P20 − P80]

P20: ¿En que clase esta?:n · p100

=220 · 20

100= 44

es decir, esta en la 4a clase.

P80: ¿En que clase esta?:n · p100

=220 · 80

100= 176

es decir, esta en la 7a clase.

La formula para calcular el percentil en datos tabulados es:

Pp = LI + cj

[ n∗p100

−Nj−1

Nj −Nj−1

]donde:

i. LI: Limite Inferior de la clase que contiene a Pi.

ii. cj: Amplitud de la clase que contiene a Pi.

iii. Nj: Frecuencia acumulada en la clase que contiene Pi.

Reemplazando tenemos lo siguiente:

P20 = 800 + 99

[44− 24

52− 24

]= 870,71

P80 = 1100 + 99

[176− 173

196− 173

]= 1112,91

Por lo tanto el intervalo que contiene al 60% de los datos es:

(870,71; 1112,91)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 15: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 9

(e) Para el calculo de la Mediana en datos tabulados y continuos, el procedimiento es elsiguiente:

Se observa la columna de las frecuencias acumuladas y se determina la menos frecuenciaacumulada Nj tal que

Nj >n

2

En esta situacion puede ocurrir que n2≥ Nj−1. Es decir, se puede tener

Nj−1 ≤n

2< Nj

i. Si ocurre que n2

= Nj−1, la mediana esta dada por:

Me = yj−1

donde yj−1 es el lımite inferior de la clases mediana.

ii. Si ocurre que n2

> Nj−1, la mediana esta dada por:

Me = yj−1 + cj

[ n2−Nj−1

Nj −Nj−1

]Dado esto tenemos que n

2= 220

2= 110, lo que indica que Nj = N5 = 116 y como

n2

= 110 > Nj−1 = N4 = 52 tenemos que la mediana es:

Me = 900 + 99

[110− 52

116− 52

]= 989,718

EJERCICIO 4

Los tiempos de CPU que se indican en la tabla de frecuencias representan el tiempo (ensegundos) que 25 trabajos estuvieron en control de la unidad de proceso (CPU) de unacomputadora mainframe grande.

Intervalo de Clase Frecuencia de Clase[0.015-0.715) 5[0.715-1.415) 9[1.415-2.115) 4[2.115-2.815) 3[2.815-3.515) 1[3.515-4.215) 2[4.215-4.915] 1

(a) Calcule el tiempo promedio de CPU.

(b) Calcule e interprete la desviacion estandar.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 16: Libro Ejercicios Jimenez y Olea Tomo I

10 Capıtulo 1. Analisis Descriptivo

(c) Construya e interprete un histograma de frecuencia.

(d) Encuentre e interprete el intervalo intercuartil.

SOLUCION

A continuacion la tabla de frecuencias completa

Intervalo de Clase f F fr Fr yi

[0.015-0.715) 5 5 0,2 0,2 0,35[0.715-1.415) 9 14 0,36 0,56 1,065[1.415-2.115) 4 18 0,16 0,72 1,765[2.115-2.815) 3 21 0,12 0,84 2,465[2.815-3.515) 1 22 0,04 0,88 3,165[3.515-4.215) 2 24 0,08 0,96 3,865[4.215-4.915] 1 25 0,04 1 4,565

dondeN = 25yi : punto medio de la clases i-esimafi : frecuencia absoluta de la clases i-esima

(a) El tiempo promedio de CPU es:

x =1

N

7∑i=1

fi · yi

=1

25(0,365 · 5 + 1,065 · 9 + 1,765 · 4 + 2,465 · 3 + 3,165 · 1 + 3,865 · 2 + 4,565 · 1)

=41,325

25

= 1,653

(b) La desviacion estandar es la siguiente:

S2 =1

N − 1

7∑i=1

fi(yi − x)2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 17: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 11

S2 =1

24

[5 · (−1,288)2 + 9 · (−0,588)2 + 4 · (0,122)2

+3 · (0,812)2 + 1 · (1,512)2 + 2 · (2,212)2 + 1 · (2,912)2]

=33,9864

24

= 1,4161

∴ S =√

1,4161

= 1,19

La desviacion estandar es una medida de dispersion de los datos con respecto a la media.En este caso S = 1,19 seg., es alta, lo cual indica la presencia de datos extremos.

(c) El histograma de frecuencia se muestra en la figura siguiente.

Figura 1.4: Histograma

Se aprecia que el histograma es asimetrico, que mas de la mitad de los tiempos de launidad de proceso fueron menores que 1.415 seg., se aprecia que casi tres cuartas partesfueron menores que 2.115 seg. y aproximadamente un cuarto de las CPU tardan masde 2.815 seg.

(d) El intervalo intercuartil es el siguiente

(Q1, Q3)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 18: Libro Ejercicios Jimenez y Olea Tomo I

12 Capıtulo 1. Analisis Descriptivo

este rango indica que en el se ubica el 50% central de los datos, donde Q1 = P25 yQ3 = P75.

De la tabla de frecuencias tenemos que Q1 ∈ Clase 2 y Q3 ∈ Clase 4.

Luego los percentiles son

P25 = 0,715 + 0,7 ·(

6,25−514−5

)= 0,812

P75 = 2,115 + 0,7 ·(

18,75−1821−18

)= 2,290

Se tiene que el 50% de los 25 trabajos estuvieron en control de la CPU entre 0.812 y2.290 seg.

EJERCICIO 5

El numero de divorcio en una ciudad, de acuerdo con al duracion de casados, esta represen-tada por la siguiente tabla.

Anos de casados No de divorcio[0-6) 2800[6-12) 1400[12-18) 600[18-24) 150[24-30] 50

(a) ¿Cual es la duracion media de los casamientos?

(b) Encuentre la desviacion estandar de la duracion de los casamientos.

(c) Construya un histograma.

(d) Encuentre el intervalo intercuantil.

SOLUCION

(a) La duracion media de los casamientos es

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 19: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 13

x =1

N

6∑i=1

fi · yi

=1

5000(2800 · 3 + 1400 · 9 + 600 · 15 + 150 · 21 + 50 · 27)

=34500

5000

= 6,9

Los matrimonios duran en promedio 6.9 anos.

(b) La desviacion estandar de la duracion de los casamientos es:

S2 =138150

4999= 27,64 ⇒ S = 5,3 anos

(c) Histograma de No de divorcio vs Clase de Anos de casados.

Figura 1.5: Histograma

La mayorıa de los matrimonios se separan en los primeros 6 anos. Solo el 10% de losmatrimonios dura entre los 24 y 30 anos.

(d) El intervalo intercuantil es

I = (P25; P75) = (Q1; Q3)

tenemos que

n

4=

5000

4= 1250 < N1 ⇒ la clase del percentil 25 es 0− 6

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 20: Libro Ejercicios Jimenez y Olea Tomo I

14 Capıtulo 1. Analisis Descriptivo

luego

Q1 = P25 = 0 + 6 ·(

1250− 0

2800= 2,7

)3n

4=

3 · 5000

4= 1250 < N2 ⇒ la clase del percentil 75 es 6− 12

luego

Q3 = P75 = 6 + 6 ·(

3750− 2800

1400= 10,1

)Ası tenemos

I = (2,7; 10,1)

El 50% central de los matrimonios dura entre los 2.7 anos y 10.1 anos.

EJERCICIO 6

La siguiente informacion corresponde al ingreso neto (X) como porcentaje de sus activos,para las 20 companıas exitosas:

17 23 22 18 8 7 12 2 49 1414 36 16 7 3 8 10 11 20 21

De los ingresos netos como porcentajes de las ventas (Y), informados por 250 Companıasregularmente exitosas se sabe que:

250∑i=1

yi = 2125250∑i=1

y2i = 18625

(a) Compare el coeficiente de variacion del ingreso neto como porcentaje de la activos, conla del ingreso neto como porcentaje de las ventas, para las Companıas exitosas y lasregularmente exitosas, respectivamente. ¿Cual ingreso neto es mas homogeneo?

(b) Si en las Companıas regularmente exitosas, se eliminan dos valores extremos 0.8 y 14.5,¿cual es la desviacion estandar del ingreso neto como porcentaje de las ventas, paralas 248 Companıas restantes? (Utilice 3 decimales)

SOLUCION

(a) el Coeficiente de variacion (C.V) se calcula como:

C.V =S

X

Se puede calcular considerando S2n−1 (varianza muestral) o S2

n (varianza poblacional).En la siguiente tabla se entrega el resumen de ambos casos

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 21: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 15

X S2n−1 C.V S2

n C.VX 15.9 124.199 0.700 130.735 0.719Y 8.5 2.259 0.176 2.250 0.176

Como C.V (Y ) < C.V (X), se puede concluir que el ingreso neto como porcentaje delas ventas es mas homogeneo que el ingreso neto como porcentaje de la activos.

(b) Si consideramos varianza poblacional tenemos que dado lo siguiente:

248∑i=1

yi = 2125− 0,8− 14,5 = 2109,7 ⇒ Y = 8,506

248∑i=1

y2i = 18625− 0,82 − 14,52 = 18414,11 ⇒ Y 2 = 74,250

la desviacion estandar es

Sn =

√Y 2 − Y

2=√

74,250− 8,5062 = 1,377

EJERCICIO 7

Actualmente existe un reglamento con respecto de la obligacion de las construcciones porcumplir normas mınimas de seguridad, entre ellas se encuentra la resistencia al fuego de loselementos de una construccion. Un sistema de proteccion consiste en utilizar una pinturaque permite aislar el elemento, llamada pintura “ıntumescente”.

Antes de la construccion de un edificio se realizaron ensayos en pilares de acero que fueronexpuestos al fuego por sus 4 caras, los cuales fueron pintados con diferentes espesores de estapintura, en micrones y se midio su resistencia al fuego, en minutos, hasta que se comenzabaa deteriorar. La informacion se presenta a continuacion.

ESPESOR DE LA RESISTENCIA AL FUEGO (minutos)PINTURA (micrones) Menos de 22 22 - 52 52 - 82 82 y mas

[0− 335) 10 6 1 0[335− 670) 5 8 2 0[670− 1005) 1 3 3 1[1005− 1340) 0 1 7 10[1340− 1675] 0 0 10 15

(a) Segun el tiempo de exposicion al fuego antes de ser danado el pilar, la resistencia alfuego se clasifica como clases F30, si este tuvo una duracion entre 30 y 59 minutos.¿Que porcentaje de los pilares no se clasificarıan como clase F30?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 22: Libro Ejercicios Jimenez y Olea Tomo I

16 Capıtulo 1. Analisis Descriptivo

(b) ¿Cual distribucion es mas homogenea en relacion al espesor de la pintura “ıntumes-cente”, la de los pilares que mostraron una resistencia al fuego de menos de 52 minutoso la de los pilares con resistencia igual o superior a 52 minutos?

(c) Si consideramos solo los pilares que fueron pintados con un espesor entre 670 y 1005micrones. Grafique la distribucion de estos pilares segun sea su resistencia al fuego.

SOLUCION

(a) Considerando solo la resistencia al fuego tenemos las siguiente tabla de frecuencias ycon la cual podremos obtener el porcentaje de de pilares que no se clasifican como F30.

Resistencia f F Fr

< 22 16 16 0.19[22− 52) 18 34 0.41[52− 82) 23 57 0.69≥ 82 26 83 1.00

Se calcula el percentil a que corresponde 30 y 59 en resistencia al fuego.

Pα = 30 = 22 + 30×(

α×83100

− 16)

18⇒ α = 25,06

Pβ = 59 = 52 + 30×(

α×83100

− 34)

23⇒ β = 47,43

luego β − α = 22,37 %, es decir, el 22.37% de los pilares se clasifica como F30, porende el 73.63% no corresponde a esa categorıa.

(b) La idea es calcular los coeficientes de variacion, para los dos grupos de resistencia, paraello reconstruimos la tabla de frecuencias como sigue:

Espesor R < 52 R ≥ 52 mi

[000− 335) 16 1 167.5[335− 670) 13 2 502.5[670− 1005) 4 4 837.5[1005− 1340) 1 17 1172.5[1340− 1675) 0 25 1507.5

luego los coeficienes de variacion son los siguientes:

C.V (Espesor|R < 52) =263,6446

403,970≈ 0,6526

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 23: Libro Ejercicios Jimenez y Olea Tomo I

1.1 Ejercicios Resueltos 17

C.V (Espesor|R ≥ 52) =310,1497

1268,2142≈ 0,2446

∴ la distribucion es mas homogenea en relacion al espesor de la pintura en la corre-spondiente a los pilares con resistencia igual o superior a 52 minutos.

(c) Considerando solo el grupo de Espesor entre 670 y 1005 la tabla de frecuencias obtenidaes la siguiente:

Resistencia frecuencia< 22 1

[22− 52) 3[52− 82) 3≥ 82 1

Graficamente la distribucion es la siguiente:

Figura 1.6: Histograma

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 24: Libro Ejercicios Jimenez y Olea Tomo I

18 Capıtulo 1. Analisis Descriptivo

1.2. Ejercicios Propuestos

1. La resistencia del concreto depende del procedimiento que se utilice para curarlo. Dosmetodos distintos de curado mostraron los siguientes resultados en ensayos independi-entes.

Se considera que el concreto queda con resistencia optima, cuando es superior a 3220libras/pulgadas2.

Resistencia Metodo 1 Metodo 2[2500-2740) 3 2[2740-2980) 4 3[2980-3220) 5 7[3220-3460) 5 5[3460-3820] 6 4

a) ¿Que porcentaje de los ensayos con el metodo 1 de curado, resultan con concretode resistencia optima?

b) ¿Que porcentaje de los ensayos con el metodo 2 de curado, resultan con concretode resistencia optima?

c) Construya un grafico adecuado que muestre la distribucion de los ensayos con elmetodo 1 segun resistencia de concreto y ubique en dicho grafico el valor numericode su resistencia media.

d) Construya un grafico adecuado que muestre la distribucion de los ensayos con elmetodo 2 segun resistencia de concreto y ubique en dicho grafico el valor numericode su resistencia media.

2. Denote por Xn y S2n la media y la varianza para la muestra X1, . . . , Xn, y denote por

Xn+1 y S2n+1 estas cantidades cuando una observacion adicional Xn+1 se anade a la

muestra.

a) Demuestre como Xn+1 se puede calcular de Xn y Xn+1.

b) Muestre que

nS2n+1 = (n− 1)S2

n +n

n + 1(Xn+1 −Xn)2

de modo que S2n+1 se puede calcular de Xn+1, Xny S2

n.

c) Suponga que una muestra de 15 hebras de hilo de pano dio como resultado unamedia muestral de elongacion de 12.58 mm y una desviacion estandar muestral de0.512 mm. Una decima sexta hebra da un valor de elongacion de 11.8. ¿¿Cualesson los valores de la media muestral y de la desviacion estandar muestral para las16 observaciones de elongacion?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 25: Libro Ejercicios Jimenez y Olea Tomo I

1.2 Ejercicios Propuestos 19

3. Las longitudes de las rutas de transporte en determinada lınea suelen variar entre sı. Enel artıculo ”Planning of City Bus Routes”(J. of the Institution of Engineers, 1995, pp.211-215) aparece la siguiente informacion sobre las longitudes (en km) de determinadalınea:

Longitud Frecuencia[6− 8) 6[8− 10) 23[10− 12) 30[12− 14) 35[14− 16) 32[16− 18) 48[18− 20) 42[20− 22) 40[22− 24) 28[24− 26) 27[26− 28) 26[28− 30) 14[30− 35) 27[35− 40) 11[40− 45] 2

a) Trace el histograma para estas frecuencias.

b) ¿Que proporcion de las rutas tienen una longitud menor que 20? ¿Que proporcionde estas rutas tienen longitudes de cuando menos 30?

c) Mas o menos, ¿cual es el valor del 90 percentil de la distribucion de longitudesde ruta?

d) Mas o menos, ¿cual es la mediana de la longitud de las rutas?

4. El artıculo Can We really Walk Straight”(Amer. J. of Physical Anthropology, 1992 pp.19-27) reporto un experimento en el que se pidio, a cada uno de 20 hombres sanos, quecaminaran en lınea recta tan derecho como fuera posible hacia un blanco situado a 60m a velocidad normal. Considere las siguientes observaciones sobre cadencia (numerosde pasos por segundo):

0.95 0.85 0.92 0.95 0.93 0.86 1.00 0.92 0.85 0.810.78 0.93 0.93 1.05 0.93 1.06 1.06 0.96 0.81 0.96

Utilice los metodos desarrollados en el capıtulo 1 para resumir la informacion; incluyauna interpretacion o discusion, siempre que sea apropiado. (Nota: el autor del artıculoutilizo una analisis estadıstico de gran complejidad para analizar estos datos).

5. Para cada una de las siguientes afirmaciones indique si ella es verdadera ( V ) o falsa( F ). Justifique

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 26: Libro Ejercicios Jimenez y Olea Tomo I

20 Capıtulo 1. Analisis Descriptivo

a) Me = (Q1 + Q3)/2 , siendo Me = Mediana, Qi = i - esimo cuartil ( i = 1, 3 )

b) Si el valor maximo entre ( X1, X2, . . . , Xk) = 18 , entonces , Moda = 18.

c) Si una variable es de nivel de medicion nominal , entonces la medida de tendenciacentral mas adecuada es la mediana.

6. Responda brevemente :

a) De dos definiciones de tipos de muestreo

b) Diga cuando una variable es del tipo discreta y cuando es del tipo continua

c) Diga que se entiende por : ”No depende de la unidad de medida 2senale por

lo menos dos medidas que cumplan y dos medidas que no cumplan con lo antessenalado.

d) Describa en que consiste el percentil p ( Pp )

e) ¿¿ Que porcentaje de la muestra esta contenido en el Rango-Intercuartil ?

7. La exposicion aguda al cadmio produce dolores respiratorios, danos en los rinones,hıgado y puede ocasionar la muerte. Por esta razon se controla el nivel de polvo decadmio y de humo de oxido de cadmio en el aire. Este nivel se mide en miligramos decadmio por metro cubico de aire. Una muestra de treinta y cinco lecturas arroja estosdatos : (Basado en un informe de Environmental Management , Septiembre de 1981,pag. 414)

0.044 0.030 0.052 0.044 0.046 0.020 0.066 0.0520.049 0.030 0.040 0.045 0.039 0.039 0.039 0.0570.050 0.056 0.061 0.042 0.055 0.037 0.062 0.0620.070 0.061 0.061 0.058 0.053 0.060 0.047 0.0510.054 0.042 0.051

a) Construya una tabla de Frecuencias utilizando la formula de Sturges para elnumero de intervalos.Sturges: N.I : 1 + [ 3,3 log10 n] , donde [x] := Es la parte entera de x.Amplitud : A = ( Xmax −Xmin) / N.I.

b) Construya el histograma utilizando las frecuencias absolutas. ¿¿ Parece razonablepensar que el nivel de cadmio del aire posee una distribucion en forma de campana?

c) Calcular las medidas de tendencia central utilizando los datos originales y uti-lizando la tabla construida en el apartado ( b ).

d) Compare sus resultados en relacion a la simetrıa de los datos, los puntos ( c ) y (d ).

8. La Avıcola ”El Super Pollo”preocupada por los recientes reclamos de clientes conrespecto al peso de los pollos, decidio estudiar la distribucion de los pesos de 1000pollos, con los siguientes resultados:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 27: Libro Ejercicios Jimenez y Olea Tomo I

1.2 Ejercicios Propuestos 21

Peso (gramos) Frecuencia[960− 980) 60[980− 1000) 160[1000− 1020) 280[1020− 1040) 260[1040− 1060) 160[1060− 1080] 80

Total 1000

a) ¿Cual es el peso medio?

b) Construya el histograma.

c) Construya la ojiva y la poligonal de frecuencias

d) Interesa dividir los pollos en cuatro categorıas, con respecto al peso, de modo que:

i) El 20% de los pollos mas livianos sean clasificados en categorıa D

ii) El 30% de los pollos que siguen en peso sean clasificados en categorıa C

iii) El 30% de los pollos que siguen en peso sean clasificados en categorıa B

iv) El 20% de los pollos restantes sean clasificados en categorıa A.

¿Cuales son los lımites de peso en cada categorıa?

9. ¿Que ocurre con la mediana, media y desviacion estandar de una serie de datos, cuando:

a) cada observacion es multiplicada por 2

b) se le suma 10 a cada observacion

c) se le resta la media a cada observacion

d) a cada observacion se le resta la media y se divide por la desviacion estandar.

10. La distribucion de los 20.000 empleados de la empresa alfa, segun antiguedad (X)y sueldo mensual (Y) se muestra en la siguiente tabla de proporciones (frecuenciasrelativas) conjuntas:

X Y (en miles de $)(en anos) [50− 90) [90− 130) [130− 170) [170− 250]

Menos de 4 anos 0,12 0,08 0,04 0,004 a 8 anos 0,08 0,12 0,10 0,05

Mas de 8 anos 0,00 0,12 0,18 0,11

(a) Clasifique las variables del problema segun si son cualitativas o cuantitativas ydiga si son nominal u ordinal y continua discreta.

(b) Grafique la distribucion de los empleados segun sueldo mensual.

(c) ¿En que grupo son mas homogeneos los sueldos de la empresa, en el de los em-pleados mas nuevos o en el de los mas antiguos? Justifique su respuesta.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 28: Libro Ejercicios Jimenez y Olea Tomo I

22 Capıtulo 1. Analisis Descriptivo

(d) Si para las fiestas patrias la empresa otorgo un aguinaldo de $25.000 a los emplea-dos cuyo sueldo era inferior a los $120.000, mientras que para aquellos cuyo sueldoera superior a esa cifra el aguinaldo fue de $15.500, ¿cuantos de los empleadosque tienen mas de 8 anos de antiguedad en la empresa recibieron un aguinaldo de$15.500?

11. Una empresa que se dedica a la fabricacion de mallas de acero para hormigon armado,ha tomado una muestra de las mallas que compro una constructora en un mes deter-minado, registrando por cada unidad el peso de la malla (en Kg) X, el tipo de malla Y(con borde ”C” y sin bordo ”S”) y el diametro de las barras (en mm) Z. Los resultadosobtenidos fueron los siguientes:

XZ Y (15-28] (28-41] (41-54] (54-67] Mas de 67

Menos de 5 C 10 6 4 2 0S 8 4 2 0 0

[5− 7] C 2 8 3 11 4S 2 6 5 11 0

Mas de 7 C 0 4 4 20 7S 0 2 5 15 5

(a) Clasifique las variables segun escala de medicion y tamano de recorrido.

(b) Encuentre la medida de posicion mas adecuada para el peso de la malla.

(c) ¿Que porcentaje de las mallas con bordes tienen un diametro de barras superioresa 5.5 mm?

(d) ¿Cual es la variabilidad del peso de las mallas sin bordes que tienen diametros debarras menores de 5.0 mm?

12. Los siguientes datos corresponden a las cantidades maximas de emision diaria de oxidode azufre (en toneladas) registrada segun planta de emision, en cierta zona industrial.

Cantidad de oxido (ton) Planta A Planta B Planta C[05− 10) 50 40 20[10− 15) 30 30 40[15− 20) 60 0 70[20− 25) 20 10 15[25− 30] 40 20 5

(a) Indique la unidad de informacion y clasifique las variables segun escala de mediciony tamano de recorrido

(b) Entre las plantas B y C, ¿cual presenta mayor variabilidad relativa su promediode oxido de azufre emitido?

(c) ¿Que porcentaje de las emisiones producidas por la planta C, supera las 28toneladas?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 29: Libro Ejercicios Jimenez y Olea Tomo I

1.2 Ejercicios Propuestos 23

13. En una empresa constructora se ha registrado informacion respecto: ingreso mensual(Y), especialidad (X) y permanencia (Z) en la empresa (en que A = antiguo, N =recien ingresado), de sus trabajadores, obteniendo lo siguiente:

Ingreso mensual, en miles de pesosEspecialidad [100− 150) [150− 200) [200− 300] Mas de 300

Albanil A 6 9 5 0N 9 11 1 0

Carpintero A 1 6 7 9N 1 2 3 3

Electricista A 3 5 8 1N 1 5 4 0

Pintor A 2 20 2 0N 1 10 5 0

(a) Clasifique las variables involucradas segun nivel de medicion. Calcule la medidade posicion mas adecuada en cada caso. Indique unidad de informacion.

(b) Construya un grafico que permita mostrar la distribucion de los trabajadoressegun especialidad.

(c) Construya un grafico que permita compara los ingresos de los pintores segunpermanencia en la empresa.

(d) Si entre carpinteros y electricistas tienen un sueldo promedio de $225.000 ¿Cuales el sueldo promedio de los trabajadores de la empresa?

(e) Si la empresa decide mejorar los sueldos de los trabajadores con ingresos inferioresa $180.000 ¿Que % de los trabajadores se beneficiara con esta medida?

(f) Si a los albaniles se les otorga una bonificacion de $20.000. Compare la dispersionde los ingresos de los albaniles despues de la bonificacion con la de los ingresos delos pintores.

14. Una empresa constructora de parques y plazas, ha ganado una propuesta para construirareas verdes en plazas de una determinada region. Las superficies sembradas, en metroscuadrados, en 80 plazas y la mezcla de semilla de pasto utilizadas, se resumen en lasiguiente tabla:

Superficie SembradaMezcla [200− 1180) [1180− 3140) [3140− 5100) [5100− 6080] Mas de 6080Manquehue 7 4 6 2 0Estadios 3 6 8 4 3Ray-grass 0 7 9 5 4Lon grass trevol 2 5 4 1 0Total 12 22 27 12 7

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 30: Libro Ejercicios Jimenez y Olea Tomo I

24 Capıtulo 1. Analisis Descriptivo

(a) Clasifique las variables involucradas segun nivel de medicion y tamano de recor-rido.

(b) Calcule las medidas marginales de posicion mas adecuadas para cada variable eindique las correspondientes medidas de dispersion.

(c) Construya un grafico que muestre la distribucion de las plazas sembradas segunmezcla de semilla utilizada.

(d) Compare la dispersion de las superficies sembradas con mezcla de manquehue conla dispersion de las superficies sembradas con mezcla Long grass trebol.

(e) Si un kilo de mezcla manquehue sirve para plantar una superficie de 13 metroscuadrados. ¿Que porcentaje de las superficies plantadas en que se utilizo estamezcla, ocupara mas de 284 kilos?

15. El numero de llamadas telefonicas de larga distancia nacional registrada por una em-presa distribuidora durante una hora de un dıa determinado, se realizara en horariosnormales y se consideraron llamadas de a lo mas 3 minutos de duracion.

Valor de la llamada (U.M)Carrier Region [5-6] (6-8] (8-10] (10-20] Total188 II 3 8 10 4 25

IV 7 9 10 4 30X 3 7 5 5 20

171 II 4 3 9 6 22IV 5 5 8 3 21X 2 4 7 7 20

123 II 3 4 7 8 22IV 7 4 4 5 20X 6 7 4 3 20Total 40 51 64 45 200

(a) Clasifique las variables involucradas segun nivel de medicion y tamano de recorridoe indique la medida marginal de tendencia central mas adecuadas para el valorde la llamada y para el carrier en la IV region.

(b) ¿Que porcentaje son tales que superan al valor promedio de las llamadas realizadasa traves del carrier 171?

(c) Al mes siguiente de haber efectuado este estudio, el valor de la llamada de largadistancia del carrier 123, aumento en un 2% mas de U.M por cada 3 minutos deduracion. ¿En que porcentaje disminuye (aumenta) la variabilidad del valor de lallamada al mes siguientes?

16. Una empresa constructora con varias obras en el paıs desea efectuar un estudio sobrelas canerıas hidraulicas, de una pulgada, adquiridas por la empresa. Para ello, se selec-ciono una muestra de las compras efectuadas durante un mes, anotando el precio de latira de canerıas, la cantidad de tiras, y el tipo de material de fabricacion.La informacion obtenida se presenta en la siguiente tabla:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 31: Libro Ejercicios Jimenez y Olea Tomo I

1.2 Ejercicios Propuestos 25

Material Cantidad Precios (pesos)de tiras 2300-3000 3000-4500 4500-6000 6000 y mas Total

P.V.C 0,08 0,04 0,01 0,00 0,13Fierro 0-10 0,02 0,07 0,02 0,00 0,11Cobre 0,00 0,00 0,09 0,04 0,13P.V.C 0,10 0,02 0,00 0,00 0,12Fierro 10-20 0,02 0,08 0,01 0,00 0,11Cobre 0,00 0,02 0,06 0,12 0,20P.V.C 0,07 0,01 0,00 0,00 0,08Fierro 20 y mas 0,01 0,03 0,01 0,00 0,05Cobre 0,00 0,00 0,03 0,04 0,07

Total 0,30 0,27 0,23 0,20 1,00

(a) Clasifique las variables involucradas segun nivel de medicion y tamano de recor-rido. Indique las medidas marginales de posicion y dispersion mas adecuadas.

(b) ¿que porcentaje de las compras, en las que se requieren menos de 20 tiras decanerıa, tienen un precio entre 3.000 y 6.000 pesos?

(c) Construya un grafico que muestre la distribucion de frecuencias de las comprasde canerıas de P.V.C, segun precio.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 32: Libro Ejercicios Jimenez y Olea Tomo I

26 Capıtulo 1. Analisis Descriptivo

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 33: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 2

Probabilidad

2.1. Ejercicios Resueltos

EJERCICIO 1

Las tres opciones preferidas en cierto tipo de departamento nuevo, son con resistencia an-tisısmica (A), calefaccion central (B) y con excelentes terminaciones (C). Si 70% de loscompradores piden A, 80% B, 75% C, 85% A o B, 90% A o C, 95% B o C y 98% A, B oC, calcule las probabilidades de los siguientes eventos:

(a) El siguiente comprador selecciona, por lo menos, una de las tres opciones.

(b) El siguiente comprador esta interesado en otras opciones.

(c) El siguiente comprador solo selecciona que tenga resistencia antisısmica y ninguna delas otras dos opciones.

(d) El siguiente comprador selecciona exactamente una de las tres opciones.

SOLUCION

Reescribamos la informacion que nos entregan:

P (A) = 0,7

P (B) = 0,8

P (C) = 0,75

P (A ∪B) = 0,85

P (A ∪ C) = 0,9

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 34: Libro Ejercicios Jimenez y Olea Tomo I

28 Capıtulo 2. Probabilidad

P (B ∪ C) = 0,95

P (A ∪B ∪ C) = 0,98

Luego:

(a) P (A ∪B ∪ C) = 0,98

(b) 1− P (A ∪B ∪ C) = 0,02

(c) P (A ∪B ∪ C)− P (B ∪ C) = 0,98− 0,95 = 0,03

(d) P (A ∪B ∪ C)− P (B ∪ C) + P (A ∪B ∪ C)− P (A ∪ C) + P (A ∪B ∪ C)− P (A ∪B)= 3P (A ∪B ∪ C)− P (B ∪ C)− P (A ∪ C)− P (A ∪B)= 3 · 0,98− 0,95− 0,9− 0,85= 0,24

EJERCICIO 2

Se toman muestras de una pieza fundida de aluminio y se clasifican de acuerdo con el acabadode la superficie (en micropulgadas) y con las mediciones de longitud. A continuacion seresumen los resultados obtenidos con 100 muestras.

LongitudExcelente Bueno

Acabado de la Excelente 75 7Superficie Bueno 10 8

Sean A: el evento donde la muestra tiene un acabado excelente, y B: el evento donde lamuestra tiene una longitud excelente. Determine el numero de muestras en Ac ∩ B, Bc, yA ∪ B. Dibuje un diagrama de Venn que represente estos datos. Determine las siguientesprobabilidades.

(a) P (A)

(b) P (B)

(c) P (Ac)

(d) P (A ∩B)

(e) P (A ∪B)

(f) P (Ac ∪B)

SOLUCION:

Sean los eventos A: Acabado Excelente y B: Longitud Excelente, y respectivamente Ac:Acabado bueno y Bc: Longitud Buena, entonces:

Ac ∩B = 10; Bc = 15; A ∪B = 75 + 7 + 10

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 35: Libro Ejercicios Jimenez y Olea Tomo I

2.1 Ejercicios Resueltos 29

Figura 2.1: Diagrama de Venn

(a) P (A) = P (A ∩B) + P (A ∩Bc) = 75+7100

= 82100

(b) P (B) = P (B ∩ A) + P (B ∩ Ac) = 75+10100

= 85100

(c) P (Ac) = P (Ac ∩B) + P (Ac ∩Bc) = 10+8100

= 18100

(d) P (A ∩B) = 75100

(e) P (A ∪B) = P (A) + P (B)− P (A ∩B) = 92100

(f) P (Ac ∪B) = P (Ac) + P (B)− P (Ac ∩B) = 93100

EJERCICIO 3

A continuacion se ofrece un resumen de varias ordenes de compra de dispositivos de alum-brado, de acuerdo con las caracterısticas opcionales solicitadas para estos.

Proporcion deordenes de compra

Sin caracterısticas opcionales 0.3Una caracterıstica opcional 0.5Mas de una caracterıstica opcional 0.2

(a) ¿Cual es la probabilidad de que en una orden se solicite al menos una caracterısticaopcional?

(b) ¿Cual es la probabilidad de que en una orden no se pida mas de una caracterısticaopcional?

SOLUCION:

Sean los eventos:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 36: Libro Ejercicios Jimenez y Olea Tomo I

30 Capıtulo 2. Probabilidad

S: Sin caracterısticas opcionales.

U: Una caracterısticas opcional.

M: Mas de una caracterısticas opcional.

Entonces

(a) P (al menos una caracterıstica) = P (U) + P (M) = 0,5 + 0,2 = 0,7

(b) P (no mas de una caracterıstica) = P (S) + P (U) = 0,3 + 0,5 = 0,8

EJERCICIO 4

La tabla siguiente presenta un resumen del analisis realizado a las flechas de un compresorpara determinar el grado con que estas satisfacen ciertos requerimientos.

la curva cumplecon los requerimientossı no

el acabado superficial cumple sı 345 5con los requerimientos no 12 8

(a) Si se toma una flecha al azar, ¿cual es la probabilidad de que cumpla con los reque-rimientos de acabado superficial?

(b) ¿Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos deacabado o con los de curvatura?

(c) ¿Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos deacabado o que no cumpla con los de curvatura?

(d) ¿Cual es la probabilidad de que la flecha seleccionada cumpla con los requisitos deacabado y curvatura?

SOLUCION:

Sean los eventos A: Cumple con acabado superficial, Ac : No cumple con acabado superficial,C: Cumple con curvatura, Cc: No cumple con curvatura.

(a) P (A) = P (A ∩ C) + P (A ∩ Cc) = 345+5370

= 350370

(b) P (A ∪ C) = P (A) + P (C)− P (A ∩ C) = 350+357−345370

= 362370

(c) P (A ∪ Cc) = P (A) + P (Cc)− P (A ∩ Cc) = 350+13−5370

= 358370

(d) P (A ∩ C) = P (A) + P (C)− P (A ∪ C) = 350+357−362370

= 345370

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 37: Libro Ejercicios Jimenez y Olea Tomo I

2.1 Ejercicios Resueltos 31

EJERCICIO 5

Continuacion del ejercicio anterior. Las flechas se clasifican, ademas, en terminos de lamaquina herramienta utilizada en su fabricacion.

Maquina Herramienta 1

la curva cumplecon los requerimientossı no

el acabado superficial cumple sı 200 1con los requerimientos no 4 2

Maquina Herramienta 2

la curva cumplecon los requerimientossı no

el acabado superficial cumple sı 145 4con los requerimientos no 8 6

(a) Si se elige una flecha al azar, ¿cual es la probabilidad de que cumpla con los requeri-mientos de acabado o con los de curvatura, o que provenga de la maquina herramienta1?

(b) Si se escoge una flecha al azar, ¿cual es la probabilidad de que cumpla con los requer-imientos de acabado o que cumpla con los de curvatura o que provenga de la maquinaherramienta 2?

(c) Si se elige una flecha al azar, ¿cual es la probabilidad de que cumpla con los requisitosde acabado y curvatura o que provenga de la maquina herramienta 2?

(d) Si se toma una flecha al azar, ¿cual es la probabilidad de que cumpla con los requisitosde acabado o que provenga de la maquina herramienta 2?

SOLUCION:

Agregaremos a los eventos definidos en el ejercicio anterior, M1: maquina 1 y M2: maquina2.

(a) P (A ∪ C ∪M1)

= P (A) + P (C) + P (M1)− P (A ∩ C)− P (A ∩M1)− P (C ∩M1) + P (A ∩ C ∩M1)

= 350+357+207−345−201−204+200370

= 364370

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 38: Libro Ejercicios Jimenez y Olea Tomo I

32 Capıtulo 2. Probabilidad

(b) P (A ∪ C ∪M2)

= P (A) + P (C) + P (M2)− P (A ∩ C)− P (A ∩M2)− P (C ∩M2) + P (A ∩ C ∩M2)

= 350+357+163−345−149−153+145370

= 368370

(c) P ((A ∩ C) ∪M2) = P (A ∩ C) + P (M2)− P (A ∩ C ∩M2) = 345+163−145370

= 363370

(d) P (A ∪M2) = P (A) + P (M2)− P (A ∩M2) = 350+163−149370

= 364370

EJERCICIO 6

En cierta gasolinera, 40% de los clientes utilizan gasolina regular sin plomo (A1), 35%gasolina extra sin plomo (A2) y 25% gasolina premium sin plomo (A3). De los clientes queconsumen gasolina regular, solo 30% llenan sus tanques (evento B). De los que consumengasolina extra, 60% llenan sus tanques, mientras que, de los que usan premium, 50% llenansus tanques.

(a) ¿Cual es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo yllene su tanque?.

(b) ¿Cual es la probabilidad de que el siguiente cliente llene el tanque?.

(c) Si el siguiente cliente llena el tanque, ¿Cual es la probabilidad de que pida gasolinaregular?, ¿extra? y ¿premium?.

SOLUCION

Sean los siguientes eventos:

A1: Gasolina regular sin plomoA2: Gasolina extra sin plomoA3: Gasolina Premium sin plomoB: Llena el tanque

Reescribiendo la informacion entregada obtenemos:

P (A1) = 0,4

P (A2) = 0,35

P (A3) = 0,25

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 39: Libro Ejercicios Jimenez y Olea Tomo I

2.1 Ejercicios Resueltos 33

P (B|A1) = 0,3

P (B|A2) = 0,6

P (B|A3) = 0,5

(a) P (A2 ∩B) = P (B|A2)P (A2) = 0,6 · 0,35 = 0,21

(b) P (B) = P (B|A1)P (A1) + P (B|A2)P (A2) + P (B|A3)P (A3)= 0,3 · 0,4 + 0,6 · 0,35 + 0,5 · 0,25 = 0,455

(c) P (A1|B) = P (A1∩B)P (B)

= P (B|A1)P (A1)P (B)

= 0,3·0,40,455

= 0,2637

P (A2|B) = P (A2∩B)P (B)

= P (B|A2)P (A2)P (B)

= 0,6·0,350,455

= 0,4615

P (A3|B) = P (A3∩B)P (B)

= P (B|A3)P (A3)P (B)

= 0,5·0,250,455

= 0,2747

EJERCICIO 7

En relacion al ejercicio anterior, considere la siguiente informacion adicional sobre el uso delas tarjetas de credito:

70% de los clientes que consumen gasolina regular y llenan su tanque usan una tarjetade credito.

50% de todos los clientes que consumen gasolina regular y no llenan su tanque usantarjeta de credito.

60% de todos los clientes que consumen gasolina extra y llenan su tanque usan tarjetade credito.

50% de todos los clientes que consumen gasolina extra y no llenan su tanque usantarjeta de credito.

50% de todos los clientes que consumen gasolina premium y llenan su tanque usantarjeta de credito.

40% de todos los clientes que consumen gasolina premium y no llenan su tanque usantarjeta de credito.

Calcule la probabilidad de cada uno de los siguientes eventos para el siguiente cliente quellegue:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 40: Libro Ejercicios Jimenez y Olea Tomo I

34 Capıtulo 2. Probabilidad

(a) extra,llena el tanque y usa tarjeta de credito.

(b) premium, no llena el tanque y usa tarjeta de credito.

(c) premium y usa tarjeta de credito

(d) usa tarjeta de credito, (un diagrama de arbol puede ser util).

SOLUCION:

A los eventos definidos en el ejercicio anterior, agregaremos C: Usa tarjeta de credito.

Reescribiendo nuevamente la informacion entregada en esta parte, obtenemos:

P (C|A1 ∩B) = 0,7

P (C|A1 ∩Bc) = 0,5

P (C|A2 ∩B) = 0,6

P (C|A2 ∩Bc) = 0,5

P (C|A3 ∩B) = 0,5

P (C|A3 ∩Bc) = 0,4

(a)

P (A2 ∩B ∩ C) =P (C|A2 ∩B) · P (A2 ∩B)

=P (C|A2 ∩B)P (B|A2)P (A2)

=0,6 · 0,6 · 0,35 = 0,126

(b)

P (A3 ∩Bc ∩ C) =P (C|A3 ∩Bc)P (A3 ∩Bc)

=P (C|A3 ∩Bc)P (Bc|A3)P (A3)

=0,4 · 0,5 · 0,25 = 0,05

(c)

P (A3 ∩ C) =P (A3 ∩ C ∩B) + P (A3 ∩ C ∩Bc)

=P (C|A3 ∩B)P (A3 ∩B) + P (C|A3 ∩Bc)P (A3 ∩Bc)

=P (C|A3 ∩B)P (B|A3)P (A3) + P (C|A3 ∩Bc)P (Bc|A3)P (A3)

=0,5 · 0,5 · 0,25 + 0,4 · 0,5 · 0,25 = 0,1125

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 41: Libro Ejercicios Jimenez y Olea Tomo I

2.1 Ejercicios Resueltos 35

(d) P (C) = P (A1 ∩B ∩C) + P (A1 ∩Bc ∩C) + P (A2 ∩B ∩C) + P (A2 ∩Bc ∩C) + P (A3 ∩B ∩ C) + P (A3 ∩Bc ∩ C)

= P (C|A1 ∩ B)P (A1 ∩ B) + P (C|A1 ∩ Bc)P (A1 ∩ Bc) + P (C|A2 ∩ B)P (A2 ∩ B) +P (C|A2 ∩Bc)P (A2 ∩Bc) + P (C|A3 ∩B)P (A3 ∩B) + P (C|A3 ∩Bc)P (A3 ∩Bc)

= P (C|A1∩B)P (B|A1)P (A1)+P (C|A1∩Bc)P (Bc|A1)P (A1)+P (C|A2∩B)P (B|A2)P (A2)+P (C|A2∩Bc)P (Bc|A2)P (A2)+P (C|A3∩B)P (B|A3)P (A3)+P (C|A3∩Bc)P (Bc|A3)P (A3)

= 0,7 ·0,3 ·0,4+0,5 ·0,7 ·0,4+0,6 ·0,6 ·0,35+0,5 ·0,4 ·0,35+0,5 ·0,5 ·0,25+0,4 ·0,5 ·0,25= 0,5325

Figura 2.2: Arbol

EJERCICIO 8

En la empresa Coca-Cola el llenado de las botellas con bebida es realizado automaticamentepor una maquina que funciona a distintas velocidades. La probabilidad de que el volumende llenado sea incorrecto es de 0.001 cuando el proceso se realiza a baja velocidad. Cuandoel proceso de llenado se realiza a alta velocidad, la probabilidad de llenado incorrecto es de0.01.Suponga que el 25% de las botellas son llenadas cuando el proceso se realiza a alta velocidad,mientras que el resto de botellas son llenadas a una baja velocidad.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 42: Libro Ejercicios Jimenez y Olea Tomo I

36 Capıtulo 2. Probabilidad

(a) ¿Cual es la probabilidad de encontrar una botella con un volumen incorrecto en suinterior?

(b) ¿Cual es la probabilidad de encontrar un botella llena con un volumen incorrecto y quehaya sido llenado cuando el proceso se realiza a baja velocidad?

(c) ¿Cual es la probabilidad de que el proceso de llenado de las botellas haya sido a bajavelocidad, si se sabe que la botella esta efectivamente con un volumen correcto?

(d) Si se encuentra una botella llenada con un volumen incorrecto, ¿cual es la probabilidadde que haya sido llenado cuando el proceso se realiza a alta velocidad?

SOLUCION:

Se definen los siguientes eventos:

A: Llenado a alta velocidad.

B: Llenado a baja velocidad.

C: Volumen llenado correcto

I: Volumen llenado incorrecto

Figura 2.3: Arbol

(a) P (I) = P (A ∩ I) + P (B ∩ I) = P (I|A)P (A) + P (I|B)P (B)= 0,25 · 0,01 + 0,75 · 0,001 = 0,00325

(b) P (I ∩B) = P (I|B)P (B) = 0,00075

(c) P (B|C) = P (B∩C)P (C)

= 0,75×0,9990,75×0,999+0,25×0,99

= 0,7516

(d) P (A|I) = P (A∩I)P (I)

= 0,25×0,010,25×0,01+0,75×0,001

= 0,7692

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 43: Libro Ejercicios Jimenez y Olea Tomo I

2.1 Ejercicios Resueltos 37

EJERCICIO 9

Un juego para dos jugadores se denomina ”¡QUE ES ESTO!”. Un jugador A, comienzalanzando un dado numerado en cinco de sus caras: 1, 2, 3, 4 y 6; y en la sexta cara tiene escritala frase ”¡QUE ES ESTO!”. Las caras numeradas son las puntuaciones que va obteniendocada vez. El jugador A sigue jugando hasta que saque ”¡QUE ES ESTO!”. Entonces, el turnopasa al jugador B que lanza un segundo dado. Este dado indica en cuatro de sus caras queel turno de lanzar el dado numerado pasa al jugador B y otras dos caras que indican que eljugador A continua con el dado numerado.

(a) ¿Cual es la probabilidad de que el jugador A saque un total de 4 ptos. en dos tiradas,sin que haya salido ”¡QUE ES ESTO!”?

(b) ¿Cual es la probabilidad de que, despues de lanzar el dado el jugador A, lance el jugadorB y el jugador A pierda su turno?

(c) ¿Cual es la probabilidad de que el jugador A le toque lanzar en la tercera tirada?

SOLUCION:

Sea definen los siguientes eventos:

Ak : resultado en el k-esimo lanzamiento del dado numerado por el jugador A.

Ak : Turno k-esimo de jugar el dado numerado corresponde al jugador A; con k = 2, 3, . . ..

Bk : Turno k-esimo de jugar el dado numerado corresponde al jugador B; con k = 2, 3, . . ..

Figura 2.4: Arbol

(a)

P ((A1 = 1 ∩ A2 = 3) ∪ (A1 = 2 ∩ A2 = 2) ∪ (A1 = 3 ∩ A2 = 1)) =1

6· 1

6+

1

6· 1

6+

1

6· 1

6

=3

36

=1

12

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 44: Libro Ejercicios Jimenez y Olea Tomo I

38 Capıtulo 2. Probabilidad

(b)

P (B2 ∩B3) = P (B2)P (B3)

=1

6· 4

6

=4

36

=1

9

(c)

P ((A2 ∩ A3) ∪ (B2 ∩ A3)) = P (A2 ∩ A3) + P (B2 ∩ A3)

= P (A2)P (A3) + P (B2)P (A3)

=5

6· 5

6+

1

6· 2

6

=27

36

=3

4

EJERCICIO 10

Un aficionado usa el siguiente sistema para pronosticar el tiempo atmosferico. Clasifica undıa como seco o mojado y supone que la probabilidad de que un dıa dado sea igual al anterioresta dado por p (0 ≤ p ≤ 1). En base a ciertos registros se sabe que el primer dıa de Enerotiene probabilidad β (0 ≤ β ≤ 1) de ser seco.Si βn = P (n-esimo dıa del ano es seco), obtenga una expresion para β2 y β3 en funcion deβ y p.(Hind: Puede ser util aplicar probabilidad totales)

SOLUCION:

Definamos como:

Di: ”El dıa i-esimo del ano es seco”; i = 1, 2, . . . , n.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 45: Libro Ejercicios Jimenez y Olea Tomo I

2.1 Ejercicios Resueltos 39

P (Di | Di−1) = p = P (Dci | Dc

i−1)

P (D1) = β

luego tenemos queβ2 = P (D2) = P (D2 ∩D1) + P (D2 ∩Dc

1)

⇒ β2 = P (D2 | D1)P (D1) + P (D2 | Dc1)P (Dc

1)

⇒ β2 = p× P (D1) + (1 − p)× P (Dc1)

⇒ β2 = p× β + (1 − p)× (1 − β)

∴ β2 = (2p − 1)β + (1 − p)

Ahora se obtiene de la misma manera β3

β3 = P (D3) = P (D3 ∩D2) + P (D3 ∩Dc2)

⇒ β3 = P (D3 | D2)P (D2) + P (D3 | Dc2)P (Dc

2)

⇒ β3 = p× P (D2) + (1 − p)× P (Dc2)

⇒ β3 = p× P (D2) + (1 − p)× (1 − P (D2))

⇒ β3 = (2p − 1)× P (D2) + (1 − p)

⇒ β3 = (2p − 1)× β2 + (1 − p)

⇒ β3 = (2p − 1)× (2p − 1)β + (1 − p) + (1 − p)

∴ β3 = (2p − 1)2β + (2p − 1)(1 − p) + (1 − p)

EJERCICIO 11

En la serie mundial de beisbol, dos equipos A y B juegan una serie de partidos uno contraotro y el primer equipo que gana un total de tres partidos es el ganador de la serie mundial.Si la probabilidad de que el equipo A gane un partido contra el equipo B es 1

3.

(a) Describa el espacio muestral de este experimento.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 46: Libro Ejercicios Jimenez y Olea Tomo I

40 Capıtulo 2. Probabilidad

(b) ¿Cual es la probabilidad de que el equipo A gane la serie mundial?

(c) Si la probabilidad de que el equipo A gane cualquier partido es p (0 < p < 1). ¿Cuales la probabilidad de que sea necesario jugar los 5 partidos para determinar al ganadorde la serie?

(d) Si la serie termina en el cuarto juego, ¿cual es la probabilidad de que el ganador sea elequipo B?

SOLUCION

(a) El espacio graficamente serıa:

Figura 2.5: Arbol

o de la misma manera todas las combinaciones que estan en el arbol como sigue:

Ω = AAA, AABA, AABBA,AABBB, . . . , BBB

donde #Ω = 20.

(b) Sea S: A gana el mundial

P (S) = P (AAA ∪ AABA ∪ AABBA ∪ ABAA ∪ ABABA ∪ ABBAA∪BAAA ∪ BAABA ∪ BABAA ∪ BBAAA)

=

(1

3

)3

+ 3

(1

3

)32

3+ 6

(1

3

)3(2

3

)2

(c) T : Es necesario jugar 5 partido para determinar el ganador de la serie mundial

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 47: Libro Ejercicios Jimenez y Olea Tomo I

2.1 Ejercicios Resueltos 41

P (T ) = P (AABBB ∪ ABABA ∪ ABABB ∪ BAABA∪BAABB ∪ BABAA ∪ BABAB ∪ BBAAA ∪ BBAAB)

= 6p3(1− p)2 + 6p2(1− p)3

= 6p2(1− p)2(p + 1− p)

= 6p2(1− p)2

(d) Sea C: La serie termina en el cuarto juego.

P (Sc|C) =P (Sc ∩ C)

P (C)

=P (ABBB ∪BABB ∪BBAB)

P (AABA ∪ ABAA ∪ ABBB ∪BAAA ∪BABB ∪BBAB)

=3p(1− p)3

3p(1− p)3 + 3p3(1− p)

=3p(1− p)3

3p(1− p)(1− p)2 + p2

=(1− p)2

p2 + (1− p)2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 48: Libro Ejercicios Jimenez y Olea Tomo I

42 Capıtulo 2. Probabilidad

2.2. Ejercicios Propuestos

1. Una costura hecha en un avion necesita 25 remaches. La costura tendra que volver arealizarse si cualquiera de los remaches esta defectuoso. Suponga que los remaches estandefectuosos independientemente unos de otros, cada uno con la misma probabilidad.

a) Si 14% de todas las costuras necesitan volver a efectuarse, ¿cual es la probabilidadde que un remache este defectuoso?

b) ¿Que tan pequena debe ser la probabilidad de un remache defectuoso para ase-gurar que solo 10% de todas las costuras necesiten volver a ejecutarse?

2. Dos bombas conectadas en paralelo fallan independientemente una de la otra en undıa dado. La probabilidad de que la bomba mas vieja falle es 0.10 y la probabilidad deque solo la bomba mas nueva falle es 0.05. ¿Cual es la probabilidad de que el sistemade bombeo falle en cualquier dıa dado (lo que sucedera si ambas bombas fallan)?

3. Se tienen 5 aspirantes (Juan, Dario, Marıa, Susana y Natalia) para dos trabajos identi-cos. Un supervisor selecciona dos aspirantes para ocupar esos puestos.

a) Hacer un lista de los modos posibles en que se pueden ocupar los puestos. Es decir,hacer una lista de todas las selecciones posibles de dos de los cincos aspirantes.

b) Sea A el conjunto de selecciones que contienen por lo menos un hombre. ¿¿Cuantoselementos tiene A?

c) Sea B el conjunto de selecciones que contienen exactamente un hombre. ¿¿Cuantoselementos tiene B?

d) Escribir el conjunto que contiene dos mujeres, en terminos de A y B.

e) Hacer una lista de los elementos en A, AB, A ∪B, y AB.

4. Una companıa manufacturera tiene dos expendios al menudeo. Se sabe que el 30 % delos clientes potenciales compran productos solo en la tienda I, el 50% compra en latienda II, el 10% compra en la tienda I y II, y el 10% de los consumidores no compraen ninguna de las dos. Sea A el evento en el que un cliente potencial, seleccionado alazar, compra en I y B el evento el evento en el que compra en II. Calcular las siguientesprobabilidades:

a) P (A)

b) P (B)

c) P (A ∪B)

d) P (AB)

e) P (AB)

f ) P (A ∪B)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 49: Libro Ejercicios Jimenez y Olea Tomo I

2.2 Ejercicios Propuestos 43

5. De las personas que llegan a un aeropuerto pequeno, el 60% vuela en aeroplanos pri-vados y el 10% vuela en aeroplanos comerciales que no pertenecen a una aerolınea. Delas personas que llegan por aerolıneas principales, el 50% viaja por negocios, mientrasque esa cifra es de 60% para los que llegan en aeroplanos privados y de 90% para losque llegan en otros aviones comerciales. Para una persona que se selecciona al azar deentre un grupo de llegadas, calcular la probabilidad de que

a) la persona este en viaje de negocios.

b) la persona este en viaje de negocios y llegue en un aeroplano privado.

c) la persona este en viaje de negocios, y se sabe que llego en un aeroplano comercial.

d) la persona haya llegado en un aeroplano privado, dado que viaja por negocios.

6. Supongase que las calles de una ciudad se trazan en una red que va de norte a sur y deoriente a poniente. Considerese el planteamiento siguiente para patrullar una zona de16 por 16 manzanas. Un patrullero comienza a caminar en el cruce central de la zona.En la esquina de cada cuadra elige al azar dirigirse al norte, al sur, al este o al oeste.

a) ¿Cuales es la probabilidad de que alcance el lımite de su zona de patrullaje paracuando haya caminado seis cuadras?

b) ¿Cuales es la probabilidad de que regrese a su punto de partida despues de habercaminado exactamente cuatro cuadras?

7. Se tienen dos eventos mutuamente excluyentes, A y B, tales que P (A) > 0 y P (B) > 0.¿Son independientes A y B? Demuestre su respuesta.

8. Un armador de ventiladores electricos usa motores de dos proveedores. La companıaA le suministra el 90% y la companıa B el otro 10% de los motores. Supongase quese sabe que el 5% de los motores que suministra la companıa A son defectuosos yque el 3% de los que suministra la companıa B tambien lo son. Se encuentra que unventilador ya armado tiene un motor defectuoso. ¿Cual es la probabilidad de que esemotor haya sido suministrado por la companıa B?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 50: Libro Ejercicios Jimenez y Olea Tomo I

44 Capıtulo 2. Probabilidad

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 51: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 3

Variables Aleatorias Discretas

3.1. Ejercicios Resueltos

EJERCICIO 1

Fernando y Nicolas juegan un partido de tenis al mejor de tres sets (esto es, el que gana dossets gana el partido). Suponga que la probabilidad de que Fernando gane el primer set es 0,5.Para los siguientes sets, la probabilidad de que Fernando gane es: 0,5 + (−1)Y (0,1)(k − 1) ,k = 2, 3 donde

Y =

1, si Fernando perdio el set anterior0, si Fernando gano el set anterior

(a) Sea X: N de sets que Fernando perdio. Encuentre la funcion de distribucion de X(esto es, ”la tabla”).

(b) Calcule la probabilidad de que Fernando gane el partido.

(c) Suponga que la empresa ”ABCDE” le paga a Fernando mil dolares por el encuentro,pero por cada set que este pierde se le descuentan 100 dolares. Sea G: ganancia obtenidapor Fernando. Encuentre E(G).

Sugerencia: Puede ser util para este problema hacer el diagrama de arbol.

SOLUCION

Las posibles secuencia del partido se aprecian en el arbol siguiente:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 52: Libro Ejercicios Jimenez y Olea Tomo I

46 Capıtulo 3. Variables Aleatorias Discretas

Figura 3.1: Arbol

(a) Definimos X: no set que Fernando perdio con X ∈ 0, 1, 2. Luego las probabilidadespara todos los casos son:

P (X = 0) = P (GG) = 0,5× 0,6 = 0,3P (X = 1) = P (GPG ∨ PGG) = 0,5 · 0,4 · 0,3 + 0,5 · 0,4 · 0,7 = 0,2P (X = 2) = 1− P (X = 0)− P (X = 1) = 1− 0,3− 0,2 = 0,5

Luego la funcion de distribucion de x es:

X 0 1 2P (X) 0.3 0.2 0.5

(b) P (Fernando gane el partido) = P (X = 0) + P (X = 1) = 0,3 + 0,2 = 0,5

(c) Sea H:ganancia obtenida por Fernando, por lo tanto H ∈ 800, 900, 1000.

Luego las probabilidades para las ganancias son:

P (H = 800) = P (x = 2) = 0,5P (H = 900) = P (x = 1) = 0,2P (H = 1000) = P (x = 0) = 0,3

∴ E(H) =∑

Rec H

h · P (H = h) = 800 · 0,5 + 900 · 0,2 + 1000 · 0,3 = 880

EJERCICIO 2

Sea X: numero de neumaticos de un automovil seleccionado al azar, que tengan baja la pre-sion.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 53: Libro Ejercicios Jimenez y Olea Tomo I

3.1 Ejercicios Resueltos 47

(a) ¿Cual de las siguientes tres funciones p(x) es una pmf legıtima para x, y por que no sepermiten las otras dos?

x 0 1 2 3 4p(x) 0.3 0.2 0.1 0.05 0.05p(x) 0.4 0.1 0.1 0.1 0.3p(x) 0.4 0.1 0.2 0.1 0.3

(b) Para la pmf legıtima de la parte (a), calcule P (2 ≤ X ≤ 4), P (X ≤ 2) y P (X 6= 0).

(c) Si p(x) = c(5− x), para x = 0, 1, 2, 3, 4. ¿Cual es el valor de c?.

SOLUCION

(a) Recordemos que para que una pmf sea legıtima debe cumplir con que la suma de ella,sobre todo el recorrido, resulte 1, y 0 ≤ p(x) ≤ 1. Luego observando las tres pmf prop-uestas, podemos observar que las tres tiene valores entre 0 y 1, pero solo la segundasuma 1.

∴ p(x) =

0,4, x=0;0,1, x=1;0,1, x=2;0,1, x=3;0,3, x=4;0,0, e.o.c.

(b) P (2 ≤ X ≤ 4) = 0,1 + 0,1 + 0,3 = 0,5P (X ≤ 2) = 0,4 + 0,1 + 0,1P (X 6= 0) = 0,1 + 0,1 + 0,1 + 0,3 = 0,6

(c) Si p(x) es la nueva pmf, debe cumplir que la suma sobre todo su recorrido de 1.

4∑x=0

c(5− x) = 1 → c4∑

x=0

(5− x) = 1 → c(5 + 4 + 3 + 2 + 1) = 1 → 15c = 1 → c =1

15.

EJERCICIO 3

Si el 90% de todos los solicitantes para cierto tipo de hipoteca no llenan correctamente elformato de solicitud en la primera remision, ¿Cual es la probabilidad de que entre 15 deestos solicitantes seleccionados al azar:

(a) Por lo menos 12 no la llenen a la primera remision?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 54: Libro Ejercicios Jimenez y Olea Tomo I

48 Capıtulo 3. Variables Aleatorias Discretas

(b) Entre 10 y 13 inclusive no la llenen a la primera remision?

(c) A lo sumo 2 llenen correctamente sus formatos en la primera remision?

SOLUCION

(a) Sea X: numero de personas que rellenan erroneamente la solicitud. Luego

X ∼ Bin(15, 0,9) x = 0, 1, 2, ...

Por lo tanto lo que nos piden es:

P (X ≥ 12) = P (X = 12) + P (X = 13) + P (X = 14) + P (X = 15)

=15∑

x=12

(15

x

)0,9x(1− 0,9)15−x = 0,9444

(b)P (10 ≤ X ≤ 13) = P (X = 10) + P (X = 11) + P (X = 12) + P (X = 13)

=13∑

x=10

(15

x

)0,9x(1− 0,9)15−x = 0,4488

(c) Sea Y: numero de personas que llenan correctamente sus formatos. Luego

Y ∼ Bin(15, 0,1) y = 0, 1, 2, ...

Por lo tanto lo que nos piden es:

P (Y ≤ 2) = P (Y = 0) + P (Y = 1) + P (Y = 2) =2∑

y=0

(15

y

)0,1y(1− 0,1)15−y = 0,8159

EJERCICIO 4

El voltaje de una baterıa nueva puede ser aceptable (A) o no aceptable (B). Cierta linterna demano necesita dos baterıas, ası que estas han de seleccionarse y probarse independientementehasta encontrar dos aceptables. Supongamos que el 80% de todas las baterıas tienen voltajeaceptable y denotemos por Y el numero de baterıas que deben ser probadas.

(a) ¿Cuanto vale p(2), es decir, P (Y = 2)?

(b) ¿Cuanto vale p(3) ?

(c) Para tener Y=5. ¿Que debe ser cierto de la quinta baterıa seleccionada?. (Hint: Hagauna lista de los casos favorables de Y=5 y luego determine p(5)).

(d) Utilice el lector del modelo de sus respuestas para las partes (a) a la (c) para obteneruna formula general para p(y).

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 55: Libro Ejercicios Jimenez y Olea Tomo I

3.1 Ejercicios Resueltos 49

SOLUCION

Considerando que una baterıa es aceptable con probabilidad 0.8 y por ende no aceptable conprobabilidad 0.2:

(a)

P (Y = 2) = P (A ∩ A) = 0,8 · 0,8 = 0,64

(b) En este caso hay dos formas de obtener Y=3:

P (Y = 3) = P (A ∩B ∩ A) + P (B ∩ A ∩ A) = 0,8 · 0,2 · 0,8 + 0,2 · 0,8 · 0,8 = 0,256

(c) Como se revisa hasta encontrar 2 buenas en voltaje, entonces la quinta obligadamentedebe ser Aceptable (A). La lista de los posibles resultados son:

ABBBABABBABBABABBBAA

Luego calculamos lo pedido:

P (Y = 5) = 0,82 · 0,23 · 4 = 0,204

(d) Si observamos la relacion que tienen (a), (b) y (c), podemos rescatar que

P (Y = y) = (y − 1)0,820,2y−2, y ≥ 2

P (Y = y) =

(y − 1

2− 1

)0,820,2y−2, y ≥ 2

Y la forma que tiene esta pmf, corresponde a la conocida Binomial Negativa.

Y ∼ BN(r, p)

donde r corresponde a los exitos que se quieren obtener, en este caso 2 y p es laprobabilidad del exito, en este caso 0.8.

EJERCICIO 5

Un director tecnico de tenis tiene una canasta de 25 pelotas; 15 de estas son pelotas Penn ylas otras 10 son Wilson. Cada uno de cuatro jugadores seleccionan 3 pelotas para un juego.

(a) ¿Cual es la probabilidad de que exactamente 8 de las pelotas seleccionadas sean Penn?

(b) ¿Cual es la probabilidad de que todas las pelotas seleccionadas sean Wilson?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 56: Libro Ejercicios Jimenez y Olea Tomo I

50 Capıtulo 3. Variables Aleatorias Discretas

SOLUCION

Resumiendo los datos entregados, tenemos lo siguiente:N:25 pelotasP:15 PennW:10 Wilsonn:12 tamano muestra

Sea X: numero de pelotas de las que me sirven, en la muestra sin reposicion, en este casopelotas Penn. Luego

X ∼ Hiper(15, 10, 12) → P (X = x) =

(Px

)(N−Pn−x

)(Nn

)(a)

P (X = 8) =

(158

)(104

)(2512

) = 0,2599

(b)

P (X = 0) =

(150

)(1012

)(2512

) = 0

Pues(1012

)no esta definido, es decir no existe, ya que es ilogico sacar mas pelotas de un

tipo de las que tengo, luego es un evento imposible.

EJERCICIO 6

Un artıculo de Los Angeles Times (3 de Dic. de 1993) reporta que de cada 200 personas,una lleva el gene defectuoso que ocasiona cancer de colon hereditario. En una muestra de1000 personas ¿Cual es la distribucion aproximada del numero de quienes llevan este gene?.Utilice esta distribucion para calcular la probabilidad aproximada de que:

(a) Entre 4 y 7 inclusive, personas lleven el gene.

(b) Por lo menos 8 lleven el gene.

SOLUCION

Por las caracterısticas del problema, con X= numero de personas con el gene.

X ∼ Poisson(5)

(a)P (4 ≤ X ≤ 7) = P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7)

=54e−5

4!+

55e−5

5!+

56e−5

6!+

57e−5

7!= 0,602

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 57: Libro Ejercicios Jimenez y Olea Tomo I

3.1 Ejercicios Resueltos 51

(b)

P (X ≥ 8) =∞∑

x=8

5xe−5

x!

= 1−7∑

x=0

5xe−5

x!= 0,133

EJERCICIO 7

Una companıa telefonica emplea cinco operadoras de informacion que reciben solicitudes deinformacion independientemente una de otra, cada una segun un proceso de Poisson con tasaλ = 2× minuto.

(a) ¿Cual es la probabilidad de que durante un periodo dado de un minuto, la primeraoperadora no reciba solicitudes?

(b) ¿Cual es la probabilidad de que durante un periodo dado de un minuto, exactamente4 de las 5 operadoras no reciban solicitudes?

(c) Escriba una expresion para la probabilidad de que durante un periodo dado de unminuto, todas las operadoras reciban exactamente el mismo numero de solicitudes.

SOLUCION

Es importante tener presente que las operadoras atienden solicitudes independientementeuna de otra. Luego

Sea X: numero de llamadas en un minuto de la operadora x. Por lo tanto

X ∼ Poisson(2)

P (X = 0) =e−220

0!= e−2 = 0,1353

(b) En este caso tenemos un experimento incluido en el otro, ya que cuando contamos elnumero de operadoras que cumplen con algo de entre un total, estamos hablando deun experimento Binomial, en el cual, la probabilidad del exito esta modelada por ladistribucion Poisson. Luego

Y: numero de operadoras que reciben cero llamadas entre las 5Y ∼ Bin(5, P (X = 0)), recuerde que X ∼ Poisson(2)

→ P (Y = 4) =

(5

4

)0,13534(1− 0,1353)5−4 = 0,001451

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 58: Libro Ejercicios Jimenez y Olea Tomo I

52 Capıtulo 3. Variables Aleatorias Discretas

(c) Como las operadoras son independientes una de las otras y las 5 tienen exactamente lamisma distribucion, basta considerar la de una operadora y potenciarla a las 5. Luegola expresion para tal calculo serıa:

∞∑x=0

[P (X = x)]5

EJERCICIO 8

Para promocionar sus helados de paleta, una fabrica pone cada 15 helados una etiqueta quedice ”vale otro”. Cualquiera persona que compre un helado y le salga ”vale otro” obtieneun helado gratis. Estos helados cuestan 100 pesos cada uno. Si Ud. decide comprar estoshelados hasta obtener uno gratis ¿cuanto esperarıa gastar?

SOLUCION

Sea X: no helados comprados hasta obtener el primero gratis.

De lo anterior de deduce que la variable X tiene distribucion geometrica

X ∼ Geometrica(p) p = P (Salga gratis) =1

15

Sea G = 100X, luego la que uno esperarıa gastar serıa la E(G).

E(G) = 100E(X) = 1001

p= 100 · 15 = 1500

∴ lo que se esperarıa gastar si se compran helados hasta obtener uno gratis serıan $1500.

EJERCICIO 9

Un examen consta de n preguntas con k alternativas cada una. Suponga que cierto alumnoresponde cada pregunta de acuerdo al siguiente procedimiento: si conoce la alternativa cor-recta, entonces la escoge con probabilidad 1; si no la sabe, entonces escoge una alternativaal azar. Suponga que la probabilidad de que el alumno conozca la alternativa correcta es p(0 < p < 1), igual para todas las preguntas y que las distintas preguntas se responden enforma independiente.

(a) Sea X el numero de preguntas respondidas correctamente. Encuentre la funcion deprobabilidad o cuantıa de X.

(b) ¿Si una de estas preguntas fue respondida correctamente, cual es la probabilidad deque el alumno haya sabido la alternativa correcta?

SOLUCION

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 59: Libro Ejercicios Jimenez y Olea Tomo I

3.1 Ejercicios Resueltos 53

(a) Sean los eventos:

S: Saber la respuesta.C: respuesta correcta.

Entonces, por probabilidad total.

P (C) = P (C|S)P (S) + P (C|S ′)P (S ′)

= 1 · p +1

k· (1− p)

= p +(1− p)

k

como las respuestas a cada pre4gunta son independientes y p∗ = P (C), la probabilidadde responder correctamente una pregunta, es constante para cada pregunta, se tieneque:

X ∼ Bin(n, p∗)

con p∗ = p + 1−pk

.

Luego

p(x) = P (X = x) =

(n

x

)(p∗)x(1− p∗)n−x, x = 0, 1, 2, 3, . . . , n.

(b)

P (S|C)Bayes=

P (C|S)P (S)

P (C)

=1 · p

p + (1−p)k

=kp

(k + 1)p + 1

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 60: Libro Ejercicios Jimenez y Olea Tomo I

54 Capıtulo 3. Variables Aleatorias Discretas

3.2. Ejercicios Propuestos

1. Suponga que cada una de las llamadas que hace una persona a una estacion de radiomuy popular tiene una probabilidad de 0.02 de que la lınea no este ocupada. Supongaque las llamadas son independientes.

a) ¿Cual es la probabilidad de que la primera llamada que entre sea la decima querealiza la persona?

b) ¿Cual es la probabilidad de que sea necesario llamar mas de cinco veces parahallar desocupada la lınea?

c) ¿Cual es le numero promedio de llamadas que deben hacerse para hallar desocu-pada la lınea?

2. Un negocio de computadores que atiende pedidos por correo tiene seis lıneas telefonicas.Simbolicemos con correo X el numero de lıneas con uso en un momento especıfico.Supongamos que la pmf de X estas dada en la tabla siguiente.

x 0 1 2 3 4 5 6p(x) 0.1 0.15 0.20 0.25 0.20 0.06 0.04

Calcule la probabilidad de cada uno de los siguientes eventos:

a) A lo sumo 3 lıneas estan en uso

b) Menos de 3 lıneas estan en uso

c) Por lo menos 3 lıneas estan en uso

d) Entre 2 y 5 lıneas estan en uso

e) Entre 2 y 4 lıneas no estan en uso

f ) Por lo menos 4 lıneas no estan en uso

3. Una companıa de seguros ofrece a sus tenedores de polizas varias opciones diferentespara el pago de primas. Para un tenedor seleccionado al azar, sea X=numero de mesesentre pagos sucesivos. La cdf de X es como sigue:

F (x) =

0 si x < 10,30 si 1 ≤ x < 30,40 si 3 ≤ x < 40,45 si 4 ≤ x < 60,60 si 6 ≤ x < 121 si 12 ≤ x

a) ¿Cual es la pmf de X?

b) Solo con el uso de la cdf, calcule P (3 ≤ X ≤ 6) y P (4 ≤ X)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 61: Libro Ejercicios Jimenez y Olea Tomo I

3.2 Ejercicios Propuestos 55

4. La pmf para X=numero de defectos importantes que tiene un electrodomestico de uncierto tipo, seleccionado al azar, es

x 0 1 2 3 4p(x) 0.08 0.15 0.45 0.27 0.05

Calcule lo siguiente:

a) E(X).

b) V (X) directamente de la definicion.

c) La desviacion estandar de X.

d) V (X) usando la formula abreviada.

5. Un distribuidor de aparatos electrodomesticos vende tres modelos diferentes de conge-ladores verticales con capacidad de 13.5, 15.9 y 19.1 pies cubicos de espacio de alma-cenaje. Sea X=cantidad de espacio de almacenaje de un congelador comprado por elsiguiente cliente. Supongamos que X tiene pmf

x 13.5 15.9 19.1p(x) 0.2 0.5 0.3

a) Calcule E(X), E(X2) y V (X).

b) Si el precio de un congelador con capacidad de X pies cubicos es 25X−8,5, ¿cuales el precio esperado por el cliente que va a comprar un congelador?

c) ¿Cual es la varianza del precio 25X − 8,5 pagado por el cliente?

d) Supongamos que mientras la capacidad nominal de un congelador es X, la ca-pacidad real es h(X) = X − 0,01X2. ¿Cual es la capacidad real esperada delcongelador comprado por el siguiente cliente?

6. Un equipo tiene 5 componentes, de las cuales 2 son defectuosas. Se inspeccionan lascomponentes en un orden aleatorio.

a) Si X es el numero de componentes que deben examinarse antes de encontrar unadefectuosa calcule E(X).

b) Si Y es el numero de componentes que deben examinarse para encontrar las dosdefectuosas, calcule E(Y ).

7. Sea X una variable aleatoria que sigue una de las siguientes distribuciones.

a) Binomial(n, p).

b) Poisson(λ).

c) Geometrica con parametro p.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 62: Libro Ejercicios Jimenez y Olea Tomo I

56 Capıtulo 3. Variables Aleatorias Discretas

Para cada distribucion calcule:

a) E(X).

b) E(X(X − 1)).

c) E(X2).

d) V ar(X).

8. Una variable aleatoria puede tomar cada uno de los siete valores−3, −2, −1, 0, 1, 2, 3con la misma probabilidad. Determinar fY (y) donde Y = X2 −X.

9. Para cada uno de los siguientes, establezca si es razonable o no, utilizar la distribucionbinomial como modelo de variable aleatoria y por que. Indique todas las suposicionesque tenga que hacer, segun sea el caso.

a) Un proceso produce miles de transductores de temperatura. Sea X el numero detransductores que no cumplen con los requisitos de diseno de una muestra de 30tomada al azar del proceso.

b) De un lote de 50 transductores de temperatura, se toma una muestra de 30 sinreemplazo. Sea X el numero de transductores de la muestra que no cumplen conlos requisitos de diseno.

c) Cuatro componentes electronicos identicos estan conectados a un controlador quepuede conmutar de un componente que falla a otro de los que quedan comorepuesto. Sea X el numero de componentes que han fallado despues de ciertotiempo de operacion.

d) Sea X el numero de accidentes que ocurren en las carreteras federales de ciertoestado durante un mes.

e) Sea X el numero de respuestas correctas de un estudiante que resolvio un examende opcion multiple, en las que pudo eliminar, en algunas preguntas, varias de lasopciones porque eran incorrectas, y en otras, todas las opciones incorrectas.

f ) Los defectos sobre la superficie de un chip semiconductor aparecen al azar. Sinembargo, solo el 80% de los defectos pueden detectarse mediante pruebas. Setoma una muestra de 40 chips que tienen un defecto y se someten a prueba. SeaX el numero de chips en los que la prueba encuentra un defecto.

g) Considere de nuevo la situacion presentada en f). Suponga ahora que la muestrade 40 chips esta formada por chips que tienen uno o cero defectos.

h) En una operacion de llenado se intenta llenar paquetes de detergentes, de modoque tengan el peso senalado en publicidad. Sea X el numero de paquetes dedetergente que pesan menos que lo indicado en la publicidad.

i) Los errores en un canal de comunicacion digital se presentan en rachas que afectande manera severa a varios bits consecutivos. Sea X el numero de bits transmitidoserroneamente en el envıo de 100000 bits.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 63: Libro Ejercicios Jimenez y Olea Tomo I

3.2 Ejercicios Propuestos 57

j ) Sea X el numero de grietas superficiales de una bobina grande de acero galva-nizado.

10. Este ejercicio ilustra el impacto que la baja calidad puede tener sobre planes y costos.Un proceso de fabricacion tiene 100 pedidos en espera de ser surtidos. Cada pedidonecesita un componente que se compra a otro proveedor. Sin embargo, lo comun esidentificar 2% de estos componentes como defectuosos; por otra parte, puede supon-erse que el estado de cada componente es independiente del de los demas.

a) Si el inventario del fabricante es de 100 componentes, Cual es la probabilidad deque se puedan surtir los 100 pedidos sin tener que pedir mas componentes?

b) Si el inventario del fabricante es de 102 componentes, Cual es la probabilidad deque se puedan surtir los 100 pedidos sin tener que pedir mas componentes?

c) Si el inventario del fabricante es de 105 componentes, Cual es la probabilidad deque se puedan surtir los 100 pedidos sin tener que pedir mas componentes?

11. Las tarjetas de circuito impreso se envıan a una prueba de funcionamiento despues dehaber montado en ellas todos los chips. Un lote contiene 140 tarjetas y se toman 20sin reemplazo para hacerles la prueba de funcionamiento.

a) Si 20 tarjetas estan defectuosas, Cual es la probabilidad de que al menos una deellas se encuentre en la muestra?

b) Si 5 tarjetas estan defectuosas, Cual es la probabilidad de que al menos una deellas aparezca en la muestra?

12. Los empleados de una empresa que fabrica aisladores son examinados para detectarla presencia de asbesto en sus pulmones. La empresa debe enviar tres empleados conpruebas positivas de asbesto a un centro medico para realizarles mas examenes. Si el40% de los empleados tienen pruebas positivas de asbesto en sus pulmones;

a) ¿Cual es la probabilidad de que se tengan que examinar k empleados hasta en-contrar tres con asbesto en sus pulmones ?

b) Si cada prueba cuesta $20.000, cual es el costo total esperado de las pruebasnecesarias hasta encontrar 3 empleados con examen positivo ?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 64: Libro Ejercicios Jimenez y Olea Tomo I

58 Capıtulo 3. Variables Aleatorias Discretas

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 65: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 4

Variables Aleatorias Continuas

4.1. Ejercicios Resueltos

EJERCICIO 1

La dureza Rockwell de un metal se determina al golpear con un punto acerado (herramien-ta)la superficie del metal y despues medir la profundidad de penetracion del punto. Supongaque la dureza Rockwell de cierta aleacion esta normalmente distribuida con media de 70 ydesviacion estandar de 3.

(a) Si un especimen es aceptable solo si su dureza esta entre 67 y 75, ¿Cual es la proba-bilidad de que un especimen seleccionado al azar tenga una dureza aceptable?

(b) Si la escala aceptable de dureza es (70 − c, 70 + c), ¿para que calor de c tendrıa unadureza aceptable, 95% de todos los especımenes?

(c) Si la escala aceptable es como el inciso (a) y la dureza de cada diez especımenesseleccionados al azar se determina independientemente, ¿cual es el numero esperadode especımenes aceptables entre los diez?

(d) ¿Cual es la probabilidad de que a lo sumo ocho de diez especımenes seleccionadosindependientemente, tengan una dureza menor a 73.84?

SOLUCION

Sea X: Dureza Rockwell, donde

X ∼ N(0, 1)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 66: Libro Ejercicios Jimenez y Olea Tomo I

60 Capıtulo 4. Variables Aleatorias Continuas

(a)

P (67 ≤ X ≤ 75) = P

(67− 70

3≤ Z ≤ 75− 70

3

)

= Φ

(5

3

)− Φ (−1)

= Φ(1,666)− Φ(−1)

= 0,9522− 0,158

= 0,7935

(b)

P (70− c ≤ X ≤ 70 + c) = 0,95

⇒ P (X ≤ 70 + c)− P (X < 70− c) = 0,95

⇒ P

(Z ≤ 70 + c− 70

3

)− P

(Z <

70− c− 70

3

)= 0,95

⇒ Φ( c

3

)− Φ

(−c

3

)= 0,95

⇒ Φ( c

3

)−[1− Φ

( c

3

)]= 0,95

⇒ 2Φ( c

3

)− 1 = 0,95

⇒ 2Φ( c

3

)= 1,95

⇒ Φ( c

3

)=

1,95

2= 0,975

⇒ c

3= 1,96

⇒ c = 1,96 · 3 = 5,88

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 67: Libro Ejercicios Jimenez y Olea Tomo I

4.1 Ejercicios Resueltos 61

(c) Sea Y: no de especımenes con dureza aceptable de entre 10, siendo para este caso sudistribucion como sigue:

Y ∼ Bin(10, 0,7935)

Luego nos pidenE(Y ) = n · p = 10 · 0,7935 = 7,9

(d)

P (X < 73,84) = P

(Z <

73,84− 70

3

)= Φ

(3,84

3

)= 0,8997

LuegoY ∼ Bin(10, 0,8997)

⇒ P (Y ≤ 8) =8∑

i=0

(10

i

)0,8997i(1− 0,8997)10−i = 0,265

EJERCICIO 2

La resistencia a la compresion de una serie de muestras de cemento puede modelarse con unadistribucion normal con media 6000 Kg/cm2 y una desviacion estandar de 100 Kg/cm2.

(a) ¿Cual es la probabilidad de que la resistencia de una muestra sea menor que 6250Kg/cm2?

(b) ¿Cual es la probabilidad de que la resistencia de una muestra se encuentre entre 5800y 5900 Kg/cm2?

(c) ¿Cual es el valor de resistencia que excede el 95% de las muestras?

SOLUCION

Sea X: Resistencia a la compresion. Luego

X ∼ N(6000, 1002)

(a)

P (X < 6250) = P

(Z <

6250− 6000

100

)= Φ

(250

100

)= 0,9938

(b)

P (5800 < X < 5900) = P

(5800− 6000

100≤ Z ≤ 5900− 6000

100

)

= Φ

(5900− 6000

100

)− Φ

(5800− 6000

100

)

= Φ (−1)− Φ (−2) = 0,1359

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 68: Libro Ejercicios Jimenez y Olea Tomo I

62 Capıtulo 4. Variables Aleatorias Continuas

(c)

P (X < x) = 0,95

⇒ P

(X − 6000

100<

x− 6000

100

)= 0,95

⇒ Φ

(X − 6000

100

)= 0,95

⇒(

X − 6000

100

)= 1,64

⇒ X = 164 + 6000 = 6164

Luego ∀ x > 6164 la probabilidad excederıa el 95%.

EJERCICIO 3

La funcion de densidad de probabilidad del tiempo necesario para terminar una operacionde ensamblado es:

fX(x) =

0,1, 30 < x < 400, e.o.c.

(a) Calcule la proporcion de ensambles que requieren mas de 35 segundos para concluir laoperacion.

(b) ¿Que tiempo de armado es el que excede el 90% de los ensambles?

(c) ¿Cual es el tiempo esperado de ensamblado y que tan variante es?

SOLUCION

(a)

P (X > 35) =

∫ 40

35

f(x)dx =

∫ 40

35

0,1dx = 0,1 · 40− 0,1 · 35 = 0,5

(b)P (X < x) = 0,9

P (X < x) =

∫ x

30

f(x)dx =

∫ x

30

0,1dx = 0,1 · x− 0,1 · 30 = 0,9

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 69: Libro Ejercicios Jimenez y Olea Tomo I

4.1 Ejercicios Resueltos 63

⇒ 0,1 · x− 0,1 · 30 = 0,9

⇒ 0,1 · x = 3,9

⇒ x =3,9

0,1

⇒ x = 39

Luego el tipo de armado que excede al 90% de los ensambles es el que se demora masde 39 segundos en este.

(c) Lo que nos piden es la Esperanza y varianza de la variable tiempo de ensamble.

Entonces calculemos

E(X) =

∫ 40

30

xf(x)dx =

∫ 40

30

0,1xdx =0,1x2

2

∣∣∣4030

=0,1× 402

2− 0,12

2= 35

∴ el tiempo medio o esperado de ensamble es 35 segundos.

Ahora calculemos su variabilidad con la V ar(X),Por definicion tenemos

V ar(X) = E(X2)− E2(X)

∴ tenemos que calcular E(X2).

E(X2) ==

∫ 40

30

x2f(x)dx =

∫ 40

30

0,1x2dx =0,1x3

3

∣∣∣4030

=0,1× 403

3− 0,13

3= 1233,33

∴V ar(X) = 1233,33− 352

⇒ Desv. Standar = 2,88

es decir, 2.88 segundos es el tiempo en promedio que encuentran del valor esperado (35segundos) los tiempos de ensamble.

EJERCICIO 4

El tiempo X (minutos) para que un asistente de laboratorio prepare el equipo para unexperimento tiene una distribucion Uniforme(25,35).

(a) Escriba la pdf de X y trace su grafica.

(b) ¿Cual es la probabilidad de que el tiempo de preparacion exceda de 33 min.?

(c) ¿Cual es la probabilidad de que el tiempo de preparacion se encuentre a una distanciaa lo mas de 2 min. del tiempo esperado?

(d) Para cualquier a tal que 25 < a < a+2 < 35, ¿Cual es la probabilidad de que el tiempode preparacion este entre a y a + 2 minutos?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 70: Libro Ejercicios Jimenez y Olea Tomo I

64 Capıtulo 4. Variables Aleatorias Continuas

SOLUCION

X: tiempo para preparar equipo;

X ∼ U(25, 35)

(a)

f(X) =

1

35−25, 25 < X < 35

0, e.o.c.

Figura 4.1: Grafica de la pdf de X

(b)

P (X > 33) =

∫ 35

33

f(x)dx =

∫ 35

33

0,1dx = 0,1 · 35− 0,1 · 33 = 0,2

(c) Se necesita el tiempo esperado.

E(X) =

∫ 35

25

xf(x)dx =

∫ 35

25

0,1xdx =0,1x2

2

∣∣∣3525

=0,1 · 352

2− 0,1 · 252

2= 30

Como sabemos que el tiempo esperado es de 30, la probabilidad que se pide es lasiguiente:

P (28 < X < 32) =

∫ 32

28

f(x)dx =

∫ 32

28

0,1dx = 0,1 · 32− 0,1 · 28 = 0,4

(d) La condicion de que 25 < a < a+2 < 35, es para poder utilizar la f(x) de la Uniformesin salirnos del rango.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 71: Libro Ejercicios Jimenez y Olea Tomo I

4.1 Ejercicios Resueltos 65

Entonces tenemos lo siguiente

P (a < X < a + 2) =

∫ a+2

a

f(x)dx =

∫ a+2

a

0,1dx = 0,1 · (a + 2)− 0,1 · a = 0,1 · 2 = 0,2

EJERCICIO 5

Sea X la distancia en metros que un animal se mueve desde su lugar de nacimiento hasta elprimer territorio vacante que encuentra. Suponga que para las ratas canguro, X tiene unadistribucion exponencial con parametro λ = 0,01386 (como lo sugiere el artıculo ”Competi-tion and Dispersal from Multiples Nest”, Ecology, 1997, pp. 873-883).

(a) ¿Cual es la probabilidad de que la distancia sea a lo sumo 100 metros?, ¿Entre 100 y200 metros?

(b) ¿Cual es la probabilidad de que la distancia sea mayor que la distancia promedio enmas de 2 desviaciones estandar?

(c) ¿Cual es el valor de la mediana de la distancia?

SOLUCION

Tenemos que X ∼ exp(λ) con λ = 0,01386. De esto de puede obtener:

FX(x) = P (X ≤ x) = 1− e−λx

y por ende

P (X > x) = e−λx

ademas tenemos que

E(X) = µX =1

λy Var(X) = σ2

X =1

λ2

(a) Que la probabilidad sea a lo sumo 100 metros es

P (X ≤ 100) = 1− e−λ·100 = 1− e−0,01386·100 = 0,4799

y que este entre 100 y 200 metros es

P (100 < X < 200) = P (X < 200)− P (X < 100)

= 1− e−λ·200 −(1− e−λ·200

)= e−λ·100 − e−λ·200

= 0,1875

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 72: Libro Ejercicios Jimenez y Olea Tomo I

66 Capıtulo 4. Variables Aleatorias Continuas

(b) La probabilidad pedida se puede escribir como

P (X > E(X) + 2σX) = P (X > 3σX)

= P

(X >

3

0,01386

)

= P (X > 216,450)

= e−λ·216,450

= 0,049 ≈ 0,05

(c) Se pide la mediana, sabemos que esta se encuentra en el percentil 50.

Luego se tiene que

∫ mediana

0

fX(x)dx = 0,5 ⇐⇒ FX(mediana) = 0,5

Al reemplazar por la funcion de distribucion acumulada de la exponencial se logra lasiguiente igualdad

1− e−λ·mediana = 0,5

⇒ 1− 0,5 = e−λ·mediana

⇒ ln(0,5) = −λ ·mediana

⇒ ln(0,5)−0,01386

= mediana

⇒ 50,01 = mediana

EJERCICIO 6

La presion del aire de un neumatico seleccionado al azar, instalado en un automovil nuevo,esta normalmente distribuida con valor medio de 31 lb/pulg2 y desviacion estandar de 0.2lb/pulg2.

(a) ¿Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, excedade 30.5 lb/pulg2?

(b) ¿Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, seencuentre entre 30.5 y 31.5 lb/pulg2?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 73: Libro Ejercicios Jimenez y Olea Tomo I

4.1 Ejercicios Resueltos 67

(c) Suponga que un neumatico se considera con presion baja si esta debajo de 30.4 lb/pulg2.¿Cual es la probabilidad de que al menos uno de los cuatro neumaticos de un automovilse encuentre con presion baja?

SOLUCION

Sea X la presion de aire, luego tenemos que

X ∼ N(31, 0,22)

(a) P (X > 30,5) = P (Z > 30,5−310,2

) = P (Z > −2,5) = P (Z < 2,5) = 0,9938

(b)

P (30,5 < X < 31,5) = P (X < 31,5)− P (X < 30,5)

= P

(Z <

31,5− 31

0,2

)− P

(Z <

30,5− 31

0,2

)

= P (Z < 2,5)− P (Z < −2,5)

= 0,9938− (1− 0,9938)

= 0,9876

(c) Sea Y : no de neumaticos con presion baja. Se puede deducir que Y ∼ Bin(4, p), dondep = P (X < 30,4).

Luego calculando tenemos que

p = P (X < 30,4) = P

(Z <

30,4− 31

0,2

)= P (Z < −3) = 0,0013

∴ Y ∼ Bin(4, 0,0013)

Se pide

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 74: Libro Ejercicios Jimenez y Olea Tomo I

68 Capıtulo 4. Variables Aleatorias Continuas

P (Y ≥ 1) = 1− P (Y < 1)

= 1− [P (Y = 0)]

= 1−(

4

0

)p0(1− p)4

= 1− [1− 0,0013]4

= 0,005189

EJERCICIO 7

Suponga que el numero de horas X que funcionara una maquina antes de fallar es una vari-able aleatoria con distribucion Normal de parametros µ = 720 y σ2 = 482.

Suponga que en el momento en que la maquina comienza a funcionar Ud. debe decidircuando el inspector regresara a revisarla. Si el vuelve antes de que la maquina falle, seocasiona un costo de a dolares por haber desperdiciado una inspeccion. Si vuelve despues deque la maquina haya fallado, se ocasiona un costo de b dolares por el no funcionamiento dela maquina.

(a) Determine una expresion para el costo esperado, considerando que el tiempo hasta queel inspector vuelve a inspeccionar la maquina es de t horas.

(b) Suponga que el inspector decide volver en un tiempo de t = 816hrs. Calcule la prob-abilidad de que el inspector llegue tarde a la inspeccion, es decir, la maquina ya hadejado de funcionar.

(c) Se observa este proceso durante 15 perıodos. Determine de que el inspector llegue tardemas de 12 veces.

SOLUCION

Sea X : Tiempo de funcionamiento de una maquina hasta que falle.

X ∼ N(720, 482)

(a) Tenemos que

Costo =

a X > t

b X < t

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 75: Libro Ejercicios Jimenez y Olea Tomo I

4.1 Ejercicios Resueltos 69

luego el costo esperado es

E(Costo) = aP (X > t) + bP (X < t)

= a− aP (X < t) + bP (X < t)

= a + P (X < t)b− a

= a + (b− a)FZ

(t− 720

48

)(b)

P (X < 816) = P

(X − 720

48<

816− 720

48

)

= P

(Z <

96

48

)

= P (Z < 2)

= 0,9772499

(c) Sea X : Numero de veces que el inspector llega tarde.

X ∼ Bin(15, 0,9772499)

entonces

P (X > 12) =15∑

x=13

(15

x

)(0,9772499)x(1− 0,9772499)15−x

= 0,9956363

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 76: Libro Ejercicios Jimenez y Olea Tomo I

70 Capıtulo 4. Variables Aleatorias Continuas

4.2. Ejercicios Propuestos

1. Si Y ∼ U [0, 5] ¿Cual es la probabilidad de que las raıces de la ecuacion

4x2 + 4xY + Y + 2 = 0

sean ambas reales?

2. Las calificaciones X de un examen del curso EYP* siguen una distribucion normal demedia 4.2 y desviacion estandar 0.6. El profesor sospecha que el examen fue difıcil. Deacuerdo a lo anterior ajusta las calificaciones en la forma Y = aX + b, a > 0,

a) ¿Que valores deben asignarse a las constantes a y b de manera que las nuevascalificaciones tengan un promedio de 5.3 y una desviacion estandar de 0.3?

b) Encuentre c ∈ [0; 7] para que, con probabilidad igual a 0.9, las calificacionesajustadas superen a c.

3. El tiempo que transcurre entre las llamadas a una empresa de artıculos para plom-erıa tiene una distribucion exponencial con un tiempo promedio entre llamadas de 15minutos.

(a) ¿Cual es la probabilidad de que no haya llamadas en un lapso de 30 minutos?

(b) ¿Cual es la probabilidad de recibir al menos una llamada en un intervalo de 10minutos?

(c) ¿Cual es la probabilidad de recibir la primera llamada en un intervalo entre 5 y10 minutos despues de haber abierto la empresa?

(d) Calcule la dimension de un intervalo de tiempo, de modo tal que la probabilidadde recibir al menos una llamada en ese lapso sea 0.9.

4. La funcion de densidad de probabilidad del tiempo de falla (en horas) de un componente

electronico de una copiadora es fX(x) = e−x/1000

1000para x > 0. Calcule la probabilidad

de que:

a) El componente tarde mas de 3000 horas en fallar.

b) El componente falle en el lapso comprendido entre 1000 y 2000 horas.

c) El componente falle antes de 1000 horas.

d) Calcule el numero de horas en las que fallaran el 10% de todos los componentes.

5. El peso regular de apoyo de una pastilla de estereo, que actualmente esta puesta a 3gr. en un tocadiscos, puede considerarse como una v.a. X continua con pdf:

f(x) =

k[1− (x− 3)2], 2 ≤ x ≤ 4;0, e.o.c.

a) Dibuje la grafica de f(x).

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 77: Libro Ejercicios Jimenez y Olea Tomo I

4.2 Ejercicios Propuestos 71

b) Encuentre el valor k.

c) ¿Cual es la probabilidad de que el peso de apoyo sea mayor que el peso especifi-cado?

d) ¿Cual es la probabilidad de que el peso difiera del peso especificado en mas de .5gr.?

6. El artıculo “The Prediction of Corrosion by Statistical Analysis of Corrosion Profiles”sugiere la siguiente cdf, para la profundidad X de la picadura mas profunda en unexperimento donde interviene la exposicion de acero al manganeso carbono a agua demar acidulada:

F (x; α, β) = e−e−(x−α)/β

, −∞ < x < ∞

Los autores proponen los valores α = 150, β = 90. Suponga que este es el modelocorrecto.

a) ¿Cual es la probabilidad de que la profundidad de la picadura mas profunda seaa lo sumo 150? ¿A lo sumo 300? ¿Entre 150 y 300?

b) ¿Cual es la funcion de densidad de X?

c) Se puede demostrar que E(X) ≈ ,5772β + α. ¿Cual es la media para los valoresdados α y β, y como se compara con la mediana?

7. El tiempo en minutos en ir de un hotel al aeropuerto por la ruta A se distribuyeN(27, 25). Mientras que por la ruta B se distribuye N(30, 4).¿Que ruta conviene utilizarsi se dispone de:

a) 30 minutos?

b) 34 minutos?

8. Si X tiene una distribucion exponencial con parametro λ, derive una expresion generalpara el (100p) avo percentil de la distribucion. Luego especifique como obtener lamediana.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 78: Libro Ejercicios Jimenez y Olea Tomo I

72 Capıtulo 4. Variables Aleatorias Continuas

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 79: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 5

Sensibilidad y Especificidad

5.1. Ejercicios Resueltos

EJERCICIO 1

En una investigacion sobre el factor de crecimiento de carcinoma mamario (FCCM), el estu-dio piloto revelo que estaba elevado en los pacientes con carcinomas de mama confirmados.Se hizo un estudio clınico que incluyo a 1600 pacientes donde por biopsia se determino carci-noma en 600 y 1000 estaban sanos. Se considero como positivo al FCCM un resultado mayoro igual a 150 unidades por litro. La tabla obtenida fue la siguiente:

Con carcinoma de mama Sin carcinoma de mama TotalFCCM (+) 570 150 720FCCM (-) 30 850 880Total 600 1000 1600

(a) Explique e identifique para este ejemplo:

i. Verdaderos Positivos.

ii. Falsos Positivos.

iii. Verdaderos Negativos.

iv. Falsos Negativos.

(b) ¿Que es la Prevalencia? Calculela.

(c) ¿Cual es la probabilidad de que un sujeto enfermo sea clasificado como positivo?, ¿cuales el nombre tecnico de esta probabilidad y como podrıa aumentarla?

(d) ¿Cual es la probabilidad de que un sujeto sano sea clasificado como negativo?, ¿cuales el nombre tecnico de esta probabilidad y como podrıa aumentarla?

(e) ¿Cual es la probabilidad de que el individuo tenga carcinoma de mama si la pruebaFCCM es positivo?, ¿cual es la probabilidad de que no la padezca si la prueba FCCMes negativa?, ¿tecnicamente que se esta pidiendo?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 80: Libro Ejercicios Jimenez y Olea Tomo I

74 Capıtulo 5. Sensibilidad y Especificidad

SOLUCION

(a) Identificacion en la tabla

Con carcinoma de mama Sin carcinoma de mama TotalFCCM (+) 570 (VP) 150 (FP) 720FCCM (-) 30 (FN) 850 (VN) 880Total 600 1000 1600

i. Verdaderos Positivos (V P ): Son los individuos que realmente tienen la enfermedad(con carcinoma de mama) y su test salio positivo (FCCM (+)).

ii. Falsos Positivos (FP ): Son los individuos que realmente no tienen la enfermedad(sin carcinoma de mama) y su test salio positivo (FCCM (+)).

iii. Verdaderos Negativos (V N): Son los individuos que realmente no tienen la enfer-medad (sin carcinoma de mama) y su test salio negativo (FCCM (-)).

iv. Falsos Negativos (FN): Son los individuos que realmente tienen la enfermedad(con carcinoma de mama) y su test salio negativo (FCCM (-)).

(b) La prevalencia es la proporcion de individuos que estan realmenete enfermos (Preva-lencia Real) con respecto al total.

Prevalencia =# de realmente enfermos

# total de individuos=

V P

Total=

570

1600= 0,35625

(c) La probabilidad pedida se llama Sensibilidad (Sp).

Sp =V P

V P + FN=

570

570 + 30=

570

600= 0,95

∴ La Probabilidad de que un individuo obtenga positivo en el test (FCCM(+)), dadoque esta realmente enfermo es de 95%.

La manera de poder aumentar la Sp es disminuyendo los Falsos Negativos (FN).

(d) La probabilidad pedida se llama Especificidad (Ep).

Ep =V N

V N + FP=

850

850 + 150=

850

1000= 0,85

∴ La Probabilidad de que un individuo obtenga negativo en el test (FCCM(-)), dadoque esta realmente no esta enfermo es de 85%.

La manera de poder aumentar la Ep es disminuyendo los Falsos Positivos (FP).

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 81: Libro Ejercicios Jimenez y Olea Tomo I

5.1 Ejercicios Resueltos 75

(e) Lo que estan pidiendo tecnicamente es el valor predictivo positivo y negativo.

V PP =V P

V P + FP=

570

570 + 150=

570

720= 0,79167

V PN =V N

V N + FN=

850

850 + 30=

850

880= 0,9659

∴ La Probabilidad de que un individuo este enfermo (con carcinoma de mama) dadoque el test salio positivo (FCCM(+)) es de 79% y la probabilidad de que el individuono tenga carcinoma de mama dado que el test salio negativo (FCCM(-)) es de 96.6 %.

EJERCICIO 2

La mastitis es una enfermedad que afecta a las vacas que estan produciendo leche. Para unproductor de leche es muy importante detectar una enfermedad tempranamente. Un grupode investigadores desarrollo un examen para este efecto con una confiabilidad del 90%, esdecir, de 100 vacas con la enfermedad el examen detecta 90 vacas enfermas. De las vacaslibres de mastitis un 99% de los examenes se consideran libres de la enfermedad y un 1% sediagnostican como mostrando mastitis, se seleccionan al azar una y se le somete al examenque arroja como resultado que sı posee la enfermedad. ¿Cual es la probabilidad que la vacatenga realmente mastitis?

SOLUCION

Sean

E : Vaca enfermaS : vaca sin enfermedad+ : Examen positivo− : Examen negativo

donde las probabilidades son:

P (E) = 0,001

P (S) = 0,999

P (+|E) = 0,9

P (−|S) = 0,01

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 82: Libro Ejercicios Jimenez y Olea Tomo I

76 Capıtulo 5. Sensibilidad y Especificidad

lo que se pide es lo siguiente:

P (E|+) =P (+|E)P (E)

P (+|S)P (S) + P (+|E)P (E)

=0,01 · 0,999

0,9 · 0,001 + 0,9 · 0,001

= 0,0826446

A esta probabilidad se le llama usualmente la valor predictivo positivo

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 83: Libro Ejercicios Jimenez y Olea Tomo I

5.2 Ejercicios Propuestos 77

5.2. Ejercicios Propuestos

1. Se quiere estudiar la utilidad de la reaccion en cadena de la polimerasa (PCR) en eldiagnostico de la meningitis meningococica. Se estudian 115 lıquidos cefalorraquıdeosprocedentes de otros tantos pacientes con sospecha de meningitis. Los resultados quese obtienen se recogen en la siguiente tabla:

Meningitis meningococica Meningitis no meningococica TotalPrueba (+) 34 1 35Prueba (-) 5 75 80

Total 39 76 115

donde

En 34 personas con meningitis meningococica la PCR fue positiva (VerdaderosPositivos).

En 5 personas con meningitis meningococica la PCR fue negativa (Falsos Nega-tivos).

En 75 personas sin meningitis meningococica la PCR fue negativa (VerdaderosNegativos).

En 1 persona sin meningitis meningococica la PCR fue positiva (Falsos Positivos).

Responda lo siguiente:

a) ¿Que es la Prevalencia? Calculela.

b) ¿Cual es la probabilidad de que un sujeto enfermo sea clasificado como positivo?,¿Como se podrıa aumentar esta probabilidad?

c) ¿Cual es la probabilidad de que un sujeto sano sea clasificado como negativo?,¿Como se podrıa aumentar esta probabilidad?

d) ¿Cual es la probabilidad de que el individuo tenga meningitis meningococica si laprueba es positivo?, ¿cual es la probabilidad de que no la padezca si la prueba esnegativa?

2. Con el objeto de diagnosticar la colelietasis se usan los ultrasonidos. Tal tecnica tieneuna sensibilidad del 91% y una especificidad del 98%. En la poblacion que nos pre-ocupa, la probabilidad de colelietasis es de 0,2.

a) Si a un individuo de tal poblacion se le aplican los ultrasonidos y dan positivos,¿cual es la probabilidad de que sufra la colelietasis?

b) Si el resultado fuese negativo, ¿cual serıa la probabilidad de que no tenga laenfermedad?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 84: Libro Ejercicios Jimenez y Olea Tomo I

78 Capıtulo 5. Sensibilidad y Especificidad

3. Dadas las siguientes tablas:

Tabla AEnfermos

Examen Si No Total(+) 58 4 62(-) 12 28 40

Total 70 32 102

Tabla BEnfermos

Examen Si No Total(+) 58 40 98(-) 12 280 292

Total 70 320 390

a) Calcule y comente para cada una de ellas su Prevalencia, Sensibilidad y Especifi-cidad.

b) Para la Tabla A conociendo la sensibilidad y la especificidad del examen diagnosti-co calcule aplicando el Teorema de Bayes: VPPP (valor predictivo de la pruebapositiva) y VPPN (valor predictivo de la prueba negativa), comente.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 85: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 6

Estimacion

6.1. Ejercicios Resueltos

EJERCICIO 1

Suponga que se tiene una m.a. de tamano 2n tomada de una poblacion X, con E(X) = µ yV ar(X) = σ2. Sean:

X1 =1

2n

2n∑i=1

xi y X2 =1

n

n∑i=1

xi

dos estimadores de µ. ¿Cual es el mejor estimador de µ? Explique su eleccion.

SOLUCION

El mejor estimador sera aquel que tenga menor error cuadratico medio E.C.M.. Primeroveamos si son insesgados los estimadores.

E(X1) =1

2nE

(2n∑i=1

xi

)=

1

2n

2n∑i=1

E(xi) =1

2n2nµ = µ

E(X2) =1

nE

(n∑

i=1

xi

)=

1

n

n∑i=1

E(xi) =1

nnµ = µ

Luego ambos estimadores son insesgados, por lo tanto el mejor estimador de entre los dos,sera aquel que tenga menor varianza.

V ar(X1) =1

4n2V ar

(2n∑i=1

xi

)=

1

4n2

2n∑i=1

V ar(xi) =1

4n22nσ2 =

σ2

2n

V ar(X2) =1

n2V ar

(n∑

i=1

xi

)=

1

n2

n∑i=1

V ar(xi) =1

n2nσ2 =

σ2

n

Luego, como el que tiene menor varianza es X1, escogemos este, pues es el que produce unmenor E.C.M.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 86: Libro Ejercicios Jimenez y Olea Tomo I

80 Capıtulo 6. Estimacion

EJERCICIO 2

Suponga que Θ1 y Θ2 son estimadores insesgados del parametro θ. Se sabe que V ar(Θ1) = 10y V ar(Θ2) = 4. ¿Cual es el mejor y en que sentido lo es?

SOLUCION

Como ambos son insesgados, el mejor estimador sera aquel que tenga menor varianza, loque, en este caso, conlleva a tener un menor E.C.M.. Luego observando, vemos que Θ2 tienemenor varianza que Θ1, por lo tanto escogemos Θ2 como mejor estimador de θ.

EJERCICIO 3

Suponga que Θ1 y Θ2 son estimadores del parametro θ. Se sabe que E(Θ1) = θ, E(Θ2) = θ2,

V ar(Θ1) = 10 y V ar(Θ2) = 4. ¿Cual es el mejor y en que sentido lo es?

SOLUCION

Si observamos cuidadosamente, vemos que Θ1 es insesgado para θ pero que Θ2 no lo es.Ahora la mejor forma de ver cual es mejor es comparando los E.C.M. de cada uno, ya queesta medida considera el sesgo producido por cada estimador y la varianza que tienen.

E.C.M.(Θ1) = V ar(Θ1) + Sesgo2(Θ1) = 10 + 02 = 10

E.C.M.(Θ2) = V ar(Θ2) + Sesgo2(Θ2) = 4 +

2− θ

)2

= 4 +

(−θ

2

)2

Como se puede ver, el E.C.M. de Θ2 depende del verdadero valor que tiene θ, luego debemoshacer un analisis mas detallado, para saber cuando Θ2 sera mejor que Θ1.

Cuando ocurre:E.C.M.(Θ1) ≤ E.C.M.(Θ2)

10 ≤ 4 +

(−θ

2

)2

10 ≤ 16 + θ2

440 ≤ 16 + θ2

θ2 ≥ 40− 16

θ2 ≥ 24

Es decir, Θ2 sera mejor estimador de θ que Θ1 cuando el verdadero valor de θ sea:

θ ≥√

24 o cuando θ ≤ −√

24

Equivalentemente, Θ1 sera mejor estimador de θ que Θ2 cuando

−√

24 < θ <√

24

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 87: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 81

EJERCICIO 4

Sea X1, . . . , Xn una muestra aleatoria de tamano n, de una poblacion N(µ, σ2).

(a) Demuestre que X2

es un estimador sesgado de µ2.

(b) Determine la magnitud del sesgo en el estimador.

(c) ¿Que sucede con el sesgo a medida que aumenta el tamano n de la muestra?

SOLUCION

(a) Como X ∼ N(µ, σ2) entonces se sabe que X ∼ N(µ, σ2

n), luego si queremos demostrar

que X2 es sesgado para µ2 ocupamos la siguiente relacion:

V ar(X) = E(X2)− E2(X)

σ2

n= E(X

2)− µ2

Luego despejando lo que necesitamos, obtenemos:

E(X2) =

σ2

n+ µ2

Lo cual es distinto de µ2, que es el caso donde habrıa sido insesgado el estimador.

(b) La magnitud del sesgo, no es mas que el tamano de este, es decir, su valor.

Sesgo(X2) = E(X

2)− µ2

Sesgo(X2) =

σ2

n+ µ2 − µ2 =

σ2

n

(c) A medida que el tamano de muestra aumenta, el sesgo σ2

n→ 0, es decir, el estimador

es asintoticamente (cuando n →∞) insesgado.

EJERCICIO 5

Una maquina produce artıculos defectuosos con probabilidad π. En la inspeccion de artıculosse define la v.a.

Yi =

1, si el artıculo i es defectuoso;0, si el artıculo i no es defectuoso.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 88: Libro Ejercicios Jimenez y Olea Tomo I

82 Capıtulo 6. Estimacion

En una muestra de tamano 5 se observan dos artıculos defectuosos. Proponga un modeloapropiado para el problema y estime la proporcion de artıculos defectuosos usando el metodode maxima verosimilitud.

SOLUCION

Dada la definicion del problema y la estructura de la variable aleatoria, Y tiene una distribu-cion Bernoulli

Y ∼ Ber(p) → P (Y = y) = py(1− p)1−y

donde el parametro p, que es la probabilidad del exito, es desconocida, por lo que la esti-maremos por maxima verosimilitud.

L(y|p) =5∏

i=1

pyi(1− p)1−yi

L(y|p) = p∑5

i=1 yi(1− p)5−∑5

i=1 yi

Aplicando logaritmo natural, obtenemos:

`(y|p) =

( 5∑i=1

yi

)ln(p) +

(5−

5∑i=1

yi

)ln(1− p)

Luego, para maximizar la funcion de verosimilitud, derivamos con respecto al parametro p,que es el que estamos buscando e igualamos a cero para despejar p.

∂`

∂p=

5∑i=1

yi

p+

(5∑

i=1

yi

)− 5

1− p= 0

p =

5∑i=1

yi

5Pero como nos dicen que se observaron dos artıculos defectuosos, es decir solo dos de los yi

son 1, la suma de estos es 2,

∴ p =2

5EJERCICIO 6

El numero de conexiones mal soldadas por microcircuito integrado en una operacion demanufactura electronica sigue una distribucion Binomial(20,p) con p desconocida. El costode corregir los errores, por microcircuito, es:

C = 3X + X2

En base a una muestra aleatoria X1, X2, ..., Xn encuentre el EMV del costo esperado decorregir los errores de estos n microcircuitos observados.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 89: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 83

SOLUCION

Considerando que el parametro p es desconocido, debemos estimarlo, lo que haremos por elmetodo de Maxima Verosimilitud.

L(x|p) =n∏

i=1

(20

xi

)pxi(1− p)20−xi

L(x|p) = p∑n

i=1 xi(1− p)20n−∑n

i=1 xi

n∏i=1

(20

xi

)Aplicando logaritmo natural, obtenemos:

`(x|p) =

( n∑i=1

xi

)ln(p) +

(20n−

n∑i=1

xi

)ln(1− p) +

n∑i=1

ln

((20

xi

))Luego, para maximizar la funcion de verosimilitud, derivamos con respecto al parametro p,que es el que estamos buscando e igualamos a cero para despejar p.

∂`

∂p=

n∑i=1

xi

p+

(n∑

i=1

yi

)− 20n

1− p= 0

p =

n∑i=1

xi

20n

Ya teniendo este estimador, lo que sigue es calcular el EMV del costo.

E(C) = 3E(X) + E(X2)

= 3np + np(1− p) + (np)2

= 3np + np− np2 + n2p2

= 4np + np2(n− 1)

Luego el E.M.V. de E(C) es E(C) = 4np + np2(n− 1) por invarianza del E.M.V.

EJERCICIO 7

En encuestas, es difıcil obtener respuestas precisas a preguntas delicadas tales como ¿Hasusado alguna vez heroına? o ¿Has hecho trampa alguna vez en un examen?. Warner introdujoel metodo de respuestas aleatorizadas para tratar tales situaciones. El encuestado hace giraruna flecha en una rueda o extrae una bola desde una urna que contiene dos bolas de doscolores para determinar cual de las dos afirmaciones contestara: (1)“Tengo la caracterıstica

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 90: Libro Ejercicios Jimenez y Olea Tomo I

84 Capıtulo 6. Estimacion

A”, o (2)“No tengo la caracterıstica A”. El encuestador no conoce cual afirmacion sera con-testada pero solamente anotara un sı o un no. Se cree que es mas probable que el encuestadoresponda verazmente si el o ella saben que el encuestador no conoce cual afirmacion sera con-testada. Sea R la proporcion de una muestra que contesta Sı. Sea p la probabilidad que laafirmacion 1 sea contestada (p es conocido desde la estructura del metodo aleatorizado), ysea q la proporcion de la poblacion que tiene la caracterıstica A. Sea r la probabilidad queun encuestado responda sı.

(a) Muestre que r = (2p− 1)q + (1− p)

(b) Si r es conocida, ¿Como podrıa determinarse q?

SOLUCION

Definamos como:

R: Proporcion de la muestra que contesta sı.

p: Probabilidad que la afirmacion 1 sea contestada.

q: Probabilidad de la poblacion que tiene la caracterıstica A.

r: Probabilidad que un encuestado responda si.

(a)

r = P (responda sı)

= P (responda sı | contesta afirmacion 1)P (contesta afirmacion 1)+ P (responda sı | no contesta afirmacion 1)P (no contesta afirmacion 1)

= pq + (1− p)(1− q)

= pq + 1− p− q + pq

= 2pq + 1− p− q

= (2pq + 1)q + (1− p)

(b) Serıa cosa de despejar q, es decir,

r − (1− p) = (2p− 1)q

luego

q =r + p− 1

2p− 1

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 91: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 85

EJERCICIO 8

Supongase que X1, X2, ..., Xn constituyen una m.a. de una distribucion cuya funcion densidades la siguiente

f(x|θ) =

θxθ−1, 0 < x < 1;0, e.o.c.

Ademas, supongase que el valor de θ es desconocido (θ > 0).

(a) Determine el EMV de θ.

(b) Determine el EMV de E(X).

SOLUCION

(a)

L(x1, . . . , xn, θ) =n∏

i=1

θxθ−1i

= θn

(n∏

i=1

xi

)θ−1

/ ln

`(x1, . . . , xn, θ) = n ln θ + (θ − 1)n∑

i=1

ln xi /∂θ

∂`(x1,...,xn,θ)∂θ

= nθ

+n∑

i=1

ln xi

⇒ θEMV = −nn∑

i=1

ln xi

(b)

E(X) =

∫ 1

0

xθxθ−1dx =

∫ 1

0

θxθdx =θxθ+1

θ

∣∣∣10

θ + 1

Luego E(X) = θ

θ+1por la invarianza del E.M.V.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 92: Libro Ejercicios Jimenez y Olea Tomo I

86 Capıtulo 6. Estimacion

EJERCICIO 9

Sean X1, X2, . . . , Xn variables aleatorias i.i.d. con funcion densidad dada por

fX(x) =

(α + 1)xα ;0 < x < 10 ;e.o.c.

(a) Encuentre el estimador de α por el metodo de momentos.

(b) Encuentre el estimador de α por el metodo de maxima verosimilitud.

(c) Evalue ambos estimadores usando los siguientes datos:

X 0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9Frecuencia 3 1 2 3

SOLUCION

(a) El metodo de momentos consiste en igualar el momento muestral con el momentopoblacional.

Para el caso k = 1 tenemos la siguiente igualdad

E(X) = X

Necesitamos calcular E(X):

E(X) =

∫Rec X

xfX(x)dx =

∫Rec X

x · (α + 1)xαdx

= (α + 1)

∫ 1

0

xα+1dx

= (α + 1)xα+2

α + 2

∣∣∣10

=α + 1

α + 2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 93: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 87

Luego

E(X) = X

⇒ α + 1

α + 2= X

⇒ α + 1 = αX + 2X

⇒ α(1−X) = 2X − 1

⇒ αMM =2X − 1

1−X

(b)

L(x, α) =n∏

i=1

f(xi) =n∏

i=1

(α + 1)xαi = (α + 1)n

(n∏

i=1

xi

\ ln

`(x, α) =n ln(α + 1) + αn∑

i=1

ln(xi) \∂α

∂`

∂α=

n

α + 1+

n∑i=1

ln(xi) = 0

⇒ n

α + 1= −

n∑i=1

ln(xi)

⇒ α + 1 =−n

n∑i=1

ln(xi)

⇒ αMV = −

nn∑

i=1

ln(xi)

+ 1

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 94: Libro Ejercicios Jimenez y Olea Tomo I

88 Capıtulo 6. Estimacion

(c) Para evaluar los estimadores necesitamos convertir los datos tabulados a un set dedatos compuestos por las marcas de cada clases

(0.2) (0.45) (0.65) (0.8)X 0.1 - 0.3 0.3 - 0.6 0.6 - 0.7 0.7 - 0.9

Frecuencia 3 1 2 3

Se puede representar el conjunto de valores para X como:

[X : 0,2; 0,2; 0,2; 0,45; 0,65; 0,65; 0,8; 0,8; 0,8]

Calculando ahora lo necesario para poder evaluar los estimadores con estos datos tab-ulados

X =1

n

k∑i=1

mi · fi =1

9(0,2 · 3 + 0,45 · 1 + 0,65 · 2 + 0,8 · 3) = 0,5277

n∑i=1

ln(xi) = ln

(n∏

i=1

xi

)= ln(0,000778752) = −7,15781

Luego al evaluar estos resultados en los estimadores, estos toman los siguientes valores:

αMM =2X − 1

1−X=

2 · 0,52777− 1

1− 0,52777= 0,117612

αMV = −

nn∑

i=1

ln(xi)

+ 1

= −(

9

−7,15781+ 1

)= 0,257367

EJERCICIO 10

Sean X1, ..., Xn, Y1, ..., Yn v.a. independientes con Xi ∼ Exp( 1α) e Yj ∼ Exp( 1

β), con

i = 1, ..., n; j = 1, ..., n. Se define el parametro θ = (θ1, θ2) por θ1 = α y θ2 = βα.

(a) Determine los EMV (estimador maximo verosımil) para θ1 y θ2

(b) Encuentre el sesgo y el ECM (error cuadratico medio) de θ1

SOLUCION

(a) Dada la independencia existente entre las variables, tenemos que la densidad conjunta

es fXi,Yj(xi, yj) = 1

αe−

xiα

1βe−

yiβ , luego la verosimilitud conjunta es la siguiente:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 95: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 89

L(θ) = 1αnβn e−

∑xi

α e−∑

yiβ \ ln

`(θ) = −∑

xi

α−

∑yi

β− n ln(α)− n ln(β) \∂α

∂`∂α

=∑

xi

α2 − nα

= 0 −→ α = x = θ1

∂`∂β

=∑

yi

β2 − nβ

= 0 −→ β = y

Tenemos que por la invarianza de los EMV’s, θ2 = βα, luego reemplazando queda que θ2 = y

x.

(b) Por formula el ECM(θ1) = V ar(θ1) + Sesgo2(θ1), donde el Sesgo(θ1) = E(θ1) − θ1.Luego veremos primero si tiene sesgo (sesgado):

E(θ1) = E

n∑

i=1

xi

n

=1

n

n∑i=1

E(xi) =1

n

n∑i=1

α = α

Luego como es insesgado (recuerde que θ1 = α), el Sesgo(θ1) = 0.Por lo tanto para calcular el ECM(θ1) basta calcular su varianza.

V ar(θ1) = V ar

n∑

i=1

xi

n

=1

n2V ar

(n∑

i=1

xi

)

ind=

1

n2

n∑i=1

V ar(xi) =1

n2

n∑i=1

α2 =α2

n

Por lo tanto ECM(θ1) = α2

nel cual

n→∞−→ 0.

EJERCICIO 11

Sean X1, ..., Xn iid con densidad λe−λx, x ≥ 0, n ≥ 2. Sea Sn =n∑

i=1

Xi. Es bien conocido

que Z = λSn tiene densidad:

fZ(z) =zn−1e−z

(n− 1)!, z ≥ 0

Utilice esto para calcular el sesgo y el ECM de λ = n−1Sn

.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 96: Libro Ejercicios Jimenez y Olea Tomo I

90 Capıtulo 6. Estimacion

SOLUCION

Nesecitamos calcular la esperanza y varianza de λ.

E(λ) = E

n− 1n∑

i=1

xi

= (n− 1)E

1n∑

i=1

xi

= (n− 1)E

λ

λ

n∑i=1

xi

= (n− 1)E

Z

)= λ(n− 1)E

(1

Z

)

= λ(n− 1)E(Z−1)

= λ(n− 1)

∫ ∞

0

z−1 zn−1e−z

(n− 1)!dz = λ(n− 1)

∫ ∞

0

zn−2e−z

(n− 1)!dz

=λ(n− 1)

n− 1

∫ ∞

0

zn−2e−z

(n− 2)!dz = λ

Por lo tanto λ es un estimador insesgado, es decir, Sesgo(λ) = 0. Luego queda que:

ECM(λ) = V ar(λ) = E(λ2)− E2(λ)

= E

([n− 1

Sn

]2)− λ2

= (n− 1)2E

(λ2

Z2

)− λ2

= λ2(n− 1)2E(Z−2)− λ2

= λ2(n− 1)2

∫ ∞

0

z−2 zn−1e−z

(n− 1)!dz − λ2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 97: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 91

=λ2(n− 1)2

(n− 1)(n− 2)

∫ ∞

0

zn−3e−z

(n− 3)!dz − λ2

=λ2(n− 1)

(n− 2)− λ2

=λ2

n− 2

Por lo tanto el ECM(λ) = λ2

n−2

n→∞−→ 0.

EJERCICIO 12

Sean Y1, ..., Yniid∼ U(0, θ). Sea T = Max(Y1, ..., Yn) y considere los estimadores de θ de la

forma cT, c ≥ 0.

(a) ¿Para que valor de c, cT es insesgado?

(b) ¿Para que valor de c, el ECM(cT ) es mınimo?

SOLUCION

Si T corresponde al Maximo, entonces su funcion densidad es de la forma fT (t) = n[FY (t)]n−1fY (t),donde fY (t) = 1

θy FY (t) = t

θ.

(a) Calcularemos la esperanza para determinar el insesgamiento.

E(cT ) = cE(T )

= c

∫ θ

0

tntn−1

θn−1

1

θdt

=cn

θn

∫ θ

0

tndt =cn

θn

tn+1

n + 1

∣∣∣θ0

=cn

θn

θn+1

n + 1=

cnθ

n + 1

Luego si c = n+1n

, cT es insesgado.

(b) En primer lugar calcularemos lo necesario para obtener el ECM y ası despues encontrarel c que lo minimice.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 98: Libro Ejercicios Jimenez y Olea Tomo I

92 Capıtulo 6. Estimacion

E(θ2) = E((cT )2) = c2E(T 2)

= c2

∫ θ

0

t2ntn−1

θn−1

1

θdt =

c2n

θn

∫ θ

0

tn+1dt

=c2n

θn

(tn+2

n + 2

∣∣∣θ0

)=

c2nθ2

n + 2

Ahora calculemos V ar(θ):

V ar(θ) =c2nθ2

n + 2− c2n2θ2

(n + 1)2

= c2nθ2

(1

n + 2− n

(n + 1)2

)

= c2nθ2

((n + 1)2 − n(n + 2)

(n + 1)2(n + 2)

)

= c2nθ2

(1

(n + 1)2(n + 2)

)Por lo tanto el sesgo queda de la siguiente forma:

Sesgo(θ) =cnθ

n + 1− θ = θ

(cn− n− 1

n + 1

)y ası obtenemos el ECM , resultando:

ECM(θ) =c2nθ2

(n + 1)2(n + 2)+ θ2

((cn− n− 1)2

(n + 1)2

)Ahora utilizando los metodos matematicos (1a Derivada) para minimizar, encontraremos elc correspondiente.

∂ECM(θ)

∂c=

2cnθ2

(n + 1)2(n + 2)+

2θ2n(cn− n− 1)

(n + 1)2= 0

−→ c =n + 2

n + 1

Para verificar si realmente es mınimo, se calcula la segunda derivada.

∂2ECM(θ)

∂c2=

2nθ2

n + 2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 99: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 93

la cual es positiva ∀n > 0, luego cuando c = n+2n+1

, el ECM(θ) se minimiza.

EJERCICIO 13

Suponga que X sigue una distribucion de Pareto, su funcion de densidad esta dada por:

f(x|α, θ) = θαθx−θ−1, x ≥ α y θ ≥ 1

Asuma que α > 0 es conocido y que X1, . . . , Xn son v.a. iid.

(a) Encuentre un estimador de momentos para θ.

(b) Determine el EMV de θ.

SOLUCION

Como los Xi siguen distribucion de Pareto, se tiene que su esperanza y varianza son conoci-das:

E(X) =θα

θ − 1, θ > 1 V ar(X) =

θα2

(θ − 1)2(θ − 2), θ > 2

(a) Igualando el momento poblacional con el muestral, se obtiene el estimador de momen-tos:

θα

θ − 1=

1

n

n∑i=1

Xi

θα

θ − 1= X

θα− θX = −X

θ =X

X − α

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 100: Libro Ejercicios Jimenez y Olea Tomo I

94 Capıtulo 6. Estimacion

(b) Teniendo que las observaciones distribuyen Pareto, la funcion de verosimilitud es lasiguiente:

L(α, θ) =n∏

i=1

θαθx−(θ+1)i

= θnαnθ

(n∏

i=1

xi

)−(θ+1)

\ ln

`(α, θ) = n ln(θ) + nθ ln(α)− (θ + 1)n∑

i=1

ln(xi) \∂θ

∂`∂θ

= nθ

+ n ln(α)−n∑

i=1

ln(xi) = 0

→ θ = −n

n ln(α)−

n∑i=1

ln(xi)

EJERCICIO 14

Sea Y1, ..., Yn una muestra aleatoria proveniente de una poblacion N(θ, θ), con θ > 0 y de-sconocido. A partir de una muestra aleatoria correspondiente a 25 pesos de circuitos, con

n∑i=1

Yi = 1264 y conn∑

i=1

Y 2i = 5240, determine la estimacion maximo verosimil de θ.

SOLUCION

L(θ) =n∏

i=1

1√2πθ

exp

1

2θ(yi − θ)2

= (2πθ)−n2 exp

− 1

n∑i=1

(yi − θ)2

\ ln

`(θ) = −n2

ln(2π)− n2

ln(θ)− 12θ

n∑i=1

(yi − θ)2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 101: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 95

= −n2

ln(2π)− n2

ln(θ)− 12θ

n∑i=1

(y2i − 2θyi + θ2)

= −n2

ln(2π)− n2

ln(θ)− 12θ

n∑i=1

y2i +

n∑i=1

yi −nθ2

2θ\∂θ

∂`∂θ

= − n2θ

+ 12θ2

n∑i=i

y2i −

n

2= 0

−→ −nθ

+

∑y2

i

θ2 − n = 0 \ · θ2

−nθ +n∑

i=1

y2i − nθ2 = 0 \ · − 1

n

θ −n∑

i=1

y2i /n + θ2 = 0

θ2 + θ − y2 = 0

θ =−1±

√1+4y2

2

EJERCICIO 15

Ingenieros electricos japoneses han inventado un sistema de radar llamado detector de blancosmoviles (MTD, moving target detector), disenado para rechazar los ecos parasitos provoca-dos por el terreno, la lluvia, las aves y otras fuentes de interferencia.Los investigadores han demostrado que la magnitud X de la frecuencia Doppler de una senalrecibida por radar se puede modelar por una distribucion Weibull, con parametro α = 2 yβ > 0, tal que:

f(x) =2x

βexp

− 1

βx2

x > 0

En base a una muestra aleatoria de tamano n,determine el estimador maximo verosımil deβ y obtenga su estimacion con las siguientes magnitudes de frecuencias si

∑50i=1 x2

i = 51,9.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 102: Libro Ejercicios Jimenez y Olea Tomo I

96 Capıtulo 6. Estimacion

SOLUCION

L(β) =n∏

i=1

2xi

βexp

1

βx2

i

= 2n

βn

n∏i=1

xi exp

− 1

β

n∑i=1

x2i

\ ln

`(β) = n ln(2)− n ln(β) +n∑

i=1

ln(xi)−1

β

n∑i=1

x2i \∂β

∂`∂β

= −nβ

+

n∑i=1

x2i

β2 = 0

n∑i=1

x2i

n= β2

β

β =

n∑i=1

x2i

n

Reemplazando por los valores dados en el inicio, queda que

β = 1,038

EJERCICIO 16

En una fabrica se seleccionan diariamente motores y se inspeccionan hasta encontrar elprimer motor defectuoso. Sea (X1, . . . , Xn) una m.a. de X distribuida geometricamente conp desconocido.

(a) Determine el estimador de momentos para p.

(b) Determine el estimador maximo verosımil de p.

(c) De los registros de 100 dıas se obtuvo la siguiente informacion del numero de motoresinspeccionados.

N ode motores inspeccionados 1 2 3 4 5N ode dıas 8 10 15 25 42

Estime la probabilidad de que en un dıa cualquiera se deban inspeccionar mas de dosmotores para encontrar uno defectuoso.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 103: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 97

SOLUCION

Dado que Xi ∼ Geom(p) tenemos que:

P (X = x) = p(1− p)x−1; E(X) =1

pV ar(X) =

1

p2

(a) Igualando momento poblacional con el muestral, queda:

1

p=

n∑i=1

xi

n

p =n

n∑i=1

xi

=1

x

(b) Encontremos ahora los estimadores M.V.

L(p) =n∏

i=1

p(1− p)xi−1

= pn(1− p)

n∑i=1

(xi − 1)

= pn(1− p)

n∑i=1

xi − n

`(p) = n ln(p) + (n∑

i=1

xi − n) ln(1− p)

= n ln(p) +n∑

i=1

xi ln(1− p)− n ln(1− p)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 104: Libro Ejercicios Jimenez y Olea Tomo I

98 Capıtulo 6. Estimacion

∂`

∂p=

n

p−

n∑i=1

xi

1− p+

n

1− p= 0

n

p=

n∑i=1

xi − n

1− p

n(1− p) = p

(n∑

i=1

xi − n

)

p =n

n∑i=1

xi

(c) Recordando la propiedad de invarianza que tienen los estimadores maximo verosımiles,lo que se pide, se puede traducir estadısticamente en:

P (X > 2) = 1− P (X ≤ 2)

= 1− P (X = 1)− P (X = 2)

= 1− p(1− p)1−1 − p(1− p)2−1 = 1− p− p(1− p)

= (1− p)2 = 0,261

EJERCICIO 17

Sean X1, . . . , Xn i.i.d. ∼ U(θ1, θ2). Es decir, la densidad de Xi es:

f(x) =1

θ2 − θ1

θ1 ≤ x ≤ θ2

(a) Encuentre el estimador de momentos para los parametros de esta distribucion.

(b) Encuentre el estimador maximo verosımil para θ1 y θ2.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 105: Libro Ejercicios Jimenez y Olea Tomo I

6.1 Ejercicios Resueltos 99

SOLUCION

(a) Se necesita encontrar los estimadores de θ1 y θ2, luego por ser dos parametros, uti-lizaremos el primer y segundo momento para armar un sistema de ecuaciones.

Momentos poblacionales:

E(X) =θ1 + θ2

2

E(X2) =

∫ θ2

θ1

x2 1

θ2 − θ1

dx

=θ22 + θ2θ1 + θ2

1

3

Igualando momentos poblacionales con muestrales, queda el siguiente sistema de ecua-ciones:

θ1 + θ2

2= x (1)

θ22 + θ2θ1 + θ2

1

3= x2 (2)

Despejando tenemos de (1) que θ1 = 2x − θ2 y reemplazando en la segunda ecuacionse obtiene:

(2x− θ2)2 + (2x− θ2)θ2 + θ2

2 = 3

∑x2

i

n

4x2 − 4xθ2 + θ22 + 2xθ2 − θ2

2 + θ22 = 3

∑x2

i

n

θ22 − 2xθ2 + 4x2 − 3x2 = 0

Resolviendo esta ecuacion de segundo grado con los metodos usuales, se obtiene:

θ2 =2x±

√4x2 − 16x2 + 12x2

2= x±

√3x2 − 3x2 = x±

√3S2

Luego reemplazando θ2 en (1) se tiene que θ1 = 1− θ2 = 1− x∓√

3S2.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 106: Libro Ejercicios Jimenez y Olea Tomo I

100 Capıtulo 6. Estimacion

(b) En el caso de aquellas distribuciones en que su dominio depende de los parametros aestimar (en este caso la distribucion es valida cuando θ1 ≤ x ≤ θ2), el procedimiento deestimacion debe considerar un muy pequeno detalle como se muestra a continuacion:

L(θ1, θ2) =1

(θ2 − θ1)nI(θ1,θ2)(x1) . . . I(θ1,θ2)(xn)

=1

(θ1, θ2)n

n∏i=1

I(θ1,θ2)(xi)

=1

(θ1, θ2)n

n∏i=1

I(xi>θ1)(xi)I(xi<θ2)(xi)

=1

(θ1, θ2)n

n∏i=1

I(min(xi)>θ1)(xi)I(max(xi)<θ2)(xi)

Como se muestra a continuacion tanto el mınimo como el maximo de los xi son elestimador maximo verosımil de θ1 y θ2 respectivamente.

Figura 6.1: Estimacion Theta 1 Figura 6.2: Estimacion Theta 2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 107: Libro Ejercicios Jimenez y Olea Tomo I

6.2 Ejercicios Propuestos 101

6.2. Ejercicios Propuestos

1. Considere las siguientes observaciones efectuadas en un flujo de corriente (miles deacres pies) registradas en una estacion en Colorado para el perıodo del 1o de Abrilal 31 de Agosto, durante el perıodo de 31 anos (de un artıculo del volumen de 1974,Water Resources Research).

127,96 210,07 203,24 108,91 178,21285,37 100,85 89,59 185,36 126,94200,19 66,24 247,11 299,87 109,64125,86 114,79 109,11 330,33 85,54117,64 302,74 280,55 145,11 95,36204,91 311,13 150,58 262,09 477,0894,33

Una grafica apropiada de probabilidad apoya el uso de la distribucion log-normal comoun modelo razonable para un flujo de corriente.

a) Estime los parametros de la distribucion. (Sugerencia: recuerde que X tiene unadistribucion log-normal con parametros µ y σ2 si ln(X) esta normalmente dis-tribuida con media µ y varianza σ2.)

b) Utilice las estimaciones del inciso a) para calcular una estimacion del valor esper-ado del caudal. (Sugerencia: ¿cual es E(X)? )

2. a) Se selecciona una muestra aleatoria de 10 casas de una zona en particular, cadauna tiene calefaccion con gas natural, y se determina la cantidad de gas (ternias,es decir, 25200 calorıas) empleada durante el mes de Enero para cada casa. Lasobservaciones resultantes son 103, 156, 118, 89, 125, 147, 122, 109, 138, 99. Rep-resente con µ el consumo promedio de gas durante enero por todas las casas dela zona. Calcule una estimacion puntual para µ.

b) Suponga que 10000 casas de esta zona utilizan gas natural para la calefaccion.Represente por τ la cantidad total de gas empleada por todas estas casas duranteEnero. Estime τ mediante los datos del inciso a). ¿Cual estimador utilizo en elcalculo de su estimacion?

c) Utilice los datos del inciso a) para estimar p, la proporcion de todas las casas queutilizaron por lo menos 100 ternias.

d) De una estimacion puntual de la media de la poblacion del consumo (el valormedio de la poblacion de todas las casas) con base en la muestra del inciso a).¿Cual estimador utilizo?

3. Se examina cada pieza de 150 recien fabricadas y se registra el numero de aranazospor pieza (se supone que las piezas no deben tener aranazos) y resultan los siguientesdatos:

Numero de aranazos por pieza 0 1 2 3 4 5 6 7Frecuencia observada 18 37 42 30 13 7 2 1

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 108: Libro Ejercicios Jimenez y Olea Tomo I

102 Capıtulo 6. Estimacion

Sea X = numero de aranazos en una pieza seleccionada al azar y suponga que X tieneuna distribucion de Poisson con parametro λ.

a) Encuentre un estimador de λ y calcule la estimacion para los datos anteriores.(Sugerencia: E(X) = λ para X ∼ Pois(λ), por lo que E(X) =?)

b) ¿Cual es la desviacion estandar (error estandar) de su estimador? Calcule el errorestandar estimado. (Sugerencia: σX = λ para X ∼ Pois(λ) .)

4. De n1 fumadores (hombres) seleccionados al azar, X1 fumaron cigarrillos con filtro,mientras que de n2 fumadoras seleccionadas al azar, X2 fumaron cigarrillos con filtro.Represente por p1 y p2 las probabilidades de que un hombre y una mujer seleccionadosal azar, respectivamente, fumaron cigarrillos con filtro.

a) Demuestre que (X1/n1)−(X2/n2) es un estimador insesgado para p1−p2. (Sugerencia:E(X) = nipi. para i = 1, 2.)

b) ¿Cual es el error estandar del estimador en el inciso a)?

c) ¿Como se utilizarıan los valores observados x1 y x2 para estimar el error estandarde su estimador?

d) Si n1 = n2 = 200, x1 = 127 y x2 = 176, utilice el estimador del inciso a) paraobtener una estimacion de p1 − p2.

e) Utilice el resultado del inciso c) y los datos del inciso d) para estimar el errorestandar del estimador.

5. Considere una muestra aleatoria X1, . . . , Xn de la pdf

f(x; θ) = 0,5(1 + θx) −1 ≤ x ≤ 1

donde −1 ≤ θ ≤ 1 (esta distribucion aparece en fısica de partıculas). Demuestre que

θ = 3X es un estimador insesgado de θ. (Sugerencia: primero determine µ = E(X) =E(X).)

6. Una muestra de n aviones caza Pandemonium capturados da como resultado numerosde serie x1, . . . , xn. La CIA sabe que las naves fueron numeradas en forma consecutivaen la fabrica, comenzando por α y terminando por β, ası que el numero total deaviones construido es β − α + 1 (es decir, si α = 17 y β = 29, entonces se fabricaron29−17+1 = 13 aviones con numeros de serie 17, 18, ..., 28, 29). pero la CIA desconocelos valores de α o β. Un experto en estadıstica de la CIA sugiere usar el estimadormax(Xi)−min(Xi) + 1 para estimar el numero total de aviones fabricados.

a) Si n= 5, x1 = 237, x2 = 375, x3 = 202, x4 = 525 y x5 = 418, ¿cual es la estimacioncorrespondiente?

b) ¿Bajo que condiciones de la muestra, el valor de la estimacion sera exactamenteigual al numero verdadero de aviones? ¿Sera la estimacion alguna vez mayor queel total verdadero? ¿Piensa que el estimador es insesgado para estimar β−α+1?Explique con una o dos oraciones.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 109: Libro Ejercicios Jimenez y Olea Tomo I

6.2 Ejercicios Propuestos 103

7. Represente por X1, . . . , Xn una muestra aleatoria de una distribucion de Rayleigh conpdf

f(x; θ) =x

θex2/(2θ) ; x > 0

a) Se puede demostrar que E(X2) = 2θ. Utilice este hecho para construir un esti-mador insesgado de θ con base en ΣX2

i y use las reglas para demostrar que esinsesgado.

b) Estime θ de las siguientes n = 10 observaciones sobre el esfuerzo vibratorio deuna paleta de turbina bajo condiciones especıficas:

16,88 14,2310,23 19,874,59 9,406,66 6,5113,68 10,95

8. Suponga que el verdadero valor promedio de crecimiento µ de un tipo de planta, du-rante un periodo de un ano, es identico al de un segundo tipo, pero la varianza decrecimiento para el primer tipo es σ2, mientras que para el segundo tipo la varian-za es 4σ2. Sean X1, . . . , Xm las m observaciones independientes de crecimiento en elprimer tipo (entonces, E(Xi) = µ, V (Xi) = σ2).Sean Y1, . . . , Yn las n observacionesindependientes de crecimiento en el segundo tipo (E(Yi) = µ, V (Yi) = 4σ2).

a) Demuestre que para cualquier δ entre 0 y 1, el estimador µ = δX + (1 − δ)Y esinsesgado para µ.

b) Para m y n fijas, calcule V (µ) y luego encuentre el valor de δ que reduzca V (µ)al mınimo. (Sugerencia: derive V (µ) con respecto a δ.)

9. Se selecciona una muestra aleatoria de n cascos para ciclistas, fabricados por ciertacompanıa. Sea X = numero entre los n que tienen defectos y p = P(con defectos).Suponga que solo se observa X, en lugar de las secuencia de las S y las F .

a) Obtenga el estimador de maxima verosimilitud de p. Si n = 20 y x = 3, ¿cual esla estimacion?

b) ¿Es insesgado el estimador del inciso a)?

c) Si n = 20 y x = 3, ¿cual es el EMV de la probabilidad (1 − p)5 de que ningunode los siguientes cinco cascos que se examinen tengan defectos?

10. Se observan dos sistemas diferentes de computadora durante un total de n semanas.Represente con Xi el numero de descomposturas del primer sistema durante la i-esimasemana y suponga que las Xi son independientes y obtenidas de una distribucion dePoisson con parametro λ1. De forma similar, represente con Yi el numero de descompos-turas del segundo sistema durante la i-esima semana y suponga independencia en cadaYi de Poisson, con parametro λ2. Obtenga los EMV de λ1, λ2 y λ1 − λ2. (Sugerencia:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 110: Libro Ejercicios Jimenez y Olea Tomo I

104 Capıtulo 6. Estimacion

mediante el uso de independencia, escriba la pdf conjunta (verosimilitud) de las Xi, yYi juntas.)

11. Se determina la resistencia al corte de cada una de diez soldaduras electricas por puntosde prueba, obteniendose los siguientes datos (lb/pulg2):

392 376 401 367 389 362 409 415 358 375

a) Si se supone que la resistencia al corte esta normalmente distribuida, estime elverdadero promedio de resistencia al corte y su desviacion estandar con el metodode maxima verosimilitud.

b) Otra vez, suponiendo una distribucion normal, estime el valor de resistencia abajodel cual 95% de todas las soldaduras tendran sus resistencias. (Sugerencia: ¿cuales el percentil 95 en terminos de µ y σ? Ahora utilice el principio de invarianza.)

12. Consulte el ejercicio anterior. Suponga que decidimos examinar otra soldadura porpuntos de prueba. Sea X = resistencia al corte de la soldadura. Utilice la informaciondada para obtener el EMV de P (X ≤ 400). (Sugerencia: P (X ≤ 400) = Φ((400 −µ)/σ).)

13. Represente por X1, . . . , Xn una muestra aleatoria de la distribucion de Rayleigh con lafuncion de densidad dada en el ejercicio 7. Determine:

a) El estimador de maxima verosimilitud de θ y despues calcule la estimacion paralos datos de esfuerzo vibratorio proporcionados en ese ejercicio. ¿Es este estimadorel mismo que el insesgado sugerido en el ejercicio 7?

b) El EMV de la mediana de la distribucion del esfuerzo vibratorio. (Sugerencia:primero exprese la mediana en terminos de θ.)

14. En el tiempo t = 0 se ponen a prueba 20 componentes identicos. La distribucion deduracion de cada uno es exponencial con parametro λ. El experimentador sale entoncesde la planta de prueba, la cual queda sin vigilancia, y a su regreso, 24 horas despues,termina de inmediato la prueba, despues de observar que y = 15 de los 20 componentestodavıa estan en operacion (es decir, 5 fallaron). Obtenga el EMV de λ. (Sugerencia:sea Y = numero que resistio 24 horas. Entonces, Y ∼ Bin(n, p). ¿Cual es el EMV dep? Ahora observe que p = P (X ≥ 24) donde Xi esta distribuida exponencialmente.Esto relaciona λ con p, de modo que la primera se puede estimar una vez que la ultimase haya estimado.)

15. Sea X1, X2, . . . , Xn una muestra aleatoria tomada de una distribucion gamma conparametros r y λ .

a) Encuentre la funcion y el log de la verosimilitud.

b) Encuentre las ecuaciones de definen los estimadores de maxima verosimilitud parar y λ. Pueden resolverse de manera explıcita?

c) Demuestre que el estimador de maxima verosimilitud de µ = rλ

es µ = X.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 111: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 7

Intervalos de Confianza y Test deHipotesis

7.1. Ejercicios Resueltos

EJERCICIO 1

Una companıa de taxis esta tratando de decidir si compra la marca A o la marca B deneumaticos para su flota de automoviles. Para estimar la diferencia entre las dos marcas,se lleva a cabo un experimento con 12 neumaticos de cada marca. Los numeros se utilizanhasta que se gastan. Los resultados son:

Marca Media (Km) Desv. Stand. (Km)A 36.300 5.000B 38.100 6.100

(a) Calcule un intervalo de confianza para µ1 − µ2, suponiendo que las poblaciones tienendistribucion normal con varianzas iguales.

(b) Encuentre un intervalo de confianza para µ1 − µ2, si se asigna un neumatico de cadacompanıa en forma aleatoria a las ruedas traseras de ocho taxis y se registran, enkilometros las siguientes distancias:

Taxi Marca A Marca B1 34.400 36.7002 45.500 46.8003 36.700 37.7004 32.000 31.1005 48.400 47.8006 32.800 36.4007 38.100 38.9008 30.100 31.500

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 112: Libro Ejercicios Jimenez y Olea Tomo I

106 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

Asuma que las diferencias de las distancias estan distribuidas aproximadamente enforma normal.

(c) Determine un intervalo de confianza de 90% para σ22/σ

21. ¿Que puede concluir?

SOLUCION

Tenemos que nA = nB = 12.

(a) I.C para µ1 − µ2 suponiendo varianzas iguales y desconocidas es el siguiente:

(X−Y )−Sp

√1

n1

+1

n2

t(n1+n2−2,1−α2) ≤ µ1−µ2 ≤ (X−Y )+Sp

√1

n1

+1

n2

t(n1+n2−2,1−α2)

Luego necesitamos

S2p =

(n1−1)S22+(n2−1)S2

1

n1+n−2−2

= (12−1)50002+(12−1)61002

12+12−2

= 68431000022

= 31105000

De aquı obtenemos Sp =√

31105000 = 5577,18.

∴ el I.C. queda

(36300−38100)−5577,18

√112

+112

t(22;0,975) ≤ µ1−µ2 ≤ (36300−38100)+5577,18

√112

+112

t(22;0,975)

Reemplazando t(22;0,975) = 2,0738, el I.C. al 95% de Confianza para µ1 − µ2 es:

−6521,94 ≤ µ1 − µ2 ≤ 2921,94

(b) Lo que nos piden es un I.C. para datos pareados.

Primero que todo tenemos que calcular las diferencias para cada par de datos comosigue:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 113: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 107

Taxi Marca A Marca B di

1 34.400 36.700 -23002 45.500 46.800 -13003 36.700 37.700 -10004 32.000 31.100 9005 48.400 47.800 6006 32.800 36.400 -36007 38.100 38.900 -8008 30.100 31.500 -1400

Un I.C. para µ1 − µ2 esta definido como:

d− SD√n

t(n−1;1−α2) ≤ µ1 − µ2 ≤ d +

SD√n

t(n−1;1−α2)

donde,

d = XA −XB = 37250− 38362,5 = −1112,5

S2D =

∑ni=1(di − d)2

n− 1

luego

S2D =

14808750

7= 2115535,71428

⇒ SD = 1454,488127

Ocupando un α = 0,05 el valor para t(n−1;1−α2) es t(7;0,975) = 2,3646.

Reemplazando el I.C. para µ1 − µ2 queda:

−111,5− 1454,4881√8

· 2,3646 ≤ µ1 − µ2 ≤ −111,5 +1454,4881√

8· 2,3646

es decir, un I.C. al 95% para µ1 − µ2 es

−2328,47 ≤ µ1 − µ2 ≤ 103,47

(c) Un I.C. para σ22/σ

21 al 90% esta determinado por:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 114: Libro Ejercicios Jimenez y Olea Tomo I

108 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

S22

S21Fn1−1;n2−1−;α

2≤ σ2

2

σ21≤ S2

2

S21Fn1−1;n2−1;1−α

2

61002

50002 F11;11;0,05 ≤ σ22

σ21≤ 61002

50002 F11;11;0,95

61002

50002 · 0,3548 ≤ σ22

σ21≤ 61002

50002 · 2,82

0,528 ≤ σ22

σ21≤ 4,1973

Como el 1 se encuentra en el I.C. no se rechaza que σ21 = σ2

2.

EJERCICIO 2

Dos tipos diferentes de aleacion, A y B, se han utilizado para fabricar especımenes experi-mentales de un pequeno eslabon de tension, empleado en cierta aplicacion de ingenierıa. Sedetermino la resistencia maxima (en ksi) de cada especimen y los resultados se resumen enla siguiente tabla de distribucion de frecuencia.

A B26-30 6 430-34 12 934-38 15 1938-42 7 10

40 42

Calcule un intervalo de confianza de 95% para la diferencia entre las proporciones realesde todos los especımenes de aleaciones A y B que tengan una resistencia maxima de por lomenos 34 ksi.

SOLUCION

Un I.C para las diferencias de proporciones esta definido por:

(pA−pB)−

√pA(1− pA)

n1+

pB(1− pB)n2

×Z1−α2≤ pA−pB ≤ (pA−pB)+

√pA(1− pA)

n1+

pB(1− pB)n2

×Z1−α2

Mirando en la tabla los rangos, sumamos las frecuencias de los rangos que cumplen teneruna resistencia mayor de 34 ksi, luego reemplazando pA = 22

40, pB = 29

42y Z0,975 = 1,96.

∴ el I.C. al 95% para pA − pB es:

−0,348 ≤ pA − pB ≤ 0,067

Como el 0 ∈ al Intervalo, se puede decir con un 95% de confianza que pA = pB.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 115: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 109

EJERCICIO 3

Una firma decide estudiar una muestra aleatoria de 20 proyectos que envio para ser evaluados,tanto a consultores externos, como a su propio departamento de proyectos. Las variablesmedidas fueron

X: no de dıas que demoro la evaluacion.

Y : no de variables consideradas en la evaluacion.

Z: Consultor al que se le envio el proyecto

Z =

−1 ; Depto. de Evaluacion0 ; Robani Consultores1 ; Tanaka Ltda.

W : Costo de la evaluacion (en U.F.)

Los resultados de este muestreo son:

No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20X 4 2 8 10 1 3 8 3 2 2 4 4 5 6 7 2 1 3 4 9Y 3 1 6 8 3 2 6 2 1 1 4 4 4 7 10 3 2 4 5 10Z -1 -1 0 0 0 0 1 0 0 1 -1 -1 0 1 1 -1 -1 0 1 -1W 40 30.5 80.3 68.5 24.7 40.5 90.6 38.5 50.4 50.2 60.1 60.8 70.9 80 90 30 27 40 50 40

Explicitando los supuestos necesarios:

(a) Estime con un 90% de confianza el costo medio de los proyectos.

(b) Estime con un 90% de confianza la proporcion de proyectos cuyo costo fue inferior a 50U.F. dado que no involucraron mas de 6 variables y que fueron resueltos en un tiemposuperior a 2 dıas.

(c) El Depto. de control afirma que el costo medio de enviar los proyectos a asesoresexternos es significativamente mayor que el de evaluarlos allı mismo. ¿Que concluyeusando α = 0,05?

(d) Tanaka Ltda. Afirma que la proporcion de proyectos que ellos evaluan, que tomanmas tiempo de mas de 4 dıas, no es superior a la proporcion de proyectos que evaluaRobani Consultores, que toman un tiempo mas de 4 dıas, no es superior a la proporcionde proyectos que evalua Robani Consultores, que toman un tiempo mas de 4 dıas.Concluya si la afirmacion de Tanaka Ltda. es correcta. (Use α = 0,01)

SOLUCION

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 116: Libro Ejercicios Jimenez y Olea Tomo I

110 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

(a) IC(µW ) = W ∓ tn−1;1−α2

SW√n, donde α = 5 % = 0,05 → t20−1;1− 0,05

2= t19;0,975 = 2,093

Luego conW SW S2

W n53,15 20,948 438,828 20

tenemos que el IC(µW ) es:

IC(µW ) = 53,15∓ 2,093 · 20,978√20

⇒ µW ∈ (43,346; 62,953)

(b) IC(p) = p∓ Z1−α2·√

pqn

, donde α = 10 % = 0,1 → Z1− 0,12

= Z0,95 = 1,645

luego conp q n12

12

8

tenemos que el IC(p) es:

IC(p) =1

2∓ 1,645 · 0,5 · 0,5

8

⇒ p ∈ (0,209; 0,790)

(c) Definamos primero:

E: Asesores externosL: Asesores locales (internos)

Luego tenemos la siguiente tabla resumen

n X S S2

E 13 59,584 21,629 467,838L 7 41,2 14,058 197,636

Sea

µE: costo medio asesores externosµL: costo medio asesores locales (internos)

Las hipotesis son

H0 : µE = µL vs H1 : µE > µL

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 117: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 111

primero haremos un test de varianzas para determinar como son estas y ası saber comotestamos las medias. Las hipotesis son:

H0 :σ2

E

σ2L

= 1 vs H1 :σ2

E

σ2L

6= 1

las cuales se dociman mediante el estadıstico F:

F =S2

E

S2L

= 2,367

Y se rechaza H0 si:F > F1 ∨ F < F2

donde F1 y F2 considerando α = 0,05 son:

F1 = FnE−1;nL−1;1−α2

= F12;6;0,975 = 5,37

F2 = FnE−1;nL−1;α2

= F12;6;0,025 =1

F6;12;0,975

=1

3,73= 0,268

Como F (2.367) no es mayor que F1 ni menor que F2, no existe suficiente evidenciabajo un 95% de confianza para rechazar H0, es decir, se pueden considerar las varianzasdesconocidas pero iguales.

Ahora hacemos un test de diferencias de medias, donde el estadıstico Tc es:

Tc =XE −XL

Sp

√1

nE+ 1

nL

donde

S2p =

(nE − 1)S2E + (nL − 1)S2

L

nE + nL − 2

=12 · 467,8382 + 6 · 197,6362

18

= 158934,925

⇒ Sp = 398,666

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 118: Libro Ejercicios Jimenez y Olea Tomo I

112 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

Reemplazando el estadıstico queda:

Tc =59,584− 41,2

398,666 ·√

113

+ 17

= 0,098

Luego se rechaza H0 si Tc > tν,1−α.

donde tν,1−α es:

tν,1−α = tnE+nL−2,1−α = t18;0,95 = 1,734

como Tc no es mayor que tν,1−α, no existe suficiente evidencia para rechazar H0, luegola opinion del Depto. no es correcta.

(d) La hipotesis para este caso es la siguiente:

H0 : pT ≤ pR vs H1 : pT > pR

necesitaremos la siguiente informacion

pT pR nT nR qT qR

0,8 0,25 5 8 0,2 0,75

El estadistico Zc es

Zc =pT − pR√

pT ·qT

nT+ pR·qT

nR

=0,8− 0,25√

0,8·0,25

+ 0,25·0,758

= 2,335

Se rechaza H0 si Zc > Z1−α.

Z1−α = Z1−0,01 = Z0,99 = 2,325

Como Zc > Z0,99, se rechaza H0, por lo tanto Tanaka Ltda tiene razon.

EJERCICIO 4

La consejalıa de la Juventud de un Ayuntamiento maneja el dato de que la edad a la quelos hijos se independizan de sus padres es una variable aleatoria normal con media 29 anos.Aunque la desviacion estandar no plantea dudas, se sospecha que la media ha aumentado,sobre todo por el poco apoyo a la polıtica de ayuda al empleo que ha llevado a cabo elAyuntamiento. Ası de un estudio reciente sobre 100 jovenes que se acaban de independizar,se ha obtenido una media de 30.7 anos de edad y una desviacion estandar de 3 anos.

(a) Con un nivel de significancia del 1%, ¿es correcta la sospecha que se tiene, acerca dela edad media en que se independizan los jovenes?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 119: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 113

(b) Se sabe que el porcentaje de personas que corresponden al sexo femenino y se indepen-dizan antes de los 29 anos, no supera el 45%. Si en la muestra, 60 jovenes son mujeres,y 35 de ellas cumplen con las caracterısticas antes expuestas, ¿Que se puede concluircon un nivel de significancia del 5%?.

SOLUCION

Rescatemos que n = 100, x = 30,7 y s = 3

(a) La hipotesis adecuada para esta conjetura es:

H0 : µ ≥ 29 H1 : µ < 29

Debemos hacer una prueba para la media, con σ2 desconocido, ocupando el estadıstico :

T =x− µ0

s/√

n=

30,7− 29

3/√

100= 5,66

Ahora, por las caracterısticas de la hipotesis, rechazamos H0, si

T < −tn−1,1−α

donde el −tn−1,1−α se obtiene buscando en una tabla t-Student −t99,0,99 (α = 0,01) elcual resulta -2.36.Por lo tanto, como:

5,66 ≮ −2,36

No existe evidencia suficiente en los datos para rechazar H0, es decir, la edad mediade independencia en los jovenes ha aumentado.

(b) Rescatando, tenemos que las mujeres que se independizan antes de los 29 anos no su-peran el 45%, lo cual puede reescribirse en la hipotesis, de la siguiente manera:

H0 : p ≤ 0,45 H1 : p > 0,45

Lo cual corresponde a un test de hipotesis para la proporcion, en donde se ocupa elestadıstico :

Z =p− p0√

p0(1− p0)/n

Pero nos dicen que de 60 mujeres, 35 cumplen con que se independizan antes de los 29anos, luego p = 35

60= 0,5833.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 120: Libro Ejercicios Jimenez y Olea Tomo I

114 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

Por lo tanto, queda que el estadıstico es:

Z =0,5833− 0,45√

0,45(1− 0,45)/60= 2,07

Ahora, por las caracterısticas de la hipotesis, rechazamos H0, si

Z > Z1−α

donde el Z1−α se obtiene buscando en una tabla Normal Z0,95 (α = 0,05) el cual resulta1.64.

Por lo tanto, como:

2,07 > 1,64

existe evidencia suficiente en los datos para rechazar H0, es decir, la proporcion demujeres que se independiza antes de los 29 anos, supera el 45%.

EJERCICIO 5

En un estudio sobre habitos de alimentacion en pelıcanos, se marcan 25 hembras y 11 machos,y se les rastrea por radio. La variable de interes es la distancia (en mts.) que recorren volandoen una pasada, en busca de alimento. Se obtuvieron estos resultados:

Hembras: Distancia Media 205 mts.Desv. Estandar 100 mts.

Machos: Distancia Media 135 mts.Desv. Estandar 90 mts.

¿Puede afirmarse que el comportamiento es diferente, respecto a la distancia media recorrida?

SOLUCION

Resumiendo tenemos:

nh = 25 xh = 205 sh = 100nm = 11 xm = 135 sm = 90

Para contestar la pregunta, debemos hacer un test de hipotesis para la diferencia de medias,es decir:

H0 : µh − µm = 0 H1 : µh − µm 6= 0

Pero para esto necesitamos saber el comportamiento de las varianzas en ambas poblaciones.Luego debemos probar si son iguales o no.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 121: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 115

H0 :σ2

h

σ2m

= 1 H1 :σ2

h

σ2m

6= 1

Esta hipotesis, la rechazamos si:

s2h

s2m

> Fnh−1,nm−1,1−α2

os2

h

s2m

< Fnh−1,nm−1, α2

con α = 0,05, luego reemplazando nos preguntamos:

1002

902> F24,10,0,975? o

1002

902< F24,10,0,025?

donde F24,10,0,975 = 3,36 y F24,10,0,025 = 1F10,24,0,975

= 0,3788, luego comparando, observamos

que las desigualdades no se dan, por lo tanto no existe evidencia en los datos para rechazarque las varianzas de ambas poblaciones son iguales.

Luego ahora docimamos nuestra hipotesis original, ya sabiendo que las varianzas poblacionesson iguales pero desconocidas, con el estadıstico :

T =xh − xm

Sp

√1

nh+ 1

nm

donde

Sp =

√(nh − 1)s2

h + (nm − 1)s2m

nh + nm − 2= 97,165

Luego reemplazando en el estadıstico, tenemos que:

T =205− 135

97,165√

125

+ 111

= 1,99

Ahora, H0 la rechazamos si:

xh − xm

Sp

√1

nh+ 1

nm

> tν,1−α2

oxh − xm

Sp

√1

nh+ 1

nm

< −tν,1−α2

con ν = nh + nm − 2, luego tν,1−α2

= t34,0,975 = 2,03. Luego haciendo las comparacionesrespectivas, concluimos que no existe evidencia en los datos para rechazar H0, es decir, lasdistancias medias recorridas para ambos sexos, en los pelicanos no difieren significativamente.

EJERCICIO 6

Se investiga el diametro de las varillas de acero fabricadas por dos maquinas diferentesde extrusion. Para ello se toman dos muestras aleatorias de tamano n1 = 15 y n2 = 18;las medias y las varianzas muestrales son x = 8,73, S2

1 = 0,35, x2 = 8,68 y S22 = 0,4,

respectivamente.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 122: Libro Ejercicios Jimenez y Olea Tomo I

116 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

(a) Suponga que σ21 = σ2

2. Construya un intervalo de confianza bilateral del 95% para ladiferencia en el diametro promedio de la varilla.

(b) Construya un intervalo de confianza bilateral del 95% para el cuociente de las varianzas

poblacionalesσ21

σ22. Parece razonable concluir que las varianzas son iguales?

(c) Pruebe la hipotesis H0 : µ1 = µ2 versus H1 : µ1 6= µ2. Utilice α = 0,05 y obtengaconclusiones.

(d) Calcule el valor p aproximado para esta prueba.

SOLUCION

(a) Para el caso dado, tenemos el siguiente pivote:

(x− y)− (µ1 − µ2)

Sp

√1n1

+ 1n2

∼ tn1+n2−2

donde

S2p =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2

Por lo tanto reemplazando los datos entregados, en el pivote y en S2p correctamente, se tiene

que S2p = 0,38, t15+18−2,1−α

2= 2,042 y

IC(µ1 − µ2) = 8,73− 8,68±√

0,38

√1

15+

1

18· 2,042

Luego se obtiene que con un 95% de confianza la diferencia de los diametros promedios delas varillas se encuentra en

µ1 − µ2 ∈ [−0,39, 0,49]

Note que el 0 ∈ al intervalo, luego esto quiere decir que las medias se pueden considerariguales con un 95% de confianza.

(b) Para el caso dado, tenemos el siguiente pivote:

S21/σ

21

S22/σ

22

∼ Fn1−1,n2−1

Luego el intervalo queda de la forma

IC

(σ2

2

σ21

)=

[S2

2

S21

Fn1−1,n2−1,α/2,S2

2

S21

Fn1−1,n2−1,1−α/2

]Luego reemplazando se tiene

σ22

σ21

∈ [0,393, 3,109]

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 123: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 117

Note que el 1 pertenece al intervalo, luego con un 95% de confianza, se puede decir que lasvarianzas son iguales.

(c) Para tal test de hipotesis y considerando los resultados de las letra (b), el estadıstico deprueba es

T =x− y

Sp

√1n1

+ 1n2

∼ tn1+n2−2

El cual rechaza la hipotesis nula si T > tn1+n2−2,1−α/2 o bien T < −tn1+n2−2,1−α/2.

Luego reemplazando y evaluando se tiene que

T =x− y

Sp

√1n1

+ 1n2

=8,73− 8,63

√0,38

√115

+ 118

= 0,23

Luego como T ≯ 2,039 y T ≮ −2,039, no existe evidencia presente en los datos para rechazarH0.

(d) El V alor−p = P (Z > 0,23) = 0,492 y como este es mayor que 0.05 (α), no se rechaza H0.

EJERCICIO 7

Los siguientes datos fueron recabados en un experimento disenado para verificar si existediferencia sistematica en los pesos obtenidos con dos balanzas diferentes.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 124: Libro Ejercicios Jimenez y Olea Tomo I

118 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

Peso en GramosRoca Balanza 1 Balanza 2

1 11.23 11.272 14.36 14.413 8.33 8.354 10.50 10.525 23.42 23.416 9.15 9.177 13.47 13.528 6.47 6.469 12.40 12.4510 19.38 19.35

Pruebe si la diferencia de las medias de los pesos obtenidos con las balanzas es significativa.

SOLUCION

En este caso lo que tenemos son muestras pareadas y lo que se pide es testear las siguienteshipotesis

H0 : µx = µy vs H1 : µx 6= µy

Cuyo estadıstico de prueba es

T =X − Y

SD/√

n∼ tn−1

donde S2D =

n∑i=1

(di − d)2

n−1, di = Xi − Yi y d =

n∑i=1

di

n.

el cual rechaza H0 si T > tn−1,1−α/2 o bien si T < −tn−1,1−α/2

Luego tenemos que

i 1 2 3 4 5 6 7 8 9 10Xi − Yi −0,04 −0,05 −0,02 −0,02 0,01 −0,02 −0,05 0,01 −0,05 0,03

de donde se obtiene que d = −0,02 y S2D = 0,028672

Luego el estadıstico queda

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 125: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 119

T =X − Y

SD/√

n

=12,871− 12,891

0,0286/√

10

= −2,2114

Por lo tanto, como T ≯ 2,26 = t9,0,975 y T ≮ −2,26 = −t9,0,975, no existe evidencia en losdatos para rechazar H0.

EJERCICIO 8

De dos procesos de produccion de plastico se seleccionaron de cada 10 especımenes en formaindependiente. Las mediciones de resistencia fueron:

Plastico A 3.03 5.53 5.6 9.3 9.92 12.51 12.95 15.21 16.04 16.84Plastico B 3.19 4.26 4.47 4.53 4.67 4.69 12.87 6.79 9.37 12.75

Utilice la teorıa normal para testear la hipotesis que no existe diferencia entre los procesosde produccion.

SOLUCION

Bajo la teorıa de Normalidad tenemos:

H0 : µA = µB vs H1 : µA 6= µB

lo cual se testea con el estadıstico

T =XA −XB

Sp

√1

nA+ 1

nB

∼ tnA+nB−2

el cual rechaza H0 si T > tnA+nB−2,1−α/2 o bien si T < −tnA+nB−2,1−α/2.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 126: Libro Ejercicios Jimenez y Olea Tomo I

120 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

Luego reemplazando tenemos que Sp =√

18,096 = 4,25 y por lo tanto

T =XA −XB

Sp

√1

nA+ 1

nB

=10,693− 6,75

4,25√

2/10

= 2,075

Finalmente como T = 2,075 ≯ 2,10 = t0,975,18 y T = 2,075 ≮ −2,10 = −t0,975,18, no existeevidencia presente en los datos para rechazar H0, es decir, con un 95% de confianza, noexiste diferencia entre los procesos.

EJERCICIO 9

Los siguientes datos se refieren a los efectos de un farmaco en la presion sanguınea de pa-cientes hipertensos. Los valores corresponden a la presion sistolica de los pacientes despuesdel perıodo placebo y despues del tratamiento con la droga (se realizo una prueba cruzada,actuando cada paciente como su propio control).

Placebo 211 210 210 191 196 190 191 177 173 170 156Droga 181 172 196 203 167 161 178 160 149 119 163

¿Sugieren estos datos que la nueva droga reduce significativamente el sistolico de la presionsanguınea?. Use α = 0,05.

SOLUCION

Bajo la teorıa de normalidad tenemos que las hipotesis a testear son:

H0 : µP ≤ µD vs H1 : µP > µD

Considerando que tenemos observaciones pareadas, es decir, dos observaciones a cada indi-viduo (antes y despues). Por lo tanto el estadıstico a utilizar es:

T =xP − xD

SD/√

n∼ tn−1

donde d = XA −XB y S2D =

∑ni=1(di−d)2

n−1= 340,77, el cual rechaza H0, si T > tn−1,1−α.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 127: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 121

T =xP − xD

SD/√

n

=188,6− 168,1

18,46/√

11

= 3,68

Por lo tanto como T = 3,68 > 1,812 = t10,0,95, se rechaza H0, es decir, con un 95% deconfianza la nueva droga reduce la presion.

EJERCICIO 10

Un instructor de perros esta entrenando a 27 animales para que obedezcan cierto mandato.El instructor utiliza dos tecnicas de entrenamiento diferentes, una en la que recompensa yalimenta (I), y otra en la que no se da recompensa alguna (II). La tabla siguiente muestrael numero de sesiones de obediencia que fueron necesarias antes de que un can obedecierael mandato. ¿Tiene el instructor la evidencia suficiente para aseverar que el metodo de larecompensa requerira, en promedio, menos tiempo de entrenamiento?. Plantee las hipotesis,llegue a conclusiones utilizando un nivel de significancia de α = 0,05.

Entrenamiento I 29 27 32 25 27 28 23 31 37 28 22 24 28 31 34Entrenamiento II 40 44 33 26 31 29 34 31 38 33 42 35

SOLUCION

Tenemos que son dos muestras independientes, y por simplicidad asumiremos que las vari-anzas poblacionales de cada una de las muestras son iguales. Luego las hipotesis quedan:

H0 : µI ≥ µII vs H1 : µI < µII

Las cuales se testean con el estadıstico

T =XI −XII

Sp

√1nI

+ 1nII

∼ tnI+nII−2

donde Sp =√

(nI−1)S2I +(nII−1)S2

II

nI+nII−2= 5, el cual rechaza H0 cuando T < −tnI+nII−2,1−α. Luego

en este caso tenemos

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 128: Libro Ejercicios Jimenez y Olea Tomo I

122 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

T =XI −XII

Sp

√1nI

+ 1nII

=28,4− 34,7

5√

115

+ 112

= −3,25

Por lo tanto como T = −3,25 < −1,7 = t25,0,05 se rechaza H0, es decir, el instructor tieneevidencia para aseverar que el metodo de la recompensa, requiere menos sesiones de entre-namiento.

EJERCICIO 11

En un proceso de bano quımico utilizado para grabar tarjetas de circuito impreso, se estancomparando dos diferentes catalizadores para determinar si requieren diferentes tiempos deinmersion para remover cantidades identicas de material fotorresistente. Se efectuaron 12banos con el catalizador 1, resultando un tiempo de inmersion medio de x1 = 24,6 min. yuna desviacion estandar de s1 = 0,85 min.. Con el catalizador 2 se efectuaron 15 banos, sien-do el tiempo de inmersion medio de x2 = 22,1 min. y una desviacion estandar de s2 = 0,98min. Se desea determinar si hay diferencia significativa en los tiempos de inmersion al utilizarun catalizador en especial. Para responder esto construya un intervalo de confianza al 95%de confianza. Considere que no se conoce el comportamiento de las varianzas poblacionales.

SOLUCION

Primero se debe concluir el comportamiento de las varianzas para decidir que tipo de inter-valo hacer. Para ello se construira un intervalo de confianza para el cuociente de varianzasal 95% de confianza.

s22

s21

F11,14,0,025 ≤σ2

2

σ21

≤ s22

s21

F11,14,0,975

0,982

0,852· 0,2977 ≤ σ2

1

σ22

≤ 0,982

0,852· 3,094

0,395 ≤ σ21

σ22

≤ 4,112

Luego con un 95% de confianza, puesto que el intervalo incluye la unidad, podrıamos no re-querir que las varianzas de los tiempos de inmersion para los dos catalizadores sean diferentes.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 129: Libro Ejercicios Jimenez y Olea Tomo I

7.1 Ejercicios Resueltos 123

Luego debemos hacer un intervalo de confianza para diferencia de medias, con varianzasdesconocidas pero iguales. Usando Minitab:

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean

1 12 24,600 0,850 0,25

2 15 22,100 0,980 0,25

Difference = mu (1) - mu (2)

Estimate for difference: 2,50000

95% CI for difference: (1,76213; 3,23787)

T-Test of difference = 0 (vs not =): T-Value = 6,98 P-Value = 0,000 DF = 25

Both use Pooled StDev = 0,9251

De aquı concluimos con 95% de confianza que el catalizador 1 requiere un tiempo de inmer-sion, que esta entre 1.76 min. y 3.24 min., mas largo que el requerido por el catalizador 2.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 130: Libro Ejercicios Jimenez y Olea Tomo I

124 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

7.2. Ejercicios Propuestos

1. Un fabricante produce anillos para los pistones de un motor de automovil. Se sabe queel diametro del anillo esta distribuido aproximadamente de manera normal, y que tieneuna desviacion estandar σ = 0,001 mm. Una muestra aleatoria de 15 anillos tiene undiametro promedio de X = 74,036 mm.

a) Construya un IC bilateral del 99% para el diametro promedio del anillo.

b) Construya un lımite inferior de confianza del 95% para el diametro promedio delanillo.

2. Se utilizan dos maquinas para llenar botellas de plastico con detergente para maquinaslavaplatos. Se sabe que las desviaciones estandar del volumen de llenado son σ1 = 0,10onzas de lıquido y σ2 = 0,15 onzas de lıquido para las dos maquinas, respectivamente.Se toman dos muestras aleatorias, n1 = 12 botellas de la maquina 1 y n2 = 10 botellasde la maquina 2. Los volumenes promedio de llenado son x1 = 30,87 onzas de lıquidoy x2 = 30,68 onzas de lıquido.

a) Construya un IC bilateral del 90% para la diferencia entre las medias del volumende llenado.

b) Construya un IC bilateral del 95% para la diferencia entre las medias del volumende llenado. Compare el ancho de este intervalo con el ancho del calculo en el incisoa).

c) Construya un IC superior del 95% para la diferencia de medias del volumen delllenado.

3. Se prueban dos formulas diferentes de un combustible oxigenado para motor en cuantoal octanaje. La varianza del octanaje para la formula 1 es σ2

1 = 1,5, mientras que parala formula 2 es σ2

2 = 1,2. Se prueban dos muestras aleatorias del tamano n1 = 15 yn2 = 20. Los octanajes promedios observados son x1 = 89,6 y x2 = 92,5. Construya unIC bilateral del 95% para la diferencia en el octanaje promedio.

4. Considere la situacion sobre pruebas de octanaje descrita en el ejercicio anterior.¿Que tamano de muestra se requiere para cada poblacion si se desea tener una confi-anza del 95% de que el error al estimar la diferencia entre las medias de octanaje seamenor que 1?

5. Se piensa que la concentracion del ingrediente activo de un detergente lıquido pararopa, es afectada por el tipo de catalizador utilizado en el proceso de fabricacion. Sesabe que la desviacion estandar de la concentracion activa es de 3g/l sin importar eltipo de catalizador utilizado. Se realizan diez observaciones con cada catalizador, y seobtiene los datos siguientes:

Catalizador1 : 57,9 66,2 65,4 65,4 65,2 62,6 67,6 63,7 67,2 71,0Catalizador2 : 66,4 71,7 70,3 69,3 64,8 69,6 68,6 69,4 65,3 68,8

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 131: Libro Ejercicios Jimenez y Olea Tomo I

7.2 Ejercicios Propuestos 125

a) Encuentre un IC del 95% para la diferencia entre las medias de las concentracionesactivas para los dos catalizadores.

b) ¿Existe alguna evidencia que indique que las concentraciones activas medias de-penden del catalizador utilizado?

6. Un ingeniero civil hace pruebas con la resistencia a la comprension del concreto. Paraello elimina 12 especımenes y obtiene los siguientes datos

2216 2237 2249 22042225 2301 2281 22632318 2255 2275 2295

a) Construya un IC bilateral del 95% para la resistencia promedio.

b) Construya un IC inferior del 95% para la resistencia promedio.

7. La pintura para autopistas se surte en dos colores: blanco y amarillo. El interes se centraen el tiempo de secado de la pintura; se sospecha que la pintura de color amarillo seseca mas rapidamente que la blanca. Se obtienen mediciones de ambos tipos de pintura.Los tiempos de secado (en minutos) son los siguientes:

Blanca : 120 132 123 122 140 110 120 107Amarilla : 126 124 116 125 109 130 125 117 129 120

a) Encuentre un IC del 95% para la diferencia entre los tiempos de secado promedio,suponiendo que las desviaciones estandar de estos son iguales. Suponga que eltiempo de secado esta distribuido de manera normal.

b) ¿Existe alguna evidencia que indique que la pintura amarilla se seca mas rapida-mente que la blanca?

8. Considere los datos del ejercicio 6). Construya lo siguiente.

a) Un IC bilateral de 99% para σ2.

b) Un IC inferior del 99% para σ2.

c) Un IC superior del 99% para σ2.

9. Considere los datos del ejercicio 5). Encuentre un IC del 95% para el cuociente de lasdos varianzas σ2

1/σ22. ¿Parece razonable concluir que las dos varianzas son iguales?

10. Se toma una muestra de 50 cascos de suspension utilizados por los corredores de mo-tocicleta y los conductores de automoviles de carrera, y se sujetan a una prueba deimpacto. En 18 de los cascos se observa cierto dano.

a) Encuentre un IC bilateral del 95% para la verdadera proporcion de cascos de estetipo que demostraran dano como resultado de la prueba.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 132: Libro Ejercicios Jimenez y Olea Tomo I

126 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

b) Al utilizar la estimacion puntual de p obtenida a partir de la muestra preliminarde 50 cascos, ¿cuantos cascos deben probarse para tener una confianza del 95%que el error al estimar el verdadero valor de p sea menor que 0.02?

c) ¿De que tamano debe ser la muestra si se desea tener una confianza de al menos95% de que el error al estimar p sea menor que 0.02, sin importar el valor ver-dadero de p?

11. Se analiza la fraccion de productos defectuosos producidos por dos lıneas de produccion.Una muestra aleatoria de 100 unidades provenientes de la lınea 1 contiene 10 que sondefectuosos, mientras que una muestra aleatoria de 120 unidades de la lınea 2 tiene25 que son defectuosas. Encuentre un IC del 99% para la diferencia en fracciones deproductos defectuosos producidos por las dos lıneas.

12. Un fabricante de gasolinas mide el octanaje de sus productos. A continuacion se presen-tan los datos obtenidos de 30 muestras tomadas del proceso de produccion. Encuentreun intervalo de tolerancia del 95% que contenga al menos el 95% de los valores deoctanaje para la gasolina producida por ese proceso.

86,98 86,90 86,94 87,11 86,80 87,0287,10 87,13 86,92 87,04 86,92 87,1387,10 86,91 87,03 86,91 87,05 86,9586,94 86,92 87,16 87,08 87,13 86,8486,91 86,83 87,19 86,81 86,98 86,97

13. Supongase que conocemos que un saco podrıa contener 1 bola roja y 4 bolas blancas o,alternativamente, 4 bolas rojas y 1 blanca. Una bola es extraıda, y la hipotesis que unabola es roja y 4 bolas son blancas puede ser no rechazada si y solo sı la bola extraıdaes blanca.

(a) Encontrar α y β

(b) Cuales son los valores de α y β si la alternativa es 3 bolas rojas y 2 bolas blancas

14. Supongase que sabemos que un saco podrıa contener 2 bolas rojas y 3 blancas (lahipotesis a ser testeada) o 3 bolas rojas y 2 blancas (la alternativa). Dos bolas sonextraıdas sin reemplazo, y la hipotesis es rechazada si y solo si ambas bolas extraıdasson rojas. Hallar α y β

15. Una caja contiene 10 bolas, y queremos testear la hipotesis que 2 bolas son rojas y 8son blancas frente a la alternativa que mas de 2 bolas son rojas. Extraemos 2 bolassin reemplazo y rechazamos la hipotesis si y solo si ambas bolas extraıdas son rojas. a)Hallar a b) Hallar b(q) y graficar la funcion potencia

(a) Hallar α

(b) Hallar β(θ) y graficar la funcion potencia

16. ¿Si una moneda es tirada 5 veces y sale 5 veces cara, podemos concluir que la monedano es honesta?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 133: Libro Ejercicios Jimenez y Olea Tomo I

7.2 Ejercicios Propuestos 127

17. Considere el siguiente caso no matematico como una prueba de hipotesis. En la escenade un accidente grave, un medico contrasta la hipotesis nula “esta vıctima esta viva”.

(a) Establezca cuidadosamente el significado de los cuatro resultados posibles indica-dos en la tabla 1.

(b) Decida sobre la gravedad de los errores posibles.

(c) Si α y β pudiesen ser controlados estadısticamente, ¿que conjunto de probabili-dades serıan preferibles para la vıctima?

I. α=0.001 y β=0.10II. α=0.05 y β=0.05III. α=0.10 y β=0.001

Tabla 1

Hipotesis NulaDecision Verdadera FalsaNo se rechaza Ho Decision correcta Error tipo IISe rechaza Ho Error tipo I Decision correcta

18. Un fabricante de fibras textiles esta investigando una nueva fibra para tapicerıa, la cualtiene una elongacion media por hilo de 12 kg. con una desviacion estandar de 0.5 kg.La companıa desea probar la hipotesis H0 : µ < 12, utilizando para ello una muestraaleatoria de 4 especımenes.

19. Un consumidor de cierto producto acusa al fabricante diciendo que mas del 20% delas unidades producidas eran defectuosas. Para confirmar su acusacion se utilizo unamuestra de tamano 50 donde el 27% de los artıculos eran defectuosos ¿Que concluyeusted?

20. Una fabrica de hamburguesas inicio un proceso de revision de los estandares de calidadde sus productos. Dichos estandares establecen ciertas dimensiones para el diametrode sus hamburguesas, el diametro medio es de 13.9 cm con una desviacion estandarestimada de 0.9 cm. Un estandar de calidad establece que el diametro medio de lashamburguesas debe ser de 14.5 cm. ¿Hay alguna evidencia en los datos que las ham-burguesas tienen un diametro incorrecto? ¿Que supuesto utilizo?

21. Se utilizan dos maquinas para llenar botellas de plastico con un volumen neto de16.0 onzas. Las distribuciones de los volumenes de llenado pueden suponerse normales,con desviaciones estandar σ1 = 0,020 y σ2 = 0,025 onzas. Un miembro del grupo deingenierıa de calidad sospecha que el volumen neto de llenado de ambas maquinas es elmismo, sin importar si este es o no de 16 onzas. De cada maquina se toma una muestraaleatoria de 10 botellas.

Maquina 1: 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99Maquina 2: 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16,00

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 134: Libro Ejercicios Jimenez y Olea Tomo I

128 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

a) ¿ Se encuentra el ingeniero en lo correcto? Utilice α = 0,05.

b) ¿Cual es el valor-p de esta prueba?

c) Si se supone que el tamano de las muestras es el mismo, ¿que tamano de muestradebe utilizarse para asegurar que β = 0,05 si la diferencia verdadera entre lasmedias es 0.08? Suponga que α = 0,05.

d) ¿Cual es la potencia de la prueba del inciso a) si la diferencia verdadera entre lasmedidas es 0.08?

22. Existen dos tipos de plasticos apropiados para su uso por un fabricante de componenteselectronicos. La tension de ruptura de este plastico es un parametro importante. Sesabe que σ1 = σ2 = 1,0 psi. De una muestra aleatoria de tamano n1 = 10 y n2 = 12, setiene que x1 = 162,5 y x2 = 155,0. La companıa no adoptara el plastico 1 a menos quela tension de ruptura de este exceda a la del plastico 2 al menos por 10 psi. Con basea la informacion contenida en la muestra, ¿La companıa debera utilizar el plastico 1?Utilice α = 0,05 para llegar a una decision.

23. En una industria se desea verificar si la productividad media de los operarios del perıododiurno es igual a la productividad media de los operarios del perıodo nocturno. Sesupone que las productividades de los operarios de los diferentes perıodos son inde-pendientes y normalmente distribuidas. Se seleccionan muestran de igual tamano paracada uno de los perıodos obteniendose los siguientes resultados:

Perıodo No de operarios Media VarianzaDiurno 15 12 35.71

Nocturno 15 10 36.43

a) Verifique igualdad de varianzas con nivel α = 0,1

b) Verifique si las productividades medias son iguales con nivel α = 0,05.

c) Determine la probabilidad de aceptar la igualdad de medias en (b), si la realidades que la diferencia entre las productividades medias es de una unidad. Aproximelos valores t1−α por z1−α.

24. Para alcanzar la maxima eficiencia en una operacion de ensamblaje en una fabrica losobreros nuevos requieren alrededor de un mes de capacitacion. Se sugiere un nuevometodo de capacitacion y se realiza una prueba para compararlo con el tradicional.Para este fin se capacitan dos grupos de nueve obreros durante un perıodo de tressemanas; uno de los grupos aplica el nuevo metodo y el otro el tradicional. Al finalde las tres semanas de capacitacion se mide el tiempo (en minutos) que le toma acada obrero ensamblar el dispositivo. Los resultados obtenidos de las muestras son lossiguientes (asuma normalidad de los datos)

MetodoEstadıstico Tradicional Nuevo

n 9 9Promedio 35 31Varianza 25 20

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 135: Libro Ejercicios Jimenez y Olea Tomo I

7.2 Ejercicios Propuestos 129

¿Hay suficiente evidencia que indique que las medias de los tiempos reales son diferentescon los dos metodos? Realice una prueba con el nivel α = 5 %. Determine el valor-p dela prueba. (sea explıcito, de hipotesis, test y conclusion).

25. El contenido de nicotina de dos marcas de cigarros, medidas en miligramos, es lasiguiente:

A 2.1 4.0 6.3 5.4 4.8 3.7 6.1 3.3B 4.1 0.6 3.1 2.5 4.0 6.2 1.6 2.2 1.9 5.4

¿Los contenidos de nicotina de las dos marcas seran diferentes?. Considere α = 5 %.

26. Un experimento quiere determinar la eficacia de un nuevo elemento versus la dietaactual (control) para reducir la cantidad de grasa en los cerdos. Los datos se encuentranen la siguiente tabla:

Nuevo 676 206 230 256 280 433 337 466 497 512 794 428 452 512Control 88 570 605 617 653 2913 924 286 1098 982 2346 321 615 519

Utilice la teorıa normal para testear la hipotesis de que existe diferencia entre los dostipos de produccion.

27. Para la elaboracion de un neumatico se utilizan dos metodos. A dichos neumaticos seles mide el desgaste. Se seleccionan 12 neumaticos de cada tipo y siendo sus medicionesde desgaste, las siguientes:

Proceso 1 329 436 457 463 477 479 1297 1319 1340 1385 1398 1440Proceso 2 313 563 670 940 1002 1261 1305 1531 1614 1694 1701 1708

Utilice la teorıa de normalidad para testear la hipotesis de que no existe diferenciaentre los metodos de elaboracion.

28. Se efectua una prueba de impacto Izod sobre 20 muestras de tuberıa PVC. El estandarASTM para este material requiere que la resistencia al impacto Izod sea mayor que1.0 ft-lb/in. El promedio y la desviacion estandar muestrales son x = 1,25 y s = 0,25,respectivamente. Pruebe H0 : µ = 1,0 contra H1 : µ > 1,0 utilizando α = 0,01. Obtengaconclusiones.

29. En la fabricacion de semiconductores, a menudo se utiliza una sustancia quımica paraquitar el silicio de la parte trasera de las obleas antes de la metalizacion. En esteproceso es importante la rapidez con la que actua la sustancia. Se han comparado dossoluciones quımicas, utilizando para ello dos muestras aleatorias de 10 obleas para cadasolucion. La rapidez de accion observada es la siguiente (en mils/min):

Solucion 1: 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1Solucion 2: 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 136: Libro Ejercicios Jimenez y Olea Tomo I

130 Capıtulo 7. Intervalos de Confianza y Test de Hipotesis

a) ¿Los datos apoyan la informacion que la rapidez promedio de accion es la mismapara ambas soluciones? Para obtener sus conclusiones, utilice α = 0,05 y supongaque las varianzas de ambas poblaciones son iguales.

b) Calcule el valor-p para la prueba del inciso (a).

c) Construya diagramas de caja para las dos muestras. ¿Estas graficas apoyan lahipotesis de que las varianzas son iguales? Escriba una interpretacion practica deestas graficas.

30. El sistema de enfriamiento de un submarino nuclear esta formado por un ensamblede tuberıas soldadas por donde circula un lıquido refrigerante. Las especificacionesrequieren que la resistencia de la soldadura sea mayor o igual que 150 psi.

a) Suponga que los ingenieros del diseno deciden probar la hipotesis H0 : µ = 150contra H1 : µ > 150. Explique por que esta eleccion de hipotesis alternativa esmejor que H1 : µ < 150.

b) Al tomar una muestra aleatoria de 20 soldaduras se tiene que x = 153,7 psi. ys = 11,3 psi. ¿Que conclusiones pueden obtenerse con respecto a la hipotesis delinciso a)? Utilice α = 0,05.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 137: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 8

Test de Homogeneidad,Independencia y Bondad de Ajuste

8.1. Ejercicios Resueltos

EJERCICIO 1

Un ginecologo analiza la posible relacion entre la edad de la menarquıa y la aparicion decancer de mama. Con el fin de estudiarlo clasifica a las mujeres que acuden a su consulta endos grupos, aquellas que tuvieron la menarquıa antes de los 12 anos (a las que distingue conel valor cero), y aquellas que la tuvieron despues de esta edad ( a las que distingue con elvalor 1). Se presentan a continuacion los resultados obtenidos:

Cancer de MamaEdad de la Menarquıa Sı No

0 64 531 47 139

Determine si existe relacion o no entre estas variables.

SOLUCION

Para medir si existe relacion entre la edad de la menarquia y el cancer de mama, realizamosun test de independencia.

H0 : nij =ni· · n·j

n··H1 : no existe independencia

Para tal hipotesis, ocupamos el estadıstico χ2.

χ2 =∑i,j

(obs− esp)2

esp

en donde los observados son los valores que aparecen en la tabla y los esperados los calcu-lamos mediante H0, por ejemplo, el esperado para la casilla

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 138: Libro Ejercicios Jimenez y Olea Tomo I

132 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

n11 =n1· · n·1

n··=

117 · 111

303= 42,8613

Luego para cada casilla, los esperados serıan los que se muestran a continuacion:

Cancer

Si No Total

0 64 53 117

Edad 42,86 74,14

1 47 139 186

68,14 117,86

Total 111 192 303

Luego el estadıstico nos queda de la siguiente manera:

χ2 =(64− 42,86)2

42,86+

(53− 74,14)2

74,14+

(47− 68,17)2

68,14+

(139− 117,86)2

117,86

= 10,425 + 6,027 + 6,558 + 3,791

= 26,801

Ahora, rechazamos H0 si χ2 > χ2(filas−1)(columnas−1),1−α donde filas en este caso tenemos 2 y

columnas 2 y el α lo escogemos como 0.05. Por lo tanto tenemos χ21,0,95 = 3,84 buscado en

una tabla de la distribucion Chi-Cuadrado.

Luego, como χ2 = 26,801 > χ21,0,95 = 3,84 se rechaza la hipotesis de que ambas variables

sean independientes con un 95% de confianza.

EJERCICIO 2

De un proceso de fabricacion, se seleccionan 100 ampolletas de 75 watts y se lleva a cabouna prueba para determinar la vida util de estas ampolletas. El resultado de esta prueba, enmiles de horas, se resume en la siguiente tabla:

Tiempo de Duracion 0 - 0.2 0.2 - 0.4 0.4 - 0.6 0.6 - 0.8 0.8 - 1 1 - 1.1N o de Ampolletas 29 20 15 9 12 15

¿ Se puede concluir al nivel de significancia del 5%, que la vida util de todas las ampolletasse distribuye exponencial?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 139: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 133

SOLUCION

En este caso debemos hacer un test de Bondad de Ajuste, para una distribucion exponencialde los datos.

Para esto debemos sacar las frecuencias esperadas para cada uno de los rangos, bajo lahipotesis de una distribucion exponencial, luego primero debemos estimar el parametro λ dela exponencial.Sabemos que la E(X) = 1

λcuando X ∼ Exp(λ), luego ocupemos el estimador de la media:

x =

∑MC · fi∑

fi

= 0,4865 =1

λ

La media la calculamos ası por tener los datos en una tabla de frecuencias.

Luego, obtenemos que:

λ =1

0,4865= 2,055

Posteriormente, calculamos las probabilidades de estar en cada uno de las clases de la tablade frecuencias, para despues calcular la frecuencia esperada.

P (0 < X < 0,2) =

∫ 0,2

0

2,055e−2,055xdx = 0,337

P (0,2 < X < 0,4) =

∫ 0,4

0,2

2,055e−2,055xdx = 0,2234

P (0,4 < X < 0,6) =

∫ 0,6

0,4

2,055e−2,055xdx = 0,1481

P (0,6 < X < 0,8) =

∫ 0,8

0,6

2,055e−2,055xdx = 0,0982

P (0,8 < X < 1,0) =

∫ 1

0,8

2,055e−2,055xdx = 0,0651

P (1,0 < X < 1,1) =

∫ 1,1

1

2,055e−2,055xdx = 0,0237

Como tenemos un total de 100 observaciones, las frecuencias esperadas las obtenemos mul-tiplicando la probabilidad de estar en la clase por 100, es decir:

fesperada[0− 0,2] = P (0 < X < 0,2) · 100 = 33,7

Luego haciendo el calculo para cada celda, queda:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 140: Libro Ejercicios Jimenez y Olea Tomo I

134 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

Tiempo de Duracion 0 - 0.2 0.2 - 0.4 0.4 - 0.6 0.6 - 0.8 0.8 - 1 1 - 1.1N o de Ampolletas 29 20 15 9 12 15

N o de Amp. Esperado 33.7 22.34 14.81 9.82 6.51 2.37

Finalmente para testear nuestra hipotesis

H0 : Los datos distribuyen Exponencial v/s H1 : No distribuyen exponencial

Ocupamos el estadıstico

χ2 =∑

i

(obsi − espi)2

espi

=(29− 33,7)2

33,7+

(20− 22,34)2

22,34+

(15− 14,81)2

14,81+

(9− 9,82)2

9,82+

(12− 6,51)2

6,51+

(15− 2,37)2

2,37

= 72,9

Luego rechazamos H0 si χ2 > χ21−α,k−p−1 = χ2

0,95,6−1−1 = 9,48 con k el numero de clases y pel numero de parametros de la distribucion.

Por lo tanto, como 72,9 > 9,48 se rechaza la postura de una distribucion exponencial en losdatos del tiempo de vida de las ampolletas.

EJERCICIO 3

Un mecanico analiza la posible relacion entre la edad de la maquina y la aparicion de unafalla grave. Con el fin de estudiarlo clasifica a las maquinas en dos grupos, aquellas quetuvieron una falla grave antes de los 12 anos (a las que distingue con el valor 0), y aquellasque la tuvieron despues de esta edad (a las que distingue con el valor 1). Se presentan acontinuacion los resultados obtenidos:

Falla GraveSi No

Edad Maquina 0 64 531 47 139

(a) Calcule el Test χ2 de Pearson.

(b) Determine si existe relacion o no entre la variables

SOLUCION

Completamos la tabla dada con los valores esperados

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 141: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 135

Falla GraveSi No Total

0 64 53 11742,861 74,139

Edad Maquina1 47 139 186

68,139 117,861

Total 111 192 303

(a) Dada la tabla completa con los los valores esperados calculamos el estadıstico comosigue:

χ2 =r∑

i=1

c∑j=1

(Oij − Eij)2

Eij

=2∑

i=1

2∑j=1

(Oij − Eij)2

Eij

=(64− 42,8613)2

42,8613+

(53− 74,138)2

74,138+

(47− 68,138)2

68,138+

(139− 117,861)2

117,861

= 10,425 + 6,027 + 6,558 + 3,791

= 26,801

(b) Se rechaza H0 : ∃ independencia entre la edad de la maquina y si la falla es grave si

χ2 > χ(1−α;(f−1)·(c−1))

Comoχ2 = 26,801 > 3,841459 = χ0,95;1

Se rechaza la hipotesis de independencia entre las fallas graves y la edad de las maquinas.

EJERCICIO 4

Suponga que cierto artıculo puede presentar hasta 4 defectos diferentes. Una muestra aleato-ria de 625 de estos artıculos es clasificado de acuerdo al numero de defectos, obteniendose losiguiente:

# de defectos 0 1 2 3 4# de casos 82 185 182 110 66

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 142: Libro Ejercicios Jimenez y Olea Tomo I

136 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

Un ingeniero afirma que el numero de defectos X es una variable aleatoria con distribucionde probabilidad

P (X = x) =

17

2x

x!x = 1, 2, 3, 4

0 e.o.c

¿Que podrıa concluir, en base a los datos de la muestra, con α = 0,05, respecto de lo firmadopor el ingeniero?

SOLUCION

Necesitamos calcular las frecuencia esperadas, mediante las probabilidades.

P (X = 0) = 17

20

0!= 0,1428

P (X = 1) = 17

21

1!= 0,2857

P (X = 2) = 17

22

2!= 0,2857

P (X = 3) = 17

23

3!= 0,1904

P (X = 4) = 17

24

3!= 0,0952

luego el numero de casos esperados sera

Ei = P (X = i) · 625 = no de defectos igual a i

una vez calculados estos valores tenemos lo siguiente

# de defectos (i) 0 1 2 3 4# de casos observado (Oi) 82 185 182 110 66# de casos esperados (Ei) 89.25 178.56 178.56 119 59.5

Para la hipotesis H0: los datos distribuyen con la funcion de probabilidad dada.

Se rechaza H0 si

χ2 =5∑

i=1

(Oi − Ei)2

Ei

> χ21−α;k−p−1

donde k: no de clases y p: no de parametros.

Luego

χ2 = 2,2782 ≯ χ20,95;5−0−1 = 9,4877

por lo tanto no existe evidencia suficiente bajo un 95% de confianza para rechazar H0, esdecir, los datos pueden ser modelados por la distribucion dada.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 143: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 137

EJERCICIO 5

Una empresa empaca determinado producto de latas de tres tamanos distintos, cada uno endistinta lınea de produccion. La mayor parte de las latas se apegan a las especificaciones,pero un ingeniero de control de calidad ha identificado los siguientes defectos:

Mancha en la lata.

Grieta en la lata.

Ubicacion incorrecta del anillo de apertura.

Falta del anillo de apertura.

Otras.

Se selecciona una muestra de unidades defectuosas de cada una de las tres lıneas, y cadaunidad se clasifica segun el defecto, la siguiente tabla de contingencia incluye esos datos:

DefectoMancha Grieta Ubicacion Falta Otras Tamano de la muestra

Lınea 1 34 65 17 21 13 150de 2 23 52 25 19 6 125Produccion 3 32 28 16 14 10 100

Total 89 145 58 54 29 375

¿Los datos sugieren desigualdad en las proporciones que caen en las distintas categorıas delas tres lıneas?

SOLUCION

Los parametros de interes son las diversas proporciones y las hipotesis relevantes son:

H0: Las lıneas de produccion son homogeneas con respecto a las 5 categorıas que no cumplenlas especificaciones.

H1: Las lıneas de produccion no son homogeneas con respecto a las 5 categorıas que nocumplen las especificaciones.

Ahora se presenta una tabla resumen con los valores esperados y el valor de (Obs. −Esp.)2/Esp.

C1 C2 C3 C4 C5 Total1 34 65 17 21 13 150

35,60 58,00 23,20 21,60 11,600,072 0,845 1,657 0,017 0,169

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 144: Libro Ejercicios Jimenez y Olea Tomo I

138 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

2 23 52 25 19 6 12529,67 48,33 19,33 18,00 9,671,498 0,278 1,661 0,056 1,391

3 32 28 16 14 10 10023,73 38,67 15,47 14,40 7,732,879 2,943 0,018 0,011 0,664

Total 89 145 58 54 29 375

luego, bajo un 95% de confianza

χ2 = 14,159 ≯ 15,50731 = χ20,95;(3−1)·(5−1)

lo que indica que no existe suficiente evidencia para rechazar H0, es decir las lıneas de produc-cion serıan homogeneas con respecto a las 5 categorıas que no cumplen las especificaciones.

Si disminuimos la confianza a un 90% tenemos que

χ2 = 14,159 > 13,36157 = χ20,90;(3−1)·(5−1)

luego, ahora sı existirıa evidencia bajo este nivel de significancia para rechazar H0.

EJERCICIO 6

Un estudio de la relacion entre las condiciones de las instalaciones en gasolineras y la agre-sividad en el precio de la gasolina reporta los siguientes datos basados en una muestra den = 144 gasolineras.

Agresividad Neutral No agresiva ni.

Anticuada 24 15 17 56Estandar 52 73 80 205Moderna 58 86 36 180n.j 134 174 133 441

En el nivel 0.01, ¿la informacion sugiere que las condiciones de instalaciones y las polıticasde precios son independientes entre si?

SOLUCION

La hipotesis a docimar es:

H0: Las condiciones de las instalaciones con la polıtica de precios son independientes.

vs

H1: No existe independencia.

La siguiente tabla resumen entrega la informacion necesaria para calcular el estadıstico χ2.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 145: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 139

C1 C2 C3 Total

1 24 15 17 56

17,02 22,10 16,89

2,867 2,278 0,001

2 52 73 80 205

62,29 80,88 61,83

1,700 0,769 5,343

3 58 86 36 180

54,69 71,02 54,29

0,200 3,159 6,159

Total 134 174 133 441

luego, bajo un 99% de confianza

χ2 = 22,476 > 13,2767 = χ20,99;(3−1)·(3−1)

lo que indica que existe suficiente evidencia con este nivel de confianza para rechazar H0,es decir el conocimiento de la polıtica de precios de una gasolinera proporciona informacionacerca de la condicion de las instalaciones de la gasolinera.

EJERCICIO 7

Se obtuvo una muestra aleatoria de individuos que viajan solos en automovil al trabajo, enuna gran zona metropolitana, y cada individuo fue clasificado de acuerdo con el tamano desu automovil y la distancia de recorrido citadino. ¿La siguiente informacion sugiere que dichadistancia y el tamano del automovil estan relacionados en la poblacion a la cual se hizo elmuestreo? Exprese las hipotesis pertinentes y utilice una prueba Chi-cuadrado con un nivel0.05.

Distancia de Recorrido[0, 10) [10, 20) [20, . . .)

Subcompacto 6 27 19Tamano de Compacto 8 36 17Automovil Mediano 21 45 33

Grande 14 18 6

SOLUCION

La hipotesis a docimar es:

H0: Existe independencia entre la distancia de recorrido y el tamano del automovil.

vs

H1: No existe independencia.

La siguiente tabla resumen entrega la informacion necesaria para calcular el estadıstico χ2.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 146: Libro Ejercicios Jimenez y Olea Tomo I

140 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

C1 C2 C3 Total

1 6 27 19 52

10,19 26,21 15,60

1,724 0,024 0,741

2 8 36 17 61

11,96 30,74 18,30

1,309 0,899 0,092

3 21 45 33 99

19,40 49,90 29,70

0,131 0,480 0,367

4 14 18 6 38

7,45 19,15 11,40

5,764 0,069 2,558

Total 49 126 75 250

luego, bajo un 95% de confianza

χ2 = 14, 158 > 12,59159 = χ20,95;(4−1)·(3−1)

lo que indica que existe suficiente evidencia con este nivel de confianza para rechazar H0, esdecir, la distancia de recorrido proporciona informacion acerca el tamano del automovil.

EJERCICIO 8

Una empresa quiere contratar a cierta cantidad de personas y de los postulantes que sepresentan se hace una preseleccion de 24 hombres y 24 mujeres de entre los cuales el jefe depersonal decide quien sera contratado y quien no. Despues de que el jefe de personal hizo laseleccion de los contratados los resultados fueron los siguientes,

Hombre MujerContratado 21 14

No contratado 3 10

Alguien acusa al empleador de tener un sesgo de seleccion a favor de los hombres ya que 21 de24 hombres fueron contratados y solo 14 de 24 mujeres tambien lo fueron. ¿Existira discrimi-nacion por parte del jefe de personal?. Plantee las hipotesis con palabras y parametricamente,llegue a conclusiones utilizando un nivel de significancia de α = 0,05.

SOLUCION

Hipotesis:H0 : No existe discriminacion (Homogeneidad)

vs

H1 : Existe discriminacion (No Homogeneidad)

Equivalentemente

H0 : p1j = p2j j = 1, 2 vs H1 : p1j 6= p2j para algun j

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 147: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 141

Para testear tales hipotesis, se ocupa el estadıstico

χ2 =n∑

i=1

m∑j=1

(oij − eij)2

eij

donde eij =ni·n·j

n··, el cual rechaza H0 cuando χ2 ≥ χ2

1−α,(I−1)(J−1).

Luego la tabla de valores esperados es:

Hombre Mujer Total ni·Contratado 17,5 17,5 35

No contratado 6,5 6,5 13Total n·j 24 24 48

Por lo tanto el estadıstico de prueba queda

χ2 =(21− 17,5)2

17,5+

(14− 17,5)2

17,5+

(3− 6,5)2

6,5+

(10− 6,5)2

6,5= 5,1692

Como χ2 = 5,1692 > 3,84 = χ20,95,1, se rechaza H0, es decir, con un 95% de confianza existe

discriminacion hacia la mujer por parte del jefe de personal.

EJERCICIO 9

De cada una de tres comunidades se saco una muestra de jovenes casados. A cada pareja se lepidio que especificara la cantidad mınima de educacion que esperaba que sus hijos recibieran.La siguiente tabla muestra los resultados que se observaron en la muestra:

ComunidadNivel Mınimo A B C Total

Colegio 30 28 24 82Educ. comercial 30 19 46 95Universitario 90 78 130 298

Total 150 125 200 475

¿Que se puede concluir respecto a la homogeneidad de las aspiraciones en la educacion delos hijos?

SOLUCION

Las hipotesis son:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 148: Libro Ejercicios Jimenez y Olea Tomo I

142 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

H0 : Las 3 poblaciones son homogeneas respecto de las aspiraciones de educacion para sushijos. (p11 = p12 = p13).

H1 : Las 3 poblaciones no son homogeneas (Por lo menos 2 proporciones de una misma filano son iguales entre si.)

Para testear tales hipotesis, se ocupa el estadıstico

χ2 =I∑

i=1

J∑j=1

(oij − eij)2

eij

donde eij =ni·n·j

n··, el cual rechaza H0 cuando χ2 ≥ χ2

1−α,(I−1)(J−1).

Luego la tabla de valores esperados es:

ComunidadNivel Mınimo A B C Total

Colegio 25.89 21.58 34.53 82Educ. comercial 30.00 25.00 40.00 95Universitario 94.11 78.42 125.5 298

Total 150 125 200 475

Por lo tanto el estadıstico de prueba queda

χ2 =(30− 25,89)2

25,89+

(28− 21,58)2

21,58+

(24− 34,53)2

34,53+

(30− 30)2

30+

(19− 25)2

25+

(46− 40)2

40

+(90− 94,11)2

94,11+

(78− 78,42)2

78,42+

(130− 125,5)2

125,5

= 8,455

Como χ2 = 8,455 < 9,488 = χ20,95,4, no existe evidencia en los datos para rechazar H0, es

decir, con un 95% de confianza existe homogeneidad entre las comunidades.

EJERCICIO 10

Se selecciono una muestra al azar de 275 alumnos de ultimo ano de colegio de cada unode los siguientes tres grupos de rendimiento atletico: alto, medio y bajo. Los muchachos seclasificaron de acuerdo con la inteligencia tal como aparece en la tabla. ¿Indican estos datosuna diferencia en la distribucion de la inteligencia entre los tres grupos?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 149: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 143

RendimientoInteligencia Alto Medio Bajo Total

Alta 45 60 68 173Media 10 15 25 50Baja 5 15 32 52Total 60 90 125 100

SOLUCION

Las hipotesis son:

H0 : Los 3 niveles de inteligencia son homogeneos respecto del rendimiento. (p1j = p2j = p3j).

H1 : Los 3 niveles de inteligencia no son homogeneos respecto del rendimiento (Por lo menos2 proporciones de una misma columna no son iguales entre si.)Para testear tales hipotesis, se ocupa el estadıstico

χ2 =I∑

i=1

J∑j=1

(oij − eij)2

eij

donde eij =ni·n·j

n··, el cual rechaza H0 cuando χ2 ≥ χ2

1−α,(I−1)(J−1).

Luego la tabla de valores esperados es:

RendimientoInteligencia Alto Medio Bajo Total

Alta 37.77 56.62 78.64 173Media 10.91 16.36 36.36 50Baja 11.35 17.02 23.64 52Total 60 90 125 100

Por lo tanto el estadıstico de prueba queda

χ2 =(45− 37,77)2

37,77+

(60− 56,62)2

56,62+

(68− 78,64)2

78,64+

(10− 10,91)2

10,91+

(15− 16,36)2

16,36+

(25− 36,36)2

36,36

+(5− 11,35)2

11,5+

(15− 17,02)2

17,02+

(32− 23,64)2

23,64

= 10,199

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 150: Libro Ejercicios Jimenez y Olea Tomo I

144 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

Como χ2 = 10,199 > 9,488 = χ20,95,4, se rechaza H0, es decir, con un 95% de confianza no

existe homogeneidad entre los niveles intelectuales.

EJERCICIO 11

Un investigador desea saber si es posible concluir que hay relacion entre el grado de liber-alismo y la posicion en la universidad en una poblacion de estudiantes universitarios. Paraestos efectos se selecciono una muestra de 500 estudiantes. La tabla siguiente muestra laclasificacion de los datos segun sus respuestas:

Grado de LiberalismoClase Ligero Moderado Alto Total

1er. ano 30 83 37 1502o. ano 19 56 50 1253er. ano 16 46 63 1254o. ano 10 38 52 100Total 75 223 202 500

¿Que se puede concluir respecto al problema del investigador?

SOLUCION

Las hipotesis son:

H0 : Existe independencia entre el grado de liberalismo y el ano universitario. (nij =ni·n·jnij

).

H1 : No existe independencia entre el grado de liberalismo y el ano universitario.(nij 6= ni·n·jnij

).

Para testear tales hipotesis, se ocupa el estadıstico

χ2 =I∑

i=1

J∑j=1

(oij − eij)2

eij

donde eij =ni·n·j

n··, el cual rechaza H0 cuando χ2 ≥ χ2

1−α,(I−1)(J−1).

Luego la tabla de valores esperados es:

Grado de LiberalismoClase Ligero Moderado Alto Total

1er. ano 22.50 66.90 60.60 1502o. ano 18.75 55.75 50.50 1253er. ano 18.75 55.75 50.50 1254o. ano 15.00 44.60 40.40 100Total 75 223 202 500

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 151: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 145

Por lo tanto el estadıstico de prueba queda

χ2 =(30− 22,5)2

22,5+

(83− 66,9)2

66,9+

(37− 60,6)2

60,6+

(19− 18,75)2

18,75+

(56− 55,75)2

55,75+

(50− 50,5)2

50,5

+(16− 18,75)2

18,75+

(46− 55,75)2

55,75+

(63− 50,5)2

50,5+

(10− 15)2

15+

(38− 44,6)2

44,6+

(52− 40,4)2

40,4

= 26,751

Como χ2 = 26,751 > 12,592 = χ20,95,6, se rechaza H0, es decir, con un 95% de confianza el

grado de liberalismo en los estudiantes universitarios no es independiente del ano que cursael alumno.

EJERCICIO 12

Una muestra de 500 personas responde dos preguntas: filiacion polıtica y actitud hacia unareforma de impuestos, los resultados son los siguientes:

Actitud hacia ReformaFiliacion A favor Indiferente En contra Total

Democrata 138 83 64 285Republicano 64 67 84 215

Total 202 150 148 500

¿Existe relacion entre la tendencia polıtica y la actitud hacia la reforma de impuestos?.Plantee la hipotesis necesaria y concluya.

SOLUCION

Las hipotesis son:

H0 : Existe independencia entre la tendencia polıtica y la actitud hacia la reforma. (nij =ni·n·jnij

).

H1 : Existe asociacion entre la tendencia polıtica y la actitud hacia la reforma.(nij 6= ni·n·jnij

).

Para testear tales hipotesis, se ocupa el estadıstico

χ2 =I∑

i=1

J∑j=1

(oij − eij)2

eij

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 152: Libro Ejercicios Jimenez y Olea Tomo I

146 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

donde eij =ni·n·j

n··, el cual rechaza H0 cuando χ2 ≥ χ2

1−α,(I−1)(J−1).

Luego la tabla de valores esperados es:

Actitud hacia ReformaFiliacion A favor Indiferente En contra Total

Democrata 115.14 85.5 84.36 285Republicano 86.86 64.5 63.64 215

Total 202 150 148 500

Por lo tanto el estadıstico de prueba queda

χ2 =(138− 115,14)2

115,14+

(83− 85,5)2

85,5+

(64− 84,36)2

84,36+

(64− 86,86)2

86,86+

(67− 64,5)2

64,5+

(84− 63,64)2

63,64

= 22,51

Como χ2 = 22,51 > 5,99 = χ20,95,2, se rechaza H0, es decir, con un 95% de confianza la

tendencia polıtica influye en la actitud hacia la reforma.

EJERCICIO 13

En una muestra aleatoria de 100 universitarios se clasifico cada uno de ellos segun si habıaconsumido alguna vez droga o no y el promedio de notas. A partir de los datos tabuladosen la tabla, ¿proporcionan estos datos evidencia suficiente como para concluir que hay unarelacion entre las dos variables? Use α = 0,05.

¿Ha consumido Drogas?Promedio notas Si No Total

≤ 4,0 10 29 39> 4,0 20 41 61Total 30 70 100

SOLUCION

Las hipotesis son:

H0 : Existe independencia entre el consumo de drogas y el promedio de notas (nij =ni·n·jnij

).

H1 : Existe asociacion entre el consumo de drogas y el promedio de notas.(nij 6= ni·n·jnij

).

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 153: Libro Ejercicios Jimenez y Olea Tomo I

8.1 Ejercicios Resueltos 147

Para testear tales hipotesis, se ocupa el estadıstico

χ2 =I∑

i=1

J∑j=1

(oij − eij)2

eij

donde eij =ni·n·j

n··, el cual rechaza H0 cuando χ2 ≥ χ2

1−α,(I−1)(J−1).

Luego la tabla de valores esperados es:

¿Ha consumido Drogas?Promedio notas Si No Total

≤ 4,0 11,7 27,3 39> 4,0 18,3 42,7 61Total 30 70 100

Por lo tanto el estadıstico de prueba queda

χ2 =(10− 11,7)2

11,7+

(29− 27,3)2

27,3+

(20− 18,3)2

18,3+

(41− 42,7)2

42,7

= 0,578

Como χ2 = 0,578 < 3,841 = χ20,95,1, no se rechaza H0, es decir, con un 95% de confianza el

consumo de droga no influye en el promedio de notas de los estudiantes.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 154: Libro Ejercicios Jimenez y Olea Tomo I

148 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

8.2. Ejercicios Propuestos

1. (a) Se observo la duracion en horas de 100 pilas de una determinada marca, obteniendoselos siguientes resultados:

Horas < 20 20− 40 40− 60 60− 80 ≥ 80Frecuencia 5 26 34 22 13

¿Hay evidencia suficiente para rechazar la hipotesis de que los datos siguen unadistribucion normal de parametros µ = 50 y σ = 20?

(b) Las ampolletas pueden clasificarse segun su potencia (watts) y se piensa que dealguna forma existe una relacion entre la duracion y la potencia. Para verificar loanterior se tabulan los datos, obteniendose lo siguiente:

Duracion superiora 200 horas

Si NoPotencia < 100W 30 20

≥ 100W 20 30

2. (a) El numero de accidentes sufridos por operadores de maquina de herramientasen determinada industria se registro durante cierto periodo con los resultadossiguientes:

Accidentes por Operador 0 1 2 3 4 5 6 7 8Numero de Operadores 296 74 26 8 4 4 1 0 1

Con el nivel de significancia del 5%, probar la hipotesis de que los datos provienende una distribucion Poisson.

(b) Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifico deacuerdo a la educacion y el numero de hijos de cada uno de ellos:

Cantidad de hijos0− 1 2− 3 mas de 3

Primaria 14 37 32Educacion Secundaria 19 42 17

Bachillerato 12 17 10

Pruebe la hipotesis, con un nivel de significancia del 5%, que el tamano de unafamilia es independiente del nivel de educacion del padre.

3. Cada uno de 325 individuos que participan en cierto programa de medicamentos, seclasifico con respecto a la presencia o ausencia de hipoglucemia y con respecto a la dosismedia diaria de insulina. ¿Apoyan los datos siguientes lo dicho de que la presencia oausencia de hipoglucemia es independiente de las dosis de insulina? Pruebe usandoα = 0,05.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 155: Libro Ejercicios Jimenez y Olea Tomo I

8.2 Ejercicios Propuestos 149

Dosis diaria de insulina< 0,25 0,25− 0,49 0,5− 0,74 0,75− 0,99 > 1,0

Condicion de Presente 4 21 28 15 12Hipoglucemia Ausente 40 74 59 26 46

4. Los siguientes datos corresponden a combinaciones de sexo de los recombinantes queresultan de seis diferentes genotipos masculinos. ¿Soportan los datos la hipotesis deque la distribucion de frecuencia entre las tres combinaciones de sexo es homogeneacon respecto a los diferentes genotipos? Defina los parametros de interes, exprese H0 yH1 pertinentes, y realice el analisis.

Combinacion de sexoM/M M/F F/F

1 35 80 392 41 84 45

Genotipo 3 33 87 31Masculino 4 8 26 8

5 5 11 66 30 65 20

5. Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifico de acuerdoa la educacion y el numero de hijos de cada uno de ellos:

Cantidad de hijos0− 1 2− 3 mas de 3

Primaria 14 37 32Educacion Secundaria 19 42 17

Bachillerato 12 17 10

Pruebe la hipotesis, con un nivel de significancia del 5%, que el tamano de una familiaes independiente del nivel de educacion del padre.

6. Una companıa opera cuatro maquinas, tres turnos al dıa. De los registros de produccion,se obtuvieron los siguientes datos sobre el numero de fallas:

MaquinasTurno A B C D

1 41 20 12 162 31 11 9 143 15 17 16 10

Pruebe la hipotesis (con α = 0,05) de que el numero de fallas es independiente delturno. Encuentre el valor-p de esta prueba.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 156: Libro Ejercicios Jimenez y Olea Tomo I

150 Capıtulo 8. Test de Homogeneidad, Independencia y Bondad de Ajuste

7. Un artıculo publicado en el Journal of Marketing Ressearch (1970, pag. 36-42) con-tiene un estudio de la relacion entre las condiciones de las instalaciones de la gaso-linerıas y la dinamica de la polıtica de mercadotecnia seguida por ellas. Para ello seinvestigo una muestra de 441 gasolinerıas, y se obtuvieron los resultados siguientes.

CondicionPolıtica Subestandar Estandar Moderna

Dinamica 24 52 58Neutral 15 73 86

No dinamica 17 80 36

¿Existe evidencia de que la polıtica de mercadotecnia y las condiciones de la gasolinerıason independientes? Utilice α = 0,05.

8. Se disena un generador de numeros seudoaleatorios de modo que los enteros 0 a 9tengan la misma probabilidad de ocurrencia. Los primeros 10 mil numeros son:

0 1 2 3 4 5 6 7 8 9967 1008 975 1022 1003 989 1001 981 1043 1011

a) ¿El generador trabajo de manera apropiada? Utilice α = 0,01.

b) Calcule el valor-p de esta prueba.

9. Se toma una muestra aleatoria de 50 observaciones sobre el diametro de puntos desoldadura y el valor correspondiente de la resistencia al esfuerzo cortante.

a) Dado que r = 0,62 , pruebe la hipotesis de que ρ = 0 utilizando α = 0,01. ¿Cuales el valor-p de esta prueba?

b) Encuentre un intervalo de confianza del 99% para ρ.

c) Con base en el intervalo de confianza del inciso b), ¿puede concluirse que ρ = 0,5con un nivel de significancia de 0.01?

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 157: Libro Ejercicios Jimenez y Olea Tomo I

Capıtulo 9

Analisis de Regresion

9.1. Ejercicios Resueltos

EJERCICIO 1

Suponga que se tiene interes en ajustar un modelo de regresion lineal simple

Yi = β0 + β1xi + εi, i = 1, ..., n

dondeεi ∼ N(0, σ2)

y β0 y σ2 son conocidos.

(a) Encuentre el estimador de mınimos cuadrados de β1.

(b) ¿Cual es la varianza del estimador encontrado en el inciso (a)?

(c) Encuentre una expresion para el intervalo de confianza del 100(1−α) % para la pendi-ente β1. ¿Este intervalo es mayor que el intervalo correspondiente al caso donde tantoβ0 como β1 son desconocidos?

SOLUCION

(a) Estimador de mınimos cuadrados para β1

n∑i=1

ε2i =

n∑i=1

(yi − βo − β1xi)2

luego derivando con respecto al parametro tenemos

∂n∑

i=1

ε2i

∂β1

= −2n∑

i=1

(yi − β0 − β1xi) · xi = 0

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 158: Libro Ejercicios Jimenez y Olea Tomo I

152 Capıtulo 9. Analisis de Regresion

⇒n∑

i=1

(yi − β0 − β1xi) · xi = 0

⇒n∑

i=1

(xiyi − β0xi − β1x2i ) = 0

⇒n∑

i=1

xiyi − β0

n∑i=1

xi − β1

n∑i=1

x2i = 0

luego despejando y recordando que β0 es conocido, nos queda

β1 =

n∑i=1

xiyi − β0

n∑i=1

xi

n∑i=1

x2i

(b) Se pide calcular la V ar(β1).

V ar(β1) = V ar

n∑

i=1

xiyi − β0

n∑i=1

xi

n∑i=1

x2i

=1(

n∑i=1

x2i

)2V ar

(n∑

i=1

xiyi − β0

n∑i=1

xi

)

=1(

n∑i=1

x2i

)2V ar

(n∑

i=1

xiyi

)

ind=

1(n∑

i=1

x2i

)2

n∑i=1

x2i V ar(yi)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 159: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 153

=1(

n∑i=1

x2i

)2

n∑i=1

x2i σ

2

= σ2

n∑i=1

x2i(

n∑i=1

x2i

)2

=σ2

n∑i=1

x2i

(c) Cuando ambos parametros son desconocidos el intervalo para β1 es de la siguienteforma:

β1 ∈[β1 ∓ t(n−2),1−α

2· s.e(β1)

]donde

s.e(β1) =

√√√√√√σ2

n∑i=1

x2i

considerando σ2 conocido.

EJERCICIO 2

Suponga que se especifica un modelo lineal simple sin intercepto

yi = µxi + εi, i = 1, . . . , n

εi ∼ N(0, σ2)

(a) Encuentre el estimador de mınimos cuadrados de µ, µ y de σ2, σ2.

(b) Calcule E(µ) y V ar(µ).

(c) Estime la ecuacion de regresion a partir del siguiente conjunto de datos

x 2 2 3 4 4y 5 6 9 11 13

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 160: Libro Ejercicios Jimenez y Olea Tomo I

154 Capıtulo 9. Analisis de Regresion

SOLUCION

(a) Estimador de mınimos cuadrados para µ

n∑i=1

ε2i =

n∑i=1

(yi − µxi)2

luego derivando con respecto al parametro tenemos

n∑i=1

ε2i

∂µ= −2

n∑i=1

(yi − µxi) · xi = 0

⇒n∑

i=1

(yi − µxi) · xi = 0

⇒n∑

i=1

(xiyi − µx2i ) = 0

⇒n∑

i=1

xiyi − µn∑

i=1

x2i = 0

luego despejando nos queda

µ =

n∑i=1

xiyi

n∑i=1

x2i

Ahora para σ2 tenemos que el estimador es

σ2 =SSE

n− 2

=

n∑i=1

ε2i

n− 2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 161: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 155

=

n∑i=1

(yi − µxi)2

n− 2

=

n∑i=1

y2i − 2µ

n∑i=1

xiyi + µ2

n∑i=1

x2i

n− 2

=

n∑i=1

y2i −

2

(n∑

i=1

xiyi

)2

n∑i=1

x2i

+

(n∑

i=1

xiyi

)2 n∑i=1

x2i

/(

n∑i=1

x2i

)2/

n− 2

=

n∑i=1

y2i −

(n∑

i=1

xiyi

)2

n∑i=1

x2i

n− 2

=

n∑i=1

y2i

n− 2−

(n∑

i=1

xiyi

)2

(n− 2)

(n∑

i=1

x2i

)

(b)

E(µ) =1

n∑i=1

x2i

E

(n∑

i=1

xiyi

)

=1

n∑i=1

x2i

n∑i=1

xiE (yi)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 162: Libro Ejercicios Jimenez y Olea Tomo I

156 Capıtulo 9. Analisis de Regresion

=1

n∑i=1

x2i

n∑i=1

xi · µxi

=1

n∑i=1

x2i

/ · µ ·n∑

i=1

x2i

/

= µ

∴ µ es un estimador insesgado.

(c) Para estimar la recta debemos solo calcular µ en base a los datos

µ =

n∑i=1

xiyi

n∑i=1

x2i

=10 + 12 + 27 + 44 + 52

4 + 4 + 9 + 16 + 16= 2,959

luego la recta pedida es de la forma:

y = 2,959 · xi

EJERCICIO 3

Se presentan los siguientes datos sobre x = % de absorcion de luz a 5800A e y = pico defotovoltaje:

x 4.0 8.7 12.7 19.1 21.4 24.6 28.9 29.8 30.5y 0.12 0.28 0.55 0.68 0.85 1.02 1.15 1.34 1.29

(a) Construya una grafica de dispersion de estos datos. ¿Que sugiere?

(b) Obtenga la ecuacion de la recta de regresion estimada suponiendo que el modelo deregresion lineal simple es apropiado.

(c) ¿Que proporcion de la variacion observada en pico de fotovoltaje se puede explicar porel modelo de regresion?

(d) Pronostique el pico de fotovoltaje cuando el% de absorcion sea 19.1 y calcule el valordel residuo correspondiente.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 163: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 157

(e) Se piensa que hay una regresion lineal util entre% de absorcion y pico de fotovoltaje.¿Esta de acuerdo?. Realice una prueba formal.

SOLUCION

(a) Observando el grafico de dispersion siguiente se sugiere que hay una asociacion linealentre el % de absorcion de luz y el pico de fotovoltaje

Figura 9.1: Grafico de dispersion

(b) La ecuacion de la recta estimada es la siguiente:

y = β0 + β1x

con

β0 = y − β1x y β1 =Sxy

Sxx

de los datos obtenemos que

y = 0,8088889 y x = 19,96667

ademas se obtienen tambien

Sxx =9∑

i=1

(xi − x)2 = 746,4

Syy =9∑

i=1

(yi − y)2 = 1,514089

Sxy =9∑

i=1

(xi − x)(yi − y) = 33,32567

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 164: Libro Ejercicios Jimenez y Olea Tomo I

158 Capıtulo 9. Analisis de Regresion

luego, reemplazando tenemos que

β0 = −0,08259353 y β1 = 0,04464854

quedando la ecuacion de la recta estimada como sigue

yi = −0,08259353 + 0,04464854 · xi

(c) Lo que se pide corresponde a la definicion de R2

R2 =SSR

Syy

= 1− SSE

Syy

donde

SSE = Syy − β1 · Sxy

= 1,514089− 0,04464854 · 33,32567

= 0,02614669

reemplazando tenemos que

R2 = 1− 0,02614669

1,514089

= 0,9827311

≈ 98,27 %

Luego, el modelo explica el 98.27% de variabilidad presente en los datos, lo que seconsidera muy bueno.

(d) El pronostico cuando el% de absorcion es de 19.1 es

y = −0,08259353 + 0,04464854 · 19,1

= 0,7701936

El residuo sera la diferencia entre el verdadero valor observado para x = 19,1 y elcalculado por medio de la recta de estimacion

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 165: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 159

x y y19,1 0,68 0,7701936

luego el residuo es

e = 0,68− 0,7701936 = −0,0901936

(e) Dado que se pide una verificacion para la regresion lineal, tenemos que probar si elcoeficiente β1 es significativo, es decir distinto de cero.

La hipotesis a docimar es la siguiente:

H0 : β1 = 0 vs H1 : β1 6= 0

El estadıstico de prueba es

tc =β1 − 0

s.e(β1)

Se rechaza H0 si |tc| > t(n−2),1−α2

Tenemos que

s.e(β1) =

√σ2

Sxx

y

σ2 =SSE

n− 2

=0,02614669

7

= 0,003735241

luego el estadıstico Tc queda

Tc =0,04464854− 0√

0,003735241746,4

= 19,95877

al comparar tenemos que |Tc| = 19,95877 > t7,1−α2

= 2,364624.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 166: Libro Ejercicios Jimenez y Olea Tomo I

160 Capıtulo 9. Analisis de Regresion

Existe suficiente evidencia para rechazar H0 con un 95% de confianza, es decir, hayuna relacion lineal util entre el% de absorcion de luz y el pico de fotovoltaje.

EJERCICIO 4

En el cultivo de tejidos in vitro se ha observado que si se colocan dos nucleos, a esto sellama un campo de atraccion, los campos de atraccion se forman con mayor frecuencia si losnucleos estan cercanos. En un experimento se colocaron 20 nucleos a distancias diferentesy se midio la incidencia de campos de atraccion (Y ) para las diferencias distancias (X).Lamentablemente se borro parte del analisis de regresion y se le solicita completarlo.

(a) Completa la tabla ANOVA que se entrega a continuacion:

Tabla ANOVAFuente g.l SS MS F

Regresion 1 2.0559 301.08ErrorTotal

(b) ¿Que porcentaje de la variable total esta siendo explicada por el modelo?

(c) Utilizando la siguiente informacion realice test de hipotesis para los parametros delmodelo. Concluya.

Ecuaci\’on de regresi\’on Y = 1.18 - 0.278 X

Predictor Coef Stdev t-ratioConst 1.176232 0.03839 30.64Distancia -0.278010 0.01602 -17.35

SOLUCION

(a) La tabla ANOVA esta compuesta de los siguientes elementos.

Tabla ANOVAFuente g.l SS MS F

Regresion p SSR SSR/p MSR/MSE

Error n− 1− p SSE SSE/(n− 1− p)Total n− 1 SST

luego la tabla queda

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 167: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 161

Tabla ANOVAFuente g.l SS MS F

Regresion 1 2.0559 301.08 0.1229Error 18 0.1229 0.0068Total 19 2.1788

(b) Lo que se pide es el R2.

R2 =SSR

Syy

= 1− SSE

Syy

reemplazando tenemos que

R2 = 1− 0,1229

2,1788

= 0,9435928

≈ 94,36 %

luego, el modelo explica el 94.36% de variabilidad presente en los datos.

(c) Mediante el test T docimaremos las siguientes hipotesis:

Ho : β0 = 0 vs H1 : β0 6= 0

yHo : β1 = 0 vs H1 : β1 6= 0

donde la region de rechazo para este caso esta definida por

R :|Tc| > tn−2;1−α

2

Como t7,0,975 = 2,365 tenemos que |T0| = 30,64 > t7,0,975 y |T1| = 17,35 > t7,0,975, enambos casos se rechaza H0 con un 95%, es decir, los parametros son significativos.

EJERCICIO 5

Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosion.En Corrosion Science(Septiembre de 1993) se informo de la resistividad de una aleacionamorfa de hierro, boro y silicio despues de la cristalizacion. Se reconocieron cinco especımenesde la aleacion a 700oC, cada uno durante un intervalo de tiempo distinto. Despues se midio elpotencial de pasivacion -una medida de la resistividad de la aleacion cristalizada- para cadaespecımenes. Los datos experimentales son los siguientes:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 168: Libro Ejercicios Jimenez y Olea Tomo I

162 Capıtulo 9. Analisis de Regresion

Tiempo de Recorrido Potencial de Pasivacion(minutos) (m V)

x y10 -40820 -40045 -39290 -379120 -385

(a) Construya un diagrama de dispersion para los datos.

(b) Suponiendo que la mejor forma de describir la relacion entre las variables es con unalınea recta, utilice el metodo de mınimos cuadrados para estimar la ordenada al origeny la pendiente de la lınea recta. Interprete estos valores.

(c) Trace la lınea de mınimos cuadrados sobre el diagrama de dispersion.

(d) Segun la lınea de mınimos cuadrados. ¿Cual es el potencial de pasivacion esperado y,cuando el tiempo de recocido es de x = 30 minutos?.

(e) Calcule el R2 para este modelo. Proporcione una interpretacion de esta cantidad.

(f) Realice los test individuales con α = 0,05, H0 : βi = 0 vs H1 : βi 6= 0, i = 0, 1.

SOLUCION

(a) En la figura se muestra el grafico de dispersion de los datos.

Figura 9.2: Grafico de Dispersion

(b) Lo estimadores de mınimos cuadrados para la ordenada de origen (β0) y la pendientede la lınea recta (β1) son:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 169: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 163

β1 =Sxy

Sxx

y β0 = y − β1x

Para poder estimarlos necesitamos

Sxx =5∑

i=1

(xi − x)2 = 8780

Syy =5∑

i=1

(yi − y)2 = 534,8

Sxy =5∑

i=1

(xi − x)(yi − y) = 1918

ademas

y = −392,8 y x = 57

reemplazando tenemos que

β1 = 0,218451 y β0 = −405,2517

luego la recta es de la forma

y = −405,2517 + 0,218451 · x

(c) Ahora sobre el grafico de dispersion se construye la recta de regresion.

Figura 9.3: Recta de regresion

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 170: Libro Ejercicios Jimenez y Olea Tomo I

164 Capıtulo 9. Analisis de Regresion

(d) El potencial de pasivacion esperado y, cuando el tiempo de recorrido es de x = 30minutos es

y = −405,2517 + 0,218451 · 30 = −398,6982

(e) Para poder calcular el R2 necesitamos

SSE = Syy − β1 · Sxx = 534,8− 0,218451 · 1918 = 115,811

luego reemplazando tenemos

R2 =SSR

Syy

= 1− SSE

Syy

= 1− 115,811

534,8

= 0,78345

≈ 78,35 %

(f) Se pide docimar hipotesis para β0 = 0 y β1 = 1.

Docimemos primero la siguiente:

H0 : β0 = 0 vs H1 : β0 6= 0

el estadıstico de prueba es

tc =β0 − β0,0√

V ar(β)

=β0 − β0,0√σ

1n

+ x2

Sxx

=β0 − β0,0√

SSE

n−2·

1n

+ x2

Sxx

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 171: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 165

=−405,2517− 0√115,811

5−2·

15

+ 572

8780

= −86,38847

La region de rechazo esta dada por

|tc| > t(n−(k+1)),1−α2, donde k es el no de variables explicativas

considerando un α = 0,05 (95% de confianza), se tiene que:

t(n−(k+1)),1−α2

= t(5−2),0,975 = 3,182446

Como |tc| = 86,38847 > t3,0,975 = 3,182446, existe evidencia suficiente bajo un 95% deconfianza para rechazar H0, es decir, el parametro β0 es significativo considerandosecomo distinto a cero.

Ahora docimemos la siguiente hipotesis

H0 : β = 1 vs H1 : β 6= 1

el estadıstico de prueba es

tc =β1 − β1,0√V ar(β1)

=β1 − β1,0√

σSxx

=0,218451− 0√

115,8115−2

8780

= 3,294481

La region de rechazo al igual que el caso anterior esta dada por

|tc| > t(n−(k+1)),1−α2, donde k es el no de variables explicativas

considerando nuevamente α = 0,05 (95% de confianza)

t(n−(k+1)),1−α2

= t3,0,975 = 3,182446

Como |tc| = 3,294481 > t3,0,975 = 3,182446, existe evidencia suficiente bajo un 95%de confianza para rechazar H0, es decir, el parametro β1 es significativo y se puedeconsiderar como distinto a cero.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 172: Libro Ejercicios Jimenez y Olea Tomo I

166 Capıtulo 9. Analisis de Regresion

EJERCICIO 6

La presencia de carburos duros en aleaciones de hierro blanco con alto cromo da comoresultado una excelente resistencia a la abrasion, por lo mismo son adecuados para el manejode materiales en la industria minera. Los datos de y = perdida por desgaste abrasivo (mm3) yx = contenido de austenita retenida (%), en pruebas de desgaste de pernos con granete comoabrasivo, fueron analizados con un modelo de regresion lineal simple. Utilice el resultado quese presenta de MINITAB para contestar las siguientes preguntas:

¿Cual es la ecuacion de la recta de regresion estimada?

Complete la tabla de analisis de varianza (tabla ANOVA).

¿Que proporcion de la variacion observada de perdida de desgaste se puede atribuir almodelo de regresion lineal simple para esa relacion?

Pruebe la utilidad del modelo de regresion lineal simple, use α = 0,01.

Estime la perdida real promedio por desgaste cuando el contenido es 50% ofreciendoinformacion acerca de la confiabilidad y la precision.

¿Que valor de perdida por desgaste pronosticarıa cuando el contenido es 30%, y cuales el valor del residuo correspondiente, sabiendo que el valor observado fue de 0.80?

Otros datos relevantes:

n∑i=1

x2i = 41574,84 y x = 42,32941

Regression Analysis: y versus x

Predictor Coef SE Coef T PConstant 0.787218 0.09525879 8.264 0.0001x 0.007570 0.00192626 3.930 0.0013

Analysis of Variance (tabla ANOVA)

Source DF SS MS FRegression 0.63690Residual Error 15Total 1.25551

SOLUCION

(a) Con los datos entregados por la salida de Minitab la recta de regresion estimada es:

y = 0,787218 + 0,007570x

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 173: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 167

(b) La tabla Anova queda como sigue:

Tabla ANOVAFuente g.l SS MS F

Regresion 1 0.6369 0.6369 15.443Error 15 0.6186 0.04124Total 16 1.2555

(c) Se pide el R2.

R2 =SSR

Syy

=0,6369

1,255

= 0,5072

≈ 50,72 %

luego, el modelo explica un 50.72% de variabilidad presente en los datos.

(d) Observando el valor-p de x, tenemos que

valor-p = 0,0013 < 0,01 = α

Por lo tanto se rechaza la hipotesis H0 : β1 = 0.

(e) La estimacion para la perdida real promedio por desgaste cuando el contenido es 50%es:

y = 0,787218 + 0,00757 · 50 = 1,165718

(f) El valor de perdida por desgaste que pronosticarıa cuando el contenido es 30% es:

y = 0,787218 + 0,00757 · 30 = 1,014318

Sabiendo que le verdadero valor observado fue 0.8, el residuo es

e = y − y = 0,8− 1,014318 = −0,214318

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 174: Libro Ejercicios Jimenez y Olea Tomo I

168 Capıtulo 9. Analisis de Regresion

EJERCICIO 7

Se ha observado que para predecir la demanda (consumo) de combustible para la calefaccion,resulta ser mas preciso el pronostico a largo plazo de las temperaturas y el uso de la relaciontemperatura-consumo que el tratar de pronosticar directamente analizando las ventas decombustible. Un distribuidor de combustible mantiene un registro de ventas mensuales decombustible y de temperaturas maximas en esos meses. A continuacion aparecen los datosde nueve de estos meses seleccionados al azar.

Ventas (y) 26.2 17.4 7.8 12.3 35.9 42.1 26.4 19.0 10.1Temperaturas (x) 46.5 54.6 65.2 62.3 41.9 38.6 43.7 52.0 59.8

(a) Encuentre la recta de mınimos cuadrados para estos datos.

(b) Grafique los puntos y la recta como una verificacion de sus calculos.

(c) Utilice la ecuacion de la recta ajustada para predecir la venta observada cuando latemperatura es de 50o F.

(d) Estime σ2.

(e) Pruebe la significancia de la regresion con α = 0,5. ¿A que conclusiones puede llegarse?

(f) Encuentre un intervalo de confianza del 90% para las ventas mensuales esperadas(medias) en aquellos meses en que el promedio de la temperatura maxima sea de 45o

F.

(g) Calcule e interprete el R2.

SOLUCION

(a) Para poder calcular los estimadores de la recta de regresion, necesitamos los siguientesresultados:

x y x2 y2 x · y46.5 26.2 2162.25 686.44 1218.3054.6 17.4 2981.16 302.76 950.0465.2 7.8 4251.04 60.84 508.5662.3 12.3 3881.29 151.29 766.2941.9 35.9 1755.61 1288.81 1504.2138.6 42.1 1489.96 1772.41 1625.0643.7 26.4 1909.69 696.96 1153.6852.0 19.0 2704.00 361.00 988.0059.8 10.1 3576.04 102.01 603.98

Total 464.6 197.2 24711.04 5422.52 9318.12

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 175: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 169

de la tabla anterior se extraen los siguientes resultados:

9∑i=1

xi = 464,6 ⇒ X = 51,62

9∑i=1

yi = 197,6 ⇒ Y = 21,91

9∑i=1

x2i = 24711,04

9∑i=1

y2i = 5422,52

9∑i=1

xiyi = 9318,12

Con esto podemos calcular

Sxx =9∑

i=1

x2i − 9X

2= 24711,04− 9 · (51,62)2 = 729,4204

Syy =9∑

i=1

y2i − 9Y

2= 5422,52− 9 · (21,91)2 = 1102,0871

Sxy =9∑

i=1

xiyi − 9X · Y = 9318,12− 9 · (51,62)(21,91) = −860,8278

Luego

β1 =Sxy

Sxx

=−860,8278

729,4204= −1,180

β0 = Y − β1X = 21,91 + 1,180 · 51,62 = 82,822

Donde la recta de regresion es:

y = 82,822− 1,180x

(b) El grafico de los puntos y la recta de regresion se presenta a continuacion

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 176: Libro Ejercicios Jimenez y Olea Tomo I

170 Capıtulo 9. Analisis de Regresion

Figura 9.4: Recta de regresion

(c) La prediccion de las ventas para una temperatura de 50o F es:

y = 82,822− 1,180 · 50 = 23,822

(d) Tenemos que

σ2 =SSE

n− 2y SSE = Syy − β1Sxy

Con los resultados obtenidos en (a) se calcula SSE.

SSE = Syy − β1Sxy

= 1102,0871 + 1,180 · (−860,8278)

= 86,31

Luego

σ2 =86,31

7= 12,33

(e) La hipotesis de significancia para la regresion es:

Ho : β1 = 0 vs H1 : β1 6= 0

Se rechaza Ho si |T1| > tn−2;1−α2, donde T1 = β1

se(β1).

Para este caso tenemos que:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 177: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 171

T1 =−1,180

se(β1)con se(β1) =

√12,33

729,4204= 0,13

T1 = −1,180

0,13≈ −9,1

como t7;0,975 = 2,365 tenemos que |T1| > t7;0,975.

Luego rechazamos la hipotesis nula, es decir, los datos presentan suficiente evidenciade que las ventas de combustible estan relacionadas linealmente con la temperatura.

(f) El intervalo pedido es el siguiente:

IC(µy/x0) = µy/x0 ∓ tn−2;1−α2

√σ2

1

n+

(x0 − x)2

Sxx

Reemplazando

IC(µy/45) = (82,822− 1,180 · (45))∓ 1,895

√12,33

1

10+

(45− 51,62)2

729,4204

= 29,72∓ 2,66

= (27,06; 32,38)

(g) R2 = 1− SSESyy

= 1− 86,311102,0871

= 0,9268

Existe un 92.68% de variacion en los datos mensuales que se explica por la temperaturamaxima promedio.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 178: Libro Ejercicios Jimenez y Olea Tomo I

172 Capıtulo 9. Analisis de Regresion

EJERCICIO 8

Los siguientes datos se refieren al flujo de cloro (X, en cm3 normales por minuto) por unaboquilla, utilizada en el mecanismo de grabado, y la rapidez de grabado (Y , en 100 A/min).

X 1.5 1.5 2.0 2.5 2.5 3.0 3.5 3.5 4.0Y 23.0 24.5 25.0 30.0 33.5 40.0 40.5 47.0 49.0

Los estadısticos de resumen son:∑

xi = 24,0,∑

x2i = 70,50,

∑yi = 312,5,

∑y2

i = 11626,75,∑xiyi = 902,25, β0 = 6,448718, β1 = 10,602564.

(a) ¿El modelo de regresion lineal simple especifica una relacion util entre el flujo de cloroy la rapidez de grabado?

(b) Estime el cambio real promedio de rapidez de grabado asociado con un aumento de 1cm3 normal por minuto en el flujo, con un intervalo de confianza del 95 %, e interpreteel intervalo.

(c) Calcule el intervalo de confianza de 95 % de confianza para µY |x=3, la rapidez realpromedio de grabado cuando el flujo es igual a 3. ¿Se estimo con precision este prome-dio?

(d) Calcule el intervalo de prediccion de 95 % de confianza para una sola observacion futurasobre la rapidez de grabado cuando el flujo es igual a 3. ¿Es probable que la prediccionsea exacta?

(e) ¿Recomendarıa calcular un intervalo de prediccion de 95 % para un flujo de 6? Explique.

SOLUCION

(a) Hay que realizar el test:

H0 : β1 = 0 vs H1 : β1 6= 0

El estadıstico de prueba es

tc =β1

s.e(β1)

Se rechaza H0 si |tc| > tα2(n− 2)

Tenemos que

s.e(β1) =

√σ2

Sxx

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 179: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 173

Necesitamos los siguientes resultados

Sxx =9∑

i=1

x2i − 9X

2= 70,5− 9 · (24

9)2 = 6,5

Syy =9∑

i=1

y2i − 9Y

2= 11626,75− 9 · (312,5

9)2 = 776,06

Sxy =9∑

i=1

xiyi − 9X · Y = 902,25− 9 · (249)(312,5

9) = 68,92

luego reemplazando obtenemos el valor de σ2 como sigue:

σ2 =SSE

n− 2

=Syy − β1Sxy

n− 2

=776,06− 10602564 · 68,92

9− 2

=45,33

7

= 6,48

Luego

s.e(β1) =

√6,48

6,2= 0,998

por lo tanto el estadıstico de prueba queda como

tc =10,602564

0,998≈ 10,62

y considerando α = 5 % tenemos que

t(n−2),1−α2

= t7,0,975 = 2,365

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 180: Libro Ejercicios Jimenez y Olea Tomo I

174 Capıtulo 9. Analisis de Regresion

(a) como |tc| > 2,365 se rechaza H0

Por lo tanto el modelo de regresion lineal especifica una regresion util entre X e Y .

(b) Hay que encontrar un I.C. para β1:

β1 ∈[β1 ∓ t(n−2), α

2· s.e(β1)

]β1 ∈ [10,602564∓ 2,365 · 0,998]

β1 ∈ [8,2422; 12,9628]

Con un 95% de confianza, estimamos el cambio real promedio de rapidez de grabadoentre 8.2422 y 12.9628 asociado con un aumento de 1 cm3 normal por minuto en elflujo.

(c) El intervalo pedido es el siguiente:

IC(µy/x0) = µy/x0 ∓ tn−2;1−α2

√σ2

1

n+

(x0 − x)2

Sxx

luego necesitamos

X =24

9= 2,67

ademas

µy/x0=3 = β0 + β1x0

= 6,448718 + 10,602564 · 3

= 38,25641

ahora reemplazando tenemos que

µy/x0=3 ∈

[38,25641∓ 2,365

√6,48

1

9+

(3− 2,67)2

6,5

]

µy/x0=3 ∈ [38,25641∓ 2,365 · 0,9102]

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 181: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 175

µy/x0=3 ∈ [36,10; 40,41]

Se aprecia que sı se estimo con precision este promedio, ya que si observamos la tablade datos cuando x = 3, el valor de y es 40 y este valor pertenece al I.C.

(d) El intervalo pedido es el siguiente:

IC(y0) ∈ y0 ∓ tn−2;1−α2

√σ2

1 +

1

n+

(x0 − x)2

Sxx

necesitamos

y0 = β0 + β1x0

= 6,448718 + 10,602564 · 3= 38,25641

Luego reemplazando

y0 ∈

[38,25641∓ 2,365

√6,48

1 +

1

9+

(3− 2,67)2

6,5

]

y0 ∈ [38,25641∓ 2,365 · 2,70]

y0 ∈ [31,87; 44,64]

Por lo tanto es probable que la prediccion sea exacta.

(e) No cambia ya que el nivel de confianza es el mismo.

(f) Como el valor 6.0 esta muy alejado del rango en el cual varıa x no serıa recomendablecalcular un I.C.

EJERCICIO 9

Es difıcil determinar la resistencia al corte de puntos de soldadura, mientras que es rela-tivamente sencillo medir el diametro de soldadura de puntos. Seria ventajoso si se pudierapredecir la resistencia al corte de una medicion del diametro de soldadura. Los datos son:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 182: Libro Ejercicios Jimenez y Olea Tomo I

176 Capıtulo 9. Analisis de Regresion

Y : Resistencia al corte (psi) X: Diametro de soldadura (0.0001 pulg)

370 400780 8001210 12101560 16001980 20002450 25003070 31003550 36003940 40003950 4000

(a) ¿Existe evidencia para pensar que el ajuste de una regresion lineal es adecuada?

(b) Docime si la correlacion entre ambas variables es nula.

(c) Determine la recta por mınimos cuadrados.

(d) Calcule las varianzas de los parametros encontrados.

(e) Docime las hipotesis β1 = 1 y β0 = 0, usando un nivel de significacion igual a 0.01.

(f) Rectifique el punto anterior usando intervalos de confianza adecuados.

SOLUCION

(a) La evidencia se puede obtener al graficar los puntos o calcular el coeficiente de cor-relacion r.

Figura 9.5: Grafico de puntos

Del grafico se aprecia una fuerte asociacion lineal entre la resistencia al corte y eldiametro de la soldadura.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 183: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 177

Calculemos ahora el coeficiente de correlacion para verificar esta apreciacion.

r =

n∑i=1

(xi − x)(yi − y)√n∑

i=1

(xi − x)2

n∑i=1

(yi − y)2

=

n ·n∑

i=1

xiyi −n∑

i=1

xi

n∑i=1

yi√√√√√n

n∑i=1

x2i −

(n∑

i=1

xi

)2 ·n

n∑i=1

y2i −

(n∑

i=1

yi

)2

=10 · 68674100− 23210 · 22860√

(10 · 69644100− 538704100) · (10 · 67719400− 522579600)

=156160400√

15773690 · 154614400

=156160400

156167846

= 0,9999

Por lo tanto, como r = 0,9999 ≈ 1 hay una fuerte asociacion lineal entre el diametrode soldadura, la resistencia al corte, misma conclusion obtenida observando el grafico.Hay evidencia empırica para pensar que el ajuste de la regresion lineal es adecuado.

(b) La hipotesis que se pide docimar es la siguiente:

Sea ρ: correlacion

H0 : ρ = ρ0 vs H1 : ρ > ρ0

esta prueba de hipotesis tiene una region de rechazo dada por:

R = Zc > z1−α

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 184: Libro Ejercicios Jimenez y Olea Tomo I

178 Capıtulo 9. Analisis de Regresion

donde

Zc =

12ln(

1+r1−r

)− 1

2ln(

1+ρ0

1−ρ0

)1√n−3

=12ln(

1+r1−r

)1√n−3

=12ln (1999)

1√7

= 10,05439

considerando α = 0,05 tenemos que z1−0,05 = 1,64.

Luego, como Zc = 10,05439 > z1−α = 1,64, existe evidencia suficiente para rechazarH0, esto implica que la correlacion entre ambas variables no es nula.

(c) La estimacion de la recta por mınimos cuadrados esta dada por

y = α + βx

donde α y β son los estimadores de mınimos cuadrados.

β =

n∑i=1

(xi − x)(yi − y)

n ·n∑

i=1

(xi − x)2

=

n ·n∑

i=1

xiyi −n∑

i=1

xi

n∑i=1

yi

n ·n∑

i=1

x2i −

(n∑

i=1

xi

)2

=10 · 68674100− 23210 · 2280

10 · 69644100− 538704100

= 0,99

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 185: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 179

α = y − β · x

= 22,86− 0,99 · 2321

= 2286− 2297,79

= −11,79

Ası la recta es

y = −11,79 + 0,99 · x

(d) V ar(β) =

n∑i=1

(xi − x)2

n∑

i=1

(xi − x)2

2 V ar(yi)

como V ar(yi) = σ2 tenemos que

V ar(β) =σ2

n∑i=1

(xi − x)2

ahora para α

V ar(α) = V ar(y) + x2V ar(β)− 2xCov(y, β)

=σ2

n+ x2 σ2

n∑i=1

(xi − x)2

− 2x · 0

= σ2

1

n+

x2

n∑i=1

(xi − x)2

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 186: Libro Ejercicios Jimenez y Olea Tomo I

180 Capıtulo 9. Analisis de Regresion

=

σ2

n∑i=1

x2i

n ·n∑

i=1

(xi − x)2

pero notese que σ2 hay que estimarlo.

σ2 =SCE

n− 1, donde SCE =

n∑i=1

e2i =

n∑i=1

(yi − yi)2

luego reemplazando tenemos que

10∑i=1

ei = (−14,19942)2 + (−0,2016205)2 + (23,89612)2 + (−12,20603)2 + (11,79177)2

+ (−13,21099)2 + (12,78571)2 + (−2,217046)2 + (−8,21925)2 + (1,78075)2

= 1474,369

luego la estimacion de σ2 es

σ2 =1474,369

10− 1= 163,8187

por lo tanto, como tenemos que10∑i=1

(xi − x)2 = 15773690 y al reemplazar en las igual-

dades obtenidas para α y β se calculan las varianzas para estos parametros:

V ar(β) =163,8187

15773690

= 0,00001038557

V ar(α) =163,8187 · 69644100

10 · 15773690

=11409007637

157736900

= 72,32935

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 187: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 181

(e) Se pide docimar hipotesis para α = 0 y β = 1.

Docimemos primero la siguiente:

H0 : α = 0 vs H1 : α 6= 0

el estadıstico de prueba es

tc =α− α√V ar(α)

=−11,79− 0√

72,32935

= −1,386298

La region de rechazo esta dada por

|tc| > t(n−(k+1)),1−α2, donde k es el no de variables explicativas

considerando un α = 0,01 (99% de confianza)

t(n−(k+1)),1−α2

= t(10−2),0,995 = 3,355387

Como |tc| = 1,386298 ≯ t8,0,995 = 3,355387, no existe evidencia suficiente bajo un 99%de confianza para rechazar H0, es decir, el parametro α no serıa significativo y se puedeconsiderar como igual a cero.

Ahora docimemos la siguiente hipotesis

H0 : β = 1 vs H1 : β 6= 1

el estadıstico de prueba es

tc =β − β√V ar(β)

=0,99− 1√

0,00001038557

= −3,103022

La region de rechazo, al igual que el caso anterior, esta dada por

|tc| > t(n−(k+1)),1−α2, donde k es el no de variables explicativas

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 188: Libro Ejercicios Jimenez y Olea Tomo I

182 Capıtulo 9. Analisis de Regresion

considerando nuevamente α = 0,01 (99% de confianza)

t(n−(k+1)),1−α2

= t8,0,995 = 3,355387

Como |tc| = 3,103022 ≯ t8,0,995 = 3,355387, no existe evidencia suficiente bajo un 99%de confianza para rechazar H0, es decir, el parametro β se puede considerar como iguala uno.

(f) Haremos I.C al 99% para los parametros α y β.

El I.C(α) esta dado por

α ∈[α∓ tα

2(n− 2) · s.e(α)

]α ∈

[−11,79∓ 3,355387 ·

√72,32935

]α ∈ [−40,32645; 16,74645]

como en el I.C se encuentra el cero, se ratifica lo obtenido en (e)

El I.C(β) esta dado por

β ∈[β ∓ tα

2(n− 2) · s.e(β)

]

β ∈[0,99∓ 3,355387 ·

√0,00001038557

]β ∈ [0,9791867; 1,000813]

como en el I.C se encuentra el uno, tambien se ratifica lo obtenido en (e) para β.

EJERCICIO 10

Demuestre que en el modelo de regresion lineal simple

yi = β0 + β1xi + εi

los estimadores β0 y β1 pueden ser escritos como combinaciones lineales de las respuestas yi.Encuentre explıcitamente las constantes en la combinacion lineal.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 189: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 183

SOLUCION

Sabemos que al

mınβ0β1

n∑i=1

ε2i

se obtiene:

β0 = y − β1x

β1 =

n∑i=1

(xi − x)(yi − y)

n∑i=1

(xi − x)2

en el caso de β1 se tiene que

n∑i=1

(xi − x)(yi − y) =n∑

i=1

(xiyi − xiy − xyi + xy)

=n∑

i=1

(xiyi − y(xi − x)− xyi)

=n∑

i=1

yi(xi − x)− y(xi − x)

=n∑

i=1

yi(xi − x)− yn∑

i=1

(xi − x)

=n∑

i=1

yi(xi − x)− y · 0

=n∑

i=1

yi(xi − x)

luego

β1 =

n∑i=1

(xi − x)

Sxx

yi =n∑

i=1

diyi

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 190: Libro Ejercicios Jimenez y Olea Tomo I

184 Capıtulo 9. Analisis de Regresion

donde di = (xi−x)Sxx

y Sxx =n∑

i=1

(xi − x)2.

para β0 tenemos que

β0 = y −

n∑i=1

(xi − x)

Sxx

yix

=n∑

i=1

1

n−

∑(xi − x)

Sxx

x

yi

=n∑

i=1

ciyi

con ci = 1n−

n∑i=1

(xi − x)

Sxxx

EJERCICIO 11

Demuestre que

β0 ∼ N(β0,σ2

nSxx

n∑i=1

x2i ) y β1 ∼ N(β1,

σ2

Sxx

)

con

Cov(β0, β1) = −σ2x

Sxx

SOLUCION

Como yi ∼ N(β0 + β1xi, σ2) y β0 es combinacion lineal de yi entonces β0 ∼ N(·, ·) donde los

parametros son:

E(β0) = E

(n∑

i=1

ciE(yi)

)

=n∑

i=1

ci(β0 + β1xi)

=n∑

i=1

1

n− (xi − x)

Sxxx

(β0 + β1xi)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 191: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 185

= β0

n∑i=1

ci + β1

n∑i=1

cixi

= β0

n∑i=1

ci + β1

n∑i=1

xi

n− (xi − x)xix

Sxx

= β0 + β1

x− x

Sxx

n∑i=1

(xi − x)xi

= β0 + β1

x− x

Sxx

Sxx

= β0

V ar(β0) = V ar

(n∑

i=1

ciyi

)

ind=

n∑i=1

V ar(ciyi)

= σ2

n∑i=1

c2i

= σ2

[1

nSxx

n∑i=1

x2i

]

para β1

E(β1) = E

(n∑

i=1

diyi

)

=n∑

i=1

di(β0 + β1xi)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 192: Libro Ejercicios Jimenez y Olea Tomo I

186 Capıtulo 9. Analisis de Regresion

= β0

n∑i=1

di + β1

n∑i=1

dixi

= 0 + β1

n∑i=1

(xi − x)xi

Sxx

= 0

V ar(β1) = V ar

(n∑

i=1

diyi

)

ind= σ2

n∑i=1

d2i

= σ2

n∑i=1

(xi − x)2

Sxx

=σ2

Sxx

Finalmente la covarianza es

Cov(β0, β1) = Cov

(n∑

i=1

ciyi,n∑

i=1

diyi

)

=n∑

i=1

n∑j=1

cidjCov(yi, yj)

ind= σ2

n∑i=1

cidi

= σ2

n∑i=1

(1

n− (xi − x)

Sxx

x

)((xi − x)

Sxx

)

= σ2

n∑i=1

(1

n

(xi − x)

Sxx

− (xi − x)2x

S2xx

)

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 193: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 187

= σ2

(0− x

Sxx

)

= −σ2x

Sxx

EJERCICIO 12

Montgomery y Peck (1992) describen el uso de un modelo de regresion para relacionar lacantidad de tiempo que requiere un vendedor para dar servicio a una maquina expendedorade refrescos, con el numero de envases contenidos en la maquina (X1) y la distancia delvehıculo de servicio al sitio donde se encuentra la maquina (X2). Los datos se presentan acontinuacion:

Obs. Y X1 X2

1 9,95 2 502 24,45 8 1103 31,75 11 1204 35,00 10 5505 25,02 8 2956 16,86 4 2007 14,38 2 3758 9,60 2 529 24,35 9 10010 27,50 8 30011 17,08 4 41212 37,00 11 40013 41,95 12 50014 11,66 2 36015 21,65 4 20516 17,89 4 40017 69,00 20 60018 10,30 1 58519 34,93 10 54020 46,59 15 25021 44,88 15 29022 54,12 16 51023 56,23 17 59024 22,13 6 10025 21,15 5 400

(a) Construya el modelo.

(b) Determine paso a paso la tabla ANOVA y concluya.

SOLUCION

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 194: Libro Ejercicios Jimenez y Olea Tomo I

188 Capıtulo 9. Analisis de Regresion

(a) El modelo es el siguiente:

Y = β0 + β1X1 + β2X2 + ε

para calcular el modelo ajustado

Y = β0 + β1X1 + β2X2

necesitamos encontrar los estimadores de mınimos cuadrados a partir de

β = (X ′X)−1X ′Y

luego tenemos que

(X ′X) =

n25∑i=1

Xi1

25∑i=1

Xi2

25∑i=1

Xi1

25∑i=1

X2i1

25∑i=1

Xi1Xi2

25∑i=1

Xi2

25∑i=1

Xi1Xi2

25∑i=1

X2i2

=

25 206 8294206 2396 77177

8294 77177 3531848

Invirtiendo (X’X) queda

(X ′X)−1 =

0,2146526166 −0,00749091422 −3,403891e− 004−0,0074909142 0,00167076313 −1,891781e− 005−0,0003403891 −0,00001891781 1,495876e− 006

y

X ′Y =

25∑i=1

Yi

25∑i=1

Xi1Yi

25∑i=1

Xi2Yi

=

725,428001,67

274580,71

por lo tanto los estimadores de mınimos cuadrados son:

β0

β1

β2

=

0,2146526166 −0,00749091422 −3,403891e− 004−0,0074909142 0,00167076313 −1,891781e− 005−0,0003403891 −0,00001891781 1,495876e− 006

· 725,42

8001,67274580,71

β0

β1

β2

=

2,309200432,740369420,01243958

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 195: Libro Ejercicios Jimenez y Olea Tomo I

9.1 Ejercicios Resueltos 189

luego el modelo ajustado es

Y = 2,30920043 + 2,74036942 ·X1 + 0,01243958 ·X2

(b) La tabla ANOVA tiene la siguiente forma

Tabla ANOVAFuente g.l SS MS F

Regresion k − 1 SSR SSR/(k − 1) MSR/MSE

Error n− k SSE SSE/(n− k)Total n− 1 SST

para rellenarla necesitamos

SST = Y ′Y −

(n∑

i=1

yi

)2

n

= 27133,39− 21049,37

= 6084,021

SSR = β′X ′Y −

(n∑

i=1

yi

)2

n

= 27018,34− 21049,37

= 5968,974

SSE = SST − SSR

= 115,0465

notese que σ2 = S2 = SSE

n−k, donde k es la cantidad de parametros a estimar. Luego

σ2 =115,0465

25− 3= 5,229388

Ahora la tabla rellenada queda como sigue:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 196: Libro Ejercicios Jimenez y Olea Tomo I

190 Capıtulo 9. Analisis de Regresion

Tabla ANOVAFuente g.l SS MS F

Regresion 2 5968.974 2984.487 570.7144Error 22 115.0465 5.229388Total 24 6084.021

Para docimar la hipotesis:

H0 : β1 = β2 = 0 vs H1 : Al menos un βi 6= 0 para i = 1, 2

Se compara el FANOV A con un Fk−1;n−k;1−α de tabla. Si

FANOV A > Fk−1;n−k;1−α ⇒ se rechaza H0

comoFANOV A = 570,7144 > 3,443357 = F2;22(0,95)

Se rechaza H0, es decir, la regresion es significativa.

Al calcular el R2 tenemos que

R2 =SSR

SST

= 0,9810904

luego el porcentaje de variabilidad presente en los datos es de 98.11% aproximada-mente.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 197: Libro Ejercicios Jimenez y Olea Tomo I

9.2 Ejercicios Propuestos 191

9.2. Ejercicios Propuestos

1. Un artıculo publicado en Concrete Research (Near Surface Characteristics of Concrete:Intrinsic Permeability’, vol. 41, 1989) presenta datos sobre la resistencia a la compre-sion x y la permeabilidad intrınsica y de varias mezclas y tratamientos de concreto.El resumen de cantidades es el siguiente: n = 14,

∑yi = 572,

∑y2

i = 23530,∑

xi =43,

∑x2

i = 157,42 y∑

xiyi = 1697,80. Suponga que las dos variables estan rela-cionadas de acuerdo con el modelo de regresion lineal simple.

a) Calcule las estimaciones de mınimos cuadrados de la pendiente y la ordenada alorigen.

b) Utilice la ecuacion de la recta ajustada para predecir la permeabilidad que sera ob-servada cuando la resistencia a la compresion sea x = 4,3.

c) Proporcione una estimacion puntual de la permeabilidad promedio cuando la re-sistencia a la compresion para x = 3,7.

d) Suponga que el valor observado de la permeabilidad para x = 3,7 es y = 46,1.Calcule el valor del residuo correspondiente.

2. Un artıculo publicado en Wear (vol. 152, 1992, pags. 171-181) presenta datos sobreel desgaste del acero dulce y la viscosidad del aceite. A continuacion aparecen datosrepresentativos, con x = viscosidad del aceite y y = volumen de desgaste (10−4mm3).

y 240 181 193 155 172 110 113 75 94x 1.6 9.4 15.5 20.0 22.0 35.5 43.0 40.5 33.0

a) Construya una grafica de dispersion de los datos. ¿Parece plausible el uso de unmodelo de regresion lineal simple?

b) Si parece plausible, ajuste un modelo de regresion lineal simple utilizando la tecni-ca de mınimos cuadrados.

c) Haga una prediccion sobre el desgaste cuando la viscosidad es x = 30.

d) Obtenga el valor ajustado de y cuando x = 22,0 y calcule el residuo correspondi-ente.

3. Un artıculo publicado en el Journal of Environmental Engineering (vol. 115, num. 3,1989, pags. 608-619) informa los resultados de un estudio sobre la aparicion de sodio ycloro en los arroyos de la parte central de Rhode Island. Los datos siguientes muestranla concentracion de cloro y (en mg/l) y el area que rodea a la cuenca x (en porcentaje).

y 4.4 6.6 9.7 10.6 10.8 10.9 11.8 12.1 14.3x 0.19 0.15 0.57 0.70 0.67 0.63 0.47 0.70 0.60

y 14.7 15.0 17.3 19.2 23.1 27.4 27.7 31.8 39.5x 0.78 0.81 0.78 0.69 1.30 1.05 1.06 1.74 1.62

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 198: Libro Ejercicios Jimenez y Olea Tomo I

192 Capıtulo 9. Analisis de Regresion

a) Dibuje un diagrama de dispersion de los datos. En este caso, ¿parece apropiadoel uso de un modelo de regresion lineal simple?

b) Ajuste un modelo de regresion lineal simple utilizando el metodo de mınimoscuadrados.

c) Estime la concentracion promedio de cloro para una cuenca que tiene un area quesea el 1 % de la superficie circunvecina.

d) Encuentre el valor ajustado que corresponde a x = 0,47 ası como el residuocorrespondiente.

4. Considere los datos del ejercicio 1. para x = resistencia a la compresion y y = perme-abilidad intrınseca del concreto.

a) Pruebe la significancia de la regresion utilizando α = 0,05. Encuentre el valor-pde esta prueba. ¿Puede concluirse que el modelo especifica una relacion lineal utilentre las dos variables?

b) Estime σ2 y la desviacion estandar de β1.

c) En este modelo, ¿cual es el error estandar de la ordenada al origen?

5. El ejercicio 3, contiene datos para y = concentracion de cloro y x = area que rodea lacuenca.

a) Pruebe la hipotesis H0 : β1 = 0 contra H1 : β1 6= 0 utilizando el procedimientodel analisis de varianza con α = 0,01.

b) Encuentre el valor-p de la prueba del inciso a).

c) Estime σ2 y los errores estandar de β1 y β0.

d) Pruebe que H0 : β0 = 0 contra H1 : β0 6= 0 con α = 0,01. ¿Que conclusionespueden obtenerse? ¿Parece que el modelo ajustarıa mejor los datos si se eliminasela ordenada al origen?

6. Con los datos del ejercicio 1. para x = resistencia a la compresion y y = permeabilidadintrınseca del concreto:

a) Encuentre un intervalo de confianza del 95% para la pendiente.

b) Encuentre un intervalo de confianza del 95% para la ordenada al origen.

c) Encuentre un intervalo de confianza del 95% para la permeabilidad promediocuando x = 2,5.

d) Encuentre un intervalo de confianza del 95% para la permeabilidad cuando x =2,5. Explique por que este intervalo es mayor que el calculado en el inciso c).

7. Con respecto a los datos del ejercicio 2. sobre y = desgaste del acero dulce y x =viscosidad del aceite:

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 199: Libro Ejercicios Jimenez y Olea Tomo I

9.2 Ejercicios Propuestos 193

a) Encuentre un intervalo de confianza del 95% para la ordenada al origen.

b) Encuentre un intervalo de confianza del 95% para la pendiente.

c) Encuentre un intervalo de confianza del 95% para el desgaste promedio del acerodulce cuando la viscosidad del aceite es x = 30.

8. El ejercicio 3. presenta datos sobre y = concentracion de cloro y x = area de la cuencaen la region de la cuenca en la central de Rhode Island.

a) Encuentre un intervalo de confianza del 99% para β1.

b) Encuentre un intervalo de confianza del 99% para β0.

c) Encuentre un intervalo de confianza del 99% para la concentracion promedio decloro cuando el area es x = 1,0 %.

d) Encuentre un intervalo de prediccion del 99% para la concentracion de clorocuando el area es x = 1,0 %.

9. El ejercicio 2. presenta datos sobre el volumen de desgaste y y viscosidad del aceite x.

a) Calcule R2 para este modelo. Proporcione una interpretacion de esta cantidad.

b) Haga una grafica de los residuos de este modelo contra y y contra x. Interpreteestas graficas.

c) Prepare una grafica de probabilidad normal de los residuos. ¿Parece ser que sesatisface la hipotesis de normalidad?

10. Con respecto al ejercicio 3:

a) ¿Que proporcion de la variabilidad total en la concentracion de cloro esta explicadapor el modelo de regresion?

b) Utilice las observaciones repetidas en x = 70 y x = 78 para obtener una estimaciondel error puro con dos grados de libertad.

c) Utilice el error puro calculado en el inciso b) para probar la falta de ajuste delmodelo de regresion. Utilice α = 0,05. ¿Que conclusion puede obtenerse sobre loadecuado del modelo?

d) Haga una grafica de los residuos contra y y contra x. Interprete las graficas.

e) Prepare una grafica de probabilidad normal de los residuos. ¿Parece que se satis-face la hipotesis de normalidad?

11. A continuacion se proporcionan los resultados obtenidos en la prueba final y los examenesde 20 estudiantes seleccionados al azar, que tomaron un curso de estadıstica para in-genieros y otro en investigacion de operaciones. Supongase que los promedios finalestienen una distribucion conjunta normal.

Estadıstica 86 75 69 75 90 94 83 86 71 65IO 80 81 75 81 92 95 80 81 76 72

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 200: Libro Ejercicios Jimenez y Olea Tomo I

194 Capıtulo 9. Analisis de Regresion

Estadıstica 84 71 62 90 83 75 71 76 84 97IO 85 72 65 93 81 70 73 72 80 98

a) Encuentre la recta de regresion que relaciona el promedio final en estadıstica conel promedio final en IO.

b) Pruebe la significancia de la regresion con α = 0,05.

c) Estime el coeficiente de correlacion.

d) Pruebe la hipotesis de que ρ = 0, utilizando para ello α = 0,05.

e) Pruebe la hipotesis de que ρ = 0,5 utilizando α = 0,05.

f ) Construya un intervalo de confianza del 95% para el coeficiente de correlacion.

12. Se observa y se nota la duracion de un ciclo de una maquina automatica.

Segundos 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18 2.19 2.20Frecuencia 16 28 41 74 149 256 137 82 40 19 11

a) ¿La distribucion normal parece ser un modelo de probabilidad razonable parala duracion del ciclo? Utilice la prueba ji-cuadrada de bondad del ajuste, conα = 0,005.

b) Encuentre el valor-p de esta prueba.

13. Los ingenieros civiles a menudo utilizan la ecuacion de lınea recta E(y) = β0+ β1x paramodelar la relacion entre la resistencia de corte media E(y) de las juntas de albanilerıay el esfuerzo de precompresion x. Con objeto de probar esta teorıa, se realizo unaserie de pruebas de esfuerzo con tabiques solidos dispuestos en tripletas y unidos conmortero (Proceedings of the Institute of Civil Engineers, marzo de 1990). Se vario elesfuerzo de compresion para cada tripleta y se registro la carga de corte maxima justoantes de la ruptura (llamada resistencia de corte). En la tabla se indican los resultadosde esfuerzo para 7 tripletas (medidos en N/mm2).

Prueba de tripleta 1 2 3 4 5 6 7Resistencia al corte, y 1.00 2.18 2.24 2.41 2.59 2.82 3.06Esfuerzo de compresion, x 0 .06 1.20 1.33 1.43 1.75 1.75

a) Grafique los siete puntos de datos en un diagrama de dispersion. ¿Parece ser linealla relacion entre la resistencia de corte y el esfuerzo de precompresion?

b) Utilice el metodo de mınimos cuadrados para estimar los parametros del modelolineal.

c) Interprete los valores de β0 y β1.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 201: Libro Ejercicios Jimenez y Olea Tomo I

9.2 Ejercicios Propuestos 195

14. El artıculo “Some Field Experience in the Use of an Accelerated Method in Estimating28–Day Strength of Concrete”(J. Amer. Concrete Institute, 1969, p. 895) consid-ero la regresion de la resistencia estandar de curado y = 28 dıas (en lb/pulg2) contrax = resistencia acelerada (en lb/pulg2). Suponga que la ecuacion de la verdadera rectade regresion es y = 1800 + 1,3x.

(a) ¿Cual es el valor esperado de la resistencia de 28 dıas cuando la resistencia acel-erada = 2500?.

(b) ¿Cuanto podemos esperar que cambie la resistencia de 28 dıas cuando la resisten-cia acelerada aumenta en 1 lb/pulg2.

(c) Conteste el inciso (b) para un aumento de 100 lb/pulg2.

(d) Conteste el inciso (b) para una disminucion de 100 lb/pulg2.

15. Refierase al estudio de Vietnam expuestos al agente Naranja (y la dioxina 2,3,7,8-TCDD). La tabla de datos, que se reproduce a continuacion, proporciona las cantidadesde 2,3,7,8-TCDD (medidas en partes por millon) tanto en plasma sanguıneo como untejido graso extraıdos de cada uno de los 20 veteranos estudiados. Un objetivo delos investigadores es determinar el grado de asociacion lineal entre el nivel de dioxinaobservado en plasma sanguıneo y en tejido graso. Si se puede establecer una asociacionlineal entre las dos variables, los investigadores querran construir modelos para: (1)predecir el nivel de 2,3,7,8-TCDD observado en tejido graso y (2) predecir el nivel entejido graso a partir del nivel en plasma sanguıneo.

Veterano Niveles de TCDD en plasma Niveles de TCDD en tejido graso1 2.5 4.92 3.1 5.93 2.1 4.44 3.5 6.95 3.1 7.06 1.8 4.27 6.0 10.08 3.0 5.59 36.0 41.010 4.7 4.411 6.9 7.012 3.3 2.913 4.6 4.614 1.6 1.415 7.2 7.716 1.8 1.117 20.0 11.018 2.0 2.519 2.5 2.320 4.1 2.5

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 202: Libro Ejercicios Jimenez y Olea Tomo I

196 Capıtulo 9. Analisis de Regresion

a) Encuentre las ecuaciones de prediccion que necesitan los investigadores. Interpretelos resultados.

b) Pruebe la hipotesis de que el nivel en tejido graso (x) sirve para predecir lineal-mente el nivel en plasma sanguıneo (y). Utilice α = 0,05.

c) Pruebe la hipotesis de que el nivel en plasma sanguıneo (x) sirve para predecirlinealmente el nivel en tejido graso (y). Utilice α = 0,05.

d) Intuitivamente, ¿por que deben coincidir los resultados de los incisos b) y c)?

16. Se realizo un experimento con objeto de estudiar el agrietamiento por esfuerzos decorrosion de acero inoxidable tipo 304 en un entorno simulado de reactor con aguaen ebullicion (Transactions of the ASME, enero de 1986). Seis especımenes de aceroinoxidable se recocieron y se sensibilizaron en agua a 289C con oxıgeno y sulfatodisueltos, sometiendolos a diversos factores de intensidad de esfuerzo (es decir, cargas).La tabla presenta la carga maxima y la rapidez de crecimiento de grietas resultante(en metros por segundo) para los seis especımenes.

Carga maxima 30.0 35.6 41.5 50.2 55.5 61.1

x, MPa ·m 12

Rapidez de crecimiento 1.0 2.2 3.9 5.8 5.0 14.0de grietas y, m/s× 1010

a) ¿Hay suficientes pruebas que indiquen que la rapidez de crecimiento de grietasaumenta linealmente con la carga maxima? Pruebe con α = 0,10.

b) Estime el incremento medio en la rapidez de crecimiento de grietas por cadaincremento unitario en la carga maxima, empleando un intervalo de confianza de90 %. Interprete el resultado.

17. Un modelo robusto y muy utilizado para el movimiento humano es la Ley de Fitts.Segun esta ley, el tiempo T necesario para moverse y seleccionar un objetivo de an-chura W que esta a una distancia (o amplitud) A es: T = a + b log2(2A/W ) dondea y b son constantes que se estiman mediante regresion lineal simple. La cantidadlog2(2A/W ) se denomina ındice de dificultad (ID) y representa la variable indepen-diente (medida en bits) del modelo. Ciertas investigaciones de las que se informo enel Special Interest Group on Computer−Human Interaction Bulletin (julio de 1993)utilizaron la Ley de Fitts para modelar el tiempo (en milisegundos) necesario pararealizar cierta tarea en una computadora. Con base en datos obtenidos de n = 160ensayos (empleando diferentes valores de A y W ). Se obtuvo la siguiente prediccion de

mınimos cuadrados: T = 175,4 + 133,2(ID)

a) Interprete las estimaciones, 175.4 y 133.2.

b) El coeficiente de correlacion para el analisis es r = 0,951. Interprete este valor.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 203: Libro Ejercicios Jimenez y Olea Tomo I

9.2 Ejercicios Propuestos 197

c) Realice una prueba para determinar si el modelo de la Ley de Fitts es estadısti-camente adecuado para predecir el tiempo de realizacion de las tareas. Utiliceα = 0,05.

d) Calcule el coeficiente de determinacion, r2. Interprete el resultado.

18. Refierase al experimento, informado en Combustion and F lame, de difusividad deloxıgeno. Los datos para las nueve muestras de mezcla de nitrogeno y oxigeno se repro-ducen en la siguiente tabla.

Temperatura Difusividad de oxıgenox y

1,000 1.691,100 1.991,200 2.311,300 2.651,400 3.011,500 3.391,600 3.791,700 4.211,800 4.64

a) Calcule r y r2. Interprete sus valores.

b) Realice una prueba para determinar si la temperatura y la difusividad del oxıgenoexhiben una correlacion positiva. Utilice α = 0,05.

19. La exposicion pasiva al humo de tabaco en el ambiente se ha asociado a la supresion delcrecimiento y a un incremento en la frecuencia de infecciones de las vıas respiratoriasen ninos normales. ¿Esta asociacion es mas pronunciada en ninos que padecen fibrosiscıstica? Con el fin de contestar esta pregunta, se estudiaron 43 ninos (18 ninas y 25ninos) que asistieron a un campamento de verano de dos semanas para pacientes confibrosis cıstica (New England Journal of Medicine, 20 de septiembre de 1990). Entrelas diversas variables que se midieron estuvieron el percentil de peso del nino (y) y elnumero de cigarrillos fumados por dıa en el hogar del nino (x).

a) Para las 18 ninas, el coeficiente de correlacion entre y y x se informo como r =−0,50. Interprete este resultado.

b) Refierase al inciso (a). El valor-p para probar H0 : ρ = 0 contra H1 : ρ 6= 0 seinformo como p = 0,03. Interprete este resultado.

c) Para los 25 ninos, el coeficiente de correlacion entre y y x se informo como r =−0,12. Interprete este resultado.

d) Refierase al inciso (c). El valor-p para probar H0 : ρ = 0 contra H1 : ρ 6= 0 seinformo como p = 0,57. Interprete este resultado.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 204: Libro Ejercicios Jimenez y Olea Tomo I

198 Capıtulo 9. Analisis de Regresion

20. Los siguientes estadısticos de resumen se obtuvieron de un estudio que utilizo el analisisde regresion para investigar la relacion entre la flexion de un pavimento y la temper-atura superficial del pavimento de varios lugares de una carretera estatal. Aquı x =temperatura (o F) e y = factor de ajuste de flexion (y ≥ 0):

n = 15∑

xi = 1425∑

yi = 10,68∑x2

i = 139037,25∑

xiyi = 987,645∑

y2i = 7,85183

(a) Calcule β1, β0 y la ecuacion de la recta de regresion estimada.

(b) ¿Cual es la estimacion de cambio esperado en el factor de ajuste de flexion cuandola temperatura aumenta 1o F?.

(c) Suponga que la temperatura se midio en o C en lugar de o F. ¿Cual serıa la rectade regresion estimada?.

21. Es sabido que la potencia de un vehıculo se relaciona directamente con el numero depistones. Sea Yi : potencia del vehıculo i (miles de rpm) y Xi : numero de pistones delvehıculo i, se postula el modelo:

Yi = β Xi + εi, i = 1, . . . , n

Supuestos. E(εi) = 0, Var εi = σ2, Cov(εi, εj) = 0 ∀i 6= j.

(a) Encuentre el estimador de mınimos cuadrados de β y obtenga una expresion parala varianza de dicho estimador.

(b) Estime la ecuacion de regresion, si una muestra de 5 vehıculos entrega:

X 2 2 3 4 4Y 5 6 9 11 13

22. El concreto sin finos, preparado con un agregado grueso clasificado uniformemente yuna pasta de cemento y agua, es bueno en zonas de lluvia excesiva por sus excelentespropiedades de drenado. El artıculo “Pavement Thickness Design for No-FinesConcrete Parking Lots”. (J. of Transporting Engr., 1995, pp. 476–484) describe elempleo de un analisis de mınimos cuadrados para estudiar la forma como y = porosidad( %) se relaciona con x = peso unitario (lb/pie3) en especımenes de concreto. Utiliceel resultado que se presenta del software MINITAB para contestar las siguientes pre-guntas:

(a) ¿Cual es la ecuacion de la recta de regresion estimada?.

(b) Interprete el valor estimado de β1.

(c) Construya un intervalo de confianza de 95 % para β1. A partir del intervalo de con-fianza ¿Puede concluir que la variable x es significativa en el modelo de regresionsimple?.

(d) ¿Cual es la estimacion de σ?.

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 205: Libro Ejercicios Jimenez y Olea Tomo I

9.2 Ejercicios Propuestos 199

(e) ¿Cual es el valor de la variacion total que es explicada por el modelo?.

(f) Encuentre una estimacion puntual para la porosidad promedio real de todos losespecımenes, cuyo peso unitario sea 110 lb/pie3.

Regression Analysis: y versus x

Predictor Coef SE Coef T PConstant 118,910 4,499 26,43 0,000x -0,90473 0,04109 -22,02 0,000

Analysis of Variance

Source DF SS MS F PRegression 1 426,62 426,62 484,84 0,000Residual Error 13 11,44 0,88Total 14 438,06

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 206: Libro Ejercicios Jimenez y Olea Tomo I

200 Capıtulo 9. Analisis de Regresion

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 207: Libro Ejercicios Jimenez y Olea Tomo I

Apendice A

Formulario de Distribuciones

P (X = x) E(X) V (X) MX(t) RX(x)

X ∼ B(p) px(1− p)1−x p pq q + pet 0, 1

X ∼ Bin(n, p)(n

x

)px(1− p)n−x np npq (q + pet)n 0, 1, ..., n

X ∼ G(p) pqx−1 1p

qp2

pet1−qet , si qet < 1 1,2,...

X ∼ Bineg(r, p)(x−1

r−1

)prqx−r r

prqp

[ pet

1−qe]r , si qet < 1 r, r + 1, ...

X ∼ H(M, N, n)

(Mx

)(N−Mn−x

)(

Nn

) np n MN

(N−MN

)(N−nN−1

) 0, 1, ..., mın(M, n)

X ∼ P (µ = λt) µxe−µ

x!µ µ eµ(et−1) 0,1,...

X ∼ U(a, b)

1b−a

, a < x < b

0, e.o.c.a+b2

(b−a)2

12etb−eat

t(b−a)R

X ∼ E(λ) λe−λx 1λ

1λ2

λλ−t

,t ≤ λ 0, 1, 2, ...

X ∼ N(µ, σ2) 1√2πσ2 e

− (x−µ)2

2σ2 µ σ2 eµt+ σ2t22 R

X ∼ Gamma(α, β) x(α−1)e−xβ

Γ(α)βα αβ αβ2 (1− βt)−α x > 0

X ∼ Erlang(r, λ) λrxr−1e−λx

(r−1)!rλ

rλ2 ( λ

λ−t)r x > 0

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 208: Libro Ejercicios Jimenez y Olea Tomo I

II Capıtulo A. Formulario de Distribuciones

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 209: Libro Ejercicios Jimenez y Olea Tomo I

Apendice B

Formulario de Analisis de RegresionSimple

1. Modelo de Regresion Estimado

y =β0 + β1x

β0 =y − β1x

β1 =

n∑i=1

xiyi −

n∑i=1

xi

n∑i=1

yi

n

n∑i=1

x2i −

(n∑

i=1

xi

)2

n

2. Suma de cuadrados

a) Sxx =n∑

i=1

(xi − x)2 =n∑

i=1

x2i −

(n∑

i=1

xi

)2

n.

b) Syy =n∑

i=1

(yi − y)2 =n∑

i=1

y2i −

(n∑

i=1

yi

)2

n.

c) Sxy =n∑

i=1

(xi − x)(yi − y) =n∑

i=1

xiyi −

n∑i=1

xi

n∑i=1

yi

n

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 210: Libro Ejercicios Jimenez y Olea Tomo I

IV Capıtulo B. Formulario de Analisis de Regresion Simple

d) SSE = Syy − β1Sxy.

e) SSR = β1Sxy.

f ) SST = SSR + SSE = Syy

3. Varianzas y Desviaciones Estandar

a) σ2 = SSEn−2

b) se(β0) =

√σ2(

1n

+ x2

Sxx

)c) se(β1) =

√σ2

Sxx

4. Test de Hipotesis para los coeficientes

a) H0 : β0 = 0 H1 : β0 6= 0

T0 =β0

se(β0)

b) H0 : β1 = 0 H1 : β1 6= 0

T1 =β1

se(β1)

En ambos caso se rechaza la hipotesis nula si |Ti| > tn−2,1−α/2

5. Intervalos de Confianza

a) Intervalos de Confianza para los coeficientes

IC(β0) =β0 ∓ tn−2,1−α/2 · se(β0)

IC(β1) =β1 ∓ tn−2,1−α/2 · se(β1)

b) Intervalo de Confianza para la Prediccion y0 en el valor x0, donde y0 = β0 + β1x0

IC(y0) = y0 ∓ tn−2,1−α/2

√σ2

1 +

1

n+

(x0 − x)2

Sxx

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 211: Libro Ejercicios Jimenez y Olea Tomo I

V

c) Intervalo de Confianza para la respuesta media, donde µy|x0 = β0 + β1x0

IC(µy|x0) = µy|x0 ∓ tn−2,1−α/2

√σ2

1

n+

(x0 − x)2

Sxx

6. Coeficiente de Determinacion R2

R2 = β1Sxy

Syy

= 1− SSE

Syy

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 212: Libro Ejercicios Jimenez y Olea Tomo I

VI Capıtulo B. Formulario de Analisis de Regresion Simple

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 213: Libro Ejercicios Jimenez y Olea Tomo I

Apendice C

Tablas de distribucion

C.1. Distribucion t de Student

Magnitud de α en una colagl 0.20 0.15 0.10 0.05 0.025 0.01 0.005 0.00051 1.38 1.96 3.08 6.31 12.71 31.82 63.66 636.582 1.06 1.39 1.89 2.92 4.30 6.96 9.92 31.603 0.98 1.25 1.64 2.35 3.18 4.54 5.84 12.924 0.94 1.19 1.53 2.13 2.78 3.75 4.60 8.615 0.92 1.16 1.48 2.02 2.57 3.36 4.03 6.876 0.91 1.13 1.44 1.94 2.45 3.14 3.71 5.967 0.90 1.12 1.41 1.89 2.36 3.00 3.50 5.418 0.89 1.11 1.40 1.86 2.31 2.90 3.36 5.049 0.88 1.10 1.38 1.83 2.26 2.82 3.25 4.7810 0.88 1.09 1.37 1.81 2.23 2.76 3.17 4.5911 0.88 1.09 1.36 1.80 2.20 2.72 3.11 4.4412 0.87 1.08 1.36 1.78 2.18 2.68 3.05 4.3213 0.87 1.08 1.35 1.77 2.16 2.65 3.01 4.2214 0.87 1.08 1.35 1.76 2.14 2.62 2.98 4.1415 0.87 1.07 1.34 1.75 2.13 2.60 2.95 4.0716 0.86 1.07 1.34 1.75 2.12 2.58 2.92 4.0117 0.86 1.07 1.33 1.74 2.11 2.57 2.90 3.9718 0.86 1.07 1.33 1.73 2.10 2.55 2.88 3.9219 0.86 1.07 1.33 1.73 2.09 2.54 2.86 3.8820 0.86 1.06 1.33 1.72 2.09 2.53 2.85 3.8521 0.86 1.06 1.32 1.72 2.08 2.52 2.83 3.8222 0.86 1.06 1.32 1.72 2.07 2.51 2.82 3.7923 0.86 1.06 1.32 1.71 2.07 2.50 2.81 3.7724 0.86 1.06 1.32 1.71 2.06 2.49 2.80 3.7525 0.86 1.06 1.32 1.71 2.06 2.49 2.79 3.7326 0.86 1.06 1.31 1.71 2.06 2.48 2.78 3.7127 0.86 1.06 1.31 1.70 2.05 2.47 2.77 3.6928 0.85 1.06 1.31 1.70 2.05 2.47 2.76 3.6729 0.85 1.06 1.31 1.70 2.05 2.46 2.76 3.6630 0.85 1.05 1.31 1.70 2.04 2.46 2.75 3.65∞ 0.84 1.04 1.28 1.64 1.96 2.33 2.58 3.29

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 214: Libro Ejercicios Jimenez y Olea Tomo I

VIII Capıtulo C. Tablas de distribucion

C.2. Distribucion χ2

Proporcion del Area hasta +∞gl 0.995 0.99 0.975 0.95 0.90 0.75 0.501 0.00 0.00 0.00 0.00 0.02 0.10 0.452 0.01 0.02 0.05 0.10 0.21 0.58 1.393 0.07 0.11 0.22 0.35 0.58 1.21 2.374 0.21 0.30 0.48 0.71 1.06 1.92 3.365 0.41 0.55 0.83 1.15 1.61 2.67 4.356 0.68 0.87 1.24 1.64 2.20 3.45 5.357 0.99 1.24 1.69 2.17 2.83 4.25 6.358 1.34 1.65 2.18 2.73 3.49 5.07 7.349 1.73 2.09 2.70 3.33 4.17 5.90 8.3410 2.16 2.56 3.25 3.94 4.87 6.74 9.3411 2.60 3.05 3.82 4.57 5.58 7.58 10.3412 3.07 3.57 4.40 5.23 6.30 8.44 11.3413 3.57 4.11 5.01 5.89 7.04 9.30 12.3414 4.07 4.66 5.63 6.57 7.79 10.17 13.3415 4.60 5.23 6.26 7.26 8.55 11.04 14.3416 5.14 5.81 6.91 7.96 9.31 11.91 15.3417 5.70 6.41 7.56 8.67 10.09 12.79 16.3418 6.26 7.01 8.23 9.39 10.86 13.68 17.3419 6.84 7.63 8.91 10.12 11.65 14.56 18.34

Proporcion del Area hasta +∞gl 0.25 0.10 0.05 0.03 0.01 0.005 0.0011 1.32 2.71 3.84 5.02 6.63 7.88 10.832 2.77 4.61 5.99 7.38 9.21 10.60 13.823 4.11 6.25 7.81 9.35 11.34 12.84 16.274 5.39 7.78 9.49 11.14 13.28 14.86 18.475 6.63 9.24 11.07 12.83 15.09 16.75 20.516 7.84 10.64 12.59 14.45 16.81 18.55 22.467 9.04 12.02 14.07 16.01 18.48 20.28 24.328 10.22 13.36 15.51 17.53 20.09 21.95 26.129 11.39 14.68 16.92 19.02 21.67 23.59 27.8810 12.55 15.99 18.31 20.48 23.21 25.19 29.5911 13.70 17.28 19.68 21.92 24.73 26.76 31.2612 14.85 18.55 21.03 23.34 26.22 28.30 32.9113 15.98 19.81 22.36 24.74 27.69 29.82 34.5314 17.12 21.06 23.68 26.12 29.14 31.32 36.1215 18.25 22.31 25.00 27.49 30.58 32.80 37.7016 19.37 23.54 26.30 28.85 32.00 34.27 39.2517 20.49 24.77 27.59 30.19 33.41 35.72 40.7918 21.60 25.99 28.87 31.53 34.81 37.16 42.3119 22.72 27.20 30.14 32.85 36.19 38.58 43.82

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 215: Libro Ejercicios Jimenez y Olea Tomo I

C.3 Distribucion F (α = 0,05) IX

C.3. Distribucion F (α = 0,05)

Grados de libertad Grados de libertad para el numeradordenominador 1 2 3 4 5 6 7 8 9 10

1 161 199 216 225 230 234 237 239 241 2422 18.5 19.0 19.2 19.2 19.3 19.3 19.4 19.4 19.4 19.43 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.794 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.965 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.746 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.067 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.648 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.359 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.1410 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.9811 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.8512 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.7513 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.6714 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.6015 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.5416 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.4917 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.4518 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.4119 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.3820 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.3521 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.3222 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.3023 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.2724 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.2525 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.2430 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.1640 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.0860 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91∞ 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 216: Libro Ejercicios Jimenez y Olea Tomo I

X Capıtulo C. Tablas de distribucion

(Continuacion)

Grados de libertad Grados de libertad para el numeradordenominador 12 15 20 24 30 40 60 120 ∞

1 244 246 248 249 250 251 252 253 2542 19.4 19.4 19.4 19.5 19.5 19.5 19.5 19.5 19.53 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.534 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.635 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.376 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.677 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.238 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.939 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.7110 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.5411 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.4012 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.3013 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.2114 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.1315 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.0716 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.0117 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.9618 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.9219 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.8820 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.8421 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.8122 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.7823 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.7624 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.7325 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.7130 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.6240 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.5160 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39120 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25∞ 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.

Page 217: Libro Ejercicios Jimenez y Olea Tomo I

C.4 Distribucion Normal XI

C.4. Distribucion Normal

Segunda cifra decimal en zz 0.0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.78520.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.93191.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.97672.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.99903.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.99933.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.99953.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.99973.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.99983.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998

Recopilacion, Organizacion y Elaboracion por Patricia Jimenez P. & Ricardo Olea O.