Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

125
´ Area de Ciencias B´ asicas ESPECIALIZACION EN ESTADISTICA APLICADA Universidad del Norte Gu ´ ıa resumida sobre etodos Estad´ ısticos Teor´ ıa y pr´ actica Dr. rer. nat Humberto LLin ´ as Solano Profesor de la Universidad del Norte Barranquilla - Colombia 2005

Transcript of Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Page 1: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Area de Ciencias Basicas

ESPECIALIZACION ENESTADISTICA APLICADA

Universidad del Norte

Guıa resumida sobre

Metodos EstadısticosTeorıa y practica

Dr. rer. nat Humberto LLinas SolanoProfesor de la Universidad del Norte

Barranquilla - Colombia

2005

Page 2: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Contenido

1 Estadıstica descriptiva 41.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Medidas estadısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3 Analisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . . 9 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Probabilidad 202.1 Experimentos, espacios muestrales y eventos . . . . . . . . . . . . . . . 202.2 Tecnicas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.3 Introduccion a la probabilidad . . . . . . . . . . . . . . . . . . . . . . . 222.4 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Distribuciones de probabilidad 313.1 Variables aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . 313.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . 32 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4 Distribuciones especiales 364.1 La distribucion uniforme (discreta) . . . . . . . . . . . . . . . . . . . . 364.2 La distribucion binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 364.3 La distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 374.4 La distribucion hipergeometrica . . . . . . . . . . . . . . . . . . . . . . 394.5 Las distribuciones binomial negativa y geometrica . . . . . . . . . . . . 414.6 La distribucion uniforme (continua) . . . . . . . . . . . . . . . . . . . . 424.7 La distribucion normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.8 Las distribuciones gamma y exponencial . . . . . . . . . . . . . . . . . 454.9 Resumen de las distribuciones especiales . . . . . . . . . . . . . . . . . 48

Page 3: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CONTENIDO 2

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5 Distribuciones conjuntas 545.1 Vectores aleatorios discretos . . . . . . . . . . . . . . . . . . . . . . . . 545.2 Vectores aleatorios continuos . . . . . . . . . . . . . . . . . . . . . . . 56 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6 Distribuciones muestrales 616.1 Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616.2 Distribuciones muestrales de algunos estadısticos . . . . . . . . . . . . 626.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

7 Intervalos de confianza 717.1 Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 717.2 Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . 727.3 Intervalos de confianza para algunos parametros . . . . . . . . . . . . . 727.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747.5 Determinacion del tamano de una muestra . . . . . . . . . . . . . . . . 77 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

8 Pruebas de hipotesis 848.1 Conceptos de la prueba de hipotesis . . . . . . . . . . . . . . . . . . . 848.2 Pruebas para algunos parametros poblacionales . . . . . . . . . . . . . 868.3 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

A Guıa rapida para trabajar con Statgraphics 97A.1 Analisis de un solo conjunto de datos . . . . . . . . . . . . . . . . . . . 97A.2 Analisis simultaneo de dos o mas conjuntos de datos . . . . . . . . . . 97A.3 Graficos de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 98A.4 Diagramas de presentacion . . . . . . . . . . . . . . . . . . . . . . . . 98A.5 Variables numericas multidimensionales . . . . . . . . . . . . . . . . . . 99A.6 Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . 99A.7 Inferencias basadas en una sola muestra . . . . . . . . . . . . . . . . . 99A.8 Inferencias basadas en dos muestras . . . . . . . . . . . . . . . . . . . 100A.9 Bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

B Guıa rapida para trabajar con SPSS 101B.1 Definicion de las variables . . . . . . . . . . . . . . . . . . . . . . . . . 101

B.1.1 Transformacion de una variable . . . . . . . . . . . . . . . . . . 102B.1.2 Recodificacion de una Variable . . . . . . . . . . . . . . . . . . 103B.1.3 Filtrado de datos . . . . . . . . . . . . . . . . . . . . . . . . . 103

B.2 Analisis exploratorio de datos . . . . . . . . . . . . . . . . . . . . . . . 104B.3 Inferencia sobre una o mas poblaciones . . . . . . . . . . . . . . . . . . 105

C Uso de la calculadora en la estadıstica 106

Page 4: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Contenido 3

D Apendice de tablas 108D.1 La funcion de distribucion binomial . . . . . . . . . . . . . . . . . . . . 108D.2 La funcion de distribucion de Poisson . . . . . . . . . . . . . . . . . . . 110D.3 La funcion de distribucion normal . . . . . . . . . . . . . . . . . . . . . 112D.4 La funcion gamma incompleta . . . . . . . . . . . . . . . . . . . . . . 114D.5 Valores crıticos para la distribucion t de Student . . . . . . . . . . . . . 115D.6 Valores crıticos para la distribucion chi-cuadrada . . . . . . . . . . . . . 116D.7 Valores crıticos para la distribucion F . . . . . . . . . . . . . . . . . . . 118D.8 Algunos numeros aleatorios uniformemente distribuidos . . . . . . . . . 122

Bibliografıa & Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

Page 5: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 1

Estadıstica descriptiva

1.1 Introduccion

1. ¿Por que usted necesita conocer estadıstica?Tres razones fundamentales:

(a) Presentar y describir la informacion en forma adecuada.

(b) Inferir conclusiones sobre poblaciones grandes basandose solamente en lainformacion obtenida de subconjuntos de ellas.

(c) Utilizar modelos para obtener pronosticos confiables.

2. TerminosPoblacion, muestra, datos, parametro, estadıstico, Censo.

3. Metodos estadısticos.Metdos estadısticos = estadıstica descriptiva + estadıstica inferencial.

4. Organizacion de datos.Por el tipo de dato, de acuerdo a escalas de medidas, mediante tablas y medianterepresentaciones graficas.

5. Organizacion de datos de acuerdo al tipo.Existen dos tipos de datos: categoricos (o cualitativos) y numericos (cuantita-tivos). Estos ultimos se clasifican a su vez en discretos y continuos.

6. Organizacion de datos de acuerdo a escalas de medidas.Nominal, ordinal, de intervalo y de razon. Ver LLinas [11] o Weimer [23] paramayores detalles.

7. Organizacion de datos mediante tablas.Se necesita concepto: Frecuencias absoluta, relativa, acumulada y acumuladarelativa. Dos tipos de tablas:

Page 6: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

1.1 Introduccion 5

(a) Tablas de frecuencias agrupadas.Tablas con datos + frecuencias.

Ejemplo 1.1.1 La tabla de frecuencias (no agrupada) para el conjunto de datos3 5 7 6 4 3 7 6 6 7 5 7 es

Dato 3 4 5 6 7Frecuencia 2 1 2 3 4

(b) Tablas de frecuencias no agrupadas.Intervalos de clase, lımites de clase, fronteras de clase, Marcas de clase, ampli-tud w. Para hallar numero de clases c: Regla de Sturges (c = (3, 3) log n+1)o c =

√n.

Ejemplo 1.1.2 (Datos con un solo lugar decimal) Forme una distribucionde frecuencias considerando los siguientes datos:

8,9 10,2 11,5 7,8 10,0 12,2 13,5 14,1 10,0 12,26,8 9,5 11,5 11,2 14,9 7,5 10,0 6,0 15,8 11,5

SOLUCION:

Paso 1. El rango R es 9,8.

Paso 2. Por regla de Sturges, c = 5 (aproximar al entero mas cercano).

Paso 3. w = Rc

= 2 (aproximar al entero siguiente).

Paso 4. Como la unidad de medida es 0,1 (por tener los datos un solo lugar decimal)y como el “punto medio” de cada unidad de medida es 0,05, entonces,

Frontera inf. de primera clase = dato menor − 0, 05 = 5, 95.

En consecuencia, la tabla es

Clase Cuenta Frecuencia Marcas de clase X

5,95 - 7,95 |||| 4 6,957,95 - 9,95 || 2 8,959,95 - 11,95 ||||| ||| 8 10,9511,95 - 13,95 ||| 3 12,9513,95 - 15,95 ||| 3 14,95

8. Organizacion de datos mediante representaciones graficas.Hay graficas de varios tipos, entre los cuales se encuentran los siguientes: eldiagrama circular o de pastel, el pictograma, el diagrama de barras, el diagrama decaja y bigote, el histograma, el polıgono (de frecuencia o de frecuencias relativas),la ojiva (o polıgono de frecuencias acumuladas o polıgono de frecuencias relativasacumuladas) y el diagrama de tallo y hojas.

Page 7: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

1.2 Medidas estadısticas 6

9. Histograma

Fronteras

Fre

c.

rel.

(en

%)

5,95 7,95 9,95 11,95 13,95 15,950

10

20

30

40

Fronteras

Fre

c. re

l. (e

n %

)

(a) Histograma de frecuencias relativas

Fronteras

Fre

c.

acu

m.

5,95 7,95 9,95 11,95 13,95 15,950

4

8

12

16

20

Fronteras

Fre

c. a

cum

.

(b) Histograma de frecuencias acumu-ladas

10. Polıgono y ojiva.

Marcas de clase

Fre

cu

en

cia

s

4,95 6,95 8,95 10,95 12,95 14,95 16,950

2

4

6

8

Marcas de clase

Fre

cue

nc

ias

(c) Polıgono de frecuencias

Fronteras superiores

Fre

c.

acu

m.

5,95 7,95 9,95 11,95 13,95 15,950

4

8

12

16

20

Fronteras superiores

Fre

c. a

cum

.

(d) Ojiva

1.2 Medidas estadısticas

1. Medidas de tendencia central o de centralizacion.La media aritmetica (ponderada), la mediana, la moda, el rango medio (promediode los datos mayor y menor), la media geometrica, la media armonica y la mediacuadratica. En LLinas [11] se hace una descripcion completa de estas medidas.

2. Medidas de colocacion o de posicion relativa.La mediana, los percentiles, deciles y . En LLinas [11] se hace una descripcioncompleta de estas medidas.

3. Medidas de dispersion o de variabilidad.El rango (diferencia entre datos mayor y menor), el rango intercuartil (diferenciaentre el tercer y el primer cuartil), la varianza, la desviacion estandar y el coeficientede variancion de Pearson (desviacion estandar dividida entre la media, multiplicadapor 100 por ciento). En LLinas [11] se explican con detalles todas estas medidas.

Page 8: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

1.2 Medidas estadısticas 7

4. Aplicaciones de la desviacion estandar poblacional.Se utilizan dos reglas:

(a) Regla de Tchebychev (valida para cualquier poblacion).Por lo menos el 100(1−1/k2)% de los valores de la poblacion se encuentranen el intervalo [µ − kσ; µ + kσ].

k 1,5 2 2,5 3 3,5 4

100(1 − 1/k2)% 55,6% 75% 84% 88,9% 91,18% 93,7%

(b) Regla empırica (valida solo para poblaciones de forma acampanada).El 68% de los datos de la poblacion se encuentran en [µ − σ; µ + σ] y el95% de los datos en [µ − 2σ; µ + 2σ].

Ejemplo 1.2.1 Un inspector de control de calidad selecciona aleatoriamente 14 clavosde una caja de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm,son

2, 54 2, 55 2, 50 2, 60 2, 51 2, 52 2, 70 2, 40 2, 36 2, 53 2, 54 2, 52 2, 51 2, 55.

Si el inspector decide excluir los clavos que estan fuera del intervalo x± 2s, entonces,a lo mas el 25% estaran fuera del intervalo. ¿Se verifica la regla de Tchebychev?

5. Coeficiente de variacion de Pearson.

CV =

(desviacion estandar de los datos

media aritmetica de los datos

)· 100%.

Ejemplo 1.2.2 Los siguientes datos representan el promedio de millas por galondiario por cinco dıas para un determinado auto: 20, 25, 30, 15, 35. Por consiguiente,el tamano relativo de la “dispersion media alrededor de la media” con relacion a lamedia es 31,6%.

Ejemplo 1.2.3 El gerente de operaciones de un servicio de paqueterıa desea adquiriruna nueva flota de autos. Cuando los paquetes se guardan con eficiencia en el inte-rior de los autos (durante la preparacion de las entregas), se deben considerar dosrestricciones principales: el peso (en libras) y el volumen (en pies cubicos) de cadapaquete. Ahora, en una muestra de 200 paquetes, el peso promedio es 26 libras conuna desviacion estandar de 3,9 libras. Ademas, el volumen promedio de cada paquetees 8,8 pies cubicos con una desviacion estandar de 2,2 pies cubicos. Por consiguiente,con relacion a la media, el volumen de un paquete es mucho mas variable que su peso.¿Por que?

Ejemplo 1.2.4 Un inversionista potencial piensa adquirir acciones en una de doscompanıas A o B, listadas en la Bolsa de Valores de Nueva York. Si ninguna de lascompanıas ofrece dividendos a sus clientes y ambas tienen igual clasificacion (segunvarios servicios de inversion) en terminos de crecimiento potencial, el posible inver-sionista quizas considere la volatilidad (variabilidad) de ambas acciones para ayudaren la decision de inversion. En los ultimos meses, el precio promedio de las acciones enla companıa A fue de 50 dolares con una desviacion estandar de 10 dolares. Ademas,durante el mismo periodo, el precio promedio de las acciones en la companıa B fuede 12 dolares con una desviacion estandar de 4 dolares. Entonces, en relacion con lamedia, el precio de las acciones B es mucho mas variable que el de las acciones A.

Page 9: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

1.2 Medidas estadısticas 8

6. Medidas de formas.Coeficiente de sesgo y medida de curtosis.

7. Simetrıa y asimetrıa.Una distribucion de frecuencias sera simetrica o asimetrica segun lo sea su repre-sentacion grafica.1

Si una distribucon no es simetrica, se dice que es asimetrica a la derecha (positi-vamente) o a la izquierda (negativamente).2

En la figura 1.1 se ilustra el caso en que la distribucion de frecuencias tiene unasola moda.

(e) Distribucion simetrica (f) Distribucion asimetrica a la derecha

(g) Distribucion asimetrica a la izquierda

Fig. 1.1: Comparacion de tres distribuciones unimodales cuya forma difiere.

8. Coeficiente de sesgo Ap.Se define como:

Ap =Media aritmetica − Moda

Desviacion estandar.

Cuando Ap = 0, se dice que la distibucion es simetrica; cuando Ap < 0, sedice que la distribucion es sesgada negativamente o a la izquierda y

1En cualquier distribucion simetrica, la media coincide con la mediana.2En las medidas asimetricas unimodales la mediana esta entre la media y la moda.

Page 10: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

1.3 Analisis exploratorio de datos 9

cuando Ap > 0, se dice que la distribucion es sesgada positivamente o a la

derecha.

9. Relacion empırica entre media, mediana y moda.Para distribuciones campanoides, unimodales y moderadamente asimetricas secumple aproximadamente la relacion empırica

Media − Moda ≈ 3(Media aritmetica − Mediana),

Con lo anterior, el coeficiente de asimetrıa de Pearson la podemos calcular tambiena traves de la formula

Ap =3(Media aritmetica − Mediana)

Desviacion estandar.

10. Medidas de curtosis o apuntamiento.Se aplican a distribuciones campaniformes, es decir, unimodales simetricas o conligera asimetrıa.

1.3 Analisis exploratorio de datos

Muchos autores presentan el diagrama de tallo y hoja como tecnica del analisis ex-ploratorio de datos. Consiste en desarrollar un resumen de cinco numeros y construir undiagrama de caja y bigotes.

1. Resumen de cinco numeros.Consiste en cinco cantidades que se emplean para resumir los datos: valor mınimo,primer cuartil (Q1), Mediana (Q2), tercer cuartil (Q3) y valor maximo.

2. Situaciones para reconocer la simetrıa de los datos.Si la distribucion es simetrica:

• La distancia de Q1 a la mediana es igual a la distancia de la mediana a Q3.

• La distancia del valor mınimo a Q1 es igual a la distancia de Q3 al valormaximo.

• La mediana y el rango medio son iguales. (Estas medidas son iguales a lamedia de los datos.)

3. Situaciones para reconocer la no simetrıa de los datos.Si la distribucion no es simetrica:

• En las distribuciones sesgadas a la derecha, la distancia de Q3 al valor maximoexcede la distancia del valor mınimo a Q1. Ademas, la mediana es menorque el rango medio.

• En las distribuciones sesgadas a la izquierda, la distancia del valor mınimo aQ1 excede la distancia de Q3 al valor maximo. Ademas, el rango medio esmenor que la mediana.

Page 11: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

1.3 Analisis exploratorio de datos 10

Diagrama de caja y bigotes

Salarios mensuales

2200 2400 2600 2800 3000

Valor atípico(moderado)

Valores atípicos(extremos)

1,5 R.I1,5 R.I

Mediana

Media

+

2,200 2,400 2,600 2,800 3,000

++

Primer Tercercuartil cuartil

3 R.I

Fig. 1.2: Diagrama de caja y bigotes

4. Diagrama de caja y bigotes.(R.I. significa el rango intercuartil, los segmentos horzontales son los llamadosbigotes y los valores que estan por fuera de los bigotes se llaman valores atıpicos).

5. Diagramas de cajas multiples (o comparativos).La figura 1.3 contiene los diagramas de caja de las calificaciones en un examende matematicas para quince estudiantes de primer curso de primaria, quince desegundo y quince de tercero.

Calificaciones

Primero

Segundo

Tercero

40 50 60 70 80 90 100Calificaciones

Fig. 1.3: Diagrama de caja y bigotes de las calificaciones en un examen

En el diagrama puede apreciarse que no hay valores atıpicos en ninguno de los tresgrupos. Los estudiantes del tercer curso consiguieron la mejor mediana, pero suscalificaciones tienen una variabilidad considerablemente mayor que la de los otrosgrupos. Otro hecho que llama la atencion es la gran cantidad de calificaciones

Page 12: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 11

bajas obtenidas por los estudiantes de primer curso. Finalmente, podemos afirmarque las distribuciones de frecuencias de los tres conjuntos de datos estan sesgadasa la izquierda.

Ejercicios

1. Diga si la afirmacion dada es verdadera o falsa. Justifique siempre su respuesta. En casoque sea falso, de un contraejemplo.

(a) Si la desviacion estandar de un conjunto de datos es 0, entonces, los datos son iguales.

(b) No existen datos de tal forma que sean iguales el rango y la varianza.

(c) Existen datos con desviacion estandar negativa.

(d) En una distribucion simetrica, la media, la mediana y la moda son iguales.

(e) La desviacion estandar esta dada por las mismas unidades que la media.

(f) Toda informacion numerica proporciona datos cuantitativos.

(g) Toda informacion no numerica ofrece datos cuantitativos.

(h) Cuando todos los datos son categoricos, la moda es la unica medida de tendenciacentral que se puede utilizar.

(i) Si el primer cuartil en el primer examen de estadıstica fue de 3,0, entonces, este valorindica que el 25% de los estudiantes ganaron el examen.

2. Clasifique los datos siguientes en cuantitativos (numericos) y cualitativos (categoricos).En caso de ser numerico, como discretos o continuos:

(a) Estaturas en centımetros de cuatro jugadores de futbol.

(b) Las temperaturas promedios diarias en el ultimo mes.

(c) Clasificacion etnica de 30 empleados.

(d) Numeros telefonicos de ciertas personas.

(e) Distancia (en metros) recorrido por un atleta en una temporada.

(f) Peso perdido (en kilogramos) por 10 personas debido a una dieta.

(g) Fecha de cumpleanos de determinadas personas.

(h) Calificaciones (E, S, A, D, I) de unos estudiantes de bachillerato.

3. Se clasifico a los estudiantes de un programa universitario de acuerdo a con el semestreque cursa y su preferencia deportiva. Los resultados estan registrados en la siguiente tabla.

Primero Segundo Tercero CuartoFutbol 15 14 5 9Beisbol 12 22 6 6Voleivol 5 5 9 5Basquetbol 26 7 6 7Natacion 7 8 4 2

(a) ¿Que porcentaje de los estudiantes de primer semestre prefieren el futbol?

(b) ¿Que porcentaje de los aficionados a la natacion son de segundo semestre?

(c) ¿Que porcentaje del total de los estudiantes prefieren el basquetbol?

(d) ¿Que porcentaje de los estudiantes son de cuarto semestre?

Page 13: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 12

(e) ¿Que porcentaje del total de estudiantes son de tercer o cuarto semestre?

(f) ¿Que porcentaje prefiere la natacion, el voleibol o el beisbol?

4. Los siguientes datos representan las cuentas telefonicas mensuales, en miles de pesos, de25 residentes de un pequeno pueblo:

21,48 21,15 25,12 23,47 27,81 19,80 36,05 28,50 26,6620,35 30,22 25,49 20,80 23,83 25,35 23,48 25,81 21,0726,83 30,96 33,38 20,77 19,98 35,87 22,02

(a) ¿Que porcentaje del grupo pago mas de 21.000 pesos?

(b) ¿Que porcentaje pago mas de 22.000 pesos pero menos de 27.000 pesos?

5. Los datos que se indican a continuacion representan el costo (en miles de pesos) de laenergıa electrica durante un determinado mes del ano para una muestra aleatoria de 50apartamentos en cierta ciudad importante:

128 144 168 109 167 141 149 206 175 123153 197 127 82 96 171 202 178 147 102135 191 137 129 158 108 119 183 151 114111 148 213 130 165 157 185 90 116 172143 187 166 139 149 95 163 150 154 130

(a) Obtenga una tabla de frecuencias con 7 intervalos de clase.

(b) Grafique el correspondiente histograma de frecuencias, el polıgono de frecuenciasrelativas y la ojiva con frecuencias acumuladas relativas.

(c) ¿Alrededor de que cantidad parece concentrarse el costo mensual de energıa electrica?

(d) Segun su opinion, ¿cual de las graficas representa mejor la distribucion de los costosde energıa electrica?

6. Responda las siguientes preguntas. Justifique sus respuestas.

(a) ¿Que escala de medida se requiere para la mediana? ¿Y para la moda?

(b) ¿En que condiciones coinciden la media, la mediana y la moda de una muestra?

(c) ¿En que caso sera demasiado grande la diferencia entre la media y la mediana?

7. Una empresa de servicio electrico de una ciudad le realiza la lectura del contador de luz aun usuario, obteniendo los siguientes datos:

Fecha LecturaAgosto 27 00553 KwhAgosto 30 00571 Kwh

Septiembre 4 00605 Kwh

El recibo de pago le llego al usuario con lectura de 00638 Kwh, realizada el 9 de septiembre,pero la empresa no dejo constancia de lectura, hecho que motivo el reclamo del usuarioalegando que le estaban cobrando de mas. ¿Tiene la razon el usuario? Explique.

8. Los neumaticos de cierta marca tiene una duracion de vida con media de 29.000 kilometrosy desviacion tıpica de 3.000 kilometros.

(a) Encontrar un intervalo en el que se pueda garantizar que se encuentra por lo menosel 75% de los tiempos de vida de los neumaticos de esta marca.

Page 14: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 13

(b) Usando la regla impırica y suponiendo que la poblacion tiene forma acampanada,encontrar un intervalo en el cual se estime que se encuentra aproximadamente el 95%

de los tiempos de vida de los neumaticos de esta marca.

9. Los valores de presion sanguınea se reportan a veces a los 5 mm Hg mas cercanos (100,105, 110, etc.). Suponga que los valores reales de presion sanguınea para nueve individuosseleccionados al azar son:

130,0 113,7 122,0 108,3 131,5 133,2 118,6 127,4 138,4

(a) ¿Cual es la mediana de los valores reportados de presion sanguınea?

(b) Suponga que la presion del octavo individuo es 127,6 en lugar de 127,4 (un pequenocambio en su valor). ¿Como afectarıa esto a la mediana de los valores reportados?¿Que dice esto sobre la sensibilidad de la mediana para redondear o agrupar los datos?

10. La propagacion de grietas por fatiga en diversas partes de aeronaves ha sido objeto deprofundo estudio en anos recientes. Los datos que aparecen a continuacion constan detiempo de propagacion (horas de vuelo/104) para llegar a un tamano de grieta dado enagujeros sujetadores que se usan en aeronaves militares:

0,915 0,937 0,983 1,007 0,736 0,863 0,865 0,9131,132 1,140 1,153 1,253 1,394 1,011 1,064 1,109

(a) Calcule los valores de la media y mediana muestrales.

(b) ¿En cuanto se puede reducir la observacion muestral mas grande, sin afectar el valorde la mediana?

11. Una manifestacion interesante de la variacion surge cuando se efectuan los analisis deemision de gases en los vehıculos automotores. Los requisitos de costo y tiempo delprocedimiento federal de prueba (PFT) en cierto pais evitan la difusion de su uso en losprogramas de inspeccion vehicular. Como resultado, muchas agencias han desarrolladoanalisis menos costosos y mas rapidos con la esperanza de reproducir los resultados.Segun un artıculo de una prestigiosa revista, se dice que la eceptacion del PFT comopatron de excelencia ha conducido a la creencia de que las mediciones repetidas en elmismo vehıculo daran resultados identicos (o casi). Los autores del artıculo aplicaron elPFT a siete vehıculos caracterizados como “grandes emisores”. Los resultados de uno deesos vehıculos son los siguientes:

HC (g/mi) 32,2 32,5 13,8 18,3CO (g/mi) 232 236 118 149

(a) Calcule las desviaciones estandar muestrales de las observaciones de HC y CO. ¿Parecejustificada la creencia general?

(b) Compare los coeficientes de variacion de cada conjunto de datos para determinarcuales presentan mayor o menor variacion.

12. Un taller de mecanica acepta una orden por 10.000 ruedas de 2 pulgadas de diametro.Las especificaciones de tamano del producto podran ser mantenidas solo si el diametromedio es de 2 pulgadas y la desviacion estandar es muy pequena. En este caso, ¿cual esel margen de tolerancia permitido para la desviacion estandar?

13. A continuacion se presentan algunas medidas estadısticas (mediana, primer y tercer cuartil)y una tabla de frecuencia agrupada, para las edades de un grupo de personas que hayen una sala de concierto. A partir de estos datos, responder las preguntas que aparecenabajo. Mediana = 20, primer cuartil = 17,5 y tercer cuartil = 23.

Page 15: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 14

Frecuencia Frecuencia Frec. acum.Edades Frecuencia relativa acumulada relativa

11,5 - 14,5 2 0,0500 2 0,050014,5 - 17,5 8 0,2000 10 0,250017,5 - 20,5 11 0,2750 21 0,525020,5 - 23,5 10 0,2500 31 0,775023,5 - 26,5 8 0,2000 39 0,975026,5 - 29,5 1 0,0250 40 1,0000

(a) ¿Cual era el numero exacto de personas que habıan en la sala del concierto?

(b) ¿Cual es la media aproximada de las personas que asistieron al concierto?

(c) ¿Que edad tienen el 77,5% de las personas?

(d) ¿Que porcentaje de personas tienen una edad entre 11,5 y 20,5?

(e) ¿Que porcentaje de personas tienen una edad mayor de 23,5?

(f) ¿Cuantas personas tienen una edad entre 17,5 y 20,5?

(g) ¿Cuantas personas tienen una edad mayor que 14,5?

(h) ¿Que interpretacion tiene el valor de la mediana y el de los cuartiles?

14. Los siguientes datos representan los rendimientos porcentuales anuales en cuentas demercado de dinero de una muestra de 15 bancos comerciales en el area metropolitana deuna ciudad a una determinada fecha:

Nombre del Banco Rendimiento Nombre del banco RendimientoBanco su cuenta 3,10 Banco el Pais 2,28The Bank 2,63 Banco la Clave 3,01Mein Bank 2,79 Banco del Norte 2,53Your Bank 3,25 Banco del Sur 2,00El Banco del pueblo 1,90 Banco Nacional 3,05Aero Bank 2,79 Nuestro Banco 2,02Union Bank 2,90 Banco el dinero 3,05Bank del cliente 2,73

(a) Proporcione el resumen de cinco numeros.

(b) Construya el diagrama de caja y bigotes y describa la forma.

(c) Si alguien le dijera:“los rendimientos del mercado de dinero no varıan mucho de unbanco a otro”, con base en estos datos, ¿que dirıa?

15. Una de las metas de toda administracion es ganar lo mas posible en relacion con elcapital invertido en la empresa. Una medida del exito en alcanzarla es el retorno sobrela aportacion, que es la relacion de la ganancia neta entre el valor de las acciones. Acontinuacion se muestran los porcentajes de ganancia sobre las acciones para 25 empresas.

11,4 15,8 52,7 17,3 12,3 9,0 19,6 22,9 41,65,1 17,3 31,1 6,2 19,2 14,7 9,6 8,6 11,2

16,6 5,0 30,3 12,8 12,2 14,5 9,2

Forme el resumen de cinco numeros, trace un diagrama de caja y bigotes y determine sihay valores atıpicos. ¿Como podrıa un analista financiero usar esta informacion?

s 16. Considere la variable anchura que contiene el conjunto de datos que encontramos en elarchivo calles.sf3 y que corresponde al ancho de 112 calles de Madrid (Espana).

Page 16: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 15

(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 0 y la ultima frontera superior sea 40. A partir de ella, responda lassiguientes preguntas:

i. ¿Cuantas calles tienen un ancho entre 5 y 25 kilometros?

ii. ¿Que porcentaje de calles tienen un ancho entre 10 y 30 kilometros?

iii. ¿Cuantas calles tienen un ancho mayor de 20 kilometros?

iv. ¿Que porcentaje de calles tienen un ancho mayor 25 kilometros?

v. ¿Cuantas calles tienen un ancho menor de 15 kilometros?

vi. ¿Que porcentaje de calles tienen un ancho menor de 35 kilometros?

(b) Con 8 clases (en donde la primera frontera inferior sea 0 y la ultima frontera superiorsea 40), construir los histogramas de frecuencias absolutas y de frecuencias absolutasacumuladas, los polıgonos de frecuencia y de frecuencias relativas y las ojivas de fre-cuencias acumuladas y de frecuencias relativas acumulada. A partir de estos graficos,responda las siguientes preguntas:

i. ¿Aproximadamente cuantas calles tienen un ancho mayor que 16,9 kilometros?

ii. ¿Aproximadamente cuantas calles tienen un ancho menor que 12,5 kilometros?

iii. ¿Que porcentaje aproximado de calles tienen un ancho mayor de 7,7 kilometros?

iv. ¿Que porcentaje aproximado de calles tienen un ancho menor de 13,8 kilometros?

(c) Estudie la simetrıa de la distribucion de los datos.

(d) ¿Existen valores atıpicos? ¿Cuantos? ¿Cuales?

(e) ¿Existe alguna transformacion que mejora la simetrıa? ¿Y la presencia de valoresatıpicos? Indique en caso positivo la transformacion seleccionada.

s 17. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millaspor galon) de 154 modelos de automoviles sacados al mercado entre los anos 1978 y1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses(origen=3). Tambien aparecen los respectivos cilindrajes de los autos, las potencias, etc.

(a) Construya un diagrama de caja y bigotes para los datos de la distancia recorrida y apartir de el, responda las siguientes preguntas: ¿Entre cuales valores varıa la distanciarecorrida? ¿Cuanto recorre el 50% central de los autos? ¿Hay valores atıpicos? ¿Essimetrica o asimetrica la distribucion de los datos? En caso de ser asimetrica, ¿esasimetrica a la izquierda o a la derecha? ¿Cuales son los valores de la media y de lamediana?

(b) Estudie el grado de simetrıa de los datos de la distancia recorrida de cuatro manerasdiferentes (compare sus respuestas):

i. Utilizando las medidas estadısticas (media, mediana, moda, sesgo, etc. )

ii. Construyendo un histograma de frecuencias con 5 clases.

iii. Construyendo un un histograma con 13 clases. ¿Porque este histograma resultamas adecuado que el que construyo con 5 clases?

iv. Construyendo un grafico de simetrıa con la opcion graphical options . . . symmetryplot de Statgraphics.

s 18. Se han medido los diametros (en milımetros) de 50 tornillos y se han obtenido los resultadosque mostramos en el archivo tornillos.sf3.

(a) Forme la tabla de frecuencias con 6 clases para los datos y, a partir de ella, respondalas siguientes preguntas:

i. ¿Cuantos tornillos tienen un diametro entre 29 y 32 milımetros?

Page 17: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 16

ii. ¿Que porcentaje de tornillos tienen un diametro entre 30 y 34 milımetros?

iii. ¿Cuantos tornillos tienen un diametro mayor de 32 milımetros?

iv. ¿Que porcentaje de tornillos tienen un diametro mayor 34 milımetros?

v. ¿Cuantos tornillos tienen un diametro menor de 31 milımetros?

vi. ¿Que porcentaje de tornillos tienen un diametro menor de 33 milımetros?

(b) Con 6 clases, construir los histogramas de frecuencias absolutas y de frecuenciasabsolutas acumuladas, los polıgonos de frecuencia y de frecuencias relativas y lasojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir deestos graficos, responda las siguientes preguntas:

i. ¿Aproximadamente cuantos tornillos tienen un diametro mayor que 34,4 milımetros?

ii. ¿Aproximadamente cuantos tornillos tienen un diametro menor que 32,2 milımetros?

iii. ¿Que porcentaje aproximado de tornillos tienen un diametro mayor de 31,6milımetros?

iv. ¿Cuantos tornillos tienen un diametro menor de 32,8 milımetros?

(c) Estudie la simetrıa de la distribucion de los datos.

s 19. Los datos del archivo fotocopia.sf3 muestran el gasto en fotocopias (en miles de pesos)de 70 estudiantes universitarios durante un determinado ano.

(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 0 y la ultima frontera superior sea $ 1.400.000. A partir de ella, respondalas siguientes preguntas:

i. ¿Cuantos estudiantes han gastando entre $ 175.000 y $ 525.00 en el ano?

ii. ¿Que porcentaje de estudiantes han gastando entre $ 700.000 y $ 1.225.000 enel ano?

iii. ¿Cuantos estudiantes han gastando mas de $ 1.050.000 en el ano?

iv. ¿Que porcentaje de estudiantes han gastando mas de $ 350.000 en el ano?

v. ¿Cuantos estudiantes han gastando menos de $ 875.000 en el ano?

vi. ¿Que porcentaje de estudiantes han gastando menos de $ 525.000 en el ano?

(b) Con 8 clases (en donde la primera frontera inferior sea 0 y la ultima frontera superiorsea $ 1.400.000), construir los histogramas de frecuencias absolutas y de frecuenciasabsolutas acumuladas, los polıgonos de frecuencia y de frecuencias relativas y lasojivas de frecuencias acumuladas y de frecuencias relativas acumulada. A partir deestos graficos, responda las siguientes preguntas:

i. ¿Aproximadamente cuantos estudiantes han gastando mas de $ 767.810 en elano?

ii. ¿Aproximadamente cuantos estudiantes han gastando menos de $ 391.821 en elano?

iii. ¿Que porcentaje aproximado de estudiantes han gastando mas de $ 601.583 enel ano?

iv. ¿Cuantos estudiantes han gastando menos de $ 1.104.220 en el ano?

(c) Estudie la simetrıa de la distribucion de los datos.

(d) ¿Existen valores atıpicos? ¿Cuantos? ¿Cuales?

(e) Realice una transformacion logarıtmica de los datos e interprete los resultados. Co-mente las diferencias con los datos sin transformar.

s 20. En el archivo de datos doscientos.sf3 proporcionamos las sesenta y nueve mejores marcasde todos los tiempos en la prueba de 200 metros lisos masculinos (las marcas se dan ensegundos), ası como el nombre del atleta y la fecha en que se consiguio la marca.

Page 18: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 17

(a) Forme la tabla de frecuencias con 8 clases para los datos, en donde la primera fronterainferior sea 19,2 segundos y la ultima frontera superior sea 20,2 segundos. A partirde ella, responda las siguientes preguntas:

i. ¿Cuantos atletas han recorrido entre 19,325 y 19,7 segundos?

ii. ¿Que porcentaje de atletas han recorrido entre 19,45 y 19,95 segundos?

iii. ¿Cuantos atletas han recorrido mas de 19,7 segundos?

iv. ¿Que porcentaje de atletas han recorrido mas de 19,45 segundos?

v. ¿Cuantos atletas han recorrido menos de 19,95 segundos?

vi. ¿Que porcentaje de atletas han recorrido menos de 19,825 segundos?

(b) Con 8 clases (en donde la primera frontera inferior sea 19,2 segundos y la ultima fron-tera superior sea 20,2 segundos.), construir los histogramas de frecuencias absolutasy de frecuencias absolutas acumuladas, los polıgonos de frecuencia y de frecuenciasrelativas y las ojivas de frecuencias acumuladas y de frecuencias relativas acumulada.A partir de estos graficos, responda las siguientes preguntas:

i. ¿Aproximadamente cuantos atletas han recorrido mas de 19,818 segundos?

ii. ¿Que porcentaje aproximado de atletas han recorrido mas de 19,845 segundos?

iii. ¿Que porcentaje aproximado de atletas han recorrido mas de 19,782 segundos?

iv. ¿Aproximadamente cuantos atletas han recorrido menos de 20,03 segundos?

(c) Estudie la simetrıa de la distribucion de los datos.

(d) ¿Se detecta algo peculiar en la distribucion de estos datos?

(e) ¿Se detecta algun valor potencialmente atıpico? ¿Cual es?

s 21. En el archivo de datos Cavendish.sf3 presentamos 29 medidas de la densidad de la tierraobtenidas por Henry Cavendish en 1798 empleando una balanza de torsion. La densidadde la tierra se proporciona como un multiplo de la densidad del agua.

(a) Utilice los diagramas de tallo y hojas y de cajas para determinar si existe algun valoratıpico.

(b) Proponga, razonando la respuesta, un valor para la densidad de la tierra.

s 22. En el archivo de datos autos.sf3 mostramos las distancias recorridas (dadas en millaspor galon) de 154 modelos de automoviles sacados al mercado entre los anos 1978 y1982 por diferentes fabricantes: americanos (origen=1), europeos (origen=2) y japoneses(origen=3). Tambien aparecen los respectivos cilindrajes de los autos, las potencias, etc.

(a) Considere por separado los conjuntos de distancias recorridas de los modelos de cadauno de los cinco anos.

i. Analice grafica y numericamente cada uno de estos conjuntos.

ii. Utilizando la opcion Plot . . . Exploratory Plots . . . Multiple Box-and-WhishkerPlot . . . Data=distancia . . . Level codes=year . . . obtenga los diagramas de cajas(multiples) de los cinco conjuntos de distancias recorridas con respecto a cadauno de los anos. ¿Que se observa? ¿Conoce alguna razon que pueda explicarlo que resulta de los analisis numericos y de la observacion de los diagramas decajas?

(b) Ahora, construya el diagrama de caja multiple de la distancia recorrida de los au-tomoviles segun su cilindrada.

i. Teniendo en cuenta cada uno de los diagramas, responda las preguntas formu-ladas en la parte (a).

Page 19: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 18

ii. Compare entre sı los distintos diagramas y responda las siguientes preguntas:¿Donde es mas fuerte la asimetrıa? ¿Donde es menor? ¿Donde no existe? ¿Varıabastante los valores de la media y de la mediana para los diferentes grupos?

(c) Construya el diagrama de caja multiple de la potencia de los automoviles segun suorigen y responda las preguntas formuladas en el inciso anterior.

s 23. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligenciarealizados a parejas de gemelos monozigoticos. Los gemelos monozigoticos se formanpor la division en dos de un mismo ovulo ya fecundado y, por tanto, tienen la mismacarga genetica. Al mismo tiempo, por razones obvias, es muy frecuente que compartan elentorno vital y es difıcil separar ambos factores. En el conjunto de datos, los datos de lacolumna A corresponden al gemelo criado por sus padres naturales, los de la columna B alcriado por un familiar u otra persona. Mediante la opcion Compare . . . Two Samples . . .

Two Sample Comparison . . . Sample 1=A . . . Sample 2=B . . . Ok, resuelva lo siguiente:

(a) Compare la simetrıa de los datos de la columna A y B.

(b) Construya un diagrama de caja multiple para los datos de la columna A y B y describasus interesantes propiedades.

(c) ¿Como interpreta el coeficiente de variacion de ambos conjuntos de datos?

s 24. En 1893 Lord Rayleigh investigo la densidad del nitrogeno empleando en su obtenciondistintas fuentes. Previamente habıa comprobado la gran discrepancia existente entre ladensidad del nitrogeno producido tras la eliminacion del oxıgeno del aire y el nitrogenoproducido por la descomposicion de ciertos compuestos quımicos. Los datos del archivoRayleigh.sf3 muestran esta diferencia de forma clara. Esto llevo a Lord Rayleigh a in-vestigar detenidamente la composicion del aire libre de oxıgeno y al descubrimiento de unnuevo elemento gaseoso, el argon.

(a) Analice numerica y graficamente estos datos. Preste especial atencion a los diagramasde tallo y hojas y al diagrama de cajas. ¿Hay alguna peculiaridad de la poblacion depesos que se manifieste en un diagrama y no en el otro?

(b) Realice diagramas de cajas dividiendo los datos en los pesos obtenidos a partir de airey los obtenidos a partir de compuestos quımicos del nitrogeno. ¿Que se observa?

s 25. Una de las medidas de seguridad de los reactores nucleares frente a desajustes en el procesode generacion de energıa o de extraccion de esta es el disparo del reactor. Esta medidaconsiste en la detencion del proceso de fusion mediante la insercion en el nucleo del reactorde venenos neutronicos. El numero de disparos no previstos de un reactor en un periodo esun indicador de problemas de comportamiento y de fiabilidad en la planta. En el archivode datos disparos.sf3 proporcionamos, para dos anos diferentes (1984 y 1993), el numerode disparos no previstos en sesenta y seis reactores nucleares de los Estados Unidos deNorteamerica.

(a) Analice numerica y graficamente, por separado, el numero de disparos de reactor encada uno de los dos anos considerados.

(b) Compare graficamente las distribuciones de ambas variables ¿Se aprecian diferenciasimportantes entre ellas? ¿Que conclusiones le merece esta comparacion?

s 26. Sea una variable X que presenta los valorees x1, x2, x3, x4, x5 con frecuencias absolutasn1 = 1, n2 = 2, n3 = 8, n4 = 5 y n5 = 6.

(a) Representar la variable X mediante digramas de barras horizontales.

(b) Hacer la representacion con barras horizontales apiladas.

Page 20: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 1. Ejercicios 19

(c) Representar la variable X mediante digramas de barras verticales.

(d) Representar la variable X mediante un diagrama de barras varticales con la lınea basesituada a la altura del punto 4.

(e) Representar la variable X mediante un diagrama de barras horizontales con rectangulosde error representados por lıneas y definidos por la variable Y cuyos valores son 1,5;2,5; 3,5; 3 y 2.

s 27. La encuesta de poblacion activa elaborada por una empresa referente al cuarto trimestrede 1.970 presenta para el numero de activos por ramas los siguientes datos:

RAMA DE ACTIVIDAD MILES DE ACTIVOSAgricultura, caza y pesca 3706,3Fabriles 3437,8Construccion 1096,3Comercio 1388,3Transporte 648,7Otros servicios 2454,8

(a) Realizar un grafico de sectores con porcentajes del numero de activos por ramas.

(b) Realizar el grafico conlas etiquetas de las ramas de actividad sobre los sectores.

(c) Desplazar el sector relativo a la rama con menor numero de activos.

Page 21: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 2

Probabilidad

2.1 Experimentos, espacios muestrales y eventos

1. Experimentos determinısticos y aleatorios.

(a) Experimento: cualquier accion que genera observaciones.

(b) Experimento determinıstico: al repetirse bajo las mismas condiciones,genera siempre los mismos resultados (como, por ejmplo, las leyes fısicas).

(c) Experimento aleatorio (o estocastico): Al repertirse bajo las mismascondiciones, no genera siempre los mismos resultados.

2. Espacio muestral, evento y evento elemental.

(a) Espacio muestral Ω: Conjunto de todos los posibles resultados de unexperimento aleatorio.

(b) Evento: cualquier subconjunto de Ω.

(c) Evento elemental: evento con un solo elemento.

2.2 Tecnicas de conteo

Conteo por enumeracion de elementos, conteo a traves de diagramas de arbol, teoremafundamental del conteo, principio de adicion, conteo de permutaciones y el conteo decombinaciones.

1. Permutacion.Arreglo ordenado de una cantidad finita de objetos distintos.

2. Situaciones especiales (relacionadas con permutaciones).

• Permutaciones sin repeticion de n objetos tomados todos a la vez.

• Permutaciones sin repeticion de n objetos tomados de k en k (k ≤ n).

Page 22: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

2.2 Tecnicas de conteo 21

• Permutaciones circulares.

• Permutaciones con repeticion de n objetos tomados de k en k (k es cualquiernumero natural).

• Permutaciones de n objetos de los cuales hay n1 de un primer tipo, n2 deun segundo tipo, . . ., nk de un k-esimo tipo, donde n1 +n2 + · · ·+nk = n.

• Maneras de hacer una particion de un conjunto.

Solo ilustraremos la primera.

3. Permutaciones sin repeticion de n objetos tomados todos a la vez.El numero de permutaciones de un conjunto de n elementos distintos es igual1 an! := 1 · 2 · · · (n − 1) · n, siendo 0! := 1.

Ejemplo 2.2.1 Suponga que una empresa dispone de ocho maquinas atornilladorasy de ocho espacios en el area de produccion. Entonces, hay 8! = 40.320 maneras deordenar las ocho maquinas en los ocho espacios disponibles.

4. Combinacion.Cualquier escogencia de k objetos de un conjunto de n objetos distintos, sinimportar el orden en que los k objetos son escogidos (una combinacion puede sercon repeticion o sin repeticion).

5. Formula para calcular el numero de combinaciones.El numero de combinaciones de k objetos seleccionados, sin repeticion, de unconjunto de n elementos, es2

(n

k

):=

n!

k!(n − k)!, siendo

(n

0

):= 1.

Y el numero de combinaciones de k objetos seleccionados con repeticion, de unconjunto de n elementos, es

(n + k − 1

k

)=

(n + k − 1)!

k!(n − 1)!, siendo

(n

0

):= 1.

Ejemplo 2.2.2 (Combinaciones tomadas de 2 en 2, sin repeticion) Hay 10 posi-bles formas de escoger dos letras de un total de 5, cuando el orden no importa y laseleccion es sin repeticion.

Ejemplo 2.2.3 (Combinaciones tomadas de 2 en 2, con repeticion) Hay 15 posi-bles formas de escoger dos letras de un total de 5, cuando el orden no importa y laseleccion es con repeticion.

1El sımbolo “!” se conoce con el nombre de factorial. Cuando escribamos, por ejemplo, 5!

leeremos “5 factorial”. Algunos valores factoriales son los siguientes:

1! = 1, 2! = 2 · 1 = 2, 3! = 3 · 2 · 1 = 6, 4! = 4 · 3 · 2 · 1 = 24, etc.

2Los numeros(

n

k

)se conocen con el nombre de coeficiente binomial.

Page 23: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

2.3 Introduccion a la probabilidad 22

2.3 Introduccion a la probabilidad

En general, hay 4 formas de calcular o estimar la probabilidad, a saber, mediantelos siguientes metodos (que se relacionan todos entre sı): axiomatico, de la fre-cuencia relativa, clasico y subjetivo.

Solo explicaremos brevemente los metodos empırico y clasico.

6. Propiedades de la probabilidad.

(a) P(∅) = 0 y P(Ω) = 1.

(b) Si los eventos A, B y C son mutuamente excluyentes,3 entonces, P(A ∪ B ∪C) = P(A) + P(B) + P(C).

(c) P(A) = 1 − P(A), siendo A el complemento de A.

(d) 0 ≤ P(A) ≤ 1.

(e) P(A) = P(A ∩ B) + P(A ∩ B).

(f) Teorema de adicion para 2 eventos o formula de Silvester:

P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

(g) Teorema de adicion para 3 eventos o formula de Silvester:

P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C).

7. Metodo empırico.Utiliza datos que se han observado empıricamente, registra la frecuencia con queha ocurrido algun evento en el pasado y estima la probabilidad de que el eventoocurra nuevamente con base en estos datos historicos.

8. Frecuencia relativa de un evento.Supongamos que un experimento aleatorio se repite n veces y que un eventoA asociado con estas n repeticiones ocurre exactamente k veces. Entonces, lafrecuencia relativa del evento A es fn = k

n.

Ejemplo 2.3.1 La tabla 2.1 muestra experimentos hechos por tres investigadores:

Observese que en cada una de las investigaciones, la frecuencia relativa del numero decaras es aproximadamente 0,5, que es la probabilidad de obtener una cara.

9. Probabilidad empırica.Sea A un evento asociado con un experimento. Entonces, la probabilidad P(A) esaproximadamente igual a la frecuencia relativa de A si efectuamos el experimentomuchas veces.

Al usar esta definicion, tener en cuenta:

• Esta probabilidad es solo una estimacion del valor real.

3Es decir, todas las posibles intersecciones son vacıas.

Page 24: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

2.3 Introduccion a la probabilidad 23

FrecuenciaHecho Numero de Numero relativapor Lanzamientos de caras de caras

Buffon 4.040 2.048 0,5069K. Pearson 12.000 6.019 0,5016K. Pearson 24.000 12.012 0,5005

Fig. 2.1: Lanzamientos de una moneda realizada por 3 investigadores

• A mayor numero de experimentos mejor sera la estimacion.

• Los experimentos deben repetirse siempre bajo las mismas condiciones.

10. Probabilidad (clasica) un evento elemental.Sea Ω un espacio muestral finito y no vacıo. Entonces,

P(evento elemental) =1

Numero de elementos de Ω. (2.1)

Ejemplo 2.3.2 Consideremos el experimento de lanzar una moneda. Entonces, laprobabilidad de obtener cara, simbolizado por P(C), y la de obtener sello, simbolizadopor P(S), esta dado por P(C) = P(S) = 1

2= 0, 5. Estas probabilidades las interpreta-

mos de la siguiente manera: En un gran numero de lanzamientos aparecera una caraaproximadamente en la mitad de los lanzamientos y sello en la otra mitad. O tambienpodemos decir: si la moneda se lanza repetidamente, entonces, el 50% (que resulta demultiplicar 0,5 por 100) de las veces resultara cara y en el otro 50%, sello.

11. Probabilidad (clasica) de un evento.Sea Ω finito, no vacıo y supongamos que (2.1) se cumple para cada evento ele-mental de Ω. Entonces, para cada evento A de Ω, tenemos

P(A) =Numero de elementos de A

Numero de elementos de Ω. (2.2)

Ejemplo 2.3.3 Dos dados no falsos se lanzan. Sea B el evento de obtener por lomenos un 11. Entonces, la probabilidad de que la suma sea por lo menos un 11 esP(B) = 3

36= 1

12.

Ejemplo 2.3.4 En la primera epoca del desarrollo de un yacimiento de petroleo, unaempresa estimo en 0,1 la probabilidad de que las reservas economicamente recuper-ables excedieran los 2.000 millones de barriles. La probabilidad de que las reservasexcediesen los 1.000 millones de barriles se estimo en 0,5. Dada esta informacion, laprobabilidad estimada de que las reservas se encuentren entre 1.000 y 2.000 millonesde barriles es 0, 5 − 0, 1 = 0, 4.

Ejemplo 2.3.5 Un estante tiene 6 libros de matematicas y 4 de fısica. Si todoslos libros de matematicas son diferentes y los libros de fısica tambien, entonces, laprobabilidad de que 3 libros determinados de matematicas esten juntos es P(A) =8! 3!10!

= 0, 0666.

Page 25: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

2.3 Introduccion a la probabilidad 24

Ejemplo 2.3.6 Una caja de doce lapiceros tiene dos que estan defectuosos. Se ex-traen tres lapiceros sin reemplazo. Entonces, la probabilidad de que dos salgan defec-tuosos es P(A) = 10

220= 0, 045.

12. Probabilidad condicional de A dado B.

Se define como P(A/B) =P(A∩B)

P(B)si P(B) > 0.

Ejemplo 2.3.7 Una persona lanza una moneda tres veces. Entonces, la probabilidad

de obtener 3 caras dado que salio por lo menos una cara es 1/8

7/8= 1

7.

13. Teorema de multiplicacion para 2 eventos.Si A y B son dos eventos de un espacio muestral Ω 6= ∅ y si P(B ∩ A) > 0,entonces,

P(B ∩ A) = P(B/A)P(A) o por P(B ∩ A) = P(A/B)P(B).

Ejemplo 2.3.8 Supongamos que una caja tiene diez bolas, de los cuales tres estandefectuosas. Se sacan dos bolas, una detras de la otra y sin reemplazo. Sean A elevento “la primera bola sacada esta defectuosa” y B el evento “la segunda bola sacadaesta defectuosa”. Entonces, la probabilidad de sacar una bola defectuosa seguida deotra defectuosa es

P(A ∩ B) = P(A)P(B/A) =3

10· 2

9.

14. Teorema de multiplicacion para 3 eventos.Si P(A1 ∩ · · · ∩ A3) > 0, entonces,

P(A1 ∩ · · · ∩ A3) = P(A1) · P(A2/A1) · P(A3/A1 ∩ A2).

Como podemos observar claramente, en este teorema hemos considerando que A1 es el evento

que primero sucede, luego sucede A2 ; posteriormente, A3.

Ejemplo 2.3.9 Una caja contiene 6 fichas rojas, 4 blancas y 5 azules. Halle laprobabilidad de que se extraigan en el orden roja (R), blanca (B) y azul (A) si lasfichas no se reemplazan es P(R ∩ B ∩ A) = 0, 044.

15. Teorema de la probabilidad total.Si los eventos A1, A2, . . ., An forman una particion4 de un espacio muestral Ω ysi P(Ai) > 0 para todo i = 1, . . . , n, entonces, para cada evento B de Ω, se tieneque

P(B) = P(B/A1)P(A1) + P(B/A2)P(A2) + · · · + P(B/An)P(An).

Ejemplo 2.3.10 La caja I contiene 3 fichas rojas(R) y 2 azules (A), en tanto que lacaja II contiene 2 fichas rojas y 8 azules. Se lanza una moneda no falsa de tal formaque si cae cara, entonces, se saca una ficha de la caja I y, por el contrario, si cae sello,se saca una ficha de la caja II. Supongamos que quien lanza la moneda no revela siresulta cara o sello (de tal forma que la caja de la cual se saco una ficha no se revela).

4Es decir, todas las posibles intersecciones son vacıas y la union de todos los eventos son igualesa Ω.

Page 26: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

2.3 Introduccion a la probabilidad 25

Fig. 2.2: Diagrama para la situacion del ejemplo 2.3.10

Entonces, la probabilidad de haber sacado una ficha roja es

P(R) = P(R/I)P(I) + P(R/II)P(II) = 0, 4.

Ejemplo 2.3.11 Un editor envıa propaganda de un libro de estadıstica al 70% deaquellos profesores que estan a cargo de esa materia. El 40% de aquellos que recibieronla propaganda se decidieron a utilizar el libro, inclusive, el 20% de los que no recibieronla propaganda tambien utilizaran el libro. Entonces, la probabilidad de utilizar ellibro es 0,34 (se aplica el teorema de la probabilidad; tambien se puede calcular laprobabilidad con ayuda del diagrama de arbol que aparece en la figura 2.3).

Fig. 2.3: Diagrama para la situacion del ejemplo 2.3.11

16. Regla o teorema de Bayes.Sea A1, A2, . . . , An una particion5 de un espacio muestral Ω. Entonces, paracada evento B con P(B) > 0 y para todo k = 1, . . . , n, se tiene

P(Ak/B) =P(B/Ak)P(Ak)

P(B/A1)P(A1) + P(B/A2)P(A2) + · · · + P(B/An)P(An).

Para poder aplicar la regla de Bayes, recomendamos dibujar siempre un diagramade arbol.

5Es decir, todas las posibles intersecciones son vacıas y la union de todos los eventos son igualesa Ω.

Page 27: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

2.3 Introduccion a la probabilidad 26

Ejemplo 2.3.12 Considere la situacion del ejemplo 2.3.10. Entonces, la probabilidadde haber escogido la caja I (es decir, que el resultado de la moneda sea cara) es

P(I/R) =P(R/I)P(I)

P(R/I)P(I) + P(R/II)P(II)=

35· 1

235· 1

2+ 1

5· 1

2

=3

4= 0, 75.

Ejemplo 2.3.13 Un analista de bolsa examina las perspectivas de las acciones de ungran numero de companıas. Cuando se investigo el comportamiento de estas accionesun ano antes, se descubrio que el 15% experimentaron un crecimiento superior al de lamedia, el 40% inferior y el 45% restante se mantuvieron alrededor de la media. El 30%de los valores que crecieron por encima de la media fueron clasificados como “buenasadquisiciones” por el analista, al igual que el 15% de las que crecieron alrededor dela media y el 20% de las que tuvieron un crecimiento inferior. Al aplicar el teoremade Bayes, la probabilidad de que un valor clasificado como “buena adquisicion” porel analista crezca por encima de la media del mercado es igual a 0,3658.

Ejemplo 2.3.14 En cierta ciudad, aproximadamente el 10% de los habitantes estaafectado por una rara enfermedad (A), para la cual se ha desarrollado una prueba dediagnostico. A traves de esta prueba se ha determinado que el 85% de los individuosque padecen la enfermedad, presentan un resultado positivo (B), mientras que el20% de los individuos sin la enfermedad muestran un resultado de prueba positivo.Supongamos que se hace una prueba en un individuo seleccionado al azar. Todaslas probabilidades mencionadas en el problema se pueden identificar en el siguientediagrama de arbol que se muestra en la figura 2.4.

Fig. 2.4: Diagrama de arbol para los datos del ejemplo 2.3.12.

(a) La probabilidad de que el resultado sea positivo es

P(B) = P(A)P(B/A) + P(A)P(B/A) = 0, 085 + 0, 18 = 0, 265.

(b) Si el resultado es positivo, entonces, la probabilidad de que el individuo tenga

Page 28: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

2.4 Independencia 27

la enfermedad es (por el teorema de Bayes):

P(A/B) =P(A ∩ B)

P(B)=

0, 085

0, 265= 0, 3207.

2.4 Independencia

1. Independencia.A, B son (estocasticamente) independientes, si y solo si P(A/B) = P(A) y sondependientes en cualquier otro caso. Es decir, el evento A es independiente delevento B si la probabilidad de A no se ve afectada por la ocurrencia o no de B.

2. Teorema de multiplicacion para eventos independientes.Dos eventos A, B de un espacio muestral Ω 6= ∅ son independientes si y solo si

P(A ∩ B) = P(A)P(B).

3. Teorema de independencia.Sean A, B eventos de un espacio muestral Ω 6= ∅. Entonces, las siguientes cuatroproposiciones son equivalentes:

(a) A y B son independientes. (b) A y B son independientes.

(c) A y B son independientes. (d) A y B son independientes.

Ejercicios

1. Una universidad realiza tres tipos de pruebas a 100 aspirantes y obtiene los siguientesresultados: 2 fracasaron en las tres pruebas; 7, en la primera y en la segunda; 8, en lasegunda y en la tercera; 10, en la primera y en la tercera; 25, en la primera; 30, enla segunda; 25, en la tercera. Determine el numero de aspirantes que conforman lossiguientes eventos:

(a) Fracasaron exactamente en una prueba.

(b) Aprobaron las tres pruebas.

(c) Fracasaron en la primera y en la tercera, pero no en la segunda.

(d) Fracasaron en la segunda y en la tercera, pero no en la primera.

(e) Fracasaron en al menos una prueba.

(f) Aprobaron al menos una prueba

(g) Aprobaron la segunda o la tercera, pero no la primera.

2. Un equipo de futbol ha determinado contratar un futbolista de talla internacional para elproximo campeonato. Sean A, B y C eventos que representan el hecho de que el futbolistacontratado ha jugado en el Real Madrid, en el Milan y en el Bayern de Munich, respecti-vamente. Utilice las operaciones de union, interseccion y complemento para describir, enterminos de A, B y C, dibuje un diagrama de Venn y sombree la region correspondientea cada uno.

(a) Por lo menos el futbolista ha jugado en uno de los tres equipos mencionados ante-riormente.

Page 29: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 2. Ejercicios 28

(b) El futbolista ha jugado en los tres equipos mencionados anteriormente.

(c) El futbolista ha jugado en el Real Madrid y no en el Milan.

(d) El futbolista solo ha jugado en el Bayern de Munich.

(e) El futbolista ha jugado exactamente en uno de los tres equipos mencionados ante-riormente.

3. Los estudiantes de un curso de estadıstica se clasifican como estudiantes de administra-cion, economıa o ingenierıa; como repitente o no repitente y tambien como hombre omujer. Encuentre el numero total de clasificaciones posibles para los estudiantes de dichocurso.

4. Supongamos que 7 personas se quieren organizar en una fila. ¿De cuantas manerasdiferentes pueden hacerlo?

5. La mayor accionista de una determinada empresa decide que en el futuro se divida el pre-supuesto de publicidad entre tres agencias. Seis son las agencias que se estan considerandopara este trabajo. ¿Cuantas son las posibles elecciones de tres agencias?

6. Las placas para autos en Barranquilla antes tenıan dos letras y cuatro numeros. El sistemade nomenclatura cambio y ahora son de tres letras y tres numeros. Con el sistema actual,¿aumento o disminuyo el numero de placas que se pueden emitir? ¿En que porcentaje?

7. En una comunidad el 30% de las personas son fumadoras, 55% son bebedoras y 20%tanto fumadoras como bebedoras. Calcule la probabilidad de que una persona elegida alazar (a) fume pero no beba, (b) ni fume ni beba, (c) fume o no beba. Interprete siempresus resultados.

8. Para un control de calidad se seleccionan aleatoriamente dos abanicos sin reemplazo de unlote. Si uno de los dos abanicos esta defectuoso, todo el lote se rechaza. Si una muestrade 200 abanicos contiene cinco defectuosos calcule la probabilidad de que la muestra searechazada.

9. La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas enaquellos que fuma o no fuman y aquellos que tiene problemas de salud.

Problemas Fuman No fumanSı 0,15 0,09No 0,18 0,58

(a) ¿Cual es la probabilidad de que un adulto de esta poblacion elegido al azar tengaproblemas de salud?

(b) ¿Cual es la probabilidad de que un adulto de esta poblacion elegido fume?

(c) ¿Cual es la probabilidad de que un adulto de esta poblacion elegido al azar que nofume tenga problemas de salud?

10. En cierta empresa, 31% de los empleados son europeos, 42% son asiaticos y 27% sonlatinoamericanos. De los empleados europeos, 34% son mujeres; de los asiaticos, 42%son mujeres; mientras que de los latinoamericanos, 72% son mujeres.

(a) ¿Cual es la probabilidad de que un empleado seleccionado al azar sea una (mujer)europea? ¿(Hombre) asiatico?

(b) ¿Cual es la probabilidad de que un empleado seleccionado al azar sea una mujer?¿Hombre?

(c) Si un empleado seleccionado al azar es una mujer, ¿cual es la probabilidad de que seaeuropea? ¿Asiatica? ¿Latinoamericana?

Page 30: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 2. Ejercicios 29

(d) Repita el inciso anterior, teniendo en cuenta que el empleado seleccionado sea unhombre.

11. Una empresa fabrica computadores, cuyo disco duro tienen capacidad de 20 GB y otroscon capacidad de 30 GB. En el mes anterior, 35% de los computadores vendidos han sidolos que tienen disco duro de 20 GB. De los compradores de computadores con disco durode 20 GB, 45% compran los que tienen una memoria RAM de 356 MB, mientras queel 30% de los compradores de computadores con disco duro de 30 GB tambien lo hacenası. Si sabemos que un comprador seleccionado al azar ha comprado un computador conmemoria RAM de 356 MB, ¿cual es la probabilidad de que tenga un computador con discoduro de 30 GB?

12. Una prestigiosa Universidad de Barranquilla utiliza tres hoteles locales para proporcionarhospedaje nocturno a sus profesores invitados. Supongamos que a 25% de los profesoresse les asignan habitaciones en el Hotel Las Nieves, al 45% en el Hotel El Mar y al 30%en el Hotel San Felipe. Si hay una decorado especial en 3% de la habitaciones del HotelLas Nieves, 5% del Hotel El Mar y en 8%de las habitaciones del Hotel San Felipe, ¿cuales la probabilidad de que

(a) a un cliente se le asigne una habitacion con decorado especial?

(b) a una persona con una habitacion que tiene un decorado especial se le haya acomodadoen el Hotel El Mar?

13. Una emisora de bonos municipales tiene tres categorıas de clasificacion (A, B y C).Suponga que el ano pasado, de los bonos municipales que se emitieron en cierto pais,70% tuvieron clasificacion A, 20% clasificacion B y 10% clasificacion C. De los bonosmunicipales con clasificacion A, 50% fueron emitidos en ciudades, 40% en suburbios y10% en areas rurales. De los bonos municipales con clasificacion B, 60% fueron emitidosen ciudades, 20% en suburbios y 20% en areas rurales. De los bonos municipales conclasificacion C, 90% fueron emitidos en ciudades, 5% en suburbios y 5% en areas rurales.

(a) ¿Que proporcion de bonos municipales emiten las ciudades? ¿Los suburbios? ¿Lasareas rurales?

(b) Si una ciudad emitiera un nuevo bono municipal, ¿cual seria la probabilidad de quetuviera clasificacion A?

14. Se les pregunto a los suscriptores de un periodico local si leıan regularmente, ocasional-mente o nunca la seccion de deportes y, tambien, si habıan practicado futbol durante elano anterior. La proporciones obtenidas en la encuesta figuran en la siguiente tabla.

Futbol Lee regularmente Lee ocasionalmente Nunca leeSı 0,21 0,16 0,31No 0,10 0,04 0,18

(a) ¿Cual es la probabilidad de que un suscriptor elegido al azar nunca lea la seccion dedeportes?

(b) ¿Cual es la probabilidad de que un suscriptor elegido al azar haya jugado futbol duranteel ano pasado?

(c) ¿Cual es la probabilidad de que un suscriptor que nunca lea la seccion de deporteshaya jugado futbol durante el ano pasado?

(d) ¿Cual es la probabilidad de que un suscriptor que ha jugado futbol durante el anopasado nunca lea la seccion de deportes?

(e) ¿Cual es la probabilidad de que un suscriptor que no lea regularmente la seccion dedeportes haya jugado futbol durante el ano pasado?

Page 31: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 2. Ejercicios 30

15. Suponga que las proporciones de fenotipos sanguıneos en determinada poblacion son lossiguientes: A : 35%, B : 28%, AB : 13% y O : 24%. Supongamos que los fenotipos dedos personas seleccionadas al azar son independientes entre sı. ¿Cual es la probabilidadde que ambos fenotipos sean O?

16. Se clasifican muestras de hule de espuma de tres proveedores de acuerdo a si cumplen ono con las especificaciones. Los resultados de 100 muestras se resumen a continuacion:

Proveedor Sı cumple No cumple1 17 32 18 103 50 2

Si A denota el evento de que una muestra es del proveedor 1 y si B denota el evento deque una muestra cumple con las especificaciones, determine si A y B son independientes.¿Son independientes A y B?

17. Se selecciono una muestra de 570 encuestados en una cierta ciudad para recoger in-formacion acerca del comportamiento de los consumidores. Entre las preguntas estaba:“¿Disfruta usted comprando ropa?” De 270 hombres, 165 respondieron que sı. De 300mujeres, 224 respondieron que sı.

(a) Suponga que el participante elegido es mujer. ¿Cual es la probabilidad de que nodisfrute comprando ropa?

(b) Suponga que el participante elegido disfruta comprando la ropa. ¿Cual es la proba-bilidad de que la persona sea hombre?

(c) Los eventos disfrutar comprando ropa y sexo del participante, ¿son estadısticamenteindependientes? Explique.

18. Una companıa de seguros estima que el 30% de los accidentes de automovil son debidosal estado de embriaguez del conductor y que el 20% provocan heridos. Ademas, el 40% delos accidentes que dan lugar a heridos son debidos al estado de embriaguez del conductor

(a) ¿Cual es la probabilidad de que un accidente elegido al azar haya sido causado por elestado de embriaguez del conductor y haya dado lugar a heridos?

(b) ¿ Son los sucesos debido al estado de embriaguez del conductor” y “da lugar a heridos”independientes?

(c) Si un accidente elegido al azar es causado por el estado de embriaguez del conductor,¿cual es la probabilidad de que haya dado lugar a heridos?

(d) ¿Cual es la probabilidad de que un accidente elegido al azar haya sido provocado porel estado de embriaguez del conductor y no haya dado lugar a heridos?

Page 32: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 3

Distribuciones de probabilidad

3.1 Variables aleatorias discretas

1. Variable aleatoria.X : Ω −→ R. Se clasifica en discreta o continua.

2. Variable aleatoria discreta.Tiene una cantidad o finita o (infinita) enumerable de valores.

3. Funcion de probabilidad f de X.Una funcion f : R −→ [0, 1] tal que

f(x) =

P(X = x), si x = x1, x2, . . .;0, de otra forma.

Es claro que:

(a) f(x) ≥ 0 para todo valor x real.

(b)∑

x∈R

f(x) = 1.

(c) La grafica de f es un histograma de probabilidad.

4. Funcion de distribucion acumulada de X.Una funcion F : R −→ [0, 1] definida por

F(t) = P(X ≤ t) =∑

x;x≤t

f(x), para todo t real.

5. Propiedades de F.

(a) 0 ≤ F(t) ≤ 1.

(b) F es creciente y escalonada.

(c) F(−∞) = 1 y F(∞) = 0.

Page 33: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

3.2 Variables aleatorias continuas 32

6. Comentarios generales.

(a) P(X = a) no siempre es cero.

(b) P(a < X ≤ b) = F(b) − F(a).

(c) P(a ≤ X ≤ b) 6= F(b) − F(a).

(d) P(a ≤ X ≤ b) 6= P(a < X ≤ b).

7. ¿Como se calcula f a partir de F?Si a− es el valor maximo posible de X que es estrictamente menor que a, entonces,

f(a) = F(a) − F(a−)

8. Esperanza y varianza.

E(X) =∑

k

xk · f(xk), V(X) =∑

k

(xk − µ)2 · f(xk).

9. Propiedades de la esperanza y varianza.

(a) E(aX + b) = aE(X) + b.

(b) V(aX + b) = a2V(X).

(c) V(X) = E(X2) −[E(X)

]2.

3.2 Variables aleatorias continuas

1. Variable aleatoria.X : Ω −→ R. Se clasifica en discreta o continua.

2. Variable aleatoria continua.Tiene una cantidad infinita no enumerable de valores.

3. Funcion de densidad f de X.Una funcion f : R −→ [0,∞) que cumple las dos condiciones:

(a) P(a ≤ X ≤ b) =b∫

a

f(x)dx, para todo a y b reales.

(b) El area bajo toda la grafica de f es 1, es decir,∞∫

−∞f(x)dx = 1.

La grafica de f es una curva.

4. Funcion de distribucion acumulada de X.Una funcion F : R −→ [0, 1] definida por

F(t) = P(X ≤ t) =

t∫

−∞

f(x)dx, para todo t real.

Page 34: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 3. Ejercicios 33

5. Propiedades de F.

(a) 0 ≤ F(t) ≤ 1.

(b) F es creciente y continua.

(c) F(−∞) = 1 y F(∞) = 0.

6. Comentarios generales.

(a) P(X = a) siempre es cero.

(b) P(a < X ≤ b) = F(b) − F(a).

(c) P(a ≤ X ≤ b) = F(b) − F(a).

(d) P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b).

7. ¿Como se calcula f a partir de F?f(x) = F ′(x), para todo valor de x en donde exista la derivada.

8. Esperanza y varianza.

E(X) =

∞∫

−∞

x · f(x)dx, V(X) =

∞∫

−∞

(x − µ)2 · f(x)dx.

9. Propiedades de la esperanza y varianza. Las mismas que en el caso discreto.

Ejercicios

1. ¿Son las siguientes afirmaciones verdaderas o falsas? Justifique cada respuesta.

(a) Toda variable aleatoria es un numero.

(b) Si f es la funcion de probabilidad de una variable aleatoria discreta X y 0 es un posiblevalor de X, entonces, f(0) = 0.

(c) Para cualquier variable aleatoria discreta X se cumple que P(X = 1) = 1, en donde 1es un posible valor de X.

(d) Si F es la funcion de distribucion acumulada de una variable aleatoria X discreta,entonces, F es una funcion escalonada.

(e) Si X es una variable aleatoria discreta con funcion de distribucion acumulada F, en-tonces, se cumple que P(3 ≤ X < 5) = F(5) − F(3).

(f) Si f es la funcion de densidad de una variable aleatoria continua X, entonces, f(x) =

P(X = x), para todo numero real x.

(g) Para cualquier variable aleatoria continua X se cumple que P(X = 1) = 1.

(h) Si F es la funcion de distribucion acumulada de una variable aleatoria X continua,entonces, F es una funcion escalonada

(i) Si X es una variable aleatoria continua con funcion de distribucion acumulada F,entonces, se cumple que P(4 ≤ X < 8) = F(8) − F(4).

(j) Si X es cualquier variable aleatoria y si la variable aleatoria X + 4 tiene esperanza 1,entonces, la esperanza de X es 5.

Page 35: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 3. Ejercicios 34

2. Una pizzerıa, que atiende pedidos por correo, tiene cinco lıneas telefonicas. Sea X lavariable aleatoria que representa al numero de lıneas en uso en un momento especıfico.Supongamos que la funcion de probabilidad f de X esta dada en la siguiente tabla:

Valor x de X 0 1 2 3 4 5f(x) 0,20 0,25 0,10 0,15 0,09 0,21

Calcule la probabilidad de cada uno de los siguientes eventos:

(a) A = “a lo sumo 2 lıneas estan en uso”.

(b) B = “menos de 4 lıneas estan en uso”.

(c) C = “por lo menos 3 lıneas estan en uso”.

(d) D = “entre 2 y 4 (ambos inclusive) lıneas estan en uso”.

(e) E = “entre 2 y 5 (ambos inclusive) lıneas no estan en uso”.

(f) F = “por lo menos 3 lıneas no estan en uso”.

3. La funcion de probabilidad de la variable aleatoria X que representa al numero de imper-fecciones por 4 metros de un papel especial en rollos continuos de ancho uniforme, estadada por

x 0 1 2 3 4f(x) 0,21 0,28 0,10 0,25 0,16

Determine la funcion de distribucion acumulada de X y representela graficamente.

4. Una fabricante de lapiceros tiene un programa de control de calidad que incluye la in-speccion de lapiceros recibidos para revisar que no tengan defectos. Supongamos que, encierto dıa, el recibe lapiceros en lotes de cinco y se seleccionan dos lapiceros de un lotepara inspeccionarlos. Podemos representar los posibles resultados del proceso de seleccionpor pares. Por ejemplo, el par (3, 4) representa la seleccion de los lapiceros 3 y 4 parainspeccionarlos.

(a) Haga una lista de los resultados diferentes.

(b) Supongamos que los lapiceros 3 y 4 son los unicos defectuosos de un lote de cinco yse van a escoger dos lapiceros al azar. Defina la variable aleatoria X como el numerode de lapiceros defectuosos observado entre los inspeccionados. Encuentre la funcionde probabilidad de X.

(c) Encuentre la funcion de distribucion acumulada F de X y representela graficamente.

5. Al invertir en unas acciones particulares, una persona puede tener una ganancia en un anode $8.000.000 con probabilidad de 0,4 o tener una perdida de $2.000 con probabilidad de0,6. ¿Cual es la ganancia esperada de esta persona? Interprete su respuesta.

6. El numero total de horas, medidas en unidades de 10 horas, que una familia utiliza unalavadora en un perıodo de 6 meses es una variable continua X con funcion de densidad

f(x) =

x, si 0 < x < 1,

2 − x si 1 ≤ x < 2,

0, de otro modo.

(a) Haga un bosquejo de la grafica de f.

(b) ¿Cual es la probabilidad de que en un perıodo de 6 meses, una familia utilice sulavadora menos de 15 horas? ¿Entre 5 y 12 horas?

Page 36: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 3. Ejercicios 35

7. Suponga que la temperatura de reaccion (en grados centıgrados) de cierto proceso quımicoes una variable aleatoria continua X con funcion de densidad

f(x) =

1 − x, si −k ≤ x ≤ k,

0, de otra manera.

(a) Halle el valor de k para que f sea en realidad una densidad y, luego, trace la graficade f.

(b) Calcule la probabilidad de que la temperatura de reaccion sea estrictamente positiva.

(c) Calcule la probabilidad de que la temperatura de reaccion se encuentre entre 0 y 1/2grados centıgrados.

(d) Calcule probabilidad de que la temperatura de reaccion sea menor que −1/4 gradoscentıgrados o mayor que 1/4 grados centıgrados.

8. Un maestro universitario nunca termina su clase antes de que suene la campana y siempretermina su clase por lo menos 2 minutos despues de que suena la campana. Sea X eltiempo (en minutos) que transcurre entre la campana y el termino de la clase, y supongaque la funcion de densidad de X es

f(x) =

kx2, si 0 ≤ x ≤ 2,

0, de otra manera.

(a) Encuentre el valor de k y luego grafique f.

(b) ¿Cual es la probabilidad de que la clase termine por lo menos 1 minuto despues deque suene la campana?

(c) ¿Cual es la probabilidad de que la clase continue entre 60 y 90 segundos despues deque suene la campana?

(d) ¿Cual es la probabilidad de que la clase continue por lo menos 90 segundos despuesde que suene la campana?

9. Un vendedor recibe un salario anual de 12.000.000 de pesos, mas un 5% del valor delas ventas que realiza. Las ventas anuales pueden representarse mediante una variablealeatoria con media 20.000.000 de pesos y desviacion tıpica de 2.000.000 de pesos. Hallela media y la desviacion del ingreso anual de este vendedor.

Page 37: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 4

Distribuciones especiales

1. Distribuciones especiales discretas:Uniforme discreta, de Bernoulli, binomial, de Poisson, hipergeometrica, binomialnegativa, geometrica, etc.

2. Distribuciones especiales continuas:Uniforme continua, normal, gamma, exponencial, t de Student, Chi-cuadrada, F

de Weibull, etc.

4.1 La distribucion uniforme (discreta)

1. Definicion.Una variable aleatoria discreta X con los valores enteros sobre el intervalo [a, b]

tiene distribucion uniforme discreta sobre el conjunto de los numeros en-teros que estan en el intervalo [a, b], cuando se tiene que P(X = x) = 1

b−a+1,

para todo x entero que esta en el intervalo [a, b]. Ademas,

E(X) =a + b

2y V(X) =

(b − a + 1)2 − 1

12.

4.2 La distribucion binomial

1. Experimento de Bernoulli.Aquel con solo dos resultados posibles: “exito” y “fracaso” y en donde un exitoocurre con probabilidad p, siendo 0 < p < 1.

2. Experimento binomial.Es un experimento de Bernoulli que se ejecuta n veces, de tal manera que lasdiferentes ejecuciones se efectuen independientemente unas de las otras.

3. Distribucion binomial.Si se realiza n veces un experimento de Bernoulli con probabilidad de exito p y si

Page 38: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.3 La distribucion de Poisson 37

X denota al numero total de exitos obtenidos, entonces, la probabilidad de que seobtengan k exitos es

P(X = k) =(nk

)pk (1 − p)n−k, k = 0, 1, 2, . . . , n.

La correspondiente distribucion de X se conoce con el nombre de distribucion

binomial con parametros n y p. Ademas, E(X) = np y V(X) = np(1 − p).

Fig. 4.1: Distribucion binomial para varios n pero fijo np = 3.

Ejemplo 4.2.1 Una moneda no falsa es lanzada 10 veces. Consideraremos el evento“cara” como un exito y “sello” como un fracaso. Es claro que p = 0, 5, n = 10 ylas condiciones basicas que caracterizan a la distribucion binomial se satisfacen. Porconsiguiente,

(a) La probabilidad de tener exito exactamente 7 veces es 0,1172.

(b) La probabilidad de tener a lo mas 7 exitos es 0,945.

(c) La probabilidad de tener por lo menos 3 exitos es 0,945 y la probabilidad deningun exito es 9.766 ×10−4.

4.3 La distribucion de Poisson

1. Experimento y proceso de Poisson.

Consideremos las siguientes variables aleatorias:

(a) El numero de partıculas emitidas por cierta sustancia radioactiva en un de-terminado lapso de tiempo.

(b) El numero de llamadas que llegan a una central telefonica en cierto intervalode tiempo.

Page 39: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.3 La distribucion de Poisson 38

(c) El numero de ordenes de devolucion de piezas que recibe una empresa enuna semana.

(d) El numero de veces que falla una pieza de un equipo durante un perıodo detres meses.

(e) El numero de huelgas anuales en un empresa.

Cada una de estas variables aleatorias esta asociada a unos procesos llamadosprocesos de Poisson.

2. Distribucion de Poisson.Consideremos un proceso de Poisson con parametro λ > 0 (es decir, λ es el numeropromedio de ocurrencias por unidad de tiempo) y sea X el “numero de eventosque ocurren en un intervalo de tiempo [0, t]”. Entonces, la probabilidad de queocurran k eventos en el intervalo [0, t] esta dada por

P(X = k) =1

k!e−λ λk, k = 0, 1, 2, 3, . . . .

siendo e la base del logaritmo natural. La correspondiente distribucion de X seconoce con el nombre de distribucion de Poisson con parametro λ. E(X) =

V(X) = λ.

Fig. 4.2: Distribuciones de Poisson para varios valores del parametro λ.

Ejemplo 4.3.1 Los sabados por la manana, los clientes entran en una pequena tiendade un centro comercial suburbano a una tasa esperada de 0,50 por minuto. Halle laprobabilidad de que el numero de clientes que entran en un intervalo especıfico de 10minutos es (a) 3, (b) a lo mas 3.SOLUCION:Las hipotesis del proceso de Poisson parecen ser razonables en este contexto. Damospor sentado que los clientes no llegan en grupos (o podemos contar al grupo enterocomo un solo cliente) y que la entrada de un cliente no aumenta ni disminuye la

Page 40: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.4 La distribucion hipergeometrica 39

probabilidad de que llegue otro. Para obtener λ, observamos que auna tasa media de0,50 por minuto durante un periodo de 10 minutos, podemos esperar λ = (0, 50)(10) =

5 entradas. Sea X la variable aleatoria que representa al numero de clientes que entranen un intervalo especıfico de 10 minutos. Por tanto, (a) P(X = 3) = 0, 1403 y (b)P(X ≤ 3) = 0, 2650.

Ejemplo 4.3.2 La distribucion de Poisson ha resultado ser muy util en problemasde lıneas de espera o colas. Los clientes llegan a una maquina fotocopiadora a unatasa media de 2 cada 5 minutos. En la practica, se pueden representar los procesosde llegada de esta clase mediante una distribucion de Poisson. Asumiendo que este esel caso,

(a) La probabilidad de que no haya llegadas en un perıodo de cinco minutos es 0,135.

(b) La probabilidad de que haya 1 llegada es 0,271.

(c) La probabilidad de que haya estrictamente mas de dos llegadas es 0,323.

3. Teorema de aproximacion de la binomial a la Poisson.Sea X una variable aleatoria binomial con parametros n y p. Si n es grande(n ≥ 100), p pequena (p ≤ 0, 01) y np tiene un tamano moderado (np ≤ 20),entonces, la distribucion binomial con parametros n y p puede aproximarse bien porla distribucion de Poisson con parametro λ = np. Es decir, bajo estas condicionesse cumple que

b(k; n; p) ≈ p(k; np), k = 0, 1, 2, 3, . . .

o, que es equivalente,

B(k; n; p) ≈ P(k; np), k = 0, 1, 2, 3, . . . .

Ejemplo 4.3.3 Una cierta companıa electronica produce 15.000 unidades de un tipoespecial de tubo al vacıo. Se ha observado que, en promedio, 3 tubos de 300 sondefectuosos. La companıa empaca los tubos en cajas de 600. ¿Cual es la probabilidadde que en una caja de 600 tubos hayan (a) 5 tubos defectuosos, (b) por lo menos 3defectuosos y (c) a lo mas 1 defectuoso?SOLUCION:Sea X la variable aleatoria que representa al numero de tubos defectuosos. Entonces,X es una variable binomial con parametros n = 600 y p = 0, 01. Aplicando el teoremade aproximacion, tenemos (a) P(X = 5)0, 161, (b) P(X ≥ 3) = 0, 938 y (c) P(X ≤ 1) =

0, 017.

4.4 La distribucion hipergeometrica

1. Experimento hipergeometrico.

En general, un experimento hipergeometrico con parametros n, M y N

esta basado en las siguientes suposiciones (vease la figura 4.3):

(H1) La poblacion o conjunto donde deba hacerse el muestreo es una poblacionfinita con N elementos.

Page 41: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.4 La distribucion hipergeometrica 40

(H2) Cada elemento de la poblacion puede ser caracterizado como un exito o unfracaso.

(H3) Hay M exitos en la poblacion.

(H4) Se elige una muestra sin reemplazo de n individuos, de tal forma que seaigualmente probable seleccionar cada subconjunto de tamano n.

Fig. 4.3: Esquema grafico de un experimento hipergeometrico

2. Distribucion hipergeometrica.Sea X el numero de exitos obtenidos en una muestra escogida al azar al realizar unexperimento hipergeometrico con parametros n, M y N. Entonces, la probabilidadde elegir de manera exacta k exitos en n intentos esta dada por

P(X = k) =

(Mk

) (N−Mn−k

)(Nn

) , donde k = 0, 1, 2, . . . , n y n ≤ N. (4.1)

La correspondiente distribucion de X se conoce con el nombre de distribucion

hipergeometrica con parametros n, M y N.

E(X) = n · M

Ny V(X) =

(N − n

N − 1

)· n · M

N·(

1 −M

N

).

Las distribuciones binomial e hipergeometrica coinciden cuando nN

≤ 0, 05.

Ejemplo 4.4.1 Una cantidad de 8 componentes electricas estan sujetas a un controlde calidad. Fue encontrado que 3 de las componentes no estaban defectuosas y lascomponentes que quedaban sı lo estaban. Si una muestra aleatoria de 3 componentesson escogidas de este lote, ¿cual es la probabilidad de que (a) exactamente 2 de ellasesten defectuosas?, (b) a lo mas 1 de ellas este defectuosa?SOLUCION:Sea X la variable aleatoria que representa al numero de componentes defectuosas.Aplicando la distribucion hipergeometrica con parametros n = 3, N = 8 y M = 3,tenemos que (a) P(X = 2) = 0, 26786 y (b) P(X ≤ 1) = 0, 714286.

Ejemplo 4.4.2 Una companıa recibe un pedido de 20 artıculos. Dado que la in-speccion de cada artıculo es cara, se sigue la polıtica de analizar una muestra de 6artıculos de cada envıo (seleccionada sin reemplazo y sin orden), aceptando la remesasi no hay mas de un artıculo defectuoso en la muestra. Entonces, la probabilidad deque sea aceptado un pedido con cinco artıculos defectuosos es de 0,516.

Page 42: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.5 Las distribuciones binomial negativa y geometrica 41

4.5 Las distribuciones binomial negativa y geometrica

1. Experimento binomial negativo.Un experimento binomial negativo con parametros r y p esta caracterizadopor las siguientes condiciones:

(BN1) El experimento consta de una serie de experimentos de Bernoulli y que sonindependientes entre sı.

(BN2) La probabilidad de exito p de cada experimento de Bernoulli es siempre lamisma.

(BN3) El experimento continua hasta que un total de r exitos se haya observado,siendo r un entero no negativo dado.

2. Distribucion binomial negativa.Sea X el numero de fracasos que preceden al r-esimo exito en un experimentobinomial negativo con parametros r y p. Entonces, la probabilidad de que hayank fracasos antes del r-esimo exito esta dada por

P(X = k) =

(k + r − 1

r − 1

)pr (1 − p)k, k = 0, 1, 2, . . . .

La correspondiente distribucion de X se conoce con el nombre de distribucion

binomial negativa con parametros r y p. Ademas,

E(X) =r(1 − p)

py V(X) =

r(1 − p)

p2.

Ejemplo 4.5.1 Una pareja desea tener exactamente dos ninas en su familia. Tendranhijos (ninos y ninas) hasta que se satisfaga esta condicion. Suponga que la probabili-dad de que el hijo que nazca varon es igual a 0,5 y que X es la variable aleatoria querepresenta a “numero de varones que nacen antes de que nazca la segunda hembra”.Entonces,

(a) La probabilidad de que la familia tenga k hijos varones es P(X = k) = (k +

1) (0, 5)k+2.

(b) La probabilidad de que la familia tenga a lo mas 4 hijos es P(X ≤ 2) = 0, 688.

(c) Se esperarıa esta familia tenga E(X) = 2 varones.

(d) Se esperarıa que esta familia tenga E(X + 2) = 4 hijos.

3. Distribucion geometrica.Caso especial de la distribucion binomial negativa con parametros r = 1 y p.

Sea X el numero de fracasos que preceden al primer exito en un experimentobinomial negativo con parametros 1 y p. Entonces, la probabilidad de que haya k

fracasos antes del primer exito esta dada por

P(X = k) = bn(k; 1, p) = p (1 − p)k, k = 0, 1, 2, . . . .

La correspondiente distribucion de X se conoce con el nombre de distribucion

geometrica con parametros p. Ademas, E(X) = 1−pp

y V(X) = 1−p

p2 .

Page 43: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.6 La distribucion uniforme (continua) 42

4.6 La distribucion uniforme (continua)

1. Definicion.Una variable aleatoria continua X tiene distribucion uniforme con los parametrosa y b con a < b si posee la densidad

f(x) =

1

b−a, si a ≤ x ≤ b,

0, de otro modo.

La media y la varianza de X vienen dadas, respectivamente, por

E(X) =a + b

2, V(X) =

(a − b)2

12.

4.7 La distribucion normal

1. Densidad con parametros µ ∈ R y σ2 > 0.Esta dada por

ϕ(x) =1√

2πσ2e

−(x−µ)2

2σ2 , para todo x ∈ R.

La funcion de distribucion acumulada normal la simbolizaremos por Φ.

2. Propiedades de la distribucion normal.

(a) Si X es normal con µ y σ2, entonces, E(X) = µ y V(X) = σ2.

(b) Hay toda una familia de distribuciones normales. Cada distribucion normalespecıfica se distingue por µ y σ (comparese con la figura 4.4).

(c) En la figura 4.4 podemos observar que:

i. La densidad normal es creciente para x < µ y decreciente para x > µ.Es decir, el punto mas alto de la densidad normal se obtiene cuandox = µ (vease la figura 4.4a,b).

ii. La densidad normal es simetrica con respecto a µ.

iii. Las colas, es decir, los extremos o los lados de la densidad normal seprolongan al infinito en ambas direcciones y nunca tocan el eje horizontal(vease la figura 4.4a,b).

iv. La desviacion estandar σ determina el ancho de la curva.

(d) La media, la mediana y la moda son todas iguales (vease la figura 4.4a).

(e) En la figura 4.4c) ilustramos la grafica de la distribucion acumulada normalpara σ1 < σ2.

3. La distribucion normal estandar.Aquella con esperanza 0 y varianza 1.

4. Propiedades de la distribucion normal estandar.

Page 44: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.7 La distribucion normal 43

(a) ϕ con σ = 1 y µ = −3, 0 y 3. (b) ϕ con µ = 0 y σ = 0, 3, 1 y 3.

(c) Φ con σ1 < σ2 .

Fig. 4.4: Graficas de ϕ y Φ para diferentes valores de los parametros µ y σ.

• Simetrica con respecto a 0.

• De la figura 4.5: El area de la region I es igual al area de la region II.

5. Conversion a la distribucion normal estandar.Sea X una variable aleatoria que tiene distribucion normal con parametros µ y σ2.Entonces,

(a) La variable Z = Z−µσ

tiene distribucion normal estandar.

(b) Para todo a real, se cumple que P(X ≤ a) = P(Z ≤ a−µ

σ

).

Ejemplo 4.7.1 Una companıa fabrica focos con vida media de 500 horas y desviacionestandar de 100. Si se supone que los tiempos de vida util de los focos se distribuyennormalmente, esto es que los tiempos de vida forman una distribucion normal, en-tonces, la probabilidad de que cierta cantidad de focos duren entre 650 y 780 horases aproximadamente 0,0642.

6. Teorema de aproximacion de la binomial a la normal.Consideremos un experimento binomial con parametros n y p. Entonces, si (a)n ≥ 30 o (b) np ≥ 5 y n(1 − p) ≥ 5, entonces, la distribucion binomial se puede

Page 45: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.7 La distribucion normal 44

Fig. 4.5: Las areas de las regiones I y II son iguales en la distibucion normal estandar

aproximar a la distribucion normal con µ = np y σ2 = np(1 − p). Si X es unavariable aleatoria que tiene distribucion binomial con parametros n y p, entonces,

P(X ≤ k) = B(k; n; p) ≈ Φ

(k + 0, 5 − np√

np(1 − p)

).

Ejemplo 4.7.2 Un fabricante sabe por experiencia que, de 17.000 productos, el 4%

es rechazado por defectos. Si un nuevo lote de 800 unidades se van a inspeccionar,entonces, la probabilidad aproximada de que menos de 35 unidades sean rechazadases aproximadamente 0,6736.

7. Las medidas de curtosis y la distribucion normal.Con la curtosis se estudia la deformacion, en sentido vertical, respecto a la normal,de una distribucion (vease la figura 4.6).

(a) Platicurtica. (b) Mesocurtica. (c) Liptocurtica.

Fig. 4.6: Diversos tipos de curvas clasificadas de acuerdo a su apuntamiento.

8. Medidas de curtosis.Sea X una variable aleatoria continua o discreta. Entonces, el coeficiente de

curtosis de X se define como la diferencia de la division de la cuarta potenciade la esperanza de la variable X − E(X) y el cuadrado de la varianza de X y 3, esdecir,

κ =E([X − E(X)]4

)

[V(X)]2− 3.

Page 46: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.8 Las distribuciones gamma y exponencial 45

De igual manera, el coeficiente de curtosis de un conjunto de datos x1, . . .,xn con frecuencias f1, . . . , fn se define como la diferencia de la division entre lamedia aritmetica de los datos (x1−x)4, . . ., (xn−x)4 y el cuadrado de la varianzade los datos originales. Es decir,

κ =

[f1(x1 − x)4 + · · · + fn(xn − x)4

]/N

(Varianza de los datos x1, . . ., xn)2− 3,

siendo N := f1 + · · · + fn. El coeficiente de curtosis estandarizado,simbolizado por κs se define como el cociente entre el coeficiente de curtosis κ yla raiz cuadrada de 6/N. Es decir,

κs =κ√6/N

.

Una distribucion es mesocurtica (apuntamiento igual al de la normal ) cuando κ = 0; es lep-

tocurtica (apuntamiento mayor que el de la normal) si κ > 0 y es platicurtica (apuntamiento

menor que el de la normal) si κ < 0.

4.8 Las distribuciones gamma y exponencial

1. La funcion gamma y sus propiedades.La funcion gamma Γ : (0,∞) −→ R se define como

Γ(α) :=

∫∞

0

e−t tα−1 dt, para todo α > 0.

2. Propiedades de la funcion gamma.

(a) Para cualquier α > 0, se cumple que Γ(α + 1) = αΓ(α).

(b) Para cualquier numero natural n, tenemos que Γ(n) = (n − 1)!.

(c) Γ(

12

)=

√π.

3. La distribucion gamma.Una variable aleatoria X tiene distribucion gamma con parametros α > 0 yβ > 0 si su funcion de densidad esta dada por

f(x; α; β) =:

1

βα Γ(α)xα−1 e−x/β para x > 0

0, de otra manera.

Cuando β = 1, la distribucion se conoce con el nombre de distribucion gamma

estandar. Ademas, E(X) = αβ y V(X) = αβ2.

4. La distribucion gamma incompleta.Sea X una variable aleatoria que tiene distribucion gamma estandar con parametroα. La siguiente funcion F recibe el nombre de funcion gamma incompleta

F(t; α) =

t∫

0

1

Γ(α)e−x xα−1 dx, x > 0,

Page 47: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.8 Las distribuciones gamma y exponencial 46

(a) α = 1, 2, 3 y β = 1.

(b) α = 2 y β = 2, 1, 12.

Fig. 4.7: Densidad f de la distribucion gamma para diferentes valores de α y β.

Hay tablas muy completas para la funcion gamma incompleta. En el apendice presentamos

una pequena tabulacion de esta funcion para α = 1, 2, . . . , 10 y x = 1, 2, . . . , 15 (vease la

tabla D.4 del apendice).

5. Calculo de probabilidades a partir de la gamma.

Ejemplo 4.8.1 Suponga que el tiempo de reaccion X a cierto estımulo en un indi-viduo seleccionado al azar tiene distribucion gamma estandar con parametro α = 2.Sea F la funcion gamma incompleta de X. Teniendo en cuenta la tabla D.4 del apendice,entonces, la probabilidad de el tiempo de reaccion se encuentre entre 3 y 5 (ambosinclusive) es P(3 ≤ X ≤ 5) = F(5; 2) − F(3; 2) = 0, 159.

La funcion gamma incompleta tambien la podemos utilizar para calcular probabil-idades en las que aparezcan distribuciones gamma que no sean estandar.

Page 48: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.8 Las distribuciones gamma y exponencial 47

Teorema 4.8.2 Sea X una variable aleatoria que tiene distribucion gamma

con parametros α y β. Si F es la funcion gamma incompleta de una variable

aleatoria gamma estandar con parametro α, entonces, para todo t > 0, se

cumple que

P(X ≤ t) = F

(t

β; α

).

Ejemplo 4.8.3 Suponga que el tiempo X de supervivencia en semanas de un ratonmacho seleccionado al azar y expuesto a 240 rads de radiacion gamma tiene unadistribucion gamma con α = 8 y β = 15. Determine la probabilidad de que un ratonsobreviva (a) entre 60 y 120 semanas y (b) por lo menos 30 semanas.SOLUCION:Sea F la funcion gamma incompleta de una variable aleatoria gamma estandar conparametro α = 8. Entonces, la probabilidad de que un raton sobreviva entre 60 y 120semanas es

P(60 ≤ X ≤ 120) = F

(120

15; 8

)− F

(60

15; 8

)= 0, 496.

6. La densidad exponencial con parametro λ > 0.Esta dada por

f(x; λ) =

0, para x < 0,

λe−λx, para x ≥ 0.

La distribucion exponencial es un caso especial de la distribucion gamma en la queα = 1 y β se ha reemplazado por 1/λ. En este caso, E(X) = 1

λy V(X) = 1

λ2 .

Fig. 4.8: Distribucion exponencial para β = 2, 1, 12, siendo β = 1/λ.

Ejemplo 4.8.4 El tiempo de atencion al cliente en un servicio de informacion deuna biblioteca sigue una distribucion exponecial, con un tiempo de servicio medio de5 minutos. Entonces, la probabilidad de que una consulta de un cliente dure mas de10 minutos es 0,135335.

Page 49: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

4.9 Resumen de las distribuciones especiales 48

4.9 Resumen de las distribuciones especiales

En las tablas 4.1 y 4.2 (al final de este capıtulo) presentamos un resumen de las dis-tribuciones continuas y discretas, respectivamente, mas importantes.

NOMBRE FUNCION PARAMETROS E(X) V(X)

Uniforme f(x) = 1b−a

, a < b a+b2

(a−b)2

12

a < x < b

Normal f(x) = 1√2πσ2

, e−

(x−µ)2

2σ2 µ ∈ R, µ σ2

x ∈ R σ2 > 0

Normal f(x) = 1√2π

e−x2

2 , 0 1

estandar x ∈ R

Gamma f(x) = 1βα Γ(α)

xα−1 e−x/β, α > 0, αβ αβ2

x > 0 β > 0

Exponencial f(x) = λe−λx, λ > 0 1λ

1λ2

x > 0

t de Student f(x) = an

(1 + x2

n

)−(n+1)/2

, n ∈ N 0, nn−2

,

n ≥ 2 n ≥ 3

an :=Γ(n+1

2 )Γ(n

2 )√

nπ, x ∈ R

Chi-cuadrada 1an

xn2

−1e−x/2, n > 0 n 2n

an := 2n/2Γ(

n2

), x > 0

F de Fisher f(x) = an xm2

−1

(n+mx)(m+n)/2 m, n ∈ Nn

n−2, 2n2(m+n−2)

m(n−2)2(n−4),

n ≥ 3 n ≥ 5

an :=Γ(m+n

2 )mm/2nn/2

Γ(m2 )Γ(n

2 ), x > 0

Tabla 4.1: Resumen de distribuciones continuas

Page 50: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 4. Ejercicios 49

Ejercicios

1. Con el proposito de establecer el grado de aceptacion de su producto, una empresa selec-ciona una muestra de 1.000 consumidores de una poblacion de 1.000.000, de forma tal quecada uno de los elementos de la poblacion tiene la misma probabilidad de ser seleccionado.A cada consumidor seleccionado se le pregunta si prefiere el producto producido por estaempresa o no. ¿Es este un experimento binomial? Explique su respuesta.

2. Un fabricante de celulares, desea controlar la calidad de su producto y rechazar cualquierlote en el que la proporcion de celulares defectuosos sea demasiado alta. Con este fin, decada lote grande (digamos, 20.000 celulares) selecciona y prueba 25. Si por lo menos 3de estos estan defectuosos, todo el lote sera rechazado.

(a) ¿Cual es la probabilidad de que un lote sea rechazado si 5% de los celulares estandefectuosos?

(b) ¿Cual es la probabilidad de que un lote sea rechazado si 10% de los celulares estandefectuosos?

(c) ¿Cual es la probabilidad de que un lote sea rechazado si 30% de los celulares estandefectuosos?

3. Una empresa se dedica a la instalacion de nuevos paquetes computacionales. Se hacomprobado que en el 10% de 250 instalaciones es necesario volver para realizar algu-nas modificaciones. En una semana determinada se realizaron 10 instalaciones. Asumirindependencia en los resultados de esas instalaciones.

(a) ¿Cual es la probabilidad de que sea necesario volver en cinco casos?

(b) ¿Cual es la probabilidad de que no sea necesario volver en ninguno los casos?

(c) ¿Cual es la probabilidad de que sea necesario volver en mas de un caso?

4. En un lote de 1.000 bombillas fabricadas por una companıa, 10 son defectuosas. Utilicela aproximacion de la distribucion binomial por la de Poisson para calcular la probabilidadde que en una muestra de 20 bombillas, (a) 2, (b) 0, (c) por lo menos 3 sean defectuosas.

5. En cierto estudio se reporta que de cada 100 personas, una fuma. Consideremos unamuestra aleatoria de 2.000 personas.

(a) ¿Cual es la distribucion aproximada del numero de quienes fuman?

(b) Utiliza la aproximacion de la parte (a) para calcular la probabilidad aproximada deque entre 8 y 20 (ambos inclusive) personas fumen.

(c) Utiliza nuevamente la aproximacion de la parte (a) para calcular la probabilidad apro-ximada de que estrictamente entre 12 y 30 personas fumen.

6. Suponga que los buses llegan a cierto terminal de transporte, segun un proceso de Poisson,con tasa α = 8 buses por hora, de modo que el numero de llegadas por un periodo de t

horas es una variable aleatoria de Poisson con parametro λ = 8t.

(a) ¿Cual es la probabilidad de que exactamente 5 buses pequenos lleguen durante unperıodo de una hora? ¿Por lo menos 5? ¿A lo mas 10?

(b) ¿Cuales son el valor esperado y la desviacion estandar del numero de buses que llegandurante un perıodo de 90 minutos?

(c) ¿Cual es la probabilidad de que por lo menos 20 buses lleguen durante un perıodo de2 horas y media? ¿De que a lo sumo 10 lleguen durante este perıodo?

Page 51: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 4. Ejercicios 50

7. Un fabricante de computadores se preocupa por el mal funcionamiento de cierto programaestadıstico en un modelo en particular. El mal funcionamiento puede producir en rarasocasiones un bloqueo en el sistema operativo. Suponga que la distribucion del numero decomputadores por ano que tienen un mal funcionamiento del paquete estadıstico es la dePoisson con λ = 5.

(a) ¿Cual es la probabilidad de que a lo mas dos computadores por ano tenga un bloqueoen el sistema operativo?

(b) ¿Cual es la probabilidad de que mas de un computador por ano tenga un bloqueo enel sistema operativo?

8. Una empresa recibe un pedido de 1.000 artıculos. Se analiza una muestra aleatoria de15 artıculos y se acepta el pedido si menos de tres resultan defectuosos. ¿Cual es laprobabilidad de aceptar un envıo que contenga un 5% de artıculos defectuosos?

9. Cada uno de los 13 computadores de cierta marca ha sido devuelto a un proveedor de-bido al mal funcionamiento de ciertos programas bajo un determinado sistema operativo.Supongamos que 7 de estos 13 tienen problemas con la memoria RAM y los otros 6 tienenproblemas con los ejecutables EXE. Si se examinan al azar y sin reemplazo 6 de estoscomputadores, ¿cual es la probabilidad de que (a) exactamente 3, (b) a lo mas 2, (c)estrictamente entre 2 y 5 computadores tengan problemas con la memoria RAM?

10. Una determinada empresa esta interesada en evaluar su procedimiento de inspeccion actualen embarques de 50 artıculos identicos. El procedimiento es tomar una muestra de cincoy pasar el embarque si no se encuentra mas de dos defectuosos. ¿Que proporcion del 20%de embarques defectuosos se aceptara?

11. El 10% de los motores armados en una fabrica de montaje estan defectuosos. Si seseleccionan en forma aleatoria uno por uno y se prueba, calcule la probabilidad de localizarel tercer motor sin defecto (a) en el quinto ensayo,(b) en el quinto ensayo o antes.

12. De acuerdo con un estudio geologico, en un pozo de exploracion petrolera hay 0,2 de pro-babilidad de encontrar petroleo. Calcule la probabilidad de localizar petroleo por primeravez en el tercer pozo que se perfore.

13. Se sabe que en cierto proceso de fabricacion, en promedio, uno de cada 100 artıculos estadefectuoso. ¿Cual es la probabilidad de que el sexto artıculo que se inspecciona sea elprimer defectuoso que se encuentra.

14. Suponga que el tiempo de reaccion X (en minutos) a cierto medicamento tiene unadistribucion uniforme continua en el intervalo [−5, 5]. Calcule la probabilidad de que latemperatura de reaccion

(a) sea estrictamente menor que 0

(b) se encuentre entre −2, 5 y 2, 5.

(c) se encuentre entre k y k + 4 si k satisface −5 < k < k + 4 < 5.

15. El tiempo X (minutos) para que un profesor prepare un cuestionario tiene una distribucionuniforme continua en el intervalo [20, 40].

(a) Escriba la funcion de densidad, la funcion de distribucion acumulada y trace susrespectivas graficas.

(b) ¿Cual es la probabilidad de que el tiempo de preparacion exceda a 35 minutos?

(c) ¿Cual es la probabilidad de que el tiempo de preparacion se encuentre a 2 minutosdel tiempo medio?

Page 52: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 4. Ejercicios 51

(d) Para cualquier k tal que 25 < k < k + 2 < 35, ¿cual es la probabilidad de que eltiempo de preparacion este entre k y k + 2 minutos?

16. Se regula una maquina despachadora de cafe para que sirva un promedio de 200 mililitrospor vaso. Si la cantidad de bebida se distribuye normalmente con una desviacion estandarde 15 mililitros,

(a) ¿que fraccion de los vasos contendran mas de 191 mililitros?

(b) ¿Cual es la probabilidad de que un vaso contenga entre 209 y 224 mililitros?

(c) ¿Cuantos vasos probablemente se derramaran si se utilizan vasos de 230 mililitrospara las siguientes 1.000 bebidas?

(d) ¿Por debajo de que valor obtendremos un 25% de las bebidas mas pequenas?

17. La vida promedio de cierta maquinaria electrica es 10 anos con una desviacion estandarde dos anos. El fabricante reemplaza gratis todas las maquinarias que fallen dentro deltiempo de garantıa. Si esta dispuesto a reemplazar solo 3% de las maquinarias que fallany si la duracion de una maquinaria sigue una distribucion normal, ¿de que duracion debeser la garantıa que ofrezca?

18. Los coeficientes de inteligencia de 600 aspirantes a cierta beca escolar en una universidadextranjera se distribuyen aproximadamente normal con media de 115 y desviacion estandarde 12. Si la universidad requiere un coeficiente de inteligencia de al menos 95, ¿cuantosde estos aspirantes seran rechazados sobre esta base sin importar sus otras calificaciones?

19. Suponga que 90% de todas los trabajadores que hay en una determinada empresa nofuman. Considere una muestra aleatoria de 200 trabajadores y represente con X a lacantidad de trabajadores que fuman. ¿Cual es la probabilidad aproximada de que X (a)sea a lo sumo 30? (b) sea mas de 30? (c) este entre 15 (inclusive) y 25 (no inclusive)?

20. Suponga que solo 80% de todos las personas mayores de 18 anos que viven en ciertopueblo cerca del mar saben nadar. Se selecciona al azar una muestra de 200 personasmayores de 18 anos del pueblo. ¿Cual es la probabilidad de que

(a) entre 50 y 100 (ambos inclusive) de las personas mayores de 18 anos del pueblo nosepan nadar?

(b) menos de 140 de las personas mayores de 18 anos del pueblo sepan nadar? ¿Y masde 150?

21. Suponga que el tiempo (en horas) tomado por una cocinea para preparar una deliciosacomida es una variable aleatoria X que tiene una distribucion gamma con parametrosα = 2 y β = 1/2. ¿Cual es la probabilidad de que tarde (a) a lo sumo 1 hora, (b) por lomenos 2 horas,(c) entre 0,5 y 1,5 horas para preparar la comida?

22. Un reconocido cientıfico ha determinado que el tiempo de supervivencia (en semanas)de un animal cuando se le somete a cierta exposicion de radiacion gamma tiene unadistribucion gamma con α = 5 y β = 10.

(a) ¿Cual es el tiempo medio de supervivencia de un animal seleccionado al azar del tipoque se utilizo en el experimento?

(b) ¿Cual es la desviacion estandar del tiempo de supervivencia?

(c) ¿Cual es la probabilidad de que un animal sobreviva mas de 30 semanas?

23. El tiempo de respuesta de una computadora es una aplicacion importante de las distribu-ciones gamma y exponencial. Suponga que un estudio de cierto sistema de computadorasrevela que el tiempo de respuesta en segundos tiene una distribucion exponencial con unamedia de tres segundos. ¿Cual es la probabilidad de que el tiempo de respuesta (a) exceda5 segundos, (b) no exceda 10 segundos?

Page 53: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 4. Ejercicios 52

24. Suponga que la vida de cierto tipo de baterıa tiene una tasa de falla constante anunciadade 0,01 por hora y que tiene distribucion exponencial.

(a) ¿Cual es el tiempo medio de falla?

(b) ¿Cual es la probabilidad de que pasen 300 horas antes de que se observen dos fallas?

s 25. Utilizando la opcion Plot. . .Probability Distributions. . .Binomial de Statgraphics, realizar:

(a) Los ejemplos 3.5.4 y 3.5.6 de [11].

(b) Los ejercicios 37, 39 (partes b y c), 43 (partes a,b,c y d) y 51 de [11].

s 26. Utilizando la opcion Plot. . .Probability Distributions. . .Poisson de Statgraphics, realizarlos ejemplos 3.6.2, 3.6.3, 3.6.4, 3.6.5, 3.6.9 y 3.6.10 de [11].

s 27. Utilizando la opcion Plot. . .Probability Distributions. . .Poisson de Statgraphics, realizarlos ejercicios 53, 55, 57, 61 (incisos a y c) y 63 de [11].

s 28. Utilizando la opcion Plot. . .Probability Distributions. . .Hypergeometric de Statgraphics,realizar:

(a) Los ejemplos 3.7.1, 3.7.3, 3.7.4 y 3.7.5 de [11].

(b) Los ejercicios 65, 67, 69, 73 y 77 (inciso b) de [11].

s 29. Utilizando la opcion Plot. . .Probability Distributions. . .Negative Binomial de Statgraphics,realizar:

(a) El ejemplo 3.8.2 (incisos b y c) de [11].

(b) Los ejercicios 80 y 84 de [11].

s 30. Utilizando la opcion Plot. . .Probability Distributions. . .Geometric de Statgraphics, reali-zar:

(a) El ejemplo 3.8.6 (incisos a,b) de [11].

(b) Los ejercicios 81, 85, 87 y 89 de [11].

s 31. Utilizando la opcion Plot. . .Probability Distributions. . .Uniform de Statgraphics, realizar:

(a) Los ejemplos 4.3.2 y 4.3.3 de [11].

(b) Los ejercicios 24, 25 (inciso b), 26 y 28 (incisos a y b) de [11].

s 32. Utilizando la opcion Plot. . .Probability Distributions. . .Normal de Statgraphics, realizar:

(a) Los ejemplos 4.4.2, 4.4.4, 4.4.6 y 4.4.7 de [11].

(b) Los ejercicios 30 (incisos a, b, c y d), 32 (incisos b y c), 35, 36 y 41 (incisos a y b)de [11].

s 33. Utilizando la opcion Plot. . .Probability Distributions. . .Gamma de Statgraphics, realizar:

(a) Los ejemplos 4.5.8 y 4.5.12 de [11].

(b) Los ejercicios 50, 51, 53 y 55 (inciso c) de [11].

s 34. Utilizando la opcion Plot. . .Probability Distributions. . .Exponential de Statgraphics, re-alizar:

(a) Los ejemplos 4.5.15 y 4.5.16 de [11].

(b) Los ejercicios 57, 58, 59 (inciso b), 60, 61 y 63 (inciso b) de [11].

Page 54: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.4.

Ejercicios

53

NOMBRE FUNCION PARAMETROS E(X) V(X)

Uniforme f(xk) = 1n, x1 < x2 < · · · < xn

1n

n∑

k=1

xk1n

n∑

k=1

x2k−

k = 1, 2, . . . , n n ∈ N − 1n

(n∑

k=1

xk

)2

De dos f(x1) = p, x1 < x2 x1p + x2(1 − p) (x1 − x2)2p(1 − p)

puntos f(x2) = 1 − p 0 < p < 1

Bernoulli f(0) = p, p p p(1 − p)

f(1) = 1 − p

Binomial f(k) =(nk

)pk (1 − p)n−k 0 < p < 1 np np(1 − p)

k = 0, 1, 2, . . . , n n ∈ N

Poisson f(k) = 1k!

e−λ λk λ > 0 λ λ

k = 0, 1, 2, 3, . . .

Hiper-(M

k ) (N−Mn−k )

(Nn)

M ∈ N0, N ∈ N, n ∈ N n · MN

(N−nN−1

)· n · M

N·(1 − M

N

)

geometrica k ∈ N0, k ≤ n, k ≤ M n ≤ M ≤ N

Binomial f(k) =(k+r−1

r−1

)pr (1 − p)k r > 0, r(1−p)

pr(1−p)

p2

negativa k = 0, 1, 2, . . . 0 < p < 1

Geometrica f(k) = p (1 − p)k 0 < p < 1 1−pp

1−p

p2

k = 0, 1, 2, . . .

Tabla 4.2: Resumen de distribuciones dicretas

Page 55: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 5

Distribuciones conjuntas

5.1 Vectores aleatorios discretos

1. Vectores aleatorios.Vectores (es decir, tuplas ordenadas), digamos, de la forma (X1, X2, . . . , Xn) cuyas com-ponentes X1, X2, . . ., Xn son variables aleatorias. Pueden ser discretos, continuos omixtos.

2. Vectores aleatorios discretos.Si todas las componentes del vector son discretas.

3. Funcion de probabilidad conjunta f de (X, Y).

Una funcion f : R2 −→ [0, 1] tal que

f(xi, yk) := P(X = xi, Y = yk), para todo i, j = 1, 2, . . ..

Es claro que:

(a) f(xi , yk) ≥ 0 para todo valor xi de X y para todo valor yk de Y.

(b)∑

i

k

f(xi , yk) = 1.

4. Funcion de distribucion acumulada de X.Una funcion F : R

2 −→ [0, 1] definida por

F(x, y) = P(X ≤ x, Y ≤ y) =∑

xi con

xi≤x

yk con

yk≤y

f(xi, yk).

para todo x y y reales.

5. Funcion de probabilidad marginal.

(a) De la variable X:

fX(xi) := P(X = xi) =∑

k

f(xi, yk), para todo i = 1, 2, . . ..

Page 56: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

5.1 Vectores aleatorios discretos 55

(b) De la variable Y:

fY(yk) := P(Y = yk) =∑

i

f(xi, yk) para todo k = 1, 2, . . ..

6. Funcion de dist. acumulada marginal.

FX(t) := P(X ≤ t) :=∑

xi≤t

fX(xi), FY(t) := P(Y ≤ t) :=∑

yk≤t

fY(yk).

7. Funcion de probabilidad condicional de Y, dado X = x.

h(y/x) =f(x, y)

fX(x), para todo y real.

8. Independencia.X y Y independientes ⇐⇒ f(x, y) = fX(x) fY(y).

9. Covarianza de X y Y.Si X y Y tienen varianza finita, entonces,

Cov(X, Y) := E([X − E(X)][Y − E(Y)]

)= E(XY) − E(X)E(Y).

10. Coeficiente de correlacion de X y Y.Si X y Y tienen varianza finita y positiva, entonces,

Corr(X, Y) :=Cov(X, Y)√V(X)V(Y)

.

11. Propiedades.

(a) X, Y independientes ⇒ Cov(X, Y) = 0. (Recıproco no es cierto)

(b) X, Y independientes ⇒ Corr(X, Y) = 0. (Recıproco no es cierto)

(c) −1 ≤ Corr(X, Y) ≤ 1.

(d) Corr(X, Y) = 1 o −1 ⇐⇒ existen m, r reales con m 6= 0, tales que Y = mX + r.

12. Esperanza y varianza condicional de Y dado que X = x.

E(Y/X = x) =∑

y

yh(y/x), V(Y/X = x) =∑

y

(y − E(Y/X = x))2

h(y/x).

13. Propiedades de la esperanza y de la varianza condicional.

(a) E(Y) = E(E(Y/X)

).

(b) V(Y/X) = E([

Y − E(Y/X)]2)

= E(Y2/X) −[E(Y/X)

]2.

(c) E(V(Y/X)

)= E(Y2) − E

([E(Y/X)]2

).

(d) V(E(Y/X)

)= E

([E(Y/X)]2

)− [E(Y)]2.

(e) V(Y) = E(V(Y/X)

)− V

(E(Y/X)

).

Page 57: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

5.2 Vectores aleatorios continuos 56

5.2 Vectores aleatorios continuos

1. Vector aleatorio.Vectores (es decir, tuplas ordenadas), digamos, de la forma (X1, X2, . . . , Xn) cuyas com-ponentes X1, X2, . . ., Xn son variables aleatorias. Pueden ser discretos, continuos omixtos.

2. Vectores aleatorios continuos.Si todas las componentes del vector son continuas.

3. Funcion de densidad conjunta f de (X, Y).

Una funcion f : R2 −→ [0,∞) que cumple las dos condiciones:

(a) P(a ≤ X ≤ b, c ≤ Y ≤ d) =b∫

a

d∫

c

f(x, y)dxdy.

(b) El volumen bajo toda la superficie de f es 1, es decir,∞∫

−∞

∞∫

−∞f(x, y)dxdy = 1.

4. Funcion de distribucion acumulada de X.Una funcion F : R

2 −→ [0, 1] definida por

F(s, t) = P(X ≤ s, Y ≤ t) =

t∫

−∞

s∫

−∞

f(x, y)dxdy,

para todo s y t reales.

5. Funcion de densidad marginal.

(a) De la variable X:

fX(x) :=

∞∫

−∞

f(x, y)dy, para todo x real.

(b) De la variable Y:

fY(y) :=

∞∫

−∞

f(x, y)dx, para todo y real.

6. Funcion de dist. acumulada marginal.

FX(t) := P(X ≤ t) :=

t∫

−∞

fX(x)dx, FY(t) := P(Y ≤ t) =

t∫

−∞

fY(y)dy.

7. Funcion de probabilidad condicional de Y, dado X = x.

h(y/x) =f(x, y)

fX(x), para todo y real.

8. Independencia.Igual que en el caso discreto.

9. Covarianza de X y Y.Igual que en el caso discreto.

Page 58: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 5. Ejercicios 57

10. Coeficiente de correlacion de X y Y.Igual que en el caso discreto.

11. Propiedades.Igual que en el caso discreto.

12. Esperanza y varianza condicional de Y dado que X = x.

E(Y/X = x) =

∞∫

−∞

yh(y/x)dy, V(Y/X = x) =

∞∫

−∞

(y − E(Y/X = x)

)2h(y/x)dy.

13. Propiedades de la esperanza y de la varianza condicional.Las mismas que en el caso discreto.

Ejercicios

1. Un investigador sospecha que en cierto paıs, el numero diario de cigarrillos que fumanlos estudiantes durante la semana de examenes finales (variable X) puede depender delnumero de examenes que el estudiante debe realizar en el dıa (variable Y). La tabla deabajo muestra las probabilidades conjuntas estimadas en un estudio:

f(x, y) Y = 0 1 2 3X = 0 0,09 0,07 0,01 0,06

1 0,06 0,01 0,07 0,072 0,14 0,03 0,06 0,073 0, 04 0,04 0,04 0,14

(a) Halle la funcion de probabilidad marginal de X y la de Y.

(b) ¿Cual es la probabilidad que un estudiante seleccionado al azar fume por lo menos 2cigarrillos y tenga que hacer 3 examenes en un dıa?

2. Un agente inmobiliario esta interesado en averiguar cual es la relacion entre el numerode lıneas de un anuncio en prensa sobre un apartamento y el volumen de demanda deinformacion por parte de posibles inquilinos. Representemos el volumen de demandamediante la variable aleatoria X, que toma el valor 0 si despierta poco interes, 1 paraun interes moderado, y 2 si despierta un fuerte interes. Sea Y la variable aleatoria querepresenta al numero de lıneas del anuncio. El agente estima que la funcion de probabilidadconjunta es la que aparece en la tabla de abajo.

f(x, y) Y = 3 4 5X = 0 0,08 0,07 0,04

1 0,13 0,22 0,102 0,10 0,15 0,11

(a) Si F es la funcion acumulada conjunta de X y Y, halle F(1, 4) e interprete el resultado.

(b) Halle la funcion de probabilidad marginal de Y y, con ello, halle la probabilidad de queY = 5.

3. Una vinaterıa cuenta con instalaciones para atender a clientes que llegan en automovil ya quienes llegan caminando. En un dıa seleccionado aleatoriamente, sean X y Y, respec-tivamente, los perıodos de tiempo que se utilizan para cada caso. La funcion de densidadconjunta de X y Y es

f(x, y) =

23(x + 2y), si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,

0, de otro modo.

Page 59: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 5. Ejercicios 58

(a) Verifique si f satisface las propiedades de una funcion de densidad conjunta.

(b) Halle la funcion de densidad marginal de X y y la de Y.

4. Un centro de servicios trabaja con dos lıneas. En un dıa seleccionado al azar, sean X y Y

las respectivas proporciones de tiempo de que la primera y segunda lıneas esten en uso.Suponga que X y Y tienen funcion de densidad conjunta

f(x, y) =

32(x2 + y2), si 0 ≤ x ≤ 1 y 0 ≤ y ≤ 1.

0, de otro modo.

(a) Determine la probabilidad de que ninguna lınea este ocupada mas de la mitad deltiempo.

(b) Calcule la probabilidad de que la primera lınea este ocupada mas del 65% del tiempo.

5. Sean X y Y dos variables aleatorias continuas con funcion de densidad conjunta

f(x, y) =

k(6 − x − y), si 0 < x < 2 y 2 < y < 4,

0, de otro modo.

Halle el valor de k y encuentre P(1 < Y < 3/X = 2).

6. La tabla siguiente muestra, para los poseedores de entre una y tres tarjetas de credito, lasprobabilidades conjuntas del numero de tarjetas de que dispone (variable X) y el numerode compras a credito realizadas durante una semana (variable Y).

f(x, y) Y = 0 1 2 3 4Y = 1 0,03 0,07 0,04 0,06 0,10

2 0,08 0,03 0,09 0,07 0,083 0,13 0,02 0,07 0,08 0,05

(a) Para una persona elegida aleatoriamente de este grupo, ¿cual es la funcion de proba-bilidad del numero de compras semanales?

(b) Para una persona de este grupo que posea tres tarjetas, ¿cual es la funcion de pro-babilidad del numero de compras semanales?

(c) ¿Son estadısticamente independientes el numero de tarjetas disponibles y el numerode compras realizadas?

7. Sea X el tiempo de reaccion (en segundos) de un producto a cierto estimulante y Y

la temperatura, en grados celsius, a la que la reaccion comienza a suceder. Estas dosvariables aleatorias tienen la funcion de densidad conjunta

f(x, y) =

kxy, si 0 < x < 1 y 0 < y < 1.

0, de otro modo,

(a) Halle el valor de k.

(b) Encuentre la densidad marginal de X y la de Y.

(c) Encuentre la funcion de distribucion acumulada de Y.

(d) Encuentre la probabilidad de que la pieza 2 tenga una duracion de vida entre 0,5 y 3anos.

(e) ¿Son X y Y son independientes?

Page 60: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 5. Ejercicios 59

8. Marıa y Josefa, dos distinguidas profesoras entregan sus examenes finales a la secretariade matematicas para que sean pasados al computador. Sea X = numero de errores en laescritura del examen de la profesora Marıa y Y el numero de errores en el de la profesoraJosefa. Suponga que X y Y son independientes y que cada una tiene distribucion dePoisson con parametro 2.

(a) ¿Cual es la funcion de probabilidad conjunta de X y Y?

(b) ¿Cual es la probabilidad de que a lo sumo se cometa en total un error en ambosexamenes?

9. Una persona tiene dos baterıas para un reloj en particular. Sean X y Y las variablesaleatorias que representan a las duracion de la primera y segunda baterıas, respectivamente(ambas en horas). Ademas, X y Y son independientes y cada una tiene una distribucionexponencial con parametro 1.

(a) ¿Cual es la funcion de probabilidad conjunta de X y Y?

(b) ¿Cual es la probabilidad de que cada baterıa dure a lo sumo 20 horas?

(c) ¿Cual es la probabilidad que la duracion total de las dos baterıas sea a lo sumo 30horas?

(d) ¿Cual es la probabilidad que la duracion total de las dos baterıas este entre 20 y 30horas?

10. Sean X y Y variables aleatorias que denotan las longitudes de dos dimensiones de unapieza maquinada, respectivamente. Si X y Y son independientes y, ademas, la distribucionde X es normal con media 10,5 milımetros y varianza 0,0025 milımetros cuadrados, yla distribucion de Y es normal con media 3,2 milımetros y varianza 0,0036 milımetroscuadrados, determine la probabilidad de que (a) 10, 4 < X < 10, 6, (b) 3, 15 < Y < 3, 25.

11. Sea X el numero de veces en que cierta secretaria se levanta de su puesto para ir al bano:1, 2 o 3 veces en una hora dada. Sea Y el numero de veces en que el jefe le llama laatencion a la secretaria. Supongamos que la funcion de probabilidad conjunta de X y Y

esta dada por

f(x, y) X = 1 2 3Y=1 0,01 0,09 0,05

2 0,10 0,06 0,183 0,07 0,10 0,34

(a) Encuentre la funcion de probabilidad marginal de X y la de Y.

(b) ¿Son X y Y independientes?

(c) Encuentre P(Y = 2/X = 3) e interprete su valor.

(d) Encuentre la covarianza de las variables X y Y.

12. Una profesora ha realizado un examen parcial que tiene dos partes. Para un estudianteseleccionado al azar, sea X el numero de puntos ganados en la primera parte, Y el numerode puntos ganados en la segunda parte y suponga que la funcion de probabilidad conjuntade X y Y esta dada por

f(x, y) Y = 0 1,0 2,0 2,5X = 0 0,06 0,02 0,04 0,02

1,5 0,15 0,10 0,01 0,202,5 0,14 0,01 0,10 0,15

Page 61: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 5. Ejercicios 60

(a) Si la nota final del examen parcial es el numero total de puntos ganado en las dospartes, ¿cual es la nota final esperada por el estudiante?

(b) Si se registra el maximo de las dos calificaciones, ¿cual es la nota final esperada porel estudiante?

(c) Calcule la covarianza y el coeficiente de correlacion para X y Y.

13. De una caja que contiene 3 focos rojos y 4 focos amarillos se selecciona una muestraaleatoria de 2 focos sin reemplazo y al mismo tiempo. Si X es el numero de focos rojos yY el de focos amarillos en la muestra, encuentre:

(a) La funcion de distribucion conjunta de X y Y.

(b) P(X + Y ≤ 1) e interprete este valor.

(c) La funcion de probabilidad condicional de Y, sabiendo que X = 2.

(d) La probabilidad de que Y = 0, sabiendo que X = 2.

(e) Encuentre la covarianza de las variables X y Y.

14. Si X y Y son variables aleatorias independientes con densidades marginales

fX(x) =

8

3x3 , si 1 < x < 2.

0, de otro modo,y fY(y) =

2y3

, si 1 < y < 2.

0, de otro modo,

respectivamente, encuentre el coeficiente de correlacion de X.

s 15. Utilizando la opcion Plot. . .Probability Distributions de Statgraphics, realizar los ejercicios8 (inciso b), 9 (incisos b, c y d) y 10.

s 16. Suponga que X1, X2 y X3 son variables aleatorias representan el espesor (en milesimas demilımetro) de un sustrato, una capa activa y una capa de recubrimiento de un productoquımico. Suponga que X1, X2 y X3 son independientes y que tienen una distribucionnormal con medias µ1 = 10.000, µ2 = 1.000, µ3 = 80 y desviaciones estandar σ1 = 250,σ2 = 20 y σ3 = 4, respectivamente. Las especificaciones para el espesor del sustrato, lacapa activa y la capa de recubrimiento deben estar son 9.200 < x1 < 10.800, 950 < x2 <

1.050 y 75 < x3 < 85, respectivamente.

(a) Utilizando la opcion Plot. . .Probability Distributions de Statgraphics, determine queproporcion de los productos quımicos cumple con todas las especificaciones.

(b) ¿Cual de los tres espesores es el que tiene la menor probabilidad de cumplir con lasespecificaciones?

s 17. Cierta fabrica manufacturera tiene tres departamentos de produccion independientes (ysolo tres). Las toneladas de producto obtenidas en un dıa determinado en el primer depar-tamento siguen una distribucion gamma de parametros α = 2 y β = 1, las obtenidas enel segundo departamento siguen una gamma con α = 3 y β = 1 las obtenidas en el tercerdepartamento siguen una gamma con α = 4 y β = 1. Utilice la opcion Plot. . .ProbabilityDistributions de Statgraphics para calcular la probabilidad de que la fabrica produzca enun dıa determinado mas de 4 toneladas de producto en total.

Page 62: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 6

Distribuciones muestrales

6.1 Conceptos basicos

1. Tecnicas de muestreo aleatorio.Muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerados y muestreosistematico. Solo se tratara el muestreo aleatorio simple.

2. Muestreo aleatorio simple.Un procedimiento de muestreo aleatorio simple es aquel en el que todas las posiblesmuestras del mismo tamano tienen la misma probabilidad de ser escogidas. A las mues-tras obtenidas por procedimientos de este tipo se las denomina muestras aleatorias

simples.

Este metodo se usa con tanta frecuencia que, en muchos casos, el adjetivo “simple” se elimina

de ambos terminos definidos anteriormente.

Ejemplo 6.1.1 Se asume que una cadena nacional de comidas rapidas desea selec-cionar aleatoriamente 5 de los 10 estados de un paıs para tomar muestras sobre el gustode los consumidores. Una muestra aleatoria simple garantizara que las

(105

)= 252

muestras de tamano 5 tengan la misma probabilidad de ser utilizada en el estudio.En este caso, la probabilidad de escoger una muestra aleatoria simple de tamano 5sera 0,00397 y la probabilidad de escoger una muestra aleatoria simple de tamano 7sera 0,00833. .

3. Tablas de numeros aleatorios.Una tabla de numeros aleatorios consiste en una tabla de numeros que se hacey se presenta en tal forma que cada uno de los numeros 0 a 9 aparecen en ella con unafrecuencia aproximadamente igual. Es decir, cada uno de estos numeros aparecen en latabla con la misma probabilidad.

4. Estadısticos y distribuciones muestrales.Supongamos que se ha extraıdo una muestra aleatoria de una poblacion y que se deseahacer inferencia sobre ciertas caracterısticas de la distribucion de la poblacion. Esta in-ferencia estara basada en algun estadıstico muestral, es decir, en alguna funcionparticular de la informacion muestral.

Page 63: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

6.2 Distribuciones muestrales de algunos estadısticos 62

Matematicamente, un estadıstico muestral puede definirse de la siguiente manera: Sean

X1 , . . . , Xn variables aleatorias de tal forma que el vector aleatorio (X1 , . . . , Xn) conforme

una muestra aleatoria extraida de alguna poblacion. Entonces, un estadıstico muestral

para esta muestra es un funcıon que depende solo de las variables aleatorias X1 , . . . , Xn.

5. Ejemplos tıpicos de estadısticos.La media muestral, la mediana muestral, la moda muestral, el rango muestral, la varianzamuestral, la desviacion estandar muestral y la proporcion muestral, entre otros.

6. Distribucion muestral.La distribucion de un estadıstico muestral recibe el nombre de distribucion muestral,o distribucion en el muestreo y se define como la distribucion de probabilidades delos valores que puede tomar el estadıstico a lo largo de todas las posibles muestras con elmismo numero de observaciones que pueden ser extraıdas de la poblacion.

6.2 Distribuciones muestrales de algunos estadısticos

Al final de este capıtulo se presentan unas tablas que ilustran la forma de las distribucionesmuestrales de algunos estadısticos. Algunos comentarios:

• En la tabla 6.1 aparece un resumen acerca de la distribucion muestral de la media muestral.

• En la tabla 6.2 aparece un resumen de la distribucion muestral de la diferencias de mediasmuestrales (muestras independientes).

• Al definir X1−X2 =: X y al considerar el problema de determinar la distribucion muestral deX para el caso en que las muestras sean dependientes o pareadas, los diferentes supuestosque se deben tener en cuenta coinciden con los que aparecen en la tabla 6.1.

• En la tabla 6.3 aparece un resumen de la distribucion muestral de la proporcion muestraly de la diferencia de proporciones muestrales.

• En la tabla 6.4 aparece un resumen de la distribucion muestral de la varianza muestral yde la razon de varianzas muestrales. Importante, tener en cuenta que, para la distribucionchi-cuadrada con ν grados de libertad se cumple que, si ν > 40, entonces,

χ2α,ν ≈ ν

(1 −

2

9ν+ zα

√2

)3

.

Page 64: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

6.3 Aplicaciones 63

6.3 Aplicaciones

Ejemplo 6.3.1 Supongamos que el incremento porcentual de los salarios de los funcionariosde todas las corporaciones medianas se distribuye siguiendo una normal con media 12, 2%

y desviacion tıpica 3, 6%. Se toma una muestra aleatoria de nueve observaciones de estapoblacion de incrementos porcentuales de salario. ¿Cual es la probabilidad de que la mediamuestral sea mayor del 10%?SOLUCION:Como no conocemos el tamano de la poblacion, supondremos que esta es infinita. Tenemosque µ = 12, 2, σ = 3, 6 y n = 9. Entonces,

P(X > 10) = 1 − P(Z ≤ −1, 83) = 0, 9664.

Ejemplo 6.3.2 Una empresa emplea 1.500 personas. La cantidad promedio gastada, du-rante un ano determinado, en servicios medicos personales por empleado fue de 2.575 dolaresy la desviacion tıpica de 525 dolares. ¿Cual es la probabilidad de que una muestra aleatoriade 100 empleados (seleccionados sin reemplazo) arroje una media comprendida entre 2.500y 2.700 dolares?SOLUCION:Tenemos que N = 1.500, µ = 2.575, σ = 525 y n = 100. Teniendo en cuenta que la poblaciondada es finita y que la varianza poblacional se conoce, entonces, la probabilidad requeridaes

P(2.500 < X < 2.700) = P(Z < 2, 46) − P(Z < −1, 48) = 0, 9237.

Ejemplo 6.3.3 Suponga que de una poblacion normal con media 20 se toma una muestrade tamano 16. Si la desviacion estandar muestral es 4, encuentre la probabilidad de que lamedia muestral sea estrictamente mayor que 21,753.SOLUCION:Tenemos que µ = 20, s = 4 y n = 16. Debido a que la poblacion es normal con varianzadesconocida y a que n < 30, entonces, la distribucion muestral de la media muestral es la t

de Student con n − 1 = 15 grados de libertad. Entonces, la pobabilidad pedida sera

P(X > 21, 753) = P(t15 > 1, 753) = 0, 05 = 5%.

Ejemplo 6.3.4 Se toma una muestra de 250 casas de una poblacion de edificios antiguospara estimar la proporcion de casas de este tipo cuya instalacion electrica resulta insegura.Supongamos que, de hecho, el 30% de todos los edificios de esta poblacion tienen unainstalacion insegura. Hallar la probabilidad de que la proporcion de edificios de la muestracon instalacion insegura este entre 0,25 y 0,35.SOLUCION:Tenemos que p = 0, 30 y n = 250. Por consiguiente, la probabilidad requerida es

P(0, 25 < p < 0, 35) = P(Z < 1, 72) − P(Z < −1, 72) = 0, 9146.

Ejemplo 6.3.5 Los hombres y mujeres adultos radicados en una ciudad grande del nortede cierto pais difieren en sus opiniones sobre la promulgacion de la pena de muerte parapersonas culpables de asesinato. Se cree que el 12% de los hombres adultos estan a favor dela pena de muerte, mientras que solo el 10% de las mujeres adultas lo estan. Si se preguntaa dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres, su opinion sobrela promulgacion de la pena de muerte para personas culpables de asesinato, determine laprobabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el demujeres.SOLUCION:

Page 65: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

6.3 Aplicaciones 64

Representemos con p1 el porcentaje de hombres a favor de la pena de muerte y con p2 elde mujeres. Por lo tanto, la probabilidad pedida sera

P(p1 − p2 ≥ 0, 03) = P(Z ≥ 0, 25) = 0, 4013.

Ejemplo 6.3.6 La tabla de abajo recoge los datos de consumo de gasolina correspondientea una muestra aleatoria de 8 automoviles norteamericanos de dos modelos diferentes. Seformaron pares con las dos muestras y cada elemento de un determinado par fue conducidopor la misma ruta y por el mismo piloto.

xi (auto A) 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4yi (auto B) 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2

(a) Determine la media y la desviacion muestral de las diferencias en el consumo de gasolina.

(b) Suponiendo que la distribucion de las diferencias poblacionales es normal con media-0,807, encuentre la probabilidad de que el consumo promedio de gasolina del auto Asea mayor que el del auto B.

SOLUCION:

(a) Haciendo di = xi − yi, tenemos que d = 0, 775 y sd = 0, 903.

(b) Tenemos que µA − µB = −0, 807. Sean XA y XB las variables que representan alconsumo promedio de gasolina de los autos A y B, respectivamente. Nos piden calcularP(XA > XB) o, que es lo mismo, P(XA − XB > 0). Hagamos D = XA − XB. Entonces,teniendo en cuenta la tabla t de Student (con n−1 = 7 grados de libertad) encontramosque

P(D > 0) = P(t > 2, 3645) = 0, 025.

Ejemplo 6.3.7 En un estudio para comparar los pesos promedios de ninos y ninas de sextogrado en una escuela de instruccion media, se usara una muestra aleatoria de 20 ninos y otraigual de 25 ninas. Se sabe que, tanto para ninos y ninas, los pesos siguen una distribucionnormal. El promedio de los pesos de todos lo ninos de sexto grado de esa escuela es de 100libras y su desviacion estandar es de 14,142, mientras que el promedio de los pesos de todaslas ninas del sexto grado es de 85 libras y su desviacion estandar es de 12,247. Encuentrela probabilidad de que el promedio de los pesos de los 20 ninos sea al menos 20 libras masgrande que el de los de las 25 ninas.SOLUCION:Supongamos que X1 representa el promedio de los pesos de 20 ninos y X2, el promedio delos pesos de una muestra de 25 ninas. Nos piden calcular P(X1 − X2 > 20). Como las dospoblaciones en cuestion son normales y con varianzas conocidas, entonces,

P(X1 − X2 > 20) = P(Z ≥ 1, 25) = 0, 1056.

Ejemplo 6.3.8 Suponga que dos drogas A y B, de las que se dice que reducen el tiempode respuesta de las ratas a determinado estımulo, se estan comparando en un experimentode laboratorio. El experimentador supone que las respectivas poblaciones de los tiemposde respuesta al estımulo estan distribuidos normalmente y tienen varianzas iguales. Seadministra la droga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento,la reduccion promedio de tiempo de respuesta al estımulo por parte de las ratas que estanrecibiendo la droga A es 30,45 milisegundos con una desviacion tıpica de 5 milisegundos.Los datos correspondientes a la droga B son 24,9 y 6 milisegundos. ¿Cual es la probabilidadde que la diferencia entre la reduccion promedio de tiempo de respuesta al estımulo por

Page 66: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

6.3 Aplicaciones 65

parte de las ratas que estan recibiendo la droga A y la reduccion promedio de tiempo derespuesta al estımulo por parte de las ratas que estan recibiendo la droga B sea menor oigual a la que se observo en el experimento? Suponga que no hay diferencia alguna entre lasdos drogas con respecto a la reduccion promedio en tiempos de respuestas y que las drogasson igualmente efectivas.SOLUCION:Sean XA y XB la reduccion promedio de tiempo de respuesta al estımulo por parte de las ratasque estan recibiendo la droga A y la droga B, respectivamente. Como las dos poblaciones encuestion son normales y los tamanos de las muestras son grandes (observe que los tamanosde ambas muestras son mayores o iguales que 30), entonces,

P(XA − XB ≤ 5, 55) = P(Z ≤ 1, 31) = ≈ 0, 9049.

Ejemplo 6.3.9 Repita el ejemplo 6.3.8, pero ahora suponiendo que las poblaciones notienen distribucion normal y que los tamanos muestrales son menores que 30, digamosnA = 12 y nB = 13.SOLUCION:Como las dos poblaciones en cuestion son normales y los tamanos de las muestras sonpequenas (observese que los tamanos muestrales son estrictamente menores que 30), en-tonces:

• La distribucion muestral de XA − XB es aproximadamente la t de Student con 23grados de libertad.

• Debido a que no hay diferencia alguna entre las dos drogas con respecto a la reduccionpromedio en tiempos de respuestas y que las drogas son igualmente efectivas, entonces,µA = µB. Por consiguiente, la media de la distribucion muestral de XA − XB es 0.

• La varianza muestral combinada s2 es 30,74.

Por consiguiente,

P(XA − XB ≤ 5, 55) = P(t ≤ 2, 5) = 0, 01.

Ejemplo 6.3.10 Repita el ejemplo 6.3.8, pero ahora suponiendo que las poblaciones notienen distribucion normal, que los tamanos muestrales son menores que 30 (digamos nA =

12 y nB = 13) y que las varianzas poblacionales son diferentes.SOLUCION:En este caso:

• La distribucion muestral de XA − XB es aproximadamente la t de Student con 23grados de libertad.

• De nuevo, la media de la distribucion muestral de XA − XB es 0.

Por consiguiente,

P(XA − XB ≤ 5, 55) = P(t ≤ 2, 52) ≈ 0, 01.

Ejemplo 6.3.11 En una prueba sobre la efectividad de dos tipos de pıldoras para dormir,A y B, se utilizaran dos grupos independientes de personas con insomnio. A un grupo detamano 61 se le administrara la pıldora A y al otro grupo, de tamano 41, se le administrarala B, registrandose el numero de horas de sueno de cada individuo participante en el estudio.Suponiendo que el numero de hora de sueno de quienes usan cada tipo de pıldora se distribuyenormalemente y que σ2

A = σ2B, entonces, la probabilidad de que la razon de las varianzas

muestrales de A y B sea mayor que 1,64 esta dada por

P(s2A/s2

B > 1, 64) = P(F(60, 40) > 1, 64

)= 0, 05.

Page 67: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 6. Ejercicios 66

Ejercicios

1. Un fabricante declara que la duracion de las bujıas que el fabrica sigue una distribucionnormal con una media de 36.000 kilometros y una desviacion estandar de 4.000 kilometros.Para una muestra aleatoria de dieciseis bujıas, se obtuvo una duracion media de 34.500kilometros. Si la afirmacion del fabricante es correcta, ¿cual es la probabilidad de obteneruna media muestral tan pequena como esta o menor?

2. Los tiempos requeridos para que unos trabajadores terminen cierta labor, se distribuyennormalmente con media de 30 minutos y una desviacion estandar de 9 minutos. Si de laplanta de trabajadores se toma una muestra aleatoria de 25, encuentre la probabilidad deque la media del tiempo requerido para concluir la tarea en la muestra, este entre 28 y 33minutos.

3. Un estudio de transito revela que el numero promedio de ocupantes de un auto es 1,75.En una muestra de 50 autos con desviacion estandar 0,65, seleccionada de una poblacionnormal, encuentre la probabilidad de que el numero promedio de ocupantes sea mayor que2.

4. Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientescantidades en kilometros por litro:

18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.

Determine la probabilidad de que el consumo de gasolina medio muestral de los au-tomoviles de este modelo sea menor que 17,6 kilometros por litro, suponiendo que ladistribucion de la poblacion es normal con media 17.

5. Se desea estudiar una muestra de 20 personas para saber la proporcion de ellas que tienenmas de 40 anos. Sabiendo que la proporcion en la poblacion es del 40%, ¿cual es laprobabilidad de que la proporcion en la muestra sea menor del 50%?

6. Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el numero decaras este comprendido en el 40% y el 60%.

7. Se identificaron dos poblaciones de alumnos de ultimo ano de un colegio. La variable deinteres en la investigacion consistıa en los puntajes obtenidos en una prueba de rendimientoen estadıstica que hicieron los estudiantes de las dos poblaciones. Los investigadoressuponıan que los puntajes de las dos poblaciones estaban distribuidos normalmente conlas siguientes medias y varianzas: µ1 = 50, σ2

1 = 40, µ2 = 40, σ22 = 60. Una muestra

aleatoria de tamano n1 = 10 se saca de la poblacion 1 y una de tamano n2 = 12 depoblacion 2. ¿Cual es la probabilidad de que la diferencia entre las medias muestrales esteentre 5 y 15?

8. Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de respuesta delas ratas a determinado estımulo, se estan comparando en un experimento de laboratorio.El experimentador supone que las respectivas poblaciones de los tiempos de respuestaal estımulo estan distribuidos normalmente y tienen varianzas iguales. Se administra ladroga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento, la reduccionpromedio de tiempo de respuesta al estımulo por parte de las ratas que estan recibiendola droga A es 30,45 milisegundos con una desviacion tıpica de 5 milisegundos. Los datoscorrespondientes a la droga B son 24,9 y 6 milisegundos. ¿Cual es la probabilidad de quela diferencia entre la reduccion promedio de tiempo de respuesta al estımulo por parte delas ratas que estan recibiendo la droga A y la reduccion promedio de tiempo de respuestaal estımulo por parte de las ratas que estan recibiendo la droga B sea menor o igual a laque se observo en el experimento? Suponga que no hay diferencia alguna entre las dosdrogas con respecto a la reduccion promedio en tiempos de respuestas y que las drogasson igualmente efectivas.

Page 68: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.6.

Ejercicios

67

¿FORMA DE LA ¿ES σ2 ¿TAMANO DE ¿DISTRIBUCION ¿Z O t?POBLACION? CONOCIDA? LA MUESTRA? MUESTRAL?

1.Normal

Si No importa Normal Z = x−µ

σ/√

n

2.No

Grande Normal Z = x−µ

σ/√

n

(n ≥ 30)3. Pequeno t de Student,

(n < 30) ν = n − 1 t = x−µ

s/√

n

grados de libertad

4. Nonormal

odesconocida

SiGrande Normal Z = x−µ

σ/√

n

(n ≥ 30)5. Pequeno Callejon sin

(n < 30) salida

6.No

Grande Normal Z = x−µ

s/√

n

(n ≥ 30)7. Pequeno Callejon sin

(n < 30) salida

Tabla 6.1: Resumen de la distribucion muestral de la media muestral

Page 69: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.6.

Ejercicios

68

¿FORMA ¿SON σ21 y σ2

2 ¿SON σ21 y σ2

2 ¿TAMANO ¿DISTRIBUCION ¿Z O t?DE AMBAS CONOCIDAS? IGUALES? DE AMBAS MUESTRAL?

POBLACIONES? MUESTRAS?

1. Nonormal

Si No importa Grandes Normal Z =(X1−X2)−(µ1−µ2)√

σ21

n1+

σ22

n2

(n1 ≥ 30, n2 ≥ 30)

2. No No importa Grandes Normal Z =(X1−X2)−(µ1−µ2)√

s21

n1+

s22

n2

(n1 ≥ 30, n2 ≥ 30)

3.Normal

Si No importa No importa Normal Z =(X1−X2)−(µ1−µ2)√

σ21

n1+

σ22

n2

4.No

Si Pequeno t de Student con t =(x1−x2)−(µ1−µ2)√

s2

n1+ s2

n2

,

(n1 < 30, n2 < 30) ν = n1 + n2 − 2

grados de libertad s2 =(n1−1)s2

1+(n2−1)s22

n1+n2−2

5. No Pequeno t de Student con

(n1 < 30, n2 < 30) ν =

(s21

n1+

s22

n2

)2

(s21

/n1)2

n1−1+

(s22

/n2)2

n2−1

t =(x1−x2)−(µ1−µ2)√

s21

n1+

s22

n2

(redondear al en-(tero mas cercano)

Tabla 6.2: Resumen de la distribucion muestral de la diferencias de medias muestrales

Page 70: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.6.

Ejercicios

69

¿ESTADISTICO? ¿SUPUESTO? ¿DISTRIBUCION ¿Z?MUESTRAL?

1. Proporcionmuestral

n ≥ 30 Normal Z = p−p√p(1−p)

n2. np ≥ 5, n(1 − p) ≥ 5 Normal

3. Diferencia deproporcionesmuestrales

n1 ≥ 30, n2 ≥ 30 Normal Z =(p1−p2) − (p1−p2)√p1(1−p1)

n1+

p2(1−p2)

n24. n1p1 ≥ 5, n1(1 − p1) ≥ 5, Normal

n2p2 ≥ 5, n2(1 − p2) ≥ 5

Tabla 6.3: Resumen de la distribucion muestral de la proporcion muestral y de la diferencia de proporciones muestrales

Page 71: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.6.

Ejercicios

70

¿ESTADISTICO? ¿FORMA DE LA ¿DISTRIBUCION ¿χ2 O F?POBLACION? MUESTRAL?

1. Varianza Normal Chi-cuadrada con

muestral ν = n − 1 χ2 =(n−1)s2

σ2

grados de libertad

2. Razon de Ambas F de Fisher con F =s21/σ2

1

s22/σ2

2

varianzas normales ν1 = n1 − 1, ν2 = n2 − 1

muestrales grados de libertad Regla:

F1−α(a, b) = 1Fα(b,a)

Tabla 6.4: Resumen de la distribucion muestral de la varianza muestral y de la razon de varianzas muestrales

Page 72: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 7

Intervalos de confianza

7.1 Estimacion

1. Terminos basicos.

(a) La estimacion estadıstica es el proceso mediante el cual intentamos determinarel valor de un parametro de la poblacion, sin hacer un censo, a partir de la informacionde una muestra.

(b) Una estimacion es el valor numerico que creemos que tiene el parametro.

(c) el estimador es el estadıstico de la muestra, utilizada para hacer una estimacion.

(d) Un estimador puntual de un parametro poblacional es una funcion de la muestraque da como resultado un unico valor.

(e) Un valor en particular de un estimador puntual se llama una estimacion puntual

del parametro.

2. Pautas para escoger un estimador.

(a) Insesgamiento.

θ es un estimador insesgado de θ, si E(θ) = θ. Evidentemente, si E(θ) 6= θ,el estimador se dice que es sesgado. LLamaremos sesgo a la diferencia entre lamedia del estimador θ y el parametro θ, es decir,

Sesgo (θ) = E(θ) − θ.

La media, la varianza y la proporcion muestrales son estimadores insesgados de loscorrespondientes parametros poblacionales, pero la desviacion tıpica muestral no esun estimador insesgado de la desviacion tıpica poblacional.

(b) Eficiencia.

Sean θ1 y θ2 dos estimadores insesgados de θ, obtenidos en muestras del mismotamano. Entonces, θ1 es mas eficiente que θ2 si V(θ1) < V(θ2).

Al tomar muestras de una poblacion de una poblacion normal, la media muestrales mas eficiente que la mediana.

Page 73: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

7.2 Intervalos de confianza 72

(c) Estimador insesgado de mınima varianza.

Si θ es un estimador insesgado de θ y no hay ningun otro estimador insesgado quetenga menor varianza, entonces, se dice que θ es el estimador insesgado de

mınima varianza de θ. Algunos ejemplos de estimadores insesgados de mınimavarianza son:

i. La media muestral cuando la muestra proviene de una distribucion normal.

ii. La varianza muestral cuando la muestra proviene de una una distribucion normal.

iii. La proporcion muestral binomial.

(d) Consistencia.

Un estimador puntual θ de θ es consistente para θ si sus valores tienden a acer-carse al parametro poblacional θ conforme se incrementa el tamano de la muestra.De otro modo, el estimador se llama inconsitente.

Al muestrear de una poblacion normal, la desviacion tıpica muestral es consistentepara la desviacion tıpica poblacional (esto tambien es cierto para el caso de la me-dia y la varianza para sus correspondientes parametros poblacionales). Tambien laproporcion muestral es consistente para la proporcion poblacional.

7.2 Intervalos de confianza

1. Estimador y estimacion por intervalos.

(a) Un estimador por intervalos de un parametro poblacional es una regla (basadaen la informacion muestral) para determinar un rango, o un intervalo, en el cualposiblemente se encuentre dicho parametro.

(b) La estimacion correspondiente se denomina estimacion por intervalos.

2. Intervalo de confianza.Sea θ un parametro desconocido. Supongamos que con ayuda de la informacion muestral,podemos encontrar dos variables aleatorias U y V, con U menor que V, tales que P(U <

θ < V) = 1 − α, para un α ∈ (0, 1). Entonces,

(a) La fraccion 1 − α recibe el nombre de grado de confianza , α se llama nivel

de significancia y el intervalo de U hasta V es un estimador por intervalos

de θ del (1 − α)100%.

(b) Si u y v representan a un valor particular de U y V, respectivamente, entonces, elintervalo de u a v de denomina intervalo de confianza del (1−α)100% para θ.

Si se extraen muestras aleatorias de la poblacion un numero elevado de veces, el parametroestara contenido en un (1−α)100% de los intervalos calculados de este modo. El intervalode confianza obtenido de esta manera se escribe u < θ < v.

7.3 Intervalos de confianza para algunos parametros

Al final de este capıtulo se presentan unas tablas que ilustran la forma de los intervalos deconfianza para algunos parametros. Algunos comentarios:

• En la tabla 7.1 aparece un resumen acerca los intervalos de confianza para la mediapoblacional.

• En la tabla 7.2 aparece un resumen acerca los intervalos de confianza para la diferenciasde medias poblacionales (muestras independientes).

Page 74: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

7.3 Intervalos de confianza para algunos parametros 73

• Los diferentes supuestos que se deben tener en cuenta para poder determinar el intervalo deconfianza para el correspondiente parametro poblacional (para el caso en que las muestrasescogidas sean dependientes o pareadas) coinciden con los que aparecen en la tabla 7.1.

• En la tabla 7.3 aparece un resumen acerca los intervalos de confianza para la proporcionpoblacional y para la diferencia de proporciones poblacionales.

• En la tabla 7.4 aparece un resumen acerca los intervalos de confianza para varianza pobla-cional y para la razon de varianzas poblacionales. Importante, tener en cuenta que, parala distribucion chi-cuadrada con ν grados de libertad se cumple que, si ν > 40, entonces,

χ2α,ν ≈ ν

(1 −

2

9ν+ zα

√2

)3

.

Page 75: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

7.4 Aplicaciones 74

7.4 Aplicaciones

Ejemplo 7.4.1 Un fabricante produce bolsas de azucar refinado. El peso del contenido deestas bolsas tiene una distribucion normal con desviacion tıpica 15 gramos. Los contenidosde una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos. Calcular unintervalo de confianza del 95% para el verdadero peso medio de todas las bolsas de azucarproducidas por el fabricante.SOLUCION:Dado que buscamos un intervalo de confianza del 95%, tenemos que 1 − α = 95%, por loque α = 5% = 0, 05. Debido a que Zα/2 = Z0,025 = 1, 96, el intervalo de confianza del 95%para la media poblacional µ es

94, 14 < µ < 105, 88.

Con esto podemos concluir que, con una confianza del 95%, el verdadero peso medio detodas las bolsas de azucar producidas por el fabricante se encuentra entre 94,12 y 105,88gramos.

Ejemplo 7.4.2 Una muestra aleatoria de seis autos colombianos de un determinado modeloconsumen las siguientes cantidades en kilometros por litro: 18,6; 18, 4; 19,2; 20,8; 19,4 y 20,5.Calcule un intervalo de confianza del 90% para el consumo de gasolina medio poblacionalde los autos de este modelo, suponiendo que la distribucion de la poblacion en cuestion esnormal.SOLUCION:En este caso, n = 7, x = 19, 48 y s = 0, 98 kilometros por litro y tα/2 = t0,05 = 2, 015 conn − 1 = 6 grados de libertad. Entonces, el intervalo buscado sera

18, 67 < µ < 20, 29.

Por lo tanto, con una confianza del 95%, podemos afirmar que el consumo de gasolina mediopoblacional se encuentra entre 18,67 y 20,29 kilometros por litro.

Ejemplo 7.4.3 En una muestra aleatoria de 85 soportes para la pieza de un motor deautomovil, 10 tienen un pequeno defecto. Calcule un intervalo de confianza del 95% para laproporcion p de piezas de motor en la poblacion que tienen un pequeno defecto.SOLUCION:Debido a que n = 85, entonces, una estimacion puntual de la proporcion de piezas demotor en la poblacion que tienen un pequeno defecto es p = 10

85= 0, 12. Debido a que

Zα/2 = Z0,025 = 1, 96, entonces, un intervalo de confianza para p es

0, 05 < µ < 0, 19.

Es decir, con una confianza del 95%, podemos afirmar que la verdadera proporcion de piezasde motor en la poblacion que tienen un pequeno defecto esta entre el 5% y el 19%.

Ejemplo 7.4.4 Considerese el proceso de fabricacion de soportes para piezas de motoresdescrito en el ejemplo 7.4.3. Supongase que se hace una modificacion al proceso de acabadode la superficie y que, de manera subsecuente, se toma una segunda muestra aleatoriade 85 ejes. Si el numero de soportes defectuosos en esta segunda muestra es 8, calcule unintervalo de confianza del 95% para la diferencia en la proporcion de los soportes defectuososproducidos por ambos procesos.SOLUCION:En este caso, tenemos que

n1 = 85, p1 =10

85= 0, 12, n2 = 85, p2 =

8

85= 0, 09.

Page 76: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

7.4 Aplicaciones 75

Debido a que Zα/2 = Z0,025 = 1, 96, entonces, un intervalo de confianza para la diferenciaentre las proporciones poblacionales p1 − p2 es

−0, 06 < p1 − p2 < 0, 12.

Ese intervalo de confianza incluye al cero, ası que, con base en los datos muestrales, parecepoco probable que los cambios hechos en el proceso de acabado de la superficie hayanreducido el numero de soportes defectuosos para piezas producidos por el proceso.

Ejemplo 7.4.5 Para una muestra aleatoria de 321 fumadores, el numero medio de horasde absentismo laboral al mes fue de 3,01 y la desviacion tıpica muestral fue de 1,09 horas almes. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado,el numero medio de horas fue de 2,88 y la desviacion tıpica muestral fue de 1,01 horas almes. Calcular un intervalo de confianza del 99% para la diferencia entre las dos mediaspoblacionales.SOLUCION:Dado que los tamanos muestrales son grandes, podemos utilizar las varianzas muestrales enlugar de las varianzas poblacionales desconocidas. Tenemos:

n1 = 321, x1=3,01, s1 = 1, 09;n2 = 94, x2=2,88, s2 = 1, 01

y para un intervalo de confianza del 95%, se tiene que Zα/2 = Z0,025 = 1, 96. Por consi-guiente, el intervalo es

−0, 11 < µ1 − µ2 < 0, 37.

Dado que el cero esta dentro del intervalo de confianza, no hay suficiente evidencia en losdatos como para rechazar la idea de que ambas poblaciones tienen la misma media.

Ejemplo 7.4.6 En un estudio sobre los efectos de la planificacion en el rendimiento fi-nanciero de los bancos, se extrajo una muestra aleatoria de seis instituciones financieras quecontaban con un sistema de planificacion formal, y se comprobo que el porcentaje medioanual de crecimiento de los ingresos netos en dicha muestra era de 9,972 con una desviaciontıpica de 7,470. La media de dicho crecimiento en otra muestra aleatoria independientede nueve bancos que no recurrıan a la planificacion fue de 2,098 con una desviacion tıpicade 10,834. Suponiendo que las dos poblaciones son normales y tienen la misma varianza,calcular un intervalo de confianza del 90% para la diferencia de medias.SOLUCION:Los datos muestrales son

n1 = 6, x1 = 9, 972, s1 = 7, 470;n2 = 9, x2 = 2, 098, s2 = 10, 834.

Debido a que el valor de la varianza muestral combinada es s2 = 93, 7 y a que tα/2 =

t0,05 = 1, 771 con 13 grados de libertad, entonces, el intervalo de confianza del 90% para ladiferencia de los incrementos medios porcentuales es

−1, 161 < µ1 − µ2 < 16, 909.

El intervalo incluye el cero, lo cual sugiere que no existe evidencia suficiente en la muestracomo para rechazar la idea de la igualdad de medias entre ambas poblaciones.

Ejemplo 7.4.7 El departamento de zoologıa de cierto instituto llevo a cabo un estudio paraestimar la diferencia en la cantidad de cierta sustancia quımica medida en dos estacionesdiferentes de un rıo. La sustancia se mide en miligramos por litro. Se reunieron 15 muestras

Page 77: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

7.4 Aplicaciones 76

de la estacion 1 y 12 muestras de la estacion 2. Las 15 muestras de la estacion 1 tuvieronun contenido promedio de sustancia quımica de 3,84 miligramos por litro y una desviacionestandar de 3,07 miligramos por litro, mientras que las 12 muestras de la estacion 2 tuvieronun contenido promedio de 1,49 miligramos por litro y una desviacion estandar de 0,80miligramos por litro. Encuentre un intervalo de confianza del 95% para la diferencia en elcontenido promedio real de sutancia en estas dos estaciones. Suponga que las observacionesvienen de poblaciones normalmente distribuidas con varianzas diferentes.SOLUCION:Tenemos que

n1 = 15, x1 = 3, 84, s1 = 3, 07, n2 = 12, x2 = 1, 49, s2 = 0, 80.

Como las varianzas poblacionales se suponen diferentes, solo podemos encontrar un intervalode confianza de 95% aproximado basado en la distribucion t de Student con 16 grados delibertad. Debido a que tα/2 = t0,025 = 2, 120 para ν = 16 grados de libertad, entonces, elintervalo buscado es

0, 60 < µ1 − µ2 < 4, 10.

Por ello tenemos una confianza del 95% de que el intervalo de 0,60 a 4,10 miligramos porlitro contiene la diferencia de los contenidos promedio reales de sustancia para estos doslugares. Como el 0 no esta incluido en el intervalo, podemos afirmar que estos dos contenidospromedios son diferentes.

Ejemplo 7.4.8 Una muestra aleatoria de tabletas para el dolor de estomago tiene unadesviacion tıpica de 0,8% en la concentracion del ingrediente activo. Hallar un intervalo deconfianza del 90% para la varianza y para la desviacion poblacional.SOLUCION:Tenemos que n = 15 y s = 0, 8. Debido a que χ2

α2

= χ20,05 = 23, 68 y χ2

1− α2

= χ20,95 = 6, 57

con 14 grados de libertad, el intervalo de confianza del 90% para la varianza poblacionalviene dado por

0, 378 < σ2 < 1, 364.

Por consiguiente, con una confianza del 90%, la varianza poblacional de la concentraciondel ingreso activo esta entre 0,378 y 1,364. Dado que la desviacion tıpica es igual a laraız cuadrada, podemos obtener un intervalo de confianza del 90% para la desviacion tıpicapoblacional tomando raıces cuadradas. El resultado es

0, 61 < σ < 1, 17.

Por tanto, nuestro intervalo de confianza del 90% para la desviacion tıpica poblacional dela concentracion porcentual del ingrediente activo de estas tabletas va del 61% al 1,17%.

Ejemplo 7.4.9 En el ejemplo 7.4.7 se construyo un intervalo de confianza para la diferenciaen el contenido medio de sustancia quımica, que se mide en miligramos por litro, en dosestaciones sobre un rıo mediante la suposicion de que poblaciones en cuestion son normalescon varianzas diferentes. Justifique esta suposicion mediante la construccion de un intervalode confianza del 98% para σ1/σ2, donde σ1 y σ2 son las desviaciones poblacionales delcontenido de sustancia quımica en las estaciones 1 y 2, respectivamente.SOLUCION:Del ejemplo 7.4.7 se tiene que

n1 = 15, x1 = 3, 84, s1 = 3, 07, n2 = 12, x2 = 1, 49, s2 = 0, 80.

Para un intervalo de confianza del 98%, α = 0, 02. Por tanto, al interpolar en la tablade la distribucion F que aparece en el apendice, encontramos que F0,01(14, 11) ≈ 4, 30 y

Page 78: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

7.5 Determinacion del tamano de una muestra 77

F0,01(11, 14) ≈ 3, 87. Por tanto, el intervalo de confianza del 98% para σ1/σ2 es

1, 851 <σ1

σ2

< 7, 549.

Como este intervalo no permite la posibilidad de que σ1/σ2 sea igual a 1, es correcto suponerque σ1 6= σ2 o σ2

1 6= σ22 en el ejemplo 7.4.7

7.5 Determinacion del tamano de una muestra

1. Tamano muestral de los intervalos de confianza para la media.Si se utiliza x como una estimacion de µ, entonces, se puede tener una confianza de(1 − α)100% de que el error |x − µ| no excedera una cantidad especıfica e cuando eltamano de la muestra es (redondear al entero mas cercano):

n =

(Zα/2σ

e

)2

.

Cuando σ2 sea desconocida, se toma una muestra preliminar de tamano n ≥ 30, se calcula

la desviacion muestral s (para proporcionar una estimacion de la desviacion poblacional σ)

y se reemplaza σ por s.

Ejemplo 7.5.1 La longitud de barras de metal producidas por una cadena es unavariable aleatoria con distribucion normal y desviacion estandar 1,8 milımetros. Basandoseen una muestra aleatoria de 9 observaciones, se calcuo el siguiente intervalo del 99%para la longitud media poblacional:

194, 65 ≤ µ ≤ 197, 75.

Supongamos que un director de produccion cree que el intervalo es demasiado amplio,y exige un intervalo con el mismo nivel de confianza, pero cuya longitud a cada ladode la media muestral no sea superior a 0,5 milımetros. ¿Cuantas observaciones debetener la muestra para construir tal intervalo?SOLUCION:Tenemos que e = 0, 50, σ = 1, 8 y Zα/2 = Z0,005 = 2, 575. Por tanto, para satisfacer lapeticion del director, se necesita una muestra aleatoria de al menos 86 observaciones.Este gran incremento en el tamano muestral representa el costo adicional de conseguiruna mayor precision en la estimacion de la verdadera media, reflejada en un intervalode confianza mas corto.

2. Tamano de la muestra para estimar proporciones poblacionales.Si se utiliza p como una estimacion de p, entonces, se puede tener una confianza de(1 − α)100% de que el error |p − p| no excedera una cantidad especıfica e cuando eltamano de la muestra es

n =Z2

α/2p(1 − p)

e2.

Si p es desconocida, hecemos p = 0, 5.

Ejemplo 7.5.2 Supongase que, basado en 142 observaciones, se ha construido elsiguietne intervalo de confianza del 95% para la proporcion de directores de recursoshumanos que consideraban que el expediente academico era muy importante en laevaluacion de un candidato:

0, 533 ≤ p ≤ 0, 693.

Page 79: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 7. Ejercicios 78

Supongamos ahora que queremos construir un intervalo de confianza del 95% cuyalongitud a cada lado de la proporcion muestral no sea superior a 0,06. ¿Cuantas ob-servaciones necesitamos?SOLUCION:Tenemos que e = 0, 06 y Zα/2 = Z0,025 = 1, 95. Debido a que desconocemos la esti-macion p de p, hacemos p = 0, 5 y, con ello, podemos concluir que un numero mınimode 267 observaciones garantiza un intervalo de confianza con la longitud exigida.

Ejercicios

1. Un biologo desea hacer una estimacion con un intervalo de confianza del 95% de la canti-dad promedio de agua que consume cierta especie animal en condiciones experimentales.De alguna manera, el investigador logra determinar que la poblacion de valores de con-sumo diario de agua esta distribuida normalmente. Una muestra aleatoria de 36 animalesarroja una media de 16,5 gramos con una desviacion estandar de 2 gramos.

2. esuelva nuevamente el ejercicio 1 pero utilizando un grado de confianza del 99%. Comparelos resultados encontrados en ambos ejercicios.

3. Los contenidos de 7 recipientes similares de acido sulfurico son 9,8; 10,2; 10,4; 9,8; 10,0;10,2 y 9,6 litros. Encuentre un intervalo de confianza del 95% para la media de todos losrecipientes, suponiendo que la poblacion de valores tiene distribucion normal.

4. Las empresas de busqueda de ejecutivos se especializan en ayudar a las empresas a ubicary asegurar talento para la alta gerencia. Tales firmas son responsables de la ubicacion demuchos de los mejores directores ejecutivos de la nacion. Una reconocida revista reportoque “uno de cada cuatro directores ejecutivos es una persona con mas de 35 anos deedad”. Si en una muestra aleatoria de 350 compnıas de cierto pais, 77 tienen directoresejecutivos con mas de 35 anos de edad, ¿un intervalo de confianza del 99% apoyarıa laafirmacion?

5. Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de es-tadıstica de sexo masculino y femenino. De 120 hombres, 107 esperaban disfrutar de untrabajo de tiempo completo en un maximo de 6 anos. De 141 mujeres encuestadas, 73tenıan esta esperanza. Hallar un intervalo de confianza del 95% para la diferencia entrelas proporciones poblacionales.

6. Se llevan a cabo pruebas de resistencia a la tension sobre dos diferentes clases de tubosde aluminios utilizados en la fabricacion de alas de aeroplanos comerciales. Los datosobtenidos son como se muestran a continuacion:

Clase de Tamano de Media de la resistencia Desviaciontubo la muestra a la tension (kg/mm2) estandar (kg/mm2)

Tubo 1: n1 = 10, x1 = 87, 6, s1 = 1, 09;Tubo 2: n2 = 12, x2 = 74, 5, s2 = 1, 5

Si µ1 y µ2 representan los promedios verdaderos de las resistencias a la tension para lasdos clases de tubos, encuentre un intervalo de confianza del 90% para la diferencia de lasmedias µ1 − µ2.

7. Un biologo deseaba estudiar los efectos de ciertas drogas sobre el consumo de agua enuna especie particular de animales de laboratorio. La droga A que contiene un agenteque produce sed, se administro a una muestra aleatoria simple de nA = 25 animales. Ladroga B que no contiene tal agente, se administro a una muestra aleatoria independientede nB = 22 animales similares. El biologo registro la cantidad de agua consumida porcada animal durante un periodo de tiempo determinado despues de la administracion de

Page 80: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 7. Ejercicios 79

las drogas. Las cantidades promedio de agua consumida por animal en cada uno de los dosgrupos fueron respectivamente de xA = 50 mililitros (ml) y xB = 25 ml y las desviacionestıpicas de sA = 5, 3 ml y de sB = 5, 6 ml. Construya un intervalo de confianza del 95%para µ1 − µ2 suponiendo que las poblaciones en cuestion son normales con varianzasiguales.

8. Un fabricante de detergente lıquido esta interesado en la uniformidad de la maquinautilizando para llenar las botellas. De manera especıfica, es deseable que la desviacionestandar σ del proceso de llenado sea menor que 0,5 onzas de lıquido. De otro modo,existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente.Supongase que la distribucion del volumen de llenado es aproximadamente normal. Altomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral s2 = 0, 00153

(onzas de fluido)2. Calcule un intervalo de confianza del 90% para σ.

9. Una companıa fabrica propulsores para uso en motores de turbina. Una de las operacionesconsiste en esmerilar el terminado de una superficie particular con una aleacion de titanio.Pueden emplearse dos procesos de esmerilado, y ambos pueden producir partes que tienenla misma rigurosidad superficial promedio. Al ingeniero de manufactura le gustarıa selec-cionar el proceso que tenga la menor variabilidad en la rigurosidad de la superficie. Paraello toma una muestra de n1 = 12 partes del primer proceso, la cual tiene una desviacionestandar muestral de s1 = 5, 1 micropulgadas, y una muestra aleatoria de n2 = 15 partesdel segundo proceso, la cual tiene una desviacion estandar muestral de s2 = 4, 7 microp-ulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dosvarianzas σ2

1/σ22. Supongase que los dos procesos son independientes y que la rigurosidad

de la superficie esta distribuida normalmente.

Page 81: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.7.

Ejercicios

80

¿FORMA DE LA ¿ES σ2 ¿TAMANO DE ¿DISTRIBUCION ¿INTERVALO DEPOBLACION? CONOCIDA? LA MUESTRA? MUESTRAL? CONFIANZA?

1.Normal

Si No importa Normal x − Zα/2σ√n

< µ < x + Zα/2σ√n

2.No

Grande Normal x − Zα/2s√n

< µ < x + Zα/2s√n

(n ≥ 30)3. Pequeno t de Student,

(n < 30) ν = n − 1 x − tα/2s√n

< µ < x + tα/2s√n

grados de libertad

4. Nonormal

odesconocida

SiGrande Normal x − Zα/2

σ√n

< µ < x + Zα/2σ√n

(n ≥ 30)5. Pequeno Callejon sin

(n < 30) salida6.

NoGrande Normal x − Zα/2

s√n

< µ < x + Zα/2s√n

(n ≥ 30)7. Pequeno Callejon sin

(n < 30) salida

Tabla 7.1: Resumen acerca los intervalos de confianza para la media poblacional

Page 82: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.7.

Ejercicios

81

¿FORMA ¿σ21 y σ2

2 ¿σ21 y σ2

2 ¿TAMANO ¿DISTRIBUCION ¿INTERVALO DEDE AMBAS CONO- IGUALES? DE AMBAS MUESTRAL? CONFIANZA?

POBLA- CIDAS? MUESTRAS?CIONES?

1. Nonormal

Si No importa Grandes Normal (x1 − x2) − Zα/2

√σ2

1

n1+

σ22

n2< µ1 − µ2 <

(n1 ≥ 30, n2 ≥ 30) < (x1 − x2) + Zα/2

√σ2

1

n1+

σ22

n2

2. No No importa Grandes Normal (x1 − x2) − Zα/2

√s21

n1+

s22

n2< µ1 − µ2 <

(n1 ≥ 30, n2 ≥ 30) < (x1 − x2) + Zα/2

√s21

n1+

s22

n2

3.Normal

Si No importa No importa Normal (x1 − x2) − Zα/2

√σ2

1

n1+

σ22

n2< µ1 − µ2 <

< (x1 − x2) + Zα/2

√σ2

1

n1+

σ22

n2

4.No

Si Pequeno t de Student con (x1 − x2) − tα/2

√s2

n1+ s2

n2< µ1 − µ2 <

(n1 < 30, n2 < 30) ν = n1 + n2 − 2 < (x1 − x2) + tα/2

√s2

n1+ s2

n2,

grados de libertad

s2 =(n1−1)s2

1+(n2−1)s22

n1+n2−2

5. No Pequeno t de Student con

(n1 < 30, n2 < 30) ν =

(s21

n1+

s22

n2

)2

(s21

/n1)2

n1−1+

(s22

/n2)2

n2−1

(x1 − x2) − tα/2

√s21

n1+

s22

n2< µ1 − µ2 <

(redondear al en- < (x1 − x2) + tα/2

√s21

n1+

s22

n2

(tero mas cercano)

Tabla 7.2: Resumen acerca los intervalos de confianza para la diferencias de medias poblacionales

Page 83: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.7.

Ejercicios

82

¿ESTADISTICO? ¿SUPUESTOS? ¿DISTR. ¿INTERVALO DEMUESTRAL? CONFIANZA?

1. Proporcionmuestral

n ≥ 30 Normalp − Zα/2

√p(1−p)

n< p < p + Zα/2

√p(1−p)

n2. np ≥ 5, Normaln(1 − p) ≥ 5

3.Diferencia deproporcionesmuestrales

n1 ≥ 30, Normal

n2 ≥ 30 (p1 − p2) − Zα/2

√p1(1−p1)

n1+

p2(1−p2)n2

< p1 − p2 <

4. n1p1 ≥ 5, Normal < (p1 − p2) + Zα/2

√p1(1−p1)

n1+

p2(1−p2)n2

n1(1 − p1) ≥ 5,n2p2 ≥ 5,

n2(1 − p2) ≥ 5

Tabla 7.3: Resumen acerca los intervalos de confianza para la proporcion poblacional y para la diferencia de proporciones poblacionales

Page 84: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap

.7.

Ejercicios

83

¿ESTADISTICO? ¿FORMA DE LA ¿DISTRIBUCION ¿INTERVALO DEPOBLACION? MUESTRAL? CONFIANZA?

1. Varianza Normal Chi-cuadrada con

muestral ν = n − 1(n−1)s2

χ2α2

< σ2 <(n−1)s2

χ21− α

2

grados de libertad

2. Razon de Ambas F de Fisher cons21

s22

· 1Fα

2(ν1,ν2)

<σ2

1

σ2 <s21

s22

· Fα2(ν2, ν1)

varianzas normales ν1 = n1 − 1, ν2 = n2 − 1

muestrales grados de libertad Regla:

F1−α(a, b) = 1Fα(b,a)

Tabla 7.4: Resumen acerca los intervalos de confianza para varianza poblacional y para la razon de varianzas poblacionales

Page 85: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

CAPITULO 8

Pruebas de hipotesis

8.1 Conceptos de la prueba de hipotesis

1. Hipotesis estadısticas.

(a) hipotesis estadıstica: afirmacion sobre uno o mas parametros de una o maspoblaciones.

(b) la hipotesis nula H0: la hipotesis que se debe comprobar.

(c) La hipotesis alternativa H1: se establece como el “complemento” de H0.

2. Comentarios.

(a) H0 siempre se refiere a un valor especıfico del parametro de poblacion (como, porejemplo, µ), no al estadıstico muestral (como X).

(b) H0 siempre debe contener un signo igual respecto al valor especificado del parametropoblacional (por ejemplo,1 H0 : µ = 36, H0 : µ ≤ 36 o H0 : µ ≥ 36).

(c) H1 nunca debe contener un signo igual respecto al valor especificado de parametrode poblacion (por ejemplo, H0 : µ 6= 36, H0 : µ < 36 o H0 : µ > 36).

3. Errores de tipo I y de tipo II.

Decision sobre H0 H0 es verdadera H0 es falsa

Aceptar H0 Decision correcta Error de tipo II1 − α se llama grado de confianza Probabilidad = β

Rechazar H0 Error de tipo I Decision correctaα se llama nivel de significancia 1 − β se llama potencia

Fig. 8.1: Errores de tipo I y II y sus correspondientes probabilidades

1En general, si θ es un parametro poblacional y si k es cualquier numero real, entonces, lahipotesis alternativa H1 : θ 6= k se llama alternativa bilateral y las hipotesis alternativasH1 : θ < k y H1 : θ > k, alternativas unilaterales.

Page 86: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.1 Conceptos de la prueba de hipotesis 85

4. Estadıstico de prueba y region crıtica.Un estadıstico de prueba es un estadıstico (es decir, una funcion que solo depende dela informacion muestral) que se utiliza para determinar si se rechaza, o no, la hipotesis nula.

La region crıtica es el conjunto de todos los valores del estadıstico de prueba para loscuales la hipotesis nula sera rechazada.

Entonces, la hipotesis nula sera rechazada si y solo si el valor observado o calculado del

estadıstico de prueba se ubica en la region de rechazo.

5. Valor P o p-valor.El p-valor o valor p es el mınimo nivel de significancia bajo la cual H0 es rechazada.Tenemos que

(a) P-valor ≤ α ⇒ Rechazar H0 al nivel α.

(b) P-valor > α ⇒ No rechazar H0 al nivel α.

6. Comentarios acerca de los terminos “aceptar” y “rechazar”.Al “aceptar” una hipotesis nula, no estamos asegurando necesariamente que haya muchoen su favor. Una afirmacion mas precisa, aunque mas pedante, sobre la situacion puede ser“los datos disponibles no proporcionan suficiente evidencia para rechazar la hipotesis nula,dado que queremos fijar en α la probabilidad de rechazar una hipotesis nula que es cierta”.

Por esta razon, algunos autores prefieren la frase “no se rechaza la hipotesis nula” enlugar de “se acepta la hipotesis nula”. Nosotros seguiremos usando “aceptar” como unamanera eficiente de expresar esta idea, pero es importante tener en cuenta la interpretacionde la frase.

La situacion es muy similar a la de un tribunal de justicia, donde el acusado, al prinicipio,goza de la presuncion de inocencia, y la acusacion debe presentar evidencia contraria losuficientemente clara como para conseguir un veredicto de culpabilidad.

En el contexto de la prueba de hipotesis clasica, la hipotesis nula se considera ciertainicialmente. La tarea de persuadirnos de lo contrario corresponde a los datos de lamuestra.

Page 87: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.2 Pruebas para algunos parametros poblacionales 86

8.2 Pruebas para algunos parametros poblacionales

CONTRASTES PARA LA MEDIA POBLACIONAL

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de medias.

2. Las distribuciones a utilizar seran la normal o la t de Student con ν = n − 1 grados delibertad.

3. La region crıtica es la region sombreada que aparece en la figura 8.2.

4. A los valores a, b, c y d que aparecen en la figura 8.2 se les llamara valores crıticos.

¿HIPOTESIS ¿HIPOTESIS ¿REGION ¿VALORNULA? ALTERNATIVA? CRITICA? CRITICO?

1. H0 : µ ≥ k H1 : µ < k Figura 8.2(a) a = −Zα o a = −tα

2. H0 : µ ≤ k H1 : µ > k Figura 8.2(b) b = Zα o b = tα

3. H0 : µ = k H1 : µ 6= k Figura 8.2(c) c = −Zα/2 y d = Zα/2

oc = −tα/2 y d = −tα/2

Tabla 8.1: Resumen acerca contrastes relacionadas con la media poblacional

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

a

(a) H1 : µ < k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

b

(b) H1 : µ > k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

c d

(c) H1 : µ 6= k

Fig. 8.2: Region crıtica para diferentes pruebas relacionadas con medias

Page 88: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.2 Pruebas para algunos parametros poblacionales 87

CONTRASTES PARA LA DIFERENCIA DE MEDIAS POBLACIONALES(MUESTRAS INDEPENDIENTES)

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de difer-encia de medias.

2. Utilizaremos la normal o la t de Student (los grados de libertad dependen de la situaci”onque tengamos en el problema).

3. La region crıtica es la region sombreada que aparece en la figura 8.3.

4. A los valores a, b, c y d que aparecen en la figura 8.3 se les llamara valores crıticos.

¿HIPOTESIS ¿HIPOTESIS ¿REGION ¿VALORNULA? ALTERNATIVA? CRITICA? CRITICO?

1. H0 : µ1 − µ2 ≥ k H1 : µ1 − µ2 < k Figura 8.3(a) a = −Zα o a = −tα

2. H0 : µ1 − µ2 ≤ k H1 : µ1 − µ2 > k Figura 8.3(b) b = Zα o b = tα

3. H0 : µ1 − µ2 = k H1 : µ1 − µ2 6= k Figura 8.3(c) c = −Zα/2 y d = Zα/2

oc = −tα/2 y d = −tα/2

Tabla 8.2: Resumen acerca contrastes relacionadas con la media poblacional

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

a

(a) H1 : µ1 − µ2 < k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

b

(b) H1 : µ1 − µ2 > k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

c d

(c) H1 : µ1 − µ2 6= k

Fig. 8.3: Region crıtica para diferentes pruebas relacionadas con medias pobla-cionales

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIASPOBLACIONALES (MUESTRAS DEPENDIENTES O PAREADAS)

Al definir X1 − X2 =: X y al considerar el problema de determinar la distribucion muestral deX, los diferentes supuestos que se deben tener en cuenta, coinciden con los que aparecen en latabla 6.1 y los contrstes son los mismos que los que ilustran en la tabla 8.2.

Page 89: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.2 Pruebas para algunos parametros poblacionales 88

INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de pro-porciones muestrales.

2. La distribucion a utilizar sera la normal.

3. La region crıtica es la region sombreada que aparece en la figura 8.4.

4. A los valores a, b, c y d que aparecen en la figura 8.4 se les llamara valores crıticos.

¿HIPOTESIS ¿HIPOTESIS ¿REGION ¿VALORNULA? ALTERNATIVA? CRITICA? CRITICO?

1. H0 : p ≥ k H1 : p < k Figura 8.4(a) a = −Zα

2. H0 : p ≤ k H1 : p > k Figura 8.4(b) b = Zα

3. H0 : p = k H1 : p 6= k Figura 8.4(c) c = −Zα/2 y d = Zα/2

Tabla 8.3: Resumen acerca contrastes relacionadas con la proporcion poblacional

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

a

(a) H1 : p < k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

b

(b) H1 : p > k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

c d

(c) H1 : p 6= k

Fig. 8.4: Region crıtica para diferentes pruebas relacionadas con proporciones pobla-cionales

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONESPOBLACIONALES

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de difer-encia de proporciones muestrales.

2. La distribucion a utilizar sera la normal.

3. La region crıtica es la region sombreada que aparece en la figura 8.7.

4. A los valores a, b, c y d que aparecen en la figura 8.7 se les llamara valores crıticos.

Page 90: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.2 Pruebas para algunos parametros poblacionales 89

¿HIPOTESIS ¿HIPOTESIS ¿REGION ¿VALORNULA? ALTERNATIVA? CRITICA? CRITICO?

1. H0 : p1 − p2 ≥ k H1 : p1 − p2 < k Figura 8.7(a) a = −Zα

2. H0 : p1 − p2 ≤ k H1 : p1 − p2 > k Figura 8.7(b) b = Zα

3. H0 : p1 − p2 = k H1 : p1 − p2 6= k Figura 8.7(c) c = −Zα/2 y d = Zα/2

Tabla 8.4: Resumen acerca contrastes relacionadas con la diferencia de proporcionespoblacionales

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

a

(a) H1 : p1 − p2 < k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

b

(b) H1 : p1 − p2 > k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

c d

(c) H1 : p1 − p2 6= k

Fig. 8.5: Region crıtica para diferentes pruebas relacionadas con diferencia de pro-porciones poblacionales

CONTRASTES PARA LA VARIANZA POBLACIONAL

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de lavarianza muestral

2. La distribucion a utilizar sera la chi-cuadrada con ν = n − 1 grados de libertad.

3. La region crıtica es la region sombreada que aparece en la figura 8.6.

4. A los valores a, b, c y d que aparecen en la figura 8.6 se les llamara valores crıticos.

5. Es importante tener en cuenta que, para la distribucion chi-cuadrada con ν grados delibertad se cumple que, si ν > 40, entonces,

χ2α,ν ≈ ν

(1 −

2

9ν+ zα

√2

)3

.

¿HIPOTESIS ¿HIPOTESIS ¿REGION ¿VALORNULA? ALTERNATIVA? CRITICA? CRITICO?

1. H0 : σ2 ≥ k H1 : σ2 < k Figura 8.6(a) a = χ21−α

2. H0 : σ2 ≤ k H1 : σ2 > k Figura 8.6(b) b = b = χ2α

3. H0 : σ2 = k H1 : σ2 6= k Figura 8.6(c) c = χ21−(α/2)

y d = χ2α/2

Tabla 8.5: Resumen para pruebas relacionadas con la varianza poblacional

Page 91: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.2 Pruebas para algunos parametros poblacionales 90

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

a

(a) H1 : σ2 < k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

b

(b) H1 : σ2 > k

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

c d

(c) H1 : σ2 6= k

Fig. 8.6: Region crıtica para pruebas relacionadas con la varianza poblacional

CONTRASTES PARA LA RAZON DE VARIANZAS POBLACIONALES

1. Tener en cuenta los supuestos de la tabla relacionada con distribucion muestral de la razonde varainzas muestrales.

2. La distribucion a utilizar sera la F de Fisher con ν1 = n1 − 1 y ν2 = n2 − 1 grados delibertad.

3. La region crıtica es la region sombreada que aparece en la figura 8.7.

4. A los valores a, b, c y d que aparecen en la figura 8.7 se les llamara valores crıticos.

¿HIPOTESIS ¿HIPOTESIS ¿REGION ¿VALORNULA? ALTERNATIVA? CRITICA? CRITICO?

1. H0 : σ21 ≥ σ2

2 H1 : σ21 < σ2

2 Figura 8.7(a) a = F1−α

2. H0 : σ21 ≤ σ2

2 H1 : σ21 > σ2

2 Figura 8.7(b) b = Fα

3. H0 : σ21 = σ2

2 H1 : σ21 6= σ2

2 Figura 8.7(c) c = F1−(α/2) y d = Fα/2

Tabla 8.6: Resumen de pruebas relacionadas con razon de varianzas

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

a

(a) H1 : σ21 < σ2

2

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

b

(b) H1 : σ21 > σ2

2

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

c d

(c) H1 : σ21 6= σ2

2

Fig. 8.7: Region crıtica para pruebas relacionadas con razon de varianzas

Page 92: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.3 Aplicaciones 91

8.3 Aplicaciones

Ejemplo 8.3.1 Como parte de un proceso de ensamblaje, se usa un taladro para haceragujeros en una lamina de metal. Cuando el taladro funciona adecuadamente, los diametrosde estos agujeros tienen una distribucion normal con media de 2 centımetros y desviaciontıpica de 0,06 centımetros. Periodicamente, se miden los diametros de una muestra aleato-ria de agujeros para controlar que el taladro funciona adecuadamente. Asumamos que ladesviacion tıpica no varıa. Una muestra aleatoria de nueve medidas da un diametro mediode 1,95 centımetros. Probar la hipotesis de que la media poblacional es 2 centımetros frentea la alternativa de que no es ası. Use un nivel de significancia de 0,05.SOLUCION:Sea µ el diametro medio poblacional (en centımetros). Entonces, queremos contrastar lashipotesis

H0 : µ = 2 versus H1 : µ 6= 2.

Tenemos que la poblacion es normal, σ = 0, 06 (conocida), n = 6 y x = 1, 95. El valor delestadıstico de prueba esta dado por Z = −2, 50 y para una prueba al nivel del 5%, tenemosque α = 0, 05 y Zα/2 = Z0,025 = 1, 96. Entonces, se rechaza la hipotesis nula al nivel designificancia del 5%.

Ejemplo 8.3.2 De una muestra aleatoria de 802 clientes de supermercados, suponga que378 pagaron sus artıculos con tarjetas de credito. Contrastar el nivel del 10%, la hipotesisnula de que al menos la mitad de los compradores pagan sus artıculos con tarjetas de creditofrente a la alternativa de que la proporcion poblacional es menor de la mitad.SOLUCION:Sea p la proporcion poblacional de compradores que pagan sus artıculos con tarjetas decredito. Queremos probar la hipotesis

H0 : p ≥ 0, 50 versus H1 : p < 0, 50.

Tenemos que p0 = 0, 50, n = 802 (≥ 30), p = 378/802 = 0, 471. El valor del estadısticode prueba es Z = −1, 64. Para una prueba al nivel del 10%, tenemos que α = 0, 10 yZα = Z0,10 = 1, 28. Entonces, se rechaza la hipotesis nula al nivel de significancia del 10%.

Ejemplo 8.3.3 Un rector de cierta universidad afirma que la proporcion de hombres quetienen auto en el campus es mayor a la proporcion de mujeres que tienen auto en el campus.Un profesor de estadıstica se interesa en la afirmacion y entrevista aleatoriamente a 100hombres y a 100 mujeres. Encuentra que 34 hombres y 27 mujeres tienen autos en elcampus. ¿Puede concluirse con un nivel del 5% que la afirmacion del rector es falsa?SOLUCION:Sean p1 y p2 las proporciones poblacionales de hombres y mujeres, respectivamente, quetienen auto en el campus. Entonces, queremos contrastar la hipotesis nula

H0 : p1 − p2 ≤ 0 versus H1 : p1 − p2 > 0.

Los datos muestrales son

n1 = 100, p1 =34

100= 0, 34, n2 = 100, p2 =

27

100= 0, 27.

Con estos valores, el estimador comun bajo la hipotesis nula es p0 = 0, 305 y el estadısticode prueba esta dado por Z = 1, 075. Para una prueba al nivel del 5%, tenemos que α = 0, 05

y Zα = Z0,05 = 1, 64. Entonces, al nivel de significancia del 5%, no se rechaza la hipotesisnula de que la proporcion de hombres que tienen auto en el campus es menor o igual a laproporcion de mujeres que tienen auto en el campus. Es decir, los datos muestran que laafirmacion del rector es falsa.

Page 93: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.3 Aplicaciones 92

Ejemplo 8.3.4 En un establecimiento escolar suburbano, se selecciono al azr una mues-tra aleatoria de 25 alumnos de quinto grado (grupo 1) de una poblacion de estudiantesperteneciente a familias en que ambos padres trabajan. Se selecciono tambien una muestraaleatoria al azar de 15 estudiantes (grupo 2) del mismo grado y establecimiento escolar entreaquellos estudiantes que pertenecen a familias en que solamente el padre trabaja. El analisisde los puntajes de rendimiento escolar (en escala de 1 a 100) de los dos grupos dio los sigu-ientes resultados: un puntaje promedio de 78 para el grupo 1 y de 85 para el grupo 2. Laexperiencia muestra que las poblaciones de puntajes para ambos grupos estan distribuidasen forma aproximadamente normal, con varianzas de σ2

1 = 81 y σ22 = 25. Utilizando un

nivel de significancia del 5% y con base en estos datos, determinar si se puede concluir que lamedia de la poblacion de la que se selecciono el grupo 1 es inferior a la media de la poblacionde la que se selecciono el grupo 2.SOLUCION:Sean µ1 y µ2 las respectivas medias poblacionales de puntajes promedios. Al plantear lashipotesis del problema, obtenemos

H0 : µ1 ≥ µ2 o su equivalente H0 : µ1 − µ2 ≥ 0;H1 : µ1 < µ2 o su equivalente H1 : µ1 − µ2 < 0.

Ahora, tenemos que

n1 = 25, x1 = 78, σ21 = 78;

n2 = 15, x2 = 85, σ22 = 85.

El valor del estadıstico de prueba esta dado por Z = −3, 16. Para una prueba al nivel del5%, tenemos que α = 0, 05 y Zα = Z0,05 = 1, 64. Entonces, se rechaza la hipotesis nula alnivel de significancia del 5%. Por lo tanto, se concluye que en ese establecimiento escolar,los puntajes promedios generales de rendimiento de los estudiantes de quinto grado quepertenecen a familias en que ambos padres trabajan son inferiores a los de los estudiantesque pertenecen a familias en que solamente el padre trabaja.

Ejemplo 8.3.5 Se llevo a cabo un experimento para comparar el deterioro abrasivo de dosmateriales laminados diferentes. Se probaron doce piezas del material 1, exponiendo cadauna a una maquina para medir el deterioro. De la misma manera, se probaron diez piezasdel material 2. En cada caso, se observo la profundidad del deterioro. Las muestras delmaterial 1 dieron un deterioro promedio (registrado) de 85 unidades con una desviacionestandar muestral de 4, mientras que las muestras del material 2 dieron un promedio de 81y una desviacion estandar muestral de 5. ¿Puede concluirse en el nivel de significancia del5% que el deterioro abrasivo del material 1 excede al del material 2 por mas de 2 unidades?Asuma que las poblaciones son aproximadamente normales con varianzas iguales.SOLUCION:Sean µ1 y µ2 las respectivas medias poblacionales para las piezas de los materiales 1 y 2.Queremos contrastar la hipotesis

H0 : µ1 − µ2 = 0 versus H1 : µ1 − µ2 > 0.

Tenemos que

n1 = 12, x1 = 85, s1 = 4;n2 = 10, x2 = 81, s2 = 5.

La varianza poblacional comun se estima como s2 = 20, 05. Ademas, el valor del estadısticode prueba esta dado por t = 1, 04. Para una prueba al nivel del 5%, tenemos que α = 0, 05

y tα = t0,05 = 1, 725 con 20 grados de libertad. Entonces, no puede rechazarse la hipotesisnula de igualdad de medias frente a la alternativa unilateral al nivel del 5%. Por lo tanto,no se esta en condiciones de concluir que el deterioro abrasivo del material 1 excede al delmaterial 2 por mas de dos unidades.

Page 94: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

8.3 Aplicaciones 93

Ejemplo 8.3.6 El departamento de zoologıa de cierto instituto llevo a cabo un estudio paraestimar la diferencia en la cantidad de cierta sustancia quımica medida en dos estacionesdiferentes de un rıo. La sustancia se mide en miligramos por litro. Se reunieron 15 muestrasde la estacion 1 y 12 muestras de la estacion 2. Las 15 muestras de la estacion 1 tuvieronun contenido promedio de sustancia quımica de 3,84 miligramos por litro y una desviacionestandar de 3,07 miligramos por litro, mientras que las 12 muestras de la estacion 2 tuvieronun contenido promedio de 1,49 miligramos por litro y una desviacion estandar de 0,80miligramos por litro. Al nivel del 5% determine si los contenidos promedios reales de sutanciaen estas dos estaciones son diferentes. Suponga que las observaciones vienen de poblacionesnormalmente distribuidas con varianzas diferentes.SOLUCION:Sean µ1 y µ2 las respectivas medias poblacionales para contenidos promedios reales desutancia en las dos estaciones. Queremos contrastar la hipotesis

H0 : µ1 − µ2 = 0 versus H1 : µ1 − µ2 6= 0.

Tenemos que

n1 = 15, x1 = 3, 84, s1 = 3, 07, n2 = 12, x2 = 1, 49, s2 = 0, 80.

El valor del estadıstico de prueba esta dado por t = 2, 846. Para una prueba al nivel del 5%,tenemos que α = 0, 05 y tα/2 = t0,025 = 2, 120 con 16 grados de libertad. Entonces, puederechazarse la hipotesis nula de igualdad de medias frente a la alternativa bilateral al niveldel 5%. Por lo tanto, podemos concluir que los contenidos promedio reales de sustanciapara estos dos lugares son diferentes (comparese este resultado con el obtenido en el ejemplo7.4.7).

Ejemplo 8.3.7 Con el fin de cumplir las normas establecidas, es importante que la varianzaen el porcentaje de impurezas de unas remesas de productos quımicos no supere el 4%.Una muestra aleatoria de 20 envıos dio una varianza muestral de 5,62 en el porcentaje deimpureza. Al nivel del 10%, contrastar la hipotesis nula de que la varianza de la poblacionno es mayor que 4. Supongase que la distribucion de la poblacion es normal.SOLUCION:Sea σ2 la varianza poblacional de la concentracion de impureza. Queremos contrastar lahipotesis

H0 : σ ≤ 4 versus H1 : σ > 4.

Tenemos que s2 = 5, 62, n = 20 y σ20 = 4. El valor del estadıstico de prueba esta dado

por χ2 = 26, 695. Para una prueba al nivel del 10%, tenemos que α = 0, 10 y χ2α(19) =

χ20,10(19) = 27, 20 con 19 grados de libertad. Entonces, no puede rechazarse la hipotesis

nula al nivel del 10%. Por lo tanto, los datos no contienen una evidencia particularmenteimportante contra la hipotesis de que la varianza poblacional del porcentaje de impureza noes mayor que 4.

Ejemplo 8.3.8 Se compararon las varianzas de los vencimientos de dos tipos de bonos.Para una muestra aleatoria de 17 bonos del primer tipo, la varianza de los vencimientos (enanos al cuadrado) fue de 123,35. Para una muestra aleatoria independiente de 11 bonosdel segundo tipo, la varianza de los vencimientos fue de 8,02. Al nivel del 2%, determinarsi las dos varianzas poblacionales son diferentes. Asuma que las dos poblaciones tienendistribucion normal.SOLUCION:Sean σ2

1 y σ22 las respectivas varianzas poblacionales. Queremos contrastar la hipotesis

H0 : σ21 = σ2

2 versus H1 : σ21 6= σ2

2.

Page 95: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 8. Ejercicios 94

Para este ejemplo,

n1 = 17, s21 = 123, 35, n2 = 11, s2

2 = 8, 02.

El valor del estadıstico de prueba esta dado por F = 15, 38. Para una prueba al niveldel 2%, tenemos que α = 0, 02 e, interpolando, Fα/2(16, 10) = F0,01(16, 10) = 4, 53 conν116 y ν2 = 10 grados de libertad. Podemos rechazar la hipotesis nula al nivel del 5%.Por consiguiente, hay abrumadora evidencia de que las varianzas en los vencimientos sondiferentes para estos dos tipos de bonos.

Ejercicios

1. Una muestra aleatoria de 100 muertes registradas en cierto paıs durante el ano pasadomostro una vida promedio de 71,8 anos. Suponiendo una desviacion estandar poblacionalde 8,9 anos, ¿parecerıa esto indicar que la vida promedio hoy en dıa es mayor que 70 anos?Utilice un nivel de significancia del 5%.

2. Un doctor afirma que el 12% de todas las citas son canceladas durante un periodo de seissemanas. Se sabe que fueron canceladas 21 de las 200 citas del doctor. Haga una pruebacon un nivel de significancia del 5% para determinar si la verdadera proporcion de todaslas citas que son canceladas es diferente del 12%.

3. De una muestra aleatoria de 203 anuncios publicados en revistas colombianas, 52 erande deportes. De una muestra aleatoria independiente de 270 anuncios publicados enrevistas brasileras, 56 eran de deportes. Usando un nivel del 5%, constrastar frente a unaalternativa bilateral, la hipotesis nula de que las proporciones de anuncios comicos de lasrevistas colombianas y americanas son iguales.

4. Se llevo a cabo un estudio entre expertos matematicos para conocer su opinion sobrelas mujeres matematicas. Se les pidio que evaluaran en una escala de 1 (totalmente endesacuerdo) a 5 (totalmente de acuerdo) la afirmacion: “Las mujeres matematicas tienenla misma oferta de trabajo que los hombres”. Para una muestra aleatoria de 186 hombresde esta profesion, la respuesta media fue de 4.059 con una desviacion tıpica de 0,839. Parauna muestra aleatoria independiente de 172 mujeres matematicas, la respuesta media fue3.680 con una desviacion tıpica de 0,966. Utilize un nivel de significancia del 5% paracontrastar la hipotesis nula de que las dos medias poblacionales son iguales frente a laalternativa de que la verdadera media es mayor para los hombres.

5. Se llevo a cabo un estudio que pretendıa valorar el efecto de la presencia de un moderadorsobre el numero de ideas generadas por un grupo. Se observaron cuatro miembros, con ysin moderadores. Para una muestra aleatoria de cuatro grupos con moderador, el numeromedio de ideas generadas por grupo fue de 78, con una desviacion tıpica de 24,4. Parauna muestra aleatoria independiente de cuatro grupos sin moderardor, el numero medio deideas generadas por grupo fue de 63,5, con una desviacion tıpica de 20,2. Asumiendo quelas distribuciones poblacionales son normales con igual varianza, contrastar la hipotesisnula de que las medias poblacionales son iguales frente a la alternativa de que la verdaderamedia es mayor para los grupos con moderador. Use un nivel de significancia del 10%.

6. La varianza calculada de los puntajes en lectura de los estudiantes de tercer grado delsistema escolar A, obtenidos durante 10 anos, es 1,44. Una muestra aleatoria de 21estudiantes de tercer grado de otro sistema escolar (B) con quienes se practico la mismaprueba de lectura, arrojo una varianza de s2 = 1, 05. ¿Proporcionan estos datos evidenciasuficiente como para concluir, al nivel de significancia 0,05, que los puntajes de los alumnosde tercer grado del sistema B son menos variables de que los de los estudiantes del sistemaA? Suponga que los puntajes de los estudiantes de tercer del sistema B estan normalmentedistribuidos.

Page 96: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 8. Ejercicios 95

7. Al probar la diferencia en el desgaste abrasivo de los dos materiales en el ejemplo 8.3.5, seasumio que las varianzas poblacionales desconocidas eran iguales. ¿Es esta justificacioncorrecta? Utilice un nivel de significancia del 10%.

8. En 1879, A.A. Michelson hizo 100 determinaciones de la velocidad de la luz en el aireempleando una modificacion del metodo propuesto por el fısico frances Foucault. Losdatos estan en miles de km/s. Los datos estan recogidos en la primera columna delarchivo luz.sf. Suponiendo que los datos corresponden a una distribucion normal,

(a) estimar la media y la desviacion tıpica de la distribucion.

(b) Obtener un intervalo de confianza del 95% para la media y la desviacion tıpica de ladistribucion.

(c) Contrastar2 la hipotesis nula H0 : µ = 299.782, 5Km/s frente a H1 : µ 6= 299.782, 5

con α = 0, 05.

9. En 1879, el fısico norteamericano Albert A. Michelson tomo 100 medidas de la velocidadde la luz en el aire empleando una modificacion del metodo propuesto por el fısico francesFoucault. Las medidas que tomo se proporcionan en la primera columna del archivoluz.sf3 (en miles de km/s).

(a) Analice numerica y graficamente estos datos. Genere el histograma, el diagrama decajas y el diagrama de tallo y hojas y proporcione los principales estadısticos quecaracterizan a este conjunto de datos.

(b) Contraste la normalidad de los datos graficamente (grafico probabilista normal).

(c) Admitiendo que estos datos proceden de una distribucion normal proporcione losvalores de los estimadores de la misma por el metodo de maxima verosimilitud.

10. Simon Newcomb midio el tiempo que una senal luminosa tardaba en recorrer una distanciade 7.400 metros. Los datos se proporcionan en nanosegundos (hay 109 nanosegundos enun segundo) y estan recogidos en la segunda columna del archivo luz.sf3.

(a) Analice numerica y graficamente estos datos. ¿Se detecta algun valor atıpico mediantelos diagramas de cajas y de tallo y hojas?

(b) Transforme estos datos a velocidades y analıcelos ¿Se detecta algun valor atıpicomediante los diagramas de cajas y de tallo y hojas?

(c) Si hubiere valores atıpicos elimınelos del analisis y compruebe la normalidad de losdatos restantes mediante diferentes graficos.

(d) Admitiendo que estos datos proceden de una distribucion normal, proporcione losvalores de los estimadores de la misma por el metodo de maxima verosimilitud.

(e) Compare graficamente los datos de la velocidad de la luz de Newcomb y de Michelson(diagramas de cajas e histogramas).

11. Se ha registrado el numero de ninas en familias de 12 hijos nacidas entre 1879 y 1936 paraunas comunidades de granjeros que habitaban en los Estados Unidos de Norteamerica yCanada. Los datos se muestran en el archivo demografia.sf3.

(a) Analice numerica y graficamente estos datos. Admitiendo equiprobabilidad de nacimientode nino y nina en cualquier embarazo ¿que tipo de distribucion deberıan seguir estosdatos?

(b) Estime la fraccion media de ninas en ese tipo de familias.

2Actualmente se toma 299.792,5 km/s como la velocidad de la luz en el vacıo.

Page 97: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Cap. 8. Ejercicios 96

12. Los circuitos integrados se construyen sobre obleas de silicio, que son discos de 20 cm dediametro y muy poco espesor (entre 200-300 micras). En una de las etapas iniciales defabricacion se toman obleas de silicio y se introducen en una esmeriladora (grinder) hastaconseguir el espesor deseado. En el archivo obleas.sf3 se presentan 150 medidas de espesorde obleas de silicio, que corresponden a una planta holandesa de fabricacion de circuitosintegrados de Philips. El espesor deseado es 245 micras. Realizar la estimacion puntualy obtener los intervalos de confianza para la media y la desviacion tıpica (α = 0, 01)suponiendo distribucion normal. Contrastar la hipotesis nula H0 : µ = 245 micras frentea H1 : µ 6= 245 con α = 0, 05.

13. Los laboratorios Merck llevaron a cabo un experimento para evaluar el efecto de un nuevomedicamento. Se inyecto a diecinueve ratas de pantano una dosis de 12,5 mg de la droga.Se eligieron al azar, de la camada de cada una de estas ratas, un macho y una hembrapara tirarlos a una piscina. Cada rata era colocada en un extremo de la piscina y se ladejaba nadar hasta que escapaba por el otro extremo. Si no conseguıa escapar al cabode un cierto tiempo se le daba otra oportunidad. El experimento se repetıa hasta quela rata conseguıa escapar tres veces. El archivo de datos merck.sf3 presenta el numerode pruebas necesarias para que cada animal consiguiese los tres exitos. ¿Hay evidenciade diferencias en el numero de intentos que necesitan machos y hembras para superar laprueba?

14. En el archivo de datos gemelos.sf3 mostramos los resultados de tests de inteligenciarealizados a parejas de gemelos monozigoticos. Los gemelos monozigoticos se formanpor la division en dos de un mismo ovulo ya fecundado y, por tanto, tienen la mismacarga genetica. Al mismo tiempo, por razones obvias, es muy frecuente que compartan elentorno vital y es difıcil separar ambos factores. En el conjunto de datos, los datos de lacolumna A corresponden al gemelo criado por sus padres naturales, los de la columna Bal criado por un familiar u otra persona.

(a) Analice numerica y graficamente, por separado, los datos correspondientes a cadauno de estos dos tipos de gemelos.

(b) Calcule el coeficiente de correlacion entre los cocientes de inteligencia de ambos tiposde gemelos.

(c) Estudie si existen diferencias significativas entre los promedios de inteligencia de am-bos tipos de gemelos.

15. El Insitol es un alcohol cıclico de estructura compleja que se utiliza para combatir ladepresion. Tambien se ha utilizado en investigacion psiquiatrica contra el panico. Paraprobar esta teorıa se ha realizado un estudio doblemente ciego placebo con 21 pacientes alos que se habıa diagnosticado panico. Los pacientes apuntaban en un diario sus ataquesde panico. En el archivo insitol.sf3 se muestran los datos correspondientes a una semanadurante la cual se les habıa administrado una dosis de placebo y otra semana en la cualse les habıa administrado Insitol. Estudie si el uso de Insitol reduce significativamente elnumero de ataques de panico.

16. Se ha investigado la relacion entre la temperatura media del aire y la temperatura de laenvoltura de gusanos en el Artico. En diferentes dıas se han tomado las temperaturasmedias del aire y dentro de la envoltura de estos gusanos (grados centıgrados). Los datosdel archivo gusanos.sf3 indican que la temperatura del gusano dentro de la envoltura essuperior a la temperatura del aire exterior.

(a) Estime la diferencia media entre las temperaturas de la envoltura y del aire exterior.

(b) Contraste si la temperatura dentro de la envoltura es superior en al menos cuatrogrados centıgrados a la temperatura media del aire.

Page 98: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

A

Guıa rapida para trabajar conStatgraphics

A.1 Analisis de un solo conjunto de datos

1. Abrir el archivo de datos calles.sf3.

2. Seleccionamos Describe . . . Numeric Data . . . One-Variable Analysis.

3. Elegimos Data = Longitud y pulsamos la opcion OK.

4. Sale la llamada ventana del analisis. Los ıconos principales de esta ventana son:

• Input dialog (ıcono de dialogos): para seleccionar o cambiar variables dentro delarchivo y analisis seleccionado.

• Tabular options (ıcono de opciones tabulares): medidas estadısticas, percentiles,tablas de frecuencia, inferencias, etc.

• Graphical options (ıcono de opciones graficas): diagramas de dispersion, histogra-mas, etc.

• Save results (ıcono de salvar resultados): permite salvar los resultados del analisis.

5. Transformacion de una variable:1 OneVariable Analysis, activar el boton Transform y, enOperators, elegir logaritmo.

A.2 Analisis simultaneo de dos o mas conjuntos de datos

1. Compare . . . Two Samples . . . Two Sample Comparison . . .

2. Para obtener diagramas de cajas multiples: Compare . . . Multiple Samples . . . Multiple-Sample Comparison . . . Multiple Data Columns . . . Ok . . . Samples= (en esta ultimaopcion mencionar los datos que queremos comparar)

3. Para obtener diagramas de cajas multiples: Plot . . . Exploratory Plots . . . Multiple Box-and-Whishker Plot . . . Data=distancia . . . Level codes=year . . .

1Por ejemplo, si quisieramos trabajar con el logaritmo de la variable escribimos LOG(longitud)en vez de longitud

Page 99: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

A.3 Graficos de dispersion 98

A.3 Graficos de dispersion

Con la opcion Plot. . .Scatterplots se pueden realizar:

1. Graficos univariantes (Univariate Plot). Por ejemplo, abrir archivo de datos autos.sf3 yutilizar la variable mpg.

2. Graficos bidimensionales X-Y simples (X-Y plot) y multiples (Multiple X-Y Plot). Porejemplo, abrir archivo de datos autos.sf3 y hacer Y=mpg y X=potencia. Sobre la grafica,pulsar boton derecho del raton y elegir Pane options. Aparece una pantalla con varioscampos. Elegir Point Codes=model.

3. Graficos tridimensionales X-Y-Z simples (X-Y-Z plot) y multiples (Multiple X-Y-Z Plot).Por ejemplo, abrir archivo de datos autos.sf3 y hacer X=accel, Y=cilindro, Z=price.Sobre la zona grafica: boton derecho, Pane options, Point Codes=origin.

4. Graficos de matriz (Matriz Plot).

5. Graficos en coordenadas polares (Polar Coordinates Plot).

A.4 Diagramas de presentacion

Con la opcion Plot. . .Business Charts se pueden realizar (abrir siempre el archivo autos.sf3):

1. Graficos de barras simples (Barchart). Por ejemplo, realizar un grafico de barras para lavariable origin del archivo autos.sf3, que contiene el paıs de origen de los autos. Losvalores de la variable origin son 1 para los autos norteamericanos, 2 para autos europeos y3 para autos japoneses. En esta opcion sale, entre otros, el campo Counts (Frecuencias)que permite introducir la variable que contiene las frecuencias absolutas de los valores dela variable a graficar. Como las frecuencias absolutas de de los valores de la variable originson: 85 para autos norteamericanos, 26 para autos europeos y 44 para autos japoneses,entonces, por esta razon, debemos escribir en este campo join3(85;26;44). Ademas, elcampo Labels (Etiquetas) permite introducir el nombre de la variable que contiene lasetiquetas a utilizar para cada barra del grafico. Como las etiquetas de los valores de lavariable origin estan contenidas carmakers, que son America, Europe y Japan, hacemosLabels=carmakers.

2. Graficos de barras multiples (Multiple Barchart). Por ejemplo, realizaremos un graficode barras dobles para las variables origin y year del archivo autos.sf3, que contienen elpaıs de origen de los autos y el ano de construccion, respectivamente. Los valores de lavariable year son los intervalos 1978, [1979,1980] y [1981,1982]. Aparecen, entre otros,los siguientes campos:

• Columns (Columnas): En este campo se introducen las variables que contienen lasfrecuencias absolutas de los valores de las variables a graficar, o una expresion deStatgtraphics que contiene operadores y que genera sus valores. Como las frecuen-cias absolutas de de los valores de la variable origin son: 85 para autos norteamer-icanos, 26 para autos europeos y 44 para autos japoneses, y como las frecuenciasabsolutas de los valores de la variable year son: 36 para 1978, 58 para [1979,1980]y 61 para [1981,1982], entonces, por esta razon, debemos escribir en este campojoin3(85;26;44) y join3(36;58;61).

• Labels (Etiquetas): Hacemos Labels=carmakers.

3. Graficos de sectores (Piechart). Por ejemplo, realizaremos un grafico de sectores para lavariable origin del archivo autos.sf3, que contienen el paıs de origen de los autos y el anode construccion, respectivamente. Los valores de la variable origin son 1 para los autos

Page 100: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

A.5 Variables numericas multidimensionales 99

norteamericanos, 2 para autos europeos y 3 para autos japoneses. Aparecen, entre otros,los siguientes campos:

• Counts (Frecuencias): En este campo se introducen las variables que contienen lasfrecuencias absolutas de los valores de las variables a graficar, o una expresion deStatgtraphics que contiene operadores y que genera sus valores. Como las frecuen-cias absolutas de de los valores de la variable origin son: 85 para autos norteameri-canos, 26 para autos europeos y 44 para autos japoneses, entonces, por esta razon,debemos escribir en este campo join3(85;26;44).

• Labels (Etiquetas): En este campo se debe introducir el nombre de la variable quecontiene las etiquetas a utilizar para cada grupo de barras del grafico. Como lasetiquetas de los valores de la variable origin estan contenidas carmakers, que sonAmerica, Europe y Japan, hacemos Labels=carmakers.

4. Graficos de componentes de lıneas (Component Line Chart)

5. Graficos de escogencias alta y baja (High-Low-Chose Chart).

A.5 Variables numericas multidimensionales

Seleccione la siguiente secuencia de opciones: Describe. . .Numeric Data. . .Multiple-VariableAnalysis y aparecen todas las variables del archivo. Aparece una ventana de dialogo en cuyocampo Data introducimos la variables origin, price y year. Luego, pulsamos el boton OK.

A.6 Distribuciones de probabilidad

Plot . . . Probability Distributions. Escogemos la distribucion deseada. Los valores de losparametros que definen la distribucion (estan fijados por defecto por el programa) los pode-mos modificar si pulsamos el boton derecho del raton y escogemos la opcion Analysis Options.

A.7 Inferencias basadas en una sola muestra

1. Se escoge Describe . . . Numeric Data . . . One Variable Analysis. Elegimos la variable queva a ser objeto del analisis y pulsar OK. Al pulsar el ıcono Tabular options aparecen, entreotros:

• Confidence Intervals.Calcula intervalos para la media (Confidence Interval for Mean) y la desviacion tıpica(Confidence Interval for Standard Deviation) de la distribucion. Pulsando el botonderecho del raton y escogiendo Pane Options se puede modificar el nivel de confianza(Confidence Level) y el tipo de intervalo (Interval Type).

• Hypothesis TestingSe realizan los contrastes de la media y de la desviacion tıpica. Pulsando el botonderecho del raton y escogiendo Pane options se pueden modificar el valor delparametro para la hipotesis nula (por ejemplo Mean = µ0), del nivel de signifi-cancia α (Alpha) y de la hipotesis alternativa:

2. Calculo de la curva de potencia.Describe . . . Hypothesis Test . . . Normal Mean y en Null Hypothesis se elige el valorde la media bajo la hipotesis nula. En la casilla Sample Sigma se escoge el valor de ladesviacion tıpica de la poblacion. El tamano de muestra se fija a traves de Sample Size.Seleccionando el ıcono de graficos se selecciona la unica grafica posible (curva de potencia- Power Curve) y se pulsa OK.

Page 101: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

A.8 Inferencias basadas en dos muestras 100

A.8 Inferencias basadas en dos muestras

1. Elegir Compare . . . Two Samples, en donde aparecen cuatro (4) opciones: Two SampleComparison, Paired-Sample Comparison, Hypotesis Tests, Sample-Size Determination.

2. Cuando seleccionamos Two Sample Comparison2 el programa pide al usuario que especi-fique las dos columnas de datos a comparar (Sample 1 y Sample 2). SeleccionandoTabular options aparece, entre otros:

• Comparison of Means: Intervalo de confianza para la diferencia de medias y contrastede igualdad de medias.

• Comparison of Standard Deviations: Intervalo de confianza para el cociente devarianzas y contraste de igualdad de varianzas.

• Kolmogorov-Smirnov Test: Prueba de hipotesis para saber si las distribuciones deambas muestras son identicas.

A.9 Bondad de ajuste

1. Se selecciona Describe. . . Distribution Fitting . . .Uncensured Data. Al pulsar OK se ob-tiene, entre otras, la salida de las contrastes de bondad de ajuste.

2. Si, estando situados sobre esta salida, pulsamos el boton derecho del raton y elegimosla opcion Analysis Options del menu emergente resultante, obtenemos la caja de dialogoProbability Distributios Options, que presenta todas las posibles distribuciones a considerarpara el ajuste (observamos que por defecto el ajuste se realiza a una distribucion normal).

3. Tambien aparecen los siguientes campos:

• Number of Trials (numero de ensayos).Se rellena con el numero de tiradas cuando la distribucion elegida para el ajuste esbinomial;

• Number of Successes (numero de eventos).Se rellena con el numero de exitos cuando la distribucion elegida es una binomialnegativa.

• Population Size (tamano de la poblacion).Se rellena con el tamano de la poblacion cuando la distribucion elegida es unahipergeometrica.

4. La opcion tabular Tests for Normality : realiza los contrastes de normalidad.

5. Opcion tabular Goodness-of-Fit Tests: realiza los contrastes de la bondad de ajuste delos datos a una distribucion dada.

2El procedimiento es identico cuando seleccionamos la opcion Paired-Sample Comparison

Page 102: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

B

Guıa rapida para trabajar conSPSS

B.1 Definicion de las variables

Para definir cada variable hay dos procedimientos:

• Hacer doble clic sobre el encabezamiento de la variable o

• Seleccionar, en la parte inferior, la pestana vista de variables.

Cuando se hace esto, observamos que hay una fila para cada variable del conjunto de datosy que existen 10 columnas: Nombre, Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos,Columnas, Alineacion y Medida. La definicion de una variable se basa en las opciones que seofrecen en esa ventana:

1. Asignar un nombre a cada variable, cumpliendo las siguientes reglas:

• Nombres con no mas de 8 caracteres (el primero debe ser una letra o @).

• No utilizar sımbolos como &, /, $, etc.

• No utilizar nunca espacios en blanco.

• No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO,o WITH.

2. Asignar un tipo a cada variable, indicando el maximo numero de dıgitos que deseamospara anotar las observaciones de la variable y el tipo de la variable con la que vamos atrabajar (alfanumerica, fecha, moneda o numerica) indicando en este caso el numero decifras decimales con que queremos que aparezca en el editor. SPSS permite trabajar conlos siguientes tipos de variables:

• Numericas: formato numerico estandar.

• Coma: comas de separacion cada tres posiciones. Un punto para la parte decimal.

• Punto: al contrario que el anterior.

• Notacion Cientıfica: uso de la E para exponente.

• Cadena: variable alfanumerica (de mas de 8 caracteres se considera larga).

Page 103: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

B.1 Definicion de las variables 102

• Ademas estan los formatos de fecha, dolar y moneda personalizada.

Si no escogemos el tipo, el sistema lo asigna automaticamente, siendo el formato pordefecto: Numerica 8.2 que significa: Anchura: 8 y Decimales: 2; es decir, una amplitudde columna de 8 espacios, siendo los 2 ultimos para los decimales.

3. Asignar una Etiqueta a cada variable de no mas de 120 caracteres (entre 30 y 40 es elvalor recomendado) que nos permita tener mas informacion sobre esa variable.

4. Asignar Valores: se trata de asignar etiquetas a los valores de cada variable. No esobligatorio, pero sı muy util en algunos casos.

5. Definir Perdidos: permite definir los valores de los datos especificados como perdidospor el usuario. Situese en el campo correspondiente a Perdidos de cualquier variable ypulse sobre el recuadro coloreado, aparece: Los codigos asignados a los valores ausentesdeben de ser coherentes con el tipo de variables declarado: numericos para las numericasy alfanumericos para las alfanumericas (maximo 9 caracteres). Se pueden introducir hasta3 valores perdidos (individuales) de tipo discreto, un rango de valores perdidos o unrango mas un valor de tipo discreto. Solo pueden especificarse rangos para las variablesnumericas. Estos valores ausentes son denominados por SPSS “valores ausentes definidospor el usuario” (user-defined missing values), a diferencia de los definidos por el sistema(system-missing values o sysmis). Estos ultimos corresponden a los que establece elsistema para los espacios en blanco y caracteres ilegales que puedan haber en el archivode datos. Aparecen en los listados representados por comas.

6. Definir Columnas: consiste en especificar la amplitud de la columna. Podemos hacerlotambien desde el propio archivo de datos.

7. Definir Alineacion: seleccionar la justificacion de las entradas de la columna: Izquierda,Derecha y Centrado.

8. Especificar medida. Se puede seleccionar uno de los tres niveles de medida:

• Escala: los valores de datos son numericos en una escala de intervalo. Las variablesde escala deben ser numericas.

• Ordinal : los valores de datos representan categorıas con un cierto orden intrınseco(bajo, medio, alto; totalmente de acuerdo, de acuerdo, en desacuerdo). Las variablesordinales pueden ser de cadena o valores numericos. Notar que para variables decadena ordinales, se asume que el orden alfabetico de los valores de cadena indica elorden correcto de las categorıas; en el caso de bajo, medio y alto el orden serıa alto,bajo y medio (orden que no es correcto), por lo que es mas fiable utilizar codigosnumericos para representar datos ordinales que usar etiquetas de estos codigos.

• Nominal : los valores de datos representan categorıas sin un cierto orden intrınseco.Las variables nominales pueden ser de cadena o valores numericos que representancategorıas diferentes, por ejemplo 1 = Hombre y 2 = Mujer.

B.1.1 Transformacion de una variable

Elegimos Transformar . . . Calcular, y realizamos los siguientes pasos:

1. Asignar un nombre y un tipo (por defecto sera numerica) a la nueva variable en el cuadrode texto de la Variable de destino.

2. Definir la expresion numerica que va a permitir calcular los valores de la misma. Para elloutilizaremos los nombres de las variables del archivo (podemos escribirlos o seleccionarlosdel listado que aparece), constantes, operadores y funciones.

3. Pulsar Aceptar.

Page 104: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

B.1 Definicion de las variables 103

Para construir estas expresiones pueden usarse operadores aritmeticos como +, −, *, /, ** yfunciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS, MOD10, TRUNC, RND,entre otras:

• MOD10 (Resto resultante de dividir entre 10).

• TRUNC (Parte entera de un numero).

• RND (Redondeo al entero mas cercano).

Pulsando el boton derecho sobre le nombre de la funcion, aparece su descripcion. El argumentode las funciones debe ir entre parentesis. Existen funciones particulares como UNIFORM yNORMAL, que se utilizan para la generacion de variables aleatorias. Son de bastante utilidaden estudios de simulacion.

Es importante tener cuidado con el orden de utilizacion de los operadores y no olvidar quelos valores antiguos pierden su vigencia al recodificar una variable sobre el mismo nombre.

El boton SI . . . permite realizar modificaciones similares, pero sujetas a que se verifique unacondicion logica. Se incluiran aquellos casos que verifiquen la condicion. Los que no la cumplanpasaran a ser valores ausentes definidos por el sistema.

Una expresion logica es una expresion que puede ser evaluada como verdadera o falsa en funcionde los valores de las variables en ella relacionadas. El nexo de las variables son los operadores derelacion: = , >= , <= , < , > , ~= . Es posible formar expresiones complejas, utilizando losoperadores logicos: AND (&), OR ( | ), NOT (~).

B.1.2 Recodificacion de una Variable

A partir de una variable podemos crear otra cuyos valores sean una recodificacion de los dela primera. Esta recodificacion podemos hacerla tanto en la misma variable como en variablesdiferentes. Para ello, seleccionaremos Transformar . . . Recodificar . . . En distintas variables. Seabre una ventana en la que deberemos asignar un nombre (y una etiqueta si queremos) a lanueva variable.1

B.1.3 Filtrado de datos

El programa SPSS permite seleccionar determinados casos para un proximo proceso, bien tempo-ralmente o de forma permanente, sobre la base de un criterio logico o de una decision aleatoria.Para ello seleccionaremos el menu Datos . . . Seleccionar casos. La seleccion de individuos puedeser temporal (filtrados) o permanente (eliminados). En la seleccion permanente eliminamos delarchivo activo los individuos deseados, mientras que en la temporal, la seleccion es recuperable(los casos son filtrados). En esta ultima situacion, los individuos (casos) del archivo que nosatisfacen la condicion apareceran marcados como excluidos mediante una lınea que cruza endiagonal su numero de fila. Aparece tambien una variable llamada filter$ que el sistema creapara controlar el filtrado de datos.

Especificaciones:

• Todos los casos: indica que quiere procesar todos los casos del archivo de datos de trabajo.

• Si se satisface la condicion: indica que quiere procesar solo los casos que satisfagan unacondicion logica. Para especificar o cambiar la condicion, pulse en Si. Esta alternativacrea la variable filter$, que el sistema crea para controlar el filtrado de datos.

1Cuidado!, si se selecciona . . . borraras la variable original.

Page 105: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

B.2 Analisis exploratorio de datos 104

• Muestra aleatoria de casos: indica que queremos seleccionar los casos de forma aleatoriapara su procesamiento. Si ha tecleado las especificaciones de muestreo, estas apareceranjunto al boton de comando Muestra. Si no, o si quiere cambiarlas, pulse en Muestra(veasemas adelante). Esta alternativa tambien crea la variable filter$.

• Basandose en el rango del tiempo o de los casos: permite seleccionar los casos deseadossiempre que sean consecutivos.

• Usar variable de filtro: indica que quiere utilizar los valores de una variable numericaexistente para controlar el filtrado de casos. Seleccione la variable de la lista de la izquierda.Los casos cuyo valor sea 0, o ausentes, en la variable de filtro se excluyen del analisis.

B.2 Analisis exploratorio de datos

Primero abrir el archivo de datos.

1. Tablas de frecuencias: Analizar . . . Estadısticos descriptivos . . . Frecuencias. SPSStambien cuenta con el menu alternativo Analizar . . . Tablas personalizadas que posibilitaalterar el formato del resultado.

2. Estadısticos: Analizar . . . Estadısticos descriptivos . . . Descriptivos donde hay que selec-cionar la variable o variables de interes y despues Opciones para escoger los estadısticosque interesan. Sin embargo con este menu no se pueden obtener los percentiles. Paraobtenerlos hay que usar Analizar . . . Estadısticos descriptivos . . . Frecuencias y entrar enla opcion Estadısticos en donde se seleccionan los percentiles deseados.

3. Graficos de sectores: Graficos . . . Sectores y seleccionaremos una o varias variablesapareciendo un cuadro de dialogo, cuyas opciones pasamos a comentar:

(a) Resumenes para grupos de casos: Genera un grafico en el que cada sector corre-sponde a un valor de la variable seleccionada. El tamano del sector se determina porla opcion Los sectores representan, esta opcion aparece en el cuadro de dialogo quesurge despues de pulsar el boton Definir del cuadro anterior. Tambien es posible quelos sectores representen otra cosa, como la media de los valores de otra variable, elvalor maximo, etc.; esto se consigue con la opcion Otra funcion resumen. Se puedetambien editar el grafico haciendo doble clic sobre el, con posibilidad de cambiarcolores, tramas, desgajar sectores, etc.

(b) Resumenes para distintas variables. Permite que los sectores representen variablesen lugar de grupos de casos. Cada sector representa una funcion de una determinadavariable (por ejemplo, la suma de los valores de sus casos).

(c) Valores individuales de los casos. Se resume una unica variable, los casos ya sonvalores agrupados de la variable. Cada sector representa el valor de un caso individ-ual. Con Graficos . . . Interactivos . . . Sectores podemos obtener representacionescon efectos mas llamativos.

4. Diagramas de barras: Graficos . . . Barras y Graficos . . . Interactivos . . . Barras.

5. Histogramas: Graficos . . . Histograma o Graficos . . . Interactivos . . . Histograma.

6. Graficos de tallo y hojas: Analizar . . . Estadısticos descriptivos . . . Explorar.

7. Diagramas de caja: Graficos . . . Diagrama de cajas.

8. Diagramas de dispersion: Graficos . . . dispersion . . . simple o Graficos . . . Interactivos. . . Diagrama de dispersion, en donde aparece un cuadro de dialogo en el que se puedeelegir que variable ocupara el eje X y que otra el eje Y.

Page 106: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

B.3 Inferencia sobre una o mas poblaciones 105

B.3 Inferencia sobre una o mas poblaciones

Primero abrir el archivo de datos.

1. Analisis de una muestra: Analizar . . . Comparar medias . . . Prueba T para una muestra.Aparece una pantalla en cuyo campo Contrastar Variables introducimos las varaibles quequeremos contrastar. En esta ventana, seleccione Opciones, para introducir el grado deconfianza deseado (por defecto es del 95%). Al final se pulsa Aceptar.

2. Analisis de dos muestras emparejadas o relacionadas (Prueba T para muestrasrelacionadas). Para efectuar la prueba T para muestras relacionadas se necesita unacolumna en los datos para cada una de las variables a comparar. Seleccionamos Analizar. . . Comparar medias . . . Prueba T para muestras relacionadas. Aparece la ventana endonde seleccionamos las variables en cuya comparacion estamos interesados. Al hacerla primera seleccion en la columna de variables, esta aparece en el recuadro seleccionesactuales como variable 1, y al realizar la segunda seleccion aparecera como variable 2. Enese momento, ya seleccionadas las dos, es cuando las podemos introducir en la columnavariables relacionadas. Se pulsa Aceptar.

3. Analisis de dos muestras independientes (Prueba T para muestras independientes).El programa necesita una columna en el editor de datos que contenga los valores de lavariable cuyas medias en las dos poblaciones se desea comparar, y otra que indica lapoblacion o grupo a que pertenece cada individuo. A continuacion, seleccionamos Analizar. . . Comparar medias . . . Prueba T para muestras independientes. Aparece una ventana endonde, en primer lugar seleccionamos una variable numerica y con el puntero la situamosen la ventana de Contrastar variables. A continuacion, seleccionamos una unica variablede agrupacion y pulsamos Definir grupos. En esta ventana debemos especificar los dosgrupos de la variable de contraste, eligiendo entre:

• Usar valores especificados. Escribimos un valor para el Grupo 1 y otro para el Grupo2. Los casos con otros valores quedaran excluidos.

• Punto de corte. Escribimos un numero que divida los valores de la variable deagrupacion en dos conjuntos.

Si la variable de agrupacion es de cadena corta, por ejemplo, SI y NO, podemos escribiruna cadena para el Grupo 1 y otra para el Grupo 2. Los casos con otras cadenas quedaranexcluidos del analisis. Una vez completada la ventana y tras pulsar Continuar, volvemosa la ventana de Prueba T para muestras independientes. Pulsando el boton Opcionespodemos introducir un valor entre 1 y 99 para el coeficiente de confianza de un intervalo,cuyo valor por defecto es del 95%. Tras pulsar el boton Aceptar.

4. Pruebas de normalidad. Analizar . . . Estadısticos descriptivos . . . Explorar. Aparece laventana Explorar. En el caso de una muestra situamos la variable en la ventana Depen-dientes, y dejamos Factores en blanco. Para dos muestras independientes, situamos lavariable a contrastar en la ventana Dependientes, y la variable que forma los grupos en lade Factores. Para dos muestras emparejadas situamos una variable con la diferencia de lasdos originales en la ventana Dependientes, y dejamos Factores en blanco. A continuacion,debemos pulsar el boton Graficos y en la nueva ventana escoger la opcion de Histogramay activar la opcion de Graficos con pruebas de normalidad.

Page 107: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

C

Uso de la calculadora en laestadıstica

Las explicaciones las basaremos en la utilizacion de las calculadoras Casio fx-82MS, fx-83MS,fx-85MS, fx-270MS, fx-300MS y fx-350MS.

Calculos estadısticos

Para realizar calculos estadısticos en la calculadora, tenga en cuenta los siguientes comentarios:

• Utilice mode 2 para ingresar el modo estadıstico SD.

• Utilice shift clr 1 = para borrar la memoria.

• Ingrese los datos usando la secuencia de tecla siguiente: <Dato> dt .

• Tenga en cuenta la tabla siguiente para los calculos que se necesiten:

Para llamar este tipo de valor: Realice esta operacion:∑x2 shift s-sum 1∑x shift s-sum 2

n shift s-sum 3

x shift s-var 1

σn shift s-var 2

σn−1 shift s-var 3

Ejemplo C.0.1 Calcule n,∑

x,∑

x2, x, σn y σn−1 para los datos siguientes: 55, 54, 51,55, 53, 53, 54 y 52.SOLUCION:

• Primero, ingresamos al modo SD con las teclas mode 2 .

• Luego, borramos la memoria con la secuencia de teclas shift clr 1 = .

• Posteriormente, ingresamos los datos: 55 dt 54 dt 51 dt 55 dt 53 dt 53 dt

54 dt 52 dt

• Por ultimo, calculamos las medidas estadısticas pedidas:

Page 108: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

107

Suma de los cuadrados de los valores∑

x2 = 22.805 shift s-sum 1 =

Suma de valores∑

x = 427 shift s-sum 2 =

Numero de datos n = 8 shift s-sum 3 =

Media aritmetica x = 53, 375 shift s-var 1 =

Desviacion estandar poblacional σn = 1, 316956719 shift s-var 2 =

Desviacion estandar muestral σn−1 = 1, 407885953 shift s-var 3 =

Precauciones con el ingreso de datos

• dt dt ingresa el mismo dato dos veces.

• Tambien puede ingresar multiples entradas del mismo dato usando shift ; . Por ejem-

plo, para ingresar el dato 110 diez veces presiones 110 shift ; 10 dt .

• Mientras ingresa datos o despues de completar el ingreso de datos, puede usar las teclas y ∇ para ir visualizando a traves de los datos que ha ingresado.

• Si ingresa multiples ingresos del mismo dato usando shift ; para especificar la fre-

cuencia de datos (numero de ıtemes de datos) como se describe anteriormente, pasandoa traves de los datos muetra el ıtem de dato y una pantalla separada para la frecuenciade datos (freq).

• Los datos visualizados pueden editarse, si ası lo desea. Ingrese el valor nuevo y presionela tecla = para reemplazar el valor antiguo por el valor nuevo. Esto tambien significaque si desea realizar alguna otra operacion (calculo, llamada de resultados de calculos es-tadısticos, etc.), siempre debera presionar primero la tecla ac para salir de la presentacionde datos.

• Presionando la tecla dt en lugar de = despues de cambiar un valor sobre la presentacion,registra el valor que ha ingresado como un elemento de dato nuevo, y deja el valor antiguotal como esta.

• Puede borrar el valor del dato visualizado usando y ∇ , y luego presionando shift

cl . Borrando un valor de dato ocasiona que todos los valores siguientes se desplacenhacia arriba.

• Despues de ingresar los datos en el modo SD, no podra visualizar o editar mas los datosıtemes de datos individuales, despues de cambiar a otro modo.

Page 109: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D

Apendice de tablas

D.1 La funcion de distribucion binomial

La funcion tabulada es la funcion de distribucion acumulada

B(k;n, p) =

n∑

k=0

(n

k

)pk(1 − p)n−k

para n = 5, 10, 15, 20 y 25.

(a) Tabla binomial para n = 5

p

k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95

0 0,774 0,590 0,328 0,237 0,168 0,078 0,031 0,010 0,002 0,001 0,000 0,000 0,000

1 0,977 0,919 0,737 0,633 0,528 0,337 0,188 0,087 0,031 0,016 0,007 0,000 0,000

2 0,999 0,991 0,942 0,896 0,837 0,683 0,500 0,317 0,163 0,104 0,058 0,009 0,001

3 1,000 1,000 0,993 0,984 0,969 0,913 0,812 0,663 0,472 0,367 0,263 0,081 0,023

4 1,000 1,000 0,999 0,999 0,998 0,990 0,969 0,922 0,832 0,763 0,672 0,410 0,226

5 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

(b) Probabilidades binomiales acumuladas para n = 10

p

k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95

0 0,599 0,349 0,107 0,056 0,028 0,006 0,001 0,000 0,000 0,000 0,000 0,000 0,000

1 0,914 0,736 0,376 0,244 0,149 0,046 0,011 0,002 0,000 0,000 0,000 0,000 0,000

2 0,988 0,930 0,678 0,526 0,383 0,167 0,055 0,012 0,002 0,000 0,000 0,000 0,000

3 0,999 0,987 0,879 0,776 0,650 0,382 0,172 0,055 0,011 0,004 0,001 0,000 0,000

4 1,000 0,998 0,967 0,922 0,850 0,633 0,377 0,166 0,047 0,020 0,006 0,000 0,000

5 1,000 1,000 0,994 0,980 0,953 0,834 0,623 0,367 0,150 0,078 0,033 0,002 0,000

6 1,000 1,000 0,999 0,996 0,989 0,945 0,828 0,618 0,350 0,224 0,121 0,013 0,001

7 1,000 1,000 1,000 1,000 0,998 0,988 0,945 0,833 0,617 0,474 0,322 0,070 0,012

8 1,000 1,000 1,000 1,000 1,000 0,998 0,989 0,954 0,851 0,756 0,624 0,264 0,086

9 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,994 0,972 0,944 0,893 0,651 0,401

Page 110: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.1 La funcion de distribucion binomial 109

(c) Probabilidades binomiales acumuladas para n = 15

p

k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95

0 0,463 0,206 0,305 0,013 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

1 0,829 0,549 0,167 0,080 0,035 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000

2 0,964 0,816 0,398 0,236 0,127 0,027 0,004 0,000 0,000 0,000 0,000 0,000 0,000

3 0,995 0,944 0,648 0,461 0,297 0,091 0,018 0,002 0,000 0,000 0,000 0,000 0,000

4 0,999 0,987 0,836 0,686 0,515 0,217 0,059 0,009 0,001 0,000 0,000 0,000 0,000

5 1,000 0,998 0,939 0,852 0,722 0,403 0,151 0,034 0,004 0,001 0,000 0,000 0,000

6 1,000 1,000 0,982 0,943 0,869 0,610 0,304 0,095 0,015 0,004 0,001 0,000 0,000

7 1,000 1,000 0,996 0,983 0,950 0,787 0,500 0,213 0,050 0,017 0,004 0,000 0,000

8 1,000 1,000 0,999 0,996 0,985 0,905 0,696 0,390 0,131 0,057 0,018 0,000 0,000

9 1,000 1,000 1,000 0,999 0,996 0,966 0,849 0,597 0,278 0,148 0,061 0,002 0,000

10 1,000 1,000 1,000 1,000 0,999 0,991 0,941 0,783 0,485 0,314 0,164 0,013 0,000

11 1,000 1,000 1,000 1,000 1,000 0,998 0,982 0,909 0,703 0,539 0,352 0,056 0,005

12 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,973 0,873 0,764 0,602 0,184 0,036

13 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,965 0,920 0,833 0,451 0,171

14 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,987 0,965 0,794 0,537

(d) Probabilidades binomiales acumuladas para n = 20

p

k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95

0 0,358 0,122 0,012 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

1 0,736 0,392 0,069 0,024 0,008 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000

2 0,925 0,677 0,206 0,091 0,035 0,004 0,000 0,000 0,000 0,000 0,000 0,000 0,000

3 0,984 0,867 0,411 0,225 0,107 0,016 0,001 0,000 0,000 0,000 0,000 0,000 0,000

4 0,997 0,957 0,630 0,415 0,238 0,051 0,006 0,000 0,000 0,000 0,000 0,000 0,000

5 1,000 0,989 0,804 0,617 0,416 0,126 0,021 0,002 0,000 0,000 0,000 0,000 0,000

6 1,000 0,998 0,913 0,786 0,608 0,250 0,058 0,006 0,000 0,000 0,000 0,000 0,000

7 1,000 1,000 0,968 0,898 0,772 0,416 0,132 0,021 0,001 0,000 0,000 0,000 0,000

8 1,000 1,000 0,990 0,959 0,887 0,596 0,252 0,057 0,005 0,001 0,000 0,000 0,000

9 1,000 1,000 0,997 0,986 0,952 0,755 0,412 0,128 0,017 0,004 0,001 0,000 0,000

10 1,000 1,000 0,999 0,996 0,983 0,872 0,588 0,245 0,048 0,014 0,003 0,000 0,000

11 1,000 1,000 1,000 0,999 0,995 0,943 0,748 0,404 0,113 0,041 0,010 0,000 0,000

12 1,000 1,000 1,000 1,000 0,999 0,979 0,868 0,584 0,228 0,102 0,032 0,000 0,000

13 1,000 1,000 1,000 1,000 1,000 0,994 0,942 0,750 0,392 0,214 0,087 0,002 0,000

14 1,000 1,000 1,000 1,000 1,000 0,998 0,979 0,874 0,584 0,383 0,196 0,011 0,000

15 1,000 1,000 1,000 1,000 1,000 1,000 0,994 0,949 0,762 0,585 0,370 0,043 0,003

16 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,984 0,893 0,775 0,589 0,133 0,016

17 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,965 0,909 0,794 0,323 0,075

18 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,992 0,976 0,931 0,608 0,264

19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,997 0,988 0,878 0,642

Page 111: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.2 La funcion de distribucion de Poisson 110

(e) Probabilidades binomiales acumuladas para n = 25

p

k 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95

0 0,277 0,072 0,004 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

1 0,642 0,271 0,027 0,007 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

2 0,873 0,537 0,098 0,032 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

3 0,966 0,764 0,234 0,096 0,033 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000

4 0,993 0,902 0,421 0,214 0,090 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000

5 0,999 0,967 0,617 0,378 0,193 0,029 0,002 0,000 0,000 0,000 0,000 0,000 0,000

6 1,000 0,991 0,780 0,561 0,341 0,074 0,007 0,000 0,000 0,000 0,000 0,000 0,000

7 1,000 0,998 0,891 0,727 0,512 0,154 0,022 0,001 0,000 0,000 0,000 0,000 0,000

8 1,000 1,000 0,953 0,851 0,677 0,274 0,054 0,004 0,000 0,000 0,000 0,000 0,000

9 1,000 1,000 0,983 0,929 0,811 0,425 0,115 0,013 0,000 0,000 0,000 0,000 0,000

10 1,000 1,000 0,994 0,970 0,902 0,586 0,212 0,034 0,002 0,000 0,000 0,000 0,000

11 1,000 1,000 0,998 0,980 0,956 0,732 0,345 0,078 0,006 0,001 0,000 0,000 0,000

12 1,000 1,000 1,000 0,997 0,983 0,846 0,500 0,154 0,017 0,003 0,000 0,000 0,000

13 1,000 1,000 1,000 0,999 0,994 0,922 0,655 0,268 0,044 0,020 0,002 0,000 0,000

14 1,000 1,000 1,000 1,000 0,998 0,966 0,788 0,414 0,098 0,030 0,006 0,000 0,000

15 1,000 1,000 1,000 1,000 1,000 0,987 0,885 0,575 0,189 0,071 0,017 0,000 0,000

16 1,000 1,000 1,000 1,000 1,000 0,996 0,946 0,726 0,323 0,149 0,047 0,000 0,000

17 1,000 1,000 1,000 1,000 1,000 0,999 0,978 0,846 0,488 0,273 0,109 0,002 0,000

18 1,000 1,000 1,000 1,000 1,000 1,000 0,993 0,926 0,659 0,439 0,220 0,009 0,000

19 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,971 0,807 0,622 0,383 0,033 0,001

20 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,910 0,786 0,579 0,098 0,007

21 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,967 0,904 0,766 0,236 0,034

22 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,968 0,902 0,463 0,127

23 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,993 0,973 0,729 0,358

24 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,996 0,928 0,723

D.2 La funcion de distribucion de Poisson

La funcion tabulada es la funcion de distribucion acumulada

P(k; λ) =

n∑

k=0

(n

k

)λk

k!e−λ

para algunos valores de λ.

(a) Tabla de Poisson para λ ≤ 1

λ

k 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

0 0,905 0,819 0,741 0,670 0,607 0,549 0,497 0,449 0,407 0,368

1 0,995 0,982 0,963 0,938 0,910 0,878 0,844 0,809 0,772 0,736

2 1,000 0,999 0,996 0,992 0,986 0,977 0,966 0,953 0,937 0,920

3 1,000 1,000 1,000 0,999 0,998 0,997 0,994 0,991 0,987 0,981

4 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,999 0,998 0,996

5 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999

6 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

Page 112: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.2 La funcion de distribucion de Poisson 111

(b) Tabla de Poisson para 2 ≤ λ ≤ 20

λ

k 2 3 4 5 6 7 8 9 10 15 20

0 0,135 0,050 0,018 0,007 0,002 0,001 0,000 0,000 0,000 0,000 0,000

1 0,406 0,199 0,092 0,040 0,017 0,007 0,003 0,001 0,000 0,000 0,000

2 0,677 0,423 0,238 0,125 0,062 0,030 0,014 0,006 0,003 0,000 0,000

3 0,857 0,647 0,433 0,265 0,151 0,082 0,042 0,021 0,010 0,000 0,000

4 0,947 0,815 0,629 0,440 0,285 0,173 0,100 0,055 0,029 0,001 0,000

5 0,983 0,916 0,785 0,616 0,446 0,301 0,191 0,116 0,067 0,003 0,000

6 0,995 0,966 0,889 0,762 0,606 0,450 0,313 0,207 0,130 0,008 0,000

7 0,999 0,988 0,949 0,867 0,744 0,599 0,453 0,324 0,220 0,018 0,001

8 1,000 0,996 0,979 0,932 0,847 0,729 0,593 0,456 0,333 0,037 0,002

9 1,000 0,999 0,992 0,968 0,916 0,830 0,717 0,587 0,458 0,070 0,005

10 1,000 1,000 0,997 0,986 0,957 0,901 0,816 0,706 0,583 0,118 0,011

11 1,000 1,000 0,999 0,995 0,980 0,947 0,888 0,803 0,697 0,185 0,021

12 1,000 1,000 1,000 0,998 0,991 0,973 0,936 0,876 0,792 0,268 0,039

13 1,000 1,000 1,000 0,999 0,996 0,987 0,966 0,926 0,864 0,363 0,066

14 1,000 1,000 1,000 1,000 0,999 0,994 0,983 0,959 0,917 0,466 0,105

15 1,000 1,000 1,000 1,000 0,999 0,998 0,992 0,978 0,951 0,568 0,157

16 1,000 1,000 1,000 1,000 1,000 0,999 0,996 0,989 0,973 0,664 0,221

17 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,995 0,986 0,749 0,297

18 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,998 0,993 0,819 0,381

19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,997 0,875 0,470

20 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,917 0,559

21 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,947 0,644

22 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,967 0,721

23 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,981 0,787

24 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,989 0,843

25 1,000 1,000 1,000 0,994 0,970 0,902 0,586 0,212 0,034 0,994 0,888

26 1,000 1,000 1,000 0,998 0,980 0,956 0,732 0,345 0,078 0,997 0,922

27 1,000 1,000 1,000 1,000 0,997 0,983 0,846 0,500 0,154 0,998 0,948

28 1,000 1,000 1,000 1,000 0,999 0,994 0,922 0,655 0,268 0,999 0,966

29 1,000 1,000 1,000 1,000 1,000 0,998 0,966 0,788 0,414 1,000 0,978

30 1,000 1,000 1,000 1,000 1,000 1,000 0,987 0,885 0,575 1,000 0,987

31 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,946 0,726 1,000 0,992

32 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,978 0,846 1,000 0,995

33 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,993 0,926 1,000 0,997

34 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,971 1,000 0,999

35 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 1,000 0,999

36 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 1,000 1,000

Page 113: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.3 La funcion de distribucion normal 112

D.3 La funcion de distribucion normal

La funcion tabulada es la funcion Φ(z) =z∫

−∞e−t2/2 dt. Observe que Φ(z) es la probabilidad

de que una variable aleatoria Z, distribuida normalmente con media 0 y varianza 1, sea menor oigual a z. Es decir, Φ(z) = P(Z ≤ z).

(a) Areas de curva normal estandar para valores negativos de Z

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003

-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004

-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005

-3.1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007

-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010

-2,9 0,0019 0,0018 0,0017 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014

-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019

-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026

-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036

-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048

-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064

-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084

-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110

-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143

-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183

-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

-1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294

-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367

-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455

-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681

-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823

-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985

-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170

-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148

-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451

-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776

-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483

-0,2 0,4207 0,4168 0,4129 0,4009 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641

Page 114: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.3 La funcion de distribucion normal 113

(b) Areas de curva normal estandar para valores positivos de Z

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9278 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857

2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916

2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9948 0,9951 0,9952

2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9961 0,9963 0,9964

2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9971 0,9973 0,9974

2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981

2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993

3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995

3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997

3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998

Page 115: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.4 La funcion gamma incompleta 114

D.4 La funcion gamma incompleta

La funcion tabulada es

F(t;α) =

t∫

0

1

Γ(α)e−x xα−1 dx, x > 0,

α

t 1 2 3 4 5 6 7 8 9 10

1 0,632 0,264 0,080 0,019 0,004 0,001 0,000 0,000 0,000 0,000

2 0,865 0,594 0,323 0,143 0,053 0,017 0,005 0,001 0,003 0,000

3 0,950 0,801 0,577 0,353 0,185 0,084 0,034 0,012 0,004 0,001

4 0,982 0,908 0,762 0,567 0,371 0,215 0,111 0,051 0,021 0,008

5 0,993 0,960 0,875 0,735 0,560 0,384 0,238 0,133 0,068 0,032

6 0,998 0,983 0,938 0,849 0,715 0,554 0,394 0,256 0,153 0,084

7 0,999 0,993 0,970 0,918 0,827 0,699 0,550 0,401 0,271 0,170

8 1,000 0,997 0,986 0,958 0,900 0,809 0,687 0,547 0,407 0,283

9 1,000 0,999 0,994 0,979 0,945 0,884 0,793 0,676 0,544 0,413

10 1,000 1,000 0,997 0,990 0,971 0,993 0,870 0,780 0,667 0,542

11 1,000 1,000 0,999 0,995 0,985 0,962 0,921 0,857 0,768 0,659

12 1,000 1,000 1,000 0,998 0,992 0,980 0,954 0,911 0,845 0,758

13 1,000 1,000 1,000 0,999 0,996 0,989 0,974 0,946 0,900 0,834

14 1,000 1,000 1,000 1,000 0,998 0,994 0,986 0,968 0,938 0,891

15 1,000 1,000 1,000 1,000 0,999 0,997 0,992 0,982 0,963 0,930

Page 116: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.5 Valores crıticos para la distribucion t de Student 115

D.5 Valores crıticos para la distribucion t de Student

Para ν > 120, tenemos que tα(ν) ≈ zα.

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

α

αt

α

ν 0,10 0,05 0,025 0,01 0,005 0,001 0,0005

1 3,078 6,314 12,706 31,821 63,657 318,31 636,620

2 1,886 2,920 4,303 6,965 9,925 22,326 31,598

3 1,638 2,353 3,182 4,541 5,841 10,213 12,924

4 1,533 2,132 2,776 3,747 4,604 7,173 8,610

5 1,476 2,015 2,571 3,365 4,032 5,893 6,869

6 1,440 1,943 2,447 3,143 3,707 5,208 5,959

7 1,415 1,895 2,365 2,998 3,499 4,785 5,408

8 1,397 1,860 2,306 2,896 3,355 4,501 5,041

9 1,383 1.833 2,262 2,821 3,250 4,297 4,781

10 1,372 1,812 2,228 2,764 3,169 4,144 4,587

11 1,363 1,796 2,201 2,718 3,106 4,025 4,437

12 1,356 1,782 2,179 2,681 3,055 3,930 4,318

13 1,350 1,771 2,160 2,650 3,012 3,852 4,221

14 1,345 1,761 2,145 2,624 2,977 3,787 4,140

15 1,341 1,753 2,131 2,602 2,947 3,733 4,073

16 1,337 1,746 2,120 2,583 2,921 3,686 4,015

17 1,333 1,740 2,110 2,567 2,898 3,646 3,965

18 1,330 1,734 2,101 2,552 2,878 3,610 3,922

19 1,328 1,729 2,093 2,539 2,861 3,579 3,883

20 1,325 1,725 2,086 2,528 2,845 3,552 3,850

21 1,323 1,721 2,080 2,518 2,831 3,527 3,819

22 1,321 1,717 2,074 2,508 2,819 3,505 3,795

23 1,319 1,714 2,069 2,500 2,807 3,485 3,767

24 1,318 1,711 2,064 2,492 2,797 3,467 3,745

25 1,316 1,708 2,060 2,485 2,787 3,450 3,725

26 1,315 1,706 2,056 2,479 2,779 3,435 3,707

27 1,314 1,703 2,052 2,473 2,771 3,421 3,690

28 1,313 1,701 2,048 2,467 2,763 3,408 3,674

29 1,311 1,699 2,045 2,462 2,756 3,396 3,659

30 1,310 1,697 2,042 2,457 2,750 3,385 3,646

32 1,309 1,694 2,037 2,449 2,738 3,365 3,622

34 1,307 1,691 2,032 2,441 2,728 3,348 3,601

36 1,306 1,688 2,028 2,434 2,719 3,333 3,582

38 1,304 1,686 2,024 2,429 2,712 3,319 3,566

40 1,303 1,684 2,021 2,423 2,704 3,307 3,551

50 1,299 1,676 2,009 2,403 2,678 3,262 3,496

60 1,296 1.671 2,000 2,390 2,660 3,232 3,460

120 1,282 1,658 1,980 2,358 2,617 3,160 3,373

∞(= z) 1,282 1,645 1,960 2,326 2,576 3,090 3,291

Page 117: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.6 Valores crıticos para la distribucion chi-cuadrada 116

D.6 Valores crıticos para la distribucion chi-cuadrada

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

α

αX

2

(a) Valores crıticos χ2α(ν)

α

ν 0,995 0,99 0,98 0,975 0,95 0,90 0,80 0,75 0,70 0,50

1 0,000 0,000 0,000 0,001 0,00393 0,0158 0,0642 0,102 0,148 0,4550

2 0,010 0,0201 0,0404 0,0506 0,103 0,211 0,446 0,575 0,713 1,386

3 0,0717 0,115 0,185 0,216 0,352 0,584 1,005 1,213 1,424 2,366

4 0,207 0,297 0,429 0,484 0,711 1,064 1,649 1,923 2,195 3,357

5 0,412 0,554 0,752 0,831 1,145 1,610 2,343 2,675 3,000 4,351

6 0,676 0,872 1,134 1,237 1,635 2,204 3,070 3,455 3,828 5,348

7 0,989 1,239 1,564 1,690 2,167 2,833 3,822 4,255 4,671 6,346

8 1,344 1,646 2,032 2,180 2,733 3,490 4,594 5,071 5,527 7,344

9 1,735 2,088 2,532 2,700 3,325 4,168 5,380 5,899 6,393 8,343

10 2,156 2,558 3,059 3,247 3,940 4,865 6,179 6,737 7,267 9,342

11 2,603 3,053 3,609 3,816 4,575 5,578 6,989 7,584 8,148 10,341

12 3,074 3,571 4,178 4,404 5,226 6,304 7,807 8,438 9,034 11,340

13 3,565 4,107 4,765 5,009 5,892 7,042 8,634 9,299 9,926 12,340

14 4,075 4,660 5,368 5,629 6,571 7,790 9,467 10,165 10,821 13,339

15 4,601 5,229 5,985 6,262 7,261 8,547 10,307 11,036 11,721 14,339

16 5,142 5,812 6,614 6,908 7,962 9,312 11,152 11,912 12,624 15,338

17 5,697 6,408 7,255 7,564 8,672 10,085 12,002 12,792 13,531 16,338

18 6,844 7,633 8,567 8,907 10,117 11,651 13,716 14,562 15,352 18,338

19 6,844 7,633 8,567 8,907 10,117 11,651 13,716 14,562 15,352 18,338

20 7,434 8,260 9,237 9,591 10,851 12,443 14,578 15,452 16,266 19,337

21 8,034 8,897 9,915 10,283 11,591 13,240 15,445 16,344 17,182 20,337

22 8,643 9,542 10,600 10,982 12,338 14,041 16,314 17,240 18,101 21,337

23 9,260 10,196 11,293 11,688 13,091 14,848 17,187 18,137 19,021 22,337

24 9,886 10,856 11,992 12,401 13,848 15,659 18,062 19,037 19,943 23,337

25 10,520 11,524 12,692 13,120 14,611 16,473 18,940 19,939 20,867 24,337

26 11,160 12,198 13,409 13,844 15,379 17,292 19,820 20,843 21,792 25,336

27 11,808 12,879 14,125 14,573 16,151 18,114 20,703 21,749 22,719 26,336

28 12,461 13,565 14,847 15,308 16,928 18,939 21,588 22,657 23,647 27,336

29 13,121 14,256 15,574 16,047 17,708 19,768 22,475 23,567 24,577 28,336

30 13,787 14,953 16,306 16,791 18,493 20,599 23,364 24,478 25,508 29,336

31 14,457 15,655 17,538 19,280 21,433

32 15,134 16,362 18,291 20,072 22,271

33 15,815 17,073 19,046 20,866 23,110

34 16,501 17,789 19,806 21,664 23,952

35 17,191 18,508 20,569 22,465 24,796

36 17,887 19,233 21,336 23,269 25,643

37 18,584 19,960 22,105 24,075 26,492

38 19,289 20,691 22,878 24,884 27,343

39 19,994 21,425 23,654 25695 28,196

40 20,706 22,164 24,433 26,509 29,050

Page 118: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.6 Valores crıticos para la distribucion chi-cuadrada 117

(b) Valores crıticos χ2α(ν) (continuacion)

α

ν 0,30 0,25 0,20 0,10 0,05 0,025 0,02 0,01 0,005 0,001

1 1,074 1,323 1,642 2,706 3,841 5,024 5,412 6,635 7,879 10,827

2 2,408 2,773 3,219 4,605 5,991 7,378 7,824 9,210 10,597 13,815

3 3,665 4,108 4,642 6,251 7,815 9,348 9,837 11,345 12,838 16,268

4 4,878 5,385 5,989 5,779 9,488 11,143 11,668 13,277 14,860 18,465

5 6,064 6,626 7,289 9,236 11,070 12,832 13,388 15,086 16,750 20,517

6 7,231 7,841 8,558 10,645 12,592 14,449 15,033 16,812 18,548 22,457

7 8,383 9,037 9,803 12,017 14,067 16,013 16,622 18,475 20,278 24,322

8 9,524 10,219 11,030 13,362 15,507 17,535 18,168 20,090 21,955 26,125

9 10,656 11,389 12,242 14,684 16,919 19,023 19,679 21,666 23,589 27,877

10 11,781 12,549 13,442 15,987 18,307 20,483 21,161 23,209 25,188 29,588

11 12,899 13,701 14,631 17,275 19,675 21,920 22,618 24,725 26,757 31,264

12 14,011 14,845 15,812 18,549 21,026 23,337 24,054 26,217 28,300 32,909

13 15,119 15,984 16,985 19,812 22,362 24,736 25,472 27,688 29,819 34,528

14 16,222 17,117 18,151 21,064 23,685 26,119 26,873 29,141 31,319 36,123

15 17,322 18,245 19,311 22,307 24,996 27,488 28,259 30,578 32,801 37,697

16 18,418 19,369 20,465 23,542 26,296 28,845 29,633 32,000 34,267 39,252

17 19,511 20,489 21,615 24,769 27,587 30,191 30,995 33,409 35,718 40,790

18 20,601 21,605 22,760 25,989 28,869 31,526 32,346 34,805 37,156 42,312

19 21,689 22,718 23,900 27,204 30,144 32,852 33,687 36,191 38,582 43,820

20 22,775 23,828 25,038 28,412 31,410 34,170 35,020 37,566 39,997 45,315

21 23,858 24,935 26,171 29,615 32,671 35,479 36343 38,932 41,401 46,797

22 24,939 26,039 27,301 30,813 33,924 36,781 37,659 40,289 42,796 48,268

23 26,018 27,141 28,429 32,007 35,172 38,076 38,968 41,638 44,181 49,728

24 27,096 28,241 29,553 33,196 36,415 39,364 40,270 42,980 45,558 51,179

25 28,172 29,339 30,675 34,382 37,652 40,646 41,566 44,314 46,928 52,620

26 29,246 30,434 31,795 35,563 38,885 41,923 42,856 45,642 48,290 54,052

27 30,319 31,528 32,912 36,741 40,113 43,194 44,140 46,963 49,645 55,476

28 31,391 32,620 34,027 37,916 41,337 44,461 45,419 48,278 50,993 56,893

29 32,461 33,711 35,139 39,087 42,557 45,722 46,693 49,588 52,336 58,302

30 33,530 34,800 36,250 40,256 43,773 46,979 47,962 50,892 53,672 59,703

31 41,422 44,985 48,231 52,190 55,000

32 42,585 46,194 49,480 53,486 56,328

33 43,745 47,400 50,724 54,774 57,646

34 44,903 48,602 51,966 56,061 58,964

35 46,059 49,802 53,203 57,340 60,272

36 47,212 50,998 54,437 58,619 61,581

37 48,363 52,192 55,667 59,891 62,880

38 49,513 53,384 56,896 61,162 64,181

39 50,660 54,572 58,119 62,426 65,473

40 51,805 55,758 59,342 63,691 66,766

Page 119: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.7 Valores crıticos para la distribucion F 118

D.7 Valores crıticos para la distribucion F

Siempre se cumple que Fα(a, b) = 1F1−α(b,a)

.

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

α

αf

(a) Valores crıticos Fα(ν1, ν2) para α = 0, 05

ν1

ν2 1 2 3 4 5 6 7 8 9

1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04

120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96

∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88

Page 120: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.7 Valores crıticos para la distribucion F 119

(b) Valores crıticos Fα(ν1, ν2) para α = 0, 05

ν1

ν2 10 12 15 20 24 30 40 60 120 ∞

1 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3

2 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50

3 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53

4 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63

5 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36

6 4,06 4,00 3,94 3,87 384 3,81 3,77 3,74 3,70 3,67

7 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23

8 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93

9 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71

10 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54

11 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40

12 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30

13 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21

14 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13

15 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07

16 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01

17 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96

18 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92

19 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88

20 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84

21 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81

22 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78

23 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76

24 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73

25 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71

26 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69

27 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67

28 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65

29 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64

30 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62

40 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51

60 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39

120 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25

∞ 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00

Page 121: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.7 Valores crıticos para la distribucion F 120

(c) Valores crıticos Fα(ν1, ν2) para α = 0, 01

ν1

ν2 1 2 3 4 5 6 7 8 9

1 4052 4999,5 5403 5625 5764 5859 5928 5981 6022

2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39

3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35

4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16

6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72

8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19

14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78

17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68

18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60

19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35

23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30

24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26

25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22

26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18

27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15

28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12

29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07

40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89

60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72

120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56

∞ 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41

Page 122: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.7 Valores crıticos para la distribucion F 121

(d) Valores crıticos Fα(ν1, ν2) para α = 0, 01

ν1

ν2 10 12 15 20 24 30 40 60 120 ∞

1 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366

2 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50

3 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13

4 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46

5 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02

6 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88

7 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65

8 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86

9 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31

10 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91

11 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60

12 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36

13 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17

14 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00

15 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87

16 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75

17 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65

18 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57

19 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49

20 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42

21 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36

22 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31

23 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26

24 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21

25 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17

26 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,23 2,13

27 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,20 2,10

28 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,17 2,06

29 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,14 2,03

30 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01

40 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80

60 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60

120 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38

∞ 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00

Page 123: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

D.8 Algunos numeros aleatorios uniformemente distribuidos 122

D.8 Algunos numeros aleatorios uniformemente distribui-dos85387 51571 57714 00512 61319 69143 08881 01400 55061 82977

84176 03311 16955 59504 54499 32096 79485 98031 99485 16788

27258 51746 67223 98182 43166 54297 26830 29842 78016 73127

99398 46950 19399 65167 35082 30482 86223 41061 21717 48126

72752 89364 02150 85418 05420 84341 02395 27655 59457 55438

69090 93551 11649 54688 57061 77711 24201 16895 64936 62347

39620 54988 67846 71845 54000 26134 84526 16619 82573 01737

81725 49831 35595 29891 46812 57770 03326 31316 75412 80732

87968 85157 84752 93777 62772 78961 30750 76089 23340 64637

07730 01861 40610 73445 70321 26467 53533 20787 46971 29134

32825 82100 67406 44156 21531 67186 39945 04189 79798 41087

34453 05330 40224 04116 24597 93823 28171 47701 77201 68257

00830 34235 40671 66042 06341 54437 81649 70494 01883 18350

24580 05258 37329 59173 62660 72513 82232 49794 36913 05877

59578 08535 77107 19838 40651 01749 58893 99115 05212 92309

75387 24990 12748 71766 17471 15794 68622 59161 14476 75074

02465 34977 48319 53026 53691 80594 58805 76961 62665 82855

49689 08342 81912 92735 30042 47623 60061 69427 21163 68543

60958 20236 79424 04055 54955 73342 14040 72431 99469 41044

79956 98409 79548 39569 83974 43707 77080 08645 20949 56932

04316 01206 08715 77713 20572 13912 94324 14656 11979 53258

78684 28546 06881 66097 53530 42509 54130 30878 77166 98075

69235 18535 61904 99246 84050 15270 07751 90410 96675 62870

81201 04314 92708 44984 83121 33767 56607 46371 20389 08809

80336 59638 44368 23433 97794 10343 19235 82633 17186 63902

65076 87960 92013 60169 49176 50140 39081 04638 96114 63463

90879 70970 50789 59973 47771 94567 35590 23462 33993 99899

50555 84355 97066 82748 98298 14385 82493 40182 20523 69182

48658 41921 86514 46786 74097 62825 46457 24428 09245 86069

26373 19166 88223 32371 11570 62078 92317 13378 05734 71778

20878 80883 26027 29101 58382 17109 53511 95536 21759 10630

20069 60582 55749 88068 48589 01784 42930 40310 34613 97359

46819 38577 20520 94145 99405 47064 25248 27289 41289 54972

83644 04459 73252 58414 94180 09321 59747 07379 56255 45615

08636 31363 56033 49076 88908 51318 39104 56556 23112 63317

92058 38678 12507 90343 17213 24545 66053 76412 29545 89932

05038 18443 87138 05076 25660 23414 84837 87132 84405 15346

41838 68590 93646 82113 25498 33110 15356 81070 84900 42660

15564 81618 99186 73113 99344 13213 07235 90064 89150 86359

74600 40206 15237 37378 96862 78638 14376 46607 55909 46398

78275 77017 60310 13499 35268 47790 77475 44345 14615 25231

30145 71205 10355 18404 85354 22199 90822 35204 47891 69860

46944 00097 39161 50139 60458 44649 85537 90017 18157 13856

85883 21272 89266 94887 00291 70963 28169 95130 27223 35387

83606 98192 82194 26719 24499 28102 97769 98769 30757 81593

66888 81818 52490 54272 70549 69235 79684 96412 65186 87974

63673 73966 34036 44298 60652 05947 05833 37914 57021 58566

37944 16094 39797 63253 64103 32222 65925 64693 34048 75394

93240 66855 29336 28345 71398 45118 01454 72128 09715 29454

40189 76776 70842 32675 81647 75868 21288 12849 94990 21513

Page 124: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Bibliografıa &Referencias

[1] Anderson, D.; Sweeney, D.; Williams, T., Estadıstica para administracion yeconomıa. International Thomson Editores, 1999.

[2] Berk, K.; Carey, P., Analisis de datos con Microsoft Excel. International ThomsonEditores, 2001.

[3] Berenson, M.; Levine, D.; Krehbiel, T., Estadıstica para administracion. PrenticeHall, 2001.

[4] Canavos, G,, Probabilidad y Estadıstica: Aplicaciones y Metodos. Mc Graw-Hill, 1988.

[5] DeGroot, M., Probabilidad y Estadıstica. Addison-Wesley Iberoamericana, 1988.

[6] Devore, J., Probabilidad y estadıstica para ingenierıa y ciencias. International ThomsonEditores, 2001.

[7] Freund. J., Estadıstica elemental. Prentice Hall, 1994.

[8] Kreyszig, E., Introduccion a la estadıstica matematica: Principios y metodos. Ed. Limusa,1991.

[9] Levin, R.; Rubin, D., Estadıstica para Administracion y Economıa. Prentice Hall, 2004.

[10] Lizasoain, L.; Joaristi, L., Gestion y analisis de datos con SPSS. International Thom-son Editores, 2003.

[11] LLinas, H.; Rojas, C., Estadıstica descriptiva y distribuciones de probabilidad. EdicionesUninorte, 2005.

[12] LLinas, H., Guıa resumida sobre Metodos Estadısticos: Teorıa y pactica. Notas de clasespara la Especializacion en Estadıstica Aplicada, 2005.

[13] Milton, S.; Arnold, J., Probabilidad y estadıstica con aplicaciones para ingenierıa yciencias computacionales. Mc Graw-Hill, 2003.

[14] Montgomery, D.; Runger, G. , Probabilidad y estadıstica aplicadas a la ingenierıa.Ed. Limusa, 2002.

[15] Newbold, P., Estadıstica para los Negocios y la Economıa. Prentice Hall, 1998.

[16] Perez, C., Estadıstica practica con Statgraphics. Prentice Hall, 2002.

Page 125: Estadistica 2, distribuciones muestrales, intervalos de confianza y prueba de hipotesis. Llinas.

Bibliografıa & Referencias 124

[17] Perez, C., Tecnicas estadısticas con SPSS. Prentice Hall, 2001.

[18] Pitman, J., Probability. Berlin-Heidelberg-New York: Springer-Verlag, 1993.

[19] Ross, S., A first Course in Probability. Prentice Hall, 2002.

[20] Visauta, B., Analisis estadıstico con SPSS para windows. Mc Graw-Hill, 2002.

[21] Wackerly, D.; Mendenhall, W.; Scheaffer, R., Estadıstica matematica con apli-caciones. International Thomson Editores, 2002.

[22] Walpole, R.; Myers, R.; Myers, S., Probabilidad y Estadıstica para ingenieros.Prentice Hall, 1999.

[23] Weimer, R., Estadıstica. Ed. Cecsa, 1996.