Instituto Profesional Diego Portales
A U T Ó N O M O
1
Asignatura
EESSTTAADDÍÍSSTTIICCAA
AAPPLLIICCAADDAA
Autor: RODRIGO ALÍ VALLEJOS
Instituto Profesional Diego Portales
A U T Ó N O M O
2
AUTOR
RODRIGO ALÍ:
Ingeniero Matemático, Universidad de Concepción.
Se desempeña como docente en el Instituto Diego Portales de Concepción, desde 2000 a la
fecha.
Se desempeña como docente en la Universidad Católica de la Santísima Concepción desde 2001
a la fecha.
Se desempeña como docente en la Universidad del Bío-Bío desde 2003 a la fecha.
Se desempeñó 3 años como coordinador e instructor de cursos en el Laboratorio de computación
de la Facultad de Ciencias físicas y Matemáticas de la Universidad de Concepción
INVITACIÓN AL MÓDULO
Instituto Profesional Diego Portales
A U T Ó N O M O
3
Estimado alumno
Los conocimientos de teoría estadística son la base del soporte tecnológico y la base sobre
la cuál se puede hacer un uso racional, sistemático y ético de la sorprendente tecnología que se
incorpora cotidianamente a nuestro quehacer laboral. Por tanto, no es solo la necesidad de
calcular, medir o de disponer de herramientas mecánicas directas por lo cuál hay que estudiar
disciplina, sino que nos debe mover el manifiesto interés por desarrollar nuestra capacidad de
desición, aumentar nuestra capacidad de analizar, discriminar, abstraer y sintetizar información,
optimizando así nuestra rapidez y eficacia para enfrentar el conjunto de situaciones problemáticas
que afectan diariamente al conjunto de nuestra actividad.
Este módulo de Estadística ha sido creado siguiendo de muy cerca el programa de la
asignatura, en su elaboración se han priorizado objetivos y contenidos fundamentales, para
acceder al dominio de herramientas de decisión y de lenguaje estadístico, que permitan una
utilización transversal en el currículum general de tu carrera así como también una posible
proyección posterior, hacia niveles de instrucción superiores en tu respectiva área.
Para facilitar el seguimiento de presente texto, se ha considerado una instrucción
programada, simple reinterpretar por el alumno, que generalmente dispone de un tiempo limitado
de estudio personal; se sugiere enfrentar perseverantemente todas las actividades de
autoevaluación, propuestas al final de cada unidad temática, para ir accediendo a capítulos
progresivos en forma directa, considerando también las instancias de consultoría establecidas por
el Programa a Distancia a cargo de tus profesores tutores.
Esperando para ti todo el éxito posible, te invito a iniciar la tarea del aprendizaje
sistemático, que te conducirá a la obtención de tus objetivos personales y profesionales.
¡¡Mucha suerte y hasta pronto!!
Instituto Profesional Diego Portales
A U T Ó N O M O
4
ASIGNATURA ESTADÍSTICA
OBJETIVO GENERAL
Al término del curso, el alumno será capaz de:
Aplicar elementos de estadística inferencial relacionados con distribuciones maestrales,
desarrollándolos en problemas de gestión empresarial.
Propender al desarrollo del sentido de autonomía personal y por lo tanto la responsabilidad
de su propio aprendizaje.
OBJETIVOS ESPECÍFICOS
Unidad Temática N° 1: Emplear la distribución normal, sus aplicaciones más importantes y
su importancia en la construcción de otras distribuciones.
Unidad Temática N° 2: Construir parámetros en forma puntual y por intervalos verificando
sus propiedades y aplicar los conceptos de estimación de cada uno de los muestreos
estudiados.
Unidad Temática N° 3: Elaborar una prueba de hipótesis para medias y proporciones,
aplicables a problemas del área.
Unidad Temática N° 4: Aplicar el análisis de varianza para medir la bondad del ajuste en
modelos de regresión lineal.
Instituto Profesional Diego Portales
A U T Ó N O M O
5
ASIGNATURA ESTADÍSTICA
PRIMERA UNIDAD
DISTRIBUCIONES CONTINUAS
CONTENIDO DE LA UNIDAD TEMÁTICA
1.1 Distribución normal. Generalidades y aplicaciones.
1.2 Distribución Chi – Cuadrado. T – Student y F.
1.2.1 Construcción. Características. Uso de tablas. Aplicaciones.
DISTRIBUCIÓN NORMAL
Instituto Profesional Diego Portales
A U T Ó N O M O
6
Es la distribución continua de de probabilidad más importante en el campo de la estadística. Su
gráfica recibe el nombre de curva normal, su forma es la de una campana.
Esta curva permite describir muchos fenómenos que ocurren en la naturaleza, la industria y la
investigación.
Una variable aleatoria (v.a) continua que tiene distribución en forma de campana se llama
variable aleatoria normal.
Concepto: La función de la variable aleatoria , con media y varianza 2, está dada por:
),(~
2
1)(
2
2
12
NX
xeXf
X
Propiedades de la distribución normal
Instituto Profesional Diego Portales
A U T Ó N O M O
7
1) El máximo valor de la curva se encuentra en x=
2) La curva es simétrica respecto a la recta x=
3) La curva es asintótica al eje X
4) El área bajo la curva y sobre el eje X es uno.
5) Si X es una variable aleatoria normal, entonces E(X)= y Var(X)=2
Áreas bajo la curva
b
a
dxXfbXaP )()(
Sin embargo, resolver esta integral con la función de densidad de la variable aleatoria normal no
es tan simple. Por tal motivo, se recurre a un proceso denominado estandarización basándose en
una variable aleatoria z que tiene =0 y 2=1 y que se denomina distribución normal estándar.
Concepto: Si z es una v.a. normal con =0 y 2=1, tiene función de densidad:
Instituto Profesional Diego Portales
A U T Ó N O M O
8
)1,0(~
- 2
1)(
2
2
1
NZ
xeZfZ
El proceso de estandarización se realiza de la siguiente forma:
)1,0(~ entonces ),,(~ 2 NX
ZNXSi
Ejemplos
1) P(z>1,84)
P(z>1,84)=1-P(z 1,84)
= 1-0,9671
= 0,0329
2) P(-1,97<z<0,86)
Instituto Profesional Diego Portales
A U T Ó N O M O
9
P(-1,97<z<0,86) = P(z<0,86)- P(z<-197)
= 0,8051-0,0244
= 0,7807
3) P(z>z0)=0,7486
P(z>z0)=0,7486
1-P(z z0)=0,7486
1-0,7486 = P(z z0) P(z z0) = 0,2514 z0=-067
4) Sea X una v.a normal =40 y =6, detemine:
Instituto Profesional Diego Portales
A U T Ó N O M O
10
a) P(X x) = 0,45
45.06
40zzP
22,39 13.06
40x
x
b) P( X>x )= 0,14
48,46 08,16
40 86,0
6
40
14,06
401
xxx
zP
xzP
EJERCICIOS
Instituto Profesional Diego Portales
A U T Ó N O M O
11
I) Usando la tabla determine:
a) P(z<0,83) Resp: 0,7967
b) P(z<-1,27) Resp: 0,1020
c) P(z>0,83) Resp: 0,2033
d) P(z>-1,27) Resp: 0,898
e) P(0,47<z<1,08) Resp: 0,1791
f) P( -1,39<z<1,39) Resp: 0,8354
g) P(z>z1)=0,06 Resp: z1=1,55
h) P(-0,93<z<z1)=0,7235 Resp: z1=1,28
II) Dada la v.a. X distribuida normalmente con media 18 y desviación estándar 2,5 , encuentre:
a) P(x<15) Resp: 0,1151
b) P(x<x1) Resp: x1=16,1
c) P(x<x1) Resp: x1=20,28
d) P(17<x<21) Resp: 0,4009
Problemas de aplicación
Instituto Profesional Diego Portales
A U T Ó N O M O
12
1) Cierto tipo de batería dura un promedio de tres años, con una desviación estándar de 0,5
años. Suponiendo que las duraciones de las baterías son normalmente distribuidas,
encuentre la probabilidad de que una determinada batería dure menos de 2,3 años.
Solución:
batería la deDuración ))5,0(,3(~ 2 XNX
0808,0
)4,1(
5,0
33,2 )3,2(
batería la deDuración ))5,0(,3(~ 2
zP
zPxP
XNX
La probabilidad de que una determinada batería dure menos de 2,3 años es de un 8,08%.
Instituto Profesional Diego Portales
A U T Ó N O M O
13
2) Una compañía fabrica focos cuya duración es normalmente distribuida con una media de
800 horas y una desviación estándar de 40 horas. Encuentre la probabilidad de que un
foco dura entre 778 y 834 horas de uso.
Solución
0,5110,2912-0,8023
)55,0()85,0(
)85,055,0(
40
800834
40
800778 )834778(
focos los deDuración ))40(,800(~ 2
PzP
zP
zPxP
XNX
La probabilidad de que un foco dure entre 778 y 834 horas de uso es de un 51,11%.
Instituto Profesional Diego Portales
A U T Ó N O M O
14
3) Una cierta máquina produce resistencias aléctricas que tienen un valor medio de 40 ohms
y una desviación estándar de 2 ohms. Suponiendo que los valores de las resistencias
siguen una distribución normal y que pueden medirse con cualquier grado de precisión.
¿Que porcentaje de las resistencias tendrá un valor que exceda los 43 ohms ?
Solución:
0668,0
9332,01
)5,1(1
2
40431 )43(
eléctricas asresistenci las devalor ))2(,40(~ 2
zP
zPxP
XNX
El 6,68% de las resistencias tendrá un valor que exceda a 43 ohms.
Instituto Profesional Diego Portales
A U T Ó N O M O
15
4) En una empresa las edades de los trabajadores se distribuye normalmente con media 50
años y desviación estándar 5 años.
a) ¿Qué porcentaje de los trabajadores tiene entre 50 y 52,5 años ?
b) ¿Cuál es la probabilidad de qque un trabajador cualquiera no sea mayor de 45 años?
c) ¿Cuál es la probabilidad que un trabajador tenga entre 41 y 58 años?
d) El 20% de los trabajadores están bajo cierta edad ¿Cuál es esa edad?
Solución:
res trabajadolos de edad ))5(,50(~ 2 XNX
0,1915
5,06915,0
)0()5,0(
)5,00(
5
505,52
5
5050 )5,5250( a)
zPzP
zP
zPxP
El 19,15% de los trabajadores tiene entre 50 y 52,5 años.
0,1587
)1(
5
5045 )45( b)
zP
zPxP
La probabilidad de que un trabajador cualquiera no sea mayor de 45 años es de un 15,87 %
Instituto Profesional Diego Portales
A U T Ó N O M O
16
0,9093
)8,1()6,1(
)6,18,1(
5
5058
5
5041 )5841( c)
zPzP
zP
zPxP
La probabilidad que un trabajador tenga entre 41 y 58 años es de un 90,93 %
75,45 -0,855
50 0,20
5
50
20,0)( d)
xxx
zP
xXP
El 20% de los trabajadores tiene una edad menor o igual a 45,75 años.
Instituto Profesional Diego Portales
A U T Ó N O M O
17
EJERCICIOS AUTO EVALUACIÓN Nº 1
1) Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta pastelería
tienen una longitud promedio de 30 cm y una desviación estándar de 2 cm. Suponiendo
que las longitudes están normalmente distribuidas. ¿Qué porcentaje de las piezas son :
a) De más de 31,7 cm de longitud ?
b) Entre 29,3 y 33,5 cm de longitud ?
c) De una longitud menor que 25,5 cm ?
2) Una máquina despachadora de refrescos está ajustada para servir un promedio de 200
mililítros por vaso. Si la cantidad de refresco está normalmente distribuida con una
desviación estándar de 15 mililítros.
a) ¿Qué fracción de los vasos contendrá más de 224 mililítros?
b) ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 206 mililítros?
3) El diámetro interno ya terminado de un anillo de pistón está normalmente distribuido con
una media de 10 cm y una desviación estándar de 0,03 cm.
a) ¿Qué proporción de los anillos tendrá un diámetro interno que exceda de 10,075
cm ?
b) ¿Cuál es la probabilidad de que un anillo de pistón tenga un diámetro interno entre
9,97 y 10,03 cm ?
c) ¿Para que valor el diámetro interno de un anillo de pistón representará el 15% ?
4) La resistencia a la tensión de cierto componente metálico está normalmente distribuida
con una media de 10.000 Kg/cm2 y una desviación estándar de 0,03 cm.
Instituto Profesional Diego Portales
A U T Ó N O M O
18
a) ¿Cuál es la proporción de estos componentes que execeden de 10.150 Kg/cm2 ?
b) Si las especificaciones requieren que todos los componentes tengan una resistencia
a la tensión entre 9.800 y 10.200 Kg/cm2 inclusive, ¿ qué porcentaje de piezas se
esperaría que se desechara?
5) La vida promedio de cierto tipo de motor pequeño es de 10 años con una desviación
estándar de 2 años. El fabricante repone sin cargo todos los motores que fallen dentro del
período de garantía. Si está a reponer sólo el 3% de los motores que fallan, ¿qué tan larga
deberá ser la garantía que otorgue? Suponga que la vida de los motores tienen distribución
normal.
6) Suponga que un consultor está investigando cuánto tiempo necesitarán los obreros de la
fábrica para montar cierta pieza en una planta de automóviles Volvo, y determinó que la
información ( tiempo en segundos ) estaba normalmente distribuida con una media de 75
segundos y una desviación estándar de 6 segundos.
a) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza en más de 81 segundos ?
b) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza entre 69 y 81 segundos ?
c) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza en menos de 62 segundos ?
d) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la
pieza entre 62 y 69 segundos ?
e) ¿Cuántos segundos deben pasar antes de que el 50% de los obreros monten la pieza?
7) El espesor de un lote de 10.000 arandelas de bronce de un cierto tipo fabricadas par una
gran compañía tiene una distribución normal con media 0,0191 pulgadas y desviación
estándar de 0,000425 pulgadas. Compruebe que se puede esperar que el 99,04% de estas
arandelas tengan un espesor entre 0,0180 y 0,202 pulgadas.
Instituto Profesional Diego Portales
A U T Ó N O M O
19
8) El tiempo de reacción para un cierto tipo de experimento psicológico está distribuido
normalmente con media 20 segundos y desviación estándar 4 segundos.
a) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción entre 14 y 30
segundos ?
b) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción entre 25y 30
segundos ?
c) ¿Qué porcentaje de personas tienen un tiempo de reacción de más de 14 segundos?
d) ¿Cuál es el tiempo de reacción de modo que sólo el 1% de todas las personas
reaccionen con mayor rapidez?
9) Un procesador de alimentos envasa café en pequeños tarros, los pesos de los tarros están
normalmente distribuidos con una desviación estándar de 0,3 onzas. Si el 5% de los tarros
pesa más de de 12,492 onzas. ¿Cuál es el promedio de los tarros?
Instituto Profesional Diego Portales
A U T Ó N O M O
20
SOLUCIONES EJERCICIOS AUTO EVALUACIÓN Nº1
1)
a) El 19,77% de las piezas tiene una longitud de más de 31,7 cm.
b) El 59,67% de las piezas tiene una longitud menos que 25,5 cm.
2)
a) El 5,48% de los vasos contendrá más de 224 mililítros
b) El 5,18% de los vasos tendrá entre 191 y 209 mililítros
3)
a) El 0,62% de los anillos tendrá un diámetro superior a 10,075 cm.
b) El 68,26% de los anillos tendrá un diámetro entre 9,97 y 10,03 cm.
c) El 15% de los anillos tendrá un diámetro de 9,9688 cm.
4)
a) El 6,68% de los componentes exceden de 10.150 Kg/cm2 de resistencia a la tensión.
b) El 4,56% de las piezas se despacharán
5) Deben tener una garantía de a lo más 6,24 años.
6)
a) Existe un 65,87% de probabilidad de que un obrero pueda montar una pieza en menos de 75
seg o en ,más de 81 seg.
b) Existe un 68,26% de probabilidad de que un obrero pueda montar una pieza entre 69 y 81 seg.
c) Existe un 1,5% de probabilidad de que un obrero pueda montar una pieza en menos de 62
seg.
d) Existe un 14,37% de probabilidad de que un obrero pueda montar una pieza entre 62y 69 seg.
e) Deben pasar 75 segundos antes de que el 50% de los obreros monten la pieza.
Instituto Profesional Diego Portales
A U T Ó N O M O
21
7)
Se cumple que el 99,04% de las arandelas tiene un espesor entre 0,0180 y 0,202 pulgadas.
8)
a) El 92,7% de las personas tiene un tiempo de reacción entre 14 y 30 segundos.
b) El 9,94% de las personas tiene un tiempo de reacción entre 25 y 30 segundos.
c) El 93,32% de las personas tiene un tiempo de reacción de más de 14 segundos.
d) El tiempo de reacción es de 10,38 segundos.
9) El promedio de los tarros es de 12,3 onzas.
Instituto Profesional Diego Portales
A U T Ó N O M O
22
DISTRIBUCIÓN T-STUDENT
Definición
Sean X1,X2,……Xn variables aleatorias identicamente distribuidas con distribución normal con
media y varianza 2. Entonces la variable:
s
nxT
)(
tiene distribución t-student con v=n-1 grados de libertad donde n es el tamaño de la muestra, x es
la media de la muestra y s es la varianza muestral. La gráfica de esta distribución es similar a la
distribución normal y está dada por:
Al igual que la distribución normal los valores de área de esta distribución se encuentran
tabulados.
La distribución de probabilidad T se publicó por primera vez en 1908 en un artículo de W.S.
Gosset. En esa época , Gosset era empleado de una cervecería irlandesa que desaprobaba la
publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo
en secreto bajo el nombre de Student. En consecuencia, la distribución T normalmente se llama
distribución t de Student, o simplemente distribución t.
La distribución T es similar a la distribución de Z, pues ambas son simétricas alrededor de la
media igual a cero. Ambas distribuciones tienen forma de campana, pero la distribución t es más
variable, debido al hecho que la distribución t depende de las cantidades de x y s2.
Instituto Profesional Diego Portales
A U T Ó N O M O
23
Ejemplos
1) El valor de t con v=14 grados de libertad que deja un área de 0.0975 a la derecha es:
145.2025.0975.0 tt
2) Encuentre P(-t0.025<T<t0.05).
Solución:
Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda,
encontrmos un área total de:
1-0.05-0.025=0.925
3) Encuentre el valor de k tal que P(k<t<-1.761)=0.045, para una muestra aleatoria de
tamaño 15 que se selecciona de una distribución normal.
Solución:
Notemos que 1.761 corresponde a t0.05 cuando v=14. Por tanto, -t0.05=-1761. Como k en el
enunciado de de la probabilidad original está a la izquieda de –t0.05 = -1761,
luego k=-2.977.
4) Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso
en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación
muestrea 25 lotes cada mes. Si el valor t calculado cae entre –t0.05 y t0.05, queda satisfecho
con su afirmación. ¿ que conclusión extraería de una muestra que tiene una media x =518
Instituto Profesional Diego Portales
A U T Ó N O M O
24
gramos por milímetro y una desviación estándar s=40 gramos?. Suponga que la
distribución de rendimientos es aproximadamente normal.
Solución:
De la tabla t-student encontramos que t0.05=1.711 para 24 grados de libertad. Por tanto, el
fabricante que satisfecho con esta afirmación si para la muestra de tamaño 25 el valor de t queda
entre -1.711 y 1.711. Si =500 entonces:
25.2
40
25)500518()(
s
nxt
Como t=2.25 no está entre -1711 y 1.711 el fabricante debe revisar su proceso productivo.
Instituto Profesional Diego Portales
A U T Ó N O M O
25
EJERCICIOS AUTO EVALUATIVOS Nº 2
1) Mediante uso de tabla encuentre:
12con v )179.2P(-1.356 )
24con v )318.1P(T b)
7con v )365.2P(T a)
Tc
2) Dada una muestra aleatoria de tamaño 24 de una distribución normal, encuentre k tal que:
0.9 )P(-k )
0.095 )807.2TP(k b)
0.965 )TP(-2.069 a)
kTc
k
3) Un fabricante de instrumentos de precisión para medidas terrestre afirma que sus mediciones
fallan en promedio a lo más 0.5 mm. En una muestra aleatoria de 8 de estos instrumentos las
fallas de medición fueron de : 0.6 , 0.7 , 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2 mm. Estaría de acuerdo
con la afirmación del fabricante?
4) Un fabricante de cigarrillos asegura que el contenido promedio de nicotina, en una de sus
marcas, es de 0.6 mg por cigarrillo. Una organización independiente mide el contenido de
nicotina de 16 cigarros de esta marca y encuentra que el promedio y la desviación estándar
muestral es de 0.75 y 0.175 mg, respectivamente, de nicotina. Si se supone que la cantidad de
nicotina de estos cigarros es una variable aleatoria normal ¿ que tan probable es el resultado
muestral dado por el fabricante ?
Instituto Profesional Diego Portales
A U T Ó N O M O
26
SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 2
1)
a) P= 0.975
b) P= 0.10
c) P= 0.875
2)
a) k=2.5
b) k=1.319
c) k=1.714
3) La varianza de una muestra está dada por:
1
)( 22
2
n
xnxs
i
así entonces s2=0.034 s=0.183 ; además x =0.475
Calculemos P( 0.5)
3.0)38.0()38.0()38.0(
183.0
8)5.0475.0(
)5.0()()5.0(
777
7
TPTPTP
TP
s
nx
s
nxPP
Luego el fabricante debe revisar la presición de sus instrumentos
Instituto Profesional Diego Portales
A U T Ó N O M O
27
4) Calculemos: P( >0.6)
0025.0)428.3(
175.0
16)6.075.0(
)6.0()()6.0(
15
15
TP
TP
s
nx
s
nxPP
Luego la probabilidad que el contenido promedio de nicotina se mayor que 0.6 milígramos es
muy baja por tanto el fabricante podría tener razón sobre los contenidos promedio de nicotina de
sus cigarros.
Instituto Profesional Diego Portales
A U T Ó N O M O
28
Distribución ji-cuadrado
Definición
Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población
normal que tiene varianza 2 , entonces la variable:
2
22 )1( Sn
tiene distribución ji-cuadrado con v=n-1 grados de libertad. En que n es el tamaño de la
muestra S2 es la varianza muestral y
2 es la varianza de la población.
1
)( 22
2
n
xnxs
i
La gráfica de esta distribución está dada por:
Al igual que las otras distribuciones sus valores de probabilidad se encuentran tabulados.
Instituto Profesional Diego Portales
A U T Ó N O M O
29
Ejemplo:
Un fabricante de baterías para auto garantiza que sus baterías durarán, en promedio tres años
con una desviación estándar de un año. Si cinco de estas baterías tienen duraciones de 1.9,
2.4, 3.0 , 3.5 y 4.2 años, ¿el fabricante aún está convencido de que sus baterías tienen una
desviación estándar de un año? Suponga que la duración de la batería tiene distribución
normal.
Solución:
Encontremos primero la varianza de la muestra:
815.0
1
)( 22
2
n
xnxs
i
por otro lado
26.3
1
)815.0)(4()1(2
22 Sn
5.026.31
)815.0)(4()1()1( 2
4
22 P
snPsP
Luego el fabricante podría no tener razón en su afirmación.
Instituto Profesional Diego Portales
A U T Ó N O M O
30
EJERCICIOS AUTO EVALUATIVOS Nº 3
24 vcuando c)
7 vcuando b)
15 vcuando a)
:encuentre Para )1
2
0.01
2
0.05
2
0.005
2
25con v 045.0)652.37P( )
19con v 025.0)P( b)
5con v 99.0)P( a)
: si Encuentre 2)
2
0
2
2
0
2
-1
2
0
2
2
0
c
3) Un fabricante de baterías para auto garantiza que sus baterías duraran en promedio, tres años
con una desviación estandar de 1 año .Si 5 de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5
y 4.2 años. Cual es la probabilidad de que la variabilidad de las baterías sea de más de 3 años ?
4) Considere una medición física proporcionada por un instrumento de precisión, en donde el
interés recae en la variabilidad de la lectura .suponga que, con base en la experiencia, la medición
es una variable aleatoria normalmente distribuida con media 10 y desviación estándar 0.1
unidades. Si se toma una muestra aleatoria procedente de un proceso de manofactura de los
instrumentos de tamaño 25, ¿ cuál es la probabilidad de que el valor de la varianza muestral sea
mayor de 0.014 unidades cuadradas ?
Instituto Profesional Diego Portales
A U T Ó N O M O
31
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 3
1)
a) 27.488
b) 18.475
c) 36.415
2)
a) 13.277
b) 32.852
c) 46.928
3) y 4) tarea
Instituto Profesional Diego Portales
A U T Ó N O M O
32
ASIGNATURA ESTADÍSTICA
SEGUNDA UNIDAD
TÉCNICAS DE MUESTREO Y ESTIMACIÓN
PUNTUAL
CONTENIDO DE LA UNIDAD TEMÁTICA
2.1 Muestreo aleatorio simple.
2.2 Muestreo aleatorio sistemático.
2.3 Muestreo aleatorio estratificado.
2.4 Muestreo por conglomerados.
2.5 Distribución muestral de la Media.
2.6 Teorema central del límite.
2.7 Estimación puntual y por intervalos.
2.8 Error Estándar de la media.
2.9 Tamaño de muestra.
2.10 Muestreo por etapas.
Instituto Profesional Diego Portales
A U T Ó N O M O
33
Descripción de Técnicas de muestreo sobre
una población
La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la
distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus
muestras.
Las ventajas de estudiar una población a partir de sus muestras son principalmente:
Coste reducido:
Si los datos que buscamos los podemos obtener a partir de una pequeña parte del total de
la población, los gastos de recogida y tratamiento de los datos serán menores. Por
ejemplo, cuando se realizan encuestas previas a un referéndum, es más barato preguntar a
4.000 personas su intención de voto, que a 30.000.000;
Mayor rapidez:
Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras
mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas
elecciones, muchas horas antes de que el recuento final de votos haya finalizado;
Más posibilidades:
Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de bombillas,
no es posible en la práctica destruirlas todas para conocer su vida media, ya que no
quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar
conclusiones sobre las demás.
De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas:
Elección de la muestra (muestreo), que es a lo que nos dedicaremos en este capítulo.
Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población
(inferencia).
Instituto Profesional Diego Portales
A U T Ó N O M O
34
Muestreo aleatorio
Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso
de extracción es tal que garantiza a cada uno de los elementos de la población la misma
oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo
aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
Sin reposición de los elementos;
Con reposición.
1) Muestreo aleatorio sin reposición
Consideremos una población E formada por N elementos. Si observamos un elemento particular,
e E , en un muestreo aleatorio sin reposición se da la siguiente circunstancia:
La probabilidad de que e sea elegido en primer lugar es N
1
;
Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de 1N
N
, la
probabilidad de que sea elegido en el segundo intento es de 1
1
N .
en el (i+1)-ésimo intento, la población consta de N-i elementos, con lo cual si e no ha sido
seleccionado previamente, la probabilidad de que lo sea en este momento es de iN
1
.
Instituto Profesional Diego Portales
A U T Ó N O M O
35
Si consideramos una muestra de n N elementos, donde el orden en la elección de los mismos
tiene importancia, la probabilidad de elección de una muestra M=(e1,e2,,,en) cualquiera es
!
)!(
)1(
1
1
11
]/[][][
)],.....,,[(][
121 ,......,,21
21
N
nN
nNNN
ePePeP
eeePMP
neeen
n
lo que corresponde en el sentido de la definición de probabilidad de Laplace a un caso posible
entre las VN,n posibles n-uplas de N elementos de la población.
Si el orden no interviene, la probabilidad de que una muestra M={e1,e2,…en} E
sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces
como permutaciones en el orden de sus elementos sea posible, es decir
!
)!( !
)],.....,,[( !
)],.....,,[(][
21
21
N
nNn
eeePn
eeePMP
n
n
2) Muestreo aleatorio con reposición
Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo
que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento
puede ser extraído varias veces. Si el orden en la extracción de la muestra interviene, la
probabilidad de una cualquiera de ellas, formada por n elementos es:
nNNNN
1111
Instituto Profesional Diego Portales
A U T Ó N O M O
36
Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior,
repitiéndola tantas veces como manera de combinar sus elementos sea posible. Es decir,
sea n1 el número de veces que se repite cierto elemento e1 en la muestra;
sea n2 el número de veces que se repite cierto elemento e2;
sea nk el número de veces que se repite cierto elemento ek,
de modo que n=n1+n2+…..nk.
El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que
como hemos mencionado se caracteriza por que:
cada elemento de la población tiene la misma probabilidad de ser elegido, y
las observaciones se realizan con reemplazamiento. De este modo, cada observación es
realizada sobre la misma población (no disminuye con las extracciones sucesivas).
Instituto Profesional Diego Portales
A U T Ó N O M O
37
Tablas de números aleatorios: Lotería Nacional
Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería
Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la
misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones.
Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de
k=5 cifras (00000-99.999), una población de N=600individuos, y deseamos extraer una muestra
de n=6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo
que a cada uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos
dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un
número t, y tomamos como primer elemento de la muestra al elemento de la población:
000.100
6001
101
tNtk
El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta
obtener la muestra de 10 individuos.
Las cantidades
k
tu
10
pueden ser consideradas como observaciones de una v.a. U, que sigue una distribución uniforme
en el intervalo [0,1]
Instituto Profesional Diego Portales
A U T Ó N O M O
38
Método de Montecarlo
El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una v.a. X,
de la que conocemos su ley de probabilidad (a partir de su función de distribución F). Con este
método, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad
es:
1. Usando una tabla de números aleatorios se toma un valor u de una v.a. U~U(0,1).
2. Si X es continua tomar como observación de X, la cantidad x=F-1
(u). En el caso en que X sea
discreta se toma x como el percentil 100* de X, es decir el valor más pequeño que verifica que
F(x) .
Este proceso se debe repetir n veces para obtener una muestra de tamaño n.
Ejemplo
Si queremos extraer n=10 muestras de una distribución N(0,1) podemos recurrir a una tabla de
números aleatorios de k=5 cifras, en las que observamos las cantidades (por ejemplo)
95.141 , 41.330 , 52.125 , 17.979 , 33.717 , 71.153 , 50.803 , 31.776 , 293.76~t
A partir de ellas podemos obtener una muestra de X~N(0,1) usando una tabla de la distribución
normal:
Números aleatorios Muestra U(0,1) Muestra N(0,1)
ti 510
ii
tu
xi = F
-1(ui)
76.293 0'76 0'71
31.776 0'32(=1-0'68) -0'47
50.803 0'51 0'03
71.153 0'71 0'55
20.271 0'20(=1-0'80) -0'84
33.717 0'34(=1-0'66) -0'41
Instituto Profesional Diego Portales
A U T Ó N O M O
39
17.979 0'18(=1-0'82) -0'92
52.125 0'52 0'05
41.330 0'41(=1-0'59) -0'23
95.141 0'95 1'65
Obsérvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la
esperanza matemática deXi~N( =0, 2=1). Por otra parte, esto no implica que el valor medio de
la muestra sea necesariamente 0x . Sin embargo como sabemos por el teorema de Fischer que
10
1,0~ 2
10
1
xx
i
i NXX
su dispersión con respecto al valor central es pequeña, lo que implica que probablemente el valor
medio estará muy próximo a 0, como se puede calcular:
012,0)65,1......71,0(10
1x
Obsérvese que si el problema fuese el inverso, donde únicamente conociésemos las
observaciones xi y que el mecanismo que generó esos datos hubiese sido una distribución normal
de parámetros desconocidos, con x obtenida hubiésemos tenido una buena aproximación del
``parámetro desconocido'' . Sobre esta cuestión volveremos más adelante al abordar el
problema de la estimación puntual de parámetros.
Instituto Profesional Diego Portales
A U T Ó N O M O
40
MUESTREO ESTRATIFICADO
Muestreo aleatorio estratificado
Un muestreo aleatorio estratificado es aquel en el que se divide la población de N individuos,
en k subpoblaciones o estratos, atendiendo a criterios que puedan ser importantes en el estudio,
de tamaños respectivos N1, ..., Nk, y realizando en cada una de estas subpoblaciones muestreos
aleatorios simples de tamaño ni.
A continuación nos planteamos el problema de cuantos elementos de muestra se han de elegir de
cada uno de los estratos. Para ello tenemos fundamentalmente dos técnicas: la asignación
proporcional y la asignación óptima
Ejemplo
Supongamos que realizamos un estudio sobre la población de estudiantes de una Universidad, en
el que a través de una muestra de 10 de ellos queremos obtener información sobre el uso de
barras de labios.
En primera aproximación lo que procede es hacer un muestreo aleatorio simple, pero en su lugar
podemos reflexionar sobre el hecho de que el comportamiento de la población con respecto a este
carácter no es homogéneo, y atendiendo a él, podemos dividir a la población en dos estratos:
Estudiantes masculinos (60% del total);
Estudiantes femeninos (40% restante).
de modo que se repartan proporcionalmente ambos grupos el número total de muestras, en
función de sus respectivos tamaños (6 varones y 4 mujeres). Esto es lo que se denomina
asignación proporcional.
Instituto Profesional Diego Portales
A U T Ó N O M O
41
Si observamos con más atención, nos encontramos (salvo sorpresas de probabilidad reducida)
que el comportamiento de los varones con respecto al carácter que se estudia es muy homogéneo
y diferenciado del grupo de las mujeres.
Por otra parte, con toda seguridad la precisión sobre el carácter que estudiamos, será muy alta en
el grupo de los varones aunque en la muestra haya muy pocos (pequeña varianza), mientras que
en el grupo de las mujeres habrá mayor dispersión. Cuando las varianzas poblacionales son
pequenãs, con pocos elementos de una muestra se obtiene una información más precisa del total
de la población que cuando la varianza es grande. Por tanto, si nuestros medios sólo nos permiten
tomar una muestra de 10 alumnos, será más conveniente dividir la muestra en dos estratos, y
tomar mediante muestreo aleatorio simple cierto número de individuos de cada estrato, de modo
que se elegirán más individuos en los grupos de mayor variabilidad. Así probablemente
obtendríamos mejores resultados estudiando una muestra de:
1 varón.
9 hembras.
Esto es lo que se denomina asignación óptima
Asignación proporcional
Sea n el número de individuos de la población total que forman parte de alguna muestra:
n=n1,n2,…,nk
Cuando la asignación es proporcional el tamaño de la muestra de cada estrato es proporcional al
tamaño del estrato correspondiente con respecto a la población total:
N
Nnn i
i
Instituto Profesional Diego Portales
A U T Ó N O M O
42
Asignación óptima
Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno de los estratos,
ni, los elige quien hace el muestreo, y para ello puede basarse en alguno de los siguientes
criterios:
Elegir los ni de tal modo que se minimice la varianza del estimador, para un coste
especificado, o bien,
habiendo fijado la varianza que podemos admitir para el estimador, minimizar el coste en
la obtención de las muestras.
Así en un estrato dado, se tiende a tomar una muestra más grande cuando:
El estrato es más grande;
El estrato posee mayor variabilidad interna (varianza);
El muestreo es más barato en ese estrato.
Para ajustar el tamaño de los estratos cuando conocemos la dispersión interna de cada uno de los
mismos, tenemos el siguiente resultado:
Muestreo sistemático
Cuando los elementos de la población están ordenados en fichas o en una lista, una manera de
muestrear consiste en
Sea k=N/n ;
Elegir aleatoriamente un número m, entre 1 y k;
Tomar como muestra los elementos de la lista:
knmkmkmm eeee )1(2, ,...,,
Instituto Profesional Diego Portales
A U T Ó N O M O
43
Esto es lo que se denomina muestreo sistemático. Cuando el criterio de ordenación de
los elementos en la lista es tal que los elementos más parecidos tienden a estar más
cercanos, el muestreo sistemático suele ser más preciso que el aleatorio simple, ya que
recorre la población de un modo más uniforme. Por otro lado, es a menudo más fácil no
cometer errores con un muestreo sistemático que con este último.
Observación
El método tal como se ha definido anteriormente es sesgado si N/n no es entero, ya que los
últimos elementos de la lista nunca pueden ser escogidos. Un modo de evitar este problema
consiste en considerar la lista como si fuese circular (el elemento N+1 coincide con el primero)
y:
Sea k el entero más cercano a N/n;
Se selecciona un número al azar m, entre 1 y N;
Se toma como muestra los elementos de la lista que consisten en ir saltando de k
elementos en k, a partir de m, teniendo en cuenta que la lista es circular.
Se puede comprobar que con este método todos los elementos de la lista tienen la misma
probabilidad de selección.
Muestreo por conglomerados
Si intentamos hacer un estudio sobre los habitantes de una ciudad, el muestreo aleatorio simple
puede resultar muy costoso, ya que estudiar una muestra de tamaño n implica enviar a los
encuestadores a npuntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza
una entrevista. En esta situación es más económico realizar el denominado muestreo por
conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para
después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.
Instituto Profesional Diego Portales
A U T Ó N O M O
44
Teorema central del límite
Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media y
varianza 2 , entonces la variable:
)30( , que siempre N(0,1)) (estándar normalón distribuci tiene nnnX
Z
Ejemplo
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente
en forma normal, con media 800 horas y desviación estándar 40 horas. Encuentre la probabilidad
de que una muestra aleatoria de 16 focos tenga una vida promedio de 775 horas.
Solución
Como la distribución de los focos es aproximadamente normal, que n=16 sea menor que treinta
no es relevante para el problema. Luego
5.2
40
16)800775(
nXZ
por lo tanto
0062.0)5.2()775( ZPXP
La probabilidad de que un foco dure menos de 775 horas es 0.0062.
Instituto Profesional Diego Portales
A U T Ó N O M O
45
Teorema ( distribución de la media muestral)
Sea x1,x2,…..x2 una muestra aleatoria de una variable aleatoria X que se distribuye normal con
media y varianza 2 entonces:
)1,0(~)(
,~2
Nn
nXZ
nNX
Ejemplo
Si una muestra aleatoria de tamaño 20 de una población normal con media 64,3 y varianza 225.
Encuentre la probabilidad de que la media muestral sea mayor que 68.
Solución
1357.08643.01)10.1(1
15
20)3,6468(1
)68(1)68(
zP
zP
xPxP
Luego la probabilidad de la media muestral sea mayor que 68 es 0.1357.
Instituto Profesional Diego Portales
A U T Ó N O M O
46
EJERCICIOS AUTO EVALUATIVOS Nº 4
1) La vida media de una máquina para hacer pasta es de siete años, con una desviación
estándar de un año. Suponga que las vidas de estas máquinas siguen aproximadamente
una distribución normal, encuentre:
a) La probabilidad de que la vida media de una muestra aleatoria de nueve de
estas máquinas caiga entre 6.4 y 7.2
b) El valor de x a la derecha del cual caería el 15% de las medias calculadas de
muestras aleatorias de tamaño 9.
2) El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es
una variable aleatoria con media 3.2 minutos y una desviación estándar de 1.6 minutos. Si
se observa una muestra aleatoria de de 64 clientes encuentre la probabilidad de que su
tiempo medio con el cajero sea:
a) a lo más 2.7 minutos
b) más de 3.5 minutos
c) entre 3.2 y 3.4 minutos.
Instituto Profesional Diego Portales
A U T Ó N O M O
47
SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 4
1)
a) 0.6898
b) 7.35
2)
a) 0.0062
b) 0.0668
c) 0.3413
Instituto Profesional Diego Portales
A U T Ó N O M O
48
Inferencia estadística
La teoría de inferencia estadística consiste en aquellos métodos con los cuales se pueden
realizar inferencias o generalizaciones acerca de una población.
La inferencia estadística se divide en dos áreas:
a) Estimación de parámetros
b) Pruebas de hipótesis
ESTIMACION DE PARAMETROS
Los parámetros a estudiar son parámetros poblacionales como la media y la varianza.
Si es un parámetro desconocido, entonces ˆ será su estimador.
Así , x es un estimador de y 2s es un estimador de
2
si ellos cumplen con la propiedad de
insesgamiento.
Definición
Se dice que un estadístico ˆ es un estimador insesgado del parámetro si y sólo si )ˆ(E .
22 )E( b)
)( a) :forma esta De
s
xE
Nota : La letra E simboliza Esperanza o Valor Esperado para x y 2s .
Instituto Profesional Diego Portales
A U T Ó N O M O
49
ESTIMACION POR INTERVALOS
Una estimación por intervalo de un parámetro poblacional ˆ es un intervalo de la forma
21ˆˆ
, donde 1ˆ
y 2ˆ
dependen del valor de ˆ para una muestra particular y también de la
distribución muestral de ˆ.
Basado en la distribución muetral de ˆ se puede determinar si el intervalo )ˆ,ˆ( 21 con una
probabilidad dada contiene realmente el parámetro que se supone va estimar.
1 0 donde 1 )ˆˆ( : es Esto 21P .
El intervalo )ˆ,ˆ( 21 calculado de una muestra particular se llama intervalo de confianza del
% 100)1( , la fracción )1( se denomina coeficiente de confianza, grado de confianza, o
nivel de confianza y los puntos 1ˆ
y 2ˆ
se llaman límites de confianza.
Por ejemplo:
%. 99 del es confianza de intervalo el entonces ,01.0 Si b)
%. 95 del confianza de intervaloun tienese entonces ,05.0 Si a)
Instituto Profesional Diego Portales
A U T Ó N O M O
50
A) Intervalo de confianza para la media ( ) de una población normal
A1) Se conoce su varianza
:entonces normal,poblacion una de aleatoria variableuna es si que Sabemos X ,~
2
nNX
N(0,1)~ )(
: variablela luego nx
Z
21
1
21
2
1
21
2
1
2
21
Z:Luego
Zpero Z Z
ónconstruccipor :Luego
2)(
211
2)(
1)(
Z
Z
ZZ
ZZP
ZZP
ZZZP
1)P(Z Así, 21 ZZ
Instituto Profesional Diego Portales
A U T Ó N O M O
51
De esta forma, reemplazando en esta expresión, los valores de Z, Z1 y Z2 obtenidos anteriormente
se tiene:
1
1
1
1)(
1)(
21
21
21
21
21
21
21
21
21
21
nZx
nZxP
nZx
nZxP
nZx
nZP
Z
n
xZP
Znx
ZP
Definición
Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza
pobalcional 2
conocida, entonces un intervalo de confianza del (1- )100% para la media
poblacional está dado por:
n
Zxn
Zx2
12
1,
Ejemplo :
Si una muestra aleatoria de tamaño 20 de una población normal con varianza 225 tiene una media
muestral de 64.3. Construya un intervalo de confianza del 95% para .
Instituto Profesional Diego Portales
A U T Ó N O M O
52
Solución
3.64
15225
20
05.0 %95%100)1(
2
x
n
reemplazando, estos valores en el intervalo se tiene:
9.70,7.5720
15)96.1(3.64,
20
15)96.1(3.64
20
153.64,
20
153.64
2
05.01
2
05.01
ZZ
así con una confianza del 95% el verdadero valor de la media poblacional se encuentra en el
intervalo : (57.7,70.9).
ESTIMACION DEL ERROR
Teorema
Si se usa x como estimación de , se puede tener una confianza del (1- )100% de que el error
no excederá de :
n
Ze2
1
En el ejemplo anterior:
57.620
15)96.1( 96.1975.0
21
eZZ
Instituto Profesional Diego Portales
A U T Ó N O M O
53
así con una confianza de 95% , el error de estimar a través de x no será mayor que 6.57
unidades, es decir : 57.6x
.
TAMAÑO MUESTRAL ADECUADO
Teorema
Con una confianza del (1- )100% , el tamaño muestral adecuado (n) para que la diferencia entre
x y no sea mayor que una cantidad específica e está dado por :
2
21
e
Z
n
Ejemplo:
¿ Que tan grande se require que sea la muestra del ejemplo (1) para que el error de estimar a
través de x no sea mayor que 0.05 ? utilice una confianza del 95%.
Sol
744.34505.0
)15(96.1 tantolopor 15
96.1 así 0.05 0.95)-(1 ; 05.0
2
975.0
21
n
ZZe α-
Luego con una confianza del 95% el tamaño muestral adecuado para que error de estimar de
x no sea mayor que 0.05 es de n=346 unidades aproximadamente.
Observación
Todo lo anterior también es aplicable a poblaciones no normales con varianza conocida cuando
n>30.
Instituto Profesional Diego Portales
A U T Ó N O M O
54
EJERCICIOS AUTO EVALUATIVOS Nº 5
1) Las medidas de los diámetros de los rodamientos tiene una desviación estándar de de
0.042 cm. Se selecciona una muestra aleatoria de 200 rodamientos producidas por una
máquina en una semana, los diámetros dieron una media de 0.824 cm. Hallar un intervalo
de confianza del 95% y 99% para el verdadero diámetro promedio de los rodamientos.
2) Suponga que la duración de un componente tiene distribución normal con media y
varianza 9. Se prueban 20 componentes y se anotan sus tipos de fallas x1,x2,x3…..x20.
Suponga además que la media de la muestra es de 100.9 horas. Obtener un intervalo de
confianza del 99% para la verdadera duración promedio de todos los componentes.
3) Se administra un test estándar a una numerosa clase de estudiantes. La puntuación media
de una muestra de 100 estudiantes es de 75 puntos. Suponga que la varianza admitida de
las puntuaciones para este test es de 2500 puntos. Hallar:
a) Intervalo de confianza del 98% para la verdadera puntuación media de los
estudiantes.
b) Límite superior del intervalo de confianza del 95% para
c) Límite inferior del intervalo de confianza del 90% para
4) Al medir el tiempo de reacción de una persona, un psicólogo estima que la desviación
estándar es de 0.05 segundos. ¿ De que tamaño ha de tomarse una muestra de medidas
para tener una confianza del 95% y 99% de que el error de estimar a través de x no sea
mayor que 0.01 segundos ?
Instituto Profesional Diego Portales
A U T Ó N O M O
55
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 5
1) 95% (0.8182 , 08298) 99% (0.816 , 0.8316)
2) (99.17 , 102.63)
3) a) (63.35 , 86.65)
b) (84.8)
c) 66.775
4) 95% n=96.04 97 99% n=116.4 167
Instituto Profesional Diego Portales
A U T Ó N O M O
56
A2) Si no se conoce su varianza
Sabemos que si x1,x2,……..xn una muestra aleatoria de una variable aleatoria X~N( ,2) con
2
desconocida entonces el estadístico:
. libertad de grados 1con student -ón tdistribuci tiene)(
nvs
nxT
donde n es el tamaño de la muestra y s es la desviación estándar de la muestra .
La función de densidad t-student gráficamente es similar a la función de densidad normal.
Su función de distribución acumulada como ya sabemos se encuentra tabulada.
El parámetro que caracteriza a la t-student se conoce como grados de libertad.
Instituto Profesional Diego Portales
A U T Ó N O M O
57
1
1
1)(
22
22
21
n
stx
n
stxP
t
n
s
xtP
tTtP
Definición
Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza
conocida, entonces un intervalo de confianza del (1- )100% para está dado por:
n
stx
n
stx
22
,
Ejemplo
Un fabricante de pintura quiere determinar el tiempo de secado promedio para una nueva pintura
para pared interior. Si para una prueba de 12 áreas de igual tamaño se obtiene un tiempo medio
de secado de 66.3 minutos y una desviación estándar de 8.4 minutos. Construya un intervalo de
confianza del 95% para el verdadero tiempo de secado promedio de las paredes si el tiempo
de secado tiene distribución normal.
Solución
61;71.6 12
8.4(2.201)66.3 ,
12
8.4(2.201)-66.3
:por dado está confianza de intervalo el así 4.8
2.201 025.0 2
05.0 95.01 :lado otropor 3.66
111-n 12
11,025.01,
2
s
ttx
n
n
Instituto Profesional Diego Portales
A U T Ó N O M O
58
Así un intervalo de confianza del 95% para el verdadero tiempo de secado promedio de las
paredes se encuentra en el intervalo (61; 71.6) minutos.
Teorema
Si se usa x como estimación de , se puede tener una confianza del (1- )100% de que el error
no excederá de :
n
ste
2
Ejemplo:
En el ejemplo anterior:
34.512
4.8)201.2( : tantolopor 12 , 4.8 , 201.2
2
enst
De esta forma, para la muestra de tamaño 12 x difiere de en 5.34 minutos, es decir:
minutos. 34.5x
TAMAÑO MUESTRAL ADECUADO
Teorema
Con una confianza del (1- )100% , el tamaño muestral adecuado (n) para que la diferencia entre
x y no sea mayor que una cantidad específica e está dado por :
2
2
e
st
n
Instituto Profesional Diego Portales
A U T Ó N O M O
59
Ejemplo:
En el ejemplo del fabricante de pintura, determine el tamaño de muestra adecuado para que el
error de estimar a través de x no sea mayor que 0.25 minutos.
546925.0
)4.8(201.22
n
Es decir para que el error no sea mayor que 0.25 se debe tomar una muestra de 5469 áreas.
Instituto Profesional Diego Portales
A U T Ó N O M O
60
EJERCICIOS AUTO EVALUATIVOS Nº 6
1) Se van a realizar durante un mes pruebas de mercado de un nuevo instrumento, en
determinadas tiendas de de una ciudad. Los resultados para una muestra de 16 tiendas
señalaron ventas promedio de $ 12.000 con una desviación estándar de $ 180. Encuentre
un intervalo de confianza del 99% para las ventas promedio reales de este nuevo
instrumento. Suponga distribución normal.
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La
media de la muestra es 10.48 ohms y la desviación estándar 1.36 ohms. Obtener un
intervalo de confianza de un 99% para la resistencia promedio real si ellas se distribuyen
normalmente.
3) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un
automóvil recorre un promedio de 23.500 Km por año con una desviación estándar de
3.900 Km. Determine un intervalo de confianza del 98% para la cantidad promedio de
Km que un automóvil recorre anualmente en el estado XX. Suponga distribución normal.
4) Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido
promedio de nicotina de 2.6 milígramos y una desviación estándar de 0.9 milígramos.
a) Determine un intervalo de confianza del 95% para el contenido promedio de real
de nicotina en esta marca de cigarros en particular, si se sabe que la distribución
de los contenidos de nicotina son normales.
b) Determine el tamaño muestral adecuado para que el error de estimar a través
de x no sea mayor que 0.05 con una confianza del 99%
Instituto Profesional Diego Portales
A U T Ó N O M O
61
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 6
1) (11867,385 ; 12132,615)
2) (9.61 ; 11.35)
3) (22578,04 ; 24421,96)
4) a) (1,847 ; 3.353)
b) n= 40 cigarros aproximadamente.
Instituto Profesional Diego Portales
A U T Ó N O M O
62
B) Intervalo de confianza para la varianza ( 2 ) de una población normal
Sabemos que si x1,x2,…….xn es una muestra aleatoria de X~N( ,2) con
2 desconocida,
entonces el estadístico:
libertad. de grados )1(con ochicuadradón distribuci tiene)1(
2
22 nv
snX
Donde s2 es la varianza de la muestra.
Instituto Profesional Diego Portales
A U T Ó N O M O
63
1)1()1(
11
)1(
1
1)1(
1
2
21
22
2
2
2
2
21
2
2
2
2
2
2
2
22
21
2
2
22
21
X
sn
X
snP
XsnXP
Xsn
XP
XXXP
Definición
Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo
de confianza del (1- )100% para 2 está dado por:
2
21
2
2
2
2 )1(;
)1(
X
sn
X
sn
donde X2
/2 y X2
1- /2 son los valores de X2 con (n-1) grados de libertad, con áreas de /2 y
1- /2 respectivamente, a la derecha.
Ejemplo:
1) Determine un intervalo de confianza del 95% para la varianza de una muestra de 10
paquetes de semilla, si la varianza de la muestra es 0.286.
Instituto Profesional Diego Portales
A U T Ó N O M O
64
Solución:
700.2X ; 023.19
286.0
9)1(10
975.02
1025.02
05.0%95%1001
2
2-1
2
2
2
X
s
nn
luego el intervalo de confianza para la varianza 2 queda dado por:
)953.0,135.0(700.2
286.0(9,
023.19
)286.0(9
así, con una confianza del 95% el verdadero valor de la varianza poblacional 2 se encuentra
en el intervalo (0.135,0.953).
2) Se obtiene una muestra aleatoria de 20 estudiantes con una media 72x puntos y una
varianza 162s en un exámen de Estadística. Suponga que las calificaciones tienen
distribución normal. Determine un intervalo de confianza del 98% para la varianza
poblacional.
Solución
633.7X ; 191.36
19)1(20
99.02
101.02
02.0%98%100)1(
2
2-1
2
2
X
nn
de esta manera el intervalo de confianza del 95% para la varianza 2 está dado por:
)82.39;39.8(633.7
)16(19;
191.36
)16(19
luego con una confianza del 95% el verdadero valor de la varianza 2 de las notas de los
estudiantes se encuentra en el intervalo (8.39;39.82).
Instituto Profesional Diego Portales
A U T Ó N O M O
65
EJERCICIOS AUTO EVALUATIVOS Nº 7
1) Un fabricante de baterías para automóvil asegura que sus baterías duran en promedio, 3
años con una desviacíon estándar de un año. Si 5 de estas baterías tienen una desviación
estándar de 0.9028 años. Determine un intervalo de confianza del 95% para la varianza
real. ¿ Es válida la afirmación del fabricante ? Suponga que la población de las duraciones
de las baterías se distribuye aproximadamente normal.
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La
media de la muestra es de 10,48 ohms y la desviación estándar 1.36 ohms. Obtener un
intervalo de confianza de un 95% para la varianza real si las resistencias se distribuyen
normalmente.
3) Una muestra aleatoria de 25 cigarros de una cierta marca tiene un contenido promedio de
nicotina de 1.3 milígramos y una desviación estándar de 0.17 milígramos. Encuentre un
intervalo de confianza del 90% y 98% para la varianza real de esta derteminada marca de
cigarros si se supone que las mediciones se distribuyen normalmente.
4) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un
automóvil recorre un promedio de 23.500 Km al año con una desviación estándar de
3.900 Km. Determine un intervalo de confianza del 99% para la varianza real de Km
recorridos al año por los automóviles del estado XX.
Instituto Profesional Diego Portales
A U T Ó N O M O
66
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 7
1) (0.29; 6.79) La afirmación del fabricante es válida porque la varianza poblacional está
dentro del intervalo que se determinó con una confianza del 95%.
2) (1.069; 3.949)
3) 90% (0.019; 0.05) 98% (0.016 ; 0.064)
4) ( 10741065.69 ; 22374294,2)
Instituto Profesional Diego Portales
A U T Ó N O M O
67
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS
POBLACIONES
A) Intervalo de confianza para la diferencia de medias ( 1 - 2 ) con varianzas
poblacionales 12 y 2
2 conocidas
Si tenemos dos poblaciones normales con medias 1 y 2 y varianzas 12 y 2
2, respectivamente,
el estadístico usado para la construcción de este intervalo está dado por:
estándar) normalón distribuci tienez ( )1,0(~ )()(
2
2
2
1
2
1
2121 N
nn
uuxxz
Definición
Si 1x y 2x son las medias de muestras aleatorias independientes de tamaños n1 y n2 ,
respectivamente de poblaciones con varianzas conocidas 12 y 2
2 , respectivamente, un intervalo
de confianza del (1- )100% para ( 1 - 2 ) está dado por:
)( ; )(2
2
2
1
2
1
21
21
2
2
2
1
2
1
21
21nn
zxxnn
zxx
Instituto Profesional Diego Portales
A U T Ó N O M O
68
Ejemplo:
Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B. Se mide el
rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y
75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen
constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el
promedio para el motor B es 42 millas por galón. Encuentre un intervalo de confianza del 96 %
para ( B- A), donde B y A son el rendimiento de gasolina medio poblacional para los motores
B y A. Suponga que las deviaciones estándar poblacionales son seis y ocho para los motores A y
B.
Solución
(1- )100%=96% (1- )=0.96 = 0.04 /2 = 0.02 ( 1- /2) = 0.98 . Por lo tanto:
z1- /2 = z0.98 = 2.05.
Por otro lado:
75 50, además , 6 , 8 , 636-42 2
A
2
B BAAB nnxx
De esta forma un intervalo de confianza de 96% para ( B- A) está dado por:
8.57 ; 3.4350
36
75
6405.26 ;
50
36
75
642.05-6
Podemos concluir que el rendimiento del motor B es mayor que el rendimiento del motor A.
Instituto Profesional Diego Portales
A U T Ó N O M O
69
B) Intervalo de confianza para la diferencia de medias ( 1 - 2 ) con varianzas
poblacionales 12 y 2
2 desconocidas pero iguales
Si tenemos dos poblaciones normales con medias 1 y 2 y varianzas poblacionales 12 y 2
2,
desconocidas pero iguales, el estadístico usado para la construcción de este intervalo está dado
por:
libertad de grados 2-con ón distribuci tiene11
)()(21
21
2121 nnvstudentt
nns
xxT
p
donde:
.muestrales varianzaslasson y queen 2
)1()1( 2
2
2
1
21
2
22
2
112 ssnn
snsns p
Definición
Si 1x y 2x son las medias de muestras aleatorias independientes de tamaños n1 y n2 ,
respectivamente, de poblaciones aproximadamente normales con varianzas iguales pero
desconocidas, un intervalo de de confianza del (1- )100% para ( 1 - 2 ) está dado por:
212
21
212
21
11)( ;
11)(
nnstxx
nnstxx pp
donde t /2 es el valor de t que deja un área de /2 a derecha con v=n1+n2-2 grados de libertad.
Instituto Profesional Diego Portales
A U T Ó N O M O
70
Ejemplo:
Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de
ácido de una mína de uranio. Los registros de ambas estaciones se encuentran dados en la
siguiente tabla:
Estación 1 Estación 2
n1= 12 n2= 10
1x =3.11 2x =2.04
s1=0.771 s2=0.448
Encuentre un intervalode confianza del 90% para la diferencia entre las medias poblacionales de
ambas estaciones. Suponga que las varianzas poblacionales son iguales pero desconocidas.
Solución
(1- )100%=90% (1- )=0.90 = 0.1 /2 = 0.05. Por lo tanto: t /2=t0.05=1.725
Por otro lado:
10 ,12 además , 0.448s , 0.771s , 1.072.04-3.11 21
2
2
2
121 nnxx
De esta forma:
417.021012
)448.0)(9()(11)(0.771
2
)1()1( 22
21
2
22
2
112
nn
snsnsp
Instituto Profesional Diego Portales
A U T Ó N O M O
71
De esta forma un intervalo de confianza de 90% para ( 1- 2) está dado por:
1.547 ; 0.593 10
1
12
1646)(1.725)(0.1.07 ;
10
1
12
1646)(1.725)(0.-1.07
De esta forma podemos concluir que las decarga de uranio en la en la estación 1 es mayor que
en la estación 2.
Instituto Profesional Diego Portales
A U T Ó N O M O
72
EJERCICIOS AUTO EVALUATIVOS Nº 8
1) Una muestra aleatoria de tamaño n1=25 que se toma de una población normal con una
desviación estándar 1=5 tiene una media 801x . Una segunda muestra aleatoria de
tamaño n2=36, que se toma de una población normal diferente con una desviación
estándar 2=3, tiene una media 752x .Encuentre un intervalo de confianza del 95% para
1- 2.
2) Los estudiantes pueden elegir entre un curso de física sin laboratorio de tres semestres-
hora y un curso con laboratorio de 4 semestres-hora. El examen escrito final es el mismo
para cada sección. Si 12 estudiantes de la sección con laboratorio tienen una calificación
promedio en el exámen de 84 con una deviación estándar de 4, y 18 estudiantes de la
sección sin laboratorio tienen una calificación promedio de 77 con una deviación estándar
de 6, encuentre un intervalo de confianza del 99% para la diferencia entre las
calificaciones promedio de los dos cursos. Suponga que las poblaciones se distribuyen de
forma aproximadamente normal con varianzas iguales.
3) Los siguientes datos, registrados en días, representan el tiempo de recuperación para
pacientes que se tratan al azar con uno de dos medicamentos para infecciones graves de la
vegiga:
Medicamento 1 Medicamento 2
n1= 14 n2= 16
1x =17 2x =19
2
1s =0.771 2
2s =0.448
Instituto Profesional Diego Portales
A U T Ó N O M O
73
Encuentre un intervalo de confianza del 99% para la diferencia 1- 2 del tiempo promedio de
recuperación de los medicamentos. ¿Son iguales los tiempos de recuperación? Suponga
poblaciones normales con varianzas poblacionales desconocidas pero iguales.
4) Una compañía de taxis trata de decidir si comprar neumáticos marca A o de la marca B para su
flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento
utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son:
Marca A Marca B
n1= 12 n2= 12
1x =36,300 kilómetros 2x =38,100 kilómetros
1s =5000 kilómetro 2s =6100 kilómetros
Calcule un intervalo de confianza del 95% para 1- 2 , suponga que las poblaciones se
distribuyen de forma aproximadamente normal. Suponga varianzas iguales pero desconocidas. ¿
Existe diferencia entre las dos marcas de neumáticos ?
Instituto Profesional Diego Portales
A U T Ó N O M O
74
SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 8
1) 1- 2 [2.9 , 7.1]
2) 1- 2 [1.5 , 12.5]
3) 2- 1 [0.7 , 3.3] . El tiempo de recuperación del medicamento 2 es mayor que el tiempo
de recuperación del medicamento 1
4) 1- 2 [-6522 , 2922] . El cero pertenece este intervalo luego 1- 2 puede ser igual a
cero, es decir: 1- 2 =0 1 = 2 , luego no existen diferencias entre los dos marcas
neumáticos.
Instituto Profesional Diego Portales
A U T Ó N O M O
75
ASIGNATURA ESTADÍSTICA
TERCERA UNIDAD
PRUEBAS DE HIPÓTESIS
CONTENIDO DE LA UNIDAD TEMÁTICA
3.1 Pruebas de hipótesis para diferencia de media con variancias conocidas.
3.2 Pruebas de hipótesis para diferencia de media con variancias desconocidas pero
iguales.
3.3 Pruebas de hipótesis para la varianza de una población normal.
Instituto Profesional Diego Portales
A U T Ó N O M O
76
PRUEBAS DE HIPOTESIS
Son procedimientos de decisión basados en datos que puedan producir una conclusión acerca de
algún sistema científico.
Una hipótesis estadística es una afirmación o conjetura acerca de una o más poblaciones.
No es posible saber con absoluta certeza la verdad o falsedad de una hipótesis estadística, pues
para ello habría que trabajar con toda la población. En la práctica se toma una muestra aleatoria
de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar
evidencias que confirmen o no la hipótesis. Si la evidencia de la muestra es inconsistente con la
hipótesis planteada, entonces ésta se rechaza y si la evidencia apoya a la hipótesis planteada,
entonces se acepta ésta.
La aceptación de una hipótesis implica tan sólo que los datos no proporcionan evidencia
suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la muestra la refuta.
La estructura de una prueba de hipótesis consiste en la formulación de una hipótesis nula , es
decir, cualquier hipótesis que se desee probar se denota por 0H . El rechazo de 0H , genera la
aceptación de una hipótesis alternativa , que se denota por 1H .
Una hipótesis nula referente a un parámetro poblacional siempre debe establecerse de manera que
especifique un valor exacto del parámetro, mientras que la hipótesis alternativa admite la
posibilidad de varios valores.
Por ejemplo:
1) 20 :
20 :
1
0
H
H 2)
20 :
20 :
1
0
H
H 3)
20 :
20 :
1
0
H
H
En la hipótesis alternativa se plantea usualmente la que se cree verdadero y en la hipótesis nula lo
que se desea rechazar.
Para tomar una desición acerca de un parámetro es necesario una prueba estadística para
cuantificar esta decisión. Esto se logra al establecer primero la distribución muestral que sigue la
muestra estadística ( es decir, la media ) y después calcular la prueba estadística apropiada. Esta
prueba estadística mide que tan cerca de la hipótesis nula se encuentra el valor de la muestra. La
prueba estadística suela seguir una distribución estadística conocida ( normal, t-student, ji
cuadrado).
La distribución apropiada de la prueba estadística se divide en dos regiones:
a) región de rechazo ( región crítica)
Instituto Profesional Diego Portales
A U T Ó N O M O
77
b) región de no rechazo
Si la prueba estadística cae en la región de no rechazo no se puede rechazar la hipótesis nula y si
cae en la región de rechazo, se rechaza la hipótesis nula.
Pare decidir con relación a la hipótesis nula, primero se tiene que determinar el valor crítico para
la distribución estadística de interés. El valor crítico separa la región de rechazo de la región de
no rechazo.
región de no rechazo región de rechazo
valor crítico
Errores al realizar una prueba de hipótesis
Al utilizar una muestra para obtener conclusiones sobre una población existe el riesgo de llegar a
una conclusión incorrrecta. Pueden ocurrir dos errores diferentes:
1) Error tipo I consiste en rechazar OH cuando ésta es verdadera
2) Error tipo II consiste en aceptar 0H cuando ésta es falsa
Al probar cualquier hipótesis estadística, existen cuatro posibles situaciones que determinan si la
desición es correcta o equivocada.
H0 es verdadera H0 es falsa
Se acepta H0 Desición correcta Error tipo II
Se rechaza H0 Error tipo I Desición correcta
La probabilidad de cometer error tipo I, es decir, rechazar H0 cuando es verdadera, se denomina
nivel de significación y se denota por . P( error tipo I)=
La probabilidad de no cometer error tipo I, es decir, aceptar H0 cuando es verdadera, se denota
por 1 . P( error tipo I)c =1
La probabilidad de cometer error tipo II, es decir, aceptar H0 cuando es falsa, se representa por
. P(error tipo II)=
La probabilidad de cometer error tipo II, es decir, rechazar H0 cuando es falsa, se denomina
potencia de la prueba y se denota por 1 . P(error tipo I)c=1
Instituto Profesional Diego Portales
A U T Ó N O M O
78
El ideal al rechazar una prueba de hipótesis es determinar los procedimientos o reglas que
conduzcan a maximizar la potencia de una prueba, para fijo. se suele especificar antes de
tomar una muestra, es frecuente que 05.0 o 01.0
Esquema para realizar una prueba de hipótesis acerca de un parámetro
1) Plantear la hipótesis nula y la hipótesis alternativa.
a) 11
10
:
:
H
H b)
11
10
:
:
H
H c)
11
10
:
:
H
H
2) Seleccionar el test estadístico o estadístico de prueba.
3) Fijar (0.05; 0.01; 0.10)
4) Construir la regla de decisión o región crítica con el valor elegido .
5) Extraer una muestra aleatoria de tamaño n y calcular el valor del test estadístico.
6) Si el valor calculado del test estadístico cae en la región crítica rechazar H0 , en caso contrario
no rechazar H0 y concluir que la muestra aleatoria no proporciona evidencia para rechazarla.
Pruebas de una y de dos colas
Una prueba de hipótesis será de una cola en los siguientes casos:
a) 11
10
:
:
H
H
b) 11
10
:
:
H
H
c) 11
10
:
:
H
H
d) 11
10
:
:
H
H
Instituto Profesional Diego Portales
A U T Ó N O M O
79
Una prueba de hipótesis será de dos colas si :
) ( :
:
1111
10
H
H
Pruebas de hipótesis
1) Para la media si la varianza )( 2 es conocida
Recuerde que si 2,~ NX , entonces n
NX2
,~ . Luego el estadístico usado para
contrastar estas hipótesis está dado por:
nx
z)(
~ N(0,1)
a) Prueba de hipótesis de una cola
11
110
:
)( : )
uuH
uuuuHi
En este caso La región crítica o región de rechazo de H0 está dada por:
1/ zzzRC
Gráficamente:
Instituto Profesional Diego Portales
A U T Ó N O M O
80
11
110
:
)( : )
uuH
uuuuHii
En este caso la región crítica o región de rechazo de H0 está dada por:
zzzRC /
Gráficamente:
b) Prueba de hipótesis de dos colas
11
10
:
:
uuH
uuH
En este caso la región crítica o región de rechazo de H0 está dada por:
21
21
ó / zzzzzRC
Gráficamente:
Instituto Profesional Diego Portales
A U T Ó N O M O
81
Ejemplos
1) Considere la hipótesis nula de que el peso promedio de los estudiantes de un cierto
instituto es de 68 kilos contra la hipótesis alternativa de que es diferente de 68 kilos.
Suponga que los pesos se distribuyen normalmente con una desviación estándar de 3.6
kilos. Se elige una muestra aleatoria de 36 estudiantes y se obtiene un peso promedio de
67.5 kilos. Utilice un nivel de significancia =0.05.
Solución:
68:
68:
1
0
uH
uH
96.1 05.0 975.0
21
zz
83.06.3
36)685.67( 3.6 5.67 36 zxn
Así la región crítica o región de rechazo de H0 queda dada por:
96.1 ó 96.1/ zzzRC
Por lo tanto RCz . Luego con base en la muestra no es posible decidir si el peso promedio de
los estudiantes del instituto es distinto de 68 kilos.
2) Una muestra aleatoria de 100 muertos registrados en Chile durante el año pasado mostró
una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9
años. ¿ Parecería esto indicar que la vida promedio hoy en día es mayor que 70 años ?
Utilice un nivel de significancia =0.05.
Instituto Profesional Diego Portales
A U T Ó N O M O
82
Solución:
70:
70:
1
0
uH
uH
64.1 05.0 95.01 zz
022.29.8
100)708.71( 9.8 8.71 100 zxn
Así la región crítica o región de rechazo de H0 queda dada por:
64.1/ zzRC
Por lo tanto RCz . Luego con base en la muestra podemos decir que la vida promedio hoy en
día supera los 70 años.
3) Un fabricante de equipo deportivo ha desarrollado un nuevo sedal sintético para pesca
que se considera tiene una resistencia a la ruptura de 8 kilógramos con una desviación
estándar de 0.5 kilógramos. Pruébese la hipótesis de que =8 Kg ,en contraposición a la
alternativa de que 8 Kg , si se toma una muestra aleatoria de 50 sedales y se encuentra
que tiene una resistencia promedio a la ruptura de 7.8 Kg. Utilice un nivel de
significancia =0.01.
Solución:
8:
8:
1
0
uH
uH
57.2 01.0 995.0
21
zz
83.25.0
50)88.7( 5.0 8.7 50 zxn
Instituto Profesional Diego Portales
A U T Ó N O M O
83
Así la región crítica o región de rechazo de H0 queda dada por:
57.2 ó 57.2/ zzzRC
Por lo tanto RCz . Luego se rechaza H0 , por lo tanto la resistencia a la ruptura es distinta de
8 Kg.
Instituto Profesional Diego Portales
A U T Ó N O M O
84
EJERCICIOS AUTO EVALUATIVOS Nº 9
1) Una empresa eléctrica fabrica focos que tienen una duración que está distribuída en forma
aproximadamente normal con media 800 horas y una desviación estándar de 40 horas.
Pruebe la hipótesis de que = 800 horas en contraposición de la alternativa de que
800 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788
horas. Utilice un nivel de significancia de 0,04.
2) Un fabricante de cigarros afirma que el contenido promedio de nicotina no excede de de
3,5 milígramos , con una desviación estándar de 1,4 milígramos. Para una muestra
aleatoria de 8 cigarros se tiene un contenido promedio de nicotina de 4,2 milígramos
¿Está de acuerdo con la afirmación del fabricante? Use un nivel de significancia =0,05.
Instituto Profesional Diego Portales
A U T Ó N O M O
85
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 9
1) Se acepta H0 , es decir, los focos tienen una duración promedio de 800 horas.
2) Se acepta H0, es decir, es correcta la afirmación del fabricante.
Instituto Profesional Diego Portales
A U T Ó N O M O
86
2) Para la media (μ ) con varianza poblacional ( 2 ) desconocida
Recordemos que si 2 es desconocida se usa s 2 y por lo tanto el adecuado para
contrastar estas hipótesis está dado por:
s
nxt
)( μ se distribuye t-student con v=n-1 grados de libertad, donde s es la
desviación estándar de la muestra.
a) Pruebas de hipótesis de una cola
i) 11
110
:
)( :
μμ
μμμμ
H
H
La región crítica o región de rechazo de H0 está dada por:
),(/
1ntttRC
Gráficamente:
Instituto Profesional Diego Portales
A U T Ó N O M O
87
ii) 11
110
:
)( :
H
H
La región crítica o región de rechazo de H0 está dada por:
)1,(/ ntttRC
Gráficamente:
b) Pruebas de hipótesis de dos colas
11
10
:
:
uuH
uuH
En este caso la región crítica o región de rechazo de H0 está dada por:
22
ó / tttttRC
Instituto Profesional Diego Portales
A U T Ó N O M O
88
Gráficamente:
Ejemplos:
1) Una compañía de electricidad ha publicado cifras acerca de la cantidad anual de
kilowatts-hora consumida por varios aparatos para el hogar. Se afirma que la aspiradora
consume un promedio de 46 kilowatts-hora al año. Si una muestra aleatoria de 12 hogares
incluidos en un estudio planeado indica que las aspiradoras consumen un promedio de 42
kilowatts-hora al año con una desviación estándar de 11.9 kilowatts-hora. ¿ Sugiere esto,
con un nivel de significación =0.05 , que las aspiradoras consumen, en promedio, menos
de 46 kilowatts-hora al año ? Suponga que la población de kilowatts-hora es normal.
Solución:
46:
46:
1
0
uH
uH
796.1 t- 05.0 11,05.01-n, t
16.19.11
12)4642( t 9.11s 42 12 xn
Instituto Profesional Diego Portales
A U T Ó N O M O
89
Así la región crítica o región de rechazo de H0 queda dada por:
796.1/ ttRC
Por lo tanto RCt . Luego con base en la muestra no podemos decir que el consumo de
kilowatts-hora al año de las aspiradoras sea menor que 46.
2) El gerente de producción de una empresa cuyo proceso consiste en llenar cajas de cereal
desea saber si efectivamente en cada caja se está depositando, en promedio, los 368
gramos que se supone es lo que la empresa asegura a sus vendedores. Para ello, se
selecciona una muestra aleatoria de 25 de estas cajas obteniendose una media de 364.1
gramos y una desviación estándar de 17.3 gramos. Considere que la distribución de los
pesos de las cajas de cereales es normal y trabaje con un nivel de significancia =0.05. ¿
Qué decide el gerente ?
Solución:
368:
368:
1
0
uH
uH
064.2 t 05.0 24,025.01,
2
tn
13.13.17
25)3681.364( t 3.17s 1.364 25 xn
Así la región crítica o región de rechazo de H0 queda dada por:
064.2 tó 064.2/ ttRC
Por lo tanto RCt . Luego con base en la muestra el gerente de producción puede estar seguro
que, en promedio, cada caja contiene 368gramos de cereal.
Instituto Profesional Diego Portales
A U T Ó N O M O
90
3) Suponga que en el mismo ejemplo anterior, del proceso de llenado de las cajas de cereal,
que la empresa es visitada por un representante de la oficina de protección al consumidor
y que le interesa averiguar si las cajas, en promedio, están faltas de peso, es decir, si el
peso promedio es inferior a 368 gramos. Considere un nivel de significación =0.01.
Solución:
368:
368:
1
0
uH
uH
492.2 t 01.0 24,01.01-n, t
13.13.17
25)3681.364( t 3.17s 1.364 25 xn
Así la región crítica o región de rechazo de H0 queda dada por:
492.2/ ttRC
Por lo tanto RCt . Luego con base en la muestra el representante de la oficina de protección
al consumidor puede estar seguro que, en promedio, el peso de cada caja de cereal no es inferior a
268 gramos.
Instituto Profesional Diego Portales
A U T Ó N O M O
91
EJERCICIOS AUTO EVALUATIVOS Nº 10
1) Una muestra aleatoria de 36 refrescos de una máquina despachadora automática tiene un
contenido promedio de 21.9 decílitros con una desviación estándar de 1.42 decílitros.
Pruebe la hipótesis de =22.2 decílitros en contraposición a la hipótesis alternativa,
<22.2 decílitros, con un nivel de significancia =0.05.
2) Se afirma que automóvil recorre un promedio anual de más de 20.000 kilómetros. Para
probar esta afirmación, se le solicita a una muestra aleatoria de 100 propietarios de
automóvil que lleven un registro de los kilómetros que recorren. ¿Estaría usted de
acuerdo con esta afirmación si en la muestra aleatoria resulta un promedio de 23.500
kilómetros y una desviación estándar de 3.900 kilómetros ? Use un nivel se significancia
=0.01.
3) En un informe de una investigación de J.M.N. se afirma que los ratones con una vida
promedio de 32 meses llegarán hasta casi 40 cuando 40% de las calorías en su
alimentación se reemplacen con vitaminas y proteínas. ¿ Hay alguna razón para creer que
la vida promedio será inferior a 40 meses si 64 ratones que se han sujetado a esta dieta
tienen una vida promedio de 38 meses con una desviación estándar de 5.8 meses ? Utilice
un nivel de significancia =0.025
4) Una empresa eléctrica afirma que un compactador de basura se usa un promedio de 125
horas al año. Si una muestra aleatoria de 49 hogares equipados con compactadores de
basura indica un uso promedio anual de 126.9 horas con una desviación estándar de 8.4
horas ¿ Sugiere esto con un nivel de significancia de 0.05, que estos aparatos se usan en
promedio más de 125 horas ?
Instituto Profesional Diego Portales
A U T Ó N O M O
92
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 10
1) Se acepta H0 , es decir, =22,2 decílitros.
2) Se rechaza H0 , es decir , un automóvil recorre un promedio anual superior a 20000
Km.
3) Se rechaza H0 , es decir la vida promedio no es inferior a 40 meses
4) Se acepta H0 , es decir , un compactador de basura dura, en promedio , sobre 125 horas al
año.
Instituto Profesional Diego Portales
A U T Ó N O M O
93
3) Prueba de hipótesis para la varianza de una población normal
Para contrastar estas hipótesis se usa el estadístico ji-cuadrado dado por:
2
22 )1( sn
a) Pruebas de hipótesis de una cola
i) :
)( :
2
1
2
1
2
1
22
1
2
0
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
/ 2
1,
22
nRC
Gráficamente:
Instituto Profesional Diego Portales
A U T Ó N O M O
94
ii) i) :
)( :
2
1
2
1
2
1
22
1
2
0
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
/ 2
1,1
22
nRC
Gráficamente:
c) Pruebas de hipótesis de dos colas
:
:
2
1
2
1
2
1
2
0
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
ó / 2
)1,2
(
22
)1,2
1(
22
nnRC
Instituto Profesional Diego Portales
A U T Ó N O M O
95
Gráficamente:
Ejemplos
1) Un fabricante de baterías para automóvil asegura que la duración de sus baterías tiene
distribución aproximadamente normal con desviación estándar de 0.9 años. Si una
muestra aleatoria de 10 baterías tiene una desviación estándar de 1.2 años ¿ Piensa usted
que >0.9 años ? Utilice un nivel de significancia =0.05
Solución:
81,0:
81,0:
2
1
2
0
H
H
919,19 05.0 2
9,05.0
2
1,n
16
81.0
44,19 44.1s 10 22n
Instituto Profesional Diego Portales
A U T Ó N O M O
96
Así la región crítica o región de rechazo de H0 queda dada por:
919,19/ 22RC
Por lo tanto 2
RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que
la varianza de la duración de las baterías sea mayor que 0.81 años.
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene distribución
aproximadamente normal con una varianza de 1.3 milígramos. Pruebe la hipótesis de que
2=1,3 en contraposición a la alternativa de que
21.3 , si una muestra aleatoria de 8
cigarros tiene una desviación estándar de 1,8 milígramos. Use un nivel de significación
=0.05.
Solución:
3,1:
3,1:
2
1
2
0
H
H
013,16
690,1 05.0
2
7,025.0
2
1,2
2
7,975.0
2
1,2
1
n
n
45.17
13.0
24,37 24.3s 8 22n
Así la región crítica o región de rechazo de H0 queda dada por:
013,16 ó 690,1/ 222RC
Por lo tanto 2
RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que
la varianza del contenido de nicotina en los cigarros se igual a 1,3 milígramos.
Instituto Profesional Diego Portales
A U T Ó N O M O
97
3) Experiencias pasadas indican que el tiempo para que los alumnos del último año realicen
un examen estandarizado es una v.a normal con desviación estándar de 6 minutos. Pruebe
la hipótesis de que <6 , si una muestra aleatoria de 20 estudiantes tiene una desviación
estándar de 4.51 minutos al realizar este examen. Utilice un nivel de significancia =0.01.
Solución:
36:
36:
2
1
2
0
H
H
633,7 01.0 2
19,99.0
2
1,1 n
74,10
36
3401,2019 3401,20s 20 22n
Así la región crítica o región de rechazo de H0 queda dada por:
633,7/ 22RC
Por lo tanto 2
RC. Luego con base en la muestra es posible afirmar que la varianza del tiempo
en que los estudiantes contestan el examen es igual a 36 minutos.
Instituto Profesional Diego Portales
A U T Ó N O M O
98
EJERCICIOS AUTO EVALUATIVOS Nº 11
1) Se sabe que la capacidad de los recipientes de un determinado lubricante tiene
distribución normal con varianza de 0,03 litros2. Pruebe la hipótesis de que
2=0,03 en
contraposición a la alternativa de que 2
0,03 para la muestra aleatoria de 10 recipientes
que tienen una desviación estándar de 0,25. Use un nivel de significación de 0,01.
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene una distribución
aproximadamente normal con una varianza de 1,3 milígramos. Pruebe la hipótesis de que
2=1.3 en contraposición a la alternativa de que
2>1,3 , si una muestra aleatoria de 8 de
estos tiene una desviación estándar de 1,8. Use un nivel de significancia =0,05.
Instituto Profesional Diego Portales
A U T Ó N O M O
99
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 11
1) Se acepta H0 , es decir , 2=0,03
2) Se rechaza H0 , es decir, 2
>1,3
Instituto Profesional Diego Portales
A U T Ó N O M O
100
ASIGNATURA ESTADÍSTICA
CUARTA UNIDAD
ANÁLISIS DE VARIANZA
CONTENIDO DE LA UNIDAD TEMÁTICA
4.1 Comparación de medias de dos tratamientos.
Instituto Profesional Diego Portales
A U T Ó N O M O
101
COMPARACION DE MEDIAS DE DOS POBLACIONES
1) Comparación de medias de dos poblaciones con varianzas poblacionales
21 y
22
conocidas
El estadístico usado para probar estas hipótesis está dado por:
estándar) normalón distribuci tienez ( )1,0(~ )(
2
2
2
1
2
1
21 N
nn
xxz
a) Prueba de hipótesis de una cola
i) 211
210
:
:
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
/ zzzRC
ii) 211
210
:
:
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
/ zzzRC
Instituto Profesional Diego Portales
A U T Ó N O M O
102
b) Prueba de hipótesis de dos colas
211
210
:
:
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
22
z ó / zzzzRC
2) Comparación de medias de dos poblaciones con varianzas poblacionales 2
1 y 2
2
desconocidas pero iguales
El estadístico usado para probar estas hipótesis está dado por:
libertad de grados 2-con ón distribuci tiene11
)(21
21
21 nnvstudentt
nns
xxT
p
donde:
.muestrales varianzaslasson y queen 2
)1()1( 2
2
2
1
21
2
22
2
112 ssnn
snsns p
Instituto Profesional Diego Portales
A U T Ó N O M O
103
a) Prueba de hipótesis de una cola
i) 211
210
:
:
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
/ tttRC
ii) 211
210
:
:
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
/ tttRC
b) Prueba de hipótesis de dos colas
211
210
:
:
H
H
En este caso la región crítica o región de rechazo de H0 está dada por:
22
tó / ttttRC
Instituto Profesional Diego Portales
A U T Ó N O M O
104
Ejemplo:
Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de
ácido de una mina de uranio. Los registros de ambas estaciones se encuentran dados en la
siguiente tabla:
Estación 1 Estación 2
n1= 12 n2= 10
1x =3.11 2x =2.04
s1=0.771 s2=0.448
¿ Son iguales las medias de ambas estaciones ? Utilice un nivel de significancia de 0,1.Suponga
que las varianzas poblacionales son iguales pero desconocidas.
Solución
211
210
:
:
H
H
= 0.1 /2 = 0.05. Por lo tanto: t /2=t0.05=1.725
725.1 tó 725.1/ ttRC
Por otro lado:
10 ,12 además , 0.448s , 0.771s , 1.072.04-3.11 21
2
2
2
121 nnxx
Instituto Profesional Diego Portales
A U T Ó N O M O
105
De esta forma:
417.021012
)448.0)(9()(11)(0.771
2
)1()1( 22
21
2
22
2
112
nn
snsnsp
así:
011,6 0.4280,417
07,1
11
)(
21
21
nns
xxt
p
Por lo tanto RCt . Luego se rechaza H0 , de esta forma las medias de ambas estaciones no
son iguales.
Instituto Profesional Diego Portales
A U T Ó N O M O
106
EJERCICIOS AUTO EVALUATIVOS Nº 12
Problema 1
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un
análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro.
Cada muestra se divide en 2 submuestras y se aplican los dos tipos de análisis. A continuación se
presentan los datos codificados que muestran los análisis de contenido de hierro.
Análisis 1 2 3 4 5
Rayos X 2.0 2.0 2.3 2.1 2.4
Químico 2.2 1.9 2.5 2.3 2.4
Suponga que las poblaciones son normales, Pruebe con un nivel de significancia de 0.05 si los
dos métodos de análisis dan en promedio el mismo resultado.
Problema 2
Los siguientes datos representan los tiempos de duración de las películas que producen dos
compañías cinematográficas.
Compañía Tiempo (minutos)
I 103 94 110 87 98
II 97 82 123 92 175 88 118
¿Son iguales los tiempos de duración de las películas que producen las 2 compañías? Utilice un
nivel de significancia de 0,05.
Instituto Profesional Diego Portales
A U T Ó N O M O
107
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 12
1) Los dos tratamientos no dan en promedio el mismo resultado es decir se rechaza H0.
2) Los tiempos promedio de duración de ambas películas no son iguales es decir se rechaza H0.
Instituto Profesional Diego Portales
A U T Ó N O M O
108
ANEXOS Tablas de distribución de probabilidades: (normal, t –student, y ji-cuadrado)
Tabla Áreas bajo la curva normal
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
-2.9 0.0019 0.0018 0.0017 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0352 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
-1.5 0.0668 0.0655 0.0643 0.0630 0.0518 0.0606 0.0594 0.0582 0.0571 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0722 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
Instituto Profesional Diego Portales
A U T Ó N O M O
109
Tabla, áreas bajo la curva normal
Instituto Profesional Diego Portales
A U T Ó N O M O
110
Tabla t- student
Instituto Profesional Diego Portales
A U T Ó N O M O
111
Tabla t- student
Instituto Profesional Diego Portales
A U T Ó N O M O
112
Tablas ji-cuadrado
Instituto Profesional Diego Portales
A U T Ó N O M O
113
Tablas ji-cuadrado
Instituto Profesional Diego Portales
A U T Ó N O M O
114
BIBLIOGRAFÍA
Chao, L 81993 (1993) “Estadísticas para las Ciencias Administrativas”
México, Editorial Mc. Graw Hill, 3º Edición (146 p).
Mason y Lind (1995) “Estadística para Administración y Economía”
España, Editorial Alfaomega (911 p.)
Canavos, G (1990) “Probalidad y Estadística. Aplicaciones y Métodos”.
México, Editorial Mc. Graw Hill, 1º Edición (651 p.)
Walpole, “Probabilidad y Estadística para Ingenieros”
México (1999) 6ª Edición
Uso de Internet para temas específicos.