Mód. Estadística Aplicada

114
Instituto Profesional Diego Portales AUTÓNOMO 1 Asignatura E E S S T T A A D D Í Í S S T T I I C C A A I I I I Autor: RODRIGO ALÍ VALLEJOS

description

ejercicios de estadisticas reforsamiento

Transcript of Mód. Estadística Aplicada

Instituto Profesional Diego Portales

A U T Ó N O M O

1

Asignatura

EESSTTAADDÍÍSSTTIICCAA IIII

Autor: RODRIGO ALÍ VALLEJOS

Instituto Profesional Diego Portales

A U T Ó N O M O

2

AUTOR RODRIGO ALÍ:

Ingeniero Matemático, Universidad de Concepción.

Se desempeña como docente en el Instituto Diego Portales de Concepción, desde 2000 a la fecha.

Se desempeña como docente en la Universidad Católica de la Santísima Concepción desde 2001 a la fecha.

Se desempeña como docente en la Universidad del Bío-Bío desde 2003 a la fecha.

Se desempeñó 3 años como coordinador e instructor de cursos en el Laboratorio de computación de la Facultad de Ciencias físicas y Matemáticas de la Universidad de Concepción

Instituto Profesional Diego Portales

A U T Ó N O M O

3

INVITACIÓN AL MÓDULO

Estimado alumno

Los conocimientos de teoría estadística son la base del soporte tecnológico y la base sobre la cuál se puede hacer un uso racional, sistemático y ético de la sorprendente tecnología que se incorpora cotidianamente a nuestro quehacer laboral. Por tanto, no es solo la necesidad de calcular, medir o de disponer de herramientas mecánicas directas por lo cuál hay que estudiar disciplina, sino que nos debe mover el manifiesto interés por desarrollar nuestra capacidad de desición, aumentar nuestra capacidad de analizar, discriminar, abstraer y sintetizar información, optimizando así nuestra rapidez y eficacia para enfrentar el conjunto de situaciones problemáticas que afectan diariamente al conjunto de nuestra actividad.

Este módulo de Estadística ha sido creado siguiendo de muy cerca el programa de la asignatura, en su elaboración se han priorizado objetivos y contenidos fundamentales, para acceder al dominio de herramientas de decisión y de lenguaje estadístico, que permitan una utilización transversal en el currículum general de tu carrera así como también una posible proyección posterior, hacia niveles de instrucción superiores en tu respectiva área.

Para facilitar el seguimiento de presente texto, se ha considerado una instrucción programada, simple reinterpretar por el alumno, que generalmente dispone de un tiempo limitado de estudio personal; se sugiere enfrentar perseverantemente todas las actividades de autoevaluación, propuestas al final de cada unidad temática, para ir accediendo a capítulos progresivos en forma directa, considerando también las instancias de consultoría establecidas por el Programa a Distancia a cargo de tus profesores tutores.

Esperando para ti todo el éxito posible, te invito a iniciar la tarea del aprendizaje sistemático, que te conducirá a la obtención de tus objetivos personales y profesionales.

¡¡Mucha suerte y hasta pronto!!

Instituto Profesional Diego Portales

A U T Ó N O M O

4

ASIGNATURA ESTADÍSTICA

OBJETIVO GENERAL

Al término del curso, el alumno será capaz de:

Aplicar elementos de estadística inferencial relacionados con distribuciones maestrales,

desarrollándolos en problemas de gestión empresarial.

Propender al desarrollo del sentido de autonomía personal y por lo tanto la responsabilidad

de su propio aprendizaje.

OBJETIVOS ESPECÍFICOS

Unidad Temática N° 1: Emplear la distribución normal, sus aplicaciones más importantes y su importancia en la construcción de otras distribuciones.

Unidad Temática N° 2: Construir parámetros en forma puntual y por intervalos verificando sus propiedades y aplicar los conceptos de estimación de cada uno de los muestreos estudiados.

Unidad Temática N° 3: Elaborar una prueba de hipótesis para medias y proporciones, aplicables a problemas del área.

Unidad Temática N° 4: Aplicar el análisis de varianza para medir la bondad del ajuste en modelos de regresión lineal.

Instituto Profesional Diego Portales

A U T Ó N O M O

5

ASIGNATURA ESTADÍSTICA

PRIMERA UNIDAD DISTRIBUCIONES CONTINUAS

CONTENIDO DE LA UNIDAD TEMÁTICA

1.1 Distribución normal. Generalidades y aplicaciones.

1.2 Distribución Chi – Cuadrado. T – Student y F.

1.2.1 Construcción. Características. Uso de tablas. Aplicaciones.

Instituto Profesional Diego Portales

A U T Ó N O M O

6

DISTRIBUCIÓN NORMAL

Es la distribución continua de de probabilidad más importante en el campo de la estadística. Su

gráfica recibe el nombre de curva normal, su forma es la de una campana.

Esta curva permite describir muchos fenómenos que ocurren en la naturaleza, la industria y la

investigación.

Una variable aleatoria (v.a) continua Χ que tiene distribución en forma de campana se llama

variable aleatoria normal.

Concepto: La función de la variable aleatoria Χ , con media μ y varianza σ2, está dada por:

),(~

2

1)(

2

21 2

σμ

σπσμ

NX

xeXfX

∞<<∞−⋅⋅

=⎟⎠⎞

⎜⎝⎛ −

Instituto Profesional Diego Portales

A U T Ó N O M O

7

Propiedades de la distribución normal

1) El máximo valor de la curva se encuentra en x=μ

2) La curva es simétrica respecto a la recta x=μ

3) La curva es asintótica al eje X

4) El área bajo la curva y sobre el eje X es uno.

5) Si X es una variable aleatoria normal, entonces E(X)=μ y Var(X)=σ2

Áreas bajo la curva

∫=<<b

a

dxXfbXaP )()(

Sin embargo, resolver esta integral con la función de densidad de la variable aleatoria normal no

es tan simple. Por tal motivo, se recurre a un proceso denominado estandarización basándose en

una variable aleatoria z que tiene μ=0 y σ2=1 y que se denomina distribución normal estándar.

Instituto Profesional Diego Portales

A U T Ó N O M O

8

Concepto: Si z es una v.a. normal con μ=0 y σ2=1, tiene función de densidad:

)1,0(~

- 21)(

2

21

NZ

xeZfZ

∞<<∞=−

π

El proceso de estandarización se realiza de la siguiente forma:

)1,0(~ entonces ),,(~ 2 NXZNXSiσμσμ −

=

Ejemplos

1) P(z>1,84)

P(z>1,84)=1-P(z ≤ 1,84)

= 1-0,9671

= 0,0329

Instituto Profesional Diego Portales

A U T Ó N O M O

9

2) P(-1,97<z<0,86)

P(-1,97<z<0,86) = P(z<0,86)- P(z<-197)

= 0,8051-0,0244

= 0,7807

3) P(z>z0)=0,7486

P(z>z0)=0,7486

1-P(z ≤ z0)=0,7486

1-0,7486 = P(z ≤ z0) ⇒ P(z ≤ z0) = 0,2514 ⇒ z0=-067

Instituto Profesional Diego Portales

A U T Ó N O M O

10

4) Sea X una v.a normal μ=40 y σ=6, detemine:

a) P(X≤x) = 0,45

45.0640

=⎟⎠⎞

⎜⎝⎛ −

≤zzP

22,39 13.0640

=⇒−=− xx

b) P( X>x )= 0,14

48,46 08,1640 86,0

640

14,06401

=⇒=−

⇒=⎟⎠⎞

⎜⎝⎛ −

=⎟⎠⎞

⎜⎝⎛ −

≤−

xxxzP

xzP

Instituto Profesional Diego Portales

A U T Ó N O M O

11

EJERCICIOS

I) Usando la tabla determine:

a) P(z<0,83) Resp: 0,7967

b) P(z<-1,27) Resp: 0,1020

c) P(z>0,83) Resp: 0,2033

d) P(z>-1,27) Resp: 0,898

e) P(0,47<z<1,08) Resp: 0,1791

f) P( -1,39<z<1,39) Resp: 0,8354

g) P(z>z1)=0,06 Resp: z1=1,55

h) P(-0,93<z<z1)=0,7235 Resp: z1=1,28

II) Dada la v.a. X distribuida normalmente con media 18 y desviación estándar 2,5 , encuentre:

a) P(x<15) Resp: 0,1151

b) P(x<x1) Resp: x1=16,1

c) P(x<x1) Resp: x1=20,28

d) P(17<x<21) Resp: 0,4009

Instituto Profesional Diego Portales

A U T Ó N O M O

12

Problemas de aplicación

1) Cierto tipo de batería dura un promedio de tres años, con una desviación estándar de 0,5

años. Suponiendo que las duraciones de las baterías son normalmente distribuidas,

encuentre la probabilidad de que una determinada batería dure menos de 2,3 años.

Solución:

batería la deDuración ))5,0(,3(~ 2 =XNX

0808,0

)4,1(

5,033,2 )3,2(

batería la deDuración ))5,0(,3(~ 2

=

<=

⎟⎠

⎞⎜⎝

⎛ −<=<

=

zP

zPxP

XNX

La probabilidad de que una determinada batería dure menos de 2,3 años es de un 8,08%.

Instituto Profesional Diego Portales

A U T Ó N O M O

13

2) Una compañía fabrica focos cuya duración es normalmente distribuida con una media de

800 horas y una desviación estándar de 40 horas. Encuentre la probabilidad de que un

foco dura entre 778 y 834 horas de uso.

Solución

0,5110,2912-0,8023

)55,0()85,0(

)85,055,0(

40800834

40800778 )834778(

focos los deDuración ))40(,800(~ 2

==

−−<=

−<<−=

⎟⎠⎞

⎜⎝⎛ −

<<−

=<<

=

PzP

zP

zPxP

XNX

La probabilidad de que un foco dure entre 778 y 834 horas de uso es de un 51,11%.

Instituto Profesional Diego Portales

A U T Ó N O M O

14

3) Una cierta máquina produce resistencias aléctricas que tienen un valor medio de 40 ohms

y una desviación estándar de 2 ohms. Suponiendo que los valores de las resistencias

siguen una distribución normal y que pueden medirse con cualquier grado de precisión.

¿Que porcentaje de las resistencias tendrá un valor que exceda los 43 ohms ?

Solución:

0668,0

9332,01

)5,1(1

240431 )43(

eléctricas asresistenci las devalor ))2(,40(~ 2

=

−=

≤−=

⎟⎠⎞

⎜⎝⎛ −

≤−=>

=

zP

zPxP

XNX

El 6,68% de las resistencias tendrá un valor que exceda a 43 ohms.

Instituto Profesional Diego Portales

A U T Ó N O M O

15

4) En una empresa las edades de los trabajadores se distribuye normalmente con media 50

años y desviación estándar 5 años.

a) ¿Qué porcentaje de los trabajadores tiene entre 50 y 52,5 años ?

b) ¿Cuál es la probabilidad de qque un trabajador cualquiera no sea mayor de 45 años?

c) ¿Cuál es la probabilidad que un trabajador tenga entre 41 y 58 años?

d) El 20% de los trabajadores están bajo cierta edad ¿Cuál es esa edad?

Solución:

res trabajadolos de edad ))5(,50(~ 2 =XNX

0,1915

5,06915,0

)0()5,0(

)5,00(

5505,52

55050 )5,5250( a)

=

−=

<−<=

<<=

⎟⎠⎞

⎜⎝⎛ −

<<−

=<<

zPzP

zP

zPxP

El 19,15% de los trabajadores tiene entre 50 y 52,5 años.

0,1587

)1(

55045 )45( b)

=

−≤=

⎟⎠⎞

⎜⎝⎛ −

≤=≤

zP

zPxP

La probabilidad de que un trabajador cualquiera no sea mayor de 45 años es de un 15,87 %

Instituto Profesional Diego Portales

A U T Ó N O M O

16

0,9093

)8,1()6,1(

)6,18,1(

55058

55041 )5841( c)

=

−<−<=

<<−=

⎟⎠⎞

⎜⎝⎛ −

<<−

=<<

zPzP

zP

zPxP

La probabilidad que un trabajador tenga entre 41 y 58 años es de un 90,93 %

75,45 -0,85550 0,20

550

20,0)( d)

=⇒=−

⇒=⎟⎠⎞

⎜⎝⎛ −

=<

xxxzP

xXP

El 20% de los trabajadores tiene una edad menor o igual a 45,75 años.

Instituto Profesional Diego Portales

A U T Ó N O M O

17

EJERCICIOS AUTO EVALUACIÓN Nº 1

1) Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta pastelería

tienen una longitud promedio de 30 cm y una desviación estándar de 2 cm. Suponiendo

que las longitudes están normalmente distribuidas. ¿Qué porcentaje de las piezas son :

a) De más de 31,7 cm de longitud ?

b) Entre 29,3 y 33,5 cm de longitud ?

c) De una longitud menor que 25,5 cm ?

2) Una máquina despachadora de refrescos está ajustada para servir un promedio de 200

mililítros por vaso. Si la cantidad de refresco está normalmente distribuida con una

desviación estándar de 15 mililítros.

a) ¿Qué fracción de los vasos contendrá más de 224 mililítros?

b) ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 206 mililítros?

3) El diámetro interno ya terminado de un anillo de pistón está normalmente distribuido con

una media de 10 cm y una desviación estándar de 0,03 cm.

a) ¿Qué proporción de los anillos tendrá un diámetro interno que exceda de 10,075

cm ?

b) ¿Cuál es la probabilidad de que un anillo de pistón tenga un diámetro interno entre

9,97 y 10,03 cm ?

c) ¿Para que valor el diámetro interno de un anillo de pistón representará el 15% ?

4) La resistencia a la tensión de cierto componente metálico está normalmente distribuida

con una media de 10.000 Kg/cm2 y una desviación estándar de 0,03 cm.

Instituto Profesional Diego Portales

A U T Ó N O M O

18

a) ¿Cuál es la proporción de estos componentes que execeden de 10.150 Kg/cm2 ?

b) Si las especificaciones requieren que todos los componentes tengan una resistencia

a la tensión entre 9.800 y 10.200 Kg/cm2 inclusive, ¿ qué porcentaje de piezas se

esperaría que se desechara?

5) La vida promedio de cierto tipo de motor pequeño es de 10 años con una desviación

estándar de 2 años. El fabricante repone sin cargo todos los motores que fallen dentro del

período de garantía. Si está a reponer sólo el 3% de los motores que fallan, ¿qué tan larga

deberá ser la garantía que otorgue? Suponga que la vida de los motores tienen distribución

normal.

6) Suponga que un consultor está investigando cuánto tiempo necesitarán los obreros de la

fábrica para montar cierta pieza en una planta de automóviles Volvo, y determinó que la

información ( tiempo en segundos ) estaba normalmente distribuida con una media de 75

segundos y una desviación estándar de 6 segundos.

a) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la

pieza en más de 81 segundos ?

b) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la

pieza entre 69 y 81 segundos ?

c) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la

pieza en menos de 62 segundos ?

d) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la

pieza entre 62 y 69 segundos ?

e) ¿Cuántos segundos deben pasar antes de que el 50% de los obreros monten la pieza?

7) El espesor de un lote de 10.000 arandelas de bronce de un cierto tipo fabricadas par una

gran compañía tiene una distribución normal con media 0,0191 pulgadas y desviación

estándar de 0,000425 pulgadas. Compruebe que se puede esperar que el 99,04% de estas

arandelas tengan un espesor entre 0,0180 y 0,202 pulgadas.

Instituto Profesional Diego Portales

A U T Ó N O M O

19

8) El tiempo de reacción para un cierto tipo de experimento psicológico está distribuido

normalmente con media 20 segundos y desviación estándar 4 segundos.

a) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción entre 14 y 30

segundos ?

b) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción entre 25y 30

segundos ?

c) ¿Qué porcentaje de personas tienen un tiempo de reacción de más de 14 segundos?

d) ¿Cuál es el tiempo de reacción de modo que sólo el 1% de todas las personas

reaccionen con mayor rapidez?

9) Un procesador de alimentos envasa café en pequeños tarros, los pesos de los tarros están

normalmente distribuidos con una desviación estándar de 0,3 onzas. Si el 5% de los tarros

pesa más de de 12,492 onzas. ¿Cuál es el promedio de los tarros?

Instituto Profesional Diego Portales

A U T Ó N O M O

20

SOLUCIONES EJERCICIOS AUTO EVALUACIÓN Nº1

1)

a) El 19,77% de las piezas tiene una longitud de más de 31,7 cm.

b) El 59,67% de las piezas tiene una longitud menos que 25,5 cm.

2)

a) El 5,48% de los vasos contendrá más de 224 mililítros

b) El 5,18% de los vasos tendrá entre 191 y 209 mililítros

3)

a) El 0,62% de los anillos tendrá un diámetro superior a 10,075 cm.

b) El 68,26% de los anillos tendrá un diámetro entre 9,97 y 10,03 cm.

c) El 15% de los anillos tendrá un diámetro de 9,9688 cm.

4)

a) El 6,68% de los componentes exceden de 10.150 Kg/cm2 de resistencia a la tensión.

b) El 4,56% de las piezas se despacharán

5) Deben tener una garantía de a lo más 6,24 años.

6)

a) Existe un 65,87% de probabilidad de que un obrero pueda montar una pieza en menos de 75

seg o en ,más de 81 seg.

b) Existe un 68,26% de probabilidad de que un obrero pueda montar una pieza entre 69 y 81 seg.

c) Existe un 1,5% de probabilidad de que un obrero pueda montar una pieza en menos de 62

seg.

d) Existe un 14,37% de probabilidad de que un obrero pueda montar una pieza entre 62y 69 seg.

e) Deben pasar 75 segundos antes de que el 50% de los obreros monten la pieza.

Instituto Profesional Diego Portales

A U T Ó N O M O

21

7)

Se cumple que el 99,04% de las arandelas tiene un espesor entre 0,0180 y 0,202 pulgadas.

8)

a) El 92,7% de las personas tiene un tiempo de reacción entre 14 y 30 segundos.

b) El 9,94% de las personas tiene un tiempo de reacción entre 25 y 30 segundos.

c) El 93,32% de las personas tiene un tiempo de reacción de más de 14 segundos.

d) El tiempo de reacción es de 10,38 segundos.

9) El promedio de los tarros es de 12,3 onzas.

Instituto Profesional Diego Portales

A U T Ó N O M O

22

DISTRIBUCIÓN T-STUDENT

Definición

Sean X1,X2,……Xn variables aleatorias identicamente distribuidas con distribución normal con

media μ y varianza σ2. Entonces la variable:

snxT )( μ−

=

tiene distribución t-student con v=n-1 grados de libertad donde n es el tamaño de la muestra, x es

la media de la muestra y s es la varianza muestral. La gráfica de esta distribución es similar a la

distribución normal y está dada por:

Al igual que la distribución normal los valores de área de esta distribución se encuentran

tabulados.

La distribución de probabilidad T se publicó por primera vez en 1908 en un artículo de W.S.

Gosset. En esa época , Gosset era empleado de una cervecería irlandesa que desaprobaba la

publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo

en secreto bajo el nombre de Student. En consecuencia, la distribución T normalmente se llama

distribución t de Student, o simplemente distribución t.

La distribución T es similar a la distribución de Z, pues ambas son simétricas alrededor de la

media igual a cero. Ambas distribuciones tienen forma de campana, pero la distribución t es más

variable, debido al hecho que la distribución t depende de las cantidades de x y s2.

Instituto Profesional Diego Portales

A U T Ó N O M O

23

Ejemplos

1) El valor de t con v=14 grados de libertad que deja un área de 0.0975 a la derecha es:

145.2025.0975.0 −=−= tt

2) Encuentre P(-t0.025<T<t0.05).

Solución:

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda,

encontrmos un área total de:

1-0.05-0.025=0.925

3) Encuentre el valor de k tal que P(k<t<-1.761)=0.045, para una muestra aleatoria de

tamaño 15 que se selecciona de una distribución normal.

Solución:

Notemos que 1.761 corresponde a t0.05 cuando v=14. Por tanto, -t0.05=-1761. Como k en el

enunciado de de la probabilidad original está a la izquieda de –t0.05 = -1761,

luego k=-2.977.

4) Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso

en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación

muestrea 25 lotes cada mes. Si el valor t calculado cae entre –t0.05 y t0.05, queda satisfecho

con su afirmación. ¿ que conclusión extraería de una muestra que tiene una media x =518

Instituto Profesional Diego Portales

A U T Ó N O M O

24

gramos por milímetro y una desviación estándar s=40 gramos?. Suponga que la

distribución de rendimientos es aproximadamente normal.

Solución:

De la tabla t-student encontramos que t0.05=1.711 para 24 grados de libertad. Por tanto, el

fabricante que satisfecho con esta afirmación si para la muestra de tamaño 25 el valor de t queda

entre -1.711 y 1.711. Si μ=500 entonces:

25.2

4025)500518()(

=−

=−

=s

nxt μ

Como t=2.25 no está entre -1711 y 1.711 el fabricante debe revisar su proceso productivo.

Instituto Profesional Diego Portales

A U T Ó N O M O

25

EJERCICIOS AUTO EVALUATIVOS Nº 2

1) Mediante uso de tabla encuentre:

12con v )179.2P(-1.356 )24con v )318.1P(T b)7con v )365.2P(T a)

=<<=>=<

Tc 2) Dada una muestra aleatoria de tamaño 24 de una distribución normal, encuentre k tal que:

0.9 )P(-k )0.095 )807.2TP(k b)0.965 )TP(-2.069 a)

=<<=<<=<<

kTc

k

3) Un fabricante de instrumentos de precisión para medidas terrestre afirma que sus mediciones

fallan en promedio a lo más 0.5 mm. En una muestra aleatoria de 8 de estos instrumentos las

fallas de medición fueron de : 0.6 , 0.7 , 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2 mm. Estaría de acuerdo

con la afirmación del fabricante?

4) Un fabricante de cigarrillos asegura que el contenido promedio de nicotina, en una de sus

marcas, es de 0.6 mg por cigarrillo. Una organización independiente mide el contenido de

nicotina de 16 cigarros de esta marca y encuentra que el promedio y la desviación estándar

muestral es de 0.75 y 0.175 mg, respectivamente, de nicotina. Si se supone que la cantidad de

nicotina de estos cigarros es una variable aleatoria normal ¿ que tan probable es el resultado

muestral dado por el fabricante ?

Instituto Profesional Diego Portales

A U T Ó N O M O

26

SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 2

1)

a) P= 0.975

b) P= 0.10

c) P= 0.875

2)

a) k=2.5

b) k=1.319

c) k=1.714

3) La varianza de una muestra está dada por:

1)( 22

2

−= ∑

nxnx

s i

así entonces s2=0.034 ⇒ s=0.183 ; además x =0.475 Calculemos P(μ ≤ 0.5)

3.0)38.0()38.0()38.0(

183.08)5.0475.0(

)5.0()()5.0(

777

7

=>=−<=−<=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −<=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −>

−=<

TPTPTP

TP

snx

snxPP μμ

Luego el fabricante debe revisar la presición de sus instrumentos

Instituto Profesional Diego Portales

A U T Ó N O M O

27

4) Calculemos: P(μ>0.6)

0025.0)428.3(

175.016)6.075.0(

)6.0()()6.0(

15

15

=>=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −>=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −>

−=>

TP

TP

snx

snxPP μμ

Luego la probabilidad que el contenido promedio de nicotina se mayor que 0.6 milígramos es

muy baja por tanto el fabricante podría tener razón sobre los contenidos promedio de nicotina de

sus cigarros.

Instituto Profesional Diego Portales

A U T Ó N O M O

28

Distribución ji-cuadrado

Definición

Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población

normal que tiene varianza σ2 , entonces la variable:

2

22 )1(

σχ Sn −

=

tiene distribución ji-cuadrado con v=n-1 grados de libertad. En que n es el tamaño de la

muestra S2 es la varianza muestral y σ2 es la varianza de la población.

1)( 22

2

−= ∑

nxnx

s i

La gráfica de esta distribución está dada por:

Al igual que las otras distribuciones sus valores de probabilidad se encuentran tabulados.

Instituto Profesional Diego Portales

A U T Ó N O M O

29

Ejemplo:

Un fabricante de baterías para auto garantiza que sus baterías durarán, en promedio tres años

con una desviación estándar de un año. Si cinco de estas baterías tienen duraciones de 1.9,

2.4, 3.0 , 3.5 y 4.2 años, ¿el fabricante aún está convencido de que sus baterías tienen una

desviación estándar de un año? Suponga que la duración de la batería tiene distribución

normal.

Solución:

Encontremos primero la varianza de la muestra:

815.0

1)( 22

2 =−

−= ∑

nxnx

s i

por otro lado

26.3

1)815.0)(4()1(

2

22 ==

−=

σχ Sn

( ) 5.026.31

)815.0)(4()1()1( 24

22 =<=⎟⎟

⎞⎜⎜⎝

⎛<

−=< χ

σPsnPsP

Luego el fabricante podría no tener razón en su afirmación.

Instituto Profesional Diego Portales

A U T Ó N O M O

30

EJERCICIOS AUTO EVALUATIVOS Nº 3

24 vcuando c)

7 vcuando b)

15 vcuando a)

:encuentre Para )1

20.01

20.05

20.005

2

=

=

=

χ

χ

χ

χα

25con v 045.0)652.37P( )

19con v 025.0)P( b)

5con v 99.0)P( a)

: si Encuentre 2)

20

2

20

2-1

20

2

20

==<<

==>

==>

χχ

χχ

χχ

χ

α

α

c 3) Un fabricante de baterías para auto garantiza que sus baterías duraran en promedio, tres años con una desviación estandar de 1 año .Si 5 de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años. Cual es la probabilidad de que la variabilidad de las baterías sea de más de 3 años ? 4) Considere una medición física proporcionada por un instrumento de precisión, en donde el interés recae en la variabilidad de la lectura .suponga que, con base en la experiencia, la medición es una variable aleatoria normalmente distribuida con media 10 y desviación estándar 0.1 unidades. Si se toma una muestra aleatoria procedente de un proceso de manofactura de los instrumentos de tamaño 25, ¿ cuál es la probabilidad de que el valor de la varianza muestral sea mayor de 0.014 unidades cuadradas ?

Instituto Profesional Diego Portales

A U T Ó N O M O

31

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 3

1)

a) 27.488

b) 18.475

c) 36.415

2)

a) 13.277

b) 32.852

c) 46.928

3) y 4) tarea

Instituto Profesional Diego Portales

A U T Ó N O M O

32

ASIGNATURA ESTADÍSTICA

SEGUNDA UNIDAD TÉCNICAS DE MUESTREO Y ESTIMACIÓN

PUNTUAL

CONTENIDO DE LA UNIDAD TEMÁTICA

2.1 Muestreo aleatorio simple.

2.2 Muestreo aleatorio sistemático.

2.3 Muestreo aleatorio estratificado.

2.4 Muestreo por conglomerados.

2.5 Distribución muestral de la Media.

2.6 Teorema central del límite.

2.7 Estimación puntual y por intervalos.

2.8 Error Estándar de la media.

2.9 Tamaño de muestra.

2.10 Muestreo por etapas.

Instituto Profesional Diego Portales

A U T Ó N O M O

33

Descripción de Técnicas de muestreo sobre una población

La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la

distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus

muestras.

Las ventajas de estudiar una población a partir de sus muestras son principalmente:

Coste reducido:

Si los datos que buscamos los podemos obtener a partir de una pequeña parte del total de

la población, los gastos de recogida y tratamiento de los datos serán menores. Por

ejemplo, cuando se realizan encuestas previas a un referéndum, es más barato preguntar a

4.000 personas su intención de voto, que a 30.000.000;

Mayor rapidez:

Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras

mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas

elecciones, muchas horas antes de que el recuento final de votos haya finalizado;

Más posibilidades:

Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de bombillas,

no es posible en la práctica destruirlas todas para conocer su vida media, ya que no

quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar

conclusiones sobre las demás.

De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas:

• Elección de la muestra (muestreo), que es a lo que nos dedicaremos en este capítulo.

• Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población

(inferencia).

Instituto Profesional Diego Portales

A U T Ó N O M O

34

Muestreo aleatorio

Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso

de extracción es tal que garantiza a cada uno de los elementos de la población la misma

oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo

aleatorio.

El muestreo aleatorio se puede plantear bajo dos puntos de vista:

• Sin reposición de los elementos;

• Con reposición.

1) Muestreo aleatorio sin reposición

Consideremos una población E formada por N elementos. Si observamos un elemento particular,

e∈E , en un muestreo aleatorio sin reposición se da la siguiente circunstancia:

• La probabilidad de que e sea elegido en primer lugar es N1

;

• Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de 1−NN

, la

probabilidad de que sea elegido en el segundo intento es de 11−N .

• en el (i+1)-ésimo intento, la población consta de N-i elementos, con lo cual si e no ha sido

seleccionado previamente, la probabilidad de que lo sea en este momento es de iN −1

.

Instituto Profesional Diego Portales

A U T Ó N O M O

35

Si consideramos una muestra de n ≤N elementos, donde el orden en la elección de los mismos

tiene importancia, la probabilidad de elección de una muestra M=(e1,e2,,,en) cualquiera es

!)!(

)1(1

111

]/[][][ )],.....,,[(][

121 ,......,,21

21

NnN

nNNN

ePePePeeePMP

neeen

n

−=

−−⋅⋅⋅

−⋅=

⋅⋅⋅⋅==

lo que corresponde en el sentido de la definición de probabilidad de Laplace a un caso posible

entre las VN,n posibles n-uplas de N elementos de la población.

Si el orden no interviene, la probabilidad de que una muestra M={e1,e2,…en}⊂E

sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces

como permutaciones en el orden de sus elementos sea posible, es decir

!)!( !

)],.....,,[( ! )],.....,,[(][

21

21

NnNn

eeePneeePMP

n

n

−⋅=

⋅==

2) Muestreo aleatorio con reposición

Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo

que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento

puede ser extraído varias veces. Si el orden en la extracción de la muestra interviene, la

probabilidad de una cualquiera de ellas, formada por n elementos es:

nNNNN1111

=⋅⋅⋅⋅

Instituto Profesional Diego Portales

A U T Ó N O M O

36

Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior,

repitiéndola tantas veces como manera de combinar sus elementos sea posible. Es decir,

sea n1 el número de veces que se repite cierto elemento e1 en la muestra;

sea n2 el número de veces que se repite cierto elemento e2;

sea nk el número de veces que se repite cierto elemento ek,

de modo que n=n1+n2+…..nk.

El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que

como hemos mencionado se caracteriza por que:

• cada elemento de la población tiene la misma probabilidad de ser elegido, y

• las observaciones se realizan con reemplazamiento. De este modo, cada observación es

realizada sobre la misma población (no disminuye con las extracciones sucesivas).

Instituto Profesional Diego Portales

A U T Ó N O M O

37

Tablas de números aleatorios: Lotería Nacional

Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería

Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la

misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones.

Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de

k=5 cifras (00000-99.999), una población de N=600individuos, y deseamos extraer una muestra

de n=6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo

que a cada uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos

dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un

número t, y tomamos como primer elemento de la muestra al elemento de la población:

⎥⎦⎤

⎢⎣⎡ ⋅

+=⎥⎦⎤

⎢⎣⎡ ⋅

+000.100

600110

1 tNtk

El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta

obtener la muestra de 10 individuos.

Las cantidades

k

tu10

=

pueden ser consideradas como observaciones de una v.a. U, que sigue una distribución uniforme

en el intervalo [0,1]

Instituto Profesional Diego Portales

A U T Ó N O M O

38

Método de Montecarlo

El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una v.a. X,

de la que conocemos su ley de probabilidad (a partir de su función de distribución F). Con este

método, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad

es:

1. Usando una tabla de números aleatorios se toma un valor u de una v.a. U~U(0,1).

2. Si X es continua tomar como observación de X, la cantidad x=F-1(u). En el caso en que X sea

discreta se toma x como el percentil 100*μ de X, es decir el valor más pequeño que verifica que

F(x)≥μ.

Este proceso se debe repetir n veces para obtener una muestra de tamaño n.

Ejemplo

Si queremos extraer n=10 muestras de una distribución N(0,1) podemos recurrir a una tabla de

números aleatorios de k=5 cifras, en las que observamos las cantidades (por ejemplo)

95.141 , 41.330 , 52.125 , 17.979 , 33.717 , 71.153 , 50.803 , 31.776 , 293.76~t

A partir de ellas podemos obtener una muestra de X~N(0,1) usando una tabla de la distribución normal:

Números aleatorios Muestra U(0,1) Muestra N(0,1)

ti 510i

it

u ≈

xi = F-1(ui)

76.293 0'76 0'71

31.776 0'32(=1-0'68) -0'47

50.803 0'51 0'03

71.153 0'71 0'55

20.271 0'20(=1-0'80) -0'84

33.717 0'34(=1-0'66) -0'41

Instituto Profesional Diego Portales

A U T Ó N O M O

39

17.979 0'18(=1-0'82) -0'92

52.125 0'52 0'05

41.330 0'41(=1-0'59) -0'23

95.141 0'95 1'65

Obsérvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la

esperanza matemática deXi~N(μ=0, σ2=1). Por otra parte, esto no implica que el valor medio de

la muestra sea necesariamente 0=x . Sin embargo como sabemos por el teorema de Fischer que

⎟⎠⎞

⎜⎝⎛ === ∑

= 101,0~ 2

10

1xx

ii NXX σμ

su dispersión con respecto al valor central es pequeña, lo que implica que probablemente el valor

medio estará muy próximo a 0, como se puede calcular:

012,0)65,1......71,0(101

=++=x

Obsérvese que si el problema fuese el inverso, donde únicamente conociésemos las

observaciones xi y que el mecanismo que generó esos datos hubiese sido una distribución normal

de parámetros desconocidos, con x obtenida hubiésemos tenido una buena aproximación del

``parámetro desconocido''μ . Sobre esta cuestión volveremos más adelante al abordar el

problema de la estimación puntual de parámetros.

Instituto Profesional Diego Portales

A U T Ó N O M O

40

MUESTREO ESTRATIFICADO

Muestreo aleatorio estratificado

Un muestreo aleatorio estratificado es aquel en el que se divide la población de N individuos,

en k subpoblaciones o estratos, atendiendo a criterios que puedan ser importantes en el estudio,

de tamaños respectivos N1, ..., Nk, y realizando en cada una de estas subpoblaciones muestreos

aleatorios simples de tamaño ni.

A continuación nos planteamos el problema de cuantos elementos de muestra se han de elegir de

cada uno de los estratos. Para ello tenemos fundamentalmente dos técnicas: la asignación

proporcional y la asignación óptima

Ejemplo

Supongamos que realizamos un estudio sobre la población de estudiantes de una Universidad, en

el que a través de una muestra de 10 de ellos queremos obtener información sobre el uso de

barras de labios.

En primera aproximación lo que procede es hacer un muestreo aleatorio simple, pero en su lugar

podemos reflexionar sobre el hecho de que el comportamiento de la población con respecto a este

carácter no es homogéneo, y atendiendo a él, podemos dividir a la población en dos estratos:

• Estudiantes masculinos (60% del total);

• Estudiantes femeninos (40% restante).

de modo que se repartan proporcionalmente ambos grupos el número total de muestras, en

función de sus respectivos tamaños (6 varones y 4 mujeres). Esto es lo que se denomina

asignación proporcional.

Instituto Profesional Diego Portales

A U T Ó N O M O

41

Si observamos con más atención, nos encontramos (salvo sorpresas de probabilidad reducida)

que el comportamiento de los varones con respecto al carácter que se estudia es muy homogéneo

y diferenciado del grupo de las mujeres.

Por otra parte, con toda seguridad la precisión sobre el carácter que estudiamos, será muy alta en

el grupo de los varones aunque en la muestra haya muy pocos (pequeña varianza), mientras que

en el grupo de las mujeres habrá mayor dispersión. Cuando las varianzas poblacionales son

pequenãs, con pocos elementos de una muestra se obtiene una información más precisa del total

de la población que cuando la varianza es grande. Por tanto, si nuestros medios sólo nos permiten

tomar una muestra de 10 alumnos, será más conveniente dividir la muestra en dos estratos, y

tomar mediante muestreo aleatorio simple cierto número de individuos de cada estrato, de modo

que se elegirán más individuos en los grupos de mayor variabilidad. Así probablemente

obtendríamos mejores resultados estudiando una muestra de:

• 1 varón.

• 9 hembras.

Esto es lo que se denomina asignación óptima

Asignación proporcional

Sea n el número de individuos de la población total que forman parte de alguna muestra:

n=n1,n2,…,nk

Cuando la asignación es proporcional el tamaño de la muestra de cada estrato es proporcional al

tamaño del estrato correspondiente con respecto a la población total:

NN

nn ii ⋅=

Instituto Profesional Diego Portales

A U T Ó N O M O

42

Asignación óptima

Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno de los estratos,

ni, los elige quien hace el muestreo, y para ello puede basarse en alguno de los siguientes

criterios:

• Elegir los ni de tal modo que se minimice la varianza del estimador, para un coste

especificado, o bien,

• habiendo fijado la varianza que podemos admitir para el estimador, minimizar el coste en

la obtención de las muestras.

Así en un estrato dado, se tiende a tomar una muestra más grande cuando:

• El estrato es más grande;

• El estrato posee mayor variabilidad interna (varianza);

• El muestreo es más barato en ese estrato.

Para ajustar el tamaño de los estratos cuando conocemos la dispersión interna de cada uno de los

mismos, tenemos el siguiente resultado:

Muestreo sistemático

Cuando los elementos de la población están ordenados en fichas o en una lista, una manera de

muestrear consiste en

• Sea k=N/n ;

• Elegir aleatoriamente un número m, entre 1 y k;

• Tomar como muestra los elementos de la lista:

{ }knmkmkmm eeee )1(2, ,...,, −+++

Instituto Profesional Diego Portales

A U T Ó N O M O

43

Esto es lo que se denomina muestreo sistemático. Cuando el criterio de ordenación de

los elementos en la lista es tal que los elementos más parecidos tienden a estar más

cercanos, el muestreo sistemático suele ser más preciso que el aleatorio simple, ya que

recorre la población de un modo más uniforme. Por otro lado, es a menudo más fácil no

cometer errores con un muestreo sistemático que con este último.

Observación

El método tal como se ha definido anteriormente es sesgado si N/n no es entero, ya que los

últimos elementos de la lista nunca pueden ser escogidos. Un modo de evitar este problema

consiste en considerar la lista como si fuese circular (el elemento N+1 coincide con el primero)

y:

• Sea k el entero más cercano a N/n;

• Se selecciona un número al azar m, entre 1 y N;

• Se toma como muestra los elementos de la lista que consisten en ir saltando de k

elementos en k, a partir de m, teniendo en cuenta que la lista es circular.

Se puede comprobar que con este método todos los elementos de la lista tienen la misma

probabilidad de selección.

Muestreo por conglomerados

Si intentamos hacer un estudio sobre los habitantes de una ciudad, el muestreo aleatorio simple

puede resultar muy costoso, ya que estudiar una muestra de tamaño n implica enviar a los

encuestadores a npuntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza

una entrevista. En esta situación es más económico realizar el denominado muestreo por

conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para

después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.

Instituto Profesional Diego Portales

A U T Ó N O M O

44

Teorema central del límite

Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media μ y

varianza σ2 , entonces la variable:

( ) )30( , que siempre N(0,1)) (estándar normalón distribuci tiene ≥∞→−

= nnnXZσμ

Ejemplo

Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente

en forma normal, con media 800 horas y desviación estándar 40 horas. Encuentre la probabilidad

de que una muestra aleatoria de 16 focos tenga una vida promedio de 775 horas.

Solución

Como la distribución de los focos es aproximadamente normal, que n=16 sea menor que treinta

no es relevante para el problema. Luego

( )5.2

4016)800775( −=

−=

−=

σμ nXZ

por lo tanto

0062.0)5.2()775( =−<=< ZPXP

La probabilidad de que un foco dure menos de 775 horas es 0.0062.

Instituto Profesional Diego Portales

A U T Ó N O M O

45

Teorema ( distribución de la media muestral)

Sea x1,x2,…..x2 una muestra aleatoria de una variable aleatoria X que se distribuye normal con

media μ y varianza σ2 entonces:

)1,0(~)(,~

2

Nn

nXZn

NX μσμ −=⇒⎟⎟

⎞⎜⎜⎝

Ejemplo

Si una muestra aleatoria de tamaño 20 de una población normal con media 64,3 y varianza 225.

Encuentre la probabilidad de que la media muestral sea mayor que 68.

Solución

1357.08643.01)10.1(1

1520)3,6468(1

)68(1)68(

=−=<−=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −<−=

<−=>

zP

zP

xPxP

Luego la probabilidad de la media muestral sea mayor que 68 es 0.1357.

Instituto Profesional Diego Portales

A U T Ó N O M O

46

EJERCICIOS AUTO EVALUATIVOS Nº 4

1) La vida media de una máquina para hacer pasta es de siete años, con una desviación

estándar de un año. Suponga que las vidas de estas máquinas siguen aproximadamente

una distribución normal, encuentre:

a) La probabilidad de que la vida media de una muestra aleatoria de nueve de

estas máquinas caiga entre 6.4 y 7.2

b) El valor de x a la derecha del cual caería el 15% de las medias calculadas de

muestras aleatorias de tamaño 9.

2) El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es

una variable aleatoria con media 3.2 minutos y una desviación estándar de 1.6 minutos. Si

se observa una muestra aleatoria de de 64 clientes encuentre la probabilidad de que su

tiempo medio con el cajero sea:

a) a lo más 2.7 minutos

b) más de 3.5 minutos

c) entre 3.2 y 3.4 minutos.

Instituto Profesional Diego Portales

A U T Ó N O M O

47

SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 4

1)

a) 0.6898

b) 7.35

2)

a) 0.0062

b) 0.0668

c) 0.3413

Instituto Profesional Diego Portales

A U T Ó N O M O

48

Inferencia estadística

La teoría de inferencia estadística consiste en aquellos métodos con los cuales se pueden

realizar inferencias o generalizaciones acerca de una población.

La inferencia estadística se divide en dos áreas:

a) Estimación de parámetros

b) Pruebas de hipótesis

ESTIMACION DE PARAMETROS

Los parámetros a estudiar son parámetros poblacionales como la media y la varianza.

Si θ es un parámetro desconocido, entonces θ̂ será su estimador.

Así , x es un estimador de μ y 2s es un estimador de

2σ si ellos cumplen con la propiedad de

insesgamiento.

Definición

Se dice que un estadístico θ̂ es un estimador insesgado del parámetro θ si y sólo si θθ =)ˆ(E .

22 )E( b) )( a) :forma esta Deσμ=

=

sxE

Nota : La letra E simboliza Esperanza o Valor Esperado para x y 2s .

Instituto Profesional Diego Portales

A U T Ó N O M O

49

ESTIMACION POR INTERVALOS

Una estimación por intervalo de un parámetro poblacional θ̂ es un intervalo de la forma

21ˆˆ θθθ << , donde 1̂θ y 2θ̂ dependen del valor de θ̂ para una muestra particular y también de la

distribución muestral de θ̂ .

Basado en la distribución muetral de θ̂ se puede determinar si el intervalo )ˆ,ˆ( 21 θθ con una

probabilidad dada contiene realmente el parámetro que se supone va estimar.

1 0 donde 1 )ˆˆ( : es Esto 21 <<−=<< ααθθθP .

El intervalo )ˆ,ˆ( 21 θθ calculado de una muestra particular se llama intervalo de confianza del

% 100)1( α− , la fracción )1( α− se denomina coeficiente de confianza, grado de confianza, o

nivel de confianza y los puntos 1̂θ y 2θ̂ se llaman límites de confianza.

Por ejemplo:

%. 99 del es confianza de intervalo el entonces ,01.0 Si b)%. 95 del confianza de intervaloun tienese entonces ,05.0 Si a)

==

αα

Instituto Profesional Diego Portales

A U T Ó N O M O

50

A) Intervalo de confianza para la media (μ ) de una población normal

A1) Se conoce su varianza

:entonces normal,poblacion una de aleatoria variableuna es si que Sabemos X ,~

2

⎟⎟⎠

⎞⎜⎜⎝

⎛n

NX σμ

N(0,1)~ )( : variablela luego σμ nxZ −

=

21

1

212

1

21

2

1

2

21

Z:Luego

Zpero Z Z

ónconstruccipor :Luego2

)(

211

2)(

1)(

α

α

α

α

αααα

−=

−==

=

=<

−=−+=<

−=<<

Z

Z

ZZ

ZZP

ZZP

ZZZP

α−=<< 1)P(Z Así, 21 ZZ

Instituto Profesional Diego Portales

A U T Ó N O M O

51

De esta forma, reemplazando en esta expresión, los valores de Z, Z1 y Z2 obtenidos anteriormente

se tiene:

ασμσ

ασμσ

ασμσ

ασμ

ασμ

αα

αα

αα

αα

αα

−=⎟⎟⎠

⎞⎜⎜⎝

⎛+<<−

−=⎟⎟⎠

⎞⎜⎜⎝

⎛+−<−<−−

−=⎟⎟⎠

⎞⎜⎜⎝

⎛<−<−

−=

⎟⎟⎟⎟

⎜⎜⎜⎜

<−

<−

−=⎟⎟⎠

⎞⎜⎜⎝

⎛<

−<−

−−

−−

−−

−−

−−

1

1

1

1)(

1)(

21

21

21

21

21

21

21

21

21

21

nZx

nZxP

nZx

nZxP

nZx

nZP

Z

n

xZP

ZnxZP

Definición

Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza

pobalcional 2σ conocida, entonces un intervalo de confianza del (1-α )100% para la media

poblacional μ está dado por:

⎟⎟⎠

⎞⎜⎜⎝

⎛+−

−− nZx

nZx σσ

αα2

12

1,

Ejemplo :

Si una muestra aleatoria de tamaño 20 de una población normal con varianza 225 tiene una media

muestral de 64.3. Construya un intervalo de confianza del 95% para μ .

Instituto Profesional Diego Portales

A U T Ó N O M O

52

Solución

3.6415225

2005.0 %95%100)1(

2

==⇒=

==⇒=−

x

nσσ

αα

reemplazando, estos valores en el intervalo se tiene:

( )9.70,7.5720

15)96.1(3.64,20

15)96.1(3.64

20153.64,

20153.64

205.01

205.01

=⎟⎟⎠

⎞⎜⎜⎝

⎛+−

⎟⎟⎠

⎞⎜⎜⎝

⎛+−

−−ZZ

así con una confianza del 95% el verdadero valor de la media poblacional μ se encuentra en el

intervalo : (57.7,70.9).

ESTIMACION DEL ERROR

Teorema

Si se usa x como estimación de μ , se puede tener una confianza del (1-α)100% de que el error

no excederá de :

nZe σ

α2

1−=

En el ejemplo anterior:

57.620

15)96.1( 96.1975.02

1==⇒==

−eZZ α

Instituto Profesional Diego Portales

A U T Ó N O M O

53

así con una confianza de 95% , el error de estimar μ a través de x no será mayor que 6.57

unidades, es decir : 57.6≤− μx .

TAMAÑO MUESTRAL ADECUADO

Teorema

Con una confianza del (1-α)100% , el tamaño muestral adecuado (n) para que la diferencia entre

x y μ no sea mayor que una cantidad específica e está dado por :

2

21

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎛⎟⎟⎠

⎞⎜⎜⎝

=−

e

Zn

σα

Ejemplo:

¿ Que tan grande se require que sea la muestra del ejemplo (1) para que el error de estimar μ a

través de x no sea mayor que 0.05 ? utilice una confianza del 95%.

Sol

744.34505.0

)15(96.1 tantolopor 15

96.1 así 0.05 0.95)-(1 ; 05.0

2

975.02

1

=⎟⎠⎞

⎜⎝⎛==

===⇒==

n

ZZe α-

σ

αα

Luego con una confianza del 95% el tamaño muestral adecuado para que error de estimar μ de

x no sea mayor que 0.05 es de n=346 unidades aproximadamente.

Observación

Todo lo anterior también es aplicable a poblaciones no normales con varianza conocida cuando

n>30.

Instituto Profesional Diego Portales

A U T Ó N O M O

54

EJERCICIOS AUTO EVALUATIVOS Nº 5

1) Las medidas de los diámetros de los rodamientos tiene una desviación estándar de de

0.042 cm. Se selecciona una muestra aleatoria de 200 rodamientos producidas por una

máquina en una semana, los diámetros dieron una media de 0.824 cm. Hallar un intervalo

de confianza del 95% y 99% para el verdadero diámetro promedio de los rodamientos.

2) Suponga que la duración de un componente tiene distribución normal con media μ y

varianza 9. Se prueban 20 componentes y se anotan sus tipos de fallas x1,x2,x3…..x20.

Suponga además que la media de la muestra es de 100.9 horas. Obtener un intervalo de

confianza del 99% para la verdadera duración promedio μ de todos los componentes.

3) Se administra un test estándar a una numerosa clase de estudiantes. La puntuación media

de una muestra de 100 estudiantes es de 75 puntos. Suponga que la varianza admitida de

las puntuaciones para este test es de 2500 puntos. Hallar:

a) Intervalo de confianza del 98% para la verdadera puntuación media μ de los

estudiantes.

b) Límite superior del intervalo de confianza del 95% para μ

c) Límite inferior del intervalo de confianza del 90% para μ

4) Al medir el tiempo de reacción de una persona, un psicólogo estima que la desviación

estándar es de 0.05 segundos. ¿ De que tamaño ha de tomarse una muestra de medidas

para tener una confianza del 95% y 99% de que el error de estimar μ a través de x no sea

mayor que 0.01 segundos ?

Instituto Profesional Diego Portales

A U T Ó N O M O

55

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 5

1) 95% ⇒ (0.8182 , 08298) 99% ⇒ (0.816 , 0.8316)

2) (99.17 , 102.63)

3) a) (63.35 , 86.65)

b) (84.8)

c) 66.775

4) 95% ⇒ n=96.04 ≈ 97 99% ⇒ n=116.4 ≈ 167

Instituto Profesional Diego Portales

A U T Ó N O M O

56

A2) Si no se conoce su varianza

Sabemos que si x1,x2,……..xn una muestra aleatoria de una variable aleatoria X~N(μ,σ2) con σ2

desconocida entonces el estadístico:

. libertad de grados 1con student -ón tdistribuci tiene)(−=

−= nv

snxT μ

donde n es el tamaño de la muestra y s es la desviación estándar de la muestra .

La función de densidad t-student gráficamente es similar a la función de densidad normal.

Su función de distribución acumulada como ya sabemos se encuentra tabulada.

El parámetro que caracteriza a la t-student se conoce como grados de libertad.

Instituto Profesional Diego Portales

A U T Ó N O M O

57

αμ

αμ

α

αα

αα

−=⎟⎟⎠

⎞⎜⎜⎝

⎛+<<−

−=

⎟⎟⎟⎟

⎜⎜⎜⎜

<−

<−

−=<<

1

1

1)(

22

22

21

nstx

nstxP

t

ns

xtP

tTtP

Definición

Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza

conocida, entonces un intervalo de confianza del (1-α)100% para μ está dado por:

⎟⎟⎠

⎞⎜⎜⎝

⎛+−

nstx

nstx

22

, αα

Ejemplo

Un fabricante de pintura quiere determinar el tiempo de secado promedio para una nueva pintura

para pared interior. Si para una prueba de 12 áreas de igual tamaño se obtiene un tiempo medio

de secado de 66.3 minutos y una desviación estándar de 8.4 minutos. Construya un intervalo de

confianza del 95% para μ el verdadero tiempo de secado promedio de las paredes si el tiempo

de secado tiene distribución normal.

Solución

( )61;71.6 12

8.4(2.201)66.3 , 12

8.4(2.201)-66.3

:por dado está confianza de intervalo el así 4.8

2.201 025.0 2

05.0 95.01 :lado otropor 3.66

111-n 12

11,025.01,2

=⎟⎠

⎞⎜⎝

⎛+

=

==⇒=⇒=⇒=−=

=⇒=

s

ttx

n

nαααα

Instituto Profesional Diego Portales

A U T Ó N O M O

58

Así un intervalo de confianza del 95% para el verdadero tiempo de secado promedio de las

paredes se encuentra en el intervalo (61; 71.6) minutos.

Teorema

Si se usa x como estimación de μ , se puede tener una confianza del (1-α)100% de que el error

no excederá de :

nste

2α=

Ejemplo:

En el ejemplo anterior:

34.5124.8)201.2( : tantolopor 12 , 4.8 , 201.2

2

===== enstα

De esta forma, para la muestra de tamaño 12 x difiere de μ en 5.34 minutos, es decir:

minutos. 34.5=− μx

TAMAÑO MUESTRAL ADECUADO

Teorema

Con una confianza del (1-α)100% , el tamaño muestral adecuado (n) para que la diferencia entre

x y μ no sea mayor que una cantidad específica e está dado por :

2

2

⎟⎟⎟

⎜⎜⎜

⎛=

e

stn

α

Instituto Profesional Diego Portales

A U T Ó N O M O

59

Ejemplo:

En el ejemplo del fabricante de pintura, determine el tamaño de muestra adecuado para que el

error de estimar μ a través de x no sea mayor que 0.25 minutos.

546925.0

)4.8(201.2 2

=⎟⎠⎞

⎜⎝⎛=n

Es decir para que el error no sea mayor que 0.25 se debe tomar una muestra de 5469 áreas.

Instituto Profesional Diego Portales

A U T Ó N O M O

60

EJERCICIOS AUTO EVALUATIVOS Nº 6

1) Se van a realizar durante un mes pruebas de mercado de un nuevo instrumento, en

determinadas tiendas de de una ciudad. Los resultados para una muestra de 16 tiendas

señalaron ventas promedio de $ 12.000 con una desviación estándar de $ 180. Encuentre

un intervalo de confianza del 99% para las ventas promedio reales de este nuevo

instrumento. Suponga distribución normal.

2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La

media de la muestra es 10.48 ohms y la desviación estándar 1.36 ohms. Obtener un

intervalo de confianza de un 99% para la resistencia promedio real si ellas se distribuyen

normalmente.

3) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un

automóvil recorre un promedio de 23.500 Km por año con una desviación estándar de

3.900 Km. Determine un intervalo de confianza del 98% para la cantidad promedio de

Km que un automóvil recorre anualmente en el estado XX. Suponga distribución normal.

4) Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido

promedio de nicotina de 2.6 milígramos y una desviación estándar de 0.9 milígramos.

a) Determine un intervalo de confianza del 95% para el contenido promedio de real

de nicotina en esta marca de cigarros en particular, si se sabe que la distribución

de los contenidos de nicotina son normales.

b) Determine el tamaño muestral adecuado para que el error de estimar μ a través

de x no sea mayor que 0.05 con una confianza del 99%

Instituto Profesional Diego Portales

A U T Ó N O M O

61

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 6

1) (11867,385 ; 12132,615)

2) (9.61 ; 11.35)

3) (22578,04 ; 24421,96)

4) a) (1,847 ; 3.353)

b) n= 40 cigarros aproximadamente.

Instituto Profesional Diego Portales

A U T Ó N O M O

62

B) Intervalo de confianza para la varianza ( σ2 ) de una población normal

Sabemos que si x1,x2,…….xn es una muestra aleatoria de X~N(μ,σ2) con σ2 desconocida,

entonces el estadístico:

libertad. de grados )1(con ochicuadradón distribuci tiene)1(2

22 −=

−= nvsnX

σ Donde s2 es la varianza de la muestra.

Instituto Profesional Diego Portales

A U T Ó N O M O

63

ασ

ασ

ασ

α

αα

αα

αα

αα

−=⎟⎟⎟

⎜⎜⎜

⎛−

<<−

−=⎟⎟⎟

⎜⎜⎜

<−

<

−=⎟⎟⎠

⎞⎜⎜⎝

⎛<

−<

−=⎟⎟⎠

⎞⎜⎜⎝

⎛<<

1)1()1(

11)1(

1

1)1(

1

2

21

22

2

2

2

2

21

2

2

2

2

2

22

22

21

2

2

22

21

Xsn

XsnP

XsnXP

XsnXP

XXXP

Definición

Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo

de confianza del (1-α)100% para σ2 está dado por:

⎟⎟⎟

⎜⎜⎜

⎛−−

2

21

2

2

2

2 )1(;)1(

αα Xsn

Xsn

donde X2α/2 y X2

1-α/2 son los valores de X2 con (n-1) grados de libertad, con áreas de α/2 y

1-α/2 respectivamente, a la derecha.

Ejemplo:

1) Determine un intervalo de confianza del 95% para la varianza de una muestra de 10

paquetes de semilla, si la varianza de la muestra es 0.286.

Instituto Profesional Diego Portales

A U T Ó N O M O

64

Solución:

( )

700.2X ; 023.19286.0

9)1(10

975.02

1025.02

05.0%95%1001

2

2-1

2

2

2

==

=

=−⇒=

=−⇒=⇒=⇒=−

αα

αααα

Xs

nn

luego el intervalo de confianza para la varianza σ2 queda dado por:

)953.0,135.0(700.2286.0(9,

023.19)286.0(9

=⎟⎠⎞

⎜⎝⎛

así, con una confianza del 95% el verdadero valor de la varianza poblacional σ2 se encuentra

en el intervalo (0.135,0.953).

2) Se obtiene una muestra aleatoria de 20 estudiantes con una media 72=x puntos y una

varianza 162 =s en un exámen de Estadística. Suponga que las calificaciones tienen

distribución normal. Determine un intervalo de confianza del 98% para la varianza

poblacional.

Solución

633.7X ; 191.3619)1(20

99.02

101.02

02.0%98%100)1(

2

2-1

2

2

==

=−⇒=

=−⇒=⇒=⇒=−

αα

αααα

Xnn

de esta manera el intervalo de confianza del 95% para la varianza σ2 está dado por:

)82.39;39.8(633.7

)16(19;191.36

)16(19=⎟

⎠⎞

⎜⎝⎛

luego con una confianza del 95% el verdadero valor de la varianza σ2 de las notas de los

estudiantes se encuentra en el intervalo (8.39;39.82).

Instituto Profesional Diego Portales

A U T Ó N O M O

65

EJERCICIOS AUTO EVALUATIVOS Nº 7

1) Un fabricante de baterías para automóvil asegura que sus baterías duran en promedio, 3

años con una desviacíon estándar de un año. Si 5 de estas baterías tienen una desviación

estándar de 0.9028 años. Determine un intervalo de confianza del 95% para la varianza

real. ¿ Es válida la afirmación del fabricante ? Suponga que la población de las duraciones

de las baterías se distribuye aproximadamente normal.

2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La

media de la muestra es de 10,48 ohms y la desviación estándar 1.36 ohms. Obtener un

intervalo de confianza de un 95% para la varianza real si las resistencias se distribuyen

normalmente.

3) Una muestra aleatoria de 25 cigarros de una cierta marca tiene un contenido promedio de

nicotina de 1.3 milígramos y una desviación estándar de 0.17 milígramos. Encuentre un

intervalo de confianza del 90% y 98% para la varianza real de esta derteminada marca de

cigarros si se supone que las mediciones se distribuyen normalmente.

4) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un

automóvil recorre un promedio de 23.500 Km al año con una desviación estándar de

3.900 Km. Determine un intervalo de confianza del 99% para la varianza real de Km

recorridos al año por los automóviles del estado XX.

Instituto Profesional Diego Portales

A U T Ó N O M O

66

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 7

1) (0.29; 6.79) La afirmación del fabricante es válida porque la varianza poblacional está

dentro del intervalo que se determinó con una confianza del 95%.

2) (1.069; 3.949)

3) 90% ⇒ (0.019; 0.05) 98% ⇒ (0.016 ; 0.064)

4) ( 10741065.69 ; 22374294,2)

Instituto Profesional Diego Portales

A U T Ó N O M O

67

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS

POBLACIONES

A) Intervalo de confianza para la diferencia de medias ( μ1 -μ2 ) con varianzas

poblacionales σ12 y σ2

2 conocidas

Si tenemos dos poblaciones normales con medias μ1 y μ2 y varianzas σ12 y σ2

2, respectivamente,

el estadístico usado para la construcción de este intervalo está dado por:

estándar) normalón distribuci tienez ( )1,0(~ )()(

2

22

1

21

2121 N

nn

uuxxz

⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

−−−=

σσ

Definición

Si 1x y 2x son las medias de muestras aleatorias independientes de tamaños n1 y n2 ,

respectivamente de poblaciones con varianzas conocidas σ12 y σ2

2 , respectivamente, un intervalo

de confianza del (1-α)100% para (μ1 -μ2 ) está dado por:

⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛+−⎟⎟

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛−−

−− )( ; )(

2

22

1

21

2121

2

22

1

21

2121 nn

zxxnn

zxx σσσσαα

Instituto Profesional Diego Portales

A U T Ó N O M O

68

Ejemplo:

Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B. Se mide el

rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y

75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen

constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el

promedio para el motor B es 42 millas por galón. Encuentre un intervalo de confianza del 96 %

para ( μB-μA), donde μB y μA son el rendimiento de gasolina medio poblacional para los motores

B y A. Suponga que las deviaciones estándar poblacionales son seis y ocho para los motores A y

B.

Solución

(1-α)100%=96% ⇒ (1-α)=0.96 ⇒ α = 0.04 ⇒ α/2 = 0.02 ⇒ ( 1- α/2) = 0.98 . Por lo tanto:

z1-α/2 = z0.98 = 2.05.

Por otro lado:

75 50, además , 6 , 8 , 636-42 2A

2B ======− BAAB nnxx σσ

De esta forma un intervalo de confianza de 96% para (μB-μA) está dado por:

[ ] 8.57 ; 3.435036

756405.26 ;

5036

75642.05-6 =⎥

⎤⎢⎣

⎡+++

Podemos concluir que el rendimiento del motor B es mayor que el rendimiento del motor A.

Instituto Profesional Diego Portales

A U T Ó N O M O

69

B) Intervalo de confianza para la diferencia de medias ( μ1 -μ2 ) con varianzas

poblacionales σ12 y σ2

2 desconocidas pero iguales

Si tenemos dos poblaciones normales con medias μ1 y μ2 y varianzas poblacionales σ12 y σ2

2,

desconocidas pero iguales, el estadístico usado para la construcción de este intervalo está dado

por:

libertad de grados 2-con ón distribuci tiene11

)()(21

21

2121 nnvstudentt

nns

xxT

p

+=−+

−−−=

μμ

donde:

.muestrales varianzaslasson y queen 2

)1()1( 22

21

21

222

2112 ss

nnsnsns p −+

−+−=

Definición

Si 1x y 2x son las medias de muestras aleatorias independientes de tamaños n1 y n2 ,

respectivamente, de poblaciones aproximadamente normales con varianzas iguales pero

desconocidas, un intervalo de de confianza del (1-α)100% para (μ1 -μ2 ) está dado por:

⎥⎦

⎤⎢⎣

⎡++−+−−

21221

21221

11)( ; 11)(nn

stxxnn

stxx pp αα

donde tα/2 es el valor de t que deja un área de α/2 a derecha con v=n1+n2-2 grados de libertad.

Instituto Profesional Diego Portales

A U T Ó N O M O

70

Ejemplo:

Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de

ácido de una mína de uranio. Los registros de ambas estaciones se encuentran dados en la

siguiente tabla:

Estación 1 Estación 2

n1= 12 n2= 10

1x =3.11 2x =2.04

s1=0.771 s2=0.448

Encuentre un intervalode confianza del 90% para la diferencia entre las medias poblacionales de

ambas estaciones. Suponga que las varianzas poblacionales son iguales pero desconocidas.

Solución

(1-α)100%=90% ⇒ (1-α)=0.90 ⇒ α = 0.1 ⇒ α/2 = 0.05. Por lo tanto: tα/2=t0.05=1.725

Por otro lado:

10 ,12 además , 0.448s , 0.771s , 1.072.04-3.11 2122

2121 ======− nnxx

De esta forma:

417.021012

)448.0)(9()(11)(0.771 2

)1()1( 22

21

222

2112 =

−++

=−+−+−

=nn

snsnsp

Instituto Profesional Diego Portales

A U T Ó N O M O

71

De esta forma un intervalo de confianza de 90% para (μ1-μ2) está dado por:

[ ] 1.547 ; 0.593 101

121646)(1.725)(0.1.07 ;

101

121646)(1.725)(0.-1.07 =⎥

⎤⎢⎣

⎡+++

De esta forma podemos concluir que las decarga de uranio en la en la estación 1 es mayor que

en la estación 2.

Instituto Profesional Diego Portales

A U T Ó N O M O

72

EJERCICIOS AUTO EVALUATIVOS Nº 8

1) Una muestra aleatoria de tamaño n1=25 que se toma de una población normal con una

desviación estándar σ1=5 tiene una media 801 =x . Una segunda muestra aleatoria de

tamaño n2=36, que se toma de una población normal diferente con una desviación

estándar σ2=3, tiene una media 752 =x .Encuentre un intervalo de confianza del 95% para

μ1-μ2.

2) Los estudiantes pueden elegir entre un curso de física sin laboratorio de tres semestres-

hora y un curso con laboratorio de 4 semestres-hora. El examen escrito final es el mismo

para cada sección. Si 12 estudiantes de la sección con laboratorio tienen una calificación

promedio en el exámen de 84 con una deviación estándar de 4, y 18 estudiantes de la

sección sin laboratorio tienen una calificación promedio de 77 con una deviación estándar

de 6, encuentre un intervalo de confianza del 99% para la diferencia entre las

calificaciones promedio de los dos cursos. Suponga que las poblaciones se distribuyen de

forma aproximadamente normal con varianzas iguales.

3) Los siguientes datos, registrados en días, representan el tiempo de recuperación para

pacientes que se tratan al azar con uno de dos medicamentos para infecciones graves de la

vegiga:

Medicamento 1 Medicamento 2

n1= 14 n2= 16

1x =17 2x =19 21s =0.771

22s =0.448

Instituto Profesional Diego Portales

A U T Ó N O M O

73

Encuentre un intervalo de confianza del 99% para la diferencia μ1-μ2 del tiempo promedio de

recuperación de los medicamentos. ¿Son iguales los tiempos de recuperación? Suponga

poblaciones normales con varianzas poblacionales desconocidas pero iguales.

4) Una compañía de taxis trata de decidir si comprar neumáticos marca A o de la marca B para su

flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento

utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son:

Marca A Marca B

n1= 12 n2= 12

1x =36,300 kilómetros 2x =38,100 kilómetros

1s =5000 kilómetro 2s =6100 kilómetros

Calcule un intervalo de confianza del 95% para μ1-μ2 , suponga que las poblaciones se

distribuyen de forma aproximadamente normal. Suponga varianzas iguales pero desconocidas. ¿

Existe diferencia entre las dos marcas de neumáticos ?

Instituto Profesional Diego Portales

A U T Ó N O M O

74

SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 8

1) μ1-μ2 ∈ [2.9 , 7.1]

2) μ1-μ2 ∈ [1.5 , 12.5]

3) μ2-μ1 ∈ [0.7 , 3.3] . El tiempo de recuperación del medicamento 2 es mayor que el tiempo

de recuperación del medicamento 1

4) μ1-μ2 ∈ [-6522 , 2922] . El cero pertenece este intervalo luego μ1-μ2 puede ser igual a

cero, es decir: μ1-μ2 =0 ⇒ μ1 = μ2 , luego no existen diferencias entre los dos marcas

neumáticos.

Instituto Profesional Diego Portales

A U T Ó N O M O

75

ASIGNATURA ESTADÍSTICA

TERCERA UNIDAD PRUEBAS DE HIPÓTESIS

CONTENIDO DE LA UNIDAD TEMÁTICA

3.1 Pruebas de hipótesis para diferencia de media con variancias conocidas.

3.2 Pruebas de hipótesis para diferencia de media con variancias desconocidas pero

iguales.

3.3 Pruebas de hipótesis para la varianza de una población normal.

Instituto Profesional Diego Portales

A U T Ó N O M O

76

PRUEBAS DE HIPOTESIS

Son procedimientos de decisión basados en datos que puedan producir una conclusión acerca de algún sistema científico. Una hipótesis estadística es una afirmación o conjetura acerca de una o más poblaciones. No es posible saber con absoluta certeza la verdad o falsedad de una hipótesis estadística, pues para ello habría que trabajar con toda la población. En la práctica se toma una muestra aleatoria de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencias que confirmen o no la hipótesis. Si la evidencia de la muestra es inconsistente con la hipótesis planteada, entonces ésta se rechaza y si la evidencia apoya a la hipótesis planteada, entonces se acepta ésta. La aceptación de una hipótesis implica tan sólo que los datos no proporcionan evidencia suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la muestra la refuta. La estructura de una prueba de hipótesis consiste en la formulación de una hipótesis nula , es decir, cualquier hipótesis que se desee probar se denota por 0H . El rechazo de 0H , genera la aceptación de una hipótesis alternativa , que se denota por 1H . Una hipótesis nula referente a un parámetro poblacional siempre debe establecerse de manera que especifique un valor exacto del parámetro, mientras que la hipótesis alternativa admite la posibilidad de varios valores. Por ejemplo:

1) 20 :20 :

1

0

>=

μμ

HH

2) 20 :20 :

1

0

<=

μμ

HH

3) 20 :20 :

1

0

≠=

μμ

HH

En la hipótesis alternativa se plantea usualmente la que se cree verdadero y en la hipótesis nula lo que se desea rechazar. Para tomar una desición acerca de un parámetro es necesario una prueba estadística para cuantificar esta decisión. Esto se logra al establecer primero la distribución muestral que sigue la muestra estadística ( es decir, la media ) y después calcular la prueba estadística apropiada. Esta prueba estadística mide que tan cerca de la hipótesis nula se encuentra el valor de la muestra. La prueba estadística suela seguir una distribución estadística conocida ( normal, t-student, ji cuadrado). La distribución apropiada de la prueba estadística se divide en dos regiones: a) región de rechazo ( región crítica)

Instituto Profesional Diego Portales

A U T Ó N O M O

77

b) región de no rechazo

Si la prueba estadística cae en la región de no rechazo no se puede rechazar la hipótesis nula y si cae en la región de rechazo, se rechaza la hipótesis nula. Pare decidir con relación a la hipótesis nula, primero se tiene que determinar el valor crítico para la distribución estadística de interés. El valor crítico separa la región de rechazo de la región de no rechazo. región de no rechazo región de rechazo valor crítico

Errores al realizar una prueba de hipótesis

Al utilizar una muestra para obtener conclusiones sobre una población existe el riesgo de llegar a una conclusión incorrrecta. Pueden ocurrir dos errores diferentes: 1) Error tipo I consiste en rechazar OH cuando ésta es verdadera

2) Error tipo II consiste en aceptar 0H cuando ésta es falsa

Al probar cualquier hipótesis estadística, existen cuatro posibles situaciones que determinan si la desición es correcta o equivocada.

H0 es verdadera H0 es falsa Se acepta H0 Desición correcta Error tipo II Se rechaza H0 Error tipo I Desición correcta

La probabilidad de cometer error tipo I, es decir, rechazar H0 cuando es verdadera, se denomina nivel de significación y se denota por α . P( error tipo I)= α La probabilidad de no cometer error tipo I, es decir, aceptar H0 cuando es verdadera, se denota por α−1 . P( error tipo I)c = α−1 La probabilidad de cometer error tipo II, es decir, aceptar H0 cuando es falsa, se representa por β . P(error tipo II)= β La probabilidad de cometer error tipo II, es decir, rechazar H0 cuando es falsa, se denomina potencia de la prueba y se denota por β−1 . P(error tipo I)c= β−1

Instituto Profesional Diego Portales

A U T Ó N O M O

78

El ideal al rechazar una prueba de hipótesis es determinar los procedimientos o reglas que conduzcan a maximizar la potencia de una prueba, para α fijo. α se suele especificar antes de

tomar una muestra, es frecuente que 05.0=α o 01.0=α

Esquema para realizar una prueba de hipótesis acerca de un parámetro θ

1) Plantear la hipótesis nula y la hipótesis alternativa.

a) 11

10

::

θθθθ

>≤

HH

b) 11

10

::

θθθθ

<≥

HH

c) 11

10

::

θθθθ

≠=

HH

2) Seleccionar el test estadístico o estadístico de prueba.

3) Fijar α (0.05; 0.01; 0.10)

4) Construir la regla de decisión o región crítica con el valor elegido α .

5) Extraer una muestra aleatoria de tamaño n y calcular el valor del test estadístico.

6) Si el valor calculado del test estadístico cae en la región crítica rechazar H0 , en caso contrario

no rechazar H0 y concluir que la muestra aleatoria no proporciona evidencia para rechazarla.

Pruebas de una y de dos colas

Una prueba de hipótesis será de una cola en los siguientes casos:

a) 11

10

::

θθθθ

>=

HH

b) 11

10

::

θθθθ

<=

HH

c) 11

10

::

θθθθ

>≤

HH

d) 11

10

::

θθθθ

<≥

HH

Instituto Profesional Diego Portales

A U T Ó N O M O

79

Una prueba de hipótesis será de dos colas si :

) ( ::

1111

10

θθθθθθθθ

>∨<≠=

HH

Pruebas de hipótesis 1) Para la media μ si la varianza )( 2σ es conocida

Recuerde que si ( )2,~ σμNX , entonces ⎟⎟⎠

⎞⎜⎜⎝

⎛n

NX2

,~ σμ . Luego el estadístico usado para

contrastar estas hipótesis está dado por:

σμ nxz )( −

= ~ N(0,1)

a) Prueba de hipótesis de una cola

11

110

: )( : )

uuHuuuuHi

>≤=

En este caso La región crítica o región de rechazo de H0 está dada por:

{ }α−>= 1/ zzzRC Gráficamente:

Instituto Profesional Diego Portales

A U T Ó N O M O

80

11

110

: )( : )

uuHuuuuHii

<≥=

En este caso la región crítica o región de rechazo de H0 está dada por:

{ }αzzzRC <= / Gráficamente:

b) Prueba de hipótesis de dos colas

11

10

: :

uuHuuH

≠=

En este caso la región crítica o región de rechazo de H0 está dada por:

⎭⎬⎫

⎩⎨⎧

>−<=−−

21

21

ó / αα zzzzzRC

Gráficamente:

Instituto Profesional Diego Portales

A U T Ó N O M O

81

Ejemplos

1) Considere la hipótesis nula de que el peso promedio de los estudiantes de un cierto

instituto es de 68 kilos contra la hipótesis alternativa de que es diferente de 68 kilos.

Suponga que los pesos se distribuyen normalmente con una desviación estándar de 3.6

kilos. Se elige una muestra aleatoria de 36 estudiantes y se obtiene un peso promedio de

67.5 kilos. Utilice un nivel de significancia α=0.05.

Solución:

68: 68:

1

0

≠=

uHuH

96.1 05.0 975.02

1==⇒=

−zz αα

83.06.3

36)685.67( 3.6 5.67 36 −=−

=⇒=== zxn σ

Así la región crítica o región de rechazo de H0 queda dada por:

{ }96.1 ó 96.1/ >−<= zzzRC Por lo tanto RCz∉ . Luego con base en la muestra no es posible decidir si el peso promedio de los estudiantes del instituto es distinto de 68 kilos.

2) Una muestra aleatoria de 100 muertos registrados en Chile durante el año pasado mostró

una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9

años. ¿ Parecería esto indicar que la vida promedio hoy en día es mayor que 70 años ?

Utilice un nivel de significancia α=0.05.

Instituto Profesional Diego Portales

A U T Ó N O M O

82

Solución:

70: 70:

1

0

><

uHuH

64.1 05.0 95.01 ==⇒= − zz αα

022.29.8

100)708.71( 9.8 8.71 100 =−

=⇒=== zxn σ

Así la región crítica o región de rechazo de H0 queda dada por:

{ }64.1/ >= zzRC

Por lo tanto RCz ∈ . Luego con base en la muestra podemos decir que la vida promedio hoy en día supera los 70 años.

3) Un fabricante de equipo deportivo ha desarrollado un nuevo sedal sintético para pesca

que se considera tiene una resistencia a la ruptura de 8 kilógramos con una desviación

estándar de 0.5 kilógramos. Pruébese la hipótesis de que μ=8 Kg ,en contraposición a la

alternativa de que μ ≠ 8 Kg , si se toma una muestra aleatoria de 50 sedales y se encuentra

que tiene una resistencia promedio a la ruptura de 7.8 Kg. Utilice un nivel de

significancia α=0.01.

Solución:

8: 8:

1

0

≠=

uHuH

57.2 01.0 995.02

1==⇒=

−zz αα

83.25.0

50)88.7( 5.0 8.7 50 −=−

=⇒=== zxn σ

Instituto Profesional Diego Portales

A U T Ó N O M O

83

Así la región crítica o región de rechazo de H0 queda dada por:

{ }57.2 ó 57.2/ >−<= zzzRC

Por lo tanto RCz ∈ . Luego se rechaza H0 , por lo tanto la resistencia a la ruptura es distinta de 8 Kg.

Instituto Profesional Diego Portales

A U T Ó N O M O

84

EJERCICIOS AUTO EVALUATIVOS Nº 9

1) Una empresa eléctrica fabrica focos que tienen una duración que está distribuída en forma

aproximadamente normal con media 800 horas y una desviación estándar de 40 horas.

Pruebe la hipótesis de que μ = 800 horas en contraposición de la alternativa de que μ ≠

800 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788

horas. Utilice un nivel de significancia de 0,04.

2) Un fabricante de cigarros afirma que el contenido promedio de nicotina no excede de de

3,5 milígramos , con una desviación estándar de 1,4 milígramos. Para una muestra

aleatoria de 8 cigarros se tiene un contenido promedio de nicotina de 4,2 milígramos

¿Está de acuerdo con la afirmación del fabricante? Use un nivel de significancia α=0,05.

Instituto Profesional Diego Portales

A U T Ó N O M O

85

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 9

1) Se acepta H0 , es decir, los focos tienen una duración promedio de 800 horas.

2) Se acepta H0, es decir, es correcta la afirmación del fabricante.

Instituto Profesional Diego Portales

A U T Ó N O M O

86

2) Para la media (μ ) con varianza poblacional ( σ2 ) desconocida Recordemos que si σ2 es desconocida se usa s 2 y por lo tanto el adecuado para

contrastar estas hipótesis está dado por:

s

nxt

)( μ−= se distribuye t-student con v=n-1 grados de libertad, donde s es la

desviación estándar de la muestra.

a) Pruebas de hipótesis de una cola

i) 11

110

:)( :

μμμμμμ

>≤=

HH

La región crítica o región de rechazo de H0 está dada por:

{ }),(/ 1−>= ntttRC α

Gráficamente:

Instituto Profesional Diego Portales

A U T Ó N O M O

87

ii) 11

110

:)( :

μμμμμμ

<≥=

HH

La región crítica o región de rechazo de H0 está dada por:

{ })1,(/ −−<= ntttRC α

Gráficamente:

b) Pruebas de hipótesis de dos colas

11

10

: :

uuHuuH

≠=

En este caso la región crítica o región de rechazo de H0 está dada por:

⎭⎬⎫

⎩⎨⎧

>−<=22

ó / αα tttttRC

Instituto Profesional Diego Portales

A U T Ó N O M O

88

Gráficamente:

Ejemplos:

1) Una compañía de electricidad ha publicado cifras acerca de la cantidad anual de

kilowatts-hora consumida por varios aparatos para el hogar. Se afirma que la aspiradora

consume un promedio de 46 kilowatts-hora al año. Si una muestra aleatoria de 12 hogares

incluidos en un estudio planeado indica que las aspiradoras consumen un promedio de 42

kilowatts-hora al año con una desviación estándar de 11.9 kilowatts-hora. ¿ Sugiere esto,

con un nivel de significación α=0.05 , que las aspiradoras consumen, en promedio, menos

de 46 kilowatts-hora al año ? Suponga que la población de kilowatts-hora es normal.

Solución:

46: 46:

1

0

<=

uHuH

796.1 t- 05.0 11,05.01-n, −=−=⇒= tαα

16.19.11

12)4642( t 9.11s 42 12 −=−

=⇒=== xn

Instituto Profesional Diego Portales

A U T Ó N O M O

89

Así la región crítica o región de rechazo de H0 queda dada por:

{ }796.1/ −<= ttRC

Por lo tanto RCt ∉ . Luego con base en la muestra no podemos decir que el consumo de kilowatts-hora al año de las aspiradoras sea menor que 46.

2) El gerente de producción de una empresa cuyo proceso consiste en llenar cajas de cereal

desea saber si efectivamente en cada caja se está depositando, en promedio, los 368

gramos que se supone es lo que la empresa asegura a sus vendedores. Para ello, se

selecciona una muestra aleatoria de 25 de estas cajas obteniendose una media de 364.1

gramos y una desviación estándar de 17.3 gramos. Considere que la distribución de los

pesos de las cajas de cereales es normal y trabaje con un nivel de significancia α=0.05. ¿

Qué decide el gerente ?

Solución:

368: 368:

1

0

≠=

uHuH

064.2 t 05.0 24,025.0

1,2

==⇒=−

tn

αα

13.13.17

25)3681.364( t 3.17s 1.364 25 −=−

=⇒=== xn

Así la región crítica o región de rechazo de H0 queda dada por:

{ }064.2 tó 064.2/ >−<= ttRC

Por lo tanto RCt ∉ . Luego con base en la muestra el gerente de producción puede estar seguro que, en promedio, cada caja contiene 368gramos de cereal.

Instituto Profesional Diego Portales

A U T Ó N O M O

90

3) Suponga que en el mismo ejemplo anterior, del proceso de llenado de las cajas de cereal,

que la empresa es visitada por un representante de la oficina de protección al consumidor

y que le interesa averiguar si las cajas, en promedio, están faltas de peso, es decir, si el

peso promedio es inferior a 368 gramos. Considere un nivel de significación α=0.01.

Solución:

368: 368:

1

0

<≥

uHuH

492.2 t 01.0 24,01.01-n, −==−⇒= tαα

13.13.17

25)3681.364( t 3.17s 1.364 25 −=−

=⇒=== xn

Así la región crítica o región de rechazo de H0 queda dada por:

{ } 492.2/ −<= ttRC

Por lo tanto RCt ∉ . Luego con base en la muestra el representante de la oficina de protección al consumidor puede estar seguro que, en promedio, el peso de cada caja de cereal no es inferior a 268 gramos.

Instituto Profesional Diego Portales

A U T Ó N O M O

91

EJERCICIOS AUTO EVALUATIVOS Nº 10

1) Una muestra aleatoria de 36 refrescos de una máquina despachadora automática tiene un

contenido promedio de 21.9 decílitros con una desviación estándar de 1.42 decílitros.

Pruebe la hipótesis de μ=22.2 decílitros en contraposición a la hipótesis alternativa,

μ<22.2 decílitros, con un nivel de significancia α=0.05.

2) Se afirma que automóvil recorre un promedio anual de más de 20.000 kilómetros. Para

probar esta afirmación, se le solicita a una muestra aleatoria de 100 propietarios de

automóvil que lleven un registro de los kilómetros que recorren. ¿Estaría usted de

acuerdo con esta afirmación si en la muestra aleatoria resulta un promedio de 23.500

kilómetros y una desviación estándar de 3.900 kilómetros ? Use un nivel se significancia

α=0.01.

3) En un informe de una investigación de J.M.N. se afirma que los ratones con una vida

promedio de 32 meses llegarán hasta casi 40 cuando 40% de las calorías en su

alimentación se reemplacen con vitaminas y proteínas. ¿ Hay alguna razón para creer que

la vida promedio será inferior a 40 meses si 64 ratones que se han sujetado a esta dieta

tienen una vida promedio de 38 meses con una desviación estándar de 5.8 meses ? Utilice

un nivel de significancia α=0.025

4) Una empresa eléctrica afirma que un compactador de basura se usa un promedio de 125

horas al año. Si una muestra aleatoria de 49 hogares equipados con compactadores de

basura indica un uso promedio anual de 126.9 horas con una desviación estándar de 8.4

horas ¿ Sugiere esto con un nivel de significancia de 0.05, que estos aparatos se usan en

promedio más de 125 horas ?

Instituto Profesional Diego Portales

A U T Ó N O M O

92

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 10

1) Se acepta H0 , es decir, μ=22,2 decílitros.

2) Se rechaza H0 , es decir , un automóvil recorre un promedio anual superior a 20000

Km. 3) Se rechaza H0 , es decir la vida promedio no es inferior a 40 meses

4) Se acepta H0 , es decir , un compactador de basura dura, en promedio , sobre 125 horas al

año.

Instituto Profesional Diego Portales

A U T Ó N O M O

93

3) Prueba de hipótesis para la varianza de una población normal Para contrastar estas hipótesis se usa el estadístico ji-cuadrado dado por:

2

22 )1(

σχ sn −

=

a) Pruebas de hipótesis de una cola

i) :

)( :21

21

21

221

20

σσ

σσσσ

>

≤=

H

H

En este caso la región crítica o región de rechazo de H0 está dada por:

{ } / 21,

22−>= nRC αχχχ

Gráficamente:

Instituto Profesional Diego Portales

A U T Ó N O M O

94

ii) i) :

)( :21

21

21

221

20

σσ

σσσσ

<

≥=

H

H

En este caso la región crítica o región de rechazo de H0 está dada por:

{ } / 21,1

22−−<= nRC αχχχ

Gráficamente:

c) Pruebas de hipótesis de dos colas

:

:21

21

21

20

σσ

σσ

=

H

H

En este caso la región crítica o región de rechazo de H0 está dada por:

⎭⎬⎫

⎩⎨⎧

><=−−−

ó / 2

)1,2

(

22

)1,2

1(

22

nnRC αα χχχχχ

Instituto Profesional Diego Portales

A U T Ó N O M O

95

Gráficamente:

Ejemplos

1) Un fabricante de baterías para automóvil asegura que la duración de sus baterías tiene

distribución aproximadamente normal con desviación estándar de 0.9 años. Si una

muestra aleatoria de 10 baterías tiene una desviación estándar de 1.2 años ¿ Piensa usted

que σ >0.9 años ? Utilice un nivel de significancia α=0.05

Solución:

81,0:

81,0:2

1

20

>

=

σ

σ

H

H

919,19 05.0 29,05.0

21, ==⇒= − χχα α n

16

81.044,19 44.1s 10 22 =

⋅=⇒== χn

Instituto Profesional Diego Portales

A U T Ó N O M O

96

Así la región crítica o región de rechazo de H0 queda dada por:

{ } 919,19/ 22 >= χχRC Por lo tanto χ2∉RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que la varianza de la duración de las baterías sea mayor que 0.81 años.

2) Se sabe que el contenido de nicotina de una marca de cigarros tiene distribución

aproximadamente normal con una varianza de 1.3 milígramos. Pruebe la hipótesis de que

σ2=1,3 en contraposición a la alternativa de que σ2≠1.3 , si una muestra aleatoria de 8

cigarros tiene una desviación estándar de 1,8 milígramos. Use un nivel de significación

α=0.05.

Solución:

3,1:

3,1:2

1

20

=

σ

σ

H

H

013,16

690,1 05.0

27,025.0

2

1,2

27,975.0

2

1,2

1

==

==⇒=

−−

χχ

χχα

α

α

n

n

45.17

13.024,37 24.3s 8 22 =

⋅=⇒== χn

Así la región crítica o región de rechazo de H0 queda dada por:

{ } 013,16 ó 690,1/ 222 ><= χχχRC Por lo tanto χ2∈RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que la varianza del contenido de nicotina en los cigarros se igual a 1,3 milígramos.

Instituto Profesional Diego Portales

A U T Ó N O M O

97

3) Experiencias pasadas indican que el tiempo para que los alumnos del último año realicen

un examen estandarizado es una v.a normal con desviación estándar de 6 minutos. Pruebe

la hipótesis de que σ<6 , si una muestra aleatoria de 20 estudiantes tiene una desviación

estándar de 4.51 minutos al realizar este examen. Utilice un nivel de significancia α=0.01.

Solución:

36:

36:2

1

20

<

=

σ

σ

H

H

633,7 01.0 2

19,99.02

1,1 ==⇒= −− χχα α n

74,10

363401,2019 3401,20s 20 22 =

⋅=⇒== χn

Así la región crítica o región de rechazo de H0 queda dada por:

{ } 633,7/ 22 <= χχRC

Por lo tanto χ2∉RC. Luego con base en la muestra es posible afirmar que la varianza del tiempo en que los estudiantes contestan el examen es igual a 36 minutos.

Instituto Profesional Diego Portales

A U T Ó N O M O

98

EJERCICIOS AUTO EVALUATIVOS Nº 11

1) Se sabe que la capacidad de los recipientes de un determinado lubricante tiene

distribución normal con varianza de 0,03 litros2. Pruebe la hipótesis de que σ2=0,03 en

contraposición a la alternativa de que σ2≠0,03 para la muestra aleatoria de 10 recipientes

que tienen una desviación estándar de 0,25. Use un nivel de significación de 0,01.

2) Se sabe que el contenido de nicotina de una marca de cigarros tiene una distribución

aproximadamente normal con una varianza de 1,3 milígramos. Pruebe la hipótesis de que

σ2=1.3 en contraposición a la alternativa de que σ2>1,3 , si una muestra aleatoria de 8 de

estos tiene una desviación estándar de 1,8. Use un nivel de significancia α=0,05.

Instituto Profesional Diego Portales

A U T Ó N O M O

99

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 11

1) Se acepta H0 , es decir , σ2=0,03

2) Se rechaza H0 , es decir, σ2 >1,3

Instituto Profesional Diego Portales

A U T Ó N O M O

100

ASIGNATURA ESTADÍSTICA

CUARTA UNIDAD ANÁLISIS DE VARIANZA

CONTENIDO DE LA UNIDAD TEMÁTICA

4.1 Comparación de medias de dos tratamientos.

Instituto Profesional Diego Portales

A U T Ó N O M O

101

COMPARACION DE MEDIAS DE DOS POBLACIONES

1) Comparación de medias de dos poblaciones con varianzas poblacionales σ21 y σ2

2

conocidas

El estadístico usado para probar estas hipótesis está dado por:

estándar) normalón distribuci tienez ( )1,0(~ )(

2

22

1

21

21 N

nn

xxz

⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

−=

σσ

a) Prueba de hipótesis de una cola

i) 211

210

: :

μμμμ

<=

HH

En este caso la región crítica o región de rechazo de H0 está dada por:

{ } / αzzzRC −<=

ii) 211

210

: :

μμμμ

>=

HH

En este caso la región crítica o región de rechazo de H0 está dada por:

{ } / αzzzRC >=

Instituto Profesional Diego Portales

A U T Ó N O M O

102

b) Prueba de hipótesis de dos colas

211

210

: :

μμμμ

≠=

HH

En este caso la región crítica o región de rechazo de H0 está dada por:

⎭⎬⎫

⎩⎨⎧

>−<=22

z ó / αα zzzzRC

2) Comparación de medias de dos poblaciones con varianzas poblacionales σ21 y σ2

2

desconocidas pero iguales

El estadístico usado para probar estas hipótesis está dado por:

libertad de grados 2-con ón distribuci tiene11)(

21

21

21 nnvstudentt

nns

xxT

p

+=−+

−=

donde:

.muestrales varianzaslasson y queen 2

)1()1( 22

21

21

222

2112 ss

nnsnsns p −+

−+−=

Instituto Profesional Diego Portales

A U T Ó N O M O

103

a) Prueba de hipótesis de una cola

i) 211

210

: :

μμμμ

<=

HH

En este caso la región crítica o región de rechazo de H0 está dada por:

{ } / αtttRC −<=

ii) 211

210

: :

μμμμ

>=

HH

En este caso la región crítica o región de rechazo de H0 está dada por:

{ } / αtttRC >= b) Prueba de hipótesis de dos colas

211

210

: :

μμμμ

≠=

HH

En este caso la región crítica o región de rechazo de H0 está dada por:

⎭⎬⎫

⎩⎨⎧

>−<=22

tó / αα ttttRC

Instituto Profesional Diego Portales

A U T Ó N O M O

104

Ejemplo:

Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de

ácido de una mina de uranio. Los registros de ambas estaciones se encuentran dados en la

siguiente tabla:

Estación 1 Estación 2

n1= 12 n2= 10

1x =3.11 2x =2.04

s1=0.771 s2=0.448

¿ Son iguales las medias de ambas estaciones ? Utilice un nivel de significancia de 0,1.Suponga

que las varianzas poblacionales son iguales pero desconocidas.

Solución

211

210

: :

μμμμ

≠=

HH

α = 0.1 ⇒ α/2 = 0.05. Por lo tanto: tα/2=t0.05=1.725

{ }725.1 tó 725.1/ >−<= ttRC

Por otro lado:

10 ,12 además , 0.448s , 0.771s , 1.072.04-3.11 2122

2121 ======− nnxx

Instituto Profesional Diego Portales

A U T Ó N O M O

105

De esta forma:

417.021012

)448.0)(9()(11)(0.771 2

)1()1( 22

21

222

2112 =

−++

=−+−+−

=nn

snsnsp

así:

011,6 0.4280,417

07,111)(

21

21 =⋅

=+

−=

nns

xxt

p

Por lo tanto RCt ∈ . Luego se rechaza H0 , de esta forma las medias de ambas estaciones no son iguales.

Instituto Profesional Diego Portales

A U T Ó N O M O

106

EJERCICIOS AUTO EVALUATIVOS Nº 12

Problema 1 Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en 2 submuestras y se aplican los dos tipos de análisis. A continuación se presentan los datos codificados que muestran los análisis de contenido de hierro.

Análisis 1 2 3 4 5

Rayos X 2.0 2.0 2.3 2.1 2.4 Químico 2.2 1.9 2.5 2.3 2.4

Suponga que las poblaciones son normales, Pruebe con un nivel de significancia de 0.05 si los dos métodos de análisis dan en promedio el mismo resultado. Problema 2 Los siguientes datos representan los tiempos de duración de las películas que producen dos compañías cinematográficas.

Compañía Tiempo (minutos)

I 103 94 110 87 98 II 97 82 123 92 175 88 118

¿Son iguales los tiempos de duración de las películas que producen las 2 compañías? Utilice un nivel de significancia de 0,05.

Instituto Profesional Diego Portales

A U T Ó N O M O

107

SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 12

1) Los dos tratamientos no dan en promedio el mismo resultado es decir se rechaza H0.

2) Los tiempos promedio de duración de ambas películas no son iguales es decir se rechaza H0.

Instituto Profesional Diego Portales

A U T Ó N O M O

108

ANEXOS Tablas de distribución de probabilidades: (normal, t –student, y ji-cuadrado)

Tabla Áreas bajo la curva normal

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 -3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002 -3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003 -3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005 -3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007 -3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010

-2.9 0.0019 0.0018 0.0017 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014 -2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019 -2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026 -2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036 -2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048

-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064 -2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084 -2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110 -2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143 -2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183

-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233 -1.8 0.0359 0.0352 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294 -1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367 -1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455 -1.5 0.0668 0.0655 0.0643 0.0630 0.0518 0.0606 0.0594 0.0582 0.0571 0.0559

-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0722 0.0708 0.0694 0.0681 -1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823 -1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985 -1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170 -1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379

-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611 -0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867 -0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 -0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 -0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776

-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121 -0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483 -0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 -0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247 -0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641

Instituto Profesional Diego Portales

A U T Ó N O M O

109

Tabla, áreas bajo la curva normal

Instituto Profesional Diego Portales

A U T Ó N O M O

110

Tabla t- student

Instituto Profesional Diego Portales

A U T Ó N O M O

111

Tabla t- student

Instituto Profesional Diego Portales

A U T Ó N O M O

112

Tablas ji-cuadrado

Instituto Profesional Diego Portales

A U T Ó N O M O

113

Tablas ji-cuadrado

Instituto Profesional Diego Portales

A U T Ó N O M O

114

BIBLIOGRAFÍA

Chao, L 81993 (1993) “Estadísticas para las Ciencias Administrativas” México, Editorial Mc. Graw Hill, 3º Edición (146 p).

Mason y Lind (1995) “Estadística para Administración y Economía” España, Editorial Alfaomega (911 p.)

Canavos, G (1990) “Probalidad y Estadística. Aplicaciones y Métodos”. México, Editorial Mc. Graw Hill, 1º Edición (651 p.)

Walpole, “Probabilidad y Estadística para Ingenieros” México (1999) 6ª Edición

Uso de Internet para temas específicos.