Estadística Inferencial.docx

36
ING. DIEGO EGAS VAREA CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y DEL COMERCIO INGENIERÍA COMERCIAL ESTADÍSTICA INFERENCIAL ACTIVIDAD ENTREGABLE No. 1

description

Ciencias exactas

Transcript of Estadística Inferencial.docx

Page 1: Estadística Inferencial.docx

ING. DIEGO EGAS VAREA

CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y DEL COMERCIO

INGENIERÍA COMERCIAL

ESTADÍSTICA INFERENCIAL

ACTIVIDAD ENTREGABLE No. 1

Page 2: Estadística Inferencial.docx

Actividades de aprendizaje

Actividad de aprendizaje 1.1.

PROBLEMA 1

Se publica que los frenos de los nuevos autos de la marca Lambourginis duran un promedio de 35000 millas con una desviación estándar de 1115 millas.

Los Datos son:

μ=35000millas ; σ=1115millas

Desarrollo:

a. ¿Cuál es la probabilidad de que los frenos duren menos de 33900 millas?

P(X<33900)

Z=X−μσ

=33900−350001115

=−0 ,9865

Area=0 ,3389

P(X<33900) = 0,50 – Área = 0,50 – 0,3389 = 0,1611

Probabilidad de 16,11% que los frenos duren menos de 33900 millas

b. ¿Cuál es la probabilidad de que los frenos duren menos de 37500 millas?

P(X<37500)

1

Page 3: Estadística Inferencial.docx

Z=X−μσ

=37500−350001115

=2 ,2422

Area=0 ,4875

P(X<37500) = 0,50 + Área = 0,50 + 0,4875 = 0,9875

Probabilidad de 98,75% que los frenos duren menos de 37500 millas

c. ¿Cuál es la probabilidad de que los frenos duren entre 35200 y 36900 millas?

P (35200<X<36900)

Z1=X 1−μ

σ=35200−35000

1115=0 ,1794

Area1=0 ,0714

Z2=X2−μ

σ=36900−35000

1115=1 ,7040

Area2=0 ,4554

P (35200<X<36900) = Area2 – Area1 = 0,4554 – 0,0714 = 0,384

Probabilidad de 38,4% que los frenos duren entre 35200 millas y 36900 millas

d. ¿Cuál es la probabilidad de que los frenos duren entre 34100 y 35900 millas?

P (34100<X<35900)

2

Page 4: Estadística Inferencial.docx

Z1=X 1−μ

σ=34100−35000

1115=−0 ,8072

Area1=0 ,2910

Z2=X2−μ

σ=35900−35000

1115=0 ,8072

Area2=0 ,2910

P (34100<X<35900) = Area1 + Area2 = 0,2910 + 0,2910 = 0,582

Probabilidad del 58,2% que los frenos duren entre 34100 millas y 35900 millas

e. ¿Cuáles deben ser las duraciones de los frenos para que estos tengan el 15% más bajo o que duren más del 90%?

Duraciones para los 15% más bajo o 10% más altos.

Para el 15% más bajo: Area1 = 0,50-0,15 = 0,35 y Z1=−1 ,04

X1=μ+Z1×σ=35000+(−1,04 )(1115 )=33840 ,4

Para el 10% más alto: Area2 = 0,50-0,10 = 0,40 y Z2=1 ,28

X 2=μ+Z2×σ=35000+1,28(1115 )=36427 ,2

Entonces las duraciones de frenos son: 33840,4 millas y 36427,2 millas

3

Page 5: Estadística Inferencial.docx

PROBLEMA 2

Los paquetes de cereal vienen en cajas de 36 onzas que tienen una desviación estándar de 1.9 onzas. Si se selecciona una caja aleatoriamente:

Los Datos son:

μ=36onzas; σ=1,9onzas

a. ¿Cuál es la probabilidad de que la caja pese menos de 34.8 onzas?

P(x<34,8)

Z=X−μσ

=34 ,8−361,9

=−0 ,6316

Area=0 ,2357

P(X<34,8) = 0,50 – Área = 0,50 – 0,2357 = 0,2643

La probabilidad es de 26,43% que la caja pese menos de 34,8 onzas

b. ¿Cuál es la probabilidad de que la caja pese más de 34.6 onzas?

P(x>34,6)

Z=X−μσ

=34 ,6−361,9

=−0 ,7368

Area=0 ,2704

P(X<34,8) = 0,50 + Área = 0,50 + 0,2704 = 0,7704

4

Page 6: Estadística Inferencial.docx

La probabilidad es de 77,04% que la caja pese más de 34,6 onzas

c. ¿Cuál es la probabilidad de que la caja pese entre 34.3 y 38.9 onzas?

P (34,3<x<38,9)

Z1=X 1−μ

σ=34 ,3−36

1,9=−0 ,8947

Area1=0 ,3133

Z2=X2−μ

σ=38 ,9−36

1,9=1 ,5263

Area2=0 ,4370

P (34,3<X<38,9) = Area1 + Area2 = 0,3133 + 0,4370 = 0,7503

La probabilidad es de 75,03% que la caja pese entre 34,3 y 38,9 onzas

d. ¿Cuál es la probabilidad de que la caja pese entre 39.5 y 41.1onzas?

P (39,5<x<41,1)

Z1=X 1−μ

σ=39 ,5−36

1,9=1 ,8421

Area1=0 , 4671

5

Page 7: Estadística Inferencial.docx

Z2=X2−μ

σ=41,1−36

1,9=2 ,6842

Area2=0 ,4963

P (39,5<X<41,1) = Area2 - Area1 = 0,4963 - 0,4671 = 0,0292

La probabilidad es de 2,92% que la caja pese entre 39,5 y 41,1 onzas.

e. ¿Cuánto pesan las cajas que se encuentran entre el 35% más bajo y el 95% más alto del peso?

Pesos de cajas entre el 35% más bajo y el 95% más altos de los pesos.

Para el 35% más bajo: Area1 = 0,50-0,35 = 0,15 y Z1=−0 ,39

X1=μ+Z1×σ=36+(−0 ,39)(1,9 )=35 ,26

Para el 95% más alto: Area2 = 0,95-0,50 = 0,45 y Z2=1 ,65

X 2=μ+Z2×σ=36+1 ,65 (1,9 )=39 ,14

Los pesan las cajas 35,26 onzas y 39,14 onzas

PROBLEMA 3

Se considera un sindicato laboral en el cual el 40% de los miembros está a favor de la huelga. ¿Cuál es la probabilidad de que 10 apoyen a un paro?

Datos y formulas:

Distribución Binomial: π=0 ,40; n=?

Como no está definido el tamaño de muestra n, el tamaño que se toma es: n = 10.

Probabilidad: P(X )=n Cx .π x .(1−π )n− x

Hallar la probabilidad P(X=10)

6

Page 8: Estadística Inferencial.docx

a. Utilice la distribución binomial para determinar la probabilidad

P(X=10)=10 C10×0 ,4010 . (1−0 ,40 )10−10

P(X=10)=1×0 ,0001049×1=0 ,0001049

La probabilidad es de 0,1049% que 10 miembros del sindicato apoyen un paro.

b. Si no se pudiese utilizar la tabla binomial, aproxime la respuesta utilizando la distribución normal y determine la diferencia entre los dos procesos

Media: μ=n. π=10×0,4=4

Desviación estándar: σ=√n .π (1−π )=√10(0 ,40 )(1−0 , 40)=1 ,549

Probabilidad P(X=10)

Z1=(X±0,5 )−μσ

=(10−0,5 )−41 ,549

=3 ,551

Area1=0 , 499808

Z2=(X±0,5)−μσ

=(10+0,5 )−41 ,549

=4 ,196

Area2=0 ,499986

P (X=10) = Area2 - Area1 = 0,499986 - 0,499808 = 0,000178

La probabilidad es de 0,0178% que 10 miembros del sindicato apoyen un paro

La Diferencia es: 0,000178-0,0001049 = 0,0000731

Entonces la diferencia de probabilidad al usar la aproximación normal es de: 0,0000731

7

Page 9: Estadística Inferencial.docx

Actividad de aprendizaje 1.2.

PROBLEMA 1

Defina en su propio lenguaje los siguientes términos. De ejemplos de cada uno.

a. Distribución muestral

Consiste en una distribución de probabilidad de un detallado muestral conformada por todas las muestras de tamaño n, que son seleccionadas en forma aleatoria de una población de la variable de interés que se está investigando.

Ej.

Una población formada por 10 elementos se forman todas las muestra posibles de tamaño n = 2, para obtener la media de cada muestra, con lo cual se construye su distribución de probabilidad para la media.

b. Media de las medias

Media de medias es el valor promedio del conjunto de medias de cada una de las muestras que conforman una distribución muestral, numéricamente es igual a la media de la población

Ej.

La media de medias del caso anterior, es el valor promedio del conjunto de medias obtenidas en cada una de las muestras de tamaño n = 2.

c. Varianza y error estándar de la distribución muestral

Varianza de la distribución muestral es el promedio del cuadrado de la diferencia de cada una de las medias de muestra con respecto a la media general, matemáticamente está dado por:

σ X2 =∑ (X−X )2

k

Error estándar de la distribución muestral, es la desviación estándar de una distribución muestral de medias, que se calcula como la raíz cuadrada de la varianza de la distribución muestral, así:

σ X=√∑ (X−X )2

k

d. Tipos de muestreo

Hay 2 tipos de muestras: la muestra probabilística y la muestra no probabilística.

Las muestras probabilísticas a su vez se clasifican como:

1. Muestreo aleatorio simple, la muestra se selecciona de manera que todo miembro de la población tiene la misma probabilidad de ser elegido.

Ej.

8

Page 10: Estadística Inferencial.docx

Los nombres de los miembros de una familia se anotan en trozos de papel y se colocan en una cajita, para luego extraer uno a uno según el tamaño de muestra deseado, de esa manera cada persona tiene la misma posibilidad de ser elegido como parte de la muestra.

2. Muestreo aleatorio sistemático, los integrantes de la población se puede ordenar en forma alfabética, después se elige al azar un punto de partida, a continuación se selecciona para la muestra cada siguiente k-esimo elemento de la población.

Ej.

La lista alfabética de obreros del departamento de producción de una gran empresa, se elige el punto de partida que puede ser de los primeros 3 empleados, para luego seleccionar cada siguiente tercer obrero hasta conformar la muestra deseada.

3. Muestreo aleatorio estratificado, la población se divide en varios grupos o estratos, para luego seleccionar una muestra de cada estrato. En cada estrato la característica de la variable investigada es heterogénea.

Ej.

Para investigar el rendimiento promedio en los diferentes paralelos del sexto curso de un colegio, los estratos serian cada uno de los paralelos del sexto curso, cada paralelo tendrá diferente tamaño; para formar la muestra de interés, se eligen muestras proporcionales de calificaciones en cada paralelo.

4. Muestreo por conglomeración, se usa para reducir el costo de muestrear una población dispersa en un área geográfica grande. Se subdivide una región extensa en áreas menores llamadas unidades primarias, después se eligen aleatoriamente algunas de estas unidades para conformar la muestra deseada, o también se puede extraer una muestra de cada unidad primaria. En cada conglomerado la característica de la variable investigada es bastante homogénea.

Ej.

Para investigar el nivel de educación de las familias en un barrio pequeño, cada manzana se puede considerar como unidad primaria; para formar una muestra principal, se puede elegir al azar algunas de las manzanas del barrio o a su vez se obtienen muestras menores de cada unidad primaria.

Entonces en el muestreo no probabilístico, la selección de los elementos de una muestra se basa en algún criterio del individuo encargado de realizar el muestreo. Esta clase de muestras puede conducir a resultados sesgados, que en si es indeseable en un muestreo sea confiable.

PROBLEMA 2

Las ventas en miles de dólares para una empresa manufacturera durante los últimos 5 meses fueron 68, 73, 65, 80 y 72. Asumiendo que estos cinco meses constituyen la población, la media es = 71.6. Como director de marketing de la empresa, se desea estimar es “desconocido” tomando una muestra de tamaño n=3. Se espera que el error de muestreo sea pequeño. Realice la distribución muestral y haga comentarios sobre el posible error del muestreo.

Población de ventas: 68, 73, 65, 80 y 72; n = 5

Media de población: μ=

∑ x

N=

3585

=71 ,6miles

9

Page 11: Estadística Inferencial.docx

Distribución muestral para muestras de tamaño n = 3.

Numero de muestras:

k=N Cn=5 C3=5 !

3 ! (5−3 )!=10

Nº MUESTRA

MUESTRAS MEDIA ERROR

K Xi Muestral

1 68 73 65 68,67 -2,93

2 68 73 80 73,67 2,07

3 68 73 72 71,00 -0,60

4 68 65 80 71,00 -0,60

5 68 65 72 68,33 -3,27

6 68 80 72 73,33 1,73

7 73 65 80 72,67 1,07

8 73 65 72 70,00 -1,60

9 73 80 72 75,00 3,40

10 65 80 72 72,33 0,73

Suman: 716,00

Calculo de la gran media (media de la distribución muestral).

X=∑ X

k=

71610

=71 ,6miles

El error muestral es la diferencia entre el valor de la media de una muestra y el valor de la media de la población.

De los datos de la tabla de distribución muestral, en la columna del error muestral, para cada muestra se muestran valores pequeños del error muestral por lo en tanto que el valor de la media de toda la distribución muestral es justamente igual al valor de la media de población, como lo prevé el teorema de limite central, entonces que el error de muestreo para este caso es 0.

Actividad de aprendizaje 1.3.

10

Page 12: Estadística Inferencial.docx

PROBLEMA 1

Una empresa de taxis planea comprar una flota de nuevos autos para sus operaciones. La decisión depende de si el rendimiento del auto en consideración es por lo menos de 27.5 millas por galón (MPG) de gasolina. Los 36 autos que prueba que la compañía reportaron una media de 25.5 MPG, con una desviación estándar de 3.5 MPG. Con niveles de confianza del 95% y 99%, ¿qué aconsejaría a la compañía?

Datos:

μ=27 ,5MPG; n=36 ; X=25 ,5MPG; S=3,5MPG

Intervalo de confianza para la media.

Ya que el tamaño de muestra n>30 aplico la distribución normal.

IC=X±Z .S

√na. Para el 95% de confianza

Área = 0,95/2 = 0,475: Z = 1,96

IC=25 ,5±1 ,96 .3,5

√36=25 ,5±1 ,14

LI=25 ,5−1 ,14=24 ,36

LS=25 ,5+1 ,14=26 ,64

b. Para el 99% de confianza

Área = 0,99/2 = 0,495: Z = 2,58

IC=25 ,5±2,58 .3,5

√36=25 ,5±1 ,50

LI=25 ,5−1,5=24

LS=25 ,5+1,5=27

11

Page 13: Estadística Inferencial.docx

Ya que para ningún nivel de confianza se cumple con el mínimo de rendimiento promedio solicitado por la empresa, y por esta razón se sugiere a la compañía de taxis no realizar la compra de la flota de nuevos autos.

PROBLEMA 2

Una empresa de construcción fue culpada de inflar los comprobantes que registra para los contratos de construcción con el gobierno. El contrato estableció que un cierto tipo de trabajo debería promediar 1150 dólares. Por motivos de tiempo, los directivos de solo 12 empresas del gobierno fueron llamados a dar testimonio ante la corte respecto a los comprobantes de las empresas. Si se descubrió a partir del testimonio una media de 1275 dólares y una desviación estándar de 235 dólares, ¿a niveles de confianza del 95% y 99% apoyaría el caso legal de la empresa constructora? Se asume que los montos de los comprobantes son normales.

Los datos son:

μ=$1150 ; n=12; X=$1275 ; S=$ 235

Intervalo de confianza para la media.

El tamaño de muestra n es menor a 30 y se excluye la desviación estándar de la población, y entonces se aplica la distribución t.

IC=X±t .S

√na. Para el 95% de confianza

Para gl = n-1 = 11 y 95% de confianza: t = 2,201

IC=1275±2 ,201 .235

√12=1275±149 ,32

LI=1275−149 ,32=1125 ,68

LS=1275+149 ,32=1424 ,32

12

Page 14: Estadística Inferencial.docx

b. Para el 99% de confianza

Para gl = n-1 = 11 y 99% de confianza: t = 3,106

IC=1275±3 ,106 .235

√12=1275±210 ,71

LI=1275−210 ,71=1064 ,29

LS=1275+210 ,71=1485 ,71

Entonces el intervalo de confianza para la media contiene el valor promedio de $1150 exigido en el contrato, tanto al 95% como al 99% de confianza, estos resultados apoyan el caso legal de la empresa constructora, es decir que no están inflados los comprobantes registrados.

PROBLEMA 3

El gerente de una estación de televisión debe determinar en la ciudad qué porcentajes de casas tiene más de un televisor. Una muestra aleatoria de 500 casas revela que 275 tienen dos más televisores. ¿Cuáles son los intervalos de confianza del 90% y 95% para estimar la proporción de todas las casas que tienen dos o más televisores?

Datos:

n=500 ; X=275 ; p= xn=275

500=0 ,55

Intervalo de confianza para la proporción.

Por lo que NP como n (1-p) son mayores a 5, la distribución muestral para la proporción se aproxima a la distribución normal

13

Page 15: Estadística Inferencial.docx

IC=p±Z .√ p (1−p )n

a. Para el 90% de confianza

Área = 0,90/2 = 0,45: Z = 1,65

IC=0 ,55±1,65 .√ 0 ,55 .(1−0 ,55)500

=0 ,55±0 ,037

LI=0 ,55−0 ,037=0 ,513

LS=0 ,55+0 ,037=0 ,587

Hay el 90% de confianza que la verdadera proporción de hogares que tienen 2 o más televisores estará comprendido entre el 51,3% y el 58,7%.

b. Para el 95% de confianza

Área = 0,95/2 = 0,475: Z = 1,96

IC=0 ,55±1,96 .√ 0 ,55 .(1−0 ,55 )500

=0 ,55±0 ,044

LI=0 ,55−0 ,044=0 ,506

LS=0 ,55+0 ,044=0 ,594

Consta del 95% de confianza que la verdadera proporción de hogares que tienen 2 o más televisores estará comprendido entre el 50,6% y el 59,4%.

PROBLEMA 4

14

Un estudiante de administración quiere determinar el ingreso medio mensual de los miembros del consejo ciudadano de una ciudad grande. El error al estimar la media debe ser inferior a $100 con un nivel de confianza de 95%. El estudiante encontró un informe del Ministerio del Trabajo en el que se estimó que la desviación estándar era $1000. ¿De qué tamaño debe ser la muestra?

Page 16: Estadística Inferencial.docx

Datos:

n=?; E=$ 100; S=$1000 ; NC=95 %

Para Área = 0,95/2 = 0,475: Z = 1,96

Tamaño de muestra para investigar el ingreso medio mensual.

n=( Z .SE )

2

=( 1 ,96×1000100 )

2

=384 ,16

Entonces el tamaño de la muestra es de 384 miembros del consejo ciudadano para cumplir con la investigación.

PROBLEMA 5

Suponga que el presidente quiere una estimación de la proporción de la población que apoya su propuesta respecto al control de armas. El presidente desea que la estimación esté dentro de 0.04 de la verdadera proporción. Use el nivel de confianza del 95%. El asesor del presidente estima que la proporción que apoya su propuesta deberá ser 0.60.

Los datos son:

n=?; E=0 ,04 ; p=0 ,60 ; NC=95 %

Para Área = 0,95/2 = 0,475: Z = 1,96

Tamaño de muestra para investigar la proporción de población a favor del control de armas.

a. ¿De qué tamaño deberá ser la muestra?

Para una proporción deseada: p = 0,60

n=p (1−p )( ZE )2

=0 ,60 (1−0 ,60 )( 1 ,960 ,04 )

2

=576 ,24

El tamaño mínimo de muestra necesario es 576 personas

b. ¿De qué tamaño debería ser la muestra si no se contara con ninguna estimación de la proporción que apoya la propuesta del presidente?

Para una proporción desconocida, se aplica p = 0,50

n=p (1−p )( ZE )2

=0 ,50 (1−0 ,50 )( 1 ,960 ,04 )

2

=600 ,25

El tamaño de la muestra necesaria para este caso es 600 personas, entonces es mayor tamaño de la muestra.

15

Page 17: Estadística Inferencial.docx

Actividad de aprendizaje 1.4.

PROBLEMA 1

Seducido por los comerciales, usted ha sido persuadido para comprar un auto nuevo. Usted piensa que tendrá que pagar 25000 dólares por el auto que desea. Como comprador

16

Page 18: Estadística Inferencial.docx

cuidadoso, averigua el precio de 40 autos posibles y encuentra un costo promedio de 27312 dólares, con una desviación estándar de 8012 dólares. Deseando evitar un error tipo II, usted prueba la hipótesis de que el precio promedio es 25000 dólares con un nivel de significancia del 10%. ¿Cuál es su conclusión? Utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

μ=$25000 ; n=40 ; X=$ 27312; S=$8012 ; α=0 ,10

Prueba de hipótesis para la media de una muestra de 2 colas

a. Planteo de hipótesis.

H0 : μ=25000 . Precio promedio del auto es igual a $25000.

H1 : μ≠25000. Precio promedio del auto es diferente a $25000.

b. Nivel de significancia: α=0 ,10

c. Estadística de prueba.

Por ser el tamaño de muestra n>30, la distribución muestral para la media se aproxima a la distribución de probabilidad normal.

Zp= X−μS /√n

=27312−250008012/√40

=1 ,825

d. Regla de decisión.

Estadística Z critica, para Área = 0,50 – α/2 = 0,45: Zc = ±1,65

Regla de decisión: Se rechaza la Ho si Zp está fuera de ±1,65; caso contrario se acepta.

e. Decisión.

Como Zp = 1,825 está fuera de ±1,65 se rechaza la Ho, entonces al nivel de significancia del 10% se concluye que el precio promedio del auto deseado es diferente a $25000 en forma significativa.

f. Valor p.

Para Zp = 1,825: Área = 0,4664

Probabilidad p = 2(0,50-Area) = 2(0,50-0,4664) = 0,0672

Por lo tanto, se tiene alguna evidencia que Ho no es verdadera

17

Page 19: Estadística Inferencial.docx

PROBLEMA 2

Una encuesta realizada mostró que los estudiantes de las universidades en una ciudad gastan en promedio más de 75 dólares mensuales en entretenimiento. Si un estudiante halla evidencias para confirmar esta afirmación, podría utilizarla para solicitar a su casa ayuda adicional. De los 100 estudiantes que tomó de muestra, el estudiante halló una media de 80.23 dólares con una desviación estándar de 45.67 dólares. ¿A un nivel de significancia del 2%, se encuentra justificación para la solicitud? Utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

μ=$75 ; n=100 ; X=$80 ,23 ; S=$ 45 ,67 ; α=0 ,02

Prueba de hipótesis para la media de una muestra de cola superior

a. Planteo de hipótesis.

H0 : μ≤75 . Gasto promedio en entrenamiento es igual a $75.

H1 : μ>75 . Gasto promedio en entretenimiento es mayor a $75.

b. Nivel de significancia: α=0 ,02

c. Estadística de prueba.

Por ser el tamaño de muestra n>30, la distribución muestral para la media se aproxima a la distribución de probabilidad normal.

Zp= X−μS /√n

=80 ,23−7545 ,67/√100

=1 ,145

d. Regla de decisión.

Estadística Z critica, para Área = 0,50 – α = 0,48: Zc = 2,06

Regla de decisión: Se rechaza la Ho si Zp > 2,06; caso contrario se acepta.

e. Decisión.

Ya que Zp = 1,145 < 2,06 se acepta la Ho, entonces al nivel de significancia del 2% se concluye que el estudiante no tiene suficiente evidencia para pedir ayuda adicional en la casa.

18

Page 20: Estadística Inferencial.docx

f. Valor p.

Para Zp = 1,145: Área = 0,3749

Probabilidad p = 0,50-Area = 0,50-0,3749 = 0,1251

Por lo tanto no se tiene evidencia que Ho no es verdadera.

PROBLEMA 3

En una reunión informativa para una oficina corporativa, el gerente de un hotel en Azuay, reportó que el número promedio de habitaciones alquiladas por noche es de por lo menos 212. Uno de los funcionarios corporativos considera que esta cifra puede estar algo sobre estimada. Una muestra de 150 noches produce una media de 203.1 habitaciones y una desviación estándar de 45.5 habitaciones. Si estos resultados sugieres que el gerente ha “inflado” su reporte, será amonestado severamente. A un nivel de 1%, ¿cuál será el destino del gerente? Utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

μ=212; n=150 ; X=203 ,1 ; S=45 ,5 ; α=0 ,01

Prueba de hipótesis para la media de una muestra de cola inferior

a. Planteo de hipótesis.

H0 : μ≥212. Promedio de habitaciones alquiladas es igual a 212.

H1 : μ<212 . Promedio de habitaciones alquiladas es menor a 212.

b. Nivel de significancia: α=0 ,01

c. Estadística de prueba.

Por ser el tamaño de muestra n>30, la distribución muestral para la media se aproxima a la distribución de probabilidad normal.

Zp= X−μS /√n

=203 ,1−21245 ,5/√150

=−2 ,396

d. Regla de decisión.

Estadística Z critica, para Área = 0,50 – α = 0,49: Zc = -2,33

Regla de decisión: Se rechaza la Ho si Zp < -2,33; caso contrario se acepta.

19

Page 21: Estadística Inferencial.docx

e. Decisión.

Ya que Zp = -2,396 < -2,33 se rechaza la Ho, entonces al nivel de significancia del 1% se concluye que el gerente ha inflado su informe, de modo que será amonestado severamente.

f. Valor p.

Para Zp = -2,396: Área = 0,4918

Probabilidad p = 0,50-Area = 0,50-0,4918 = 0,0082

Por lo tanto se tiene una muy fuerte evidencia que Ho no es verdadera.

PROBLEMA 4

Un contratista eléctrico ha concluido que los hogares promedio utilizan 500 metros de cableado eléctrico. Usted encuentra que en una muestra de 15 casas se utilizó 545.3 metros con una desviación estándar de 166.4 metros. ¿A un valor de del 5%, está de acuerdo usted con el contratista? Utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

μ=500m; n=15 ; X=545 ,3m; S=166 ,4 ; α=0 ,05

Prueba de hipótesis para la media de una muestra de 2 colas

a. Planteo de hipótesis.

H0 : μ=500 . Promedio de cableado eléctrico usado es igual a 500 metros.

H1 : μ≠500. Promedio de cableado eléctrico usado es diferente a 500 metros.

b. Nivel de significancia: α=0 ,05

c. Estadística de prueba.

Por ser el tamaño de muestra n<30 y se desconoce la desviación estándar de población, se usa la distribución de probabilidad t.

tp= X−μS /√n

=545 ,3−500166 ,4 /√15

=1,054

d. Regla de decisión.

Estadística t critica, para n-1 = 14gl, α = 0,05 de 2 colas: tc = ±2,145

20

Page 22: Estadística Inferencial.docx

Regla de decisión: Se rechaza la Ho si tp está fuera de ±2,145; caso contrario se acepta.

e. Decisión.

Como tp = 1,054 está dentro de ±2,145 se acepta la Ho, entonces al nivel de significancia del 5% se concluye que el promedio de cableado eléctrico usado por casa es igual a 500 metros, lo cual conduce a estar de acuerdo con el contratista.

f. Valor p.

Para tp = 1,054 para 14gl de 2 colas: Probabilidad p >0,20

Por lo tanto no se tiene evidencia que Ho no es verdadera.

PROBLEMA 5

Su empresa ha determinado en el pasado que exactamente el 53% de las personas que están en su área de mercadeo prefieren su producto. Se invierten varios miles de dólares en un programa publicitario para incrementar su participación en el mercado. Luego, una muestra de 622 personas revela que 348 prefieren su producto. A un nivel de significancia del 4%, ¿el dinero fue bien invertido? Utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

π=0 ,53 ; n=622 ; X=348 ; p=348/622=0 ,5595 ; α=0 ,04

Prueba de hipótesis para la proporción de una muestra de cola superior

a. Planteo de hipótesis.

H0 : π≤0 ,53 . Proporción de población que prefiere el producto es igual a 0,53.

H1 : μ>75 . Proporción de población que prefiere el producto es mayor a 0,53.

b. Nivel de significancia: α=0 ,04

c. Estadística de prueba.

Ya que n.π y n (1-π) es mayor a 5, la distribución muestral para la proporción se aproxima a la distribución de probabilidad normal.

Zp= p−π

√ π (1−π )n

= 0 ,5595−0 ,53

√ 0 ,53(1−0 ,53 )622

=1 ,474

21

Page 23: Estadística Inferencial.docx

d. Regla de decisión.

Estadística Z critica, para Área = 0,50 – α = 0,46: Zc = 1,75

Regla de decisión: Se rechaza la Ho si Zp >1,75; caso contrario se acepta.

e. Decisión.

Ya que Zp = 1,474 < 1,75 se acepta la Ho, entonces al nivel de significancia del 4% se concluye que la proporción de población que prefiere el producto no ha aumentado en forma significativa, lo cual indica que el dinero no fue bien invertido en el programa de publicidad para aumentar la participación en el mercado.

f. Valor p.

Para Zp = 1,474: Área = 0,4292

Probabilidad p = 0,50-Area = 0,50-0,4292 = 0,0708

Por lo tanto se tiene alguna evidencia que Ho no es verdadera.

Actividad de aprendizaje 1.5.

PROBLEMA 1

En abril de 1991, la revista Fortune contaba una historia sobre los adictos al trabajo nacidos después de la Segunda Guerra Mundial, entre los 25 y 45 años de edad, que tenían trabajo en el área administrativa. El artículo comparaba la vida laboral de estos jóvenes ejecutivos que se habían ubicado en la vía rápida corporativa, con las de los trabajadores quienes dedicaban menos tiempo a su trabajo. Los datos se recolectaron de las entrevistas hechas a empleados corporativos y revelaron las siguientes estadísticas respecto a los horarios de trabajos semanales.

22

Page 24: Estadística Inferencial.docx

Haga e interprete un intervalo del 90% para la diferencia en las horas promedio de trabajo y pruebe la hipótesis de medias iguales a un nivel del 10% con el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

Grupo 1 Grupo 2

X1=62 ,5h X 2=39 ,7h

S1=23 ,7h S2=8,9h

n1=175 n2=168NC = 90%

I) Intervalo de confianza para la diferencia de medias de 2 muestras independientes.

Por ser los tamaños de muestras mayores a 30 se aplica la distribución normal.

IC=(X1−X2)±Z .S X1−X 2

Desviación estándar de diferencia en medias muestrales.

SX 1−X2=√ S12

n1

+S2

2

n2

=√23 ,72

175+

8,92

168=1 ,9186

Para el 90% de confianza

Área = 0,90/2 = 0,45: Z = 1,65

IC=(62 ,5−39 ,7 )±1 ,65×1 ,9186=22 ,8±3 ,17

LI=22 ,8−3 ,17=19 ,63

LS=22 ,8+3 ,17=25 ,97

23

Grupo 1

Vía rápida

Grupo 2

Menos tiempo en el trabajo

Media (horas) 62.5 39.7

Desviación estándar (horas)

23.7 8.9

Número 175 168

Page 25: Estadística Inferencial.docx

Existe el 90% de confianza que la verdadera diferencia entre medias en las horas de trabajo semanal entre los 2 grupos estará comprendido entre 19,63 y 25,97 horas.

II) Prueba de hipótesis para la diferencia de medias de 2 muestras independientes de 2 colas.

a. Planteo de hipótesis.

H0 : μ1=μ2 . Promedio semanal de horas de trabajo es igual en los 2 grupos.

H1 : μ1≠μ2 . Promedio semanal de horas de trabajo es diferente en los 2 grupos.

b. Nivel de significancia: α=0 ,10

c. Estadística de prueba.

Por ser los tamaños de muestras mayores a 30, la distribución muestral para la diferencia de medias se aproxima a la distribución de probabilidad normal.

Zp=X1−X2

Sp=62 ,5−39 ,7

1 ,9186=11 ,88

d. Regla de decisión.

Estadística Z critica, para Área = 0,50 – α/2 = 0,45: Zc = ±1,65

Regla de decisión: Se rechaza la Ho si Zp está fuera de ±1,65; caso contrario se acepta.

e. Decisión.

Como Zp = 11,88 está fuera de ±1,65 se rechaza la Ho, entonces al nivel de significancia del 10% se concluye que el promedio de horas de trabajo semanal es diferente en forma significativa entre los 2 grupos de trabajadores.

Utilizando el intervalo de confianza de la primera parte también se llega a la decisión de rechazar la Ho porque el punto cero no está incluido en el intervalo para la diferencia de medias.

f. Valor p.

Para Zp = 11,86: Área = 0,50

Probabilidad p = 2(0,50-Area) = 2(0,50-0,50) = 0,0

Por lo tanto no se tiene evidencia que Ho no es verdadera.

24

Page 26: Estadística Inferencial.docx

PROBLEMA 2

Una compañía de perforación prueba dos brocas de barrena calando a un máximo de 112 pies y registrando el número de horas que le tomó el procedimiento. La primera broca se utilizó en 12 ocasiones, resultando un tiempo promedio de 27.3 horas y una desviación estándar de 8.7 horas. Se excavaron 10 pozos con una segunda broca, produciendo tiempo promedio de 31.7 horas y una desviación estándar de 8.3 horas. ¿Parece que una

broca es más efectiva que otra? Sea = 0.10. Construya el intervalo de confianza y utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

Broca 1 Broca 2

X1=27 ,3h X 2=31 ,7h

S1=8,7h S2=8,3h

n1=12 n2=10NC = 90%

I) Intervalo de confianza para la diferencia entre medias de 2 muestras independientes.

Por ser los tamaños de muestras menores a 30 se aplica la distribución t.

IC=(X1−X2)±t .√S p2 ( 1n1

+ 1n2

)Varianza conjunta.

Sp2=

(n1−1 ) .S12+(n2−1 ) .S2

2

n1+n2−2=

(12−1)×8,72+(10−1)×8,32

12+10−2=72 ,63

Para el 90% de confianza

Con 12+10-2 = 20gl: t = 1,725

IC=(X1−X2)±t .√S p2 ( 1n1

+ 1n2

)IC=(27 ,3−31 ,7 )±1,725×√72 ,63( 1

12+ 1

10 )=−4,4±6 ,29

LI=−4,4−6 ,29=−10 ,69

LS=−4,4+6 ,29=1 ,89

25

Page 27: Estadística Inferencial.docx

Existe el 90% de confianza que la verdadera diferencia entre medias de las horas de perforación entre las 2 brocas estará comprendido entre -10,69 y 1,89 horas.

II) Prueba de hipótesis para la diferencia de medias de 2 muestras independientes de cola inferior.

a. Planteo de hipótesis.

H0 : μ1≥μ2 . Promedio de horas de perforación es igual con las 2 brocas.

H1 : μ1<μ2 . Promedio de horas de perforación es menor con la primera broca.

b. Nivel de significancia: α=0 ,10

c. Estadística de prueba.

Por ser los tamaños de muestras menores a 30, se aplica la distribución de probabilidad t.

tp=X1−X 2

√S p2 ( 1n1

+ 1n2

)=27 ,3−31,7

√72 ,63( 112

+1

10 )=−1,206

d. Regla de decisión.

Estadística t critica, para 20gl de una cola y α = 0,10: tc = -1,325

Regla de decisión: Se rechaza la Ho si tp < -1,325; caso contrario se acepta.

e. Decisión.

Como tp = -1,206 es mayor que -1,325 se acepta la Ho, entonces al nivel de significancia del 10% se concluye que el promedio de horas de perforación no es diferente en forma significativa entre los 2 tipos de brocas.

Utilizando el intervalo de confianza de la primera parte también se llega a la decisión de aceptar la Ho porque el punto cero si está incluido en el intervalo para la diferencia de medias.

26

Page 28: Estadística Inferencial.docx

f. Valor p.

Para tp = -1,206 y 20gl de una cola.

Probabilidad p > 0,10

Por lo tanto no se tiene evidencia que Ho no es verdadera.

PROBLEMA 3

Un estudio reveló que 131 de las 468 mujeres que efectuaron compras al por menor lo hicieron utilizando una tarjeta de crédito en particular, mientras que 57 de los 237 hombres utilizaron la misma tarjeta. ¿Existe evidencia que sugiera una diferencia en la

proporción de mujeres y hombres que utilicen esa tarjeta? Sea = 0.05. Construya el intervalo de confianza y utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Datos:

Mujeres Hombres

X1=131 X 2=57

n1=468 n2=237

p1=131/468=0 ,28 p2=57/237=0 ,24NC = 95%

I) Intervalo de confianza para la diferencia de proporciones de 2 muestras independientes.

Por ser n.p y n (1-p) mayores a 5 se aplica la distribución normal.

IC=( p1−p2 )±Z .√ pc(1−pc) .( 1n1

+ 1n2

)

Proporción conjunta:

pc=X1+X 2

n1+n2

=131+57468+237

=0 ,2667

Para el 95% de confianza

Área = 0,95/2 = 0,475: Z = 1,96

IC=(0 ,28−0 ,24 )±1,96×.√0 ,2667 (1−0 ,2667 ).( 1468

+ 1237 )

IC=0 ,04±0 ,069

LI=0 ,04−0 ,069=−0 ,029

LS=0 ,04+0 ,069=0 ,109

27

Page 29: Estadística Inferencial.docx

Existe el 95% de confianza que la verdadera diferencia entre las proporciones de personas que compran con una cierta tarjeta de crédito entre los 2 grupos de géneros estará comprendido entre -0,029 y 0,109.

II) Prueba de hipótesis para la diferencia de proporciones de 2 muestras independientes de 2 colas.

a. Planteo de hipótesis.

H0 : π1=π2 . Proporción de compras con cierta tarjeta de crédito es igual entre hombres y

mujeres.

H1 : π1≠π 2 . Proporción de compras con cierta tarjeta es diferente entre hombres y

mujeres.

b. Nivel de significancia: α=0 ,05

c. Estadística de prueba.

Por ser n.p y n (1-p) mayores a 5 para cada muestra se aplica la distribución normal.

Zp=p1−p2

√ pc (1−pc ) .( 1n1

+ 1n2

)= 0 ,28−0 ,24

√0 ,2667 (1−0 ,2667 ).( 1468

+1

237 )=1,135

d. Regla de decisión.

Estadística Z critica, para Área = 0,50 – α = 0,45: Zc = ±1,65

Regla de decisión: Se rechaza la Ho si Zp está fuera de ±1,65; caso contrario se acepta.

e. Decisión.

Como Zp = 1,135 está dentro de ±1,65 se acepta la Ho, entonces al nivel de significancia del 5% se concluye que la proporción de compras con una cierta tarjeta de crédito no es diferente en forma significativa entre hombres y mujeres.

28

Page 30: Estadística Inferencial.docx

Utilizando el intervalo de confianza de la primera parte también se llega a la decisión de aceptar la Ho porque el punto cero si está incluido en el intervalo para la diferencia de proporciones.

f. Valor p.

Para Zp = 1,135: Área = 0,3729

Probabilidad p = 2(0,50-Area) = 2(0,50-0,3729) = 0,2542

Por lo tanto no se tiene evidencia que Ho no es verdadera.

PROBLEMA 4

Muchos estudios económicos se concentran en las industrias en las cuales una buena parte del poder del mercado se concentra en manos de solo pocas empresas. Se teme que las empresas poderosas de las industrias de tan alta concentración dominen el mercado para su propio beneficio. Fueron pareadas empresas en nueve industrias con empresas, en un número igual de industrias, en las cuales el poder económico estaba más disperso. Los incrementos promedios en precios en los porcentajes de cada industria aparecen en la siguiente tabla. A un nivel del 10%, ¿parece que las industrias concentradas presentan presiones inflacionarias más pronunciadas que las industrias menos concentradas? Haga un intervalo apropiado y utilice el procedimiento de cinco pasos para una prueba de hipótesis. Calcule el valor p.

Tabla de cálculos para la diferencia media de 2 muestras dependientes.

Diferencia media: D=

∑ D

n=

29=0 ,2222

29

Pares de Industrias

1 2 3 4 5 6 7 8 9

Industrias concentradas (%)

3.7 4.1 2.1 -0.9 4.6 5.2 6.7 3.8 4.9

Industrias menos concentradas (%)

3.2 3.7 2.6 0.1 4.1 4.8 5.2 3.9 4.6

Pares de Industrias Industrias Diferencia Dif media Cuadrado

industrias concentrad.

Menos.conc

D Dm (D-Dm)²

1 3,7 3,2 0,5 0,2222 0,0772

2 4,1 3,7 0,4 0,2222 0,0316

3 2,1 2,6 -0,5 0,2222 0,5216

4 -0,9 0,1 -1 0,2222 1,4938

5 4,6 4,1 0,5 0,2222 0,0772

6 5,2 4,8 0,4 0,2222 0,0316

7 6,7 5,2 1,5 0,2222 1,6327

8 3,8 3,9 -0,1 0,2222 0,1038

9 4,9 4,6 0,3 0,2222 0,0060

Suman: 2 3,9756

Page 31: Estadística Inferencial.docx

Desviación estándar: SD=√∑ (D−D )2

n−1=√ 3 ,9756

9−1=0 ,7049

I) Intervalo de confianza para la diferencia media de 2 muestras dependientes.

Por ser los tamaños de muestras menores a 30 se aplica la distribución t.

IC=D±t .SD√n

Para el 90% de confianza

Con 9-1 = 8gl: t = 1,86

IC=D±t .SD√n

=0 ,2222±1 ,86×0 ,7049√9

=0 ,2222±0 ,437

LI=0 ,2222−0 ,437=−0 ,2148

LS=0 ,2222+0 ,437=0 ,6592

Existe el 90% de confianza que la verdadera diferencia media entre los incrementos porcentuales de precios entre el par de industrias estará comprendido entre -0,21% y 0,66%.

II) Prueba de hipótesis para la diferencia medias de 2 muestras dependientes de cola superior.

a. Planteo de hipótesis.

H0 : μD≤0 . Diferencia media en incrementos porcentuales de precios es igual a cero.

H1 : μD>0 . Diferencia media en incrementos porcentuales de precios es mayor a cero.

b. Nivel de significancia: α=0 ,10

c. Estadística de prueba.

Por ser los tamaños de muestras menores a 30, se aplica la distribución de probabilidad t.

tp= DSD /√n

= 0 ,22220 ,7049 /√9

=0 ,946

d. Regla de decisión.

30

Page 32: Estadística Inferencial.docx

Estadística t critica, para 8gl de una cola y α = 0,10: tc = 1,397

Regla de decisión: Se rechaza la Ho si tp > 1,397; caso contrario se acepta.

e. Decisión.

Como tp = 0,946 es menor que 1,397 se acepta la Ho, entonces al nivel de significancia del 10% se concluye que la diferencia media en el incremento porcentual de precios no es mayor que cero en forma significativa, con lo cual se puede manifestar que las industrias concentradas no presentan presiones inflacionarias más pronunciadas que las industrias menos concentradas.

Utilizando el intervalo de confianza de la primera parte también se llega a la decisión de aceptar la Ho porque el punto cero si está incluido en el intervalo para la diferencia media.

f. Valor p.

Para tp = 0,946 y 8gl de una cola.

Probabilidad p > 0,10

Por lo tanto no se tiene evidencia que Ho no es verdadera.

31

Page 33: Estadística Inferencial.docx

Enseñar no es una función vital, porque no tienen el fin en sí misma; la función vital es aprender.

Aristóteles

Gracias por su atención

32