Post on 25-Jul-2015
Maestros Online www.maestronline.com
Solicita una cotización a través de nuestros
correos
Maestros Online
Estadística y pronóstico para la
toma de decisiones Grupo de
problemas
Servicio de asesorías y solución de ejercicios
Envía tus actividades a ciencias_help@hotmail.com
Maestros Online www.maestronline.com
Actividad 1: ¿Quién tienen mayor peso, los
hombres o las mujeres?
Instrucciones:
La estatura de una persona está relacionada con su peso, por lo que puede sugerirse, en
términos generales, que a mayor estatura de una persona esta tendrá más peso. Para tener
una idea de cómo es esta relación, realiza lo siguiente:
1. De manera individual pregunta a 10 personas diferentes la siguiente información:
a. Su género (hombre o mujer)
b. Su estatura en centímetros
c. Su peso en kilogramos
2. Con base en la información recolectada, determina:
a. ¿Quiénes presentan mayor estatura, hombres o mujeres?
b. ¿Quiénes presentan mayor peso, hombres o mujeres?
c. ¿Cuál es la mayor estatura?, ¿cuál la menor?
d. ¿Cuál es el promedio de las estaturas? ¿cuál el del peso?
e. ¿Cuál es la varianza del conjunto de datos?
f. Determina la varianza por género.
3. Comparte tus resultados en el foro del equipo.
4. Utilicen Excel para elaborar una base de datos donde se incluya la información de todos
los miembros del equipo.
5. Determinen lo siguiente:
a. El promedio general tanto de estatura como de peso.
b. Para ambas variables determinar la mediana.
c. Calcular la varianza y la desviación estándar.
6. Verifiquen lo anterior utilizando herramientas de análisis de Excel.
7. Al finalizar, reflexionen sobre las siguientes preguntas y preparen un documento que
integre las respuestas de todo el equipo a manera de conclusiones. Compartan el
documento en el foro.
a. ¿Cuál es el promedio general, tanto para peso como para estatura?
b. ¿Cuál es el promedio por género (hombre, mujer)?
c. ¿Cuál es la desviación estándar para todo el conjunto de datos?
d. ¿Cuál es la desviación estándar por género?
e. ¿Cuál de los dos géneros es el de mayor estatura?, ¿cuál el de mayor peso?
f. ¿Qué genero presenta mayor variabilidad en ambas características (estatura y peso)?
g. ¿En qué otras áreas podrían aplicar estos conceptos?
Maestros Online www.maestronline.com
Realiza lo siguiente:
1. Determina cuál de las siguientes es una distribución de probabilidad. En caso de que no
sea función de probabilidad explicar por qué no lo es.
a.
x 1 2 3 4
p(x) 0.4 0.2 0.3 0.2
c.
x -2 -1 1 2
p(x) 0.1 0.2 0.6 0.1
e.
x 0 2 4 6
p(x) -0.1 0.3 0.1 0.5
g.
x 1 2 3 4
p(x) 0.4 0.2 0 .3 0.2
2. El gerente de una planta utiliza datos históricos para construir una función de distribución
de probabilidad de X, el número de empleados ausentes en un día dado; los datos se
presentan a continuación:
x 0 1 2 3 4 5 6 7
p(x) 0.001 0.025 0.350 0.300 0.200 0.090 0.029 0.005
Determinar lo siguiente:
a. P(X=1)
Maestros Online www.maestronline.com
b. P(X>5)
c. P(X≥5)
d. P(X=6)
3. Supón que X representa el número de personas en una vivienda. La distribución de
probabilidad es como sigue:
X 1 2 3 4 5 6 7
p(x) 0.26 0.31 0.19 0.14 0.05 0.03 0.02
4.
a. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga menos de 3
personas?
b. ¿Cuál es la probabilidad de que una casa seleccionada al azar tenga más de 5
personas?
c. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga entre 2 y 4
(inclusive) personas? Determínese P (2≤X≤4).
Escribe con tus propias palabras el proceso de prueba de hipótesis y los intervalos de
confianza.
5. Una muestra aleatoria de 10 observaciones se extrajo de una población normal. Los datos
son los siguientes:
3 6 3 5 6 2 6 5 5 4
a. Establecer un intervalo de confianza al 90%.
b. Establecer un intervalo de confianza al 95%.
c. Establecer un intervalo de confianza al 99%.
5. Del experimento para determinar los grados centígrados necesarios para llevar el punto
de ebullición un litro de agua, se obtuvieron los siguientes resultados:
100.0 100.2 99.7 99.5 99.5 100.3
99.0 99.4 99.9 100.2 100.1 99.8
a. Prueba la hipótesis de que la media es igual a 100 (H0: μ = 100) contra la alternativa
de que la media poblacional es diferente a 100 (Ha: μ ≠ 100). El nivel de significancia
es del 1% (α = 0.01). Realiza todas las etapas de una prueba de hipótesis.
b. Establece intérprete el intervalo de confianza al 99% para la media de ebullición μ.
Maestros Online www.maestronline.com
6. Por un período de varios años, un dentífrico ha recibido una puntuación media de 5.9, en
una escala de 7 puntos, en cuanto a la satisfacción general del cliente con el producto.
Debido a un cambio no anunciado en el producto, existe la preocupación de que quizás
haya cambiado la satisfacción del cliente. Supón que las puntuaciones para una muestra
de 25 clientes tienen una media de 5.60 y una desviación estándar de 0.87. ¿Indican
estos datos que la satisfacción del cliente es diferente de 5.9?
a. Prueba la hipótesis con α = 0.05.
b. Obtén un intervalo de confianza al 95% para la media μ.
Actividad 2: Nicotina en cigarrillos
Instrucciones:
1. De manera individual, escribe el proceso de la prueba de hipótesis.
2. Reúnanse en equipos de trabajo (foro, Skype, Google Docs, chat, etc.).
3. Comenten sobre el proceso de las pruebas de hipótesis.
4. Una muestra aleatoria de 50 jóvenes adultos se selecciona y a cada persona se le
pregunta cuántos minutos ven diariamente de deportes. La media muestral que se
encontró fue de = 64. Supón que σ = 20.
Prueben la hipótesis de que existe suficiente evidencia estadística para inferir que la
media poblacional es superior a 60 minutos. Utilicen un nivel de significancia de 0.05.
5. Repitan el ejercicio 4 con n =75
6. Repitan el ejercicio 4 con n =100
7. Repitan el ejercicio 4 con σ = 10.
8. Repitan el ejercicio 4 con σ = 40.
9. Repitan el ejercicio 4 con = 62.
10. Repitan el ejercicio 4 con = 68.
11. Realicen un resumen de los ejercicios 4 a 10 describiendo qué pasa al valor de la
estadística de prueba cuando pasa lo siguiente:
a. El tamaño de muestra se incrementa.
b. La desviación estándar disminuye.
c. El valor de se incrementa.
1. Describe con tus propias palabras qué significa una serie de tiempo.
2. Enlista y define las componentes de una serie de tiempo.
3. ¿Cuál de las cuatro componentes de una serie de tiempo se utilizaría para describir el
efecto de las ventas navideñas de una tienda departamental de menudeo?
4. ¿Por qué es más fácil pronosticar valores para una serie de tiempo que contiene un
componente estacional que uno que posee un componente cíclico?
5. Los datos que se presentan a continuación corresponden al número de autos de
pasajeros (en miles) en Francia durante los años 1970 a 2006.
Maestros Online www.maestronline.com
Año 1970 1975 1979 1980 1981 1982 1983 1984 1985 1986
Númer
o de
autos
(miles)
1247
0
1552
0
1844
0
1913
0
1975
0
2030
0
2060
0
2080
0
2109
0
2150
0
Año 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996
Númer
o de
autos
(miles)
2197
0
2252
0
2301
0
2355
0
2381
0
2402
0
2438
5
2490
0
2510
0
2550
0
Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Númer
o de
autos
(miles)
2609
0
2681
0
2748
0
2806
0
2870
0
2916
0
2956
0
2990
0
3010
0
3040
0
6. Grafica el número de autos contra los años (utiliza Excel o cualquier paquete estadístico
como Minitab).
7. ¿Qué componentes de la series de tiempo parecen estar presentes en esta serie?
Actividad 3: ¿Existe relación entre el tamaño de la
casa y los metros de terreno? ¿Existe
Maestros Online www.maestronline.com
autocorrelación en la serie de datos de los
CETES?
Instrucciones:
1. En forma individual define lo que significa los términos de:
a. Serie de tiempo
b. Componentes de una serie de tiempo
c. Correlación
d. Autocorrelación
2. En equipos (por Skype, chat, Google Docs, etc.) lleguen a una definición común e
indiquen en que situaciones de la vida diaria se pueden aplicar estos conceptos, den un
ejemplo de cada término.
3. Busquen información de 20 casas en venta en donde las variables son: Y (metros de
construcción) y X (metros de terreno); y realicen lo que se indica:
a. Realicen y describan el diagrama de dispersión
b. Calculen e interpreten el coeficiente de correlación muestral r
c. Respondan a la siguiente cuestión en un terreno urbano, ¿a mayor cantidad en metros
de construcción es mayor el precio de la vivienda?
4. Busquen información de los CETES a 28 DÍAS – SEMANAL, periodicidad diaria, datos del
Banco de México; consideren las últimas 20 cotizaciones de los CETES y realicen lo que
se indica:
a. Determina el coeficiente de autocorrelación r1
b. Determina la prueba la hipótesis de que:
i. Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)
ii. Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero)
iii. Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k
5. Den respuesta a la siguiente cuestión: ¿Qué significa el término autocorrelación? ¿Existe
autocorrelación entre los rendimientos de los CETES a 28 días?
6. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada una
de las siguientes cuestiones:
a. ¿Qué significa el coeficiente de correlación?
b. ¿Cómo se interpreta el coeficiente de correlación?
c. ¿Para qué sirve el coeficiente de autocorrelación?
¿Bajo qué condiciones es un promedio móvil simple apropiado para pronosticar?
Maestros Online www.maestronline.com
1. Los datos de la demanda anual de bolsas de fertilizante de una empresa agrícola se
muestran en la siguiente tabla.
Año
t
Demanda de
fertilizante
(miles de bolsas)
Pronóstico
1 4 -
2 6 -
3 4 -
4 5 4.7
5 10
6 8
7 7
8 9
9 12
10 14
11 15
a. Grafica la serie de tiempo.
b. Encuentra el valor de pronóstico para la demanda de fertilizante para cada año,
comenzando por el año 4 por medio de un promedio móvil de k=3 años.
2. Aplica el suavizamiento exponencial con una constante de suavizamiento de α = 0.1 y un
valor inicial de 38 para pronosticar el valor del año 11 para el siguiente conjunto de datos.
Período
T
Yt Ŷt
1 38 38
2 43
3 42
Maestros Online www.maestronline.com
4 45
5 46
6 48
7 50
8 49
9 46
10 45
3. Las ventas de equipos de cocina han aumentado durante los últimos cinco años.
Año Ventas Yt Ŷt
1 400 360
2 455
3 468
4 513
5 534
6
a. El gerente había pronosticado, antes de iniciar el negocio, que las ventas del primer
año serían de 360 equipos de cocina. Por medio de un suavizamiento exponencial con
α = 0.40, desarrolla los pronósticos para el periodo comprendido entre los años 2 y 6.
5. Las ventas trimestrales de una cadena de tiendas departamentales se registraron para los
años 1986-1989:
Año Trimestre Ventas
(millones)
Yt
Pronóstico
Ŷt
1986 1 18 18
2 33
Maestros Online www.maestronline.com
3 25
4 41
1987 1 22
2 20
3 36
4 33
1988 1 27
2 38
3 44
4 52
1989 1 31
2 26
3 29
4 45
1990 1
a. Utiliza el suavizamiento exponencial con una constante de suavizamiento de 0.4 y un
valor inicial de 18 para pronosticar las ventas para el primer trimestre de 1990.
6. Para los siguientes valores de Yt y Ŷt de la siguiente tabla calcula la DAM, el ECM, el
EPAM y EPM.
Valor
observado
Yt
Pronóstico
Ŷt
166 173
179 186
195 192
214 211
220 223
Maestros Online www.maestronline.com
6. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de
tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales
observados (Yt).
Valores de pronóstico Ŷt
Valor observado Yt Modelo 1
Modelo 2
6.0 7.5 6.3
6.6 6.3 6.7
7.3 5.4 7.1
9.4 8.2 7.5
a. Calcula el DAM y el ECM para determinar cuál es más preciso.
8. Determina DAM y ECM para los siguientes pronósticos.
Valor
observado Yt
Pronóstico Ŷt
57 63
60 72
70 86
75 71
70 60
8. Se utilizaron tres técnicas de pronóstico para predecir los valores de una serie de tiempo.
Estos valores se dan en la siguiente tabla. Calculen el DAM y el ECM para cada técnica
para determinar cuál es el más preciso.
Valores de pronóstico Ŷt
Maestros Online www.maestronline.com
Valor observado Yt Técnica
1
Técnica 2 Técnica 3
19 21 22 17
24 27 24 20
28 29 26 25
32 31 28 31
38 35 30 39
¿Cuánto tiempo dedica una persona en promedio a Internet?
Para tener una idea de esto, realiza lo siguiente:
1. Pregunta de manera individual a 10 personas del género masculino y a 10 personas del
género femenino la siguiente información:
a. Su edad
b. Tiempo que dedica diariamente a Internet
2. Con una calculadora de bolsillo y con base en esta información determina:
a. En promedio, ¿quién dedica más tiempo a Internet, hombres o mujeres?
b. ¿Cuál es el promedio de edad de las mujeres?, ¿de los hombres?
c. Para los géneros por separado determina la mediana de la edad y del tiempo
dedicado a Internet.
d. Para el total de datos determina la varianza y la desviación estándar del tiempo que
dedican a Internet y de la edad.
3. Utiliza Excel para elaborar una base de datos donde incluyas toda la información. Con una
calculadora de bolsillo contesta lo siguiente:
a. ¿Cuál es el promedio general de tiempo dedicado a Internet y de la edad?
b. ¿Cuál es la mediana para los datos en general, tanto para el tiempo dedicado a
Internet como de la edad?
c. ¿Cuál es la varianza y la desviación estándar de todos los datos para el tiempo
dedicado a Internet y para la edad?
4. Verifica lo anterior utilizando herramientas de análisis de Excel.
5. Para finalizar, reflexiona sobre las siguientes preguntas y prepara un documento con
respuestas a manera de conclusiones.
6. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco
de México y realiza lo que se indica:
a. Considera las últimas 12 cotizaciones de la TIIE
b. Determina el coeficiente de autocorrelación r1
Maestros Online www.maestronline.com
c. Determina la prueba la hipótesis de que:
Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)
Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero)
Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k
7. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco
de México, considera las últimas 24 cotizaciones de la TIIE y realiza lo que se indica,
a. Determina el valor de pronóstico para el rendimiento del bono, comenzando en 4to
periodo, por medio de un promedio móvil de k= 3 meses.
b. Determina el valor de pronóstico para el rendimiento del bono para cada mes,
comenzando en el periodo 6, mediante un promedio móvil de k=5 meses.
c. Utiliza el suavizamiento exponencial con una constante de suavizamiento α = 0.2 y un
valor inicial igual a la primera lectura del TIIE 28 DÍAS.
d. Evalúa estos métodos de pronóstico por medio de Desviación Absoluta Media (DAM),
Error Cuadrático Medio (ECM), Error Porcentual Absoluto Medio (EPAM) y Error
Porcentual Medio (EPM).
e. Pronostica el rendimiento para el periodo 25 por medio de la mejor técnica.
Actividad 4: Obtención de la recta de regresión
ajustada por medio del método de mínimos
cuadrados.
Instrucciones:
Preparación para la actividad colaborativa (de forma individual)
1. Define los siguientes términos:
a. Análisis de la regresión simple.
b. Estimadores de mínimos cuadrados.
c. Intervalo de confianza.
d. Coeficiente de regresión.
e. Coeficiente de correlación.
f. Coeficiente de determinación.
2. Comparte tus definiciones a través del foro de grupo virtual que se estableció para el
desarrollo de la actividad.
Durante la actividad colaborativa
Maestros Online www.maestronline.com
2. En equipos reporten al foro el desarrollo de los siguientes ejercicios y respuesta de las
preguntas planteadas:
a. En una compañía fabricante de helados se sospecha que el almacenar el helado a
temperaturas bajas durante largos periodos tiene un efecto lineal en la pérdida de
peso del producto. En la planta de almacenamiento de la compañía se obtuvieron los
siguientes datos:
Pérdida de peso (gr) Y 28 37 36 30 28 36 35
Tiempo (semanas) X 26 32 35 27 25 31 30
i. Ajusten e interpreten un modelo de regresión lineal simple a los datos.
ii. Prueben la significancia de la pendiente β1.
iii. Calculen e interpreten R2.
iv. Elaboren un intervalo de confianza del 90% para β1.
v. Pronostiquen la pérdida cuando el tiempo es de 33 semanas.
3. Con los conceptos vistos y puestos en práctica, den una respuesta justificada a cada una
de las siguientes cuestiones:
a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu especialidad?
b. ¿Qué relación tiene con la correlación?
c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido?
d. ¿Qué es el coeficiente de determinación?
e. ¿Por qué crees que se llama regresión lineal?
f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en la
regresión?
I. Realiza lo siguiente:
1. En un estudio de variables que afectan la productividad en el negocio de abarrotes al
menudeo, W. S. Good usa el valor agregado por hora de trabajo para medir la
productividad de tiendas de abarrotes al menudeo. Él define el “valor agregado” como
el “excedente [dinero generado por el negocio] disponible para pagar mano de obra,
muebles accesorios y equipo”. Los datos de acuerdo con la relación del valor
agregado por hora de trabajo Y y el tamaño X de la tienda de abarrotes descrita en el
artículo de Good para diez tiendas de abarrotes ficticias se muestran enseguida. Se
establecerá un modelo para relacionar Y con X.
Datos en relación con el tamaño de tienda y el valor agregado
Tienda Valor agregado
por hora de trabajo
Tamaño de la tienda
(miles de pies cuadrados)
Maestros Online www.maestronline.com
Y X
1 6.08 23.0
2 5.40 14.0
3 5.51 27.2
4 5.09 12.4
5 4.92 33.9
6 3.94 9.8
7 6.11 22.6
8 5.16 17.5
9 5.75 27.0
10 5.60 21.1
a. Realiza un diagrama de dispersión de los datos para Y contra X.
b. Calcula las rectas de mínimos cuadrados para Y contra X.
c. Obtén una gráfica de residuales contra el valor ajustado de Y, ya sea por medio
de Minitab. Observa la gráfica. ¿Qué patrón parecen seguir los datos? Éste es un
ejemplo de análisis de residuales.
2. En un experimento con conejos se tomaron en cuenta las siguientes variables:
Y: Proporción del peso final al peso inicial.
X: Gramos diarios de alimento por kg de peso inicial.
Proporción de peso
final al
peso inicial
Y
Gramos diarios
de alimento por kg
de peso inicial
X
Proporción de peso final
al
peso inicial
Y
Gramos diarios de
alimento por kg de
peso
inicial
X
0.91 10 1.16 33
0.88 15 0.96 35
0.90 18 1.08 36
0.79 19 1.13 37
0.94 20 1.00 39
0.88 21 1.10 42
Maestros Online www.maestronline.com
0.95 21 1.11 45
0.97 24 1.18 54
0.88 25 1.26 56
1.01 27 1.29 56
0.95 28 1.36 59
0.95 30 1.40 59
1.05 30 1.32 60
1.05 31 1.47 64
a. Realiza un diagrama de dispersión de los datos para Y contra X.
b. Calcula las rectas de mínimos cuadrados para Y contra X.
c. Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas de la
prueba de hipótesis (α = 0.01).
d. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15, 25, 30, 35.5,
39, 45, 60, 70, 80, 90.
Calcula el intervalo de confianza de los valores particulares de Y para los valores dados
de X0 del inciso anterior.
Realiza los siguientes ejercicios (utiliza Excel o un paquete de software estadístico como
Minitab).
3. Una empresa ha estado buscando los factores que influyen en la cantidad de acero
(en millones de toneladas) que puede vender cada año. La administración sospecha
que los siguientes son los factores principales: la tasa anual de inflación del país, el
precio promedio por tonelada de acero importado que acota los precios (en dólares) y
el número de automóviles (en millones) que los fabricantes de autos planean producir
ese año. Se recolectaron los datos de los últimos siete años:
Millones
de tons.
vendidas
Y
Tasa de
inflación X1
Cota de Importaciones
X2
Número de
automóviles (millones) X3
4.2 3.1 3.10 6.2
3.1 3.9 5.00 5.1
4.0 7.5 2.20 5.7
Maestros Online www.maestronline.com
4.7 10.7 4.50 7.1
4.3 15.5 4.35 6.5
3.7 13.0 2.60 6.1
3.5 11.0 3.05 5.9
a. Estima la ecuación de regresión múltiple.
b. Interpreta los coeficientes de regresión estimados.
4. Se llevó a cabo un conjunto de ensayos experimentales para determinar una forma de
predecir el tiempo de cocimiento en minutos Y a varios niveles de amplitud del horno,
pies X1 y temperatura de cocción, grados Celsius X2. Los datos obtenidos fueron
registrados como se muestra a continuación:
Tiempo de
cocimiento
Y
Niveles de amplitud
del horno, pies X1
Temperatura
en grados Cº
X2
6.40 1.32 1.15
15.05 2.69 3.40
18.75 3.56 4.10
30.25 4.41 8.75
44.85 5.35 14.82
48.94 6.20 15.15
51.55 7.12 15.32
61.50 8.87 18.18
100.44 9.80 35.19
111.42 10.65 40.40
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Pronostica el tiempo de cocimiento cuando el nivel de amplitud del horno es de 5
pies y la temperatura de cocción es de 20 grados Celsius.
b. El supervisor de una empresa está examinando la relación existente entre la
calificación que obtiene un empleado en una prueba de aptitud, su experiencia previa
y el éxito en el trabajo. Se estudia y se pondera la experiencia de un empleado en
Maestros Online www.maestronline.com
trabajos anteriores y se obtiene una calificación entre 2 y 12. La medida del éxito en el
empleo se basa en un sistema de puntuación que incluye producción total y eficiencia,
con valor máximo posible de 50. El supervisor tomó una muestra de seis empleados
con menos de un año de antigüedad, y obtuvo lo siguiente:
Evaluación
del
desempeño
Y
Resultado de la
prueba
de aptitud X1
Experiencia en
trabajos
anteriores (años) X2
28 74 5
33 87 11
21 69 4
40 93 9
38 71 7
46 97 10
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Si un empleado obtuvo 83 puntos en la prueba de aptitud y tenía una experiencia
en trabajos anteriores de 7 años, ¿qué evaluación de desempeño puede esperar?
Actividad 5: ¿Existe relación entre la cantidad de
Kilómetros y los caballos de fuerza y el peso
total?
Instrucciones:
Revisa la siguiente información y resuelve lo que se indica.
1. Se tomó una muestra de 20 automóviles con relación al número de kilómetros por litro (Y),
caballos de fuerza X1 y peso total en kg X2.
Kilómetros por litro, Y
Caballos de Fuerza,
X1
Peso en kg X2
Maestros Online www.maestronline.com
19 67 1844
19 50 1998
17 62 1752
16 69 1980
16 66 1797
15 63 2199
15 90 2404
14 99 2611
13 63 3236
12 91 2606
11 94 2580
11 88 2507
11 124 2922
10 97 2434
9 114 3248
9 102 2812
8 114 3382
8 142 3197
7 153 4380
7 139 4036
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Si un vehículo tiene 92 caballos de fuerza y un peso de 1750 kg ¿cuál será el número
de kilómetros por litro que se esperaría?
3. En un experimento con conejos se hizo variar la cantidad de alimento administrado, y
además se les añadió 1 g diario de colesterol en la dieta durante varias semanas. La
cantidad de alimento X está expresado como gramos diarios por kg de peso al inicio del
experimento, y el colesterol Y al final del experimento en mg. Los datos se presentan a
continuación:
Cantidad de alimento, g
X
Colesterol, mg
Y
Cantidad de alimento, g
X
Colesterol, mg
Y
10 313 33 677
15 370 35 151
Maestros Online www.maestronline.com
18 424 36 280
19 356 37 245
20 310 39 396
21 349 42 278
21 365 45 297
24 245 54 224
25 373 56 346
27 395 56 141
28 156 59 139
30 243 59 424
30 150 60 316
31 463 64 379
a. Estimen la ecuación de regresión.
b. Calculen las predicciones para los siguientes valores de X0: 11, 12, 15, 25, 30,
35.5, 39, 45, 60, 70, 80, 90.
c. Obtengan los intervalos de confianza al 99 para cada valor de Y para los
diferentes valores de X0.
Ejercicio 1
1. La energía eléctrica consumida Y cada mes por una planta química se considera
relacionada con la temperatura ambiente promedio en grados Fahrenheit X1, número de
días al mes X2, la pureza promedio del producto en porciento X3 y las toneladas obtenidas
del producto X4. Se dispone de los datos históricos del año anterior, lo cuales se presentan
enseguida:
Y
Temperatura en
grados Fahrenheit
X1
Días
X2
Porcentaje de
pureza
X3
Toneladas
de producto
X4
240 25 24 91 100
236 31 21 90 95
290 45 24 88 110
274 60 25 87 88
301 65 25 91 94
Maestros Online www.maestronline.com
316 72 26 94 99
300 80 25 87 97
296 84 25 86 96
267 75 24 88 110
276 60 25 91 105
288 50 25 90 100
261 38 23 89 98
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Interpreta los coeficientes de regresión en el contexto del problema.
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las
etapas de una prueba de hipótesis.
d. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
g. Pronostica la energía eléctrica consumida Y cuando la temperatura ambiente
promedio X1 es de 30, el número de días al mes X2 es de 25 grados Fahrenheit, la
pureza promedio del producto en porciento X3 es de 92 y las toneladas obtenidas del
producto X4 es de 95.
h. Calcula R2.
i. Construye un intervalo de confianza para las pendientes de la población β1, β2 , β3 y β4.
Ejercicio 2
2. Un negocio de ventas por catálogo de computadoras
personales, software y hardware mantiene un almacén centralizado para la distribución de
los productos ordenados. La administración examina el proceso de distribución y está
interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una
pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos
de los últimos 24 meses, que indican los costos de distribución Y, las ventas X1 y el
número de órdenes recibidas X2. Los resultados son los siguientes:
Costo de
Distribución
(miles de dólares)
Y
Ventas
(miles de
dólares)
X1
Órdenes
X2
Maestros Online www.maestronline.com
52.95 386 4015
71.66 446 3806
85.58 512 5309
63.69 401 4262
72.81 457 4296
68.44 458 4097
52.46 301 3213
70.77 484 4809
82.03 517 5237
74.39 503 4732
70.84 535 4413
54.08 353 2921
62.98 372 3977
72.30 328 4428
58.99 408 3964
79.38 491 4582
94.44 527 5582
59.74 444 3450
90.50 623 5079
93.24 596 5735
69.33 463 4269
53.71 389 3708
89.18 547 5387
66.80 415 4161
Con base en los resultados obtenidos:
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Interpreta los coeficientes de regresión en el contexto del problema.
Maestros Online www.maestronline.com
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las
ventas son de 400,000 dólares y el número de órdenes es de 4,500.
h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población (β1 y β2).
Ejercicio 3
3. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas
como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia
ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos se
recolectaron en las doce semanas posteriores al inicio de la campaña de publicidad.
Tiempo
Semanas
(X)
Ventas
(miles de dólares)
(Y)
1 4,618
2 3,741
3 5,836
4 4,367
5 5,118
6 8,887
7 19,746
8 34,215
9 50,306
10 65,717
11 86,434
12 105,464
a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas.
b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
Maestros Online www.maestronline.com
c. ¿Estás satisfecho con el modelo como pronosticador de ventas Y? Explica. Realiza
todas las etapas de una prueba de hipótesis con α = 0.05.
d. Transforma la variable independiente X2, luego corre de nuevo el modelo con X y
X2 como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los
datos? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05.
e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
Compáralo con el obtenido en el inciso b, ¿cuál modelo prefieres?, ¿por qué?
Revisa la siguiente información nutricional de las ensaladas:
1. Enseguida se presentan las siguientes variables que se registraron en diferentes tipos de
ensaladas. Las variables son:
a. Y: Calorías
b. X1: Grasa (g)
c. X2:Carbohidratos (g)
d. X3: Proteínas (g)
Ensalada
(porciones
de 100 g)
Grasa (g) X1 Carbohidratos (g) X2 Proteínas (g) X3 Calorías
Y
César 14.7 6.52 5.03 170
Atún 11.02 6.96 14.27 184
Atún con queso 14.72 6.87 14.44 217
Atún con huevo 12.93 6.96 13.71 196
Macarrones o pasta 10.63 22.98 3.76 202
Macarrones u otra pasta con pollo 13.34 15.00 10.11 221
Macarrones u otra pasta con atún 9.14 19.49 7.07 18.9
Ensalada de huevo 30.26 1.93 9.20 318
Ensalada de papas 8.20 11.17 2.68 143
Ensalada de papas con huevo 7.05 15.96 2.77 136
Ensalada de papas estilo alemán 1.24 16.66 2.52 88
Información obtenida de http://www.fatsecret.cl/.../ solo para fines educativos.
2. Estos datos se deben ingresar a Excel o Minitab y llevar a cabo lo siguiente:
a. Estima e interpreta en el contexto del problema los coeficientes de la ecuación de
regresión múltiple.
Maestros Online www.maestronline.com
b. Prueben la significancia de los coeficientes de regresión individuales. Realicen todas
las etapas de una prueba de hipótesis para cada uno de los coeficientes.
c. Calculen e interpreten R2 en el contexto del problema.
d. Calculen el error estándar de estimación.
e. Estimen la cantidad promedio de calorías cuando el contenido de grasa es de 50 g, la
cantidad de carbohidratos es de 10 g y la cantidad de proteínas es de 8 g.
f. Calculen R2ajustada.
g. Construyan un intervalo de confianza para las pendientes de la población (β1, β2 y β3).
Ejercicio 1
1. Un negocio de ventas por catálogo de computadoras
personales, software y hardware mantiene un almacén centralizado para la distribución de
los productos ordenados. La administración examina el proceso de distribución y está
interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una
pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos
de los últimos 24 meses que indican los costos de distribución Y, las ventas X1 y el
número de órdenes recibidas X2. Los resultados son los siguientes:
Costo de
Distribución
(miles de dólares)
Y
Ventas
(miles de dólares)
X1
Órdenes
X2
52.95 386 4015
71.66 446 3806
85.58 512 5309
63.69 401 4262
72.81 457 4296
68.44 458 4097
52.46 301 3213
70.77 484 4809
82.03 517 5237
74.39 503 4732
70.84 535 4413
54.08 353 2921
62.98 372 3977
Maestros Online www.maestronline.com
72.30 328 4428
58.99 408 3964
79.38 491 4582
94.44 527 5582
59.74 444 3450
90.50 623 5079
93.24 596 5735
69.33 463 4269
53.71 389 3708
89.18 547 5387
66.80 415 4161
a. Realiza una regresión múltiple.
b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
d. Determina el VIF para cada variable explicativa en el modelo. ¿Existe alguna razón
para sospechar que existe multicolinealidad?
Ejercicio 2
2. Una organización de consumidores desea desarrollar un modelo para predecir el
rendimiento de gasolina de automóvil, medido en cantidad de millas recorridas [millas por
galón (mpg)] de acuerdo a los caballos de fuerza del motor y el peso del auto en kg. Se
seleccionó una muestra de 50 modelos con los siguientes resultados:
mpg Y Caballos de fuerza X1 Peso X2
43.1 48 1985
19.9 110 3365
19.2 105 3535
17.7 165 3445
18.1 139 3205
Maestros Online www.maestronline.com
20.3 103 2830
21.5 115 3245
16.9 155 4360
15.5 142 4054
18.5 150 3940
27.2 71 3190
41.5 76 2144
46.6 65 2110
23.7 100 2420
27.2 84 2490
39.1 58 1755
28 88 2605
24 92 2865
20.2 139 3570
20.5 95 3155
28 90 2678
34.7 63 2215
36.1 66 1800
35.7 80 1915
20.2 85 2965
23.9 90 3420
29.9 65 2380
30.4 67 3250
36 74 1980
22.6 110 2800
36.4 67 2950
27.5 95 2560
33.7 75 2210
Maestros Online www.maestronline.com
44.6 67 1850
32.9 100 2615
38 67 1965
24.2 120 2930
38.1 60 1968
39.4 70 2070
25.4 116 2900
31.3 75 2542
34.1 68 1985
34 88 2395
31 82 2720
27.4 80 2670
22.3 88 2890
28 79 2625
17.6 85 3465
34.4 65 3465
20.6 105 3380
a. Realiza un modelo de regresión lineal múltiple.
b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
d. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
Ejercicio 3
1. El director de operaciones de transmisión de una estación de televisión desea estudiar el
aspecto de las “horas de espera” en la que los artistas gráficos sindicalizados se les paga
por no realizar actividades. Las variables a considerar son:
a. Horas de espera (Y): número total de horas por semana
b. Personal presente total (X1): total semanal de días-persona los 7 días a la semana
Maestros Online www.maestronline.com
c. Horas remotas (X2): número total de horas trabajadas por empleados fuera de la
planta central
d. Los resultados para un periodo de 26 semanas son:
Horas en espera
Y
Personal presente
X1
Horas remotas
X2
245 338 414
177 333 598
271 358 656
211 372 631
196 339 528
135 289 409
195 334 382
118 293 399
116 325 343
147 311 338
154 304 353
146 312 289
115 283 388
161 307 402
274 322 151
245 335 228
201 350 271
183 339 440
237 327 475
175 328 347
152 319 449
188 325 336
188 322 267
197 317 235
Maestros Online www.maestronline.com
261 315 164
232 331 270
e. Ajusta un modelo de regresión lineal múltiple.
f. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
g. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
h. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
Analiza y resuelve los siguientes ejercicios, sin olvidar incluir los procedimientos utilizados que
te llevaron a la respuesta.
Concluye con una reflexión sobre la utilización de la regresión y correlación en la vida
cotidiana. ¿Qué tipo de problemas pudieras resolver con los conocimientos adquiridos en este
módulo?
1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar a un centro
comercial y la distancia desde la casa en donde tú vives? Entrevista a 20 compañeros y
pregúntales el tiempo que tardan en llegar al centro comercial y la distancia a su casa.
Después denomina a la variable tiempo en minutos como Y y a la distancia en km como X.
a. Contesta lo siguiente:
i. Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A
mayor distancia es mayor el tiempo?
ii. Calcula la recta de regresión de mínimos cuadrados.
iii. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en
llegar? Prueba la significancia de la recta de regresión con un nivel de
significancia α = 0.01.
iv. ¿Es significativa esta regresión? Realiza todas las etapas de una prueba de
hipótesis. Concluye en el contexto del problema.
v. Pronostica el tiempo en llegar al centro comercial si la distancia es de 3, 4 y 6
kilómetros de distancia.
vi. Calcula el coeficiente de correlación.
vii. Determina e interpreta el coeficiente de determinación en el contexto del
problema.
viii. Realiza un breve resumen de los hallazgos.
Maestros Online www.maestronline.com
2. ¿Existe relación entre el peso de una persona y la medida de su cintura en centímetros?
Selecciona 10 personas del género masculino y 10 personas del género femenino y
pídeles que te den su peso en kilogramos y la medida de su cintura en centímetros.
Posteriormente denomina a la variable peso como Y y a la medida de la cintura como X.
a. Contesta lo siguiente:
i. Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A
mayor medida de la cintura es mayor el peso?
ii. Calcula la recta de regresión de mínimos cuadrados. ¿Existe evidencia que
indique que a mayor medida de la cintura es mayor el peso? Prueba la
significancia de la recta de regresión con un nivel de significancia α = 0.01. ¿Es
significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis.
Concluye en el contexto del problema.
iii. Pronostica el peso si las medidas de cintura son de 66, 80 y 86 centímetros.
iv. Calcula el coeficiente de correlación.
v. Determina e interpreta el coeficiente de determinación en el contexto del
problema.
vi. Realiza un breve resumen de los hallazgos.
3. Busca información de 20 casas en venta en donde las variables son Y (metros de
construcción) y X (metros de terreno), y realiza lo que se te indica:
a. Contesta lo siguiente:
i. Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables.
ii. ¿Qué clase de relación crees que existe entre estas dos variables?
iii. Calcula la recta de regresión de mínimos cuadrados.
iv. Prueba la significancia de la recta de regresión con un nivel de significancia α =
0.01.
v. ¿Es significativa esta regresión? Explica. Concluye en el contexto del problema.
Realiza todas las etapas de una prueba de hipótesis.
vi. Pronostica los metros de construcción cuando los metros de terreno son de 90,
100 y 150 metros.
vii. Calcula el coeficiente de correlación.
viii. Determina e interpreta el coeficiente de determinación en el contexto del
problema.
ix. Realiza un breve resumen de los hallazgos.
4. Revisa la siguiente información tomada de la sección de avisos de ocasión.
Precio
(miles de pesos)
Metros de
terreno X1
Metros de
construcción X2
Número de
recámaras X3
Maestros Online www.maestronline.com
Y
2700 288 378 4
1895 160 252 4
1397 230 252 4
1795 234 167 2
650 72 124 4
850 128 262 4
3875 188 246 4
4300 390 380 3
11850 885 775 4
11900 885 775 3
3250 150 233 3
6700 406 420 3
5499 320 390 4
4250 170 244 4
4250 170 233 3
470 160 127 3
500 90 73 2
550 91 73 2
650 110 90 2
550 90 74 2
620 172 76 2
1700 189 374 4
2330 300 330 4
1600 136 140 3
1100 144 290 3
Información obtenida de: http://www.avisosdeocasion.com solo para fines educativos.
Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo siguiente:
Maestros Online www.maestronline.com
a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de
regresión lineal múltiple.
b. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de
una prueba de hipótesis.
c. Pronostica el precio para los siguientes datos:
Metros de
terreno
( X1 )
Metros de
construcción
(X2 )
Número de
recámaras
( X3 )
180 390 4
200 250 3
230 200 4
250 180 2
100 120 3
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula el error estándar de estimación.
f. Construye un intervalo de confianza para las pendientes de la población (β1, β2 y β3).
g. Calcula e interpreta R2 en el contexto del problema.
h. Calcula R2ajustada.
i. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
j. Finalmente prepara un documento presentando un resumen de tus hallazgos.