Ejercicios de Regresión Múltiple y Pronósticos

download Ejercicios de Regresión Múltiple y Pronósticos

of 33

Transcript of Ejercicios de Regresión Múltiple y Pronósticos

Herrera Romero Gustavo Izcatl Ejercicios de Estadstica Respuestas a los ejercicios de regresin y correlacin. Ejercicio 19. a) Ecuacin de regresin. Utilizando Minitab:Anlisis de regresin: Ganancias vs. Empleados, Dividendos, InventarioLa ecuacin de regresin es Ganancias = 965 + 2.87 Empleados + 6.8 Dividendos + 0.287 Inventario Predictor Constante Empleados Dividendos Inventario S = 1008.96 Coef 965.3 2.865 6.75 0.2873 SE Coef 499.8 1.583 10.28 0.1111 T 1.93 1.81 0.66 2.59 P 0.077 0.095 0.524 0.024

R-cuad. = 78.8%

R-cuad.(ajustado) = 73.5%

Anlisis de varianza Fuente Regresin Error residual GL 3 12 Suma de Cuadrados 45510101 12215892 CM 15170034 1017991 F 14.90 P 0.000

Master Chemical Company emplea a 220 personas, ha pagado 64 dividendos y tiene un inventario de $1,500,000.00. El clculo del ingreso bruto es:Ganancias = 965 + 2.87 (220) + 6.8 (64) + 0.287 (1500) = $2,462,100.00

b) Prueba global de hiptesis. La prueba global de hiptesis nos sirve para investigar si es posible que la variable dependiente se pueda estimar sin basarse en las variables independientes, o sea, si es posible que las variables independientes tengan como coeficientes de regresin el valor cero. 1. Formulacin de las hiptesis: H0: 1 = 2 = 3 = 0. H1: No todas las i son 0. 2. Se establece un nivel de significancia = 5%. 3. Se utilizar la distribucin F. 4. Hay 3 grados de libertad en el numerador (variables independientes). Hay 12 grados de libertad en el denominador (16 observaciones (3 variables independientes + 1)). El valor crtico de F es 3.49.

Distribucin F gl = 3, 12

Regin de rechazo = 0.05 3.49

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de F es menor o igual a 3.49. 5. El valor de F se calcula mediante la frmula:F SSR / k SSE /n (k 1)

donde SSR es la suma de cuadrados de regresin, SSE es la suma de los cuadrados del error, n es el nmero de observaciones y k es el nmero de variables independientes. Por lo tanto:Anlisis de varianza Fuente Regresin Error residual GL 3 12 Suma de Cuadrados 45510101 12215892 CM 15170034 1017991 F 14.90 P 0.000

45510101 / 3 F = 14.90 12215892 /16 (3 1)

Dado que el valor calculado 14.90 es mayor que el valor crtico 3.49, se rechaza la hiptesis nula de que los coeficientes de las variables independientes en la ecuacin de regresin mltiple son todas iguales a cero. Esto significa que al menos uno de los coeficientes de las variables independientes (Empleados, Dividendos o Inventario) es diferente de cero. c) Prueba de hiptesis de los coeficientes de regresin por separado. 1. Formulacin de las hiptesis Empleados Dividendos Inventario H0: 1 = 0 H0: 2 = 0 H0: 3 = 0 H1: 1 0 H1: 2 0 H1: 3 0 2. Todas las hiptesis se probarn con un nivel de significancia = 0.05. Es una prueba de dos colas. 3. El estadstico de prueba a utilizar es la distribucin t con n-(k+1) = 12 grados de libertad. 4. El valor crtico es t = 2.179.

-2.179

2.179

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de t se encuentra entre -2.179 y 2.179. 5. El valor de t para cada variable independiente se calcula mediante la frmula donde bi es el coeficiente de regresin correspondiente a la variable independiente, se incluye 0 en la ecuacin ya que la hiptesis nula es i = 0 y sbi es la desviacin estndar de la distribucin del coeficiente de regresin. La ecuacin de regresin es:Ganancias = 965 + 2.87 Empleados + 6.8 Dividendos + 0.287 Inventario Predictor Constante Empleados Dividendos Inventario Coef 965.3 2.865 6.75 0.2873 Standard Error Coef 499.8 1.583 10.28 0.1111 T 1.93 1.81 0.66 2.59 P 0.077 0.095 0.524 0.024

Calculando los valores para cada variable independiente: Empleados Dividendos Inventario

Por lo tanto, para las variables Empleados y Dividendos no se rechaza la hiptesis nula de que sus coeficientes en la ecuacin de regresin son cero, y para la variable Inventario s se rechaza la hiptesis nula de que su coeficiente en la ecuacin de regresin es cero. Por lo tanto la nica variable que tiene influencia en las ganancias es Inventario, y se debe realizar de nuevo la regresin entre la variable dependiente Ganancias y la variable independiente Inventario para obtener una nueva ecuacin de regresin: d) Generacin de la nueva ecuacin de regresin. Utilizando Minitab:Anlisis de regresin: Ganancias vs. InventarioLa ecuacin de regresin es Ganancias = 1676 + 0.474 Inventario Predictor Constante Inventario S = 1123.83 Coef 1676.0 0.47382 SE Coef 392.0 0.08415 T 4.28 5.63 P 0.001 0.000

R-cuad. = 69.4%

R-cuad.(ajustado) = 67.2%

Anlisis de varianza Fuente Regresin Error residual GL 1 14 SC 40043961 17682033 CM 40043961 1263002 F 31.71 P 0.000

Ahora se har una nueva prueba de hiptesis para saber si el coeficiente de la variable Inventario en la ecuacin de regresin es diferente de cero.

1. Formulacin de las hiptesis. H0: 1 = 0 H1: 1 0 2. Todas las hiptesis se probarn con un nivel de significancia = 0.05. Es una prueba de dos colas. 3. El estadstico de prueba a utilizar es la distribucin t con n-(k+1) = 14 grados de libertad. 4. El valor crtico es t = 2.120.

-2.120

2.120

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de t se encuentra entre -2.120 y 2.120. 5. El valor de t se calcula mediante la frmula donde bi es el coeficiente de regresin correspondiente a la variable independiente, se incluye 0 en la ecuacin ya que la hiptesis nula es i = 0 y sbi es la desviacin estndar de la distribucin del coeficiente de regresin. La ecuacin de regresin es:Ganancias = 1676 + 0.474 Inventario Predictor Constante Inventario Coef 1676.0 0.47382 SE Coef 392.0 0.08415 T 4.28 5.63 P 0.001 0.000

Calculando el valor de t:

Por lo tanto, se rechaza la hiptesis nula de que el coeficiente de la variable Inventario en la ecuacin de regresin es cero. e) Anlisis de las varianzas residuales 1. Histograma de residuos.

(la respuesta es Ganancias) 4

Histograma

3

Frecuencia

2

1

0

-1500

-1000

-500

0 500 Residuo

1000

1500

2000

2. Grfica de probabilidad normal.Grfica de probabilidad normal(la respuesta es Ganancias)99

95 90 80

Porcentaje

70 60 50 40 30 20 10 5

1

-3000

-2000

-1000

0 Residuo

1000

2000

3000

Del anlisis del histograma de residuos se puede ver que los residuos tienen una distribucin casi normal. Adems la grfica de probabilidad normal muestra que los residuos no estn demasiado alejados de la recta. Parece razonable suponer que los residuos tienen una distribucin normal. f) Grfica de dispersin de Residuos contra Ajustes.

Grfica de dispersin de RESIDUOS vs. AJUSTES2500 2000 1500

RESIDUOS

1000 500 0 -500 -1000 -1500 2000 3000 4000 AJUSTES 5000 6000 7000

La grfica de dispersin no muestra un patrn en los puntos, los residuos parecen centrados respecto de cero en el eje vertical. Parece haber una distribucin aleatoria de valores positivos y negativos a lo largo de todo el rango de la variable Ajustes, aunque se ven un poco concentrados a la izquierda en el valor de 2000. No parece haber un patrn obvio, por lo que parece estar bien fundamentada la suposicin de linealidad entre las variables Ganancias e Inventario.

Ejercicio 20. a) Ecuacin de regresin. Utilizando Minitab:Anlisis de regresin: Suscriptores vs. Poblacin, Publicidad, IngresoLa ecuacin de regresin es Suscriptores = - 5.73 + 0.00754 Poblacin + 0.0509 Publicidad + 1.10 Ingreso Predictor Constante Poblacin Publicidad Ingreso S = 0.326933 Coef -5.733 0.007537 0.05088 1.0974 SE Coef 8.427 0.001813 0.01414 0.2450 T -0.68 4.16 3.60 4.48 P 0.504 0.000 0.002 0.000

R-cuad. = 83.5%

R-cuad.(ajustado) = 81.1%

Anlisis de varianza Fuente Regresin Error residual GL 3 21 SC 11.3437 2.2446 CM 3.7812 0.1069 F 35.38 P 0.000

b) Prueba total de regresin 1. Formulacin de las hiptesis: H0: 1 = 2 = 3 = 0. H1: No todas las i son 0. 2. Se establece un nivel de significancia = 5%. 3. Se utilizar la distribucin F. 4. Hay 3 grados de libertad en el numerador (variables independientes). Hay 21 grados de libertad en el denominador (25 observaciones (3 variables independientes + 1)). El valor crtico de F es 3.07.Distribucin F gl = 3, 23

Regin de rechazo = 0.05 3.07

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de F es menor o igual a 3.07. 5. El valor de F se calcula mediante la frmula:F SSR / k SSE /n (k 1)

donde SSR es la suma de cuadrados de regresin, SSE es la suma de los cuadrados del error, n es el nmero de observaciones y k es el nmero de variables independientes. Por lo tanto:

Anlisis de varianza Fuente Regresin Error residual GL 3 21 SC 11.3437 2.2446 CM 3.7812 0.1069 F 35.38 P 0.000

F

11.3437/ 3 = 35.37 2.2446 /25 (3 1)

Dado que el valor calculado 35.37 es mayor que el valor crtico 3.07, se rechaza la hiptesis nula de que los coeficientes de las variables independientes en la ecuacin de regresin mltiple son todas iguales a cero. Esto significa que al menos uno de los coeficientes de las variables independientes (Poblacin, Publicidad o Ingreso) es diferente de cero. c) Prueba de hiptesis de los coeficientes de regresin por separado. 1. Formulacin de las hiptesis Poblacin Publicidad Ingreso H0: 1 = 0 H0: 2 = 0 H0: 3 = 0 H1: 1 0 H1: 2 0 H1: 3 0 2. Todas las hiptesis se probarn con un nivel de significancia = 0.05. Es una prueba de dos colas. 3. El estadstico de prueba a utilizar es la distribucin t con n-(k+1) = 21 grados de libertad. 4. El valor crtico es t = 2.08.

-2.08

2.08

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de t se encuentra entre -2.08 y 2.08. 5. El valor de t para cada variable independiente se calcula mediante la frmula donde bi es el coeficiente de regresin correspondiente a la variable independiente, se incluye 0 en la ecuacin ya que la hiptesis nula es i = 0 y sbi es la desviacin estndar de la distribucin del coeficiente de regresin. La ecuacin de regresin es:La ecuacin de regresin es Suscriptores = - 5.73 + 0.00754 Poblacin + 0.0509 Publicidad + 1.10 Ingreso Predictor Constante Poblacin Publicidad Ingreso Coef -5.733 0.007537 0.05088 1.0974 SE Coef 8.427 0.001813 0.01414 0.2450 T -0.68 4.16 3.60 4.48 P 0.504 0.000 0.002 0.000

Calculando los valores para cada variable independiente:

Poblacin

Publicidad

Ingreso

Por lo tanto, al ser los valores de t para los coeficientes de correlacin mayores a 2.08, se rechaza las hiptesis de que los coeficientes sean cero. No se elimina ninguna de las variables independientes de la ecuacin de regresin. e) Grfica de Residuos contra Ajustes.vs. ajustes

(la respuesta es Suscriptores) 0.75 0.50 0.25

Residuo

0.00 -0.25 -0.50 37.0 37.5 38.0 38.5 39.0 Valor ajustado 39.5 40.0 40.5

Los residuos estn distribuidos uniformemente respecto del cero, se muestra una distribucin aleatoria de valores positivos y negativos de los residuos a lo largo de los valores ajustados, los puntos estn dispersos y no se observa un patrn obvio. Por lo tanto no hay razn para dudar de la suposicin de linealidad entre las variables. f) Histograma de varianzas residuales y grfica de probabilidad normal.

(la respuesta es Suscriptores) 6 5 4 3 2 1 0

Histograma

Frecuencia

-0.6

-0.4

-0.2

0.0 Residuo

0.2

0.4

0.6

Los residuos tienen una distribucin que se aproxima bastante a la normal.

Grfica de probabilidad normal(la respuesta es Suscriptores)99

95 90 80

Porcentaje

70 60 50 40 30 20 10 5

1

-0.8

-0.6

-0.4

-0.2

0.0 Residuo

0.2

0.4

0.6

0.8

Los residuos estn muy cerca de la recta trazada a todo lo largo de la recta, lo cual confirma que los residuos estn distribuidos de manera bastante cercana a la normal.

Ejercicio 21. a) Matriz de correlacin. Utilizando Minitab:Correlaciones: Salario, GPA, NegocioGPA Negocio Salario 0.902 0.911 GPA 0.851

Contenido de la celda: Correlacin de Pearson

Las correlaciones entre las variables independientes (GPA y Negocio) tienen valores mayores a 0.70, por lo que s puede haber multicolinealidad entre ellas.

b) Ecuacin de regresin Utilizando Minitab:Anlisis de regresin: Salario vs. GPA, NegocioLa ecuacin de regresin es Salario = 23.4 + 2.77 GPA + 1.31 Negocio Predictor Constante GPA Negocio Coef 23.447 2.775 1.3071 SE Coef 3.490 1.107 0.4660 T 6.72 2.51 2.80 P 0.000 0.028 0.016

El salario inicial se incrementa en $1,310.00 por haberse graduado de una facultad de administracin. Para un estudiante que se gradu de una facultad de administracin y tiene un GPA = 3 el salario es: Salario = 23.4 + (2.77)(3) + (1.31)(1) = $33,020.00 c) Valor de R2. Usando Minitab:Anlisis de varianza Fuente Regresin Error residual Total S = 0.472213 GL 2 12 14 SC 21.182 2.676 23.857 CM 10.591 0.223 F 47.50 P 0.000

R-cuad. = 88.8%

R-cuad.(ajustado) = 86.9%

R2 = (SSR)/(SS Total) = 21.182/23.857 = 0.8878 El valor de R2 es mucho mayor que cero. Esto indica una asociacin fuerte entre la variable dependiente y las variables independientes.

d) Para calcular la posibilidad de eliminar alguna de las variables independientes, haremos una prueba de hiptesis por separado a los coeficientes de la ecuacin de regresin.

1. Formulacin de las hiptesis GPA Negocio H0: 1 = 0 H0: 2 = 0 H1: 1 0 H1: 2 0 2. Todas las hiptesis se probarn con un nivel de significancia = 0.05. Es una prueba de dos colas. 3. El estadstico de prueba a utilizar es la distribucin t con n-(k+1) = 12 grados de libertad. 4. El valor crtico es t = 2.179.

-2.179

2.179

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de t se encuentra entre -2.179 y 2.179. 5. El valor de t para cada variable independiente se calcula mediante la frmula donde bi es el coeficiente de regresin correspondiente a la variable independiente, se incluye 0 en la ecuacin ya que la hiptesis nula es i = 0 y sbi es la desviacin estndar de la distribucin del coeficiente de regresin. La ecuacin de regresin es:La ecuacin de regresin es Salario = 23.4 + 2.77 GPA + 1.31 Negocio Predictor Constante GPA Negocio Coef 23.447 2.775 1.3071 SE Coef 3.490 1.107 0.4660 T 6.72 2.51 2.80 P 0.000 0.028 0.016

Calculando los valores para cada variable independiente:

GPA

Negocio

Por lo tanto, al ser los valores de t para las dos variables independientes mayores a 2.179 se rechaza la hiptesis de que los coeficientes sean cero. No se elimina ninguna de las variables independientes de la ecuacin de regresin.

Ejercicio 26. a) Ecuacin de regresin. Usando Minitab:Anlisis de regresin: Compensacin vs. Salida/hora, CostoLa ecuacin de regresin es Compensacin = - 2.43 + 1.08 Salida/hora + 0.878 Costo Predictor Constante Salida/hora Costo Coef -2.4311 1.0802 0.87752 SE Coef 0.4913 0.1233 0.07523 T -4.95 8.76 11.66 P 0.000 0.000 0.000

b) Prueba global de hiptesis. 1. Formulacin de las hiptesis: H0: 1 = 2 = 0. H1: No todas las i son 0. 2. Se establece un nivel de significancia = 5%. 3. Se utilizar la distribucin F. 4. Hay 2 grados de libertad en el numerador (variables independientes). Hay 20 grados de libertad en el denominador (23 observaciones (2 variables independientes + 1)). El valor crtico de F es 3.49.Distribucin F gl = 2, 20

Regin de rechazo = 0.05 3.49

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de F es menor o igual a 3.49. 5. El valor de F se calcula mediante la frmula:F SSR / k SSE /n (k 1)

donde SSR es la suma de cuadrados de regresin, SSE es la suma de los cuadrados del error, n es el nmero de observaciones y k es el nmero de variables independientes. Por lo tanto:S = 1.12209 R-cuad. = 87.2% R-cuad.(ajustado) = 86.0%

Anlisis de varianza Fuente Regresin Error residual Total GL 2 20 22 SC 172.322 25.182 197.504 CM 86.161 1.259 F 68.43 P 0.000

F

172.322 / 2 = 68.43 25.182 /23 (2 1)

Dado que el valor calculado 68.43 es mayor que el valor crtico 3.49, se rechaza la hiptesis nula de que los coeficientes de las variables independientes en la ecuacin de regresin mltiple son todas iguales a cero. Esto significa que al menos uno de los coeficientes de las variables independientes (Rendimiento por hora o Costo) es diferente de cero. El valor R2 se calcula de la siguiente manera:S = 1.12209 R-cuad. = 87.2% R-cuad.(ajustado) = 86.0%

R2 = (SSR)/(SS Total) = 172.322/197.504 = 0.8725 El valor de R2 es mucho mayor que cero. Esto indica una asociacin fuerte entre la variable dependiente y las variables independientes.

c) Prueba de hiptesis de los coeficientes de regresin por separado. 1. Formulacin de las hiptesis Rendimiento Costo H0: 1 = 0 H0: 2 = 0 H1: 1 0 H1: 2 0 2. Todas las hiptesis se probarn con un nivel de significancia = 0.05. Es una prueba de dos colas. 3. El estadstico de prueba a utilizar es la distribucin t con n-(k+1) = 20 grados de libertad. 4. El valor crtico es t = 2.086.

-2.086

2.086

Por lo tanto la regla de decisin es: no se rechaza la hiptesis nula si el valor calculado de t se encuentra entre -2.086 y 2.086. 5. El valor de t para cada variable independiente se calcula mediante la frmula donde bi es el coeficiente de regresin correspondiente a la variable independiente, se incluye 0 en la ecuacin ya que la hiptesis nula es i = 0 y sbi es la desviacin estndar de la distribucin del coeficiente de regresin.La ecuacin de regresin es Compensacin = - 2.43 + 1.08 Salida/hora + 0.878 Costo

Predictor Constante Salida/hora Costo

Coef -2.4311 1.0802 0.87752

SE Coef 0.4913 0.1233 0.07523

T -4.95 8.76 11.66

P 0.000 0.000 0.000

Calculando los valores para cada variable independiente: Rendimiento Costo

Por lo tanto, dado que los valores de t son mayores que 2.086 para los coeficientes de las variables Rendimiento y Costo, se rechaza la hiptesis nula de que sus coeficientes en la ecuacin de regresin son cero. No se elimina ninguna de las variables de la ecuacin de regresin.

d) Histograma de los residuos y grfica de residuos contra ajustes.Histograma

(la respuesta es Compensacin) 5

4

Frecuencia

3

2

1

0

-2

-1

0 Residuo

1

2

Se observa en la grfica que los residuos tienen una distribucin prcticamente de tipo normal.

(la respuesta es Compensacin) 2

Residuos vs. Ajustes

1

Residuo

0

-1

-2 -4 -2 0 2 4 6 Valor ajustado 8 10 12

Los residuos estn distribuidos uniformemente respecto del cero, se muestra una distribucin aleatoria de valores positivos y negativos de los residuos a lo largo de los valores ajustados, los puntos estn dispersos y no se observa un patrn obvio. Por lo tanto no hay razn para dudar de la suposicin de linealidad entre las variables. Se puede decir que la variacin en los residuos es prcticamente la misma para los valores ajustados pequeos que para los grandes. Esta variacin constante nos dice que se cumple la homoscedasticidad.

f) Matriz de correlacin Usando Minitab:Correlaciones: Salida/hora, Costo, CompensacinCosto Compensacin Salida/hora -0.696 0.072 Costo 0.619

Contenido de la celda: Correlacin de Pearson

Se considera que puede haber problemas de multicolinealidad si las correlaciones entre las variables independientes sobrepasan -0.7 o 0.7. En este caso la correlacin entre las variables independientes Salida/hora (Rendimiento) y Costo est ligeramente por debajo de los valores lmite, por lo que se puede decir que no hay problemas de colinealidad.

Ejercicios de pronsticos Caso 4-1 La Solar Alternative Company Preguntas 1. Identifique el modelo que Bob y Mary deberan utilizar como base de sus planes de negocio en 2003 y explique por qu seleccion este modelo. Para analizar la serie de tiempo, primero graficamos los datos a lo largo de los 24 meses:

Ventas50 45 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

En la grfica se detectan los siguientes componentes: - Una variabilidad creciente en la amplitud de los datos. - Una tendencia creciente en los datos. - Una ciclicidad caracterizada por aumentos y decrementos en los valores. - Una estacionalidad o patrn de cambio que se repite aproximadamente cada 12 meses. Con base en lo anterior, el modelo que se debe utilizar para modelar los datos y pronosticar con ms confianza es el resultante de usar el mtodo de Winters (suavizacin exponencial ajustada a la tendencia y a la variacin estacional), ya que es el que contempla los componentes de tendencia, ciclicidad y estacionalidad observados en los datos del problema. Adems, dada la variabilidad creciente en la amplitud de los datos, se deber utilizar el modelo multiplicativo. 2. Pronostique las ventas para 2003. Utilizando el mtodo de Winters en Minitab, y probando con varios valores de , y que redujeran lo ms posible el MSE se lleg a =0.1, =0.1 y =0.1 con los siguientes valores de error:

Grfica de mtodo Winters de VentasMtodo multiplicativoVariable Actual Ajustes Constantes de suavizacin Alfa (nivel) 0.01 Gamma (tendencia) 0.01 Delta (estacional) 0.01 Medidas de exactitud MAPE 12.8977 MAD 2.3423 MSD 8.3348

40

30

Ventas

20

10

0 2 4 6 8 10 12 14 ndice 16 18 20 22 24

A partir de estos valores se generaron los siguientes pronsticos para el 2003: Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Pronstico 18.1477 16.8148 25.4941 30.9187 41.6018 45.6053 58.8024 59.8035 48.6992 34.6662 34.6722 29.1403

La grfica de los datos pronosticados se ve as:

Grfica de mtodo Winters de VentasMtodo multiplicativo 70 60 50Variable Actual Ajustes Pronsticos IP de 95.0% Constantes de suavizacin Alfa (nivel) 0.1 Gamma (tendencia) 0.1 Delta (estacional) 0.1 Medidas de exactitud MAPE 13.5681 MAD 2.5494 MSD 10.5676

Ventas

40 30 20 10 0 4 8 12 16 20 ndice 24 28 32 36

Caso 4-2 Mr. Tux Preguntas 1. Resuma el nivel de error de pronstico del mejor mtodo de pronsticos que John encontr usando Minitab. Los datos originalmente presentan la siguiente distribucin:Grfica de series de tiempo de Ventas400000

300000

200000

100000

0 1 10 20 30 40 50 60 70 80 90

Haciendo el ejercicio como lo realiz John, usando el mtodo de Winters con un valor de 0.2 para , y , y una longitud estacional de 12, result lo siguiente:Grfica de mtodo Winters de VentasMtodo multiplicativo 600000 500000 400000Variable Actual Ajustes Constantes de suavizacin Alfa (nivel) 0.2 Gamma (tendencia) 0.2 Delta (estacional) 0.2 Medidas de exactitud MAPE 22 MAD 25825 MSD 2153386063

Ventas

300000 200000 100000 0 1 10 20 30 40 50 60 ndice 70 80 90

El error porcentual medio absoluto (MAPE) result de 22% que es un valor que se puede considerar muy alto en comparacin con el valor ideal deseado, que sera de cero. La desviacin media absoluta (MAD) result de 25825, un valor considerablemente grande respecto a los valores de los datos, y demasiado alto en comparacin con el valor ideal deseado, que sera de cero. El error cuadrtico medio (MSE), que generalmente se utiliza para optimizar los valores de , y buscando un MSE = 0, result de 2,153,386,063 que es un nmero tremendamente grande. Esto nos indica que los valores de , y no son los ptimos.

2. John us los valores que Minitab predetermin para , y . John cree que existen otras opciones para estos parmetros que implicaran mediciones del error ms pequeas. Est usted de acuerdo? Como se vio en la pregunta anterior, los valores de , y utilizados en el mtodo de Winters no fueron los ptimos, lo cual ocasion un MSE demasiado grande. Utilizando Minitab y escogiendo otros valores para , y intentando reducir el MSE se obtiene lo siguiente:Grfica de mtodo Winters de VentasMtodo multiplicativo 500000 400000Variable Actual Ajustes Constantes de suavizacin Alfa (nivel) 0.10 Gamma (tendencia) 0.10 Delta (estacional) 0.01 Medidas de exactitud MAPE 20 MAD 20828 MSD 1009122331

Ventas

300000 200000 100000

0 1 10 20 30 40 50 60 ndice 70 80 90

Como se observa en la figura, se modificaron los valores de , y , y aunque esos valores no son los ptimos, s se logr reducir los valores de los errores, por lo tanto s estoy de acuerdo en que hay otras opciones para los valores de , y que permiten reducir las mediciones de los errores. 3. An cuando se desilusion con los resultados iniciales, esto es lo mejor que puede hacer con mtodos de suavizacin. Qu puede hacer John, por ejemplo, para determinar qu tan adecuada es la tcnica de pronsticos de Winters? Lo que se puede hacer para saber qu tan adecuada es la tcnica de pronsticos de Winters, es analizar los residuos o diferencias entre el modelo y los valores reales buscando las siguientes caractersticas para asegurar que la tcnica es adecuada. - Que los errores MAPE, MAD y MSE sean lo ms pequeos posible. - Que los residuos tengan una distribucin lo ms prxima posible a la distribucin normal. - Que en la grfica de los ajustes contra los residuos, stos estn dispersos de manera uniforme a lo largo de la grfica, tanto por arriba como por debajo del cero. - Que en la grfica de probabilidad normal, los residuos estn muy cerca de la lnea a lo largo de toda la grfica. - Que en el correlograma mostrando la autocorrelacin de los residuos, todos stos se encuentren dentro del intervalo de confianza. 4. Si bien no se calcul directamente en Minitab, el MPE (error porcentual medio) mide el sesgo del pronstico. Cul es el valor ideal del MPE? Cul es la explicacin de un signo negativo en el MPE?

El valor ideal del MPE es cero, lo cual indicara que el modelo de pronstico se ajusta exactamente a los datos reales. Un signo negativo para el MPE estara mostrando que la suma de los residuos es negativa, y que los pronsticos, sumados, estn resultando mayores que los datos reales, sumados. En la grfica esto probablemente se vera como que la grfica del modelo de pronstico est con mucha frecuencia por arriba de la grfica de los datos reales.

Caso 4-4 Murphy Brothers Furniture Preguntas 1. Alguno de los modelos de pronsticos estudiados en este captulo funciona con los datos de las ventas nacionales? Viendo la grfica de los datos de ventas nacionales, se observa que tienen los siguientes componentes: - Tendencia creciente lineal. - Estacionalidad aproximadamente cada seis meses. Por lo tanto el modelo de pronsticos que funcionara con estos datos es el generado mediante el mtodo de Winters.

2. Alguno de los modelos de pronsticos estudiados en este captulo funciona con los datos reales de las ventas de Murphy Brothers? Graficando los datos de ventas de Murphy Brothers:Grfica de series de tiempo de Ventas6500

6000

5500

Ventas

5000

4500

4000 1 5 10 15 20 25 ndice 30 35 40 45

Se observa que los datos graficados tienen los siguientes componentes: - Tendencia creciente lineal. - Estacionalidad aproximadamente cada doce meses. Por lo tanto el modelo de pronsticos que funcionara con estos datos es el generado mediante el mtodo de Winters.

3. Cules datos y modelos de pronsticos deber usar Julie a fin de pronosticar las ventas para 1996? Deber usar los datos y modelos de pronsticos de ventas de Murphy Brothers, ya que es la que muestra el comportamiento en el tiempo que le interesa (su propia tienda). Adems al comparar los datos de su

tienda con los datos de ventas nacionales se observa que sus comportamientos no son iguales, por lo cual es mejor utilizar sus propios datos.

Caso 4-3 Consumer Credit Counseling Preguntas 1. Desarrolle un modelo informal para pronosticar el nmero de clientes nuevos que atender CCC por el resto de 1993. Los datos muestran el siguiente comportamiento:Grfica de series de tiempo de C2200 175 150

Clientes

125 100 75 50 1 10 20 30 40 50 ndice 60 70 80 90

Yt . Esta ecuacin permite Yt 1 considerar la tendencia de crecimiento a travs de la tasa de cambio de los datos (Yt respecto a Yt-1) para calcular el dato Yt+1. Para un modelo informal se utilizar la siguiente ecuacin: Yt 1 Yt

La grfica con los datos pronosticados contra los datos originales es:Grfica de series de tiempo de Yt, Ypronosticada300 250 200Variable Yt Ypronosticada

Los datos de errores son: MSD 2592.782 MAPE 0.336 MAD 39.127

Datos

150 100 50 0 1 10 20 30 40 50 60 ndice 70 80 90 100

2. Desarrolle un modelo de promedio mvil para pronosticar el nmero de clientes nuevos que atender CCC por el resto de 1993. Para generar un modelo de pronsticos usando promedios mviles, se calcul primero un promedio mvil de orden 3 no centrado en los datos, y a ese promedio mvil se le calcul el promedio mvil doble de orden 3 no centrado en los datos. El modelo resultante es:Grfica de series de tiempo de Yt, Ypronosticada250Variable Yt Ypronosticada

200

Los datos de errores son:150

Datos

100

MSD 1697.718 MAPE 0.280 MAD 33.204

50

0 1 10 20 30 40 50 60 ndice 70 80 90

Los datos que se muestran en la tabla son:Promedio mvil de orden 3 Promedio mvil doble de orden 3 Ypron = a+b

Yt

a

b

Yt - Ypron

(Yt - Ypron)^2

abs(Yt - Ypron)

abs(Yt - Ypron)/Yt

Yt - Ypron/Yt

182 136 99 77 75 63 87 73 83 82 74 75 102 121 128 128 112 122 104 108 97 139.00 104.00 83.67 71.67 75.00 74.33 81.00 79.33 79.67 77.00 83.67 99.33 117.00 125.67 122.67 120.67 112.67 111.33 108.89 86.44 76.78 73.67 76.78 78.22 80.00 78.67 80.11 86.67 100.00 114.00 121.78 123.00 118.67 34.444 63.556 71.889 88.333 81.889 81.111 74.000 88.667 118.556 147.333 151.333 131.333 119.556 102.333 104.000 -37.222 -11.444 -2.444 7.333 2.556 1.444 -3.000 5.000 19.222 30.333 25.667 8.667 -1.111 -10.333 -7.333 -2.778 52.111 69.444 95.667 84.444 82.556 71.000 93.667 137.778 177.667 177.000 140.000 118.444 92.000 75.778 30.889 12.556 -21.667 -9.444 19.444 50.000 34.333 -9.778 -65.667 -55.000 -36.000 -10.444 5.000 5742.272 954.123 157.642 469.444 89.198 378.086 2500.000 1178.778 95.605 4312.111 3025.000 1296.000 109.086 25.000 75.778 30.889 12.556 21.667 9.444 19.444 50.000 34.333 9.778 65.667 55.000 36.000 10.444 5.000 1.038 0.372 0.153 0.293 0.126 0.191 0.413 0.268 0.076 0.586 0.451 0.346 0.097 0.052 1.038 0.372 0.153 -0.293 -0.126 0.191 0.413 0.268 -0.076 -0.586 -0.451 -0.346 -0.097 0.052

141 97 87 145 103 113 150 100 131 96 92 88 118 102 98 101 153 138 107 100 115 78 106 94 93 103 104 150 102 151 100 100 98 97 120 98 135 141 67 127 146 175 110 153 117 121 121 131

103.00 115.33 111.67 108.33 109.67 111.67 120.33 122.00 121.00 127.00 109.00 106.33 92.00 99.33 102.67 106.00 100.33 117.33 130.67 132.67 115.00 107.33 97.67 99.67 92.67 97.67 96.67 100.00 119.00 118.67 134.33 117.67 117.00 99.33 98.33 105.00 105.00 117.67 124.67 114.33 111.67 113.33 149.33 143.67 146.00 126.67 130.33 119.67

114.89 109.00 109.89 110.00 111.78 109.89 109.89 113.89 118.00 121.11 123.33 119.00 114.11 102.44 99.22 98.00 102.67 103.00 107.89 116.11 126.89 126.11 118.33 106.67 101.56 96.67 96.67 95.67 98.11 105.22 112.56 124.00 123.56 123.00 111.33 104.89 100.89 102.78 109.22 115.78 118.89 116.89 113.11 124.78 135.44 146.33 138.78 134.33

91.111 121.667 113.444 106.667 107.556 113.444 130.778 130.111 124.000 132.889 94.667 93.667 69.889 96.222 106.111 114.000 98.000 131.667 153.444 149.222 103.111 88.556 77.000 92.667 83.778 98.667 96.667 104.333 139.889 132.111 156.111 111.333 110.444 75.667 85.333 105.111 109.111 132.556 140.111 112.889 104.444 109.778 185.556 162.556 156.556 107.000 121.889 105.000

-11.889 6.333 1.778 -1.667 -2.111 1.778 10.444 8.111 3.000 5.889 -14.333 -12.667 -22.111 -3.111 3.444 8.000 -2.333 14.333 22.778 16.556 -11.889 -18.778 -20.667 -7.000 -8.889 1.000 0.000 4.333 20.889 13.444 21.778 -6.333 -6.556 -23.667 -13.000 0.111 4.111 14.889 15.444 -1.444 -7.222 -3.556 36.222 18.889 10.556 -19.667 -8.444 -14.667

96.667 79.222 128.000 115.222 105.000 105.444 115.222 141.222 138.222 127.000 138.778 80.333 81.000 47.778 93.111 109.556 122.000 95.667 146.000 176.222 165.778 91.222 69.778 56.333 85.667 74.889 99.667 96.667 108.667 160.778 145.556 177.889 105.000 103.889 52.000 72.333 105.222 113.222 147.444 155.556 111.444 97.222 106.222 221.778 181.444 167.111 87.333 113.444

44.333 17.778 -41.000 29.778 -2.000 7.556 34.778 -41.222 -7.222 -31.000 -46.778 7.667 37.000 54.222 4.889 -8.556 31.000 42.333 -39.000 -76.222 -50.778 -13.222 36.222 37.667 7.333 28.111 4.333 53.333 -6.667 -9.778 -45.556 -77.889 -7.000 -6.889 68.000 25.667 29.778 27.778 -80.444 -28.556 34.556 77.778 3.778 -68.778 -64.444 -46.111 33.667 17.556

1965.444 316.049 1681.000 886.716 4.000 57.086 1209.494 1699.272 52.160 961.000 2188.160 58.778 1369.000 2940.049 23.901 73.198 961.000 1792.111 1521.000 5809.827 2578.383 174.827 1312.049 1418.778 53.778 790.235 18.778 2844.444 44.444 95.605 2075.309 6066.679 49.000 47.457 4624.000 658.778 886.716 771.605 6471.309 815.420 1194.086 6049.383 14.272 4730.383 4153.086 2126.235 1133.444 308.198

44.333 17.778 41.000 29.778 2.000 7.556 34.778 41.222 7.222 31.000 46.778 7.667 37.000 54.222 4.889 8.556 31.000 42.333 39.000 76.222 50.778 13.222 36.222 37.667 7.333 28.111 4.333 53.333 6.667 9.778 45.556 77.889 7.000 6.889 68.000 25.667 29.778 27.778 80.444 28.556 34.556 77.778 3.778 68.778 64.444 46.111 33.667 17.556

0.314 0.183 0.471 0.205 0.019 0.067 0.232 0.412 0.055 0.323 0.508 0.087 0.314 0.532 0.050 0.085 0.203 0.307 0.364 0.762 0.442 0.170 0.342 0.401 0.079 0.273 0.042 0.356 0.065 0.065 0.456 0.779 0.071 0.071 0.567 0.262 0.221 0.197 1.201 0.225 0.237 0.444 0.034 0.450 0.551 0.381 0.278 0.134

0.314 0.183 -0.471 0.205 -0.019 0.067 0.232 -0.412 -0.055 -0.323 -0.508 0.087 0.314 0.532 0.050 -0.085 0.203 0.307 -0.364 -0.762 -0.442 -0.170 0.342 0.401 0.079 0.273 0.042 0.356 -0.065 -0.065 -0.456 -0.779 -0.071 -0.071 0.567 0.262 0.221 0.197 -1.201 -0.225 0.237 0.444 0.034 -0.450 -0.551 -0.381 0.278 0.134

147 121 110 171 185 172 168 142 152 151 141 128 151 121 126 166 138 175 108 112 147 168 149 145 149 169 138 152 151 199

124.33 133.00 133.00 126.00 134.00 155.33 176.00 175.00 160.67 154.00 148.33 148.00 140.00 140.00 133.33 132.67 137.67 143.33 159.67 140.33 131.67 122.33 142.33 154.67 154.00 147.67 154.33 152.00 153.00 147.00

125.56 124.78 125.67 130.11 130.67 131.00 138.44 155.11 168.78 170.56 163.22 154.33 150.11 145.44 142.67 137.78 135.33 134.56 137.89 146.89 147.78 143.89 131.44 132.11 139.78 150.33 152.11 152.00 151.33 153.11

123.111 141.222 140.333 121.889 137.333 179.667 213.556 194.889 152.556 137.444 133.444 141.667 129.889 134.556 124.000 127.556 140.000 152.111 181.444 133.778 115.556 100.778 153.222 177.222 168.222 145.000 156.556 152.000 154.667 140.889

-1.222 8.222 7.333 -4.111 3.333 24.333 37.556 19.889 -8.111 -16.556 -14.889 -6.333 -10.111 -5.444 -9.333 -5.111 2.333 8.778 21.778 -6.556 -16.111 -21.556 10.889 22.556 14.222 -2.667 2.222 0.000 1.667 -6.111

90.333 121.889 149.444 147.667 117.778 140.667 204.000 251.111 214.778 144.444 120.889 118.556 135.333 119.778 129.111 114.667 122.444 142.333 160.889 203.222 127.222 99.444 79.222 164.111 199.778 182.444 142.333 158.778 152.000 156.333

56.667 -0.889 -39.444 23.333 67.222 31.333 -36.000 -109.111 -62.778 6.556 20.111 9.444 15.667 1.222 -3.111 51.333 15.556 32.667 -52.889 -91.222 19.778 68.556 69.778 -19.111 -50.778 -13.444 -4.333 -6.778 -1.000 42.667

3211.111 0.790 1555.864 544.444 4518.827 981.778 1296.000 11905.235 3941.049 42.975 404.457 89.198 245.444 1.494 9.679 2635.111 241.975 1067.111 2797.235 8321.494 391.160 4699.864 4868.938 365.235 2578.383 180.753 18.778 45.938 1.000 1820.444

56.667 0.889 39.444 23.333 67.222 31.333 36.000 109.111 62.778 6.556 20.111 9.444 15.667 1.222 3.111 51.333 15.556 32.667 52.889 91.222 19.778 68.556 69.778 19.111 50.778 13.444 4.333 6.778 1.000 42.667

0.385 0.007 0.359 0.136 0.363 0.182 0.214 0.768 0.413 0.043 0.143 0.074 0.104 0.010 0.025 0.309 0.113 0.187 0.490 0.814 0.135 0.408 0.468 0.132 0.341 0.080 0.031 0.045 0.007 0.214

0.385 -0.007 -0.359 0.136 0.363 0.182 -0.214 -0.768 -0.413 0.043 0.143 0.074 0.104 0.010 -0.025 0.309 0.113 0.187 -0.490 -0.814 0.135 0.408 0.468 -0.132 -0.341 -0.080 -0.031 -0.045 -0.007 0.214

3. Desarrolle un procedimiento de suavizacin exponencial para pronosticar el nmero de clientes nuevos que atender CCC por el resto de 1993. El modelo mediante un procedimiento de suavizacin exponencial simple con alfa (constante para la tendencia) ptimo result en lo siguiente:

Grfica de suavizacin para YtMtodo exponencial simple 200 175 150Variable Actual Ajustes Constante de suavizacin Alfa 0.241142 Medidas de exactitud MAPE 16.931 MAD 19.845 MSD 615.660

Yt

125 100 75 50 1 10 20 30 40 50 60 ndice 70 80 90

El modelo mediante un procedimiento de suavizacin exponencial doble con valores ptimos para alfa (constante del nivel) y gamma (constante de la tendencia) ptimo result en lo siguiente:

Grfica de suavizacin para YtMtodo exponencial doble 225 200 175 150Variable Actual Ajustes Constantes de suavizacin Alfa (nivel) 0.696982 Gamma (tendencia) 0.027443 Medidas de exactitud MAPE 17.588 MAD 20.820 MSD 690.516

Yt125 100 75 50 1 10 20 30 40 50 60 ndice 70 80 90

El modelo mediante un procedimiento de suavizacin exponencial doble con valores de 0.2 para alfa (constante del nivel), beta (constante de la tendencia) y gamma (constante de la estacionalidad), as como una estacionalidad de 12 result en lo siguiente:Grfica de mtodo Winters de YtMtodo multiplicativo 200 175 150Variable Actual Ajustes Constantes de suavizacin Alfa (nivel) 0.2 Gamma (tendencia) 0.2 Delta (estacional) 0.2 Medidas de exactitud MAPE 16.738 MAD 19.285 MSD 545.414

Yt

125 100 75 50 1 10 20 30 40 50 60 ndice 70 80 90

4. Evale estos mtodos de pronsticos usando las medidas de resumen de errores de pronsticos presentadas en el captulo 3. MAPE: Error Porcentual Absoluto Medio MAD: Desviacin Absoluta Media MSE: Error Cuadrtico Medio Mtodo Informal Promedios mviles Suavizacin exponencial Suavizacin exponencial ajustada a la tendencia (Mtodo de Holt). =0.241142 Suavizacin exponencial ajustada a la tendencia y a la variacin estacional (Mtodo de Winters). =0.2, =0.2, =0.2, estacionalidad = 12. MAPE 2592.782 1697.718 16.931 17.588 16.738 MAD 0.336 0.280 19.845 20.820 19.285 MSE 39.127 33.204 615.66 690.516 545.414

El mejor mtodo sera aqul que combine los menores valores posibles en las tres medidas de resumen de errores. Analizando los resultados obtenidos, se descartan como aceptables los mtodos informal y de promedios mviles utilizados ya que tienen un MAPE considerablemente grande. De los mtodos restantes, el mtodo de Winters es la mejor opcin por tener valores menores en los errores que en los mtodos de Holts y de suavizacin exponencial.

5. Seleccione el mejor modelo y pronostique los nuevos clientes para el resto de 1993. Se seleccion como mejor mtodo el de Winters. El pronstico para el resto de 1993 es: Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 153.003 148.214 157.737 152.853 152.021 143.995 166.761 155.735 134.113

La grfica con los pronsticos es:Grfica de mtodo Winters de YtMtodo multiplicativo 225 200 175 150Variable A ctual A justes Pronsticos IP de 95.0% C onstantes de suav izacin A lfa (niv el) 0.2 Gamma (tendencia) 0.2 Delta (estacional) 0.2 Medidas de exactitud MA PE 16.738 MA D 19.285 MSD 545.414

Yt

125 100 75 50 1 11 22 33 44 55 66 ndice 77 88 99

6. Determine la idoneidad del modelo de pronstico que usted seleccion. Para determinar la idoneidad del modelo (si es conveniente o no utilizarlo) se har un anlisis de los residuos entre el modelo de pronsticos y los datos reales. Funcin de autocorrelacin de los residuos:

(con lmites de significancia de 5% para las autocorrelaciones) 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 2 4 6 8 10 12 14 Desfase 16 18 20 22 24

Funcin de autocorrelacin para RESID1

Al analizar la grfica se observa solamente al inicio parece haber un residuo significante y por el resto del modelo los residuos se mantienen dentro de los lmites de significancia. Haciendo una prueba de Ljung-Box con la correlacin entre los residuos, con un retraso de 25 entre los residuos, se obtiene un valor de Q = 33.75, el cual, al compararlo con el valor 37.652 correspondiente a la distribucin Chi-cuadrada con 25 grados de libertad y un nivel de significancia de 95%, al ser menor el valor de Q nos indica que hay suficiente confianza para decir que el modelo de pronsticos es adecuado. Histograma de los residuos:Histograma

Autocorrelacin

(la respuesta es Yt) 18 16 14 12

Frecuencia

10 8 6 4 2 0 -40 -20 0 Residuo 20 40 60

Grfica de probabilidad normal:Grfica de probabilidad normal(la respuesta es Yt)99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1

Porcentaje

-80

-60

-40

-20

0 Residuo

20

40

60

80

Grfica de distribucin de los residuos:vs. ajustes

(la respuesta es Yt) 50

25

Residuo

0

-25

-50 50 75 100 125 Valor ajustado 150 175 200

Del anlisis del histograma de residuos se puede ver que los residuos tienen una distribucin casi normal. Adems la grfica de probabilidad normal muestra que los residuos no estn demasiado alejados de la recta, y la grfica de distribucin de los residuos contra los ajustes muestra que los datos estn distribuidos de manera aleatoria en todos los niveles de los valores ajustados y tanto arriba como abajo del nivel cero. Parece razonable suponer que los residuos tienen una distribucin normal, lo cual nos indica que el modelo de pronsticos es aceptable.