Metodos Series Tiempo

51
Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007 METODOLOGÍA DE ANÁLISIS CON SERIES DE TIEMPO Página 1

description

Series temporales

Transcript of Metodos Series Tiempo

Page 1: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

METODOLOGÍA DE ANÁLISISCON SERIES DE TIEMPO

Elaboró: Primitivo Reyes AguilarMarzo 2007

Página 1

Page 2: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

METODOLOGÍA DE SERIES DE TIEMPO

1. INTRODUCCIÓN

Los métodos de análisis de series de tiempo consideran el hecho que los datos tomados en diversos periodos de tiempo pueden tener algunas características de autocorrelación, tendencia o estacionalidad que se debe tomar en cuenta.

Definición de serie de tiempo: Es una secuencia ordenada de valores de una variable en intervalos de tiempo periódicos y consecutivos.

Aplicación: la aplicación de estos métodos tiene dos propósitos: comprender las fuerzas de influencia en los datos y descubrir la estructura que produjo los datos observados. Ajustar el modelo y proceder a realizar pronósticos, monitoreo, retroalimentación y control en avance.

Las aplicaciones incluyen pronósticos económicos, análisis de presupuesto, análisis del mercado, etc.

2. TENDENCIA Y ESTACIONALIDAD

Un supuesto en muchas técnicas de series de tiempo es que los datos son estacionarios, donde su media, variancia y autocorrelación no cambia en el tiempo, tampoco se presentan patrones de estacionalidad, sin embargo en la práctica si se presentan estos patrones de tendencia y de estacionalidad y es necesario contar con modelos que las consideren.

Tendencias: Si los datos muestran una tendencia, se pueden ajustar los datos con algún tipo de curva o recta y modelar los residuales. Como el propósito del ajuste es simplemente remover la tendencia a largo plazo, una línea recta es suficiente.

Por ejemplo:

Página 2

Page 3: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Removiendo la tendencia a largo plazo, los residuales quedan como sigue:

Estacionalidad: son fluctuaciones periódicas, por ejemplo cuando hay picos de ventas en la navidad y después declinan. La serie de tiempo de ventas mostrarán un incremento durante septiembre a diciembre y una declinación durante enero y febrero.

Para detectar la estacionalidad se pueden utilizar diferentes métodos gráficos donde se observe la estacionalidad en el tiempo:

1. Gráfica de valores contra el tiempo

Página 3

Page 4: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

2. Diagramas de caja múltiples

Página 4

Page 5: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

3. Gráfica de estacionalidad por subserie

Comportamiento anual y subserie mostrando la estacionalidad

En la gráfica anterior se observa un comportamiento mensual, con un máximo en Junio y un mínimo en Septiembre.

3. INDICADORES DE MODELOS DE SERIES DE TIEMPO

Estos indicadores sirven para comparar la efectividad de diferentes modelos utilizados. Siempre se busca el valor menor en los indicadores MAPE, MAD y MSD ya que representa un mejor ajuste del modelo.

MAPE: Porcentaje promedio absoluto de error, mide la exactitud de los valores estimados de la serie de tiempo. La exactitud se expresa como un porcentaje con

igual al valor observado, es el valor estimado y n el número de observaciones.

Página 5

Page 6: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

MAD: Desviación media absoluta, mide la exactitud de los valores estimados de la serie de tiempo. Expresa la exactitud en las mismas unidades de los datos.

MSD: Desviación cuadrática media, es más sensible a errores anormales de pronóstico que el MAD.

4. MÉTODOS DE PRONÓSTICO

Los métodos de series de tiempo incluyen métodos de pronóstico y de suavizamiento simples, métodos de análisis de correlación y métodos de Box Jenkins ARIMA.

Métodos de pronóstico y suavizamiento simple: se basan en la idea de que hay patrones visibles en una gráfica de series de tiempo que pueden ser extrapolados al futuro. El método se selecciona dependiendo de si los patrones son estáticos (constantes en el tiempo) o dinámicos (cambian en el tiempo), la naturaleza de los componentes de tendencia y estacionalidad y que tan lejos se quiera pronosticar, son métodos generalmente fáciles y rápidos de aplicar.

Métodos de pronóstico ARIMA (Autoregressive Integrated Moving Average): también usan patrones de datos, sin embargo puede que no sean fácilmente visibles en la serie de tiempo. El modelo usa funciones de diferencias, autocorrelación y autocorrelación parcial para ayudar a identificar un modelo aceptable. El modelo ARIMA representa una serie de pasos de filtraje hasta que solo queda ruido aleatorio. Es un proceso iterativo que consume tiempo de ejecución.

4.1 MÉTODOS DE PRONÓSTICO Y SUAVIZAMIENTO SIMPLE:

Página 6

Page 7: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Modelan componentes en una serie que normalmente son fáciles de ver en una serie de tiempo.

Este método descompone los datos en sus partes componentes y los extiende al futuro para pronosticar. Se pueden seleccionar los métodos siguientes:

1. Métodos estáticos de análisis de tendencias y descomposición para patrones que no cambian con el tiempo.

2. Métodos dinámicos de promedio móvil; métodos de suavizamiento exponencial simple y doble y método de Winters. Para patrones que cambian en el tiempo y sus estimados son determinados por los valores más cercanos.

Se pueden usar los dos métodos combinados, es decir se puede utilizar un método para modelar un componente y otro para modelar otros componentes, por ejemplo:

Ajustar una tendencia por medio de un análisis de tendencias estático y dinámicamente modelar el componente estacional en los residuos usar el método de Winters.

Ajustar un modelo estático de estacionalidad por medio de la descomposición y dinámicamente modelar los componentes de la tendencia en los residuos usando un modelo de suavizamiento exponencial doble.

Ajustar con modelos de tendencia y descomposición al mismo tiempo.

Una desventaja de combinar métodos es que los intervalos de confianza de los pronósticos no son válidos.

A continuación se presenta un ejemplo de cada método.

4.2 Método de análisis de tendencias

Ajusta un modelo general de tendencias a datos de series de tiempo, se puede seleccionar un modelo lineal, cuadrático, exponencial (crecimiento o declinación) y de curva – S (para tecnología).

Usar este modelo si no hay componente estacional en el patrón de serie de tiempo.

Tiene una amplitud de pronóstico amplia siguiendo la línea de tendencia.

Página 7

Page 8: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Página 8

Page 9: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Las fórmulas se muestran a continuación:

MODELOS DE TENDENCIA

Lineal

1 representa el cambio promedio de un periodo a otro.

Cuadrático

Toma en cuenta la curvatura simple en los datos.

Crecimiento exponencial

Toma en cuenta el crecimiento o decaimiento exponencial. Por ejemplo el comportamiento de una cuenta de ahorros.

Curva S de Pearl-Reed. Toma en cuenta las observaciones que se ajustan a una curva con forma de S.

Por ejemplo:

Se colectan datos de empleo en un sector de negocios durante 60 meses y se desea predecir la tasa de empleo para los siguientes 12 meses, EMPLOY.MTW.

Trade Food Metals Trade Food Metals322 53.5 44.2 351 63.6 44.5317 53 44.3 354 68.8 45319 53.2 44.4 355 68.9 44.8323 52.5 43.4 357 60.1 44.9327 53.4 42.8 362 55.6 45.2328 56.5 44.3 368 53.9 45.2325 65.3 44.4 348 53.3 45326 70.7 44.8 345 53.1 45.5330 66.9 44.4 349 53.5 46.2334 58.2 43.1 355 53.5 46.8337 55.3 42.6 362 53.9 47.5341 53.4 42.4 367 57.1 48.3322 52.1 42.2 366 64.7 48.3318 51.5 41.8 370 69.4 49.1320 51.5 40.1 371 70.3 48.9326 52.4 42 375 62.6 49.4332 53.3 42.4 380 57.9 50

Página 9

Page 10: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

334 55.5 43.1 385 55.8 50335 64.2 42.4 361 54.8 49.6336 69.6 43.1 354 54.2 49.9335 69.3 43.2 357 54.6 49.6338 58.5 42.8 367 54.3 50.7342 55.3 43 376 54.8 50.7348 53.6 42.8 381 58.1 50.9330 52.3 42.5 381 68.1 50.5326 51.5 42.6 383 73.3 51.2329 51.7 42.3 384 75.5 50.7337 51.5 42.9 387 66.4 50.3345 52.2 43.6 392 60.5 49.2350 57.1 44.7 396 57.7 48.1

Las instrucciones de Minitab son las siguientes:

1 Open Worksheet EMPLOY.MTW.2 Ejecutar Stat > Time Series > Trend Analysis.3 En Variable, poner Trade.4 En Model Type, seleccionar Linear5 Seleccionar Generate forecasts y poner 12 en Number of forecasts.6 Seleccionar Storage .7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en cada diálogo.

Index

Trad

e

70635649423528211471

400390380370360350340330320310

Accuracy MeasuresMAPE 1.8999MAD 6.6177MSD 67.4325

Variable

Forecasts

ActualFits

Trend Analysis Plot for TradeLinear Trend Model

Yt = 313.989 + 1.16485*t

Como hay un patrón curvilíneo de los datos, se usa un análisis de tendencias con un modelo cuadrático.

Como también hay un componente estacional se guardan los valores estimados y los residuos para realizar una descomposición de los residuos posteriormente.

Página 10

Page 11: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

1 Open Worksheet EMPLOY.MTW.2 Ejecutar Stat > Time Series > Trend Analysis.3 En Variable, poner Trade.4 En Model Type, seleccionar Quadratic.5 Seleccionar Generate forecasts y poner 12 en Number of forecasts.6 Seleccionar Storage .7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en cada diálogo.

Index

Trad

e

70635649423528211471

410400390380370360350340330320

Accuracy MeasuresMAPE 1.7076MAD 5.9566MSD 59.1305

Variable

Forecasts

ActualFits

Trend Analysis Plot for TradeQuadratic Trend Model

Yt = 320.762 + 0.509373*t + 0.0107456*t**2

Trend Analysis for TradeData TradeLength 60NMissing 0Fitted Trend EquationYt = 320.762 + 0.509373*t + 0.0107456*t**2

Accuracy MeasuresMAPE 1.7076MAD 5.9566MSD 59.1305ForecastsPeriod Forecast61 391.81862 393.64963 395.50264 397.37665 399.27166 401.18867 403.12768 405.08769 407.06870 409.07171 411.09672 413.142

Página 11

Page 12: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Interpretación de los resultados

La gráfica de tendencia muestra los datos originales, los datos ajustados y los pronósticos. También se muestran la ecuación de regresión y los indicadores MAPE, MAD y MSD que ayudan a determinar la exactitud del ajuste.

La tendencia de la tasa de empleo es ascendente con un componente de estacionalidad evidente. El modelo de tendencia parece ajustar bien a la tendencia general, no así al patrón de estacionalidad que puede ser analizado con el modelo de descomposición de los residuos.

4.3 Método de Descomposición

Se usa para pronosticar cuando hay un componente de estacionalidad en la serie de tiempo o si se quiere analizar la naturaleza de los componentes. Separa las series de tiempo en componentes de tendencia lineal y estacionalidad así como el error. Se puede usar componente de estacionalidad en modo aditivo o multiplicativo con la tendencia.

Tiene una amplitud de pronóstico amplia siguiendo la tendencia con el patrón de estacionalidad.

Modelos de descomposición

Multiplicativo

Yt es la observación en el tiempo t.

Aditivo

Página 12

Page 13: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Modelo de ajuste: La descomposición tiene dos pasos:

1. Estimar los índices de estacionalidad usando el método de promedios móviles.

2. Ajustar la serie en estacionalidad.3. Estimar la tendencia en la serie ajustada por regresión.

Modelos de pronóstico:

La descomposición calcula el pronóstico como la línea de regresión multiplicada por (método multiplicativo) o agregado a (método aditivo) los índices de estacionalidad.

Por ejemplo:

Se desea predecir la tasa de empleo para los siguientes 12 meses en base a datos colectados durante los últimos 60 meses. Como los datos tienen una tendencia que se ajusta bien con un modelo de tendencia cuadrática y tiene un componente estacional se utilizan los residuos del ejemplo del análisis de tendencias para combinar el análisis de tendencias y descomposición para pronosticar.

Las intrucciones de Minitab son las siguientes:

1 Correr el ejemplo de Análisis de Tendencias2 Stat > Time Series > Decomposition.3 En Variable, indicar la columna de los residuos obtenidos en el análisis de tendencias (donde fueron almacenados).4 En Seasonal length, poner 12.5 EnModel Type, seleccionar Additive. En Model Components, seleccionar Seasonal only.6 Seleccionar Generate forecasts y poner 12 en Number of forecasts.7 Seleccionar Storage . Seleccionar Forecasts y Fits.8 Seleccionar OK en cada cuadro de diálogo

Time Series Decomposition for RESI1

Additive ModelData RESI1Length 60NMissing 0

Accuracy MeasuresMAPE 881.582MAD 2.802MSD 11.899

Seasonal IndicesPeriod Index1 -8.48262 -13.33683 -11.4410

Página 13

Page 14: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

4 -5.81605 0.55906 3.55907 1.76748 3.47579 3.267410 5.392411 8.496512 12.5590

ForecastsPeriod Forecast61 -8.482662 -13.336863 -11.441064 -5.816065 0.559066 3.559067 1.767468 3.475769 3.267470 5.392471 8.496572 12.5590

Index

RESI

1

70635649423528211471

20

10

0

-10

-20

Accuracy MeasuresMAPE 881.582MAD 2.802MSD 11.899

Variable

TrendForecasts

ActualFits

Time Series Decomposition Plot for RESI1Additive Model

En esta gráfica se muestran los residuos sin tendencia cuyo ajuste es adecuado, excepto que al inicio del periodo anual los valores son subestimados y al final del periodo anual los valores son sobreestimados, también es evidente en la gráfica de abajo donde los residuos son mayores al principio y menores al final de la serie.

Página 14

Page 15: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

121110987654321

10

0

-10

121110987654321

12

8

4

0

121110987654321

10

0

-10

-20

121110987654321

10

5

0

-5

Seasonal Analysis for RESI1Additive Model

Seasonal Indices

Percent Variation, by Seasonal Period

Original Data, by Seasonal Period

Residuals, by Seasonal Period

Index

Data

60544842363024181261

100

-10-20

Index

Seas

. Adj

. Dat

a

60544842363024181261

100

-10-20

Component Analysis for RESI1Additive Model

Original Data

Seasonally Adjusted Data

Interpretación de los resultados

La descomposición genera tres tipos de gráficas:

1. Una gráfica de serie de tiempo mostrando los datos originales con la línea de tendencia ajustada, valores estimados y pronósticos

2. Un análisis de componentes con gráficas separadas para la serie, datos sin tendencia, datos ajustados con estacionalidad y los datos ajustados estacionalmente y sin tendencias (los residuos).

3. Un análisis estacional, mostrando los índices estacionales y la variación porcentual dentro de cada estación respecto a la suma de la variación por estación y gráficas de caja de los residuos por periodo estacional.

Página 15

Page 16: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

4.4 Promedio móvil

Suaviza los datos al promediar observaciones consecutivas en la serie de tiempo. Este método es adecuado cuando no hay componente de tendencia ni estacionalidad, sin embargo hay alternativas si se presentan estos patrones.

Tiene una amplitud de pronóstico corta siguiendo una línea paralela.

MÉTODOS

Promedio móvil:

Se calcula el promedio móvil de la serie. Por ejemplo si se tienen los números 4, 5, 8, 9, 10 y se usa un promedio móvil de 3. Los primeros dos valores no existen. El tercer valor es el promedio de 4, 5, y 8; el cuarto valor es el promedio de 5, 8, y 9; el quinto valor es el promedio de 8, 9, y10.

Ejemplo:

Se desea predecir el empleo durante los próximos 6 meses en el segmento de metales con los datos de los últimos 60 meses. Se usa el método de promedio móvil si no se tienen patrones bien definidos de tendencia o estacionalidad en los datos.

1    File > Open worksheet EMPLOY.MTW.2    Seleccionar Stat > Time Series > Moving Average.3    En Variable, seleccionar Metals. En MA length, poner 3. 4    Seleccionar Center the moving averages. 5    Seleccionar Generate forecasts, y poner 6 en Number of forecasts. Click OK.

Los resultados obtenidos se muestran a continuación:

Página 16

Page 17: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Moving Average for Metals

Data MetalsLength 60NMissing 0

Moving Average

Length 3

Accuracy Measures

MAPE 1.55036MAD 0.70292MSD 0.76433

Forecasts

Period Forecast Lower Upper61 49.2 47.4865 50.913562 49.2 47.4865 50.913563 49.2 47.4865 50.913564 49.2 47.4865 50.913565 49.2 47.4865 50.913566 49.2 47.4865 50.9135

Index

Met

als

635649423528211471

52

50

48

46

44

42

40

Moving AverageLength 3

Accuracy MeasuresMAPE 1.55036MAD 0.70292MSD 0.76433

Variable

Forecasts95.0% PI

ActualFits

Moving Average Plot for Metals

Página 17

Page 18: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Interpretación de resultados

Se obtiene la gráfica de serie de tiempo mostrando los valores observados y estimados (un periodo adelante), además de los seis pronósticos. Note que el patrón de datos estimados va detrás del patrón de datos.

MÉTODOS DE SUAVIZACIÓN EXPONENCIAL

Los métodos de suavizamiento exponencial han sido utilizados con éxito a través de los años en muchos problemas de pronóstico. Fueron sugeridos en 1957 por C.C. Holt para su aplicación en series de tiempo sin tendencia ni estacionalidad. Posteriormente el mismo ofreció un procedimiento que manejara tendencias. Después Winters en 1965 generalizó el método para incluir estacionalidad, de ahí el nombre de “Método de Holt Winters”.

4.5 Suavizamiento exponencial simple (Holt)

Se aplica cuando solo si se tiene un comportamiento de la serie de tiempo sin tendencia o estacionalidad.

Suaviza los datos por medio de la fórmula de pronóstico de ARIMA de un paso adelante ARIMA (0,1,1). Este modelo trabaja mejor sin uno de los componentes de tendencia o estacionalidad. El componente simple dinámico en un modelo de promedio móvil es el nivel.

Tiene una amplitud de pronóstico corta siguiendo una línea paralela.

Página 18

Page 19: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

MÉTODO DE SUAVIZAMIENTO EXPONENCIAL SIMPLE

Los valores suavizados (estimados) se obtienen ya sea con un peso óptimo generado o con un peso específico manual.

Peso óptimo de ARIMA:

1. Se ajustan los datos con un modelo ARIMA(0,1,1) y se guardan los Y estimados.

2. Los valores suavizados son los valores Y estimados por ARIMA, pero desplazados en una unidad de tiempo.

3. El valor inicial (en tiempo uno) por atraso es:

Valor inicial suavizado = [Valor suavizado del periodo 2 - (dato en periodo 1)] / (1-)Donde (1-) estima el parámetro MA.

Peso especificado

1. Se usa el promedio de los primeros seis (o N si N<6) observaciones para el valor inicial suavizado (en tiempo uno).

2. Los valores suavizados subsecuentes se calculan de la fórmula:

Valor suavizado en tiempo t = (dato en periodo t)] + (1-) (valor suavizado en periodo t-1)Donde es el peso.

Pronósticos: el valor estimado en el periodo t, es el valor suavizado en el periodo t – 1. Los pronósticos son los valores estimados en el origen de pronóstico

Por ejemplo:

Se desea predecir el empleo durante los próximos 6 meses en el segmento de metales con los datos de los últimos 60 meses. Se usa el método de promedio móvil si no se tienen patrones bien definidos de tendencia o estacionalidad en los datos.

1    File > Open worksheet EMPLOY.MTW.2    Seleccionar Stat > Time Series > Single Exp Smoothing.3    En Variable, poner Metals.4    Seleccionar Generate forecasts, y 6 en Number of forecasts. Click OK.

Los resultados se muestran a continuación:

Página 19

Page 20: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Single Exponential Smoothing for Metals Data MetalsLength 60Smoothing ConstantAlpha 1.04170

Accuracy MeasuresMAPE 1.11648MAD 0.50427MSD 0.42956

ForecastsPeriod Forecast Lower Upper61 48.0560 46.8206 49.291462 48.0560 46.8206 49.291463 48.0560 46.8206 49.291464 48.0560 46.8206 49.291465 48.0560 46.8206 49.291466 48.0560 46.8206 49.2914

Index

Met

als

635649423528211471

52

50

48

46

44

42

40

Smoothing ConstantAlpha 1.04170

Accuracy MeasuresMAPE 1.11648MAD 0.50427MSD 0.42956

Variable

Forecasts95.0% PI

ActualFits

Single Exponential Smoothing Plot for Metals

Interpretación de resultados

Se obtiene la gráfica de serie de tiempo mostrando los valores observados y estimados (un periodo adelante), además de los seis pronósticos. Note que el patrón de datos estimados va detrás del patrón de datos.

Se indica la constante de suavizamiento (peso) utilizada y las medidas MAPE, MAD y MSD de 1.12, 0.70 y 0.76 con un mejor ajuste que en el método de promedio móvil con valores 1.55, 0.70 y 0.76 respectivamente.

4.6 Suavizamiento exponencial doble (Holt)

Se aplica cuando en la serie de tiempo se presenta una tendencia ascendente o descendente pero sin estacionalidad.

Página 20

Page 21: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

A continuación se muestra una tendencia:

Suaviza los datos por medio de la fórmula de pronóstico de ARIMA de un paso adelante ARIMA (0,2,2). Este modelo trabaja bien cuando está presente el componente de tendencia pero también sirve como un método de suavizamiento general. El método de suavizamiento exponencial doble calcula estimados dinámicos para dos componentes: nivel y tendencia.

Tiene una amplitud de pronóstico corta siguiendo una línea de tendencia con pendiente igual a la de la última tendencia estimada.

Página 21

Page 22: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

MÉTODO DE SUAVIZAMIENTO EXPONENCIAL DOBLE

El suavizamiento exponencial doble emplea un componente de nivel y un componente de tendencia en cada uno de los periodos. Usa dos pesos, o parámetros de suavización, actualiza los componentes cada periodo. Las ecuaciones son:

Los valores iniciales en tiempo cero con la observación 1 se estiman por los métodos siguientes:

Pesos óptimos de ARIMA:

1. Se ajustan los datos con un modelo ARIMA(0,2,2) y se guardan los Y estimados, minimizando los cuadrados de los errores.

2. Los valores iniciales (en tiempo uno) se inicializan por atraso.

Pesos especificados

1. Se hace una regresión lineal en los datos de la serie (Y) contra el tiempo (X).

2. La constante de esta regresión es el valor inicial estimado del componente de nivel, el coeficiente de la pendiente es el estimado inicial del componente de tendencia.

Pronósticos: el método de suavizamiento exponencial doble usa los componentes de nivel y de tendencia para generar los pronósticos. El pronóstico para m periodos delante de un punto en el tiempo t es:

Lt + mTt

Donde Lt es el nivel y Tt es la tendencia en el tiempo t.

Página 22

Page 23: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Por ejemplo:

1    File > Open worksheet EMPLOY.MTW.2    Seleccionar Stat > Time Series > Double Exp Smoothing.3    En Variable, poner Metals.4    Seleccionar Generate forecasts, y 6 en Number of forecasts. Click OK.

Los resultados se muestran a continuación: Double Exponential Smoothing for Metals Data MetalsLength 60

Smoothing ConstantsAlpha (level) 1.03840Gamma (trend) 0.02997

Accuracy MeasuresMAPE 1.19684MAD 0.54058MSD 0.46794

ForecastsPeriod Forecast Lower Upper61 48.0961 46.7718 49.420562 48.1357 46.0600 50.211363 48.1752 45.3135 51.036864 48.2147 44.5546 51.874765 48.2542 43.7899 52.718466 48.2937 43.0221 53.5652

Index

Met

als

635649423528211471

54

52

50

48

46

44

42

40

Smoothing ConstantsAlpha (level) 1.03840Gamma (trend) 0.02997

Accuracy MeasuresMAPE 1.19684MAD 0.54058MSD 0.46794

Variable

Forecasts95.0% PI

ActualFits

Double Exponential Smoothing Plot for Metals

Interpretación de resultados

Se obtiene la gráfica de serie de tiempo mostrando los valores observados y estimados (un periodo adelante), además de los seis pronósticos. Note que el patrón de datos estimados va detrás del patrón de datos.

Página 23

Page 24: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Se indican las constantes de suavizamiento y de tendencia (pesos) utilizadas, y las medidas MAPE, MAD y MSD de 1.19684, 0.54058, y 0.46794 para suavizamiento exponencial doble comparados con con un ligero mejor ajuste que en el método de suavizamiento exponencial simple cuyos valores fueron 1.12, 0.70 y 0.76 respectivamente.

4.7 Método de Winters

Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y estacionalidad.

Suaviza los datos por el método exponencial de Holt – Winters. Se recomienda este método cuando se tienen presentes los componentes de tendencia y estacionalidad ya sea en forma aditiva o multiplicativa.

El efecto multiplicativo se presenta cuando el patrón estacional en los datos depende del tamaño de los datos o sea cuando la magnitud del patrón estacional se incrementa conforme los valores aumentan y decrece cuando los valores de los datos disminuyen.

El efecto aditivo es mejor cuando el patrón estacional en los datos no depende del valor de los datos, o sea que el patrón estacional no cambia conforme la serie se incrementa o disminuye de valor.

El método de Winters calcula los estimados de de tres componentes: nivel, tendencia y estacionalidad. Calcula estimados dinámicos con ecuaciones para los tres componentes: nivel, tendencia y estacionalidad. Estas ecuaciones dan una mayor ponderación a observaciones recientes y menos peso a observaciones pasadas, las ponderaciones decrecen geométricamente a una tasa constante.

La ponderación seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si se quiere hacer una correspondencia con el modelo ARIMA u otros valores entre 0 y 1 para reducir los errores de estimación.

Tiene una amplitud de pronóstico de corta a media siguiendo una tendencia con un patrón estacional.

Página 24

Page 25: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

A continuación se muestra una gráfica con sus pronósticos utilizando un suavizamiento exponencial triple.

El Método de Holt – Winters se puede ejecutar en forma sencilla con ayuda del paquete estadístico Minitab.

A continuación se muestra un ejemplo comparando los tres métodos:

Página 25

Page 26: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Página 26

Page 27: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Ejemplo de pronósticos utilizando el Método de Winters

Se desea predecir el empleo para los siguientes seis meses en la industria alimenticia usando datos colectados sobre los últimos 60 meses, usando el método de Winters con el modelo multiplicativo, dado que hay componente estacional y de tendencia aparente en los datos.

Instrucciones de Minitab

1 Open Worksheet EMPLOY.MTW.2 Ejecutar Stat > Time Series > Winters' Method.3 En Variable, poner Food. In Seasonal length, 12 .4 En Model Type, seleccionar Multiplicative.5 Seleccionar Generate forecasts poner 6 en Number of forecasts. Seleccionar OK.

Winters' Method for FoodMultiplicative MethodData FoodLength 60

Smoothing ConstantsAlpha (level) 0.2Gamma (trend) 0.2Delta (seasonal) 0.2

Accuracy MeasuresMAPE 1.88377MAD 1.12068MSD 2.86696

ForecastsPeriod Forecast Lower Upper61 57.8102 55.0646 60.555862 57.3892 54.6006 60.177863 57.8332 54.9966 60.669864 57.9307 55.0414 60.819965 58.8311 55.8847 61.777566 62.7415 59.7339 65.7492

Página 27

Page 28: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Index

Food

635649423528211471

75

70

65

60

55

50

Smoothing ConstantsAlpha (level) 0.2Gamma (trend) 0.2Delta (seasonal) 0.2

Accuracy MeasuresMAPE 1.88377MAD 1.12068MSD 2.86696

Variable

Forecasts95.0% PI

ActualFits

Winters' Method Plot for FoodMultiplicative Method

Interpretación de los resultados

La gráfica muestra los valores de la serie y los valores estimados (un periodo adelante) y los seis pronósticos.

Los valores de exactitud del modelo MAPE, MAD y MSD utilizando el modelo Multiplicativo proporcionan un mejor ajuste en dos de los tres indicadores que con el modelo Aditivo como se muestra a continuación.

Accuracy MeasuresMultiplicative AdditiveMAPE 1.88377 1.95MAD 1.12068 1.15MSD 2.86696 2.67

ANÁLISIS DE CORRELACIÓN Y MÉTODO DE ARIMA

El análisis de correlación, análisis de diferencias, autocorrelación y autocorrelación parcial, son utilizadas para identificar un modelo adecuado de ARIMA.

El Modelo ARIMA puede utilizarse para modelar series de tiempo con o sin componentes de tendencia o estacionalidad y proporcionar pronósticos. El perfil de pronóstico depende del modelo de ajuste. Tiene la ventaja de ser más flexible que los métodos de suavizamiento para el ajuste de los datos, sin embargo la identificación del modelo adecuado consume tiempo y no puede ser fácilmente automatizado.

Página 28

Page 29: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

4.8 Diferencias y atrasos

Las diferencias se calculan entre los valores de los datos de la serie de tiempo, sirven para identificar patrones de tendencia y estacionalidad.

Los atrasos (lags), son valores anteriores con los que se determina el siguiente valor pronosticado.

Ejemplo:Si se desean obtener diferencias y atrasos de 12 meses con los datos de Employ.mtw se tiene:

Intrucciones de Minitab:

1. Open Worksheet Employ.mtw2. Stat > Time series > Differences3. Series Food4. Store Differences in C45. Lag 126. OK

Y para los retrasos (lags):

1. Open Worksheet Employ.mtw2. Stat > Time series > Lags3. Series Food4. Store Lags in C55. Lag 126. OK

Los resultados parciales se muestran a continuación:

C4 C5Food Diferencias Retrasos53.5 * *53 * *

53.2 * *52.5 * *53.4 * *56.5 * *65.3 * *70.7 * *66.9 * *58.2 * *55.3 * *53.4 * *52.1 -1.4 53.5

Página 29

Page 30: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

51.5 -1.5 5351.5 -1.7 53.252.4 -0.1 52.553.3 -0.1 53.455.5 -1 56.564.2 -1.1 65.369.6 -1.1 70.769.3 2.4 66.958.5 0.3 58.255.3 0 55.353.6 0.2 53.452.3 0.2 52.151.5 0 51.551.7 0.2 51.551.5 -0.9 52.452.2 -1.1 53.357.1 1.6 55.5

4.8 Autocorrelación

La autocorrelación: es la correlación entre observaciones de una serie de tiempo separadas por K unidades de tiempo, su gráfica se denomina función de autocorrelación (ACF), su análisis permite seleccionar los términos a ser incluidos en el modelo ARIMA.

Una gráfica de autocorrelación, permite identificar estacionalidad donde no es fácil de apreciar, como se observa en la gráfica siguiente:

Primero se obtiene una gráfica de corridas normal, por ejemplo:

Esta gráfica indica cierto nivel de estacionalidad.

La gráfica de autocorrelación se muestra a continuación:

Página 30

Page 31: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

La gráfica muestra ambos un decaimiento exponencial con oscilaciones sinusoidales amortiguadas, esto indica que un modelo autoregresivo de orden mayor a uno puede ser apropiado, el orden puede determinarse con una gráfica de autocorrelación parcial como sigue:

De la gráfica se muestran picos de orden 2 que exceden los límites de confianza, por lo que el modelo debe tener este orden ARIMA(2).

Página 31

Page 32: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Ejemplo de autocorrelación:

Se desea predecir el empleo para los siguientes seis meses en la industria alimenticia usando datos colectados sobre los últimos 60 meses, se utiliza el modelo de autocorrelación para identificar el modelo ARIMA adecuado.

Como los datos muestran un comportamiento estacional de 12 meses, se toma una diferencia en el valor anterior 12 para que sea estacionario y buscar correlación de las series diferenciadas. En estos datos la magnitud de la tendencia a largo plazo se ve pequeña respecto al componente de estacionalidad, si hubiera sido mayor se podría haber considerado tomar otra diferencia en el valor anterior 1 para inducir que sea estacionario.

Las instrucciones de Minitab son las siguientes:

1 File > Open worksheet EMPLOY.MTW.2 Ejecutar Stat > Time Series > Differences.3 En Series, poner Food.4 En Store differences in, poner Food2.5 En Lag, poner 12 . OK.

6 Ejecutar Stat > Time Series > Autocorrelation.7 En Series, poner Food2. OK.

Autocorrelation Function: Food2Lag ACF T LBQ1 0.701388 4.86 25.122 0.512266 2.52 38.813 0.366882 1.60 45.994 0.310364 1.29 51.245 0.234743 0.94 54.326 0.173069 0.68 56.037 0.162046 0.63 57.578 0.170051 0.66 59.309 0.322438 1.24 65.7010 0.252774 0.94 69.7411 0.208020 0.76 72.5412 0.150936 0.55 74.06

Página 32

Page 33: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Interpretación de los resultados

Si no se especifica la amplitud de valores anteriores (lag lenght), se toma n/4 para series con menos de 240 datos. Se genera la función de autocorrelación (ACF) con bandas de confianza en 5% para comprobar la hipótesis de que las correlaciones son iguales a cero.

Los valores de la función ACF muestran picos significativos en los valores anteriores (lags) 1 y 2 con valores subsiguientes que no decaen rápidamente, patrón típico de un proceso autoregresivo.

4.9 Autocorrelación parcial:

Es la correlación entre conjuntos de pares ordenados de una serie de tiempo, mide la fuerza de la relación con otros términos tomados en cuenta. La autocorrelación parcial en una posición K es la correlación entre residuos en tiempo t de un modelo autoregresivo y las observaciones en la posición K con términos para todas las posiciones que intervienen en el modelo autoregresivo. Su gráfica se denomina función de autocorrelación (PACF). su análisis permite seleccionar los términos a ser incluidos en el modelo ARIMA.

La correlación cruzada: es la correlación entre dos series de tiempo.

Ejemplo:

Se obtiene una función de autocorrelación parcial (PACF) de los datos de empleo anteriores, después de tomar una diferencia del valor anterior 12 para determinar el modelo ARIMA más adecuado.

Página 33

Page 34: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Las instrucciones de Minitab son las siguientes:

1 Worksheet EMPLOY.MTW2 Ejecutar Stat > Time Series > Differences.3 En Series, poner Food.4 En Store differences in, poner Food2.5 En Lag, poner 12 . OK.6 Ejecutar Stat > Time Series > Partial Autocorrelation .7 En Series, poner Food2. OK.

Interpretación de resultados

Se generan bandas de confianza en 5% para la hipótesis de que las correlaciones son iguales a cero. Se observa un pico de 0.7 en el valor anterior 1, típico de un proceso autoregresivo de orden 1, hay otro en el valor anterior 9 pero no hay evidencia de que un proceso no aleatorio en ese punto.

Página 34

Page 35: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

4.10 El método ARIMA

Ajustar el modelo ARIMA de Box Jenkins a una serie de tiempo, representa pasos de filtraje hasta que solo haya ruido aleatorio, se usa para generar pronósticos.

De acuerdo a Box y Jenkins para ajustar un modelo ARIMA a una serie de tiempo proponen un método iterativo que incluye:

Identificar el modelo aplicando el juicio del analista. Estimar los parámetros. Verificar la adecuación del modelo. Hacer pronósticos de ser necesario.

1. Primero, decidir si los datos son estacionarios. Es decir si los datos poseen media y varianza constante.

Examinar la gráfica de serie de tiempo para si es necesaria una transformación para tener varianza constante.

Examinar la función de autocorrelación (ACF) para ver si las autocorrelaciones no decaen, indicando que se pueden requerir diferencias para dar una media constante.

Un patrón de estacionalidad que se repite cada k-ésimo intervalo de tiempo sugiere tomar una diferencia k-ésima para eliminar una porción del patrón. La mayoría de las series no requieren más de dos operaciones de diferencias u órdenes. Si los picos de la ACF decaen rápidamente, no hay necesidad de diferencias adicionales. Una indicación de sobre diferenciación de una serie es que la primera autocorrelación es cercana a -0.5 y pequeños valores dondequiera.

Usar Stat > Time Series > Differences para obtener las diferencias. Examinar las funciones ACF y PACF de las serie de datos diferenciada, con Stat > Time Series > Autocorrelation y Stat > Time Series > Partial Autocorrelation.

2. Después, examinar las funciones ACF y PACF de los datos estacionarios de manera de identificar que modelo autorregresivo o de promedio móvil se sugiere.

Una función ACF con picos altos iniciales que decaen a cero o una función PACF con picos altos en el primero y posiblemente en el segundo atraso indica un proceso autorregresivo.

Una función ACF con pico alto inicial y posiblemente en el segundo retraso y una función PACF con picos altos en los primeros atrasos que decaen a cero indica un proceso de promedio móvil.

Página 35

Page 36: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Si las funciones ACF y PACF tienen pico altos que gradualmente caen a cero indican que los procesos de promedios móviles y autoregresivo están presentes.

3. Una vez que se ha identificado uno o más de los modelos a utilizar, continuar con el procedimiento de ARIMA.

Ajustar el modelo y examinar la significancia de los parámetros y seleccionar un modelo que tenga el mejor ajuste.

o Si se desea un modelo estacional (intervalo en que se repite el patrón) seleccionar Fit seasonal model e introducir el periodo (default 12).

o

o Para especificar los parámetros del modelo de promedios móviles y autoregresivo incluyendo el modelo estacional o no estacional ARIMA, seleccionar un valor de 0 a 5. Al menos uno de esos parámetros no debe ser cero. La mayoría de modelo sólo requieren dos parámetros. Si se pone 2 en la celda Moving Average en Seasonal el modelo incluirá términos de primero y segundo orden de promedios móviles.

o Para especificar el número de diferencias estaciónales o no estaciónales a tomar, poner el número en la celda apropiada. Si se requiere una diferencia estacional de K como el periodo de estacionalidad, se tomará la diferencia k-ésima.

o Para incluir la constante en el modelo, seleccionar Include constant term in model.

Checar que las funciones ACF y PACF de residuos indiquen un proceso aleatorio, sin picos altos, usando las gráficas de ARIMA. Si hay picos altos, considerar cambiar el modelo.

Ejemplo de ARIMA

Las gráficas de autocorrelación (ACF) y de autocorrelación parcial (PACF) sugieren un modelo de autoregresivo de orden 1 o AR(1), después de tomar una diferencia de 12.

Ahora se corre el modelo, analizando las gráficas y la bondad de ajuste.

Página 36

Page 37: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Para tomar una diferencia estacional de orden 12, se especificó el periodo estacional de 12 y el orden de la diferencia 1, con esto se realiza el pronóstico.

Instrucciones de Minitab1 Worksheet EMPLOY.MTW.2 Stat > Time Series > ARIMA.3 En Series, poner Food.4 Seleccionar Fit seasonal model. En Period poner 12 en Nonseasonal, poner 1 en Autoregressive. En Seasonal, poner 1 en Difference .5 Seleccionar Graphs. Seleccionar ACF of residuals y PACF of residuals .6 OK en cada cuadro de diálogo.

ARIMA Model: FoodEstimates at each iterationIteration SSE Parameters0 95.2343 0.100 0.8471 77.5568 0.250 0.7022 64.5317 0.400 0.5563 56.1578 0.550 0.4104 52.4345 0.700 0.2615 52.2226 0.733 0.2166 52.2100 0.741 0.2037 52.2092 0.743 0.2018 52.2092 0.743 0.2009 52.2092 0.743 0.200

Relative change in each estimate less than 0.0010

Final Estimates of Parameters

Type Coef SE Coef T PAR 1 0.7434 0.1001 7.42 0.000

Constant 0.1996 0.1520 1.31 0.196

Differencing: 0 regular, 1 seasonal of order 12

Number of observations: Original series 60, after differencing 48

Residuals: SS = 51.0364 (backforecasts excluded)MS = 1.1095 DF = 46

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48Chi-Square 11.3 19.1 27.7 *DF 10 22 34 *P-Value 0.338 0.641 0.768 *

Página 37

Page 38: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Interpretación de resultados

El modelo ARIMA converge en 9 iteraciones. El modelo AR(1) tiene un estadístico t de 7.42, como regla si t es mayor a 2 se puede juzgar el parámetro como significativo diferente de cero. El MSE (1.1095) se usa para comparar el ajuste de diferentes modelos ARIMA. Los residuos no parecen estar correlacionados como se muestra en las gráficas (estan dentro de los intervalos de confianza, asumiendo que el valor 9 es aleatorio). El modelo AR(1) parece ser adecuado para pronosticar.

En el ejemplo anterior se encontró que un modelo AR(1) con una diferencia estacional de 12 da un buen ajuste para el sector de Food de los datos de empleo.

Ahora se puede pronosticar esta estimación para los siguientes 12 meses.

Corrida de ARIMA para pronósticos:

Página 38

Page 39: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

Paso 1. Correr el modelo ARIMA sin gráficas de ACF y PACF de los residuos

Instrucciones de Minitab1 Worksheet EMPLOY.MTW.2 Stat > Time Series > ARIMA.3 En Series, poner Food.4 Seleccionar Fit seasonal model. En Period poner 12 en Nonseasonal, poner 1 en Autoregressive. En Seasonal, poner 1 en Difference .

Paso 2: Mostrar la Gráfica de serie de tiempo

1 Seleccionar Graphs. Seleccionar Time series plot. OK.

Paso 3. Generar los pronósticos

1 Seleccionar Forecast. en Lead, poner 12 . OK en cada cuadro de diálogo.

ARIMA Model: FoodEstimates at each iterationIteration SSE Parameters0 95.2343 0.100 0.8471 77.5568 0.250 0.7022 64.5317 0.400 0.5563 56.1578 0.550 0.4104 52.4345 0.700 0.2615 52.2226 0.733 0.2166 52.2100 0.741 0.2037 52.2092 0.743 0.2018 52.2092 0.743 0.2009 52.2092 0.743 0.200

Relative change in each estimate less than 0.0010Final Estimates of Parameters

Type Coef SE Coef T PAR 1 0.7434 0.1001 7.42 0.000

Constant 0.1996 0.1520 1.31 0.196

Differencing: 0 regular, 1 seasonal of order 12

Number of observations: Original series 60, after differencing 48

Residuals: SS = 51.0364 (backforecasts excluded)MS = 1.1095 DF = 46

Modified Box-Pierce (Ljung-Box) Chi-Square statisticLag 12 24 36 48

Chi-Square 11.3 19.1 27.7 *DF 10 22 34 *

P-Value 0.338 0.641 0.768 *

Forecasts from period 60

Página 39

Page 40: Metodos Series Tiempo

Metodología de análisis con Series de tiempo P. Reyes / Marzo 2007

95 Percent

LimitsPeriod Forecast Lower Upper Actual61 56.4121 54.3472 58.477062 55.5981 53.0251 58.171163 55.8390 53.0243 58.653764 55.4207 52.4809 58.360565 55.8328 52.8261 58.839466 59.0674 56.0244 62.110467 69.0188 65.9559 72.081768 74.1827 71.1089 77.256569 76.3558 73.2760 79.435770 67.2359 64.1527 70.319171 61.3210 58.2360 64.406072 58.5100 55.4240 61.5960

Interpretación de resultados

El modelo ARIMA proporciona pronósticos con bandas de confianza en 95%, usando el modelo AR(1) la estacionalidad domina el perfil de pronósticos para los próximos 12 meses con los valores pronosticados ligeramente mayores que los 12 meses previos.

Página 40