MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de...

19
Universidad Mariano Gálvez de Guatemala Sede universitaria Chiquimula Maestría Dirección y Gestión del Recurso Humano Inga. Claudia Esmeralda Villela Cervante MODELO ARIMAJehinner Wilfrido Gramajo Perdomo 3228 06 16605 Métodos Cuantitativos Chiquimula, 30 de Julio del 2016

Transcript of MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de...

Page 1: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

Universidad Mariano Gálvez de Guatemala

Sede universitaria Chiquimula

Maestría Dirección y Gestión del Recurso Humano

Inga. Claudia Esmeralda Villela Cervante

“MODELO ARIMA”

Jehinner Wilfrido Gramajo Perdomo

3228 – 06 – 16605

Métodos Cuantitativos

Chiquimula, 30 de Julio del 2016

Page 2: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

0

Índice

Introducción .................................................................................................................................... 1

I. MODELO ARIMA ..................................................................................................................... 2

A. DEFINICIONES BÁSICAS PARA APROXIMARSE A LOS MODELOS ARIMA ........... 2

1. Proceso estocástico........................................................................................................... 2

2. Serie temporal y proceso estocástico ........................................................................... 3

3. Estacionariedad de un proceso....................................................................................... 3

a. Proceso estocástico estacionario en sentido fuerte .............................................. 3

b. Proceso estocástico estacionario en sentido débil ................................................ 4

c. Definición informal de un proceso estacionario ..................................................... 5

4. Proceso estocástico “ruido – blanco” ........................................................................... 6

5. Modelos Autorregresivos AR(p) ...................................................................................... 6

6. Operador y polinomio de retardos.................................................................................. 8

7. Modelo de medias móviles MA(q) ................................................................................... 9

B. Fases en la elaboración de un modelo ARIMA ........................................................ 10

1. Identificación ..................................................................................................................... 11

2. Estimación ......................................................................................................................... 12

3. Diagnóstico ........................................................................................................................ 12

4. Aplicación práctica .......................................................................................................... 12

II. Conclusión ............................................................................................................................. 13

Bibliografía ..................................................................................................................................... 14

ANEXOS .......................................................................................................................................... 15

Page 3: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

1

Introducción

El modelo ARIMA es un modelo estadístico que utiliza variaciones y regresiones

de datos estadísticos con el fin de encontrar patrones para una predicción hacia el

futuro, se trata de un modelo dinámico de series temporales, es decir, las

estimaciones futuras vienen explicadas por los datos del pasado y no por variables

independientes.

En los modelos ARIMA se consideran tres tipos de procesos posibles:

autorregresión (AR), diferenciación o integración (I) y medias móviles (MA), como

consecuencia de ello, tales modelos contemplan tres parámetros estructurales, p,d

y q, que se expresa de la siguiente manera ARIMA(p,d,q), donde p es el orden de

la autorregresión, d es el grado de diferenciación y q el orden de la media móvil

considerada.

Page 4: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

2

I. MODELO ARIMA

Según (Hernández, 2005), para hacer un modelo ARIMA se aconseja acudir a

un conjunto de criterios que globalmente permiten juzgar la mayor o menor

idoneidad de una especificación, así que se debe analizar si el modelo estimado

cumple el requisito básico de estacionariedad o invertibilidad.

En 1970, Box y Jenkins desarrollaron un cuerpo metodológico destinado a

identificar, estimar y diagnosticar modelos dinámicos de series temporales en los que

la variable tiempo juega un papel fundamental, los modelos ARIMA, la metodología

ARIMA es sólo una pequeña parte de los que se conoce normalmente como

“Econometría de Series Temporales” pero, sin duda alguna, una de las más utilizadas

y germen de otros muchos desarrollos posteriores.

En ocasiones, los procedimientos que vamos a analizar se han contrapuesto a la

llamada “econometría estructural”, es decir, a la especificación de modelos

econométricos apoyada en las teorías subyacentes; sin embargo, hoy en día los

conceptos y procedimientos que examinaremos constituyen más una herramienta

para apoyar y complementar los conocimientos econométricos tradicionales que un

modo alternativo de “hacer econometría”, por otro lado, la utilización de modelos

ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y

su utilidad finalista los hace útiles para el pronóstico a corto plazo pero no para la

comprensión estructural del fenómeno o la simulación de escenarios.

A. DEFINICIONES BÁSICAS PARA APROXIMARSE A LOS MODELOS

ARIMA

1. Proceso estocástico

Un proceso estocástico es una sucesión de variables aleatorias Yt ordenadas,

pudiendo tomar t cualquier valor entre - y . Por ejemplo, la siguiente sucesión de

variables aleatorias puede ser considerada como proceso estocástico:

Page 5: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

3

El subíndice t no tiene, en principio, ninguna interpretación a priori, aunque si

hablamos de proceso estocástico en el contexto del análisis de series temporales

este subíndice representará el paso del tiempo.

2. Serie temporal y proceso estocástico

Una vez introducido el concepto genérico de proceso estocástico puede decirse

que una serie temporal cualquiera es, en realidad, una muestra, una realización

concreta con unos valores concretos de un proceso estocástico teórico, real. El

análisis de series temporales tratará, a partir de los datos de una serie temporal, inferir

las características de la estructura probabilística subyacente, del verdadero proceso

estocástico. Si logramos entender qué características tiene este proceso (cuál es la

esperanza de sus variables, su varianza y las relaciones entre variables separadas

en el tiempo) y observamos además que estas características se mantienen en el

tiempo, podremos utilizar la metodología ARIMA para proyectar su valor en el futuro

inmediato.

3. Estacionariedad de un proceso

La utilización de modelos ARIMA como estrategia de predicción de series

temporales sólo tiene sentido si las características observadas en la serie (o más

correctamente, en el proceso estocástico subyacente) permanecen en el tiempo.

a. Proceso estocástico estacionario en sentido fuerte

Cada una de las variables Yt que configuran un proceso estocástico tendrán su

propia función de distribución con sus correspondientes momentos, así mismo, cada

conjunto de variables tendrán su correspondiente función de distribución conjunta y

sus funciones de distribución marginales. Habitualmente, conocer esas funciones de

distribución resulta complejo de forma que, para caracterizar un proceso estocástico,

y,y,........y,y,y,Y 432-3-4-5-

Page 6: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

4

basta con especificar la media y la varianza para cada yt y la covarianza para variables

referidas a distintos valores de t:

)]-y)(-yE[(=)Y,YCov(=

]-yE[=)yVar(=

=]YE[

ssttstst

2

ttt

2t

tt

,

Decimos que un proceso estocástico es estacionario en sentido estricto o fuerte si

las funciones de distribución conjuntas (no sólo la esperanza, las varianzas o las

covarianzas, sino las funciones de distribución “completas”) son constantes, o dicho

con más propiedad, son “invariantes con respecto a un desplazamiento en el tiempo”

(variación de t). Es decir, considerando que t, t+1, t+2, ...., t+k reflejan períodos

sucesivos:

Para cualquier t, k y m; por ejemplo:

b. Proceso estocástico estacionario en sentido débil

La definición de estacionariedad en sentido estricto puede relajarse

sustancialmente utilizando la denominada estacionariedad en sentido amplio o

débil, decimos que un proceso estocástico es débilmente estacionario si:

- Las esperanzas matemáticas de las variables aleatorias no dependen del

tiempo, son constantes:

)Y,.....,Y,YF(=)Y,.....Y,YF( m+k+tm+1+tm+tk+t1+tt

Page 7: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

5

- Las varianzas tampoco dependen del tiempo (y son finitas):

- Las covarianzas entre dos variables aleatorias del proceso correspondientes

a períodos distintos de tiempo (distintos valores de t) sólo dependen del lapso

de tiempo transcurrido entre ellas:

De esta última condición se desprende que, si un fenómeno es estacionario, sus

variables pueden estar relacionadas linealmente entre sí, pero de forma que la

relación entre dos variables sólo depende de la distancia temporal k transcurrida entre

ellas.

c. Definición informal de un proceso estacionario

De una manera informal, diremos que un proceso es estacionario cuando se

encuentra en equilibrio estadístico, en el sentido de que sus propiedades (su media,

su varianza, las covarianzas entre distintas variables del proceso) no varían a lo largo

del tiempo.

m ]YE[=]YE[ m+tt

m ]YVar[=]YVar[ m+tt

m )Y,YCov(=)Y,YCov( m+sm+tst

Page 8: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

6

4. Proceso estocástico “ruido – blanco”

En este contexto, un ruido blanco es una sucesión de variables aleatorias

(proceso estocástico) con esperanza nula, varianza constante, y covarianzas nulas

para distintos valores de t. Este tipo de proceso, que sólo presenta varianza, que no

presenta relación entre variables de distintos períodos, no podrá ser reproducido con

un modelo ARIMA, es un proceso “vacío” de información de carácter auto proyectivo.

5. Modelos Autorregresivos AR(p)

Los modelos ARIMA tratarán de expresar la evolución de una variable Yt de un

proceso estocástico en función del pasado de esa variable o de impactos aleatorios

que esa variable sufrió en el pasado. Para ello, se utilizarán dos tipos de formas

funcionales lineales sencillas: los modelos AR (Modelos Autorregresivos), y los

modelos MA (de Medias Móviles).

Definimos un modelo AR (autorregresivo) como aquel en el que la variable

endógena de un período t es explicada por las observaciones de ella misma

correspondientes a períodos anteriores (parte sistemática) más un término de error

ruido blanco (innovación).

Los modelos autorregresivos se abrevian con la palabra AR tras la que se indica

el orden del modelo: AR (1), AR (2),....etc. El orden del modelo expresa el número

de observaciones retasadas de las series temporales analizadas que intervienen en

la ecuación. Así, por ejemplo, un modelo AR (1) tendría la siguiente expresión:

La expresión genérica de un modelo autorregresivo, no ya de un AR (1) sino de

un AR (p) sería la siguiente:

Esta forma funcional se acompaña de una serie de restricciones conectadas con

importantes hipótesis analíticas:

a+Y+=Y t1-t10t

Page 9: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

7

- El proceso no debe ser anticipante (hipótesis de recursividad temporal); lo

que quiere decir que los valores de una variable en un momento t no

dependerán de los que esta misma tome en t+j.

- La correlación entre una variable y su pasado va reduciéndose a medida

que nos alejamos más en el tiempo (proceso ergódico)

- La magnitud de los coeficientes está limitada en valor absoluto: así, por

ejemplo, en el caso de un AR(1), el coeficiente autorregresivo de un

proceso estocástico estacionario ha de ser inferior a 1 en valor absoluto;

en el caso de un Ar(2), es la suma de los dos coeficientes la que no puede

exceder la unidad. Estas restricciones expresadas en los coeficientes

conectan con las propiedades de estacionariedad del proceso analizado o,

dicho de otro modo: sólo los modelos cuyos coeficientes respetan una serie

de condiciones (que dependen del orden “p” del modelo) representan

procesos estocásticos estacionarios y, por tanto, tienen utilidad analítica.

a+Y+......+Y+Y+=Y tp-tp2-t21-t10t

Page 10: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

8

6. Operador y polinomio de retardos

El operador retardo Lp aplicado al valor Yt de una determinada serie devuelve el

valor de esa serie retardado “p” observaciones, es decir:

LpYt=Yt-p

Polinomio de retardos de orden “p” p(L) se compone de una sucesión de “p”

operadores de retardos con sus respectivos coeficientes:

El polinomio de retardos permite abreviar la expresión de u modelo AR(p)

escribiéndose:

La utilidad del polinomio de retardos no es, sin embargo, permitir una notación

abreviada: las características del polinomio de retardos o, más concretamente, el

valor de sus raíces (las soluciones del polinomio) permiten analizar la estacionariedad

del proceso estocástico que subyace al modelo ARIMA, es decir, los analistas pueden

evaluar características relevantes del proceso estocástico que se está modelizando

estudiando las propiedades matemáticas del polinomio de retardos, de ahí su

utilidad.

L-......-L-L-1=(L) p

p

2

21p

a+=Y(L) t0tp

Page 11: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

9

7. Modelo de medias móviles MA(q)

Como difiere (Pulido, 2006) las medidas móviles consisten básicamente en

realizar una media aritmética de un número preestablecido de datos, donde se va

añadiendo sucesivamente un dato nuevo y eliminando el más antiguo de los incluidos,

la serie correspondiente a la media móvil alisa variaciones de la serie original.

Un modelo de los denominados de medias móviles es aquel que explica el valor

de una determinada variable en un período t en función de un término independiente

y una sucesión de términos de error, de innovaciones correspondientes a períodos

precedentes, convenientemente ponderados, estos modelos se denotan

normalmente con las siglas MA, seguidos, como en el caso de los modelos

autorregresivos, del orden entre paréntesis. Así, un modelo con q términos de error

MA (q) respondería a la siguiente expresión:

Que de nuevo puede abreviarse utilizando el polinomio de retardos (como en el

caso de los modelos AR):

Así como un modelo autorregresivo es intuitivamente sencillo de comprender, la

formulación de un modelo de medias móviles resulta sorprendente para el no iniciado.

¿Qué significa que una variable aleatoria se explique en función de los errores

cometidos en períodos precedentes?, ¿De dónde proceden esos errores?, ¿Cuál es

la justificación de un modelo de este tipo? en realidad, un modelo de medias móviles

puede obtenerse a partir de un modelo autorregresivo sin más que realizar sucesivas

sustituciones:

a+....+a+a+a+=Y q-tq2-t21-t1tt

+a(L)=Y tqt

Page 12: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

10

B. Fases en la elaboración de un modelo ARIMA

Básicamente consiste en determinar el modelo subyacente en una determinada

serie temporal: Identificación. Una vez determinado el tipo de modelo, proceder a la

estimación de los parámetros del mismo: Estimación. Y por último, comprobar si el

modelo se ajusta correctamente a los datos empíricos: Diagnóstico, que en caso de

no cumplirse, se reiniciaría del nuevo el proceso. Una vez finalizado el proceso

podremos aplicar el modelo. Así:

Identificación Estimación Diagnóstico Aplicación del modelo

Fuente: Recuperado de http://www.es.slideshare.net

+a+....+a+a+a+a=Y

Y+a+a=Y

a+Y=Ya+Y=Y

j-t

j

3-t

3

2-t

2

1-ttt

2-t

2

1-ttt

1-t2-t1-tt1-tt

...........

........

Page 13: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

11

1. Identificación

Para (Villareal, 2005), la identificación es la primera etapa donde se determinan

tanto el orden de integración de la serie de tiempo Xt, como el orden de los

polinomios AR y MA regulares y estacionales, para ello la principal herramienta es

el análisis de la función de auto covarianza.

Es la fase más importante, se trata de determinar los parámetros p, d y q que

conforma el proceso ARIMA (p,d,q) generador de la serie. Hay que decir que aunque

estos parámetros pueden adoptar cualquier valor, en la práctica la casi totalidad de

los casos serán 0 o 1, y raras veces 2, lo que hace que el proceso de identificación

sea menos complejo de lo que aparentemente resulta. Por ejemplo, el 51% de las

series estudiadas por Glas y otros (1975) no necesitaron diferenciación y tal solo el

6% necesitaron una diferenciación mayor del primer orden. Igualmente, y esto

mismos autores, detectaron que tan sólo el 2% de las series tienen un orden

autorregresivo superior a la unidad. Igualmente son raras medias móviles

superiores a 1.

Lo primero es el parámetro d, estos es el grado de diferenciación para que la

serie sea estacionaria, para ello, el procedimiento es muy sencillo, en primer lugar

se observa gráficamente si la series es estacionaria o no.

Estacionariedad significa, como se sabe, que la serie tiene la misma media y

varianza a lo largo de todo su recorrido, si la serie no es estacionaria se procede a

diferenciarla y se comprueba de nuevo gráficamente si es estacionaria, si lo es,

sabemos por tanto que el valor d vale 1, en caso contrario se deferencia de nuevo,

y así tantas veces hasta que se logre la estacionalidad, el valor d será el número de

veces que se ha diferenciado.

Conocido el valor d procedemos a conocer p y q. Para ambos parámetros

recurriremos a la función de autocorrelación ACF y a la función de autocorrelación

parcial PACF.

Page 14: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

12

Los modelos AR(p) presenta un decaimiento exponencial en los valores de ACF

y picos en los primeros p valores del PACF, por otro lado, los modelos MA(q)

presentan q picos en los primeros q valores del ACF, y valores decrecientes

exponencialmente en PACF, para otros caso, ver el Apéndice al final de estas

páginas.

2. Estimación

Por otro lado (Mongay, 2005), nos dice que la estimación normalmente es para

estimar el modelo recién identificado, se utiliza el método de mínimos cuadrados o

el método de máxima verosimilitud.

Los modelos ARIMA no son modelos lineales en sus parámetros, lo que

imposibilita el recurso a los programas estándar de regresión lineal, en su lugar se

recurre a modelos iteractivos y a la máxima verosimilitud como procedimiento de

estimación de parámetros, en esta fase se determinan los valores de los parámetros

p, d y q, que obviamente han de ser estadísticamente significativos.

3. Diagnóstico

Consistente en determinar la adecuación del modelo con los datos empíricos, si

el modelo estimado es el adecuado, los residuales generados por el mismo serán

verdaderamente aleatorios y carecerán de cualquier pauta o estructura, para ello

recurrimos de nuevos al ACF y PACF donde cabe esperar valores de los residuos

completamente aleatorios, esto es ruido blanco, en caso de no ser así habría que

replantearse el modelo y establecer otros parámetros para el modelo.

4. Aplicación práctica

Vamos a aplicar el modelo ARIMA sobre unos supuestos datos en el contexto

del control de calidad de una empresa en la producción de unos determinados

componentes, los datos, una vez definidas las fechas son los siguientes (ver

ANEXOS).

Page 15: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

13

II. Conclusión

El modelo ARIMA necesita identificar los coeficientes y número

de regresiones que se utilizarán, este modelo es muy sensible a la precisión con

que se determinen sus coeficientes, se suele expresar como ARIMA(p,d,q) donde

los parámetros p, d y q son números enteros no negativos que indican el orden de

las distintas componentes del modelo respectivamente.

Las componentes autorregresiva, integrada y de media móvil, cuando alguno de

los tres parámetros es cero, es común omitir las letras correspondientes del

acrónimo, AR para la componente autorregresiva, I para la integrada y MA para la

media móvil, por ejemplo, ARIMA(0,1,0) se puede expresar como I(1) y

ARIMA(0,0,1) como MA(1).

El modelo ARIMA puede generalizarse aún más para considerar el efecto de

la estacionalidad, ya que se restringe a series largas y de “alta frecuencia” (meses,

semanas, días) y su utilidad finalista los hace útiles para el pronóstico a corto plazo

pero no para la comprensión estructural del fenómeno o la simulación de escenarios.

Page 16: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

14

Bibliografía

Hernández, Z. (2005). MODELOS ECONJOMETRICOS PARA EL ANALISIS

ECONOMICO. Madrid, España: ESIC.

Mongay. (2005). QUIMETRIA. Valencia, España: Juli Capilla, S.L.

Pulido. (2006). GUIA PARA USUARIOS DE PREDICCIONES ECONOMICAS.

Madrid, España: Ecobook.

Villareal. (2005). ELEMENTOS TEORICOS DEL AJUSTE ESTACIONAL DE

SERIES ECONOMICAS. Santiago de Chile: L.C/L.

Page 17: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

15

ANEXOS

Fuente: Recuperado de http://www.minitab.com

Fuente: Recuperado de http://www.ciberspaceandtime.com

Page 18: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

16

Fuente: Recuperado de http://www.ciberspaceandtime.com

Fuente: Recuperado de http://www.scielo.org.co

Page 19: MODELO ARIMA - miportafoliojehinner.weebly.com€¦ · ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y su utilidad finalista los hace útiles

17

Fuente: Recuperado de http://www.scielo.br

Fecha

182

176

170

164

158

152

146

140

134

128

122

116

110

104

98

92

86

80

2280

2260

2240

2220

2200

2180

2160

2140

PUNTUACI

95% LCL for PUNTUACI

from ARIMA, MOD_42

95% UCL for PUNTUACI

from ARIMA, MOD_42