Practica 4 2009 - est.uc3m.es€¦ · 4 usualmente por máxima verosimilitud aunque en Eviews este...

36
2 PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2008/2009 Práctica 4 Planteamiento y objetivos de la práctica En la presente práctica se propone la modelización univariante por medio del enfoque de Box-Jenkins de tres series temporales con características distintas. En cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que considere más importantes en cada ejemplo y dejar los pasos omitidos para que los cubran los alumnos después por su cuenta. Con la presente práctica se intenta que el alumno aprenda a construir modelos ARIMA univariantes para una serie temporal por medio del enfoque de Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas hasta elaborar el posible modelo generador de los datos. De forma sintética los pasos a realizar son los siguientes: Especificación inicial Estimación Chequeo o validación Utilización del modelo 1 En la etapa de especificación inicial se deberá determinar el orden de integración de la serie temporal, es decir cual es el número y naturaleza (regular o estacional, incluyendo trimestral, mensual, etc.) de diferencias que se requerirán para convertir en estacionaria a la variable objeto de análisis, Z t (d,s). Z t = (1-B) d (1-B s ) D 1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredecibilidad, para basar sobre él la extracción de señales como el componente estacional, etc.

Transcript of Practica 4 2009 - est.uc3m.es€¦ · 4 usualmente por máxima verosimilitud aunque en Eviews este...

2

PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 20 08/2009

Práctica 4

Planteamiento y objetivos de la práctica

En la presente práctica se propone la modelización univariante por medio del

enfoque de Box-Jenkins de tres series temporales con características distintas. En

cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin

de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que

considere más importantes en cada ejemplo y dejar los pasos omitidos para que los

cubran los alumnos después por su cuenta.

Con la presente práctica se intenta que el alumno aprenda a construir

modelos ARIMA univariantes para una serie temporal por medio del enfoque de

Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas

hasta elaborar el posible modelo generador de los datos. De forma sintética los

pasos a realizar son los siguientes:

• Especificación inicial

• Estimación

• Chequeo o validación

• Utilización del modelo 1

En la etapa de especificación inicial se deberá determinar el orden de

integración de la serie temporal, es decir cual es el número y naturaleza (regular o

estacional, incluyendo trimestral, mensual, etc.) de diferencias que se requerirán

para convertir en estacionaria a la variable objeto de análisis, Zt (d,s).

Zt = (1-B)d (1-Bs ) D

1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredecibilidad, para basar sobre él la extracción de señales como el componente estacional, etc.

3

Donde: d es el número de diferencias regulares y D es el número de diferencias de

tipo estacional y habitualmente D = 0 ó 1 y habitualmente 0 ≤ d+D ≤ 2.

Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela

determinadas características de la misma, como sus correlogramas simple y parcial

y los tests de raíces unitarias. En esta práctica nos centramos en el test de raíces

unitarias de Dickey y Fuller aumentado (ADF o DF simplemente).

Una vez decidido el orden d y D, es decir el número de raíces unitarias que

tiene la serie temporal, habrá que decidir el orden del polinomio autorregresivo (p) y

el de medias móviles (q) para lo cual utilizamos como principales instrumentos el

correlograma simple y el parcial de la serie. Los criterios generales que deben

servir de guía para determinar el orden p del polinomio autorregresivo y el orden q

del polinomio medias móviles se recogen en las estructuras de los correlogramas

simple (FAC) y parcial (FAP) y que para los casos más sencillos se han visto en las

clases teóricas. Un resumen de las características de la estructura del correlograma

simple y del parcial se recoge en el esquema adjunto.

Características teóricas de la FAC y de la FAP de l os procesos estacionarios Procesos FAC FAP

AR (p) Decrecimiento rápido hacia

cero sin llegar a anularse

P primeras autocorrelaciones

distintas de cero y el resto

ceros

MA (p) q primeras autocorrelaciones

significativas y el resto ceros

Decrecimiento rápido hacia

cero sin llegar a anularse

ARMA (p, q) Decrecimiento rápido hacia

cero sin llegar a anularse

Decrecimiento rápido hacia

cero sin llegar a anularse

Debe quedar claro que la identificación es siempre tentativa por lo que se

deben sugerir varios modelos como posibles procesos generadores de datos. Una

vez que se han sugerido uno o varios modelos se procede a su estimación,

4

usualmente por máxima verosimilitud aunque en Eviews este método no está

implementado. Posteriormente se debe realizar el chequeo ó validación del modelo

y escoger el que parezca más adecuado para la utilización del modelo. Algunos de

los criterios de validación del modelo más importantes incluyen el análisis de la

autocorrelación y de valores atípicos de los residuos, la significatividad de los

parámetros estimados del modelo (así como sus correlaciones), las condiciones de

estacionariedad e invertibilidad y distintos criterios de ajuste (como el error estándar

de la regresión, el de Akaike o el de Scharwz).

En esta práctica se realiza la modelización de tres series temporales de

datos reales y características distintas. El primer caso se refiere al volumen de

ventas anual de una empresa en términos reales, el segundo analiza el Índice de

empleo de un determinado país con frecuencia trimestral y en el último se modeliza

una serie de frecuencia mensual y con estacionalidad, las ventas de cigarros puros

de una empresa tabaquera.

Ejemplo1. Ventas anuales de una empresa

La serie que se modeliza se refiere a las ventas en términos reales de una

determinada empresa dedicada a la producción de cosméticos. Su periodicidad es

anual y el tamaño muestral abarca 51 observaciones que comprenden el periodo

1949-1999; dada su frecuencia anual, esta serie no tendrá componente estacional.

El primer paso que debemos dar para elaborar el modelo univariante de las series

es crear en Eviews el workfile con frecuencia anual y tamaño muestral indicado e

importamos los datos, tal y como hemos hecho en las prácticas anteriores. La

variable la denominamos ventas

Una vez cargados los datos debemos verificar si la serie temporal es

estacionaria y, en caso de que no lo sea, realizar las transformaciones pertinentes

hasta convertirla en estacionaria. Para ello en primer lugar graficamos la serie

ventas, gráfico que se muestra a continuación.

5

Las instrucciones en Eviews para obtener el gráfico de la serie son:

Quik/Graph /ventas/Line Graph

500

600

700

800

900

1000

1100

1200

50 55 60 65 70 75 80 85 90 95

VENTAS

Evolución de las ventas

Se observa que tiene una tendencia creciente muy acentuada, lo que es un

claro signo de que la serie no es estacionaria en media, además ese crecimiento

muestras signos de regularidad por lo que la varianza aparentemente exhibe cierto

grado de estabilidad y no es del todo preciso tomar logaritmos.

En segundo lugar obtenemos los correlogramas

Instrucciones en Eviews para obtener los correlogramas de ventas

Quick/Series Statistics/Correlogram/ventas

También de forma alternativa en el objeto serie (ventas)

View/Correlogram

6

El correlograma simple de ventas (AC) confirma la sospecha anterior sobre la no

estacionariedad de la variable ventas al mostrar un decrecimiento muy lento.

Adicionalmente llevamos a cabo el test de raíces unitarias de DF.

Instrucciones en Eviews para el test DF:

Quick/Series Statistics/unit root/ventas

Null Hypothesis: VENTAS has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=10)

t-Statistic Prob.* Augmented Dickey-Fuller test statistic -0.906450 0.7780

Test critical values: 1% level -3.571310 5% level -2.922449 10% level -2.599224 *MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(VENTAS) Method: Least Squares Date: 04/11/06 Time: 17:42 Sample (adjusted): 1951 1999 Included observations: 49 after adjustments

7

Variable Coefficient Std. Error t-Statistic Prob. VENTAS(-1) -0.001026 0.001132 -0.906450 0.3694

D(VENTAS(-1)) 0.577317 0.111009 5.200645 0.0000 C 5.282546 1.831241 2.884682 0.0059 R-squared 0.454475 Mean dependent var 10.49688

Adjusted R-squared 0.430757 S.D. dependent var 1.402848 S.E. of regression 1.058424 Akaike info criterion 3.010708 Sum squared resid 51.53198 Schwarz criterion 3.126534 Log likelihood -70.76235 F-statistic 19.16125 Durbin-Watson stat 2.399094 Prob(F-statistic) 0.000001

El Valor del estadístico t (-0.906) es inferior a los valores críticos de la distribución

DF por lo que no se puede rechazar la hipótesis de la existencia de una raíz unitaria

y, por tanto, la serie ventas no es estacionaria.

Como un primer paso para eliminar la tendencia y convertir la serie en estacionaria

se prueba con el ajuste de una tendencia lineal determinista a la serie ventas .

Para ello, se ajusta una tendencia determinista a la variable ventas del tipo:

ventas = c + ββββ t + εεεεt

Cuya estimación se presenta a continuación

Instrucciones en Eviews para la estimación de la tendencia determinista:

Quick /estimate equation

Y en la ventana de la ecuación que se abre escribir: ventas c @trend+1

El resultado de la estimación es:

Dependent Variable: VENTAS Method: Least Squares Date: 04/09/06 Time: 19:17 Sample: 1949 1999 Included observations: 51

Variable Coefficient Std. Error t-Statistic Prob. C 605.9019 1.299179 466.3730 0.0000

@TREND+1 10.39500 0.043483 239.0563 0.0000

8

R-squared 0.999143 Mean dependent var 876.1719

Adjusted R-squared 0.999126 S.D. dependent var 154.5990 S.E. of regression 4.570939 Akaike info criterion 5.915740 Sum squared resid 1023.781 Schwarz criterion 5.991498 Log likelihood -148.8514 F-statistic 57147.92 Durbin-Watson stat 0.109129 Prob(F-statistic) 0.000000

-16

-12

-8

-4

0

4

8

12

50 55 60 65 70 75 80 85 90 95

VENTAS Residuals

Analizando esos resultados podemos observar que la estimación de los

residuos presenta un estadístico Durban-Watson próximo a cero, lo que es

indicativo de una fuerte autocorrelación de primer orden y de la existencia una raíz

unitaria y que, por lo tanto, no cumplen las condiciones para que sean ruido

blanco. El gráfico de los residuos la serie ventas también muestra esos problemas y

nos indica que los residuos se han mantenido por encima y/o por debajo de la

media durante un periodo demasiado largo. Por lo tanto, el ajuste con tendencia

determinista no es adecuado puesto que olvida determinadas propiedades

importantes de la serie

Dado que el procedimiento anterior no es el adecuado, la tendencia es tipo

estocástica y utilizamos a continuación el procedimiento de la diferenciación para

9

convertir a la serie en estacionaria. Tomamos la primera diferencia en la serie

ventas para lo que generamos la serie de Dventas =ventas-ventas(-1) , es decir,

transformamos la serie de acuerdo con la siguiente expresión:

Zt =(1-B)ventas

La representación gráfica de la serie transformada y sus correspondientes

correlogramas se muestran a continuación.

7

8

9

10

11

12

13

14

15

50 55 60 65 70 75 80 85 90 95

DVENTAS

Primera diferencia de la serie ventas

10

Tanto el gráfico de la serie Dventas como su correlograma indican que la

primera diferencia de la serie puede ser estacionaria puesto que oscila en torno a

su nivel medio y el correlograma tiende a cero con cierta rapidez. No obstante, se

completa este análisis con el test DFA de raíces unitarias que se muestra a

continuación

Test de D-F Aumentado de Dventas

Null Hypothesis: DVENTAS has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=10)

t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.777505 0.0057

Test critical values: 1% level -3.571310 5% level -2.922449 10% level -2.599224 *MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(DVENTAS) Method: Least Squares Date: 04/11/06 Time: 21:55 Sample (adjusted): 1951 1999 Included observations: 49 after adjustments

Variable Coefficient Std. Error t-Statistic Prob. DVENTAS(-1) -0.381068 0.100878 -3.777505 0.0004

C 3.942637 1.078866 3.654428 0.0006 R-squared 0.232898 Mean dependent var -0.092714

Adjusted R-squared 0.216577 S.D. dependent var 1.193536 S.E. of regression 1.056413 Akaike info criterion 2.987596 Sum squared resid 52.45244 Schwarz criterion 3.064813 Log likelihood -71.19611 F-statistic 14.26955 Durbin-Watson stat 2.473364 Prob(F-statistic) 0.000445

El test DFA rechaza la hipótesis nula de una raíz unitaria en Dventas puesto

que el valor del estadístico t (3,78) supera el valor de los puntos críticos de la

11

distribución DFA. Este resultado corrobora la estacionariedad de la serie Dventas

que indican el gráfico y el correlograma de la serie

Por lo tanto, de estos resultados la transformación que convertiría a la serie

en estacionaria sería:

Zt = (1-B) ventas o ventas ∼∼∼∼I (1)

Una vez decidido el grado de integración de la serie, es decir, el número de raíces

unitarias que tiene, se debe determinar cuales son los posibles procesos ARMA

que generan la serie.

El análisis de los correlograma de la serie Dventas nos dice que el modelo más

claro que puede generar la serie es un AR(2), puesto que el correlograma simple

tiende a cero con cierta rapidez y el parcial se anula después del segundo retardo.

También se puede sugerir como un modelo alternativo, aunque no tan

rotundamente como en el caso anterior, un MA(3) puesto que el correlograma

simple se anula después del tercero o cuarto retardo. Por otro lado, de la

observación del gráfico de la serie que consideramos estacionaria, D(ventas,1), se

observa que su media es distinta de cero, por lo que procede en principio la

inclusión de un término independiente.

Los modelos sugeridos son:

1.1) ARIMA(2,1,0) : (1- φφφφ1B- φφφφ2B2 ) (1-B) ventas = C+a t

1.2) ARIMA(0,1,3) : (1-B) ventas = C+ (1+ θθθθ1B+ θθθθ2B2+ θθθθ3B3)at

Un análisis más detallado de la estructura del correlograma podría sugerir algún

modelo adicional pero de momento nos quedamos con los propuestos.

Estimación

12

Una vez especificados varios modelos alternativos como posibles generadores de

la serie se debe proceder a la estimación de los mismos. Para ello en Eviews se

deben dar las siguientes instrucciones para estimar los modelos sugeridos.

Modelo 1.1: Quick/Estimate Equation/ LS d(ventas,1) c ar(1) ar (2)

Modelo 1.2: Quick/Estimate Equation/ LS d(ventas,1) c ma(1) ma (2) ma(3)

Los resultados de la estimación de estos modelos se presentan a continuación:

Estimación Modelo1.1

Dependent Variable: DVENTAS Method: Least Squares Date: 04/09/06 Time: 19:10 Sample (adjusted): 1952 1999 Included observations: 48 after adjustments Convergence achieved after 3 iterations

Variable Coefficient Std. Error t-Statistic Prob. C 10.11214 0.616994 16.38936 0.0000

AR(1) 0.368149 0.135783 2.711310 0.0095 AR(2) 0.388732 0.127968 3.037719 0.0040

R-squared 0.525916 Mean dependent var 10.45896

Adjusted R-squared 0.504846 S.D. dependent var 1.392085 S.E. of regression 0.979571 Akaike info criterion 2.857057 Sum squared resid 43.18014 Schwarz criterion 2.974007 Log likelihood -65.56936 F-statistic 24.95999 Durbin-Watson stat 1.991277 Prob(F-statistic) 0.000000

Inverted AR Roots .83 -.47

Estimación modelo 1.2

Dependent Variable: DVENTAS Method: Least Squares Date: 04/09/06 Time: 19:02 Sample (adjusted): 1950 1999 Included observations: 50 after adjustments Convergence achieved after 13 iterations Backcast: 1946 1948

Variable Coefficient Std. Error t-Statistic Prob.

13

C 10.43083 0.392970 26.54353 0.0000

MA(1) 0.497157 0.101433 4.901323 0.0000 MA(2) 0.564666 0.097743 5.777057 0.0000 MA(3) 0.632436 0.086339 7.324991 0.0000

R-squared 0.557023 Mean dependent var 10.57670

Adjusted R-squared 0.528133 S.D. dependent var 1.498800 S.E. of regression 1.029564 Akaike info criterion 2.972767 Sum squared resid 48.76011 Schwarz criterion 3.125729 Log likelihood -70.31917 F-statistic 19.28094 Durbin-Watson stat 2.161780 Prob(F-statistic) 0.000000

Inverted MA Roots .15-.88i .15+.88i -.79

Una vez estimados los modelos especificados se debe validar dichas estimaciones,

es decir, se debe contrastar la adecuación del modelo a los datos, por medio de

una batería de tests estadísticos y econométricos vistos en clase y que se

encuentran en Eviews en el objeto ecuación.

Validación o chequeo

En la etapa de validación se presentan tres bloques de análisis: Un primero

referente a los resultados de la estimación, un segundo centrado en el análisis de

los residuos y, finalmente, un tercero dedicado a la comparación de modelos

alternativos.

• Análisis de la estimación.-

Referente a la significatividad individual de los coeficientes por medio del

estadístico t de student pone de relieve que todos los coeficientes del modelo 1 son

altamente significativos y también lo son los del modelo 2.

En cuanto a las condiciones de estacionariedad e invertibilidad de los modelos

estimados, todas las raíces de los polinomios de retardos caen fuera de circulo de

radio unidad, ver cuadros anteriores de estimaciones, debe tenerse en cuenta que

Eviews muestra la inversa de las raíces, por lo que esas inversas caen todas dentro

del circulo de radio unidad.

14

De la observación de los resultados de la estimación se deduce que el modelo 1.1

presenta un error estándar (0,979), ligeramente más bajo que el del modelo 1.2

(1,029) y tanto el estadístico de Akaike como el criterio de Schwarz son inferiores

en el primer modelo, 2,857 y 2,974, frente a 2,973 y 3,126

En esta etapa también se suele analizar las correlaciones entre los coeficientes

estimados para verificar la posible existencia de multicolinealidad en el modelo. La

existencia de multicolinealidad indica una falta de precisión en las estimaciones

obtenidas y una cierta inestabilidad de los coeficientes estimados. Para obtener las

correlaciones entre los coeficientes se acude su matriz de correlaciones que

proporciona Eviews, para ello nos situamos en la ecuación estimada y marcamos lo

siguiente:

View/Correlation Matrix

La ejecución de esta instrucción muestra la matriz de coeficientes de la

ecuación estimada. Para el modelo 1.1 se tiene:

Matriz de correlaciones del modelo 1

C AR(1) AR(2) C 0.380682 -0.005342 -0.015880

AR(1) -0.005342 0.018437 -0.011620 AR(2) -0.015880 -0.011620 0.016376

Se observa que esa matriz presenta unas correlaciones muy bajas por lo que no

muestra indicios de multicolinealidad. Para el modelo 1.2 se puede verificar de la

misma forma que tampoco presentan problemas de multicolinealidad.

Análisis de los residuos.

El siguiente paso dentro del proceso de validación es el análisis de los

residuos de ambos modelos. Para ello en el objeto ecuación de Eviews se ofrecen

varios contrastes pero nos limitamos al contraste de que los residuos sean ruido

blanco, inspeccionando el correlograma de residuos, el estadístico Q de Box-

15

Pierce y el gráfico de residuos. Para ello, en Eviews una vez dentro del objeto

ecuación

Instrucciones: View/ Residual Tests/Correlogram-Q-Statistics

Los resultados para el modelo1.1 se presentan en la tabla adjunta y se puede

contemplar que las autocorrelaciones de los residuos no son significativas y entran

dentro de las bandas de confianza, lo que indica que no son distintas de cero. Por

su parte, el estadístico Q no muestra indicios de autocorrelación global de los

residuos, puesto que el valor de Q estimado para los diferentes ordenes de

autocorrelación que se muestran en la tabla adjunta es siempre inferior al punto

crítico de la χ2 con los correspondientes grados de libertad y niveles de significación

estándar utilizados en el trabajo empírico, lo que nos lleva a rechazar ampliamente

la hipótesis nula de autocorrelación global de los residuos.

Correlograma de los residuos del modelo 1

Instrucciones Eviews para el gráfico de residuos: View/Actual, Fitted, residuals

16

-3

-2

-1

0

1

2

6

8

10

12

14

16

55 60 65 70 75 80 85 90 95

Residual Actual Fitted

El gráfico de los residuos también apoya la ausencia de autocorrelación residual,

puesto que la gran mayoría de los residuos entran dentro de las bandas de

confianza, con excepción del correspondiente al año 1962. Por lo tanto, también

muestra claramente que los residuos son ruido blanco.

De la misma forma que el análisis llevado a cabo para el modelo 1.1 se

puede entrar en el objeto ecuación del modelo 1.2 y verificar que sus residuos son

ruido blanco.

Comparación de modelos alternativos.

Del análisis que se acaba de realizar en los dos apartados anteriores se

deduce que el modelo 1.1 supera el conjunto de pruebas estadísticas para validar

sus estimaciones. Aunque el análisis de residuos es satisfactorio para ambos

modelos, el modelo 1.1 presenta una menor varianza residual y un menor Akaike y

Schwarz, por lo que es preferible al 1.2.

17

Por lo tanto, el crecimiento anual de las ventas de la empresa, ∆∆∆∆ventas , que

es la variable modelizada viene explicada de forma satisfactoria por un modelo

sencillo ARIMA(2,1,0).

3. Ejemplo 2. El Índice de Empleo de un determinado país

La serie a modelizar es el índice de empleo de un determinado país, la serie

está corregida de estacionalidad y tiene frecuencia trimestral. El periodo muestral

abarca 1962:1 1993:4. Una vez creado el WorKfile y establecido el periodo

muestral, se cargan los datos tal y como se ha hecho en el ejemplo anterior. La

serie la denominamos empleo en el Workfile

El primer paso en la modelización de la serie es su representación gráfica. Para ello

en Eviews, la instrucción es:

Quick/ Graph/ Graph Line/empleo

El resultado es el gráfico adjunto 1a en el que se puede contemplar como la serie

empleo muestra una tendencia creciente en los primeros 20 años y después y

muestra un marcado comportamiento cíclico en los 10 años últimos. La serie no

parece mostrar cambios en la varianza ante desplazamientos del tiempo, lo que se

puede comprobar tomando logaritmos en la serie y representando gráficamente esa

serie, vemos que los gráficos de ambas series son similares, por lo que

trabajaremos con la serie original. Para ello, en Eviews

GENR Lempleo =LOG(empleo)

y para su representación gráfica:

Quick/ Graph/ Graph Line/ empleo

Grafico 1 a Gráfico 1b

18

80

85

90

95

100

105

110

115

1965 1970 1975 1980 1985 1990

EMPLEO

4.40

4.45

4.50

4.55

4.60

4.65

4.70

4.75

1965 1970 1975 1980 1985 1990

LEMPLEO

También se muestra a continuación el correlograma de la serie empleo

En Eviews una vez dentro del objeto serie empleo

View/Correlogram

El correlograma confirma un elevado grado de dependencia de las observaciones

de la serie empleo y su no estacionariedad en media por el lento decrecimiento de la

FAC.

19

Se realiza también el test de DFA de raíces unitarias, cuyos resultados se presentan

a continuación. Para ello, en Eviews:

Quick/ SERIES STATISTIC/ Unit root / empleo

Test D-F aumentado de la serie empleo

Null Hypothesis: EMPLEO has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=12)

t-Statistic Prob.* Augmented Dickey-Fuller test statistic -2.205738 0.2054

Test critical values: 1% level -3.482879 5% level -2.884477 10% level -2.579080 *MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(EMPLEO) Method: Least Squares Date: 04/19/08 Time: 21:29 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments

Variable Coefficient Std. Error t-Statistic Prob. EMPLEO(-1) -0.039278 0.017807 -2.205738 0.0293

D(EMPLEO(-1)) 0.478736 0.078727 6.080986 0.0000 C 3.982081 1.807249 2.203394 0.0294 R-squared 0.243969 Mean dependent var 0.014150

Adjusted R-squared 0.231676 S.D. dependent var 1.662605 S.E. of regression 1.457341 Akaike info criterion 3.614626 Sum squared resid 261.2326 Schwarz criterion 3.682156 Log likelihood -224.7214 F-statistic 19.84590 Durbin-Watson stat 2.064222 Prob(F-statistic) 0.000000

El test DFA no rechaza la hipótesis nula de la existencia de una raíz unitaria en

empleo puesto que el valor del estadístico t (-2.205) es notablemente inferior a los

valores críticos de la distribución DFA

20

Si ajustamos una tendencia temporal lineal simple de tipo determinista a la serie

empleo (como hicimos en el capítulo 1 del programa de la asignatura y práctica 1 y

en la modelización de la serie ventas que acabamos de realizar, y restamos de

empleo la línea ajustada, podremos comprobar que ese no es un procedimiento

correcto para convertir a la serie en estacionaria, ya que los residuos tenderán a

estar por encima y por debajo de la media durante períodos seguidos demasiado

largos (se deja al alumno que lo compruebe). Por lo tanto, es claro que esa

tendencia no es determinista sino estocástica y debemos proceder con

diferenciaciones para eliminar esa tendencia.

Comenzamos tomando una primera diferencia regular en la serie empleo , cuyo

gráfico se muestra a continuación así como su correlograma.

Instrucciones en Eviews:

Genr DEMPLEO =D(EMPLEO,1)

Quick/Graph/Line Graph/DEMPLEO

Quick/Series Statistic/Correlogram

-6

-4

-2

0

2

4

6

8

1965 1970 1975 1980 1985 1990

D(EMPLEO,1)

21

El gráfico de DEMPLEO muestra que la serie podría ser estacionaria y también en

ese sentido apunta el correlograma al mostrar un decaimiento con cierta rapidez. No

obstante, se realiza también el test de DFA, cuyos resultados se muestran a

continuación, y corrobora también la no existencia de una raíz unitaria en la serie

DEMPLEO y que, por tanto, esa transformación convierte a la serie en estacionaria.

Test DFA de la serie DEMPLEO

Null Hypothesis: D(EMPLEO,1) has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=12)

t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.751657 0.0000

Test critical values: 1% level -3.482879 5% level -2.884477 10% level -2.579080 *MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(EMPLEO,2) Method: Least Squares Date: 04/19/08 Time: 21:28 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments

22

Variable Coefficient Std. Error t-Statistic Prob. D(EMPLEO(-1),1) -0.537417 0.079598 -6.751657 0.0000

C 0.006063 0.131846 0.045988 0.9634 R-squared 0.268803 Mean dependent var -0.003332

Adjusted R-squared 0.262906 S.D. dependent var 1.723714 S.E. of regression 1.479881 Akaike info criterion 3.637545 Sum squared resid 271.5657 Schwarz criterion 3.682566 Log likelihood -227.1654 F-statistic 45.58488 Durbin-Watson stat 2.029454 Prob(F-statistic) 0.000000

Por lo tanto la serie EMPLEO tiene una raíz unitaria y la primera diferencia convierte

a dicha serie en estacionaria, eliminado su tendencia. La serie es del tipo:

Zt =(1-B)EMPLEO o EMPLEO ∼∼∼∼I(1)

Es decir, es integrada de orden 1

Determinado el grado de diferenciación ó de raíces unitarias, pasamos a

especificar el orden de los polinomios AR y MA. Del análisis de los correlogramas

de la serie DEMPLEO se deduce que en la FAC existen 2 ó tres coeficientes que

son distintos de cero y después todos son cero, mientras que en la FAP solo existe

un coeficiente significativo (que no es cero) el primero, y después tienden

rápidamente a cero (o “muy” rápidamente en este caso, ya que los coeficientes

segundo y siguientes están todos dentro de las bandas de no significación). Esto

sugiere que la serie (DEMPLEO) podría haber sido generada por modelos con

estructura MA hasta orden 2 o estructura AR(1). Los modelos que vamos a

considerar en esta práctica son ARIMA (1,1,0), ARIMA(1;1,2) y ARIMA(2,1,1).

Por otro lado, de la observación del gráfico de la serie DEMPLEO se deduce

que la media de la serie aparentemente es cero por lo que debe no debe incluirse el

término constante en los modelos especificados

Los modelos tentativos serian por tanto:

2.1. ARIMA(1,1,0) o (1- φφφφ1 B)(1-B)EMPLEO = a t

23

2.2. ARIMA(1,1,2) ) o (1- φφφφ1 B )(1-B)EMPLEO= (1+ θθθθ1B+θθθθ2B2)at

2.3. ARIMA(2,1,1) ) o (1- φφφφ1 B- φφφφ2 B2) (1-B)EMPLEO= (1+ θθθθ1B) a t

Estimación

La estimación de los modelos anteriores en Eviews se hace por medio de las

siguientes instrucciones:

Quick/ Estimate Equation/ LS EMPLEO ar(1)

Quick/ Estimate Equation/ LS EMPLEO ar(1) ma(1) m a(2)

Quick/ Estimate Equation/ LS EMPLEO ar(1) ar(2) ma (1)

Los resultados de la estimación de estos modelos se presentan a continuación:

Estimacion modelo 2.1

Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 00:48 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments Convergence achieved after 2 iterations

Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.462622 0.079275 5.835666 0.0000 R-squared 0.214051 Mean dependent var 0.014150

Adjusted R-squared 0.214051 S.D. dependent var 1.662605 S.E. of regression 1.473962 Akaike info criterion 3.621689 Sum squared resid 271.5704 Schwarz criterion 3.644200 Log likelihood -227.1664 Durbin-Watson stat 2.029500

Inverted AR Roots .46

Estimacion modelo 2.2

Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 01:37 Sample (adjusted): 1962Q3 1993Q4

24

Included observations: 126 after adjustments Convergence achieved after 8 iterations Backcast: 1961Q3 1961Q4

Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.515070 0.312357 1.648981 0.1017

MA(1) -0.070881 0.324334 -0.218544 0.8274 MA(2) 0.008407 0.170031 0.049446 0.9606

R-squared 0.215272 Mean dependent var 0.014150

Adjusted R-squared 0.202513 S.D. dependent var 1.662605 S.E. of regression 1.484742 Akaike info criterion 3.651880 Sum squared resid 271.1483 Schwarz criterion 3.719411 Log likelihood -227.0684 Durbin-Watson stat 1.992157

Inverted AR Roots .52

Inverted MA Roots .04+.08i .04-.08i

Estimacion modelo 2.3

Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 01:12 Sample (adjusted): 1962Q4 1993Q4 Included observations: 125 after adjustments Convergence achieved after 19 iterations Backcast: 1961Q4

Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.459695 0.094065 -4.886990 0.0000

AR(2) 0.426099 0.082802 5.145983 0.0000 MA(1) 0.956981 0.046168 20.72805 0.0000

R-squared 0.239708 Mean dependent var 0.002497

Adjusted R-squared 0.227244 S.D. dependent var 1.664120 S.E. of regression 1.462870 Akaike info criterion 3.622385 Sum squared resid 261.0787 Schwarz criterion 3.690265 Log likelihood -223.3991 Durbin-Watson stat 2.031913

Inverted AR Roots .46 -.92

Inverted MA Roots -.96

Validación

25

En cuanto al modelo 2.1, todos los coeficientes son individualmente significativos

según el contraste de la t de student y el ajuste es globalmente aceptable. También

son altamente significativos los coeficientes del modelo 2.3. Sin embargo en el

modelo 2.2 los coeficientes de los de los parámetros MA no son significativos por lo

que el modelo es rechazable. Todos los modelos cumplen las condiciones de

estacionariedad y de invertibilidad puesto que tanto las raíces de los polinomios

autorregresivos como los de media móvil caen fuera del círculo de radio unidad,

aunque en el modelo 2.3 haya una raíz cercana a la unidad en el polinomio

autorregresivo y otra en el polinomio de medias móviles. A su vez, las matrices de

correlaciones de los coeficientes de estos modelos no muestran signos de

multicolinealidad

Desde el punto de vista del error estándar de los modelos estimados el 2.1 es el

que presenta un valor menor (1,4739) seguido del 2.3, aunque muy cerca (1,4628).

Desde el punto de vista del criterio de Akaike, tanto el modelo 2.1 como el 2.3

presentan el mismo valor (3,622)

El análisis de los residuos de los dos modelos seleccionados a través de sus

correspondientes correlogramas, el estadístico Q y sus gráficos de residuos, que se

presentan a continuación, nos indica que ambos cumplen las condiciones para ser

considerados como ruido blanco. No obstante, el modelo 2.3 puede ser mejor desde

el punto de vista del error estándar de la ecuación. Ambos modelos presentan

residuos atípicos en la observación 87:1 y en la 92:1 y la raíz del polinomio media

móvil roza la unidad, lo que puede estar indicando sobrediferenciación. Se deja al

alumno que pruebe con la serie original EMPLEO, sin diferenciación, y corrija la

serie de atípicos y pruebe con especificaciones alternativas.

Correlograma de los residuos del modelo 2.1

26

Grafico de residuos del modelo 2.1

-4

0

4

8

-8

-4

0

4

8

1965 1970 1975 1980 1985 1990

Residual Actual Fitted

Correlograma de los residuos del modelo 2.3

27

Grafico de residuos del modelo 2.3

-4

0

4

8

-8

-4

0

4

8

1965 1970 1975 1980 1985 1990

Residual Actual Fitted

4. Ejemplo 3. Ventas de cigarros puros de una empre sa tabaquera

La serie a modelizar es el volumen de ventas mensual de puros de una

empresa tabaquera para el periodo muestral 1989:01 1996:12. El objetivo que se

28

persigue con este ejercicio es que el alumno aprenda a construir un modelo

univariante de una serie de frecuencia mensual que tiene una marcada tendencia y

estacionalidad.

Una vez creado el fichero de trabajo en Eviews para esa frecuencia y periodo

muestral, de la misma forma como se ha realizado en los dos ejercicios anteriores,

se realiza la representación gráfica de la serie objeto de análisis. La serie se

denomina puros

Instrucciones: Quick/Graph/ puros/Line graph

200

300

400

500

600

700

800

1989 1990 1991 1992 1993 1994 1995 1996

PUROS

Ventas de puros de una empresa tabaquera

Este gráfico es indicativo de una serie en la que el nivel disminuye con el

tiempo y muestra, por tanto, una tendencia decreciente. La media no se mantiene

constante y disminuye con el tiempo y la serie muy probablemente no será

estacionaria en media, por lo que necesitará una diferencia regular. También se

observa un marcado patrón estacional con picos en octubre y valores bajos en

29

diciembre. La varianza es visualmente un tanto mayor al principio de la muestra

(año 1989) que al final, años 1995 y 1996, pero en el resto de los años parece muy

uniforme.

Tomamos logaritmos en la serie puros y realizamos su representación gráfica. Para

ello en Eviews:

GENR Lpuros= log(puros)

Quick/Graph/ Lpuros/Line graph

5.4

5.6

5.8

6.0

6.2

6.4

6.6

1989 1990 1991 1992 1993 1994 1995 1996

LPUROS

Evolución logaritmica de las ventas de puros

Este gráfico del logaritmo de la variable carga (Lpuros ) es muy similar al

anterior y la varianza parece estable, por lo que en adelante decidimos trabajar con

la transformación logarítmica o sin ella es indiferente, por lo que decidimos trabajar

con la métrica original.

30

Como hemos visto en los dos ejemplos anteriores el correlograma es un

instrumento útil para verificar la estacionariedad de la serie. A continuación se

presentan los correlogramas.

Instrucciones: Una vez en el objeto serie puros, View/ Correlogram

El correlograma de la serie puros decae lentamente, tanto en la parte regular

(1,2,3,etc) como en la estacional (12,24,36,etc), por lo que confirma la no

estacionariedad apuntada anteriormente. Pasamos, en primer lugar, a corregir la no

estacionariedad en la parte regular tomando una diferencia de orden 1 y

representamos el gráfico de esa serie transformada y su correspondiente

correlograma.

Instrucciones Eviews: Genr dpuros=D(puros,1)

Quick/Graph/dpuros/Line graph

Quick/series statistic/correlogram/dpuros

31

-250

-200

-150

-100

-50

0

50

100

150

1990 1991 1992 1993 1994 1995 1996

DPUROS

Según la gráfica de la primera diferencia regular, d(puros,1), la transformación

parece que ha eliminado la tendencia regular pero persiste una cierta la tendencia

estacional. El análisis del correlograma indica que, si bien se ha corregido la no

estacionariedad de la parte regular, persiste la no estacionariedad en el componente

32

estacional, al ser significativos en el correlograma simple los retardos 12, 24 y

también podría serlo el de 36, por lo que se debe tomar una diferencia de tipo

estacional junto con la regular.

Instrucciones: Genr dd12puros=d(puros,1,12)

Quick/Graph/Line Graph/dd12puros

Quick/series statistic/correlogram/dd12puros

-150

-100

-50

0

50

100

150

1990 1991 1992 1993 1994 1995 1996

DD12PUROS

El gráfico de dd12puros muestra una clara estacionariedad en media y el

correlograma de esta variable que se muestra a continuación parece que no ofrece

dudas sobre la estacionariedad.

33

No obstante, se elabora el test de DFA para la serie dd12puros para verificar si

esta transformación es estacionaria

Test DFA de la serie dd12puros

Null Hypothesis: DD12PUROS has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=11)

t-Statistic Prob.* Augmented Dickey-Fuller test statistic -12.63026 0.0001

Test critical values: 1% level -3.513344 5% level -2.897678 10% level -2.586103 *MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(DD12PUROS) Method: Least Squares Date: 04/13/08 Time: 14:33 Sample (adjusted): 1990M04 1996M12 Included observations: 81 after adjustments

34

Variable Coefficient Std. Error t-Statistic Prob. DD12PUROS(-1) -2.275417 0.180156 -12.63026 0.0000

D(DD12PUROS(-1)) 0.447603 0.101841 4.395103 0.0000 C -0.630273 4.413679 -0.142800 0.8868 R-squared 0.828732 Mean dependent var -0.086420

Adjusted R-squared 0.824341 S.D. dependent var 94.75286 S.E. of regression 39.71255 Akaike info criterion 10.23755 Sum squared resid 123012.8 Schwarz criterion 10.32623 Log likelihood -411.6206 F-statistic 188.7137 Durbin-Watson stat 2.110029 Prob(F-statistic) 0.000000

Los resultados del test DFA son concluyentes sobre la estacionariedad de la serie

dd12lcarga, el estadístico t (-12.630) supera ampliamente los valores críticos de la

distribución ADF, lo que confirma la estacionariedad de esta transformación ya

adelantada por el análisis gráfico y el del correlograma.

A la vista de los resultados anteriores, la transformación que se sugiere es:

Zt =(1-B) (1-B 12)puros

Para finalizar la etapa de especificación inicial debemos determinar cuales son los

modelos estacionales multiplicativos ARMA (p,q) Χ ARMA(P,Q)S que pueden

generar la serie.

Del análisis del correlograma de la serie dd12puros se deduce que el proceso

generador de datos puede tener un componente media móvil regular de orden 1

MA(1), puesto que en el correlograma simple después del primer coeficiente

significativo el resto son ceros, y otro estacional de orden MA(1)12 , puesto que

después del coeficiente de orden 12 significativo el resto son ceros, es decir un

ARMA (0,1)(0,1)12.

3.1. ARIMA(0,1,1)××××(0,1,1)12 o (1-B)(1-B12)puros= (1+ θθθθ1B)(1+θθθθ12B12)at

Estimación del modelo 3.1

35

Dependent Variable: DD12PUROS Method: Least Squares Date: 04/13/08 Time: 18:09 Sample (adjusted): 1990M02 1996M12 Included observations: 83 after adjustments Convergence achieved after 14 iterations Backcast: 1987M12 1988M12

Variable Coefficient Std. Error t-Statistic Prob. MA(1) -0.677779 0.066918 -10.12847 0.0000

SMA(12) -0.867044 0.034549 -25.09612 0.0000 R-squared 0.662434 Mean dependent var -0.481928

Adjusted R-squared 0.658267 S.D. dependent var 52.83531 S.E. of regression 30.88643 Akaike info criterion 9.722312 Sum squared resid 77271.69 Schwarz criterion 9.780597 Log likelihood -401.4760 Durbin-Watson stat 2.546859

Inverted MA Roots .99 .86-.49i .86+.49i .68 .49-.86i .49+.86i .00+.99i -.00-.99i -.49-.86i -.49+.86i -.86+.49i -.86-.49i -.99

Grafico residuos del modelo 3.1

-80

-40

0

40

80

1990 1991 1992 1993 1994 1995 1996

DD12PUROS Residuals

36

Correlograma residuos del modelo 3.1

3.2. ARIMA(2,1,0)××××(0,1,1)12 ,, (1- φφφφ1B-φφφφ2B2) (1-B)(1-B12) puros= (1+ θθθθ12B12)at

Dependent Variable: D(PUROS,1,12) Method: Least Squares Date: 04/10/06 Time: 02:01 Sample (adjusted): 1990M04 1996M12 Included observations: 81 after adjustments Convergence achieved after 7 iterations Backcast: 1988M01 1988M12

Variable Coefficient Std. Error t-Statistic Prob.

3.1. AR(1) -0.952059 0.096127 -9.904132 0.0000

AR(2) -0.562088 0.095416 -5.890927 0.0000 MA(12) -0.903840 0.022752 -39.72502 0.0000

R-squared 0.732067 Mean dependent var -0.148148

Adjusted R-squared 0.725197 S.D. dependent var 53.43293 S.E. of regression 28.01044 Akaike info criterion 9.539365 Sum squared resid 61197.62 Schwarz criterion 9.628049 Log likelihood -383.3443 Durbin-Watson stat 2.068255

Inverted AR Roots -.48-.58i -.48+.58i

Inverted MA Roots .99 .86-.50i .86+.50i .50-.86i .50+.86i .00+.99i -.00-.99i -.50+.86i

37

-.50-.86i -.86+.50i -.86-.50i -.99

Validación El modelo 3.1 presenta todos su coeficientes significativos, según el t ratio, la matriz de coeficientes que se puede consultar en la ventana de la ecuación no proporciona coeficientes de correlación elevados por lo que no presentan signos de multicolinealidad. Analizando los correlogramas de los residuos se observa que todos los coeficientes de autocorrelación no son distintos de cero ya que entran dentro de las bandas de confianza. El gráfico de residuos también indica que los residuos son ruido blanco. El modelo, en principio, parece válido pero presenta alguna raíz de la media móvil próxima a la unidad lo que puede indicar sobrediferenciación. No obstante, la identificación del grado de diferenciación a través del análisis gráfico, los correlogramas de la serie y el test DFA de raíces unitarias se decantaban por una raíz de tipo regular y otra estacional. El modelo 3.2 también tiene todos los coeficientes significativos, los residuos que se pueden consultar en la ventana de la ecuación son ruido blanco a través de la observación del gráfico de los residuos y de su correlograma. Este modelo tiene también una raíz de la media móvil próxima a la unidad, sin embargo, tiene un Akaike inferior al 3.1 y también un error estándar de la ecuación menor por lo que será preferido al 3.1. La mejora del modelo puede venir por corregir algunos residuos atípicos que pueden distorsionar el análisis y la especificación.