Modelos VAR

download Modelos VAR

of 24

Transcript of Modelos VAR

Modelos vectoriales autoregresivos (VAR)Alfonso Novales Universidad Complutense Marzo 2003 1. IntroduccinUtilizamos un modelo del tipo vector autoregresivo (VAR) cuando queremos caracterizar las interacciones simultneas entre un grupo de variable. Un VAR es un modelo de ecuaciones simultneas formado por un sistema de ecuaciones de forma reducida sin restringir. Que sean ecuaciones de forma reducida quiere decir que los valores contemporneos de las variables del modelo no aparecen como variables explicativas en ninguna de las ecuaciones. El conjunto de variables explicativas de cada ecuacin est constituido por un bloque de retardos de cada una de las variables del modelo. Que sean ecuaciones no restringidas signica que aparece en cada una de ellas el mismo grupo de variables explicativas. As, en un modelo vectorial autoregresivo de primer orden, VAR(1), las variables explicativas de cada ecuacin son: una constante, ms un retardo de cada una de las variables del modelo. Si el modelo pretende explicar el comportamiento temporal de 3 variables, habra 3 variables explicativas, ms constante, en cada ecucin, para un total de 12 coecientes a estimar. Si el modelo fuera de segundo orden, VAR(2), habra 7 coecientes a estimar en cada una de las 3 ecuaciones que componen el modelo VAR. Como puede verse, todas las variables son tratadas simtricamente, siendo explicadas por el pasado de todas ellas. Pueden incluirse tambin, como variables explciativas, algunas variables de naturaleza determinista, como una posible tendencia temporal, variables cticias estacionales, o una variable cticia de tipo impulso o escaln, que sirve para llevar a cabo una anlisis de intervencin en el sistema. Por ltimo, podra incluirse como explicativa una variable, incluso en valor contemporneo, que pueda considerarse exgena respecto a las variables que integran el modelo VAR.

El modelo VAR es muy til cuando existe evidencia de simultaneidad entre un grupo de variables, y que sus relaciones se transmiten a lo largo de un determinado nmero de perodos. Al no imponer ninguna restriccin sobre la versin estructural del modelo, nos e incurre en los errores de especicacin que dichas restricciones pudieran causar al ejercicio emprico. De hecho, la principal motivacin detrs de los modelos VAR es la dicultad en identicar variables como exgenas, como es preciso hacer para identicar un modelo de ecuaciones simultneas. Por el contrario, en un modelo VAR todas las variables se tratan de igual modo: el modelo tienen tantas ecuaciones como variables, y los valores retardados de todas las ecuaciones aparecen como variables explicativas en todas las ecuaciones. Una vez estimado el modelo, puede procederse a excluir algunas variables explicativas, en funcin de su signicacin estadstica, pero hay razones para no hacerlo. Por un lado, si se mantiene el mismo conjunto de variables explicativas en todas las ecuaciones, entonces la estimacin por mnimos cuadrados ordinarios ecuacin por ecuacin es eciente, por lo que el proceso de estimacin del modelo es verdaderamente sencillo. Por otro, la presencia de bloques de retardos como variables explicativas hace que la colinealidad entre variables explicativas sea importante, lo que hace perder precisin en la estimacin del modelo y reduce los valores numricos de los estadsticos tipo t de Student. En un modelo VAR estimado no tiene mucho sentido tratar de interpretar los signos y las magnitudes de los coecientes individuales. Por el contrario, hay que utlizar estadsticos de tipo ms global, que traten de resumir con carcter agregado la inuencia de unas variables sobre otras. Ms adelante nos referiremos a este tipo de estadsticos, que incluye estadsticos tipo F para el contraste de signicatividad de un bloque de retardos de una determinada variable, contrastes de causalidad, funciones de respuesta al impulso, y descomposiciones de la varianza del error.

2. El modelo VAR(1)En el caso ms simple, con slo dos variables y un retardo, el modelo VAR2 (1) es, y1t = 10 + 11 y1t1 + 12 y2t1 + u1t y2t = 20 + 21 y1t1 + 22 y2t1 + u2t o, en forma matricial,

2

y1t y2t

!

=

10 20

!

+

11 12 21 22

!

y1t1 y2t1

!

+

u1t u2t

!

(2.1)

donde los trminos de error satisfacen, E(u1t ) = E(u2t ) = 0, t E(u1t u1s ) = E(u2t u2s ) = E(u1t u2s ) = 0, t 6= s ! ! u1t 2 12 1 V ar = = , t u2t 12 2 2 En el modelo VAR anterior, valores negativos de 12 y 21 tienden a inducir correlacin negativa entre y1t e y2t si bien no la garantizan. Un shock inesperado en y2t , en la forma de un valor no nulo de la innovacin u2t , adems de afectar a y2t , inuye sobre y1t , a travs de de la correlacin entre las innovaciones de ambas variables. En general, una sorpresa en y2t vendr acompaada de un valor no nulo de la innovacin u1t , salvo en el caso excepcional en que u1 u2 = 0. Estos efectos se propagan en el tiempo debido a la presencia de los valores retardados como variables explicativas. En general, un modelo VAR se especica, Yt = A0 +K X

As Yts + ut

(2.2)

s=1

donde Yt es un vector columna nx1, K es el orden del modelo VAR, o nmero de retardos de cada variable en cada ecuacin, y ut es un vector nx1 de innovaciones, es decir, procesos sin autocorrelacin, con V ar(ut ) = , constante. El elemento (i, j)en la matriz As , 1 s K mide el efecto directo de un cambio en Yi en el instante t sobre las variables explicativas al cabo de s perodos, Yj,t+s . El elemento i-simo en ut es el componente de Yit que no puede ser previsto utilizando el pasado de las variables que integran el vector Yt .

3. Un modelo estructuralEs til interpretar el modelo VAR como forma reducida de un modelo estructural, y1t = 10 + 11 y2t + 12 y1t1 + 13 y2t1 + 1t y2t = 20 + 21 y1t + 22 y1t1 + 23 y2t1 + 2t 3 (3.1)

donde y1t , y2t son variables estacionarias, y 1t , 2t son innovaciones, procesos ruido blanco con esperanza cero y varianzas 21 , 22 . Este es un modelo de ecuaciones simultneas con la nica peculiaridad de que sus dos variables son endgenas. Un shock inesperado en y2t , en la forma de un valor no nulo de la innovacin estructural 2t , afecta directamente a y2t , pero tambin inuye sobre y1t a travs de la presencia de y2t como variable explicativa en la primera ecuacin. Adems, este efecto se propaga en el tiempo, debido a la presencia de los valores retardados como variables explicativas. Es natural pensar que los trminos de error del modelo estructural estn mutuamente incorrelacionados, puesto que la correlacin contempornea entre y1t e y2t ya est capturada por la presencia de sus valores contemporneos como variables explicativas en ambas ecuaciones. Por tanto, suponemos que Cov(1t , 2t ) = 1 ,2 = 0. De forma resumida, la representacin matricial del modelo estructural puede escribirse, Byt = 0 + 1 yt1 + t con, B= ! ! !

1 11 21 1

; 0 =

10 20

; 1 =

12 13 22 23

y si suponemos que la matriz B tiene inversa, lo cual requiere que 11 21 6= 1, tenemos, yt = B 1 0 + B 1 1 yt1 + B 1 t = A0 + A1 yt1 + ut donde, B !1

1 = 1 11 211

!

1 11 21 1

! !

ut = A1 = A0 =

u1t u2t

= B t = B!

1

1t 2t

11 12 21 22 10 20

1 12 + 11 22 13 + 11 23 = 1 11 21 22 + 21 12 23 + 13 21 ! ! 1 10 + 11 20 = 1 11 21 20 + 21 10 4

1 = 1 11 21

1t + 11 2t 2t + 21 1t!

,(3.2) (3.3) (3.4)

con lo que habremos pasado a la forma reducida, o modelo VAR. Como puede verse, si los trminos de error del modelo estructural eran ruido blanco, tambin los trminos de error del modelo VAR tandrn estructura ruido blanco. Sin embargo, las innovaciones del VAR estarn correlacionadas entre s, puesto que, V ar

u1t u2t

!

de modo que, incluso si los trminos de error del modelo estructural estn incorrelacionados, 1 2 = 0, las perturbaciones del modelo VAR tendrn correlacin no nula. Es importante examinar las relaciones entre los parmetros de ambos modelos, que son, en el caso del modelo VAR(1), las 6 relaciones entre los parmetros y los parmetros que aparecen en (3.3), ms las 3 relaciones entre los elementos de las respectivas matrices de covarianzas, 2 1 = u 2 2 u u1 u2 1 (1 11 21 )2 1 = (1 11 21 )2 1 = (1 11 21 )2

1 = (1 11 21 )2

21 + 2 22 21 21 + 11 22 11 21 21 + 11 22 21 21 + 22

!

21 + 2 22 11 22 + 2 21 21

21 21 + 11 22

4. Identicacin en un modelo VARLa estimacin de un modelo VAR(1) bivariante proporciona valores numricos para 6 parmetros: las dos constantes ms los cuatro coecientes en las variables retardadas, ms los 3 parmetros de la matriz de covarianzas del vector ut . Sin embargo, el modelo estructural consta de 11 parmetros: las dos constantes, los 6 coecientes, y los 3 parmetros de la matriz de covarianzas del vector t , por lo que no es posible recuperar los parmetros del modelo estructural. En el ejercicio 1 se prueba que el modelo estructural recursivo bivariante de orden 1, y1t = 10 + 11 y2t + 12 y1t1 + 13 y2t1 + 1t y2t = 20 + 22 y1t1 + 23 y2t1 + 2t 5 (4.1)

est exactamente identicado, es decir, que sus parmetros pueden recuperarse de forma nica a partir de las estimaciones del modelo VAR asociado. Este es un modelo interesante, en el que se consigue identicar todos los parmetros del modelo estructural a partir de las estimaciones de la forma reducida (modelo VAR), introduciendo la hiptesis de que la variable y1t afecta a la variable y2t nicamente con un retardo, mientras que la direccin de inuencia de y2t hacia y1t se maniesta ya dentro del mismo perodo. No slo se pueden recuperar estimaciones de todos los parmetros que aparecen en el modelo estructural. Tambin las series temporales de los residuos del modelo estructural pueden recuperarse a partir de los residuos obtenidos en la estimacin del modelo VAR, mediante, 2t = u2t ; 1t + 112t = u1t Un modelo ms restringido, y1t = 10 + 11 y2t + 12 y1t1 + 13 y2t1 + 1t y2t = 20 + 23 y2t1 + 2t implicara que la variable y1t no afecta ni de forma contempornea, ni retardada, a la variable y2t , por lo que sta puede considerarse exgena respecto de y1t . Examinando los modelos anteriores, es fcil ver que las dos restricciones que hemos impuesto, 21 = 22 = 0 hacen que en el modelo VAR, 21 = 0, restriccin que puede contrastarse sin ninguna dicultad utilizando el estadstico tipo t habitual de dicho coeciente. Al haber introducido una restriccin ms, el modelo estructural est ahora sobreidenticado, es decir, hay ms de una manera de recuperar valores numricos para los parmetros de dicho modelo, a partir de las estimaciones numricas del modelo VAR. Ms dicultades plantean el modelo, y1t = 10 + 11 y2t + 12 y1t1 + 1t y2t = 20 + 21 y1t + 23 y2t1 + 2t que est asimismo sobreidenticado, habiendo varias maneras de recuperar las estimaciones de los parmetros del modelo estructural. Sin embargo, en este caso no hay ninguna restriccin contrastable sencilla que nos permita discutir esta 6

representacin. En este caso, las restricciones del modelo estructural introducen restricciones no lineales entre lso parmetros del modelo VAR. Una posible estrategia consiste en estimar el modelo VAR sujeto a las restricciones no lineales generadas por las condiciones de sobreidenticacin. El problema de obtener las innovaciones estructurales a partir de las del modelo VAR equivale a la posibilidad de disponer de valores numricos para los elementos de la matriz B, puesto que t = But . Esta matriz tiene unos en la diagonal principal, pero no es simtrica, por lo que tiene k 2 k parmetros por determinar. Adems, debemos encontrar las k varianzas de las innovaciones estructurales; recurdese que sus covarianzas son nulas. As, tenemos k 2 parmetros del modelo estructural, que querramos recuperar a partir de los (k 2 + k) /2 elementos de V ar(ut ). Necesitamos, por tanto, (k 2 k) /2 restricciones adicionales, si queremos tener alguna posibilidad de identicar el modelo. En el caso de un modelo VAR(1) con 2 variables, hemos de imponer (22 2) /2 = 1 restricci n para identicar el sistema exactamente, como hemos constatado en los ejemplos anteriores. En un modelo con 3 variables necesitaramos imponer (32 3) /2 = 3 restricciones. El nmero de restricciones necesarias para identicar el modelo es independiente del orden del modelo VAR. Si imponemos condiciones de recursividad en un modelo con 3 variables, tenemos, u1t = 1t u2t = c21 1t + 2t u3t = c31 1t + c32 2t + 3t que implica imponer 3 restricciones sobre los elementos de la matriz B 1 , por lo que el modelo estara, en principio, exactamente identicado. La recursividad del sistema equivale a suponer que la matriz B es triangular inferior o superior, lo que genera exactamente k 2 k restricciones, precisamente el nmero que precisamos para lograr la identicacin exacta del modelo. Hay conjuntos alternativos de restricciones, como, u1t = 1t + c13 3t u2t = c21 1t + 2t u3t = c32 2t + 3t 7

que tambin lograra la identicacin exacta del modelo. La representacin inversa es,

1t 1 c13 c32 c13 u1t 1 1 c13 c21 u2t 2t = c21 1 + c21 c13 c32 3t c21 c32 c32 1 u3t Otro tipo de restricciones consistira en imponer un determinado valor numrico para una respuesta. Por ejemplo, podemos pensar que la innovacin 2t tiene un efecto unitario sobre y1t , es decir, como, t = But =

1 11 21 1

!

ut

esto equivaldra a suponer que 11 = 1. Una posibilidad diferente consistira en identicar el modelo estructural imponiendo restricciones sobre la matriz de covarianzas, ya sea imponiendo un valor numrico para la varianza de 1t , la varianza de 2t , o la covarianza entre ambos. Este tipo de restricciones conduce a soluciones mltiples, por lo que el modelo estructural est en tal caso, sobreidenticado. Por ltimo, puede conseguirse la identicacin imponiendo restricciones razonables entre los valores numricos de los parmetros estructurales. por ejemplo, puede imponerse una condicin de simetra, 11 = 21 , o cualquier otra que resulte adecuada en la aplicacin que se analiza. En el caso del modelo de 2 variables est condicin de simetra de efectos conduce asimismo a una condicin de igualdad de varianzas para las innovaciones estructurales, lo que no ocurre en modelos con ms de 2 variables. 4.1. Identicacin y respuestas del sistema Otra manera de entender los problemas de identicacin es la siguiente: supongamos que, sin considerar el posible modelo estructural, hemos estimado un modelo VAR(1) bivariante, (2.1) , en el que queremos calcular cmo reacciona cada variable ante una innovacin en una de ellas, lo que luego denominaremos como funciones de respuesta al impulso. Sera poco adecuado, sin embargo, calcular las respuestas a un impulso en una de las innovaciones, u1 , por ejemplo, sin que u2 experimente ningn impulso, pues ambas innovaciones estn correlacionadas entre s. Por tanto, hemos de transformar primero el modelo estimado en otro modelo en que los trminos de error, siendo innovaciones, estn incorrelacionados 8

entre s. Para ello, podramos seguir una estrategia similar a la discutida ms arriba, proyectando por mnimos cuadrados una de los dos innovaciones, u1t , por ejemplo, sobre u2t , u1t = u2t + at cuyo residuo at , denido por at = u1t u2t , estara incorrelacionado, por construccin, con u2t . ! 1 , tendramos, Premultiplicando el modelo (2.1) por la matriz 0 1 y1t = ( 10 20 ) + y2t + ( 11 21 )y1t1 + ( 12 22 )y2t1 + at y2t = 20 + 22 y1t1 + 23 y2t1 + u2t un modelo en el que la variable y2 tiene efectos contemporneos sobre y1 . En este modelo, tiene sentido preguntarse por las respuestas de ambas variables a una perturbacin en at o en u2t , puesto que ambos estn incorrelacionados, por construccin. En respuesta a un impulso en u2t , ambas variables reaccionarn en el mismo instante, y tambin en perodos siguientes, hasta que dichas respuestas decaigan a cero. En cambio, en respuesta a una perturbacin en at , y1 responder en el mismo perodo y perodos siguientes, mientras que y2 slo responder en perodos siguientes al de la perturbacin. Este es el modelo estructural exactamente identicado (4.1) que antes consideramos. Una extensin a este procedimiento se basa en el hecho conocido de que dada una matriz simtrica, denida positiva, como es la matriz de covarianzas , existe una nica matriz triangular inferior A, con unos en su diagonal principal, y una nica matriz diagonal D, con elementos positivos a lo largo de su diagonal principal, tal que admite una descomposicin, = ADA0 Si consideramos la transformacin lineal del vector de error precisamente con esta matriz, t = A1 ut , tenemos, V ar (t ) = E(t 0t ) = E(A1 ut u0t A1 ) = E(A1 A1 ) = D por lo que, a diferencia de los componentes del vector u, los elementos del vector estn incorrelacionados entre s. Deshaciendo la transformacin, tenemos, 9 0 0

ut =

u1t u2t u3t ... ukt

= At =

1 a12 a13 ... a1k

0 1 a23 ... a2k

0 0 1 ... a3k

... ... ... ... ...

0 0 0 ... 1

1t 2t 3t ... kt

por lo que, kt = ukt a1k 1t a2k 2t ... ak1,k k1,t (4.2)

Si los coecientes a1k , a2k , ..., ak1,k se obtienen mediante una estimacin de mnimos cuadrados ordinarios de la ecuacin (4.2), que tiene a ukt como variable dependiente, y a 1t , 2t , ..., k1,t como variables explicativas, kt = ukt a1k 1t a2k 2t ... ak1,k k1,t (4.3)

entonces tendremos, por construccin, E(kt .1t ) = E(kt .2t ) = ... = E(kt .k1,t ) = 0. Dicho de otra manera, si estimamos regresiones de cada innovacin uit sobre todas las que le preceden dentro del vector u y nos quedamos con el residuo de dicha regresin, llammosle it , tendremos un componente de uit que, por construccin, estar incorrelacionado con u1t , u2t , ..., ui1,t . Ntese que los espacios generados por las variables u1t , u2t , ..., ui1,t y por las variables 1t , 2t , ..., i1,t son los mismos, es decir, que ambos conjuntos de variables contienen la misma informacin. La nica diferencia entre ambos es que las variables u1t , u2t , ..., ui1,t tiene correlaciones no nulas, mientras que las variables 1t , 2t , ..., i1,t estn incorrelacionadas entre s.

5. Condiciones de estabilidadSi resolvemos recursivamente el modelo VAR(1) tenemos, Yt = A0 + A1 Yt1 + ut = A0 + A1 (A0 + A1 Yt2 + ut1 ) + ut = = (Ik + A1 )A0 + A2 Yt2 + (A1 ut1 + ut ) = 1 = (Ik + A1 + A2 + ... + An1 )A0 + An Ytn + 1 1 1n1 X i=0

Ai uti 1

10

Como puede verse, para la estabilidad del sistema es preciso que las sucesivas potencias de la matriz A1 decaigan hacia cero, pues de lo contrario, el futuro lejano tendra efectos sobre el presente, en contra de la rpida amortiguacin temporal de efectos inherente a todo proceso estacionario. Esto requiere que las races del polinomio caracterstico de dicha matriz | Ik A1 |= 0, caigan fuera del crculo unidad, condicin anloga a la que se tiene para un proceso autoregresivo univariante. Cuando se cumplen las condiciones de estabilidad, tomando lmites, tenemos, Yt = + X i=0

Ai uti 1

donde = E(Y ) es el vector de esperanzas matemticas, que viene dado por, = (Ik A1 )1 A0 Adems, V ar(Yt ) = E (Yt )h2

i

=E

" Xi=0

Ai uti 1

#2

=

X i=0

Ai (V ar(uti )) Ai 1 1

0

=

X i=0

Ai Ai 1 1

0

En el caso bivariante, 1 = E(u1t ), 2 = E(u2t ), con =

1 2

!

= I2

"

11 12 21 22

!#1

10 20

!

1 =

10 (1 22 ) + 12 20 20 (1 11 ) + 21 10!i0

!

siendo = (1 11 )(1 22 ) 12 21 , y V ar(Yt ) = X i=0

11 12 21 22

!i

2 1 u1 u2 u u1 u2 2 2 u

!

11 12 21 22

6. VAR y modelos univariantesEs til asimismo pensar en trminos de cules son los modelos univariantes que se deducen de una representacin VAR, en lnea con el trabajo de Zellner y Palm (19xx). En este sentido, si partimos de un VAR(1), como (2.1), escrito en funcin del operador de retardos,

11

y1t = 10 + 11 Ly1t + 12 Ly2t + u1t y2t = 20 + 21 Ly1t + 22 Ly2t + u2t tenemos, y2t = con lo que, (1 11 L) y1t = 10 + 12 L y, nalmente, (1 11 L) (1 22 L) y1t = [(1 22 ) 10 + 12 20 ] + [(1 22 L) u1t + 12 u2t1 ] que es un proceso ARMA(2,1). 20 + 21 Ly1t + u2t + u1t 1 22 L 20 + 21 Ly1t + u2t 1 22 L

7. Estimacin de un modelo VARComo ya hemos mencionado, en ausencia de restricciones, la estimacin por mnimos cuadrados, ecuacin por ecuacin, de un modelo VAR produce estimadores ecientes a pesar de que ignora la informacin contenida en la matriz de covarianzas de las innovaciones. Junto con el hecho de que la colinealidad entre las variables explicativas no permite ser muy estricto en la interpretacin de los estadsticos t, sugiere que es preferible mantener todas las variables explicativas iniciales en el modelo. El estimador es consistente siempre que los trminos de error sean innovaciones, es decir, procesos ruido blanco, pues en tal caso, estarn incorrelacionados con las variables explicativas, por la misma razn que en un modelo univariante. Por tanto, la ausencia de autocorrelacin en los trminos de error de todas las ecuaciones es muy importante. Tomando ambos hechos conjuntamente, es fcil concluir que debe incluirse en cada ecuacin como variable explicativas, el menor nmero de retardos que permita eliminar la autocorrelacin residual en todas las ecuaciones. Existen contrastes del tipo de razn de verosimilitud sobre el nmero de retardos a incluir en el |modelo. 12

Un modelo VAR no se estima para hacer inferencia acerca de coecientes de variables individuales. Precisamente la baja precisin en su estimacin, desaconseja cualquier anlisis de coecientes individuales. Tiene mucho sentido, por el contrario, el anlisis conjunto de los coecientes asociados a un bloque de retardos en una determinada ecuacin. Bajo hiptesis de Normalidad del vector de innovaciones, el logaritmo de la funcin de verosimilitud es, l= u,T 1X = ut u0t T t=1

Tk T (1 + ln 2) ln | | 2 2

siendo la estimacin de la matriz de covarianzas del vector de innovaciones

una matriz simtrica, denida positiva, por construccin.

8. Contrastacin de hiptesis8.1. Contrastes de especicacin Uno de los contrates ms habituales en un modelo VAR es el relativo al nmero de retardos que deben incluirse como variables explicativas. hay que tener en cuenta que en cada ecuacin entra un bloque de retardos de todas las variables del vector y. Si, por ejemplo, trabajamos con 4 variables y establecemos un orden 3 para el VAR, tendremos 12 variables explicativas, ms el trmino constante, en cada ecuacin, con un total de 52 coecientes en el sistema de ecuaciones, ms 10 parmetros en la matriz de varianzas-covarianzas de las innovaciones. El nmero de parmetros a estimar crece muy rpidamente con el nmero de retardos. Si pasamos de 3 a 4 retardos, tendramos 68 coecientes ms los 10 parmetros de la matriz de covarianzas. Por eso ya comentamos con anterioridad que debe incluirse en cada ecuacin el menor nmero de retardos que permita eliminar la autocorrelacin del trmino de error de todas ellas. Existe un contraste formal de signicacin de un conjunto de retardos, que utiliza un estadstico de razn de verosimilitudes, = (T k)(ln | R | ln | SR | 13

donde | R |, | SR | denotan los determinantes de las matrices de covarianzas de los modelos restringido y sin restringir, respectivamente. Si queremos contrastar si un cuarto retardo es signicativo, deberamos estimar el modelo con 3 y con 4 retardos, y construir el estadstico anterior, que tiene una distribucin chi-cuadrado con un nmero de grados de libertad igual al nmero de restricciones que se contrastan. Al pasar del modelo con 3 retardos al modelo con 4 retardos, hay que aadir un retardo ms de cada variable en cada ecuacin, por lo que el nmero de restricciones es igual al incremento en el nmero de retardos, por el nmero de variables al cuadrado. Sin embargo, no puede olvidarse que la eleccin del nmero de retardos debe tener muy en cuenta la eliminacin de autocorrelacin residual en los residuos. Los estadsticos anteriores no examinan este importante aspecto y, por tanto, no deben utilizarse por s slos. En consecuencia, una buena estrategia es comenzar de un nmero reducido de retardos, y examinar las funciones de autocorrelacin de los residuos, junto con estadsticos del tipo Ljung-Box o Box-Pierce para contrastar la posible existencia de autocorrelacin, lo que requerira aumentar el nmero de retardos y con ello, el nmero de parmetros a estimar. Lamentablemente, sin embargo, es muy poco probable que pueda eliminarse la autocorrelacin residual con menos de 4 retardos cuando se trabaja con datos trimestrales, o con menos de 12 retardos, cuando se trabaja con datos mensuales. Una estrategia distinta para encontrar el orden del modelo VAR consiste en examinar los denominados criterios de Informacin, que son determinadas correcciones sobre el valor muestral de la funcin logaritmo de Verosimilitud. Los ms conocidos son los de Akaike y Schwartz, l n +2 T T l ln(T ) SBC = 2 + n T T AIC = 2 siendo n = k(d + pk) el nmero de parmetros estimados en el modelo VAR. d es el nmero de variables exgenas, p el orden del VAR, y k el nmero de variables. En ocasiones, se ignora el trmino constante, y los criterios anteriores se aproximan por, AIC = T ln | | +2n SBC = T ln | | +n ln(T ) 14

siendo N el nmero de parmetros que se estima, y la matriz de covarianzas de los residuos. Estos estadsticos se calculan para una sucesin de modelos con distinto nmero de retardos y se comparan, seleccionando aqul modelo que produce un menor valor del estadstico. Un estadstico de razn de verosimilitudes como el antes descrito puede utilizarse para contrastar cualquier tipo de hiptesis, y no slo la signicacin de grupos de variables, siempre que el modelo restringido est anidado dentro del modelo sin restringir. 8.2. Contrastes de causalidad Un contraste especialmente interesante es el conoce como de causalidad en el sentido de Granger: supongamos que estamos explicando el comportamiento de una variable y utilizando su propio pasado. Se dice que una variable z no causa a la variable y si al aadir el pasado de z a la ecuacin anterior no aade capacidad explicativa. El contraste consiste en analizar la signicacin estadstica del bloque de retardos de z en la ecuacin mencionada, y la hiptesis nula es que la variable z no causa, en el sentido de Granger, a la variable y. En realidad, la propuesta inicial de Granger haca referencia a que la prediccin de y basada en el pasado de las dos variables y y z, sea estrictamente mejor (es decir, con menos error) que la prediccin de y basada exclusivamente en su propio pasado. As, se dira que la variable z no causa a la variable y si se tiene, E(yt / yt1 , yt2, ...; zt1 , zt2 , ...) = E(yt / yt1 , yt2, ...) Sin embargo, esta propiedad no suele analizarse; se contrasta exclusivamente la signicacin del bloque de retardos de z en la ecuacin de y, y se supone que si dicho bloque de variables es signicativo, contribuir a mejorar la prediccin de la variable y. Esta manera de proceder se basa en que, analticamente, es evidente que la presencia del bloque de retardos de z en la ecuacin de y hace que la esperanza de y condicional en el pasado de las dos variables, y y z, sea distinta de la esperanza de y condicional en su propio pasado exclusivamente, si bien esta propiedad terica no siempre se maniesta en resultados prcticos, y es bien sabido que un buen ajuste no necesariamente conduce a una buena prediccin. El contraste puede llevarse a cabo utilizando el estadstico F habitual en el contraste de signicacin de un bloque de variables, o mediante el estadstico de razn de verosimilitudes anterior. Con ms de dos variables, existen muchos posibles contrastes de causalidad y en algunos casos, el estadstico de razn de 15

verosimilitudes puede resultar ms til que el estadstico F , al permitir contrastar la exclusin de algn bloque de retardos en varias ecuaciones simultneamente. Asimismo, el contraste de causalidad o, lo que es lo mismo, el contraste de signicacin de un bloque de retardos puede llevarse a cabo mediante un estadstico de razn de verosimilitudes, en el que el modelo restringido excluye un grupo de retardos de una ecuacin

9. Representacin MA de un modelo VARTodo modelo VAR admite una representacin de medias mviles (MA), Yt = X

Bs uts

s=0

a la que se llega tras sucesivas sustituciones de Yts en (2.2) . La representacin MA puede obtenerse asimismo en funcin de las innovaciones estructurales. Esta representacin permite resumir las propiedades de las relaciones cruzadas entre las variables que componen el vector Yt , que queda representado como una combinacin lineal de valores actuales y pasados del vector de innovaciones. la simultaneidad vuelve a quedar palpable en el sentido de que cualquier innovacin uit afecta a todas las variables Yj,t+s . Si volvemos al modelo de dos variables de orden 1, tenemos,

y1t y2t

!

=

10 20

!

+

11 12 21 22

!

y1t1 y2t1

!

+

u1t u2t

!

que, como vimos, puede escribirse,

y1t y2t

!

=

1 2

!

+

s=0

X

11 12 21 22

!s

u1ts u2ts

!

y, en trminos de las innovaciones del modelo estructural,

y1t y2t

!

= =

1 2 1 2

! !

X 1 + 1 11 21 s=0

+

s=0

X

11 12 21 22!

!s

11 (s) 12 (s) 21 (s) 22 (s) 16

1ts 2ts

!

1 11 21 1 =+

!

1ts (9.1) = 2ts

!

s=0

X

(s)ts

donde,

11 (s) 12 (s) 21 (s) 22 (s)

!

Existe un procedimiento recursivo para obtener las matrices de coecientes de la representacin de medias mviles,que utiliza la relacin, Yt = A1 Yt1 + ... + Ap Ytp + ut = (Ik A1 L A2 L ... Ap Lp )1 ut = = (0 + 1 L + 2 L2 + ...)ut de modo que tenemos, Ik = (Ik A1 L A2 L ... Ap Lp )(0 + 1 L + 2 L2 + ...) que conduce a, 0 = Ik 1 = A 1 2 = A1 1 + A2 ... s = A1 s1 + A2 s2 + ... + Ap sp que pueden utilizarse para calcular recursivamente las matrices de coecientes de la representacin de medias mviles.

1 = 1 11 21

11 12 21 22

!s

1 11 21 1

!

(9.2)

10. Funciones de respuesta al impulsoLa ecuacin (9.1) es la representacin de medias mviles del modelo VAR(1) bivariante. Los coecientes de la sucesin de matrices (s) representan el impacto que, a lo largo del tiempo, tienen sobre las dos variables del modelo y1t e y2t una perturbacin en las innovaciones 1t , 2t . Por ejemplo, los coecientes 12 (s) reejan el impacto que en los distintos perodos s, s 1, tiene sobre y1 una perturbacin del tipo impulso en 2 . Es decir, consideramos que 2 est en su valor de equilibrio, cero, excepto en un perodo, en que toma un valor igual a 1; como consecuencia, tanto y1 como y2 17

reaccionan, y dicha respuesta se extiende a varios perodos, hasta que las sucesin 12 (s) se hace cero. La sucesin de valores numricos {12 (s)} se conoce como la respuesta de y1 a un impulso en 2 . El efecto, multiplicador o respuesta a largo P plazo es la suma 12 (s). Esta suma existe si las variables son estacionarias, s=0 P pues en tal caso ha de cumplirse que | 12 (s) |< . s=0 El problema al que nos enfrentamos al tratar de calcular las funciones de respuesta al impulso es que, si bien contamos con estimaciones numricas de los parmetros ij , i, j = 1, 2, desconocemos los parmetros 11 y 21 que aparecen en (9.2). En el modelo recursivo que antes vimos, se tiene 21 = 0. Adems, se prueba en el ejercicio 1 que en este modelo el parmetro 11 puede recuperarse mediante 11 = u1 u2 / 2 2 . En ese caso, u2t = 2t y u1t = 1t +11 2t = 1t +11 u2t . u Las funciones de respuesta al impulso slo puden obtenerse bajo restricciones de este tipo. La que hemos descrito es la ms habitual, y equivale a admitir que una de las dos variables afecta a la otra slo con retraso, si bien permitimos que en la otra direccin haya respuesta contempornea. Estaremos caracterizando las respuestas del sistema a un impulso en cada una de las innovaciones del modelo estructural o, lo que es lo mismo, en la innovacin u2t y en u1t 11 u2t . Esta ltima es la componente de u1t que no est explicada por u2t o, si se preere, la componente de u1t que no est correlacionada con u2t 1 . En efecto, u1t 11 u2t = 1t + 11 2t 11 2t + 11 21 1t = (1 + 11 21 )1t que est incorrelacionado con 2t . De hecho, si 21 = 0, entonces u1t 11 u2t es, precisamente, igual a la perturbacin estructural 1t . Como hemos visto, las funciones de respuesta al impulso slo pueden obtenerse despus de haber introducido restricciones acerca del retraso con que unas variables inciden sobre otras. Esta eleccin condiciona bastante, en general, el aspecto de las funciones de respuesta, excepto si las innovaciones del modelo VAR, u1t y u2t estn incorrelacionadas, en cuyo caso, coinciden con las innovaciones del modelo estructural. Las funciones de respuesta al impulso generan una gran cantidad de nmeros, pues se calcula el impacto que, en cada instante futuro tendra, sobre cada variable del modelo, un impulso en una determinada innovacin, y ello puede repetirse para las innovaciones en cada una de las ecuaciones. Por eso, suele representarse enSi bien 11 no es el coeciente que estimaramos mediante una regresin de u1t sobre u2t . Si proyectamos u1t sobre u2t , el coeciente estimado ser igual a Cov(u1 ,u2 ) . Pero u1t =V ar(u1 )V ar(u2 ) 1

1t + 11 2t y u2t = 2t + 21 1t , por lo que Cov(u1 , u2 ) =

18

varios grcos, cada uno de los cuales incluye las respuestas a travs del tiempo, de una determinada variable a un impulso en cada una de las innovaciones; de este modo se tiene tantos grcos como variables en el modelo, cada uno de ellos conteniendo tantas curvas como variables. Alternativamente, pueden construirse grcos, cada uno de los cuales representa la respuesta temporal de todas las variables del modelo a un impulso en una de las innovaciones. Nuevamente hay tantos grcos como variables, cada uno de ellos conteniendo tantas curvas como variables. El inconveniente del segundo tipo de representacin es que las respuestas de las distintas variables dependen de sus respectivas volatilidades, por lo que la comparacin de las respuestas de dos variables diferentes a un determinado impulso no permite decir cul de las variables responde ms. Recordando que la desviacin tpica es una medida adecuada del tamao de toda variable aleatoria de esperanza nula, debemos dividir las respuestas de cada variable por su desviacin tpica antes de representarlas en un mismo grco. Tampoco un impulso de tamao unidad tiene el mismo signicado en cada variable, por lo que conviene calcular las respuestas normalizadas a un impulso de tamao igual a una desviacin tpica en cada innovacin. Consideremos un VAR(1) sin constante (es decir, las variables tiene esperanza igual a cero),

y1t 0, 5 0 0 y1t1 u1t y2t = 0, 1 0, 1 0, 3 y2t1 + u2t y3t 0 0, 2 0, 3 y3t1 u3t y supongamos que antes del instante t0 las innovaciones toman un valor cero en todos los perodos, las variables estn en sus niveles de equilibrio, y = y = 0. En dicho instante, la innovacin u1t0 toma un valor unitario, u1t0 = 1, y vuelve a ser cero en los perodos siguientes. Cul es la respuesta del sistema? En el instante t0 ,

y3

por lo que y2t0 e y3t0 estarn en sus niveles de equilibrio, y2 = y2 = 0, y3 = = 0, mientras que y1t0 = y1 + 1 = 1. Posteriormente,

y1t0 u1t0 1 y2t0 = u2t0 = 0 y3t0 u3t0 0

19

y1t0 +1 0, 5 0 0 y1t0 u1t0 +1 y2t0 +1 = 0, 1 0, 1 0, 3 y2t0 + u2t0 +1 = 0 0, 2 0, 3 y3t0 +1 y3t0 u3t0 +1

0, 5 0 0 y1 + 1 0 0, 5 = 0, 1 0, 1 0, 3 y2 + 0 = 0, 1 0 0, 2 0, 3 y3 0 0

y1t0 +2 0, 5 0 0 y1t0 +1 u1t0 +2 y2t0 +2 = 0, 1 0, 1 0, 3 y2t0 +1 + u2t0 +2 = y3t0 +2 0 0, 2 0, 3 y3t0 +1 u3t0 +2

0, 5 0 0 0, 5 0 0, 25 = 0, 1 0, 1 0, 3 0, 1 + 0 = 0, 06 0 0, 2 0, 3 0 0 0, 02

que van proporcionando la primera columna de las matrices que obtenemos calculando las sucesivas potencias de la matriz de coecientes A1 . De este modo, tendramos las respuestas del sistema a sorpresas en las innovaciones del modelo VAR. Si queremos calcular las respuestas a innovaciones estructurales, debemos utilizar la representacin,

y1t y2t

!

=

1 2

!

X 1 + 1 11 21 s=0

11 12 21 22

!s

1 11 21 1

!

1ts 2ts

!

y examinar la sucesin denida en (9.2).

11. Descomposicin de la varianzaSi utilizamos la representacin MA para obtener predicciones de las variables y1 , y2 , tenemos, Et yt+n = Et

y1t+n y2t+n

!

=+

s=n

X

(s)t+ns

por lo que el error de prediccin es,

20

et (n) = yt+n Et yt+n = + =

s=0

cuya varianza es, V ar"

(11 (0)1t+n1 + ... + 11 (n 1)1t+1 ) + (12 (0)2t+n1 + ... + 12 (n 1)2t+1 ) (21 (0)1t+n1 + ... + 21 (n 1)1t+1 ) + (22 (0)2t+n1 + ... + 22 (n 1)2t+1 ) e1t (n) e2t (n)#

X

(s)t+ns +

!

s=n

X

(s)t+ns =

!

n1 X s=0

(s)t+ns =!

=

que, inevitablemente,aumentan con el horizonte de prediccin. La expresin anterior nos permite descomponer la varianza del error de prediccin en dos fuentes, segn tenga a 1 o a 2 como causa. Con ello, estamos examinando el inevitable error de prediccin en cada variable a un determinado horizonte, y atribuyndolo a la incertidumbre acerca de la evolucin futura en cada una de las variables. Es, por tanto, una manera de hacer inferencia acerca de las relaciones intertemporales entre la variables que componen el vector y. Para ello, se expresan los componentes de cada varianza en trminos porcentuales,

21 n1 11 (s)2 + 22 n1 12 (s)2 Ps=0 Ps=0 21 n1 21 (s)2 + 22 n1 22 (s)2 s=0 s=0

P

P

!

21 n1 11 (s)2 22 n1 12 (s)2 s=0 ; s=0 V ar (e1t (n)) V ar (e1t (n))

P

P

!

y

21 n1 21 (s)2 22 n1 22 (s)2 s=0 ; s=0 V ar (e2t (n)) V ar (e2t (n))

P

P

!

Si una variable es prcticamente exgena respecto a las dems, entonces explicar casi el 100% de la varianza de su error de prediccin a todos los horizontes posibles. Esto es lo ms habitual a horizontes cortos, mientras que a horizontes largos, otras variables pueden ir explicando un cierto porcentaje de la varianza del error de prediccin. La descomposicin de la varianza est sujeta al mismo problema de identicacin que vimos antes para las funciones de respuesta al impulso, siendo necesario introducir alguna restriccin como las consideradas en la seccin anterior. Nuevamente, si la correlacin entre las innovaciones del VAR es muy pequea, la ordenacin que se haga de las variables del vector y o, lo que es lo mismo, las restricciones de exclusin de valores contemporneos que se introduzcan sern irrelevantes. En general, sin embargo, tales restricciones condicionan muy signicativamente la descomposicin de la varianza resultante. De hecho, con las restricciones de la seccin anterior, 2 explica el 100% de la varianza del error de prediccin un perodo hacia adelante en la variable y2 . Si, en vez de dicha restriccin, excluyramos y2t de la primera ecuacin, entonces 1 explicara el 100% de la varianza del error de prediccin un perodo hacia adelante en la variable y1 . 21

11.1. Identicacin recursiva: la descomposicin de Cholesky Para eliminar la correlacin contempornea existente entre las innovaciones ut de distintas ecuaciones, podemos transformar el vector ut en un vector et mediante la transformacin denida por la descomposicin de Cholesky de la matriz de covarianzas , = V ar(ut ). Esta descomposicin nos proporciona una matriz triangular inferior G tal que GG0 = . Como consecuencia, G1 G01 = I, y el sistema VAR puede escribirse, Yt = X

As uts =

s=0

s=0

e con As = As G, ets = G1 uts , V ar (ets ) = G1 V ar(uts )G10 = I. El efecto de eit sobre Yj,t+s viene medido por el elemento (j, i) de la matriz s . La sucesin de dichos elementos, para 1 s proporciona la respuesta A dinmica de la variable Yj a una innovacin en la variable Yi . esto se conoce como funcin de respuesta de Yj a un impulso sorpresa en Yi . Como eit es el error de prediccin un perodo hacia adelante en Yit , la representacin MA ortogonalizada nos permite computar el error de prediccin de Yit , m-perodos hacia adelante, P e en el instante t m + 1, a travs del elemento i-simo en le vector m1 As ets . s=0 Pm1 e e0 Su varianza, el elemento i-simo en la diagonal de s=0 As As , puede escribirse, PK Pm1 e e e j=1 s=0 as (i, j) as (j, i) , siendo as (i, j) el elemento (i, j) genrico de la matriz s . Al aumentar m, a partir de m = 1, esta descomposicin de la varianza element A del error de prediccin de Yit+m entre las k variables del vector Yt se conoce como descomposicin de la varianza de Yit . Proporciona una estimacin de la relevancia de cada variable del sistema para explicar los errores de prediccin de las uctuaciones futuras en Yit .

X

(As G) G1 uts =

s=0

X

e As ets

(11.1)

12. Ejercicios Considere el modelo estructural recursivo, y1t = 10 + 11 y2t + 12 y1t1 + 13 y2t1 + 1t y2t = 20 + 22 y1t1 + 23 y2t1 + 2t donde y1t afecta a y2t slo con cierto retraso. Note que este modelo permite identicar el trmino de error 2t a partir de las observaciones de la variable 22

y2t . Pruebe que este modelo est exactamente identicado, en el sentido de que todos sus coecientes, as como las varianzas de los dos trminos de error pueden recuperarse a partir de la estimacin del modelo VAR(1) en estas dos variables. 10 = 10 + 11 20 ; 11 = 12 + 11 22 ; 12 = 13 + 11 23 ; 20 = 20 ; 21 = 22 ; 22 = 23 ; 2 1 = 21 + 2 22 ; 2 2 = 22 ; u1 ,u2 = 11 22 ; u 11 u sistema que puede resolverse para obtener los 9 parmetros del modelo estructural recursivo. Muestre que en este modelo, no slo se pueden recuperar estimaciones de todos los parmetros que aparecen en el modelo estructural, sino tambin las series temporales de los trminos de error 1t y 2t .

23

13. Apndice13.1. Las innovaciones de un modelo estructural deben estar incorrelacionadas entre s. De hecho, si dicha covarianza no fuese nula, podramos transformar el modelo del siguiente modo: proyectaramos uno de los dos errores, 2t , por ejemplo, sobre 1t , 2t = 1t + at teniendo que el residuo at , denido por at = 2t 1t , estara incorrelacionado, por construccin, con 1t . Si representamos el modelo estructural en forma matricial,

1 11 21 1

!

y1t y2t

!

=

10 20

!

+

12 13 22 23!

!

y1t1 y2t1

!

+

1t 2t

!

y premultiplicamos por la matriz

1 0 1

, tendramos,

y1t = 10 + 11 y2t + 12 y1t1 + 13 y2t1 + 1t (13.1) (1 + 11 )y2t = (20 10 ) + ( + 21 )y1t + (22 12 )y1t1 + (23 13 )y2t1 + at un modelo VAR en el que, una vez despejramos y2t en la segunda ecuacin, sera indistinguible del modelo (3.1) con Cov(1t , at ) = 0. Siempre debemos estar considerando esta ltima representacin con errores ortogonalizados, por lo que la condicin de ausencia de correlacin entre los errores de las distintas ecuaciones en el modelo VAR estructural debe satisfacerse siempre. 13.2. Errata en Enders, pgina 299,h2

V ar(Yt ) = E (Yt )

i

=E

" Xi=0

Ai uti 1

#2

=

X i=0

A2i (V ar(uti )) = (Ik A2 )1 1 1!

V ar(Yt ) = (I2 h

A2 )1 1

1 = Mi h

21 12 + 2 ( 11 + 22 ) 12 22 ( 11 + 22 ) 21 21 12 + 2 11 i

con M = 1 21 12 + 2 11

1 21 12 + 2 22 24

( 11 + 22 )2 12 21 .