Post on 03-Jul-2015
Econometría I
Mg. Beatriz Castañeda
20010-1
Facultad de Economía - UNMSM
2Mg. Beatriz Castañeda
Econometría
La Econometría se ocupa del estudio de estructuras que permitan analizar características o propiedades de una variable económica utilizando como causas explicativas otras variables económicas.
3Mg. Beatriz Castañeda
Modelo
Un modelo es la representación simplificada de cualquier fenómeno, proceso, institución y en general de cualquier sistema.
Un sistema es un conjunto de elementos que se encuentran en interacción.
4Mg. Beatriz Castañeda
Tipos de modelo
Modelo mental: Representación no explícita o exteriorizada.
Modelo verbal: Descripción del modelo mental en lenguaje ordinario.
Modelo físico: Representación de un sistema en forma material o mediante objetos.
Modelo matemático: Descripción del sistema con la ayuda del lenguaje matemático.
5Mg. Beatriz Castañeda
Modelo económico y modelo econométrico
Modelo económico. Son leyes o relaciones económicas que son aplicables con validez general a diversos sistemas concretos a través del tiempo.
Modelo econométrico: Es un modelo específico de aplicación a sistemas reales concretos, basado en un modelo económico pero desarrollado con las características particulares del sistema en estudio. Tiene validez limitada por el sistema de referencia o el periodo temporal.
6Mg. Beatriz Castañeda
Objeto y método de la investigación econométrica
El papel esencial de la econometría es la estimación y verificación de los modelos econométricos.
Proceso: Especificación del modelo en forma matemática. Reunión de datos apropiados y relevantes de la
economía o sector que el modelo se propone describir.
Con los datos se estima los parámetros del modelo Realizar pruebas con el modelo para analizar si es
valido o si es necesario modificar la especificación.
7Mg. Beatriz Castañeda
Tipos de modelos econométricos
Modelos estructurales: la especificación, lineal o no lineal, del modelo se basa en las relaciones estructurales establecidas por el modelo económico para explicar el comportamiento, la variable o sistema bajo estudioModelos de regresión uniecuacionalesModelos de simulación o multiecuacional
8Mg. Beatriz Castañeda
Tipos de modelos econométricos
Modelos de series temporales: Examinan el comportamiento pasado de una serie temporal para inferir su comportamiento futuro. Se utiliza cuando se tiene escaso conocimiento sobre las relaciones causales del proceso que se trata de predecir. Son muy fiables para predicciones a corto plazo. Modelos Uniecuacionales: ARIMA, SARIMA Modelos Multiecuacionales: VAR
9Mg. Beatriz Castañeda
Relación entre variables económicas y regresión espúrea
Todo modelo econométrico exige una teoría económica previa, sin ella caere-mos en el mero cálculo de relaciones observacionales entre las variables.
Regresión espúrea: Es aquella regresión que no tiene significado ni explicación en la teoría económica
10Mg. Beatriz Castañeda
El cálculo de coeficientes de correlación y el trazado satisfactorio de líneas de regresión no debe confundirse con un método para hallar leyes, confusión tan frecuente en las ciencias sociales.
Cuando se adopta un modelo de regresión lineal y se calculan los parámetros a partir de los datos, la ley central que se supone rige esa información ruidosa (dispersa) no se ha descubierto, sino que se ha supuesto desde el principio.
No hay elaboración de datos estadísticos que produzca por si nuevas hipótesis, por no hablar ya de leyes, en general, no hay esfuerzo técnico, por grande que sea, ni empírico, ni matemático, que pueda ahorrarnos el trabajo de inventar nuevas ideas, aunque sin duda aquel trabajo técnico puede muy bien disimular la falta de ideas.
Mario Bunge
11Mg. Beatriz Castañeda
Proceso de contrastación de teorías según Koutsoyiannis (1973)
Teoría
Expresión matemática de la teoría:Modelo
Confrontación del modelo con los datos
Aceptación de la teoría si es compatible
con lo datos
Confrontación con nuevos datos
Rechazo de la teoría si es incompatible
con lo datos
Revisión de la teoría si es incompatible
con lo datos
12Mg. Beatriz Castañeda
Compatibilidad con datos con elevada probabilidad
Incompatibilidad con datos con elevada probabilidad
Contraste con datos no con-cluyente (reducida prob. o resul-tados opuestos compensados)
Teoría
Modelo adoptado para contrastación
Confrontación del modelo con datos del marco de referencia
Conjunto de datos 1
Modelo econo-métrico 1
Modelo econo-métrico 2
Modelo econo-métrico N-1
Modelo econo-métrico N
Conjunto de datos 2
Conjunto de datos N-1
Conjunto de datos N
Para todos los modelos y conjuntos de datos
Confirma eventualmente la bondad de la teoría
Nuevos modelos
econométricos y aplicacióncon nuevos
datos
Nuevos desarrollos
teóricos
Nuevos desarrollos teó-ricos en la misma línea
Para algunos modelos y conjuntos de datos
Informa sobre grado de aceptabilidad de la teoría
Nuevos desarrollos teó-ricos c/posibles correc.
Para todos los modelos y conjuntos de datos
Rechazo de la teoría
Búsqueda de nuevoscaminos teóricos
PROCESO GENERAL DE CONTRASTACIÓN DE TEORIAS
13Mg. Beatriz Castañeda
El papel de los modelos econométricos en la investigación económica aplicada
a) Análisis estructural: Nos permite evaluar el impacto en Y t de
las variaciones ocurridas en Xt y Zt.
b) Predicción de Yt dados unos hipotéticos valores futuros para
Xt y Zt.
c) Evaluación de políticas o simulación de los efectos que
tienen sobre YT+h diferentes estrategias que afectan a las
variables explicativas.
ttt ZbXbbY 210 ++=Sea el modelo estimado
El conocimiento de los coeficientes b0, b1 y b2 nos permite realizar
14Mg. Beatriz Castañeda
MODELO ECONOMETRICO
LINEAL NO LINEAL
Multiecuacional UniecuacionalUniecuacional Multiecuacional
15Mg. Beatriz Castañeda
Modelo de regresión lineal múltiple
niparaXXY ikikii ,1,....221 =++++= εβββ
Sean las variables Y, X2, …., Xk, ε donde:
Y : variable observable (variable endógena o variable explicada)
X2, …., Xk : variables predeterminadas (variable exógenas o variables explicativas)
ε : variable aleatoria no observable (variable perturbación)
Dada una muestra de tamaño n, tenemos:
Se plantea el modelo:
nKnKnn
KK
KK
XXY
XXY
XXY
εβββ
εβββεβββ
++++=
++++=++++=
...
............
...
...
221
2222212
1121211
16Mg. Beatriz Castañeda
Notación matricial
+
=
nkknnn
k
k
n xxx
xxx
xxx
y
y
y
ε
εε
β
ββ
......
...1
...............
...1
...1
...2
1
2
1
32
23222
13121
2
1
Y X β + ε=
nKnKnn
KK
KK
XXY
XXY
XXY
εβββ
εβββεβββ
++++=
++++=++++=
...
............
...
...
221
2222212
1121211
niparaXXY ikikii ,1,....221 =++++= εβββ
17Mg. Beatriz Castañeda
1. Yi es variable observable, variable dependiente.
2. Xi son variables fijas (con valores predeterminados, no colineales (linealmente independientes). Rango (X) = K. Variables explicativas o independientes.
3. ε i son variables aleatorias homocedasticas e incorrelacionadas, es decir, E(ε i ) = 0; V(ε i ) = σ2 ; Cov (ε i, ε j ) = 0.
Supuestos del modelo
=
==
=
0)(
.....
0)(
0)(
)( 2
1
nE
E
E
E
ε
εε
ε
[ ]
=
=
==
2
2
2
221
22212
12121
212
1
...00
............
0...0
0...0
)(...)()(
............
)(...)()(
)(...)()(
......
´)()(
σ
σσ
εεεεε
εεεεεεεεεε
εεε
ε
εε
εεε
nnn
n
n
n
n
EEE
EEE
EEE
EEV
4. El número de observaciones excede al de parámetros a estimar.
18Mg. Beatriz Castañeda
Propiedades de matrices y Distribuciones de probabilidad
1. A es simétrica AT = A
2. A es idempotente An = A
3. A es simétrica e idempotente ρ(A) = Traza (A)
4. Si ∃ AB y BA Traza (AB) = Traza (BA)
19Mg. Beatriz Castañeda
Propiedades de matrices y Distribuciones de probabilidad
5. Si X(kx1) es N(µ, V) y si Tpxk es una matriz de coeficientes con ρ(T) = p
TX tiene distribución N(Tµ, TVT´)
Puesto que TX genera combinaciones lineales de variables normales
6. Si X(kx1) es N(0, I) y A es una matriz simétrica e idempotente
X´AX es χ2(r) con r = Traza(A)
7. X´AX y X´BX son formas cuadráticas independientes AB=0
20Mg. Beatriz Castañeda
Estimador de Mínimos Cuadrados Ordinarios (MCO)
niparaXXY ikikii ,1,....221 =++++= εβββ
=
kβ
ββ
β
ˆ...
ˆ
ˆ
ˆ 2
1
)ˆ...ˆˆˆ(ˆ33221 kikiiiiii XXXYYYe ββββ ++++−=−=
Dado el estimador
Obtenemos el valor calculado
kikiii XXXY ββββ ˆ...ˆˆˆˆ33221 ++++=
y el residuo o error de estimación
Sea
21Mg. Beatriz Castañeda
El método de mínimos cuadrados ordinarios consiste en obtener los estimadores de β i minimizando la suma de cuadrados de los errores, esto es,
eeXXXYeS kikii
n
ii
n
ii
´)]ˆ...ˆˆˆ([)ˆ( 23322
11
1
2 =++++−== ∑∑==
βββββ
[ ] ∑=
=
==n
i
n
n ie
e
e
e
eeeeeS1
22
1
21 ......´)ˆ(β
)ˆ)´(ˆ()ˆ)´(ˆ(´)ˆ( βββ XYXYYYYYeeS −−=−−==
YY
YY
YY
YY
e
nn
ˆ
ˆ......
ˆ
ˆ
22
11
−=
−
−−
=
22Mg. Beatriz Castañeda
Para minimizar )ˆ(βS por la condición de primer orden obtenemos las derivadas
respecto a cada iβ̂
23322
11 )]ˆ...ˆˆˆ([)ˆ( kikii
n
ii XXXYS βββββ ++++−= ∑
=
e igualamos a 0
0)1()ˆ...ˆˆˆ((2ˆ)ˆ(
33221
1
1
=−++++−=∂
∂ ∑=
kikii
n
ii XXXY
S βββββ
β
0)()ˆ...ˆˆˆ((2ˆ)ˆ(
233221
1
2
=−++++−=∂
∂ ∑=
ikikii
n
ii XXXXY
S βββββ
β
0))(ˆ...ˆˆˆ((2ˆ)ˆ(
33221
1 =−++++−=∂
∂ ∑=
kikikii
n
ii
k
XXXXYS βββββ
β
…………………………….
Con estas igualdades formamos un sistema de ecuaciones, denominadas ecuaciones normales
23Mg. Beatriz Castañeda
∑∑∑∑====
++++=n
ikik
n
ii
n
ii
n
ii XXXnY
1133
122
11
ˆ...ˆˆˆ ββββ
ki
n
iiki
n
ii
n
i
n
ii
n
iii XXXXXXXY
i ∑∑∑∑∑=====
++++=1
231
231
22
12
112
ˆ...ˆˆˆ2
ββββ
∑∑∑∑∑=====
++++=n
iki
n
ikii
n
iki
n
iki
n
ikii ki
XXXXXXXY1
23
132
12
111
ˆ...ˆˆˆ ββββ
…………………………….
=
∑∑∑∑
∑∑∑∑∑∑∑
kkiikiiki
kiiiiii
kiii
nknkkk
n
kixxxxxx
xxxxxx
xxxn
y
y
y
xxxx
xxxx
β
ββ
ˆ...
ˆ
ˆ
...
...............
...
...
...
...
...............
...
1...111
2
1
232
23222
2
32
2
1
321
2232221
X´Y = (X´X)β̂ YXXX ´)´(ˆ 1−=β
Sistema de ecuaciones normales
24Mg. Beatriz Castañeda
)ˆ()´ˆ´()ˆ)´(ˆ(´)ˆ( βββββ XYXYXYXYeeS −−=−−==
Utilizando la expresión matricial para )ˆ(βS
ββββ ˆ´´ˆˆ´´´ˆ´ XXXYYXYY +−−=
βββ ˆ´´ˆ´´ˆ2´ XXYXYY +−=
0ˆ)´(2´2ˆ)ˆ( =+−=
∂∂ β
ββ
XXYXS
β̂)´(´ XXYX = YXXX ´)´(ˆ 1−=β
25Mg. Beatriz Castañeda
Propiedades de los estimadores
ββ =)ˆ(E
εβεββ ´)´()´()´(´)´(ˆ 111 XXXXXXXYXXX −−− +=+==
βεββ =+= − )(´])´[()ˆ( 1 EXXXE
1) Insesgado:
2) 12 )´()ˆ( −= XXV σβ
εββ ´)´(ˆ 1XXX −=−
)´]ˆ)(ˆ[()ˆ( βββββ −−= EV ])´(´´)´[( 11 −−= XXXXXXE εε12111 )´()´()´()´(´)(´)´( −−−− == XXXIXXXXXXEXXX σεε
12 )´( −= XXσ
Función lineal de las perturbacionesFunción lineal de las obs. Y
26Mg. Beatriz Castañeda
Teorema de Gauss-Markov
seaydelinealestimadorunYASea ββ ~~ = queodekxTmatrizXXXAA mod,´;)´(~ 1−−=
εββεββ ´])´[()(´])´([])´([~ 111 XXXAXXXXXAYXXXA −−− ++=++=+=
El estimador MCO es el estimador lineal insesgado óptimo, en el sentido de que cualquier otro estimador lineal insesgado tiene una matriz de covarianzas “mayor” que la del estimador MCO
Demostración
βββ += AXELuego )~( 0
~ =AXquetalesAsisóloinsesgadoseráasí β
εββ ´])´([~ 1XXXA −++=Si se cumple condición, el vector quedaría expresado como:
La matriz de convarianzas de seráβ~
}{ )´´])´(([)´])´(([)´]~
)(~
[()~( 11 εεβββββ XXXAXXXAEEV −− ++=−−=
)ˆ()´()´(´ 12122MCOVXXXXAA βσσσ εεε =⟩+= −−
27Mg. Beatriz Castañeda
Estimador de σ2
YXXXXXXYe ´)´(ˆ 1−−+=−= εββ)´()´( 1 εβεβ +−+= − XXXXXX
εε ´)´( 1XXXX −−=
εε MXXXXI =−= − ´])´([ 1
eidempotentesimétricaesM
MXXXXIXXXXIM =−=−= −− ´)´(´]´)´([´ 11
´])´(´][)´([ 11 XXXXIXXXXIMM −− −−=
´)´(´)´(´)´(´)´( 1111 XXXXXXXXXXXXXXXXI −−−− +−−=
MXXXXI =−= − ´)´( 1
28Mg. Beatriz Castañeda
εεεεεεβ MMMMMeeeS i ´´´))´((´)ˆ( 2 ===== ∑
+== ∑∑∑
≠=ji
jiij
n
iiii aaEMEeE
iεεεεε
1
22 )´()(
)(2 ∑∑ += jiijii Eaa εεσ
)()( 22 knMTraza −== εε σσ
´))´(()( 1XXXXITrazaMTraza nxn−−=
´))´(()( 1XXXXTrazaITraza −−=
knITrazanXXXXTrazan kxk −=−=−= − )()´)´(( 1
kn
ee
kn
ei−
=−
= ∑ ´ˆ
22εσ Es un estimador insesgado de
2εσ
29Mg. Beatriz Castañeda
kn
ee
kn
ei−
=−
= ∑ ´ˆ
22εσ
22ˆ eS=εσCálculo de
βββ ˆ´´ˆ´´ˆ2´´ XXYXYYee +−=
]´)´[(´´ˆ´´ˆ2´´ 1 YXXXXXYXYYee −+−= ββ
YXYYee ´´ˆ´´ β−=
kn
YXYYSe −
−== )´´(ˆ´ˆ 22 βσ ε
30Mg. Beatriz Castañeda
Para las variables Y, X2, X3, X4 se planteó el siguiente modelo
Y`Y = 10
−−−
−
=
−
−
=
−−
= −
125.0000
01818.00227.00455.0
00227.01591.00682.0
00455.00682.01364.0
)`(
8000
0602
0084
02410
`
3
2
3
3
´ 1XXXXYX
niparaXXXY iiiii ,1,4433221 =++++= εββββ
Obtenemos los estimadores de los parámetros con la siguiente información resumida de la data obtenida para una muestra:
YXXX ´)´(ˆ 1−=β
−−
=
38.0
16.0
64.0
52.0
β̂
iiii XXXY 432 38.016.064.052.0 +−−=
8466,06
9205,410)´´(ˆ´ˆ 22 =−=
−−==
kn
YXYYSe
βσ ε
31Mg. Beatriz Castañeda
niparaXXXY iiiii ,1,4433221 =++++= εββββ
iiiii eXXXY ++−−= 432 38.016.064.052.0
Modelo:
Modelo estimado
9201,0;8466,02 == ee SS
−−−
−
== −
1058.0000
01539.0019.00455.0
0019.01347.0058.0
00385.0058.01154.0
)`()(ˆ 12ˆ XXSV eβ
32Mg. Beatriz Castañeda
y
ii XY 21ˆˆˆ ββ +=y
x
•
••
•• •
• •
•
xi
yi
Coeficiente de determinación R2
)ˆ()ˆ( yyyYyY iiii −+−=−VariaciónTotal
Variaciónexplicada porla regresión
Variaciónno explicadaerror
∑∑
−−
==2
22
)(
)ˆ(
yY
yy
SCT
SCRR
i
i Este coeficiente indica en que proporción la variación de Y es explicada por el
modelo de regresión
∑∑
−−=−=
2
22
)(11
yY
e
SCT
SCER
i
i
∑∑∑===
−+−=−n
ii
n
iii
n
ii YyyYYY
1
2
1
2
1
2 )ˆ()ˆ()(
SCT SCE SCR= +
33Mg. Beatriz Castañeda
∑∑
−−=−=
2
22
)(11
yY
e
SCT
SCER
i
i
22
22
2
222 )´´ˆ´(
)(
)(
YnY
YXYYYnY
YY
eYYR
i
i
i
ii
−−−−
=−
−−=
∑∑
∑∑∑ β
2
22
´
´´ˆ
YnYY
YnYXR
−−= β
34Mg. Beatriz Castañeda
Coeficiente de determinación ajustado 2R
∑∑
−−=
2
22
)(1
yY
eR
i
i
Al considerar a R2 como un indicador del poder explicativo del modelo, debemos tener en cuenta que al comparar dos modelos con diferente número de variables explicativas, el modelo con más variables siempre tendrá un R2 mayor. Para determinar que tanto mejora el poder explicativo del modelo al adicionar nuevas variables se propone una modificación en el cálculo del R2 al que se denomina R2 ajustado.
)1(1
1)]1/([
)]/([1 22
Rkn
n
nSCT
knSCER −
−−−=
−−−=
Este coeficiente es sensible al número de variables adicionadas, de manera que si las variables adicionadas no incrementan de manera significativa el poder explicativo el R2 ajustado se reducirá.
35Mg. Beatriz Castañeda
Distribuciones de los estimadores
Si el vector de perturbaciones ε tiene distribución normal multivariante ),0( 2 IN εσentonces:
εββ ´)´(´)´(ˆ 11 XXXYXXX −− +==Es función lineal de las perturbaciones, y por lo tanto
))´(,(ˆ 12 −XXNnormalóndistribucitiene εσββ
1)
Luego, cada 12 )´();,(.ˆ −∈ XXadondeaNdistribtiene iiiiii εσββ
2)
2)(22
2
.´)(
kne disttiene
MSkn−=− χ
σεε
σ εε
),0(.1nINdisttieneε
εσ
36Mg. Beatriz Castañeda
3) 2)(
1 .)ˆ()]ˆ()´[ˆ( kdisttieneV χβββββ −− −
21 )ˆ(´)´ˆ(
)ˆ()]ˆ()´[ˆ(εσ
βββββββββ −−=−− − XXV
222
´))´(()]ˆ([)]´ˆ([
εεε σεε
σεε
σββββ NNNXX ==−−=
εεββββ +−=−−=−=− )ˆ()(ˆˆ)ˆ( YYYYXXX
εεεεε NXXXXMIM ==−=+−= − ´))´(()( 1
Traza(N) = K
37Mg. Beatriz Castañeda
2)(22
2
.´)(
kne disttiene
MSkn−=− χ
σεε
σ εε
2)(2
1 .´
)ˆ()]ˆ()´[ˆ( kdisttieneN
V χσ
εεβββββε
=−− −
0)( =−=−= MMMMIMMN
Entonces las dos formas cuadráticas son independientes
Luego
),(2 ./)]ˆ(´)´ˆ[(
knke
FdisttieneS
kXXF −
−−= ββββ
38Mg. Beatriz Castañeda
Estimación y Prueba de Hipótesis para los parámetros del modelo
1. Para iβ
),(ˆ 2iiii aNesComo εσββ
2)(2
2
.)(
kne disttieneSkn
y −− χσ ε
)(
2)(
2)(
)ˆ(
)ˆ(kn
iie
ii
kn
eSkn
iiaii
tesaS
T −
−
−
−
−== ββ
εσ
εσ
ββ
0 t1-α/2t(n-k)
α/2α/2
- t1-α/2
2/12/1
)ˆ(αα
ββ−− <−=<− t
aSTt
iie
ii
Obtenemos
iStL i βαβ ˆ2/1
ˆ−±=
Estimación por intervalo
39Mg. Beatriz Castañeda
Prueba de Hipótesis
*1
*0 ::
ii ii HH ββββ ≠=
Estadística de la Prueba
ciertaesHsitesaS
T kniie
ii0)(
* )ˆ(−
−= ββ
0 t1-α/2t(n-k)
α/2α/2
- t1-α/2
Decisión
Rechazar la H0 a favor de H1 si
2/12/1 αα −− >−< tTotT
40Mg. Beatriz Castañeda
2. Para 2εσ
2)(2
2
.)(
kne disttieneSkn
−− χσ ε
α/2α/2
2)( kn−χ2
2/αχ 22/1 αχ −
22/12
222/
)(α
εα χ
σχ −<−< eSkn
Obtenemos 22/1
2)(
αχ −
−= ei
SknL
22/
2)(
αχe
s
SknL
−=
1-α
41Mg. Beatriz Castañeda
Prueba de Hipótesis
01
00 :: ββββ ≠= HH
=
0
02
01
0
....
kβ
ββ
β
Estadística de la Prueba
ciertaesHsiFdisttieneS
kXXF knk
e0),(2
00
./)]ˆ](´)´[ˆ[(
−−−= ββββ
α
F(k ,n-k)F1-α
Decisión
Rechazar la H0 a favor de H1 si
F > F1-α
42Mg. Beatriz Castañeda
Prueba de Hipótesis para restricciones lineales
Sea el modelo
niparaXXY iiii ,1,.... 55221 =++++= εβββ
Para el cual se formula las siguientes hipótesis
=−=+=−
23
04
83
:.1
25
14
53
0
ββββββ
HrRH =β:0
=
−
−
2
0
8
30010
04001
10300
5
4
3
2
1
βββββ
R β r
Restricciones lineales
43Mg. Beatriz Castañeda
rRH =β:0 kqRrRH qxk ≤≠ ;:0 β
Prueba de Hipótesis para restricciones lineales
Rango( R ) = q (las restriciones son linealmente independientes)
1. Prueba o Test de Wald
Estadística2)(
1 )ˆ()]ˆ()´[ˆ( qesrRrRVrRW χβββ −−−= −
))´(,(ˆ 12 −XXNes εσββ
´)]ˆ([)ˆ(
0)ˆ()ˆ(
RVRrRV
rRrERrRE
ββ
βββ
=−
=−=−=− ´))]ˆ([,0()ˆ( RVRNesrR ββ −
2)(
112 )ˆ(´])´()´[ˆ( qesrRRXXRrRW χβσβ ε −−= −−
2)(
112 )ˆ(´])´()´[ˆ( qe rRRXXRSrRW χββ →−−≅ −−
α2
)( kn−χ21 αχ −
44Mg. Beatriz Castañeda
2. Prueba F
),(
11
)/(´
/)}ˆ(´])´()´[ˆ{(knqFes
knee
qrRRXXRrRF −
−−
−−−= ββ
rRH =β:0 kqRrRH qxk ≤≠ ;:0 β
2)(
112 )ˆ(´])´()´[ˆ( qesrRRXXRrRW χβσβ ε −−= −−
2)(22
2
.´)(
kne disttiene
eeSkn−=− χ
σσ εεFqW =
α
),( knqF −α−1F
45Mg. Beatriz Castañeda
Estimación de un modelo de Regresión múltiple con EViews
1. Ingresar a EViews File New
File
workfile
Newworkfile
46Mg. Beatriz Castañeda
2. Frequency anual Range OK
47Mg. Beatriz Castañeda
3. Ingreso de datos: Quick Empty group
48Mg. Beatriz Castañeda
Aparece una planilla en blanco en la que se asigna nombre a las variables y se ingresa los datos como en una planilla excel
49Mg. Beatriz Castañeda
3. Estimación de la ecuación: Quick Estimate equation
50Mg. Beatriz Castañeda
En la ventana se especifica el modelo ingresando a la izquierda la v. dependiente luego la constante y las variables explicativas, luego presionar en OK
51Mg. Beatriz Castañeda
El programa ofrece los resultados de la estimación
52Mg. Beatriz Castañeda
Dependent Variable: INV
Method: Least Squares
Date: 04/01/07 Time: 17:38
Sample: 1971 1994
Included observations: 24
Variable Coefficient Std. Error t-Statistic Prob.
C 5.228449 29.00686 0.180249 0.8587
PNB 0.213205 0.011921 17.88539 0.0000
R -0.828817 3.239046 -0.255883 0.8005
R-squared 0.941937 Mean dependent var 41.13333
Adjusted R-squared 0.936407 S.D. dependent var 20.97122
S.E. of regression 5.288459 Akaike info criterion 6.285400
Sum squared resid 587.3238 Schwarz criterion 6.432656
Log likelihood -72.42479 F-statistic 170.3368
Durbin-Watson stat 0.787335 Prob(F-statistic) 0.000000
Modelo estimado
eRPNBINV +−+= 83.021.023.5
53Mg. Beatriz Castañeda
Para guardar el modelo: Name Se escribe el nombre Se escribe la especificación OK
54Mg. Beatriz Castañeda
Análisis de significancia de las variables
niparaXXY ikikii ,1,....221 =++++= εβββ
Sea el modelo
0:0: 10 ≠= ii HH ββ
Estadística de la Prueba
ciertaesHsitesS
T kni
i
0)(ˆ
ˆ−=
β
β
1) Análisis de significancia de la variable Xi
0 t1-α/2t(n-k)
α/2α/2
- t1-α/2
55Mg. Beatriz Castañeda
2) Análisis de la significancia de un subvector de s variables
11
2
1
0
0
...
0
0
.....:
sxsxk
q
q
H
=
+
+
β
ββ
1
1
2
1
1
0
...
0
0
...
...
1...000...0
.....................
0...100...0
0...010...0
sx
kxk
q
q
q
sxk
=
+
+
β
βββ
β
q sNinguna de las s variables essignificativa para explicar a Y
Con H0 se define una partición en la matriz X :
=
+
+
+
knnqqnn
kqq
kqq
XXXX
XXXX
XXXX
X
......1
.....................
......1
......1
12
221222
111121
X1 X2
[ ]21 XXX =
( )sxsqxs IR 0=
56Mg. Beatriz Castañeda
[ ]21 XXX =
=
2
1
B
Bβ [ ] εε ++=+
= 2211
2
121 BXBX
B
BXXY
0:0: 2120 ≠= BHBH
( ) 00: 22
10 ==
= B
B
BIRH sxssxqβ
[ ] 222221
12111 00´)´( A
IAA
AAIRXXR =
=−
57Mg. Beatriz Castañeda
=
= −
2221
12111
2221
1211 )´(´AA
AAXX
BB
BBXX
112
111212222
121
122121111
)(
)(−−
−−
−=
−=
BBBBA
BBBBA
112112221
221211112
ABBA
ABBA−
−
−=
−=
[ ]
=
=
2'21
'2
2'11
'1
21'2
'1´
XXXX
XXXXXX
X
XXX
121
'2
12
'1
11
'11
'22
'222 ][])([ −−− =−= XMXXXXXXXXXA
])([ '1
11
'111 XXXXIMDonde −−=
111 ε+= BXYDel modelo restringido
=− ´)´( 1RXXR
58Mg. Beatriz Castañeda
0:0: 2120 ≠= BHBH
),(
11
)/(´
/)}ˆ(´])´()´[ˆ{(knqFes
knee
qrRRXXRrRF −
−−
−−−= ββ
( ) 00: 22
10 ==
= B
B
BIRH sxssxqβ
Entonces la estadística
Se reduce a:
),(2
221'2
' /ˆ][ˆ2
knse
FesS
sXMXF −=
ββ
59Mg. Beatriz Castañeda
Contraste de significación, mediante sumas residuales
0: 21 ≠BH
=
2
1
B
Bβ
[ ] εε ++=+
= 2211
2
121 BXBX
B
BXXYModelo sin restricción
(MSR)
YMYeeMSRSCE ´´)( ==MYe =
111 ε+= BXYModelo restringido(MR)
YMYeeMRSCE 111 ´´)( ==
YMe 11 =
0: 20 =BHModelo restringido Modelo sin restricción
60Mg. Beatriz Castañeda
eBXBXY ++= 2211ˆˆ
eBXMeMBXMBXMYM +=++= 22112211111ˆˆˆ
0ˆ])([ˆ11
'1
11
'11111 =−= − ββ XXXXXIXM
β̂)´(´ XXYX =
En el MSR
=
=
===−
0
00´)ˆ´(
'2
'1
'2
'1
eX
eXe
X
XeXXYX β
eeXXXXIeM =−= − ])([ '1
11
'111
Luego
61Mg. Beatriz Castañeda
eBXMYM += 2211ˆ
)ˆ)´(ˆ())´(( 22122111 eBXMeBXMYMYM ++=
eeBXMeeMXBBXMMXBYMY ´ˆ´´´´ˆˆ´´´ˆ´ 2211222211221 +++=
0´´ˆ´´´ˆ 22122 == eXeMX ββ 0]´´´´ˆ[´ 122221 == eMXXMe ββ
eeBXMXBYMY ´ˆ´´ˆ´ 221221 +=SCE(MR) SCE(MSR)
)()(ˆ´´ˆ 22122 MSRSCEMRSCEBXMXB −=Luego
)´´ˆ´(´´ˆ´ 11 YXYYYXYY ββ −−−=
)´´ˆ()´´ˆ( 211
2 YnYXYnYX −−−= ββSCR(MR)SCR(MSR)
62Mg. Beatriz Castañeda
0:0: 2120 ≠= BHBH
),(2
221'2
' /ˆ][ˆ2
knse
FesS
sXMXF −=
ββ
Estadística de la prueba
Equivale a:
),()/()(
/)]()([
)/()(
/)]()([knsFes
knMSRSCE
sMRSCRMSRSCR
knMSRSCE
sMSRSCEMRSCEF −−
−=−
−=
)/(]´´ˆ´[
/]´´ˆ´´ˆ[ 11
knYXYY
sYXYXF
−−−=
βββ
63Mg. Beatriz Castañeda
2´´ˆ YnYXSCR −= β 1−K
SCRknSCE
kSCR
−−
/
1/
2111 ´´ˆ YnYXSCR −= β
YXYXSCR ´´ˆ´´ˆ 112 ββ −= rk
SCR
−2
knSCE
rkSCR
−−
/
/2
kkk aYnYXSCR /ˆ´´ˆ 21 ββ −−=
kkk aSCR /ˆ 22 β=2SCR
knSCE
akkk
−/
/ˆ 2β
YXYYSCE ´´ˆ´ β−=kn
SCE
−2´ YnYY −
Fuente de variación Suma de cuadrados G.L. C.M. Razón F p
Debido a X2, …, XK k-1
Debido a X2, …, Xr
Debido a Xr+1, …, XK
r-1
k-r
Debido a X2, …, XK-1
Debido a XK
k-2
1
Debido al error n-k
Total n-1
ANALISIS DE VARIANZA: Contraste de significación
64Mg. Beatriz Castañeda
niparaXXY ikikii ,1,....221 =++++= εβββ
∑ =+++= 0ˆ....ˆˆ221 ikk equeyaXXY βββ
Modelo en desviaciones de media
niparaeXXY ikikii ,1,ˆ....ˆˆ221 =++++= βββ
)ˆ....ˆ(ˆ221 kk XXY βββ ++−=
ikkikii eXXXXYY +−++−=− )(ˆ....)(ˆ 222 ββ
ikikii exxy +++= ββ ˆ....ˆ22 eBxy += 2
ˆ
:y Vector de las observaciones Y en desviaciones de media
:x Matriz de observaciones de las variables X´s en desviaciones de media
65Mg. Beatriz Castañeda
eBxy += 2ˆ yxxxB ´)´(ˆ 1
2−=
22 )ˆ( BBE = 122 )´()ˆ( −= xxBV σ
niparaeXXY ikikii ,1,ˆ....ˆˆ221 =++++= βββ
Modelo en desviaciones
)ˆ....ˆ(ˆ221 kk XXY βββ ++−=
22222221 )ˆ(´)(]ˆ´[)]ˆ....ˆ([)ˆ( XBVXYVBXYVXXYVV kk +=−=++−= βββ
21
22
2
1 )´´()ˆ( XxxXn
V −+= σσβ
12
22222221 )´´()ˆ(´]ˆ,ˆ´[)ˆ,ˆcov( −=−=−= xxXBVXBBXYCovB σβ
66Mg. Beatriz Castañeda
kn
yxByy
kn
ee
kn
ei−
−=−
=−
= ∑ ´´ˆ´´ˆ 2
22εσ
eBxy += 2ˆ
2B̂xye −= yxByyee ´´ˆ´´ 2−=
yy
yxByy
SCT
SCER
´
´´ˆ´11 22 −−=−=
yy
yxBR
´
´´ˆ 22 =
67Mg. Beatriz Castañeda
Predicción utilizando el modelo de Regresión Múltiple
niparaXXY ikikii ,1,....221 =++++= εβββModelo:
ββββ '221 ....)(
iXXXYE kikii =+++=
Predicción del promedio
βββββ ˆˆ...ˆˆˆˆ '33221 i
XXXXY kikiii =++++=Predicción puntual
Predicción por intervalo
ββ '' )ˆ()ˆ(ii
XXEYE i ==
ii XVXXVYVii
)ˆ()ˆ()ˆ( '' ββ ==
),0( 2σε NesSi i
)(1'2 )´(
)(ˆkn
iie
ii tesXXXXS
YEYT −−
−=
iiei XXXXStYL 1'22/1 )´(ˆ −
−±= α
68Mg. Beatriz Castañeda
Predicción de un valor individual
βββββ ˆˆ...ˆˆˆˆ '33221 i
XXXXY kikiii =++++=Predicción puntual
Predicción por intervalo
ii XVXeVi
)ˆ()( '2 βσ +=
),0( 2σε NesSi i
)(1'2 ))´(1(
ˆkn
iie
ii tesXXXXS
YYT −−+
−=
))´(1(ˆ 1'22/1 iiei XXXXStYL −
− +±= α
ikikii XXY εβββ ++++= ....221
βεβ ˆˆ ''iiiiii XXYYe −+=−=
0)( =ieE
69Mg. Beatriz Castañeda
Coeficientes estandarizados
niparaXXY ikikii ,1,....221 =++++= εβββ Variables en su nivel
ikkikii XXXXYY εββ +−++−=− )(....)( 222 Variables en desviaciones de media
( ) ( ) iS
XiX
YkS
XiX
YY
i
X
kX
X
X
SS
SS
S
YY εββ +++=− −−
22
2 22222 .... Variables estandarizadas
Y
X
j S
Sj
jββ =* Se denomina coeficiente estandarizado o coeficiente Beta
Los coeficientes beta informan respecto de la importancia relativa de las variables explicativas en el modelo de regresión múltiple. Indican cual es el cambio en unidades estandarizadas de la variable dependiente ante un cambio en una desviación estándar de la variable dependiente.
70Mg. Beatriz Castañeda
Correlación Parcial
En el modelo de regresión múltiple interesa medir cuán relacionada está la variable dependiente con cada una de las variables independientes, luego de eliminar completamente el efecto de las otras variables independientes en el modelo.
iiii XXY εβββ +++= 33221
Ejemplo
Sea el modelo:
ii XY 321ˆˆˆ)1 αα +=
y sean los modelos auxiliares
ii XX 3212ˆˆˆ)2 αα +=
Eliminamos de Y y X2 la influencia lineal de X3 y obtenemos:
ii YYYde ˆ*)1 −= ii XXXdei 22* ˆ)22
−=
Al coeficiente de correlación entre Y* y X*2 se denomina correlación parcial entre Y y X2.
71Mg. Beatriz Castañeda
2:2
XyYentresimplenCorrelacióYXr
3232: XyXentresimplenCorrelacióXXr
3:3
XyYentresimplenCorrelacióYXr
332(2. : XporcontroladaXyYentreparcialnCorrelacióXYXr
2121.
332
3232
32YXXX rr
rrrr XXYXYX
XYX−−
−=
3.2
3.3.22
ˆS
Sr YY=β
SY.3 : Desv. est. de los residuos en la regresión de Y en X3
S2.3 : Desv. est. de los residuos en la regresión de X2 en X3
X2
X3
Y
72Mg. Beatriz Castañeda
Análisis del modelo
Supuestos del modelo
1) Las variables X son no colineales
2) Las perturbaciones tienen distribución normal
3) Regresores son no estocásticos
4) Las perturbaciones tienen varianza constante
5) Las perturbaciones son incorrelacionadas
Violación del supuesto
Multicolinealidad
No normalidad de las perturbaciones
Regresores estocásticos
Heterocedasticidad
Autocorrelación
73Mg. Beatriz Castañeda
Problema de Multicolinealidad
YXXXMCO ´)´(ˆ 1−=β
Si alguna variable X es combinación lineal de las otras, entonces
1)´()´( −∴< XXexisteNoKXXρ
Si no existe colinealidad perfecta pero las correlaciones son muy altas, esto implicaría distorsiones en las estimaciones de los coeficientes, pues su varianza sería muy grande (estimadores poco precisos).
Por lo tanto no podríamos obtener los estimadores de los coeficientes del modelo, lo que nos llevaría a reformular el modelo en función de las otras variables teniendo en cuenta la relación lineal.
74Mg. Beatriz Castañeda
Problema de Multicolinealidad
Ejemplo: iiii XXY εβββ +++= 33221Sea el modelo
−=
−=
233223
322322
2323
2322 )1()1(´
SSSr
SSrSn
SS
SSnxx
−
−−−
=−223223
322323
23
22
223
22
1
])[1(
1)´(
23 SSSr
SSrS
SSrSSnxx
)1()1()1()1()ˆ( 2
2322
2
223
23
22
223
2 rSnrSSn
SV
−−=
−−= εε σσβ ∞ Si r23 1
)1()1()1()1()ˆ( 2
2323
2
223
23
22
222
3 rSnrSSn
SV
−−=
−−= εε σσβ ∞ Si r23 1
FIVr
=− 2
231
1 Factor de incremento varianza
75Mg. Beatriz Castañeda
Consideremos el modelo restringido
iii uXY ++= 2211 ββ 22
2
21 )1()ˆ(
SnV u
−= σβ
En cambio para el modelo sin restricción iiii XXY εβββ +++= 33221
2
2
22
2
223
2 )1()1(
1)ˆ(
u
u
SnrV
σσσβ ε
−−= Donde 12
2
<uσ
σε
Si r23 = 0 )ˆ()ˆ( 212 ββ VV ≤
Así 2231
1
rFIV
−=
Indica en que medida irá creciendo la varianza del estimadorcuando las variables estén correlacionadas.
En general 21
1
iRFIV
−= es el coeficiente de determinación en el modelo
de Xi dadas las otras variables Xs:2iR
76Mg. Beatriz Castañeda
Detección del problema de Multicolinealidad
1. Característica típica de la multicolinealidad es que todos los coeficientes de regresión pueden ser no significativamente diferentes de cero a nivel individual, aunque en conjunto todas las variables sean muy significativas.
2. Al examinar la matriz de correlación de las variables regresoras, R, y su inversa R-1, se encuentra que el i-ésimo elemento de la diagonal principal de R-1 (tii) es el factor de incremento de varianza (FIV) del coeficiente de la variable Xi.
101
1)( 2 >
−==
iiii R
XFIVtSi Indica una alta multicolinealidad
Tolerancia = 1- R2i
Indica la porción de la variable que no es explicada por lasotras variables
77Mg. Beatriz Castañeda
3. Al examinar los valores propios de (X´X) o R y calcular el índice de condicionamiento
RdepropiovalorMínimo
RdepropiovalorMáximoIC =
Se tiene el siguiente criterio
IC > 30 Existe alta multicolinealidad
Existe multicolinealidad moderada10 ≤ IC ≤ 30
IC < 10 Matriz de datos está bien definida
78Mg. Beatriz Castañeda
4. Test de Farrar Glauber
i) Test de ortogonalidad
síentresortogonalesonnoXLasH
síentresortogonalesonXLasH
:
:
1
0
( ) Rn kcalc ln1
6
)52(2 +−−−=χ
Estadística
22/)1(
2−≈ kkcalc χχ
K: nº de variables explicativasR: matriz de correlaciones simples
p2
)2/)1(( −kkχ2calcχ
R.C.
79Mg. Beatriz Castañeda
ii) Test F Para determinar que regresor se encuentra más colineado con las demás
variables.
Se obtiene la regresión de cada variable en función del resto de variablesy se calcula el R2 para el modelo de cada variable.
0:0: 2max1
2max0 ≠= RHRH
),1(2max
2max
)/()1(
)1/(knki F
knR
kRF −−→
−−−
=
Estadística
K: nº de variables explicativas
p
),( knkF −iF
R.C
80Mg. Beatriz Castañeda
iii) Test t Para determinar que regresor se encuentra más correlacionado con una de
las otras variables
0:0: 2max1
2max0 ≠= rHrH
22max
2max
1−
−→
−= n
nt
r
rT
Estadística
Rmax es el coeficiente de correlación simple máximo
0 t1-α/2t(n-k)
α/2α/2
- t1-α/2
R.CR.C.
81Mg. Beatriz Castañeda
Tratamiento
1. Eliminar o excluir regresores del modelo, eligiendo aquellos que tengan mayor multicolinealidad con las otras variables, es decir, FIV > 10
2. Incluir información externa a los datos de manera que se rompa el problema de multicolinealidad (Se considera que este problema es un “problema de la muestra a mano”)
3. Utilizar un modelo multiecuacional
4. Estimar los coeficientes utilizando el método de “regresión cresta”, el cual es un método exploratorio que consiste en utilizar una modificación a la matriz (X´X)
IXX α+)´(Eligiendo α desde 0.01 hasta obtener resultados estables, es decir, tales que las varianzas de los estimadores no cambien significativamente al cambiar algunos datos
5. Utilizar restricciones lineales para los coeficientes
6. Utilizar un modelo de componentes principales