Mic sesión 13

27
MÉTODOS DE INVESTIGACIÓN CUANTITATIVA Sesión 13 ANÁLISIS RESIDUAL EN LA REGRESIÓN ESTIMADA FÁTIMA PONCE REGALADO 1

Transcript of Mic sesión 13

Page 1: Mic sesión 13

MÉTODOS DE INVESTIGACIÓN CUANTITATIVA

Sesión 13

ANÁLISIS RESIDUAL EN LA REGRESIÓN ESTIMADA

FÁTIMA PONCE REGALADO 1

Page 2: Mic sesión 13

2

PUNTOS A TRATAR

FÁTIMA PONCE REGALADO

ANÁLISIS RESIDUAL DE LA ESTIMACIÓN

En muestras de series de tiempo

En muestras de corte transversal

Aplicaciones.

Page 3: Mic sesión 13

3FÁTIMA PONCE REGALADO

INTERPRETACIÓN Y EVALUACIÓN DE RESULTADOS

Para evaluar los resultados de la estimación:

1. Interpretación Económica: signos, valores. Es muy importante la unidad de medida.

2. Evaluación Estadística: R2, test de hipótesis de significancia conjunta (test F) y test de hipótesis de significancia individual (test t).

3. Evaluación Econométrica (Si los supuestos básicos del modelo se cumplen, especialmente los residuos=análisis residual).

Page 4: Mic sesión 13

4FÁTIMA PONCE REGALADO

¿Cómo saber si algún supuesto básico del MRLG falla?.La respuesta no es simple, pues hay varias consecuencias

de violar un supuesto, además muchas veces pueden fallar varios supuestos a la vez.

Pero, elementos a evaluar que pueden ayudar son:Analizar los errores: Deben ser aleatorios (ruido blanco

no correlacionado). Si los errores muestran un patrón no aleatorio hay algo sistemático que afecta a Y y no se ha considerado.

Podría haber contradicciones en los test (F y t). Esto se presenta cuando la correlación entre las variables independientes es alta (multicolinealidad).

VIOLACIONES DE SUPUESTOS

Page 5: Mic sesión 13

5FÁTIMA PONCE REGALADO

ANÁLISIS RESIDUAL

CUANDO LA MUESTRA ES DE CORTE TRANSVERSAL

Page 6: Mic sesión 13

6FÁTIMA PONCE REGALADO

Análisis gráfico de los errores MCO al cuadrado (e2) con Y o con X:

Es una gráfica en la cual se analiza si existe alguna relación entre la varianza del error estimado (e2) y el valor estimado de Y ó los valores de la variable X (una por una).

Análisis del Test de White.

Cuando la muestra es de Corte transversal es frecuente encontrar el problema de heteroscedasticidad de errores.

ANÁLISIS DE LOS ERRORES MCO

Page 7: Mic sesión 13

7FÁTIMA PONCE REGALADO

¿Qué significa el problema de la HETEROSCEDASTICIDAD?

Errores homoscedásticos: Igual varianza (cumple con el supuesto del MRLG)

Errores heteroscedásticos: Varianza diferente (NO cumple con el supuesto del MRLG) Inferencia estadística no es buena, hay que corregir.

Fuente: Gujarati, 2004, p. 388

Page 8: Mic sesión 13

8FÁTIMA PONCE REGALADO

Por lo general se presenta cuando se emplea muestras de corte transversal.

Omisión de variable relevante.Agregación de datos. Muestra compuesta de grupos con diferentes “tamaños”, por

ejemplo: Empresas pequeñas y grandes en un modelo de predicción de

ventas, Familias ricas y familias pobres en un modelo donde se quiere

explicar el gasto familiar en bienes duraderos.

Modelos de aprendizaje.

POSIBLES CAUSAS DE HETEROSCEDASTICIDAD

Page 9: Mic sesión 13

9FÁTIMA PONCE REGALADO

EJERCICIO : Rendimiento de la Educación

Dependent Variable: LWAGE Method: Least Squares Sample: 1 526 Included observations: 526

Variable Coefficient Std. Error t-Statistic Prob. C 0.216854 0.108595 1.996909 0.0464

EDUC 0.097936 0.007622 12.84839 0.0000 EXPER 0.010347 0.001555 6.653393 0.0000

R-squared 0.249343 Mean dependent var 1.623268

Adjusted R-squared 0.246473 S.D. dependent var 0.531538 S.E. of regression 0.461407 Akaike info criterion 1.296614 Sum squared resid 111.3447 Schwarz criterion 1.320940 Log likelihood -338.0094 Hannan-Quinn criter. 1.306139 F-statistic 86.86167 Durbin-Watson stat 1.789452 Prob(F-statistic) 0.000000

0 0.5 1 1.5 2 2.50

0.51

1.52

2.53

3.54

4.5

Análisis de los residuos

Yestimado

resi

duo2

Sea: Lwage= ln(salario), Educ=años de educación, Exper=años de experiencia

Page 10: Mic sesión 13

10FÁTIMA PONCE REGALADO

TESTS DE WHITE EN EL EVIEWSTeniendo en memoria la regresión que se quiere analizar, escoger:

1

2

3Seleccionar el test a emplear

Page 11: Mic sesión 13

11FÁTIMA PONCE REGALADO

TEST DE WHITE EN EL EVIEWS

H0: Homoscedasticidad.H1: Existe heteroscedasticidad de alguna

forma general desconocida.

Dado que p-value < 0.05 Rechazar H0Heteroskedasticity Test: White

F-statistic 3.748064 Prob. F(5,520) 0.0024

Obs*R-squared 18.29714 Prob. Chi-Square(5) 0.0026 Scaled explained SS 23.23569 Prob. Chi-Square(5) 0.0003

Test Equation: Dependent Variable: RESID^2 Method: Least Squares Sample: 1 526 Included observations: 526

Variable Coefficient Std. Error t-Statistic Prob. C 0.569103 0.275889 2.062795 0.0396

EDUC -0.063059 0.037077 -1.700787 0.0896 EDUC^2 0.002103 0.001281 1.640789 0.1014

EDUC*EXPER 0.000994 0.000473 2.100461 0.0362 EXPER -0.003586 0.008067 -0.444518 0.6569

EXPER^2 -0.000113 9.31E-05 -1.213960 0.2253 R-squared 0.034785 Mean dependent var 0.211682

Adjusted R-squared 0.025505 S.D. dependent var 0.339611 S.E. of regression 0.335253 Akaike info criterion 0.663476 Sum squared resid 58.44503 Schwarz criterion 0.712130 Log likelihood -168.4942 Hannan-Quinn criter. 0.682526 F-statistic 3.748064 Durbin-Watson stat 2.068660 Prob(F-statistic) 0.002418

CORREGIR=nR2

Page 12: Mic sesión 13

12FÁTIMA PONCE REGALADO

PARA CORREGIR: USAR ESTIMADOR CONSISTENTE DE WHITE

Quick/Estimate Equation

En la ventana Options

Click en:

Elegir Huber-White

Page 13: Mic sesión 13

13FÁTIMA PONCE REGALADO

Corrección de Heteroscedasticidad: Estimador Consistente de WHITE en

EVIEWSDependent Variable: LWAGE Method: Least Squares Sample: 1 526 Included observations: 526 White heteroskedasticity-consistent standard errors & covariance

Variable Coefficient Std. Error t-Statistic Prob. C 0.216854 0.114510 1.893755 0.0588

EDUC 0.097936 0.008096 12.09693 0.0000 EXPER 0.010347 0.001605 6.445305 0.0000

R-squared 0.249343 Mean dependent var 1.623268

Adjusted R-squared 0.246473 S.D. dependent var 0.531538 S.E. of regression 0.461407 Akaike info criterion 1.296614 Sum squared resid 111.3447 Schwarz criterion 1.320940 Log likelihood -338.0094 Hannan-Quinn criter. 1.306139 F-statistic 86.86167 Durbin-Watson stat 1.789452 Prob(F-statistic) 0.000000

En la práctica se estima por MCO y se hace inferencia

empleando la matriz de Var-Cov (betas) corregida.

Page 14: Mic sesión 13

14FÁTIMA PONCE REGALADO

ANÁLISIS RESIDUAL

CUANDO LA MUESTRA ES DE SERIES DE TIEMPO

Page 15: Mic sesión 13

15FÁTIMA PONCE REGALADO

a) Análisis gráfico de los errores: - Ploteo de los errores MCO (eMCO). Es una gráfica donde los

valores de los errores son presentados secuencialmente en el tiempo.

- Diagrama de dispersión de etMCO y et-1

MCO (scatterplot). Es una gráfica que muestra la relación lineal entre los errores MCO en el período t (et

MCO) y los errores MCO en el período t-1 (et-1

MCO).b) Análisis del Estadístico Durbin-Watson.

ANÁLISIS DE LOS ERRORES MCO

Cuando la muestra es de Series de Tiempo es frecuente encontrar el problema de autocorrelación de errores.

Page 16: Mic sesión 13

16FÁTIMA PONCE REGALADO

Por lo general se presenta cuando se emplea muestras de series de tiempo.

Error de especificación: omisión de variable relevante, error en la forma funcional, error en la dinámica de la serie (no se incluyeron rezagos).

Inercia en el comportamiento. Por ejemplo, la inercia que caracteriza a la inflación (inercia inflacionaria).

Manipulación de datos.

POSIBLES CAUSAS DE AUTOCORRELACIÓN

Page 17: Mic sesión 13

17FÁTIMA PONCE REGALADO

PLOTEO DE LOS ERRORES MCO (eMCO = RESID en el Eviews)

Los residuos MCO muestran un patrón no aleatorio= autocorrelación de primer orden positiva.

Los residuos MCO se alternan aleatoriamente alrededor de cero= tienen comportamiento irregular.

-.15

-.10

-.05

.00

.05

.10

.15

1960 1965 1970 1975 1980 1985 1990

Y Residuals

-.06

-.04

-.02

.00

.02

.04

.06

30 35 40 45 50 55 60 65 70 75

RESIDMCO

Residuos ok Problemas corregir

Page 18: Mic sesión 13

18FÁTIMA PONCE REGALADO

Válido si: t = t-1 + tH0 : No Autocorrelación (=0)H1 : Autocorrelación de orden 1.

TEST DE DURBIN – WATSON (1/2)

n

(et – et-1)2

d = t=2 Para n grande: n

et2

t=1

r= coeficiente estimado de correlación de errores de 1er orden

Si r = 1 d = 0 Si r = 0 d = 2 Si r = -1 d = 4

d 2(1- r)

“d” debe ser cercano a 2, sino hay problema con los errores.

Page 19: Mic sesión 13

19FÁTIMA PONCE REGALADO

TEST DE DURBIN – WATSON (2/2)

0 2 4

Autoc + ¿? ¿?

Aceptar H0: 1 =0 No hay autocorrelación

Autoc -

dL dU 4-dU 4-dL

Valores críticos de tabla D-W % , dependen de n y k’ (sin incluir intercepto)

Nota: El test dw:No es válido en Modelos Autorregresivos. No es válido si el modelo no incluye intercepto.

Page 20: Mic sesión 13

20FÁTIMA PONCE REGALADO

TEST DE DURBIN – WATSON (3/3)

1.03 1.67

http://allman.rhon.itam.mx/~ebarrios/TablasProbabilidad/TabProb_PIEyE-100.pdfVer pg 29.

Page 21: Mic sesión 13

21FÁTIMA PONCE REGALADO

a) Estime la demanda de gasolina, empleando el archivo AUTO1.WF1 (del libro de Johnston_Dinardo) donde:

 

Y = Ln del gasto personal real en consumo de gasolina  

X2 = Ln del precio real de la gasolina  

X3 = Ln del Ingreso personal real disponible

Ejercicio: Demanda de Gasolina

Page 22: Mic sesión 13

22FÁTIMA PONCE REGALADO

Dependent Variable: YMethod: Least SquaresSample: 1959Q1 1992Q1Included observations: 133----------------------------------------------------------------------------------------------------------

Coefficient Std. Error t-Statistic Prob. ---------------------------------------------------------------------------------------------------------- C -4.4232520.231937 -19.07094 0.0000 X2 -0.1248750.033216 -3.759531 0.0003 X3 0.656708 0.034859 18.83897 0.0000---------------------------------------------------------------------------------------------------------- R-squared 0.732058 Mean dependent var -7.762089Adjusted R-squared 0.727936 S.D. dependent var 0.117997S.E. of regression 0.061547 Akaike info criterion -2.715730Sum squared resid 0.492446 Schwarz criterion -2.650534Log likelihood 183.5960 Hannan-Quinn criter. -2.689237F-statistic 177.5900 Durbin-Watson stat 0.075625Prob(F-statistic) 0.000000----------------------------------------------------------------------------------------------------------

Ejercicio: Demanda de Gasolinaa) Modelo Log-lineal pues los datos están en ln

Debe ser cercano a 2 sino hay problema con los errores.

MUESTRA ES SERIES DE TIEMPO

Varia

bles

sig

nific

ativ

as a

l 1%

, 5%

y 1

0%.

Page 23: Mic sesión 13

23FÁTIMA PONCE REGALADO

a) Estadístico Durbin-Watson = 0.075625 Valor está lejos de 2, mas bien está cercano a 0 .

Ejercicio: Demanda de Gasolina(Análisis de residuos)

b) Ploteo de los errores MCO (eMCO):

-.15

-.10

-.05

.00

.05

.10

.15

1960 1965 1970 1975 1980 1985 1990

Y Residuals

Hay problema con los errores: Hay correlación serial de los errores en la estimación, por lo tanto la inferencia estadística no es adecuada. Se debe corregir la estimación.

Page 24: Mic sesión 13

24FÁTIMA PONCE REGALADO

Para corregir los errores:1° Evaluar agregar una variable independiente relevante nueva.2° Corregir empleando Método Iterativo de C-O, en el Eviews:

Quick / Estimate Equation

Ejercicio: Demanda de Gasolina

Escribir la ecuación a estimar agregando AR(1)

AR(1) en Eviews es la estimación iterativa para corregir autocorrelación de 1er orden en los errores.

1959Q1 1992Q1

y c x2 x3 AR(1)

Page 25: Mic sesión 13

25FÁTIMA PONCE REGALADO

Ejercicio: Demanda de GasolinaN

o se

inte

rpre

ta

Dependent Variable: Y Method: ARMA Maximum Likelihood (OPG - BHHH) Sample: 1959Q1 1992Q1 Includedobservations: 133 Convergenceachievedafter 4 iterations Coefficient covariance computed using outer product of gradients

Variable Coefficient Std. Error t-Statistic Prob.

C -5.218888 0.511874 -10.19565 0.0000 X2 -0.168161 0.024063 -6.988518 0.0000 X3 0.428949 0.127794 3.356567 0.0010

AR(1) 0.979141 0.023268 42.08134 0.0000 SIGMASQ 0.000270 2.31E-05 11.64750 0.0000

R-squared 0.980496 Mean dependentvar -7.762089 Adjusted R-squared 0.979887 S.D. dependentvar 0.117997 S.E. of regression 0.016735 Akaikeinfocriterion -5.281852 Sum squaredresid 0.035846 Schwarzcriterion -5.173192 Log likelihood 356.2431 Hannan-Quinncriter. -5.237697 F-statistic 1608.708 Durbin-Watson stat 2.326064 Prob(F-statistic) 0.000000

Inverted AR Roots .98

Está cercano a 2 No hay problema con los errores.

Page 26: Mic sesión 13

26FÁTIMA PONCE REGALADO

Análisis de los errores MCO del modelo corregido:

Ejercicio: Demanda de Gasolina

-.08

-.06

-.04

-.02

.00

.02

.04

.06

1960 1965 1970 1975 1980 1985 1990

Y Residuals

El resultado de la estimación corregida es el que debe emplearse:

^ lnGasto = -5.22 - 0.17 lnP + 0.43 lnIngreso

Elasticidad precio

Elasticidad ingreso

Page 27: Mic sesión 13

27FÁTIMA PONCE REGALADO

Anderson, D., Sweeney, D. y Williams T. (2008). Estadística para Administración y Economía. [10ma. Ed.] México, Cengage Learning Editores S.A. de C.V., Cap 14 y 15.

Levin, R. y Rubin, D. (2010). Estadística para Administración y Economía. Séptima Edición Revisada. Pearson Educación, México. Prentice Hall. 2010. Cap. 12 y 13.

BIBLIOGRAFIA