FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro....

30
Ramón Antonio Rosales Álvarez Jorge Andrés Perdomo Calvo Carlos Andrés Morales Torrado Jaime Alejandro Urrego Mondragón FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA TEORÍA Y APLICACIONES 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Especificación Predicción Verificación Estimación

Transcript of FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro....

Page 1: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

Ramón Antonio Rosales Álvarez

Jorge Andrés Perdomo Calvo

Carlos Andrés Morales Torrado

Jaime Alejandro Urrego Mondragón

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA TEORÍA Y APLICACIONES

0,10,20,30,4

0,50,60,70,80,9 0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

Especificación

Predicción

Verific

ación

Estima

ción

Page 2: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad
Page 3: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES

Page 4: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad
Page 5: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES

Ramón Antonio Rosales ÁlvarezJorge Andrés Perdomo Calvo

Carlos Andrés Morales TorradoJaime Alejandro Urrego Mondragón

Page 6: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

Primera edición: enero de 2013

© Carlos Andrés Morales, Jorge Andrés Perdomo, Ramón Antonio Rosales y Jaime Alejandro Urrego

© Universidad de los Andes Facultad de Economía, Centro de Estudios sobre Desarrollo Económico (CEDE)

Ediciones UniandesCarrera 1ª núm. 19-27, edificio Aulas 6, piso 2Bogotá D. C., ColombiaTeléfono: 3394949, ext. 2133http://ediciones.uniandes.edu.co [email protected]

ISBN impreso: 978-958-695-752-6ISBN e-book: 978-958-695-797-7

Corrección de estilo: Santiago Melo Armada electrónica y finalización de arte: ProceditorIlustración de cubierta: Agencia de Diseño y Publicidad Ávila

Impresión y acabados: Nomos ImpresoresDiagonal 18 bis núm. 41-17Teléfono: 208 6500Bogotá D.C., Colombia

Impreso en Colombia - Printed in Colombia

Todos los derechos reservados. Esta publicación no puede ser reproducida ni en su todo ni en sus partes, ni registrada en o transmitida por un sistema de recuperación de información, en ninguna forma ni por ningún medio sea mecánico, fotoquímico, electrónico, magnético, elec-troóptico, por fotocopia o cualquier otro, sin el permiso previo por escrito de la editorial.

Fundamentos de econometría intermedia: teoría y aplicaciones / Ramón Antonio Rosales Álvarez… [et al.]. -- Bogotá: Universidad de los Andes, Facultad de Economía, CEDE, Ediciones Uniandes, 2013.

405 pp.; 17 x 24 cm

Otros autores: Jorge Andrés Perdomo Calvo, Carlos Andrés Morales Torrado, Jaime Alejandro Urrego Mondragón.

ISBN 978-958-695-752-6

1. Econometría I. Rosales Álvarez, Ramón Antonio II. Perdomo Calvo, Jorge Andrés III. Morales Torrado, Carlos Andrés IV. Urrego Mondragón, Jaime Alejandro V. Universidad de los Andes (Colombia). Facultad de Economía. CEDE.

CDD 330.015195 SBUA

Page 7: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

v

CONTENIDO

INTRODUCCIÓN xi

1. ESPECIFICACIÓN INCORRECTA Y ENDOGENIDAD 1 1.1. Introducción 1

1.2. Discusión sobre la especificación de los modelos econométricos 2

1.3. Endogenidad 16 1.4. Estudio de caso: efectos de la fecundidad sobre el

ingreso laboral femenino 29 Resumen 39 Ejercicios propuestos 41 Anexo 1 44

2. MODELOS DE ECUACIONES SIMULTÁNEAS 65

2.1. Introducción 65 2.2. El problema de simultaneidad 66 2.3. Detección del problema: prueba de Hausman 69 2.4. Proceso de identificación 70 2.5. Metodologías de estimación de ecuaciones simultáneas 74 2.6. Estudio de caso: evaluación del fondo de estabilización de precios del azúcar 79 2.7. Estudio de caso: análisis regional de la oferta de ganado 89 Resumen 94 Ejercicios propuestos 95 Anexo 2 99

Page 8: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

vi

3. MODELOS DE PROBABILIDAD: LINEAL, PROBIT Y LOGIT 107 3.1. Introducción 107

3.2. Modelo de probabilidad lineal 108 3.3. Modelos logit y probit 111 3.4. Estudio de caso: mercado de trabajo informal en Colombia 126 3.5. Estudio de caso: derechos de propiedad en Colombia e integración al mercado mundial 140 Resumen 152 Ejercicios propuestos 153 Anexo 3 154

4. INTRODUCCIÓN A LAS SERIES DE TIEMPO 159 4.1. Introducción 159 4.2. Conceptos básicos para las series de tiempo 160 4.3. Filtro de Hodrick y Prescott 168 4.4. Modelos de pronósticos con tendencia determinística 168 4.5. Pronóstico con métodos de atenuación exponencial 173 4.6. Estudio de caso: el PIB colombiano 176 Resumen 188 Ejercicios propuestos 193 Anexo 4 195

5. METODOLOGÍA BOX-JENKINS PARA PRONOSTICAR SERIES DE TIEMPO MEDIANTE PROCESOS AUTORREGRESIVOS Y DE MEDIA MÓVIL 199

5.1. Introducción 199 5.2. Conceptos básicos 200 5.3. Estacionariedad y ruido blanco: métodos para detectarlos y alternativas de solución que conduzcan a obtener variables estacionarias 202 5.4. Modelos univariados ARIMA y metodología Box-Jenkins 215 5.5. Modelos univariados SARIMA y metodología BJ 232 5.6. Ventajas y desventajas de los modelos ARIMA 235 5.7. Estudio de caso: el PIB colombiano 237 5.8. Estudio de caso: el IPC colombiano 259 Resumen 278 Ejercicios propuestos 280 Anexo 5 282

6. MODELOS CON REZAGOS DISTRIBUIDOS Y AUTORREGRESIVOS, CAUSALIDAD DE GRANGER Y COINTEGRACIÓN 299 6.1. Introducción 299 6.2. Introducción a los modelos con variables rezagadas 300

Page 9: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

vii

6.3. Modelos de rezagos distribuidos y autorregresivos 302 6.4. Prueba de causalidad de Granger 310 6.5. Cointegración 314 6.6. Estudio de caso: la oferta de azúcar 316 Resumen 333 Ejercicios propuestos 336

7. MODELOS PARA DATOS DE CORTE TRANSVERSAL AGRUPADOS EN EL TIEMPO Y ESTIMADOR DE DIFERENCIAS EN DIFERENCIAS 337 7.1. Introducción 337 7.2. Combinación de corte transversal y series de tiempo 338 7.3. Corte transversal a lo largo del tiempo 339 7.4. Estudio de caso: impacto de un programa de intervención a las escuelas rurales en Colombia 349 Resumen 355 Ejercicios propuestos 356

8. MODELOS PARA DATOS EN PANEL O LONGITUDINALES 359 8.1. Introducción 359 8.2. Organización de los paneles de datos 360 8.3. Estimación de las dinámicas de largo plazo: efectos entre grupos 364 8.4. El problema de efectos fijos en el término de error 365 8.5. Identificación del estimador apropiado 374 Resumen 386 Ejercicios propuestos 387 Anexo 390 Apéndice. Aplicación de comandos en Stata 391

BIBLIOGRAFÍA 405

ÍNDICE TEMÁTICO 411

Page 10: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad
Page 11: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

ix

AGRADECIMIENTOS

Los autores expresamos nuestros agradecimientos al Centro de Estudios sobre Desarrollo Económico (CEDE) de la Facultad de Economía de

la Universidad de los Andes por el apoyo financiero para la elaboración y publicación de este documento. Asimismo, a Diana Gutiérrez, Juan Carlos Vásquez, Raquel Bernal, Camilo Bohórquez, Fabio Sánchez, María del Pilar López, Antonella Fazio, Catherine Rodríguez, Armando Armenta y Gustavo García por facilitar los datos empleados para los estudios de caso. Igualmente, a los profesores Daniel Fernando Poveda Quintero, Javier Alfonso Lesmes Patiño y Jorge Armando Rueda Gallardo por su contribución a los ejercicios propuestos en el libro. También queremos agradecer a todos los profesores del área de econometría y a los estu-diantes que han tomado los cursos de Econometría I, II y Avanzada en el pregrado y posgrado en Economía de la Universidad de los Andes, cuyos aportes han contribuido a la elaboración de este documento. Finalmente, agradecemos a Santiago Melo por las observaciones realizadas durante el proceso de corrección de estilo y a todo el equipo editorial de Ediciones Uniandes.

Page 12: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad
Page 13: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

xi

INTRODUCCIÓN

La econometría es un conjunto de métodos de inferencia estadística para el tratamiento cuantitativo de la información económica que

permite, entre otras cosas, apoyar el estudio de algunos campos especia-les de la economía y los negocios, destacando entre ellos el estudio de las relaciones macroeconómicas y microeconómicas enfocadas en la toma de decisiones de producción, demanda, oferta e inversión.

Además de proporcionar una metodología de trabajo, la econometría es una disciplina auxiliar del economista porque permite contar con un instrumento de análisis en múltiples áreas de aplicación y es útil para el trabajo profesional. Por esta razón, los estudiantes e interesados en el tema deben familiarizarse inicialmente con sus fundamentos básicos, para luego proceder a estudiar las metodologías intermedias que resul-tan útiles en la práctica.

Fundamentos de econometría intermedia: teoría y aplicaciones es un libro que busca exponer los conceptos básicos de esta área de estudio a estudian-tes de últimos semestres de pregrado que quieran profundizar el conoci-miento adquirido en clases introductorias de econometría, y a estudiantes de primer año de posgrado que busquen un tratamiento introductorio e intuitivo a las prácticas intermedias de esta área de estudio que normal-mente son expuestas de forma compleja en otros libros.

Asimismo, este libro pretende buscar un equilibrio entre el tratamiento teórico de la teoría econométrica y su aplicación en casos reales mediante el uso de herramientas computacionales. Por esta razón, y a diferencia de otros libros que cubren la misma temática, aquí no se intenta dar una explicación completa de todos los conceptos de esta área de estudio, sino

Page 14: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

xii RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

que, por el contrario, se tratan temas particulares que se destacan por su gran utilidad tanto en la investigación académica como en la práctica profesional.

En resumen, el objetivo principal del texto es proveer las diferentes teorías y metodologías de manera sencilla para estudiar los temas relacio-nados en un curso de econometría intermedia. Un aporte importante del libro es presentar la teoría y los ejemplos aplicados (resultados economé-tricos y gráficas) que fueron desarrollados con el programa econométrico especializado Stata. No obstante, es una marca registrada de StataCorp LP. Así, toda la información sobre sus licencias, la forma de adquirirlo, las actualizaciones y demás pueden encontrarse en www.stata.com. En este sentido, el presente documento no pretende reproducir o sustituir total o parcialmente los manuales ofrecidos por StataCorp LP.

De acuerdo con lo anterior, y antes de iniciar la lectura del libro, el lector debe comprender previamente los temas tratados en econometría básica para familiarizarse con su contexto, debido a que los temas aquí compren-didos suponen conocimientos sobre ellos. En particular, se espera que el lector conozca:

1. Los fundamentos de estadística tales como el conocimiento de las principales distribuciones de probabilidad y los teoremas funda-mentales de esta ciencia.

2. El cálculo y la interpretación de estadísticas descriptivas tales como la media, la mediana, la varianza y la desviación estándar, entre otras.

3. La construcción y la interpretación de gráficos univariados y multi-variados como histogramas, dispersiones, líneas, entre otros.

4. La teoría y la estimación del modelo clásico de regresión lineal mediante mínimos cuadrados ordinarios (MCO).

5. La aplicación y la interpretación de las pruebas de hipótesis de dife-rencia de medias y de significancia individual y global de los pará-metros.

6. Las causas y consecuencias del problema de multicolineali-dad perfecta o alta y peligrosa en un modelo de regresión lineal. Igualmente, sus métodos de corrección como la transformación de variables y el aumento del tamaño de la muestra.

Page 15: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES xiii

7. Las causas y consecuencias del problema de heteroscedasticidad en un modelo de regresión y su estrategia de solución mediante míni-mos cuadrados generalizados (MCG) y ponderados (MCP) y esti-maciones robustas mediante el estimador de White.

8. Las causas y consecuencias del problema de autocorrelación resi-dual en un modelo de regresión y su estrategia de solución mediante mínimos cuadrados generalizados (MCG), Durbin Watson en dos etapas, método de Cochrane y Orcutt, primeras diferencias y medias móviles.

9. La estimación de los parámetros de un modelo de regresión mediante máxima verosimilitud (MV) y MCG. Esta última es una técnica que agrupa MCO y MCP.1

Para abordar el tema de econometría intermedia (v. Rosales, Perdomo, Morales y Urrego, 2010), el libro se encuentra divido en ocho capítulos de la siguiente manera: en el capítulo 1 se discuten los conceptos rela-cionados con el problema de especificación generado por la omisión de variables independientes, por el uso de formas funcionales incorrectas y por la presencia de endogenidad. Adicionalmente se consideran sus métodos de corrección, entre los que se destacan aquellos que utilizan variables aproximativas o instrumentales con mínimos cuadrados en dos etapas (MC2E).

El capítulo 2 presenta el tema de endogenidad causada por simultanei-dad. Al mismo tiempo se discuten las metodologías de mínimos cuadra-dos indirectos (MCI), MC2E y mínimos cuadrados en tres etapas (MC3E), y la aplicación de la metodología de regresiones aparentemente no rela-cionadas (SUR2). El capítulo 3 contiene aspectos sobre los modelos proba-bilísticos con variables de respuesta binarias (lineales, logit y probit) y sus respectivas estimaciones mediante máxima verosimilitud (MV).

El capítulo 4 comprende la introducción a los conceptos de series de tiempo con el fin de proyectar variables dinámicas, el procedimiento y la aplicación del filtro de Hodrick y Prescott, los modelos de pronóstico con tendencia determinística y los métodos de atenuación exponencial. El capítulo 5 continúa con las técnicas de proyección univariadas, abordando todo lo relacionado con la metodología Box-Jenkins (prueba de raíz unita-ria, series estacionarias, variables no estacionarias y estacionales).

1 Como referencia adicional véase Rosales y Bonilla (2006).

2 La sigla corresponde a seemingly unrelated regressions.

Page 16: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

xiv RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

El capítulo 6 reseña algunos aspectos de las series de tiempo con varia-bles dinámicas y explora los modelos autorregresivos, los de rezagos distribuidos y expectativas adaptativas, la causalidad de Granger y la cointegración.

El capítulo 7 abarca lo relacionado con los datos de corte transversal agrupados en el tiempo (pruebas de cambio estructural con el estadístico de Chow) y con el análisis de diferencias en diferencias (para realizar la evaluación de impacto de un proyecto o política). El capítulo 8 continúa con la relación estática y dinámica mediante panel de datos, estimación agrupada por MCO, efectos fijos y aleatorios. Finalmente se presenta el apéndice sobre los comandos de Stata utilizados en cada tema a lo largo del documento.

Page 17: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

1

1ESPECIFICACIÓN INCORRECTA Y ENDOGENIDAD

1.1. Introducción

Como se puede recordar de los conceptos estudiados en los cursos de econometría básica, el modelo clásico de regresión lineal permite

explicar el comportamiento de una variable dependiente Yi( ) a partir de una o más variables independientes (Xij

3). Este modelo establece una re-lación lineal no determinística entre ambas variables e instaura una serie de parámetros de interés que pueden ser inferidos (o estimados) a par-tir de la información muestral mediante mínimos cuadrados ordinarios (MCO).

El correcto funcionamiento de dicho modelo requiere el cumplimiento de diversos supuestos; específicamente, no multicolinealidad (independencia lineal entre las variables independientes), homoscedasticidad (varianza constante de los errores de la regresión entre las observaciones), no corre-lación serial (ausencia de correlación entre los errores estocásticos de cada observación), especificación correcta (forma funcional apropiada y varia-bles que representen la formulación correcta) e independencia condicio-nal (o no endogenidad). Adicionalmente, y con el fin de efectuar pruebas de hipótesis sobre los parámetros estimados, es necesario suponer que el término de error tiene una distribución normal.4

Este capítulo ofrece un acercamiento a las metodologías, las prácticas y los conceptos econométricos dirigidos al incumplimiento de dos de dichos supuestos; el primero, cuando existe una especificación inco-

3 Los subíndices i y j hacen referencia a las observaciones y a las variables, respectivamente.

4 Para una discusión completa de estos supuestos véase Rosales y Bonilla (2006).

Page 18: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

2 RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

rrecta; el segundo, cuando no se cumple el supuesto de independencia condicional, es decir, cuando existe correlación entre el error Ui( ) y una o más variables independientes Xij( ) .

Con este fin, la presente sección plantea una discusión sobre el sesgo de especificación para entender por qué en ocasiones no se obtienen los resultados teóricos esperados. Adicionalmente se analizan la prueba RESET5 de Ramsey, la prueba J de Davidson y MacKinnon y la prueba del multiplicador de Lagrange. Estas pruebas pretenden detectar el problema ocasionado por los errores de muestreo y medición de las variables independientes y de la variable dependiente, por la omisión de variables independientes relevantes (cuantificables y no observables), por la inclusión de variables independientes redundantes y por la especi-ficación inadecuada de la forma funcional del modelo. Posteriormente se presentarán las principales metodologías para su corrección.

No obstante, la inclusión de endogenidad en el modelo también es otra causa que origina el incumplimiento del supuesto de independencia condicional. Debido a esto se cuestionan los estimadores de MCO porque resultan sesgados e inconsistentes. Por esta razón se incluyen variables instrumentales mediante regresiones en dos etapas (MC2E), con el fin de recuperar las propiedades estadísticas de los coeficientes (insesgados y consistentes).

De igual manera se presentan la prueba de Hausman para identificar endogenidad en las estimaciones de MCO y la prueba de restricciones sobreidentificadas para verificar la validez de las variables instrumenta-les. Finalmente, se aplican las metodologías expuestas mediante un estu-dio de caso basado en el estudio de Gutiérrez (2009), titulado Efectos de la fecundidad sobre el ingreso laboral femenino, que pretende cuantificar los efectos de la fecundidad sobre los salarios de las mujeres.6

1.2. Discusión sobre la especificación de los modelos econométricos

Además del cumplimiento de los supuestos de homoscedasticidad, ausencia de multicolinealidad y autocorrelación residual en estimacio-nes por MCO, también conviene especificar apropiadamente el modelo econométrico para obtener resultados correctos. No obstante, puede

5 Regression equation specification error test.

6 Otro caso aplicado sobre formas funcionales es Perdomo y Hueth (2011).

Page 19: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES 3

presentarse un sesgo de especificación cuando se trabaja con informa-ción estadística que contiene errores de muestreo y medición de las varia-bles, se omiten regresores relevantes (cuantificables y no observables), se incluyen variables independientes redundantes o se define inadecuada-mente la forma funcional del modelo.

Lo anterior puede conducir a sesgos en los estimadores así como en sus varianzas, debido a que el valor estimado Yi

�( ) es obtenido con estos pará-metros y esto afecta los resultados del error estimado Ui

�( ),7 la varianza del error y, por consiguiente, la de los coeficientes. Esto se conoce como sesgo de especificación, que genera una relación inconsistente entre las variables independientes y la variable dependiente (Gujarati, 2003: 491). A continuación se exponen las consecuencias de estimar un modelo mediante MCO con sesgo de especificación, algunos métodos estadísti-cos para identificarlo y las alternativas de solución según su causa.

1.2.1. Causas y consecuencias del sesgo de especificación

Con el fin de estudiar las causas y consecuencias de especificar inade-cuadamente un modelo, considere cualquier axioma general de la teoría económica representado como una expresión en la que se relacionan dife-rentes variables (v. ecuación 1.1).

Y f X X Xi i i ik= ( , , , )1 2 � (1.1)

Y X X X Ui i i k ik i= + + + + +� � � �0 1 1 2 2 � (1.2)

En la ecuación 1.1 Yi8 es la variable dependiente y X Xi ik1 , ..., 9 son varia-

bles explicativas linealmente independientes.10 Por su parte, la expresión 1.2 representa una forma lineal (tanto en las variables como en los coefi-cientes) de la función de regresión poblacional (FRP) descrita por la ecua-ción 1.1, donde �0, �1, �2 , … , �k son la constante y los parámetros del

7 .

8 Con i n= 1 2, ,..., observaciones.

9 Con i n= 1 2, ,..., observaciones.

10 Esto significa que pueden escribirse como una matriz de rango completo o que no existe multicolinealidad perfecta.

Page 20: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

4 RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

modelo, y Ui corresponde a su elemento aleatorio.11 A continuación se exponen las causas que originan el problema de sesgo de especificación y sus consecuencias.

1.2.1.1. Errores de muestreo y medición de las variables del modelo

Una vez obtenida de fuentes primarias o secundarias la información esta-dística de las variables que se especificarán en la ecuación 1.1 (conforme con el principio teórico que se quiera tratar o evidenciar), es importante asegurarse de la buena calidad de los datos recolectados antes de la esti-mación econométrica del modelo, debido a que pueden provenir de un ejercicio inadecuado de muestreo de la población objetivo (tamaños no representativos o sesgo de selección, es decir, una muestra no aleatoria) o pueden contener fallas de digitación o manipulación incorrecta de la encuesta y de la información secundaria agregada o desagregada (errores de medición y datos atípicos).

Las consecuencias de estos errores de muestreo o medición pueden ser variadas, dependiendo principalmente de cuáles fueron las variables reco-lectadas incorrectamente (la dependiente, las independientes o ambas) y de si dichos errores siguen alguna estructura específica a lo largo de la muestra (por ejemplo, si los individuos con características particulares son los que resultan incorrectamente observados de forma sistemática).

El caso más simple corresponde a la medición incorrecta de la variable dependiente. Para formalizar lo anterior, considere un modelo equiva-lente al descrito por la ecuación 1.2 pero con un error de medición de la variable dependiente (denotado �), de tal forma que el valor observado Yi

*( ) diste de su valor real Yi( ) (v. ecuación 1.3).

(1.3)

En la ecuación 1.3 aparece un nuevo término de error Ui* que captura tanto

el componente estocástico del modelo como el error de medición que afecta la variable dependiente. Estimar equivocadamente una ecuación

11 Denominado término de error, que captura los determinantes no observables e impredecibles de la variable dependiente Yi( ) y transforma la relación entre las varia-bles en una relación no determínistica. En este libro el término de error poblacional se representa como Ui , mientras que los errores estimados se denotan como Ui

� .

Page 21: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES 5

como la anterior no necesariamente genera sesgos12 de los estimadores β β� �

0 1y . Aun así, esto sí conduce a un sesgo de las varianzas estimadas

Var Var Var , lo que amplía los intervalos de confianza

e invalida las pruebas de significancia global e individual del modelo

(Gujarati, 2003: 524).

A diferencia del modelo anterior, cuando los errores tienen una estruc-tura específica en la muestra u ocurren en las variables independientes del modelo, los parámetros estimados β β� �

0 1,� � se ven afectados. Esto es un caso particular del incumplimiento del supuesto de independencia condicional, que se estudia con mayor detalle en la sección 1.3.

1.2.1.2. Omisión de variables independientes relevantes

La omisión de variables independientes relevantes en una regresión muestral es otra causa posible de la especificación incorrecta del modelo. La omisión puede ocurrir como consecuencia de la escasa disponibilidad de datos, la incapacidad para su recolección o algún grado de desconoci-miento sobre el planteamiento teórico previo. Para formalizar lo anterior, a partir de la ecuación 1.2 se plantea un nuevo modelo con k – 1 variables explicativas, es decir, omitiendo una variable independiente relevante (v. ecuación 1.4).

Y X X X Ui i i k ik i= + + + + +− −� � � �0 1 1 2 2 1 1� * (1.4)

El término de error13 Ui* de la ecuación 1.4 contiene una variable omitida

teóricamente relevante para explicar Yi . Estimar equivocadamente una ecuación como la anterior tiene algunas consecuencias que se discuten a continuación.

En primer lugar, si la variable omitida capturada en el nuevo término de error está correlacionada con alguna de las k – 1 variables explica-tivas que aparecen en la especificación, el intercepto y las pendientes

resultan sesgados e inconsistentes (v. demostración en el anexo 1.3). Esto se denomina problema de endogenidad y se discute más adelante (v. sección 1.3).

12 Un estimador es sesgado cuando su valor esperado o promedio E β�1� �� � no se aproxima al verdadero valor poblacional que se desea estimar �1( ) . Ver detalles en el anexo 1.2.

13 Formalmente U X Ui k ik i*

= +� , donde Ui es el término de error del modelo correcto.

Page 22: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

6 RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

Aun cuando las variables omitidas capturadas en el nuevo término de error no estén correlacionadas con alguna de las variables explicativas, el intercepto β�0� � será sesgado. No obstante, las pendientes en este caso sí representarían correctamente el parámetro poblacional (Gujarati, 2003: 491).

En cualquiera de los casos, la varianza del error y las varianzas estimadas de los coeficientes Var Var Var son incorrectas, lo que invalida los intervalos de confianza, las pruebas de significancia parcial y global de los coeficientes, así como los intervalos de confianza que se construyan sobre las predicciones del modelo (Gujarati, 2003: 491).

1.2.1.3. Forma funcional incorrecta

Otra causa de especificación errónea sucede cuando se elige una forma funcional incorrecta para expresar las variables independientes. Para este caso, la ecuación 1.5 muestra un modelo lineal con dos variables explicativas X Xi i1 2,( ), donde Xi1 explica la variable dependiente como un polinomio de forma cuadrática. De esta forma, si equivocadamente se plantea una relación lineal (v. ecuación 1.6), se daría lugar a un problema de especificación.

Y X X X Ui i i i i= + + + +� � � �0 1 1 2 12

3 2 (1.5)

Y X X Ui i i i i= + + +� � �0 1 1 2 2* (1.6)

Aunque las estimaciones de MCO calculan correctamente cada uno de los coeficientes, omitir la forma cuadrática conduce a interpretaciones erróneas del efecto que tiene la variable Xi1 sobre la dependiente Yi( ). La diferencia entre el coeficiente obtenido usando una forma funcional incorrecta y el parámetro poblacional corresponde a un sesgo de especifi-cación.14 No obstante, también los estimadores pueden resultar sesgados e inconsistentes (v. demostración en el anexo 1.4).

1.2.1.4. Adición de variables independientes redundantes

La última causa de especificación errónea es la adición de variables independientes innecesarias como consecuencia de un planteamiento teórico incorrecto. Por consiguiente, a la ecuación 1.2 se le adicionan dos regresoras más X Xik ik+ +( )1 2 y como lo muestra la ecuación 1.7. Así,

14 En este caso particular, el efecto marginal correcto de Xi1 sobre Yi es � �1 2 12+ Xi ; el calculado erróneamente corresponde únicamente a �1.

Page 23: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES 7

cada uno de los estimadores de MCO β�i MCO�� � siguen siendo insesgados (v. demostración en el anexo 1.5) pero dejan de ser eficientes, lo que aumenta la probabilidad de cometer un error tipo II.15

Y X X X X X Ui i i k ik k ik k ik i= + + + + + + ++ + + +� � � � � �0 1 1 2 2 1 1 2 2� (1.7)

En resumen, los problemas de especificación por la omisión de variables relevantes o por la adición de términos innecesarios pueden conducir a obtener errores estándar equivocados y sesgos de los parámetros cuando se estima el modelo por MCO. Esto impide realizar aseveraciones confia-bles a partir de los resultados obtenidos. A continuación se presentan diversos contrastes estadísticos que permiten establecer si un modelo está correctamente especificado.

1.2.2. Detección del problema de especificación

Como se discutió anteriormente, los problemas de especificación tienen consecuencias sobre las estimaciones de MCO. Por esta razón, antes de realizar la estimación de alguna relación económica deben realizarse análisis exhaustivos de las estadísticas descriptivas, los gráficos de histo-gramas y las correlaciones, con el fin de conocer si la información de las variables seleccionadas contiene errores de muestreo o medición. Para esto es necesario tener en cuenta el tamaño de la muestra, la media arit-mética, la desviación estándar, el valor máximo y el mínimo, el compor-tamiento del histograma y la tendencia de las correlaciones.

También resulta conveniente contar con herramientas que permitan evaluar la idoneidad de un modelo econométrico. Así, la prueba RESET de Ramsey, la J de Davidson y MacKinnon y la prueba del multiplicador de Lagrange permiten diagnosticar la especificación adecuada o inade-cuada de un modelo.

1.2.2.1. Prueba RESET de Ramsey

Una primera metodología para detectar especificación errónea en un modelo econométrico es la prueba RESET16 de Ramsey, que mediante una regresión auxiliar busca evidencia estadística de qué tan adecuada es la especificación de un modelo. En la regresión auxiliar aparecen los polinomios de la variable explicada estimada Y Yi i

� �2 3 y ( ) como nuevas

15 Declarar equivocadamente un coeficiente como estadísticamente no significativo.

16 Las siglas corresponden a regression equation specification error test.

Page 24: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

8 RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

variables independientes. En este sentido, la ecuación 1.8 presenta el modelo lineal general mostrado en la sección anterior (v. ecuación 1.2), con k variables independientes.

Y X X X Ui i i k ik i= + + + + +� � � �0 1 1 2 2 � (1.8)

De la misma forma, la regresión auxiliar (v. ecuación 1.9) está dada por la

ecuación inicial (1.8) más un polinomio de los valores estimados Y Yi i� �2 3

y ( ). Aunque en la práctica Yi

� 2 y Yi

� 3 son suficientes para realizar la prueba,

teóricamente conviene incluir tantas formas no lineales de estos valores como sea posible (Wooldridge, 2009: 303-304).

Y X X X Y Y ei i i k ik i i i= + + + + + + +β β β β δ δ0 1 1 2 2 1

2

2

3� � � (1.9)

Una vez especificada la regresión auxiliar, la prueba RESET de Ramsey consiste en lo siguiente:

1. Realizar la estimación mediante MCO del modelo en la ecuación 1.8.

2. Con los resultados del numeral anterior, obtener los valores estima-dos para la variable dependiente Yi

�( ).3. Estimar mediante MCO la regresión auxiliar de la expresión 1.9,

agregando los nuevos polinomios Yi� 2

y Yi� 3

como variables indepen-dientes.

4. Ejecutar la prueba estadística F (v. ecuación 1.11) para determinar la significancia de los coeficientes � �1 2 y ( ) que acompañan a Yi

� 2 y Yi

� 3. Si

se rechaza la hipótesis nula (v. prueba de hipótesis 1.10), que plantea que los coeficientes son conjuntamente iguales a cero, significa que el modelo especificado en la ecuación 1.8 tiene sesgo de especifi-cación.

H0 1 2 0: � �= = Existe evidencia sobre una adecuada especificación. (1.10)

H1 1 2 0: � �≠ ≠ Existe evidencia sobre una inadecuada especificación.

F

SCE SCE l

SCE n pFR NR

NRl n p=

−( )− −∼ ,

(1.11)

Ahora bien, la ecuación 1.11 denota el estadístico F, donde SCE repre-senta la suma de los errores al cuadrado. Los subíndices R y NR hacen

Page 25: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES 9

referencia al modelo restringido17 y no restringido,18 respectivamente; p corresponde al número de parámetros en el modelo no restringido y n al total de observaciones. La cantidad de restricciones se denota como l, que en este caso son las dos formas no lineales de Y� . Si el estadístico F calculado supera el valor crítico determinado por Fl n p, − para un deter-minado nivel de significancia (usualmente 1%, 5% o 10%), entonces los coeficientes �1 y �2 son conjuntamente significativos o por lo menos uno de ellos es diferente de cero; es decir, existe evidencia estadística de espe-cificación incorrecta.

No obstante, hasta el momento se desconoce la causa de la especificación incorrecta (un error de medición o muestreo, la omisión de variables rele-vantes o la inclusión de variables independientes redundantes, el uso de una forma funcional incorrecta o la combinación de algunos o todos estos problemas). Por esto deben tenerse en cuenta, uno por uno, aspec-tos alternativos como la revisión de la teoría económica involucrada, los análisis gráficos y otros estudios existentes (Hill et ál., 2001: 135-138) para conocer la fuente del problema encontrado mediante la prueba RESET de Ramsey.

1.2.2.2. Prueba J de Davidson y MacKinnon

Otra técnica que permite evidenciar la especificación errónea de un modelo econométrico es la prueba de Davidson y MacKinnon, también conocida como prueba J. En ella se compara directamente el modelo espe-cificado de manera incorrecta con el modelo potencialmente adecuado. En este orden de ideas, conviene plantear las funciones que exponen todas las posibles causas de especificación incorrecta. Es decir, se compara una función de variables independientes omitidas con una que no presente omisión (v. ecuaciones 1.12 y 1.13), una regresión que incluya variables explicativas con otra sin ellas (v. ecuaciones 1.14 y 1.15). También se plan-tea una forma funcional correcta que ayude a contrastar la equivocada (v. ecuaciones 1.16 y 1.17).

Y X X X U Yi i i k ik i iomitida

= + + + + + →− −� � � �0 1 1 2 2 1 1� �* (1.12)

Y X X X X Y Ui i i k ik k ik iomitida

i= + + + + + + +− −β β β β β δ0 1 1 2 2 1 1 1� � (1.13)

Y X X X X U Yi i i k ik k ik i iredundante

= + + + + + + →+ +� � � � �0 1 1 2 2 1 1� �* (1.14)

17 El modelo restringido es Y X X X Ui i i k ik i= + + + + +� � � �0 1 1 2 2 � .

18 El modelo no restringido es Y X X X Y Y Ui i i k ik i i i= + + + + + + +β β β β δ δ0 1 1 2 2 1

2

2

3� � � .

Page 26: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

10 RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

Y X X X Y Ui i i k ik iredundante

i= + + + + + +β β β β δ0 1 1 2 2 1� � (1.15)

Y X X X U Yi i i k ik i iforma funcional

= + + + + + →� � � �0 1 1 2 2 � �* (1.16)

Y X X X Y Ui i i k ik iforma funcional

i= + + + + + +β β β β δ0 1 1 2 2 1log log log� � (1.17)

A partir de las ecuaciones anteriores, la prueba J de Davidson-MacKinnon consiste en estimar independientemente mediante MCO cada una de las especificaciones en las ecuaciones 1.12, 1.14 y 1.16. En segunda instancia, se toman los valores estimados Yi

�( ) obtenidos en éstas y se añaden como variables independientes en el segundo modelo correspondiente (v. ecua-ciones 1.13, 1.15 y 1.17), según el caso de las ecuaciones iniciales (1.12, 1.14 y 1.16, respectivamente).

Finalmente, con base en los resultados se determina la significancia esta-dística parcial (con el estadístico t) de esta nueva variable independiente. En general, la metodología se puede implementar siguiendo los siguien-tes pasos:

1. Plantear los modelos de las ecuaciones 1.12, 1.14 y 1.16 teniendo en cuenta que la prueba será efectuada sobre la segunda especificación correspondiente a cada caso.

2. Realizar la estimación por MCO del primer modelo en cada ecua-ción.

3. Obtener los valores estimados Yi�( ) del primer modelo de acuerdo

con el caso.

4. Estimar el segundo modelo por MCO agregando el respectivo Yi�

calculado en el paso tres.

5. Ejecutar una prueba estadística t de significancia individual sobre el coeficiente nuevo que acompaña los valores ajustados Yi

�( ). Si éste no resulta estadísticamente igual a cero (se rechaza la hipótesis nula) quiere decir que el modelo inicial (representado por la ecuación 1.12, 1.14 o 1.16 según el caso) está especificado incorrectamente (v. prueba de hipótesis 1.18).

Page 27: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES 11

H0 1 0: � = El modelo 1.12, 1.14 o 1.16 se encuentra especificado correctamente.

(1.18)H1 1 0: � ≠ El modelo 1.12, 1.14 o 1.16 se encuentra especificado erróneamente por la omisión de variables indepen-dientes, la inclusión de variables redundantes o el uso de una forma funcional incorrecta.

Por su parte, el estadístico t es presentado en la ecuación 1.19, donde ee �� 1( ) corresponde al error estándar del coeficiente �� 1. Si el valor calculado del t supera el crítico, determinado por tn p− (p corresponde al número de pará-metros en el modelo y n al total de observaciones) para un determinado nivel de significancia (usualmente 1%, 5% o 10%), entonces el coeficiente �1 resulta estadísticamente significativo. En otras palabras, se rechaza la hipótesis nula y se encuentra evidencia de especificación incorrecta.

t

eetn p= ( ) −

�∼1

1

(1.19)

A diferencia de los resultados de la prueba RESET de Ramsey, la prueba J de Davidson y MacKinnon permite establecer las causas del problema (omisión de variables relevantes, inclusión de variables redundantes o uso de una forma funcional incorrecta) según la especificación tratada. Estas causas pueden ser analizadas simultánea o individualmente en un caso específico.

1.2.2.3. Multiplicador de Lagrange

Para finalizar la exposición de los métodos que ayudan a detectar el sesgo de especificación de un modelo econométrico, en esta sección se estudiará la prueba del multiplicador de Lagrange (PML). Entre las pruebas alter-nativas planteadas (RESET de Ramsey y J de Davidson y MacKinnon), La PML permite determinar si se cumple el supuesto de independencia condicional.19

Esta técnica consiste en comparar directamente el error estimado Ui� *( ) del

modelo especificado incorrectamente con las variables independientes omitidas, redundantes o con forma funcional adecuada. En otras pala-

19 Cuando la covarianza entre al menos una de las variables explicativas Xij( ) y el error Ui( ) es diferente de cero.

Page 28: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

12 RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

bras, permite plantear Ui� *

en función de las variables explicativas omiti-das (v. ecuación 1.20), irrelevantes o redundantes (v. ecuación 1.21) y con forma funcional correcta (v. ecuación 1.22).20

Y X X X U U

U X X

i i i k ik i i

i i i

= + + + + + →

= + +

− −β β β β

α α α

0 1 1 2 2 1 1

0 1 1 2

... * *

*

�22 1 1+ + + +− −... α α εk ik k ik iX X

(1.20)

Y X X X U U

U X X

i i i k ik i i

i i i

= + + + + + →

= + +

+ +β β β β

α α α

0 1 1 2 2 1 1

0 1 1 2

... * *

*

�22 + + +... α εk ik iX

(1.21)

Y X X U U

U X X

i i k ik i i

i i k ik i

= + + + + →

= + + + +

β β β

α α α ε

0 1 1

0 1 1

… �

� …

* *

*ln ln

(1.22)

De esta forma, la PML se puede efectuar de la siguiente manera:

1. Plantear y estimar por MCO los modelos iniciales de las ecuaciones 1.20, 1.21 y 1.22 teniendo en cuenta que la prueba será efectuada sobre éstos.

2. Con los resultados del numeral uno, obtener los errores estimados Ui� *( ) de cada modelo.

3. Una vez obtenidos los errores estimados Ui� *( ), incluirlos como varia-

ble dependiente para especificar cada modelo auxiliar de las ecua-ciones 1.20, 1.21 y 1.22.

4. Estimar por MCO los modelos auxiliares de las ecuaciones 1.20, 1.21 y 1.22.

5. Realizar la PML (v. ecuación 1.24) para todos los coeficientes de la regresión auxiliar � � � �0 1 2, , , ,… k( ). Si no resultan en conjunto o de manera individual estadísticamente iguales a cero (se rechaza la hipótesis nula), quiere decir que modelo inicial de la ecuación 1.20, 1.21 o 1.22 está especificado incorrectamente (v. prueba de hipótesis 1.23).

20 En las ecuaciones 1.20-1.22 la flecha indica que la variable de la derecha se obtiene de la estimación del modelo de la izquierda.

Page 29: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA: TEORÍA Y APLICACIONES 13

H k0 1 2 0: � � �= = = =� El modelo 1.20, 1.21 o 1.22 se encuentra especificado correctamente.

(1.23)H k1 1 2 0: � � �≠ ≠ ≠ ≠�

El modelo 1.20, 1.21 o 1.22 se encuentra especificado erróneamente por la omisión de variables independientes, la inclu-sión de variables redundantes o el uso de una forma funcional incorrecta.

ML nR p= −2

12∼ �

(1.24)

En la ecuación 1.24, ML (multiplicador de Lagrange) equivale a n (total de observaciones) multiplicado por el coeficiente de determinación R2( ) de la regresión auxiliar. El estadístico tiene una distribución ji cuadrada con p − 1 grados de libertad �p−( )1

2, que representan el número de parámetros

menos uno en la regresión auxiliar. Si el ML calculado supera el valor crítico determinado por �p−1

2 para un determinado nivel de significan-

cia (usualmente 1%, 5% o 10%), entonces los coeficientes de la regresión auxiliar son conjuntamente significativos o por lo menos uno de ellos es diferente de cero. En otras palabras, existe evidencia estadística de especi-ficación incorrecta. Las pruebas de significancia individual podrían inter-pretarse análogamente sobre cada uno de los parámetros del modelo.

Todas las pruebas expuestas anteriormente permiten establecer si un modelo econométrico está correctamente especificado o no. A continua-ción se presentan algunas técnicas que permiten corregir el problema de especificación incorrecta utilizando la teoría económica y las variables aproximativas (o proxy por su nombre en inglés) para remediarla.

1.2.3. Soluciones al problema de especificación incorrecta

La especificación correcta es uno de los supuestos del modelo clásico de regresión, cuyo cumplimiento permite encontrar coeficientes coherentes con la teoría económica y hacer inferencia estadística sobre las relaciones entre las variables independientes y la dependiente de la función estimada.

Si en el análisis de las estadísticas descriptivas, de los histogramas y de las correlaciones se detectan errores de muestreo o medición de las varia-bles implicadas, la solución consiste en hacer nuevamente el ejercicio de muestreo y recolección de información (si es el caso) y corregir digitacio-nes o manipulaciones equivocadas en la base datos.

Page 30: FUNDAMENTOS DE ECONOMETRÍA INTERMEDIA · contribución a los ejercicios propuestos en el libro. También queremos ... II y Avanzada en el pregrado y posgrado en Economía de la Universidad

14 RAMÓN ROSALES � JORGE PERDOMO � CARLOS MORALES � JAIME URREGO

Adicionalmente, si el sesgo de especificación proviene de una variable independiente omitida o redundante, o de una forma funcional inco-rrecta, y es detectado mediante cualquiera de las pruebas expuestas ante-riormente, resulta necesario modificar el modelo econométrico inicial. Esta sección presenta dos estrategias para hacerlo: recurrir a la teoría económica y utilizar variables aproximativas.

1.2.3.1. Uso de la teoría económica

La primera alternativa para corregir la especificación errónea consiste en recurrir a la teoría económica que originó el planteamiento del modelo econométrico, con el fin de identificar la omisión de variables indepen-dientes relevantes, la adición de redundantes o la existencia de una forma funcional incorrecta. En el primer caso, es necesario recolectar los datos faltantes para incluir en el modelo las variables explicativas omitidas observables o cuantificables. En los otros casos, los postulados económi-cos deben indicar qué variables dejar a un lado y cómo expresar la forma funcional del modelo econométrico o de cada una de las variables impli-cadas en él para obtener una regresión correctamente especificada.

No obstante, es posible que las variables independientes relevantes excluidas no sean observables ni tampoco cuantificables fácilmente. Sin embargo, dada su importancia desde el punto de vista económico descrito econométricamente, no debe prescindirse de ellas en el análi-sis porque puede incurrirse en el problema de especificación incorrecta por variable explicativa omitida. Por esta condición, el problema se trata utilizando variables aproximativas.

1.2.3.2. Variables aproximativas

Además del análisis teórico, pueden utilizarse variables aproximativas exógenas porque en algunas ocasiones el origen del problema de especi-ficación radica en la existencia de variables independientes omitidas no observables o cuantificables. Esto ocurre con variables como la habilidad, el gusto, la cultura y la calidad de vida de una persona o de una socie-dad en general, entre otras. Por ejemplo, el coeficiente intelectual puede ser una buena aproximación para la habilidad y el índice de desarrollo humano para la calidad de vida.

Teniendo en cuenta lo anterior, la variable aproximativa (proxy) puede definirse como una representación observable y cuantificable, relacio-nada con su determinante no perceptible. Esta variable puede ser incluida