Econometria Jeffrey wooldridge 4 ed.

890

description

Introducción a la Econometría

Transcript of Econometria Jeffrey wooldridge 4 ed.

  • 1. Introduccin ala econometraUn enfoque modernoJeffrey M. WooldridgeMichigan State University4a. edicinTraduccinMa. del Carmen Enriqueta Hano Roarika M. Jasso Hernan DBornevilleTraductoras profesionalesRevisin tcnicaRoberto Palma PachecoCentro de Alta Direccin en Economa y NegociosUniversidad AnhuacDomingo Rodrguez BenavidesFacultad de EconomaUniversidad Nacional Autnoma de MxicoAustralia Brasil Corea Espaa Estados Unidos Japn Mxico Reino Unido Singapur

2. D.R. 2010 por Cengage Learning Edi to res, S.A. de C.V.,una Compaa de Cengage Lear ning, Inc.Corporativo Santa FeAv. Santa Fe nm. 505, piso 12Col. Cruz Manca, Santa FeC.P. 05349, Mxico, D.F.Cengage Lear ning es una mar ca re gis tra dausa da ba jo per mi so.DE RE CHOS RE SER VA DOS. Ninguna parte deeste trabajo amparado por la Ley Federal delDerecho de Autor, podr ser re pro ducida,transmitida, almacenada o utilizada encualquier forma o por cualquier medio, ya seagrfico, electrnico o mecnico, incluyendo,pero sin limitarse a lo siguiente: fotocopiado,reproduccin, escaneo, digitalizacin,grabacin en audio, distribucin en internet,distribucin en redes de informacin oalmacenamiento y recopilacin en sistemasde informacin a excepcin de lo permitidoen el Captulo III, Artculo 27 de la Ley Federaldel Derecho de Autor, sin el consentimientopor escrito de la Editorial.Traducido del libro Introductory Econometrics,Fourth Edition.Publicado en ingls por South-WesternCengage Learning 2009ISBN-13: 978-0-324-66054-8ISBN-10: 0-324-66054-5Datos para catalogacin bibliogrfi ca:Wooldridge, Jeffrey M. Introduccin a laeconometra. Un enfoque moderno, 4a. edicin.ISBN-13: 978-607-481-312-8ISBN-10: 607-481-312-4Visite nuestro sitio en:http://latinoamerica.cengage.comIntroduccin a la econometraUn enfoque moderno4a. edicinJeffrey M. WooldridgePresidente de Cengage LearningLatinoamrica:Javier Arellano GutirrezDirector general Mxico yCentroamrica:Pedro Turbay GarridoDirector editorial Latinoamrica:Jos Toms Prez BonillaDirector de produccin:Ral D. Zendejas EspejelCoordinadora editorial:Mara Rosas LpezEditor senior:Javier Reyes MartnezEditora de produccin:Abril Vega OrozcoDiseo de portada:DIHO Comunicacin grficaImagen de portada:Stock.xchngComposicin tipogrfica:Heriberto Gachz Chvez 3. Contenido breveCaptulo 1 La naturaleza de la econometra y los datos econmicos 1PARTE 1: ANLISIS DE REGRESIN CON DATOS DE CORTE TRANSVERSAL 21Captulo 2 El modelo de regresin simple 22Captulo 3 Anlisis de regresin mltiple: estimacin 68Captulo 4 Anlisis de regresin mltiple: inferencia 117Captulo 5 Anlisis de regresin mltiple: MCO asintticos 167Captulo 6 Anlisis de regresin mltiple: temas adicionales 184Captulo 7 Anlisis de regresin mltiple con informacin cualitativa:variables binarias (o dummy) 225Captulo 8 Heterocedasticidad 264Captulo 9 Ms sobre especifi cacin y temas de datos 300PARTE 2: ANLISIS DE REGRESIN CON DATOS DE SERIES DE TIEMPO 339Captulo 10 Anlisis bsico de regresin con datos de series de tiempo 340Captulo 11 Aspectos adicionales de MCO con datos de series de tiempo 377Captulo 12 Correlacin serial y heterocedasticidad en regresionesde series de tiempo 408PARTE 3: TEMAS AVANZADOS 443Captulo 13 Combinacin de cortes transversales en el tiempo:mtodos simples para datos de panel 444Captulo 14 Mtodos avanzados para datos de panel 481Captulo 15 Estimacin con variables instrumentales y mnimos cuadradosen dos etapas 506Captulo 16 Modelos de ecuaciones simultneas 546Captulo 17 Modelos de variable dependiente limitada y correccionesa la seleccin muestral 574Captulo 18 Temas avanzados de series de tiempo 623Captulo 19 Realizacin de un proyecto emprico 668APNDICEApndice A Herramientas matemticas bsicas 695Apndice B Fundamentos de probabilidad 714Apndice C Fundamentos de estadstica matemtica 747Apndice D Resumen de lgebra matricial 788Apndice E El modelo de regresin lineal en forma matricial 799Apndice F Respuestas a las preguntas del captulo 813Apndice G Tablas estadsticas 823Referencias 830Glosario 835ndice 849iii 4. C A P T U L O 1La naturaleza de la econometray los datos econmicos 11.1 Qu es la econometra? 11.2 Pasos en un anlisis econmico emprico 21.3 Estructura de los datos econmicos 5Datos de corte transversal 5Datos de series de tiempo 8Combinacin de cortes transversales 9Datos de panel o longitudinales 10Comentario sobre las estructuras de datos 121.4 Causalidad y la nocin de ceteris paribusen el anlisis economtrico 12Resumen 17Trminos clave 17Problemas 17Ejercicios en computadora 18P A R T E 1Anlisis de regresin condatos de corte transversal 21C A P T U L O 2El modelo de regresin simple 222.1 Definicin del modelo de regresin simple 222.2 Obtencin de las estimaciones por mnimoscuadrados ordinarios 27Nota sobre la terminologa 352.3 Propiedades de los MCO en cualquier muestrade datos 36Valores ajustados y residuales 36Propiedades algebraicas de los estadsticosMCO 37Bondad de ajuste 402.4 Unidades de medicin y forma funcional 41Efectos de los cambios de unidades de medicinsobre los estadsticos obtenidos por MCO 41Incorporacin de no linealidadesen la regresin simple 43Significado de regresin lineal 462.5 Valores esperados y varianzas de los estimadorespor MCO 46Insesgadez de los estimadores MCO 47Varianza de los estimadores por mnimoscuadrados 52Estimacin de la varianza del error 562.6 Regresin a travs del origen 58Resumen 59Trminos clave 60Problemas 61Ejercicios en computadora 64Apndice 2A 66C A P T U L O 3Anlisis de regresin mltiple:estimacin 683.1 Motivacin para la regresin mltiple 68El modelo con dos variables independientes 68Modelo con k variables independientes 713.2 Mecnica e interpretacin de los mnimoscuadrados ordinarios 73Obtencin de las estimaciones de MCO 73Interpretacin de la ecuacin de regresinde MCO 74El significado de mantener todos los demsfactores constantes en la regresin mltiple 77Cambiar de manera simultnea ms de unavariable independiente 77Valores ajustados y residuales de MCO 77Una interpretacin de descuento de efectosparciales de la regresin mltiple 78Comparacin entre las estimaciones de laregresin simple y de la regresin mltiple 79Bondad de ajuste 80Regresin a travs del origen 833.3 Valor esperado de los estimadores de MCO 84Inclusin de variables irrelevantesen un modelo de regresin 89Sesgo de la variable omitida: caso sencillo 89Sesgo de la variable omitida: casos msgenerales 933.4 Varianza de los estimadores de MCO 94Los componentes de las varianzas de losestimadores de MCO: multicolinealidad 95ivContenido detallado 5. Varianzas en modelos mal especificados 99Estimacin de 2: errores estndarde los estimadores de MCO 1013.5 Eficiencia de MCO: el teoremade Gauss-Markov 102Resumen 104Trminos clave 105Problemas 105Ejercicios en computadora 110Apndice 3A 113C A P T U L O 4Anlisis de regresin mltiple:inferencia 1174.1 Distribucin de muestreo de los estimadoresde MCO 1174.2 Prueba de hiptesis para un solo parmetropoblacional: la prueba t 120Pruebas contra alternativas de una cola 123Alternativas de dos colas 128Otras pruebas de hiptesis acerca de j 130Clculo del valor-p en las pruebas-t 133Repaso del lenguaje empleado en laspruebas de hiptesis clsicas 135Significancia econmica o prcticafrente a significancia estadstica 1354.3 Intervalos de confianza 1384.4 Pruebas de hiptesis de una solacombinacin lineal de los parmetros 1404.5 Pruebas para restricciones lineales mltiples:la prueba F 143Prueba para las restriccionesde exclusin 143Relacin entre los estadsticos F y t 149Forma R-cuadrada del estadstico F 150Clculo de los valores-p parapruebas F 151El estadstico F para la significanciageneral de una regresin 152Prueba para las restriccionesgenerales lineales 1534.6 Informe de los resultados de la regresin 154Resumen 156Trminos clave 158Problemas 159Ejercicios en computadora 163C A P T U L O 5Anlisis de regresin mltiple:MCO asintticos 1675.1 Consistencia 167Obtencin de la inconsistencia en MCO 170Contenido v5.2 Normalidad asinttica e inferenciacon muestras grandes 172Otras pruebas con muestras grandes:el estadstico multiplicador de Lagrange 1765.3 Eficiencia asinttica de MCO 179Resumen 180Trminos clave 181Problemas 181Ejercicios en computadora 181Apndice 5A 182C A P T U L O 6Anlisis de regresin mltiple:temas adicionales 1846.1 Efectos del escalamiento de datossobre los estadsticos de MCO 184Coeficientes beta 1876.2 Ms acerca de la forma funcional 189Ms acerca del empleo de lasformas funcionales logartmicas 189Modelos con funciones cuadrticas 192Modelos con trminos de interaccin 1976.3 Ms sobre bondad de ajuste y seleccinde los regresores 199R-cuadrada ajustada 200Uso de la R-cuadrada ajustada paraelegir entre modelos no anidados 201Control de demasiados factoresen un anlisis de regresin 203Adicin de regresores para reducirla varianza del error 2056.4 Prediccin y anlisis de residuales 206Intervalos de confianza para predicciones 206Anlisis de residuales 209Prediccin de y cuando log(y) es la variabledependiente 210Resumen 215Trminos clave 215Problemas 216Ejercicios en computadora 218Apndice 6A 223C A P T U L O 7Anlisis de regresin mltiplecon informacin cualitativa:variables binarias (o dummy) 2257.1 Descripcin de la informacin cualitativa 2257.2 Una sola variable binaria independiente 226Interpretacin de los coeficientes de variablesexplicativas binarias cuando la variabledependiente es log(y) 231 6. 7.3 Uso de variables binarias en categorasmltiples 233Incorporacin de informacin ordinal medianteel uso de variables binarias 2357.4 Interacciones en las que intervienen variablesbinarias 238Interacciones entre variables binarias 238Considerar pendientes diferentes 239Prueba para diferencias en las funcionesde regresin a travs de los grupos 2437.5 Una variable dependiente binaria:el modelo de probabilidad lineal 2467.6 Ms acerca del anlisis de polticasy evaluacin de programas 251Resumen 254Trminos clave 255Problemas 255Ejercicios en computadora 258C A P T U L O 8Heterocedasticidad 2648.1 Consecuencias de la heterocedasticidadpara MCO 2648.2 Inferencia robusta a la heterocedasticidaden la estimacin por MCO 265Clculo de pruebas ML robustasa la heterocedasticidad 2698.3 Pruebas para heterocedasticidad 271Prueba de White para heterocedasticidad 2748.4 Estimacin por mnimos cuadradosponderados 276Heterocedasticidad conocida,salvo una constante multiplicativa 277La funcin de heterocedasticidaddebe ser estimada: MCG factibles 282Qu pasa si la funcin de heterocedasticidadsupuesta es incorrecta? 287Prediccin e intervalos de prediccincon heterocedasticidad 2898.5 Reconsideracin del modelo de probabilidadlineal 290Resumen 293Trminos clave 294Problemas 294Ejercicios en computadora 296C A P T U L O 9Ms sobre especifi caciny temas de datos 3009.1 Especificacin incorrecta de la formafuncional 300RESET como una prueba general paraespecificacin incorrecta de formasfuncionales 303Pruebas contra alternativas no anidadas 3059.2 Uso de las variables proxy para las variablesexplicativas no observadas 306Utilizacin de variables dependientes rezagadascomo variables proxy 310Un enfoque diferente de la regresinmltiple 3129.3 Modelos con pendientes aleatorias 3139.4 Propiedades de MCO bajo errorde medicin 315Error de medicin en la variabledependiente 316Error de medicin en las variablesexplicativas 3189.5 Datos faltantes, muestras no aleatoriasy observaciones aberrantes 322Datos faltantes 322Muestras no aleatorias 323Observaciones influyentes y observacionesaberrantes 3259.6 Estimacin por mnimas desviacionesabsolutas 330Resumen 331Trminos clave 332Problemas 332Ejercicios en computadora 334P A R T E 2Anlisis de regresincon datos de seriesde tiempo 339C A P T U L O 1 0Anlisis bsico de regresincon datos de series de tiempo 34010.1 Naturaleza de los datos de seriesde tiempo 34010.2 Ejemplos de modelos de regresin con seriesde tiempo 342Modelos estticos 342Modelos de rezagos distribuidos finitos 342Una convencin sobre el ndicede tiempo 34510.3 Propiedades en muestras finitas de MCO bajolos supuestos clsicos 345Insesgamiento de MCO 345Las varianzas de los estimadores de MCO y elteorema de Gauss-Markov 349Inferencia bajo los supuestos del modelolineal clsico 35110.4 Forma funcional, variables binariasy nmeros ndice 353vi Contenido 7. 10.5 Tendencias y estacionalidad 360Caracterizacin de la tendencia en lasseries de tiempo 360Uso de variables con tendencia en elanlisis de regresin 363Interpretacin de las regresiones con tendenciaen el tiempo mediante la eliminacin de latendencia 365Clculo de la R-cuadrada cuando la variabledependiente tiene tendencia 366Estacionalidad 368Resumen 370Trminos clave 371Problemas 371Ejercicios en computadora 373C A P T U L O 1 1Aspectos adicionales de MCOcon datos de series de tiempo 37711.1 Series de tiempo estacionarias y dbilmentedependientes 377Series de tiempo estacionariasy no estacionarias 378Series de tiempo dbilmentedependientes 37911.2 Propiedades asintticas de MCO 38111.3 Uso de series de tiempo altamente persistentesen el anlisis de regresin 388Series de tiempo altamente persistentes 388Transformaciones de series de tiempo altamentepersistentes 393Decidir si una serie de tiempoes o no I(1) 39411.4 Modelos dinmicamente completos y ausenciade correlacin serial 39611.5 El supuesto de homocedasticidad en los modelosde series de tiempo 399Resumen 400Trminos clave 401Problemas 401Ejercicios en computadora 404C A P T U L O 1 2Correlacin serial yheterocedasticidad en regresionesde series de tiempo 40812.1 Propiedades de MCO con errorescorrelacionados serialmente 408Insesgamiento y consistencia 408Eficiencia e inferencia 409Bondad de ajuste 410Contenido viiCorrelacin serial en presencia de variablesdependientes rezagadas 41112.2 Mtodos de prueba de la correlacin serial 412Prueba t de correlacin serial AR(1)con regresores estrictamente exgenos 412Prueba de Durbin-Watson bajo los supuestosclsicos 415Prueba de correlacin serial AR(1)sin regresores estrictamente exgenos 416Prueba de correlacin serial de ordensuperior 41712.3 Correccin de correlacin serial con regresoresestrictamente exgenos 419Obtencin del mejor estimador lineal insesgadoen el modelo AR(1) 419Estimacin por MCG factibles con erroresAR(1) 421Comparacin de MCO y MCGF 423Correccin de la correlacin serialde orden superior 42512.4 Diferenciacin y correlacin serial 42612.5 Inferencia robusta a la correlacinserial despus de MCO 42812.6 Heterocedasticidad en regresionesde series de tiempo 432Estadsticos robustos a laheterocedasticidad 432Pruebas de heterocedasticidad 432Heterocedasticidad condicionalautorregresiva 433Heterocedasticidad y correlacin serialen modelos de regresin 435Resumen 437Trminos clave 437Problemas 438Ejercicios en computadora 438P A R T E 3Temas avanzados 443C A P T U L O 1 3Combinacin de cortes transversalesen el tiempo: mtodos simples paradatos de panel 44413.1 Combinacin independiente de cortestransversales en el tiempo 445Prueba de Chow para el cambio estructuralen el tiempo 44913.2 Anlisis de polticas con combinacin de cortestransversales 45013.3 Anlisis de datos de panel para un periodode dos aos 455Organizacin de los datos de panel 461 8. 13.4 Anlisis de polticas con datos de panelde dos periodos 46213.5 Diferenciacin con ms de dos periodos 465Posibles dificultades con la primeradiferenciacin en los datos de panel 470Resumen 471Trminos clave 471Problemas 471Ejercicios en computadora 473Apndice 13A 478C A P T U L O 1 4Mtodos avanzadospara datos de panel 48114.1 Estimacin de efectos fijos 481Regresin de variables binarias 485Efectos fijos o primera diferencia? 487Efectos fijos con paneles no balanceados 48814.2 Modelos de efectos aleatorios 489Efectos aleatorios o efectos fijos? 49314.3 Aplicacin de mtodos de datosde panel a otras estructuras de datos 494Resumen 496Trminos clave 496Problemas 497Ejercicios en computadora 498Apndice 14A 503C A P T U L O 1 5Estimacin con variablesinstrumentales y mnimoscuadrados en dos etapas 50615.1 Justificacin: variables omitidas en un modelode regresin simple 507Inferencia estadstica con el estimadorde VI 510Propiedades de VI con una variable instrumentaldeficiente 514Clculo de la R-cuadrada despus de laestimacin de VI 51615.2 Estimacin de VI del modelo de regresinmltiple 51715.3 Mnimos cuadrados en dos etapas 521Una sola variable explicativa endgena 521Multicolinealidad y MC2E 523Mltiples variables explicativasendgenas 524Pruebas de hiptesis mltiples despusde la estimacin de MC2E 52515.4 Soluciones de VI a los problemas de erroresen las variables 52515.5 Pruebas de endogeneidad y pruebasde restricciones de sobreidentificacin 527Prueba de endogeneidad 527Prueba de restriccionesde sobreidentificacin 52915.6 MC2E con heterocedasticidad 53115.7 Aplicacin de MC2E a las ecuacionesde series de tiempo 53115.8 Aplicacin de MC2E a cortes transversalescombinados y a datos de panel 534Resumen 536Trminos clave 536Problemas 536Ejercicios en computadora 539Apndice 15A 543C A P T U L O 1 6Modelos de ecuacionessimultneas 54616.1 Naturaleza de los modelos de ecuacionessimultneas 54616.2 Sesgo de simultaneidad en MCO 55016.3 Identificar y estimar una ecuacin estructural 552Identificacin en un sistema de dos ecuaciones 552Estimacin mediante MC2E 55716.4 Sistemas con ms de dos ecuaciones 559Identificacin en sistemas con tres o msecuaciones 559Estimacin 56016.5 Modelos de ecuaciones simultneas con seriesde tiempo 56016.6 Modelos de ecuaciones simultneas con datosde panel 564Resumen 566Trminos clave 567Problemas 567Ejercicios en computadora 570C A P T U L O 1 7Modelos de variable dependientelimitada y correcciones a la seleccinmuestral 57417.1 Modelos logit y probit para respuestabinaria 575Especificacin de modelos logity probit 575Estimacin de mxima verosimilitudde los modelos logit y probit 578Prueba de hiptesis mltiples 579viii Contenido 9. Interpretacin de las estimacioneslogit y probit 58017.2 Modelo Tobit para respuestas de solucinde esquina 587Interpretacin de las estimaciones Tobit 589Problemas de especificacin en losmodelos Tobit 59417.3 El modelo de regresin Poisson 59517.4 Modelos de regresin censurada y truncada 600Modelos de regresin censurada 601Modelos de regresin truncada 60417.5 Correcciones de la seleccin muestral 606Cundo es consistente MCO sobre lamuestra seleccionada? 607Truncamiento incidental 608Resumen 612Trminos clave 613Problemas 614Ejercicios en computadora 615Apndice 17A 620Apndice 17B 621C A P T U L O 1 8Temas avanzados de seriesde tiempo 62318.1 Modelos de rezagos distribuidos infinitos 624Rezagos distribuidos geomtricos(o de Koyck) 626Modelos de rezagos distribuidos racionales 62818.2 Prueba de races unitarias 63018.3 Regresin espuria 63618.4 Modelos de cointegracin y de correccindel error 637Cointegracin 637Modelos de correccin del error 64318.5 Elaboracin de pronsticos 645Tipos de modelos de regresin empleadospara pronsticos 646Pronstico de un paso hacia delante 647Comparacin de pronsticos de un pasohacia delante 651Pronsticos de mltiples pasos hacia delante 652Pronstico de tendencia, estacionalidady procesos integrados 655Resumen 660Trminos clave 661Problemas 661Ejercicios en computadora 663C A P T U L O 1 9Realizacin de un proyectoemprico 66819.1 Plantear una pregunta 66819.2 Revisin bibliogrfica 67019.3 Recoleccin de datos 671Decidir el conjunto apropiado de datos 671Ingresar y almacenar los datos 672Inspeccin, depuracin y resumende los datos 67319.4 Anlisis economtrico 67519.5 La redaccin de un trabajo emprico 678Introduccin 678Marco conceptual (o terico) 679Mtodos economtricos y mtodosde estimacin 679Los datos 682Resultados 682Conclusiones 683Sugerencias de estilo 684Resumen 687Trminos clave 687Muestra de proyectos empricos 687Lista de publicaciones 692Fuentes de datos 693A P N D I C E AHerramientas matemticasbsicas 695A.1 El operador de suma y la estadsticadescriptiva 695A.2 Propiedades de las funciones lineales 697A.3 Proporciones y porcentajes 699A.4 Algunas funciones especiales y suspropiedades 702Funciones cuadrticas 702Logaritmo natural 704La funcin exponencial 708A.5 Clculo diferencial 709Resumen 711Trminos clave 711Problemas 711A P N D I C E BFundamentos de probabilidad 714B.1 Variables aleatorias y sus distribucionesde probabilidad 714Variables aleatorias discretas 715Variables aleatorias continuas 717B.2 Distribuciones conjuntas, distribucionescondicionales e independencia 719Distribuciones conjuntas e independencia 719Distribuciones condicionales 721B.3 Caractersticas de las distribuciones deprobabilidad 722Contenido ix 10. Una medida de tendencia central:el valor esperado 722Propiedades de los valores esperados 724Otra medida de tendencia central:la mediana 725Medidas de variabilidad: varianzay desviacin estndar 726Varianza 726Desviacin estndar 728Estandarizacin de una variablealeatoria 728Sesgo y curtosis 729B.4 Caractersticas de las distribuciones conjuntasy de las condicionales 729Medidas de asociacin: covarianzay correlacin 729Covarianza 729Coeficiente de correlacin 731Varianza de sumas de variables aleatorias 732Esperanza condicional 733Propiedades de la esperanza condicional 734Varianza condicional 736B.5 La distribucin normal y otras distribucionessemejantes 737La distribucin normal 737La distribucin normal estndar 738Propiedades adicionales de ladistribucin normal 740La distribucin ji-cuadrada 741La distribucin t 741La distribucin F 743Resumen 744Trminos clave 744Problemas 745A P N D I C E CFundamentos de estadsticamatemtica 747C.1 Poblaciones, parmetros y muestreoaleatorio 747Muestreo 748C.2 Propiedades de muestras finitasde los estimadores 748Estimadores y estimaciones 749Insesgadez 750La varianza de muestreo de los estimadores 752Eficiencia 754C.3 Propiedades asintticas o de muestragrande de los estimadores 755Consistencia 755Normalidad asinttica 758C.4 Mtodos generales para estimarparmetros 760El mtodo de momentos 760Mxima verosimilitud 761Mnimos cuadrados 762C.5 Estimacin de intervalos e intervalosde confianza 762La naturaleza de la estimacinde intervalos 762Intervalos de confianza para la media deuna poblacin normalmente distribuida 764Una sencilla regla general para unintervalo de confianza a 95% 768Intervalos de confianza asintticospara poblaciones no normales 768C.6 Prueba de hiptesis 770Fundamentos de la prueba dehiptesis 770Pruebas de hiptesis para la mediade una poblacin normal 772Pruebas asintticas para poblacionesno normales 774Clculo y uso de los valores-p 776La relacin entre intervalos de confianzay pruebas de hiptesis 779Significancia prctica frente a significanciaestadstica 780C.7 Comentarios sobre la notacin 781Resumen 782Trminos clave 782Problemas 783A P N D I C E DResumen de lgebra matricial 788D.1 Definiciones bsicas 788D.2 Operaciones matriciales 789Suma matricial 789Multiplicacin escalar 790Multiplicacin matricial 790Transposicin 791Multiplicacin parcial particionada 792Traza 792Inversa 792D.3 Independencia lineal y rangode una matriz 793D.4 Formas cuadrticas y matricesdefinidas positivas 793D.5 Matrices idempotentes 794D.6 Diferenciacin de formas linealesy cuadrticas 795D.7 Momentos y distribucionesde vectores aleatorios 795Valor esperado 795Matriz varianza-covarianza 795Distribucin normal multivariada 796x Contenido 11. Distribucin ji-cuadrada 796Distribucin t 797Distribucin F 797Resumen 797Trminos clave 797Problemas 798A P N D I C E EEl modelo de regresin linealen forma matricial 799E.1 El modelo de estimacin de los mnimoscuadrados ordinarios 799E.2 Propiedades muestrales finitas de MCO 801E.3 Inferencia estadstica 805E.4 Algunos anlisis asintticos 807Estadstico de Wald para probar hiptesismltiples 809Resumen 810Trminos clave 811Problemas 811A P N D I C E FRespuestas a las preguntasdel captulo 813A P N D I C E GTablas estadsticas 823Referencias 830Glosario 835ndice 849Contenido xi 12. PrefacioLo que me motiv a escribir la primera edicin de Introduccin a la econometra: un enfoquemoderno fue la brecha tan amplia que existe entre la enseanza de la materia en los cursos uni-versitariosxiiy la manera en la que los investigadores empricos entienden y aplican los mtodoseconomtricos. Qued convencido de que una introduccin a la econometra desde la perspec-tivade los usuarios profesionales simplificara la exposicin y hara el tema mucho ms inte-resante.Con base en la reaccin positiva a las ediciones anteriores, parece que esta fue una ideaacertada. Muchos docentes, con formacin e intereses diversos y cuyos estudiantes tienen nive-lesdesiguales de preparacin, han adoptado el enfoque moderno de la econometra expuesto eneste libro. En esta edicin sigo haciendo nfasis en la econometra aplicada a cuestiones reales.Todos los mtodos economtricos estn motivados por problemas particulares con los que seencuentran los investigadores al analizar datos no experimentales. El punto central en el libroes la comprensin e interpretacin de los supuestos a la luz de aplicaciones empricas reales: lasmatemticas requeridas no van ms all del lgebra universitaria y la probabilidad y estadsticabsicas.Creado para los profesoresde econometra de hoyEn esta cuarta edicin se conserva la estructura general de la tercera. La caracterstica ms sobre-salienteque distingue a este libro de la mayora es la divisin de los temas con base en el tipode datos analizados. Este es un claro distanciamiento de la metodologa tradicional, en la que sepresenta un modelo lineal, se enumeran todos los supuestos que pueden necesitarse en algnpunto posterior del anlisis y despus se prueban o presentan resultados sin relacionarlos clara-mentecon los supuestos. Mi metodologa consiste en tratar primero, en la parte 1, el anlisisde regresin mltiple con datos de corte transversal bajo el supuesto de un muestreo aleatorio.Esto resulta conocido para el lector, porque ya est familiarizado con el muestreo aleatorio depoblaciones por los cursos de introduccin a la estadstica. En gran medida, esto permite distin-guirlos supuestos acerca del modelo de regresin poblacional subyacente supuestos a los quese les puede dar un contenido econmico o conductual de los supuestos acerca de cmo semuestrearon los datos. El anlisis de las consecuencias de un muestreo no aleatorio puede ver-sede forma intuitiva una vez que los estudiantes tengan una adecuada comprensin del modelode regresin mltiple estimado usando muestras aleatorias.Una caracterstica importante de un enfoque moderno es que las variables explicativas juntocon la variable independiente son tratadas como resultados (valores) de las variables aleatorias.En las ciencias sociales, considerar variables explicativas aleatorias es mucho ms razonable queel supuesto tradicional de variables explicativas no aleatorias. Una ventaja no trivial, es que elmodelo poblacional/enfoque del muestreo aleatorio reduce la cantidad de supuestos que el lec-tortiene que absorber y entender. Curiosamente, el enfoque clsico al anlisis de regresin, quetrata a las variables explicativas como fijas en muestras repetidas, y que sigue siendo dominanteen los libros introductorios, se usa de manera literal con datos recolectados experimentalmente. 13. Adems, los argumentos que se requieren para establecer y explicar los supuestos pueden serpoco claros para el lector.Hago hincapi que en el modelo poblacional los principales supuestos que subyacen al mo-delodel anlisis de regresin, como el supuesto de media cero para los factores no observables,son condicionales adecuadamente impuestos sobre las variables explicativas. Esto lleva a unaclara comprensin de los tipos de problemas, como la heterocedasticidad (varianza no cons-tante),que pueden invalidar los procedimientos estndar de inferencia. Adems, logro disipardiversas concepciones errneas que surgen en los libros de econometra de todos los niveles. Porejemplo, explico por qu la R-cuadrada comn es tambin vlida como medida de bondad deajuste en presencia de heterocedasticidad (captulo 8) o de errores serialmente correlacionados(captulo 12); demuestro que las pruebas para la forma funcional no deben ser vistas como prue-basgenerales de variables omitidas (captulo 9), y explico por qu en un modelo de regresinsiempre deben incluirse variables adicionales de control que no estn correlacionadas con lavariable explicativa de inters, con frecuencia la variable clave de poltica (captulo 6).Como los supuestos para el anlisis de corte transversal son relativamente sencillos y razo-nables,los estudiantes pronto pueden abordar aplicaciones serias de corte transversal sin tenerque preocuparse por los complicados temas de tendencias, estacionalidad, correlacin serial, altapersistencia y regresin espuria, omnipresentes en los modelos de regresin para series de tiem-po.En un principio pens que mi estudio de la regresin con datos de corte transversal seguidode regresin con datos de series de tiempo encontrara la aceptacin de los investigadores cuyointers fuera la microeconoma aplicada, y este parece haber sido el caso. Ha sido grato que aquienes han adoptado este libro y tienen inclinacin al uso de series de tiempo tambin les hayaentusiasmado la estructura del mismo. Posponer el anlisis economtrico de las series de tiempopermite dar la atencin adecuada a los potenciales escollos encontrados en el anlisis de datosde series de tiempo, que no surgen con datos de corte transversal. En efecto, la econometra delas series de tiempo por fin recibe el tratamiento serio que se merece en un libro de introduccina la econometra.Como en ediciones anteriores, he elegido intencionalmente temas que permitan la lectura deartculos de revistas y la realizacin de investigacin emprica bsica. En cada tema he omitidodeliberadamente muchas pruebas y procedimientos de estimacin que, aunque por tradicin in-cluidosen los libros, no han resistido la prueba emprica del tiempo. De la misma manera, hagohincapi en temas ms recientes que han demostrado con claridad su utilidad como, por ejemplo,la obtencin de estadsticos de prueba que sean robustos a la heterocedasticidad (o a la correla-cinserial) de formas desconocidas, el uso de aos mltiples de datos para el anlisis de polticaso la solucin del problema de la variable omitida mediante mtodos de variables instrumentales.Me parece que sta fue una buena eleccin, dado que lo nico que he recibido son unas cuantassugerencias de agregar o eliminar material.A lo largo del libro sigo una metodologa sistemtica, lo que significa que los temas se pre-sentanconstruyendo, de manera lgica, sobre el material previo, y los supuestos se introducena medida que son necesarios para la obtencin de alguna conclusin. Por ejemplo, los profesio-nalesde la econometra comprenden que no se necesitan todos los supuestos de Gauss-Markovpara mostrar que los estimadores por mnimos cuadrados ordinarios (MCO) son insesgados. Sinembargo, la gran mayora de los libros de econometra introduce el conjunto completo de su-puestos(muchos de los cuales son redundantes o incluso lgicamente contradictorios).Mi enfoque sistemtico se ilustra por el orden de los supuestos que utilizo para la regresinmltiple en la Parte 1. Este orden resulta en una progresin natural para resumir brevemente elrol de cada supuesto:RLM.1: Presenta el modelo poblacional e interpreta los parmetros poblacionales (que seespera estimar).Prefacio xiii 14. RLM.2: Presenta el muestreo aleatorio de una poblacin y describe los datos que seemplean para estimar los parmetros poblacionales.RLM.3: Agrega el supuesto, sobre las variables explicativas, que permite calcular losestimados a partir de la muestra; este es el llamado supuesto de ausencia decolinealidad perfecta.RLM.4: Supone que, en la poblacin, la media de los errores no observables no de-pendede los valores de las variables explicativas; este es el supuesto de in-dependenciade la media combinado con una media poblacional cero del error,y es el supuesto clave que produce el insesgamiento de los MCO.PrefacioUna vez introducidos los supuestos RLM.1 a RLM.3 se pueden analizar las propiedades al-gebraicasde los MCO, es decir, las propiedades algebraicas de los MCO en un determinado con-juntode datos. Agregando el supuesto RLM.4, se puede demostrar que los MCO son insesgados(y consistentes). El supuesto RLM.5 (homocedasticidad) se agrega para el teorema de Gauss-Markov (y para que sean vlidas las frmulas usuales de la varianza de los MCO), y RLM.6(normalidad) se agrega para completar los supuestos clsicos del modelo lineal (para la inferen-ciaestadstica exacta).Al pasar al estudio de las propiedades de las muestras grandes y al tratar la regresin de seriesde tiempo en la parte 2, empleo mtodos paralelos. La cuidadosa presentacin y el anlisis de lossupuestos hace relativamente fcil tratar temas ms avanzados, como el uso de combinaciones decorte transversal, el aprovechamiento de la estructura de los datos de panel y la aplicacin de losmtodos de variables instrumentales. En general, me he esforzado por dar una visin unificada dela econometra en la que todos los estimadores y estadsticos se obtengan empleando slo algu-nosprincipios intuitivamente razonables de estimacin y prueba (los que, por supuesto, tambintienen una rigurosa justificacin). Por ejemplo, las pruebas de correlacin lineal y heterocedasti-cidadbasadas en la regresin resultan fciles de entender para el lector, debido a que ya tienenuna slida comprensin de la regresin. Esto contrasta con tratamientos que dan un conjunto derecetas desarticuladas para obsoletos procedimientos economtricos de prueba.En todo el libro hago nfasis en las relaciones ceteris paribus, a lo que se debe que despus deun captulo sobre el modelo de regresin simple, pase al anlisis de regresin mltiple. La regre-sinmltiple motiva al lector a pensar tempranamente acerca de aplicaciones serias. Tambin doygran importancia al anlisis de polticas con todo tipo de estructuras de datos. Los temas prcticos,como el uso de variables proxy para obtener efectos ceteris paribus y la interpretacin de efectosparciales en modelos con trminos de interaccin, son vistos de manera sencilla.Lo nuevo en esta edicinEntre los cambios en esta edicin, en el captulo 3 se encuentra un anlisis sobre los factores deinflacin de la varianza. Hasta ahora me he resistido a incluir un anlisis formal de los diagns-ticosexistentes para detectar multicolinealidad. En esta edicin proporciono, con algunas reser-vas,un breve anlisis. Como en ediciones anteriores, mi opinin de que la multicolinealidades an un tema poco comprendido y de que las afirmaciones que dicen que uno puede detectary corregir multicolinealidad estn equivocadas no ha cambiado. Pero como me he encontradoteniendo que explicar repetidamente el uso y lmites de estadsticos como los factores de infla-cinde la varianza, he decidido enfrentar el tema directamente.En el captulo 6 agrego un anlisis del llamado estimado smearing para la transformacindespus de estimar un modelo lineal en el que la variable dependiente est en forma logartmi-ca.El mtodo del smearing es muy til y fcil de implementar; fue mi descuido no incluirlo enediciones anteriores. Tambin he aadido material sobre la obtencin de un intervalo de predic-xiv 15. Prefacio xvcin de 95% despus de transformar un modelo que satisface los supuestos clsicos del modelolineal.En el captulo 8 cambi el ejemplo 8.6 por uno en el que se emplea una base de datos, msmoderna y mucho ms grande, sobre riqueza financiera, ingreso y participacin en los planes depensin 401(k). Este ejemplo, junto con una nueva subseccin sobre mnimos cuadrados ponde-radoscon una funcin de varianza mal especificada, proporciona una bella ilustracin de cmolos mnimos cuadrados ponderados pueden ser significativamente ms eficientes que los mnimoscuadrados ordinarios, aun cuando se permita que la funcin de varianza est mal especificada.En otra nueva subseccin del captulo 8 se analiza el problema de la prediccin despus dela retransformacin en un modelo con una variable dependiente logartmica y heterocedasticidaden el modelo original.En el captulo 9 hay varios puntos nuevos. Primero proporciono un breve anlisis de losmodelos con pendientes aleatorias. Suministro este material como introduccin a la idea deque los efectos marginales pueden depender de la heterogeneidad individual no observada. Enel anlisis de puntos atpicos y observaciones influyentes incluyo una descripcin de los resi-dualesestudentizados como medio para determinar observaciones influyentes. Tambin hagonotar cmo stos pueden ser obtenidos fcilmente convirtiendo una observacin en variableficticia. Por ltimo el cada vez ms importante modelo de las desviaciones mnimas absolutas(DMA), ahora se describe de forma ms completa en una nueva subseccin. En los ejerciciospara computadora se emplea una nueva base de datos sobre la compensacin de los profeso-resde las escuelas elementales de Michigan para ilustrar la resistencia de las DMA a la inclu-sinde datos sospechosos.En los captulos sobre series de tiempo, captulos 10, 11 y 12, se incluyen dos ejemplos nue-vos(y bases de datos sobre la economa de Estados Unidos). El primer ejemplo es una ecuacinsencilla conocida en la economa como Ley de Okun; el segundo es un anlisis sectorial-espe-cficode los efectos del salario mnimo. Estos ejemplos ilustran bellamente aplicaciones de laregresin a la economa empleando datos de series de tiempo.En los captulos avanzados ahora se incluye un anlisis de la prueba de Chow para datos depanel (captulo 13), un anlisis ms detallado de los mtodos de MCO combinados y datos de pa-nelpara muestras de aglomerados (captulo 14) y mejores anlisis de los problemas de un instru-mentodbil y del carcter de las pruebas de sobreidentificacin con variables instrumentales).En el captulo 17 ampli el anlisis de la estimacin de efectos parciales en modelos nolineales, haciendo hincapi en la diferencia entre efectos parciales evaluados en los promediosde los regresores frente a promediar los efectos parciales sobre todas las unidades.En esta edicin se han agregado ms bases de datos. Ya antes mencion la base de datossobre la compensacin de los profesores (ELEM94_95.RAW). Adems, en algunos problemasnuevos se usa una base de datos sobre donaciones de caridad en Holanda (CHARITY.RAW).Hay dos nuevas bases de datos de series de tiempo OKUN.RAW y MINWAGE.RAW.Hay tambin algunas otras bases de datos que no se usan en el libro, pero que pueden encon-trarseen el sitio web de la obra: sobre los salarios y las publicaciones de los profesores de eco-nomade las 10 principales universidades de Estados Unidos.Dirigido a estudiantes de licenciatura,adaptable para estudiantes de posgradoEste libro est pensado para estudiantes de licenciatura que hayan tomado los cursos de lgebrauniversitaria y uno de introduccin a la probabilidad y estadstica. (Los apndices A, B y C con-tienenel material requerido.) En los cursos de econometra de un semestre o de un trimestre no 16. xvi Prefaciopuede esperarse que se vean todos, o incluso ninguno, de los temas ms avanzados de la parte3. Un curso introductorio tpico comprende los captulos 1 a 8 en los que se ven las bases de laregresin simple y de la regresin mltiple para datos de corte transversal. En tanto en este seconserve el acento en la intuicin y la interpretacin de ejemplos empricos, el material de los pri-merosocho captulos deber ser accesible para los estudiantes de licenciatura de casi todos losdepartamentos de economa. La mayora de los docentes desear ver tambin, con diverso gra-dode profundidad, al menos parte de los captulos sobre anlisis de regresin con datos de seriesde tiempo, captulos 10, 11 y 12. En el curso de un semestre en la Universidad Estatal de Michi-gandonde imparto clases, veo el captulo 10 con bastante detalle, proporciono una visin generalde los temas del captulo 11 y analizo el material sobre correlacin serial del captulo 12. Con-sideroque este curso bsico proporciona a los estudiantes bases slidas para redactar trabajosempricos, como trabajos semestrales, trabajos de seminarios de los estudiantes de ltimo semes-treo tesis. El captulo 9 contiene temas ms especializados que surgen en el anlisis de datos decorte transversal y problemas como, por ejemplo, observaciones atpicas y muestreo no aleato-rio;en un curso de un semestre, puede omitirse este captulo sin prdida de la continuidad.La estructura del libro lo hace ideal para un curso centrado en datos de corte transversal yanlisis de polticas: en lugar de los temas de los captulos 9, 13, 14 y 15, pueden saltarse loscaptulos sobre series de tiempo. El captulo 13 es avanzado slo en el sentido de que se tratandos nuevas estructuras de datos: cortes transversales independientes combinados y anlisis dedatos de panel de dos periodos. Estas estructuras de datos son especialmente tiles en el anli-sisde polticas, y en este captulo se proporcionan varios ejemplos. Quien haya comprendido bienlos captulos 1 a 8 tendr pocas dificultades con el captulo 13. En el captulo 14 se analizanmtodos ms avanzados para datos de panel y probablemente slo podrn ser vistos en un segun-docurso. Una buena manera de concluir un curso sobre mtodos para corte transversal es estu-diandolas nociones elementales de la estimacin de variables instrumentales del captulo 15.El material selecto de la parte 3, que comprende los captulos 13, 14, 15 y 17, lo he usado enun seminario para estudiantes de ltimo ao, orientado a la elaboracin de un artculo de inves-tigacin.Los estudiantes que adems de cursos bsicos de un semestre hayan tenido contactocon el anlisis bsico de datos de panel, con la estimacin de variables instrumentales y con losmodelos de variables dependientes limitadas estarn en condiciones de leer amplios segmen-tosde la literatura aplicada a las ciencias sociales. En el captulo 17 se proporciona una intro-duccina los modelos ms comunes de variables dependientes limitadas.Este libro es, tambin, adecuado para un curso introductorio a nivel maestra, en el que sehaga hincapi en las aplicaciones y no en las deducciones empleando lgebra de matrices. Detodos modos, para los docentes que deseen presentar el material de forma matricial, los apndi-cesD y E son exposiciones del lgebra de matrices y del modelo de regresin mltiple de for-mamatricial.En la Universidad Estatal de Michigan, los estudiantes de doctorado de diversas reas querequieren el anlisis de datos contadura, economa agrcola, economa del desarrollo, finanzas,economa internacional, economa laboral, macroeconoma, ciencias polticas y finanzas pbli-cashan encontrado en este libro un puente entre el trabajo emprico que leen y la econometrams terica que estudian a nivel doctorado.Caractersticas didcticasA lo largo de todo el libro se encuentran diseminadas preguntas, cuyas respuestas se dan en elapndice F. Estas preguntas tienen como finalidad proporcionar al lector una retroalimentacininmediata. Todos los captulos contienen numerosos ejemplos, muchos de los cuales son estudios 17. de caso tomados de publicaciones recientes, ligeramente modificados para simplificar el anlisisy en los que espero no haber sacrificado el punto principal.Los problemas al final de los captulos y los ejercicios para computadora estn fuertementeorientados hacia el trabajo emprico y no a deducciones complicadas. Al estudiante se le pideque piense cuidadosamente con base en lo que ha aprendido. Con frecuencia, los ejercicios paracomputadora son una ampliacin de los ejemplos presentados dentro del captulo. En varios ejer-ciciosse emplean bases de datos de trabajos publicados o bases de datos motivadas por publi-cacionesde investigaciones sobre economa u otros campos.Una innovadora caracterstica de este libro es el extenso glosario. Las breves descripciones ydefiniciones son un til repaso para los estudiantes al preparar exmenes o leer investigacionesempricas que emplean mtodos economtricos. En esta cuarta edicin se agregan varios trmi-nosy otros han sido actualizados.Complementos para el estudianteEl Student Solutions Manual (ISBN 0-324-58658-2) contiene sugerencias sobre cmo leer cadacaptulo, as como las respuestas a algunos problemas y ejercicios para computadora.Complementos para el profesorEl Instructors Manual with Solutions (ISBN 0-324-58657-4) contiene las respuestas a todos losejercicios, as como sugerencias sobre cmo presentar el material de cada captulo. El manualdel instructor contiene tambin fuentes para cada uno de los archivos de datos, y muchas suge-renciasde cmo usarlas en bases de datos, exmenes y trabajos del trimestre.Bases de datos disponibles en cuatro formatosHay aproximadamente 100 bases de datos disponibles en ASCII, EViews, Excel y Stata. Debidoa que la mayora de las bases de datos proviene de investigaciones reales, algunas son muy exten-sas.Salvo algunas listas incompletas de bases de datos que se emplean como ilustracin de lasdiversas estructuras de datos, estas bases de datos no aparecen en la obra. El libro est pensadopara un curso en que el uso de computadoras forme parte integral del mismo. En lnea puede ob-tenerseun amplio manual con la descripcin de los datos. ste contiene una lista de fuentes dedatos, as como sugerencias de cmo usar las bases de datos que no estn descritas en el libro.Recursos para el profesorEste libro cuenta con una serie de recursos para el profesor, los cuales estn disponibles en inglsy slo se proporcionan a los docentes que lo adopten como libro de texto en sus cursos. Paramayor informacin, comunquese a las oficinas de nuestros representantes o a las siguientesdirecciones de correo electrnico:Cengage Learning Mxico y Centroamrica [email protected] Learning Caribe [email protected] Learning Cono Sur [email protected] Learning Pacto Andino [email protected] xvii 18. xviii PrefacioLas direcciones de los sitios web referidas en el libro no son administradas por Cengage LearningLatinoamrica, por lo que sta no es responsable de los cambios o actualizaciones de las mismas.Sugerencias para organizar un cursoYa se ha hablado sobre el contenido de la mayora de los captulos, as como sobre las posiblesformas de organizar los cursos. Aqu se proporcionan comentarios ms precisos acerca de qumaterial puede verse u omitirse en algunos de los captulos.El captulo 9 tiene algunos ejemplos interesantes (como una regresin del salario en la que in-tervienenel CI y una variable explicativa). Las variables proxy no es necesario que se presentenformalmente para tratar este tipo de ejemplos y as suelo hacerlo al terminar el anlisis de cortetransversal. En el captulo 12, tratndose de un curso de un semestre, omito el material sobre infe-renciarobusta a la correlacin serial para mnimos cuadrados ordinarios, as como los modelosdinmicos de heterocedasticidad.Incluso en un segundo curso, acostumbro dedicar poco tiempo al captulo 16 sobre anlisisde ecuaciones simultneas. Si hay algn tema acerca del cual hay diversas opiniones, es la im-portanciade las ecuaciones simultneas. Algunos piensan que este tema es fundamental; otrospiensan que es difcilmente aplicable. Mi opinin es que los modelos de ecuaciones simultneasse emplean de forma exagerada (vea el captulo 16). Si uno lee las aplicaciones cuidadosamente,las variables omitidas y los errores de medicin parecen ser las razones ms probables por lasque se adopte la estimacin de variables instrumentales y a esto se debe que, en el captulo 15,us las variables omitidas para motivar la estimacin de variables instrumentales. Sin embargo,los modelos de ecuaciones simultneas son indispensables para estimar funciones de oferta ydemanda y son tambin usados en otros casos importantes.El captulo 17 es el nico en el que se consideran modelos en los que los parmetros soninherentemente no lineales, lo que es una dificultad ms para los estudiantes. Lo primero quese debe ver en este captulo son los modelos probit y logit para respuesta binaria. Mi presenta-cinde los modelos Tobit y de la regresin censurada parece seguir siendo novedosa: reconozcoexplcitamente que el modelo Tobit se usa para soluciones de esquina en muestras aleatorias,mientras que la regresin censurada se usa cuando el proceso de recoleccin de los datos cen-surala variable dependiente.En el captulo 18 se ven importantes temas recientes de la econometra de las series de tiem-po,que comprenden deteccin de races unitarias y cointegracin. Este material nicamente loveo en un segundo curso, ya sea a nivel licenciatura o posgrado. En este captulo se presentatambin una introduccin bastante detallada al pronstico.El captulo 19 es mucho ms amplio que captulos similares en otros libros. En l se resumenalgunos de los mtodos adecuados para distintos tipos de problemas y estructuras de datos, sesealan escollos potenciales, se explica con cierto detalle cmo escribir un trabajo semestralsobre economa emprica y se dan sugerencias para proyectos. 19. Prefacio xixAgradecimientosQuisiera agradecer a aquellos que revisaron el proyecto para la cuarta edicin o que aportaroncomentarios tiles sobre la tercera:Swarnjit S. AroraUniversity of WisconsinMilwaukeeJushan BaiNew York UniversityEdward CoulsonPenn State UniversityLisa M. DicksonUniversity of MarylandBaltimoreCountyAngela K. DillsClemson UniversityMichael JanssonUniversity of CaliforniaBerkeleySubal C. KumbhakarState University of New YorkBinghamtonAngelo MelinoUniversity of TorontoDaniel MonchukUniversity of Southern MississippiKevin J. MurphyOakland UniversityLeslie PapkeMichigan State UniversitySubhash RayUniversity of ConnecticutEdwin A. SextonBrigham Young UniversityIdahoLara Shore-SheppardWilliams CollegeJeffrey SmithUniversity of MichiganStephen StagebergUniversity of Mary WashingtonTimothy VogelsangMichigan State UniversityAnne E. WinklerUniversity of MissouriSt. LouisDec MullarkeyBoston CollegeVarios de los cambios que seal antes se deben a los comentarios recibidos de personas quese encuentran en esta lista y an sigo considerando algunas de las sugerencias hechas por uno oms de los revisores.Muchos estudiantes y profesores asistentes, demasiados para ser mencionados, han encon-tradoalgn error en las ediciones pasadas o han sugerido una redaccin diferente para algunosprrafos. Agradezco sus sugerencias.Gracias al personal de Cengage Learning, el proceso de revisin se realiz sin tropiezos. MikeWorls, mi editor de adquisiciones, desde hace tiempo, me dio, como siempre, todo su apoyo yLaura Bofinger lleg en plena actividad como mi nueva editora de desarrollo. Me sirvi muchosu entusiasmo en este proyecto.Martha Conway fue muy eficiente como gerente de proyecto y Charu Khanna de MacmillanPublishing Solutions supervis eficiente y profesionalmente la composicin tipogrfica delmanuscrito.Dedico este libro a mi esposa, Leslie quien someti a sus estudiantes de seminario a la ter-ceraedicin y a nuestros hijos, Edmund y Gwenyth quienes ya entienden lo suficiente de eco-nomacomo para saber que ms les vale ser cientficos reales.Jeffrey M. Wooldridge 20. Acerca del autorJeffrey M. Wooldridge es Profesor Universitario Distinguido de Economa en la State Universityen donde ha impartido clases desde 1991. A partir de 1986, y hasta 1991, fue profesor asistente deeconoma en el Instituto Tecnolgico de Massachussets (MIT). Obtuvo su ttulo de Licenciadoen letras, con especializaciones en ciencias computacionales y economa, en la Universidad deCalifornia, Berkeley, en 1982 y su doctorado en economa en la Universidad de California, SanDiego en 1986. Ha publicado cerca de 40 artculos en peridicos reconocidos a nivel interna-cional,xxas como varios captulos de libros. Es tambin autor de Econometric Analysis of CrossSection and Panel Data. Sus premios incluyen la Beca Alfred P. Sloan Research, el premio PluraScript de Econometric Theory, el premio Sir Richard Stone del Journal of Applied Econometricsy tres premios de profesor del ao de graduados del MIT. Es miembro de Econometric Society ydel Journal of Econometrics. Ha sido editor del Journal of Business and Economic Statistics,coeditor de econometra de Economic Letters y colaborador de los consejos editoriales deEconometric Theory, el Journal of Economic Literature, el Journal of Econometrics, de Reviewof Economics and Statistics y del Stata Journal. Tambin ha fungido como consultor en eco-nometrapara Arthur Andersen, Charles River Associates y el Washington State Institute forPublic Policy. 21. C A P T U L O 1La naturaleza de la econometray los datos econmicosEn el captulo 1 se presenta el campo de accin de la econometra y los problemas generalesque surgen al aplicar los mtodos economtricos. En la seccin 1.3 se examinan los tiposde bases de datos que se emplean en los negocios, la economa y en otras ciencias sociales.En la seccin 1.4 se presenta un anlisis intuitivo sobre las dificultades relacionadas con la infe-renciade la causalidad en las ciencias sociales.1.1 Qu es la econometra?Imagine que el gobierno lo contrata para evaluar la efectividad de un programa de capacitacinpara el trabajo financiado con fondos pblicos. Suponga que se trata de un programa para instruira los trabajadores sobre diversas maneras de utilizar las computadoras en los procesos de fabri-cacin.Este programa, de veinte semanas, ofrece cursos en horarios fuera de la jornada laboral.Cualquier trabajador de la industria puede participar e inscribirse de manera voluntaria a todo elprograma o a una parte de l. Usted tiene que determinar si este programa de capacitacin laboraltiene algn efecto sobre los posteriores salarios por hora de los trabajadores.Ahora, suponga que trabaja para la banca de inversin. Tiene que estudiar el rendimiento devarias estrategias de inversin a corto plazo en certificados o letras del tesoro de Estados Unidospara probar si se cumplen las teoras econmicas implicadas.A primera vista, la tarea de responder a estas preguntas puede parecer desalentadora. Porahora, puede que de lo nico que tenga una vaga idea sea del tipo de datos que debe recolectar.Al finalizar el curso de econometra usted sabr emplear los mtodos economtricos para eva-luar,de manera formal, un programa de capacitacin laboral o para probar una teora econmicasencilla.La econometra se basa en el desarrollo de mtodos estadsticos que se utilizan para estimarrelaciones econmicas, probar teoras econmicas y evaluar e implementar polticas pblicasy de negocios. La aplicacin ms comn de la econometra es en el pronstico de variablesmacroeconmicas tan importantes como las tasas de inters, de inflacin y el producto internobruto. Si bien el pronstico de indicadores econmicos es un tema muy conocido y al que sele suele dar mucha publicidad, los mtodos economtricos tambin se emplean en reas de laeconoma que no estn relacionadas con la elaboracin de pronsticos macroeconmicos. Porejemplo, se estudiarn los efectos de los gastos de campaa poltica sobre los resultados de lasvotaciones. En el campo de la educacin, se considerar el efecto que tiene el gasto pblico enescuelas sobre el desempeo de los estudiantes. Adems, se aprender a emplear los mtodoseconomtricos para pronosticar series de tiempo econmicas.1 22. 2 Captulo 1 La naturaleza de la econometra y los datos econmicosLa econometra se ha convertido en una disciplina independiente de la estadstica matem-ticapor ocuparse de la recoleccin y anlisis de datos econmicos no experimentales. Datos noexperimentales son datos sobre individuos, empresas o segmentos de la economa que no sonobtenidos por medio de experimentos controlados. (A los datos no experimentales en ocasionestambin se les llama datos retrospectivos o datos observacionales, para subrayar el hechode que el investigador es recolector pasivo de los datos.) En las ciencias naturales los datosexperimentales suelen ser obtenidos en el laboratorio, pero en las ciencias sociales son muchoms difciles de obtener. Aunque es posible idear experimentos sociales, suele ser imposible,prohibitivamente caro o moralmente indeseable realizar la clase de experimentos controladosque seran necesarios para abordar problemas econmicos. En la seccin 1.4 se dan ejemplosconcretos de la diferencia entre datos experimentales y datos no experimentales.Como es natural, los econometristas han tomado prestado de la estadstica matemtica todolo que les ha sido posible. El mtodo del anlisis de regresin mltiple es un pilar fundamen-talen ambos campos, pero su enfoque e interpretacin pueden ser notablemente diferentes.Adems, los economistas han ideado nuevas tcnicas para lidiar con la complejidad de los datoseconmicos y para probar las predicciones de las teoras econmicas.1.2 Pasos en un anlisis econmico empricoLos mtodos economtricos tienen importancia en casi todas las ramas de la economa aplicada.Se emplean cuando se desea probar una teora econmica o cuando se piensa en una relacinque tiene alguna importancia para decisiones de negocios o para el anlisis de polticas. En unanlisis emprico se utilizan datos para probar teoras o estimar relaciones.Cmo se procede para estructurar un anlisis econmico emprico? Aunque parezca obvio,vale la pena subrayar que el primer paso en cualquier anlisis emprico es la cuidadosa formu-lacinde la pregunta de inters, la cual puede estar relacionada con la prueba de un aspectodeterminado de una teora econmica o puede ser adecuada para probar los efectos de una po-lticapblica. En principio, los mtodos economtricos se pueden emplear para responder a unagama muy amplia de interrogantes.En algunos casos, en especial en aquellos relacionados con la prueba de teoras econmi-cas,se construye un modelo econmico formal, el cual consiste en ecuaciones matemticasque describen diversas relaciones. Los economistas son conocidos por construir modelos parala descripcin de una gran variedad de comportamientos. Por ejemplo, en microeconoma inter-media,las decisiones de consumo de un individuo, sujetas a una restriccin de presupuesto, sedescriben mediante modelos matemticos. La premisa bsica que subyace a estos modelos esla maximizacin de la utilidad. El supuesto de que al hacer una eleccin los individuos, sujetosa restricciones de recursos, eligen aquello que maximice su bienestar, proporciona un slidomarco para la elaboracin de modelos econmicos manejables y de predicciones claras. En elcontexto de las decisiones de consumo, la maximizacin de la utilidad conduce a un conjunto deecuaciones de demanda. En una ecuacin de demanda, la cantidad demandada de cada artculodepende de su precio, del precio de los bienes sustitutos y complementarios, del ingreso delconsumidor y de caractersticas individuales que influyen en las preferencias.Los economistas tambin han empleado herramientas econmicas bsicas, como la maximi-zacinde la utilidad, para explicar comportamientos que a primera vista pueden no parecer decarcter econmico. Un ejemplo clsico es el modelo econmico del comportamiento delictivode Becker (1968). 23. Captulo 1 La naturaleza de la econometra y los datos econmicos 3E j e m p l o 1 . 1[Modelo econmico del comportamiento delictivo]En un artculo extraordinario el premio Nobel, Gary Becker, postul un marco de maximizacin de la utilidadpara describir la participacin de una persona en un acto delictivo. Ciertos delitos tienen claras recompensaseconmicas, pero la mayora de las conductas delictivas tienen costos. El costo de oportunidad del delitoevita que el delincuente desarrolle otras actividades, por ejemplo, desempear un empleo legal. Adems, haycostos como la posibilidad de ser atrapado y, en caso de ser declarado culpable, el costo del encarcelamiento.Desde la perspectiva de Becker, la decisin de emprender una actividad ilegal es una decisin de asignacinde recursos tomando en cuenta los beneficios y los costos de actividades en competencia.Bajo supuestos generales, es posible deducir una ecuacin que describa el tiempo invertido en unaactividad delictiva en funcin de diversos factores. Esta funcin se puede representar comoyf (x1, x2, x3, x4, x5, x6, x7), 1.1dondeyhoras invertidas en actividades delictivas,x1salario por cada hora invertida en la actividad delictiva,x2salario por hora en un empleo legal,x3otro ingreso que no provenga ni de la delincuencia ni del empleo,x4probabilidad de ser atrapado,x5probabilidad de ser declarado culpable una vez que haya sido atrapado,x6pena prevista si es declarado culpable yx7edad.En general, tambin influyen otros factores en la decisin de una persona para participar en una actividaddelictiva, pero la lista anterior es representativa de los que pueden resultar de un anlisis econmico for-mal.Como es usual en la teora econmica, no se ha sido especfico acerca de la funcin f () de (1.1). stadepende de una funcin subyacente de utilidad que rara vez se conoce. No obstante, la teora econmica ointrospeccin puede emplearse para predecir el efecto que tendr cada variable en la actividad delictiva.Esta es la base para un anlisis economtrico de la actividad delictiva de un individuo.Algunas veces, el modelado econmico formal es el punto de partida del anlisis emprico,pero es ms comn el empleo de teoras econmicas menos formales o incluso apoyarse porcompleto en la intuicin. El lector estar de acuerdo en que los determinantes del comporta-mientodelictivo que se muestran en la ecuacin (1.1) estn basados en el sentido comn; podrahaberse llegado de manera directa a esta ecuacin, sin necesidad de partir de la maximizacin dela utilidad. Esta perspectiva tambin tiene su valor, aunque hay casos en los que una deduccinformal hace ms claro lo que para la intuicin puede pasar inadvertido.El siguiente es un ejemplo de una ecuacin que puede deducirse mediante un razonamientomenos formal.E j e m p l o 1 . 2[Capacitacin laboral y productividad de los trabajadores]Considrese el problema planteado al comienzo de la seccin 1.1. Un economista laboral desea examinarlos efectos de la capacitacin sobre la productividad de los trabajadores. En este caso no se necesita unateora econmica formal. Una comprensin bsica de la economa es suficiente para advertir que factorestales como la educacin, la experiencia y la capacitacin laboral afectan la productividad de los trabaja- 24. 4 Captulo 1 La naturaleza de la econometra y los datos econmicosdores. Adems, los economistas saben que a los trabajadores se les paga en razn de su productividad.Este sencillo razonamiento lleva a un modelo como el siguiente:salariof (educ, exper, capacitacin), 1.2dondesalariosalario por hora,educaos de escolaridad formal,experaos de experiencia laboral ycapacitacinsemanas de capacitacin laboral.De nuevo hay otros factores que influyen sobre la tasa salarial, pero la ecuacin (1.2) encierra la esen-ciadel problema.Una vez precisado el modelo econmico, es necesario transformarlo en lo que se llama unmodelo economtrico. Dado que a lo largo de este libro trataremos con modelos economtri-cos,es importante saber cmo se relaciona un modelo economtrico con un modelo econmico.Como ejemplo se tomar la ecuacin (1.1). Antes de poder emprender un anlisis economtricodebe especificarse la forma de la funcin f (). Otro problema relacionado con (1.1) es qu hacercon las variables que no pueden ser observadas de manera razonable. Por ejemplo, considere elsalario que puede ganar una persona mediante una actividad delictiva. En principio, esa es unacantidad bien definida, pero sera muy difcil, si no imposible, precisar cul es esta cantidad paraun determinado individuo. Incluso variables como la probabilidad de ser detenido no pueden serevaluadas de manera realista para un individuo determinado, pero se puede tomar nota de las esta-dsticasde detenciones y deducir una variable que aproxime la probabilidad de ser detenido. Hay,adems, muchos otros factores que influyen en el comportamiento delictivo y que no es posibleenumerar, y mucho menos precisar, pero que de alguna manera deben ser tomados en cuenta.Las ambigedades inherentes al modelo econmico de la actividad delictiva se resuelvenespecificando un modelo economtrico:actdelic01salariom2otringr3 frecdet4 frecculp 5 promsent6 edadu, 1.3dondeactdelicuna medida de la frecuencia de la actividad delictiva,salariomsalario que puede ganar en el empleo legal,otringringresos provenientes de otras fuentes (activos, herencias, etctera),frecdetfrecuencia de las detenciones por delitos anteriores (para aproximarla probabilidad de ser detenido),frecculpfrecuencia de ser declarado culpable ypromsentduracin promedio de la sentencia.La eleccin de estas variables es determinada tanto por la teora econmica como por consi-deracionesacerca de los datos. El trmino u comprende factores no precisados, como el salarioobtenido por la actividad delictiva, costumbres morales, antecedentes familiares y errores en lasmediciones de factores como la actividad delictiva y la probabilidad de ser detenido. Aunquepueden agregarse al modelo variables de antecedentes familiares, tales como cantidad de herma-nos,educacin de los padres, etc., u no puede eliminarse por completo. En efecto, cmo tratareste trmino de error o de perturbacin es quizs el componente ms importante de todo anlisiseconomtrico. 25. Captulo 1 La naturaleza de la econometra y los datos econmicos 5Las constantes 0, 1, , 6 son los parmetros del modelo economtrico y describen direc-ciny fuerza de la relacin entre la actividad delictiva y cada uno de los factores empleados paradeterminar la actividad delictiva en el modelo.Un modelo economtrico completo para el ejemplo 1.2, puede sersalario01educ2exper3capacitacinu, 1.4donde el trmino u comprende factores como habilidades innatas, calidad de la educacin,antecedentes familiares y otros innumerables factores que influyen en el salario de una persona.Si lo que interesa en concreto es la capacitacin laboral, entonces el parmetro de inters es 3.La mayora de las veces, un anlisis economtrico inicia con la especificacin de un modeloeconomtrico sin atender a los detalles de la creacin del modelo. Aqu, en general, se seguireste mtodo debido, en gran parte, a que una deduccin cuidadosa de un modelo, como el mode-loeconmico de la actividad delictiva, toma mucho tiempo y puede llevar a reas especializadas,y a menudo complicadas, de la teora econmica. En los ejemplos presentados en este libro, elrazonamiento econmico ser importante, y toda teora econmica subyacente se incorporaren las especificaciones del modelo economtrico. En el ejemplo del modelo econmico para laactividad delictiva se empezar con un modelo economtrico como el (1.3) y se usarn el razo-namientoeconmico y el sentido comn como guas para la eleccin de las variables. A pesarde que con este mtodo se pierde algo de la riqueza del anlisis econmico, suele ser un modeloempleado de manera frecuente y efectiva por investigadores meticulosos.Una vez que se ha especificado un modelo economtrico como el (1.3) o el (1.4), puedenplantearse diversas hiptesis en relacin con los parmetros desconocidos. Por ejemplo, en laecuacin (1.3), se puede plantear la hiptesis de que salariom, el salario que puede obtenerse enun empleo legal, no tenga efecto alguno sobre el comportamiento delictivo. En el contexto deeste modelo economtrico particular, esta hiptesis es equivalente a 10.Por definicin, en un anlisis emprico se necesitan datos. Una vez recolectados los datossobre las variables relevantes, se emplean los mtodos economtricos para estimar los par-metrosdel modelo economtrico y para probar, formalmente, las hiptesis de inters. En al-gunoscasos, el modelo economtrico se emplea para hacer predicciones, ya sea al probar unateora o al estudiar el impacto de alguna poltica.Dada la gran importancia de la recoleccin de datos en el trabajo emprico, en la seccin 1.3se describe el tipo de datos que suelen encontrarse.1.3 Estructura de los datos econmicosLas bases de datos econmicos pueden ser de diversos tipos. Aunque algunos mtodos econo-mtricospueden ser empleados, con alguna o ninguna pequea modificacin, para distintos tiposde bases de datos, las caractersticas especiales de algunas bases de datos deben ser tomadasen cuenta y aprovecharse. A continuacin se describen las estructuras de datos que suelen en-contrarse.Datos de corte transversalUna base de datos de corte transversal consiste en una muestra de individuos, hogares, em-presas,ciudades, estados, pases u otras unidades, tomada en algn punto dado en el tiempo.Algunas veces no todos los datos de estas unidades corresponden exactamente a un mismo mo-mento.Por ejemplo, puede ser que, un conjunto de familias sea entrevistado durante diferentessemanas de un ao. En un anlisis de corte transversal puro, diferencias menores de tiempo enla recoleccin de los datos son ignoradas. Aun cuando un conjunto de familias haya sido entre-vistadoen semanas distintas de un mismo ao, se considerar como una base de datos de cortetransversal. 26. 6 Captulo 1 La naturaleza de la econometra y los datos econmicosUna caracterstica importante de los datos de corte transversal es que a menudo puede supo-nerseque han sido obtenidos de la poblacin subyacente mediante un muestreo aleatorio. Porejemplo, si se obtiene informacin sobre salarios, educacin, experiencia y otras caractersticastomando de manera aleatoria 500 personas de la poblacin trabajadora, entonces se tiene unamuestra aleatoria de la poblacin de todos los trabajadores. El muestreo aleatorio es el esquemade muestreo que se estudia en los cursos introductorios de estadstica y simplifica el anlisis dedatos de corte transversal. En el apndice C se encuentra un repaso del muestreo aleatorio.Algunas veces, el muestro aleatorio no es una premisa apropiada para analizar datos de cortetransversal. Por ejemplo, suponga que se desea analizar los factores que intervienen en la acumu-lacindel patrimonio familiar. Se puede entrevistar a un conjunto de familias de una muestra alea-toria,pero algunas de ellas se rehusarn a informar sobre su riqueza. Si, por ejemplo, las familiasms acaudaladas estn menos dispuestas a revelar su nivel de riqueza, entonces la muestra obte-nidasobre el patrimonio no es una muestra aleatoria de la poblacin de todas las familias. Estoilustra un problema de seleccin de la muestra, tema avanzado que se ver en el captulo 17.Otra violacin al muestreo aleatorio ocurre cuando se muestrea de unidades que son grandescon relacin a la poblacin, en especial de unidades geogrficas. El problema potencial en es-toscasos es que la poblacin no es tan grande para suponer que las observaciones muestreadassean independientes. Por ejemplo, si se desea explicar el surgimiento de nueva actividad comer-cialen los es tados, en funcin de las tasas salariales, los precios de los energticos, las tasas deimpuestos empresariales y prediales, los servicios disponibles, la calidad de la fuerza de trabajoy otras caractersticas del estado, es poco probable que las actividades comerciales de estadoscontiguos sean independientes entre s. Sin embargo, los mtodos economtricos que se estudia-rnaqu s funcionan en estas situaciones, aunque algunas veces deben ser afinados. En general,la complejidad que resulta al analizar tales situaciones ser ignorada y estos problemas se trata-rnen el marco de un muestreo aleatorio, aun cuando esto no sea tcnicamente correcto.Los datos de corte transversal son muy empleados en economa y en otras ciencias sociales.En economa, el anlisis de datos de corte transversal est relacionado de manera estrecha conlos campos de la microeconoma aplicada, por ejemplo, economa laboral, finanzas pblicas lo-calesy estatales, organizacin industrial, economa urbana, demografa y economa de la salud.Datos sobre individuos, hogares, empresas y ciudades en un punto dado del tiempo son impor-tantespara probar hiptesis microeconmicas y para evaluar polticas econmicas.Los datos de corte transversal que se emplean en el anlisis economtrico pueden represen-tarsey almacenarse en una computadora. La tabla 1.1 contiene, en forma resumida, una base dedatos de corte transversal de 526 trabajadores correspondientes a 1976. (Este es un subconjuntode los datos en el archivo WAGE1.RAW.) Las variables son wage (salario en dlares por hora),educ (aos de escolaridad), exper (aos de experiencia laboral), female (mujer, un indicador delgnero), y married (casado, estado marital). Estas dos ltimas variables son de carcter binario(cero-uno) y se usan para indicar caractersticas cualitativas de la persona (es mujer o no; estcasada o no). En el captulo 7 y posteriores se ver ms acerca de las variables binarias.En la tabla 1.1, la variable obsno es el nmero de observacin asignado a cada persona dela muestra. A diferencia de las otras variables, sta no es una caracterstica de la persona. Todoslos paquetes de software para econometra o para estadstica asignan un nmero de observacina cada dato. La intuicin indica que en datos como los de la tabla 1.1 no importa qu personasea catalogada como la observacin 1, qu persona sea la observacin 2, etc. El hecho de que elorden de los datos no importe es una caracterstica clave del anlisis economtrico de bases dedatos de corte transversal.Algunas veces, en datos de corte transversal las distintas variables corresponden a periodosdiferentes. Por ejemplo, para determinar los efectos de las polticas pblicas sobre el crecimiento 27. Captulo 1 La naturaleza de la econometra y los datos econmicos 7econmico de largo plazo, los economistas han estudiado la relacin entre el crecimiento delproducto interno bruto (PIB) real per cpita a lo largo de cierto periodo (por ejemplo, 1960 a1985) y variables determinadas, en parte, por las polticas pblicas de 1960 (consumo del gobier-nocomo porcentaje del PIB y tasa de educacin secundaria en adultos). Esta base de datos puederepresentarse como en la tabla 1.2, que es una parte de la base de datos empleada en un estudiosobre tasa de crecimiento realizado por De Long y Summers (1991).TABLA 1.3Base de datos de corte transversal sobre salariosy otras caractersticas de los individuosobsnosalario(wage)educ expermujer(female)casado(married)1 3.10 11 2 1 02 3.24 12 22 1 13 3.00 11 2 0 04 6.00 8 44 0 15 5.30 12 7 0 1525 11.56 16 5 0 1526 3.50 14 5 1 0TABLA 1.2Base de datos sobre tasas de crecimiento econmicoy caractersticas de un pasobsno pas cpibrpc govcons60 second601 Argentina 0.89 9 322 Austria 3.32 16 503 Blgica 2.56 13 694 Bolivia 1.24 18 1261 Zimbabwe 2.30 17 6 28. 8 Captulo 1 La naturaleza de la econometra y los datos econmicosLa variable cpibrpc representa el crecimiento promedio del PIB real per cpita a lo largodel periodo 1960 a 1985. El hecho de que govcons60 (consumo del gobierno como porcenta-jedel PIB) y second60 (porcentaje de poblacin adulta con educacin secundaria) correspondanal ao 1960, mientras que cpibrpc sea el promedio del crecimiento a lo largo del periodo de 1960a 1985, no crea ningn problema para considerar esta informacin como una base de datos decorte transversal. Las observaciones se presentan por pas en orden alfabtico, el cual no afectaningn anlisis posterior.Datos de series de tiempoUna base de datos de series de tiempo consiste de las observaciones de una o varias variables alo largo del tiempo. Ejemplos de datos de series de tiempo son los precios de acciones, la can-tidadde dinero en circulacin, el ndice de precios al consumidor, el producto interno bruto, latasa anual de homicidios y las cifras de venta de automviles. Debido a que los eventos pasadospueden influir sobre los eventos futuros y los comportamientos rezagados son frecuentes en lasciencias sociales, el tiempo es una dimensin importante en las bases de datos de series de tiem-po.A diferencia de los datos de corte transversal, en una serie de tiempo el orden cronolgicode las observaciones proporciona informacin potencialmente importante.Una caracterstica fundamental de los datos de series de tiempo, que las hace ms difcilesde analizar que los datos de corte transversal, es que rara vez, si acaso, puede suponerse que lasobservaciones econmicas sean independientes en el tiempo. La mayor parte de las series detiempo econmicas y otras series de tiempo estn relacionadas, a menudo fuertemente, con sushistorias recientes. Por ejemplo, saber algo sobre el producto interno bruto del ltimo trimestredice mucho acerca del rango probable del PIB durante este trimestre, debido a que el PIB tiendea permanecer bastante estable de un trimestre a otro. Aunque la mayor parte de los procedimien-toseconomtricos pueden usarse tanto con datos de corte transversal como con datos de seriesde tiempo, la especificacin de modelos economtricos para datos de series de tiempo requiereun poco ms de trabajo para que se justifique el uso de los mtodos economtricos estndar.Adems, se han desarrollado modificaciones y embellecimientos de las tcnicas economtricasestndar para tomar en cuenta y aprovechar el carcter dependiente de las series de tiempo eco-nmicasy para considerar otras cuestiones, como el hecho de que algunas variables econmicastiendan a mostrar una clara tendencia en el tiempo.Otra caracterstica de las series de tiempo que puede requerir atencin especial es la perio-dicidadde los datos, la frecuencia con que stos se recolectan. En economa, las frecuenciasms comunes son diaria, semanal, mensual, trimestral y anual. As, por ejemplo, los precios delas acciones se publican cada da (con excepcin de sbados y domingos); la cantidad de dineroen circulacin se publica de manera semanal; muchas series macroeconmicas se registran cadames, incluidas las tasas de inflacin y de desempleo. Otras series macroeconmicas se registrancon menos frecuencia, por ejemplo, cada tres meses (o cada trimestre). El producto interno brutoes un ejemplo importante de una serie trimestral. Otras series de tiempo, como la tasa de morta-lidadinfantil en Estados Unidos, slo estn disponibles anualmente.Muchas series de tiempo econmicas semanales, mensuales o trimestrales muestran un fuer-tepatrn estacional, que puede ser un factor importante en el anlisis de una serie de tiempo.Por ejemplo, los datos mensuales sobre la construccin de vivienda varan con los meses, debidosimplemente a la variacin de las condiciones climatolgicas. En el captulo 10 se ver cmotrabajar con series de tiempo estacionales.La tabla 1.3 contiene una base de datos de series de tiempo tomada de un artculo de Castillo-Freeman y Freeman (1992) sobre los efectos del salario mnimo en Puerto Rico. En esta base dedatos el ao ms antiguo, corresponde a la primera observacin y el ao ms disponible corres-pondea la ltima. Al emplear mtodos economtricos para analizar datos de series de tiempo,los datos deben almacenarse en orden cronolgico. 29. Captulo 1 La naturaleza de la econometra y los datos econmicos 9TABLA 1.3Salario mnimo, desempleo y datos relacionados con Puerto Ricoobsno ao prommin coverprom desempl PNB1 1950 0.20 20.1 15.4 878.72 1951 0.21 20.7 16.0 925.03 1952 0.23 22.6 14.8 1015.937 1986 3.35 58.1 18.9 4281.638 1987 3.35 58.2 16.8 4496.7La variable prommin se refiere al salario mnimo promedio de ese ao, coverprom es latasa promedio de cobertura (el porcentaje de los trabajadores protegidos por la ley del salariomnimo), desempl es la tasa de desempleo y PNB es el producto nacional bruto. Estos datos seemplearn ms adelante al analizar el efecto del salario mnimo sobre el desempleo.Combinacin de cortes transversalesAlgunas bases de datos tienen caractersticas tanto de corte transversal como de series de tiempo.Por ejemplo, suponga que en Estados Unidos se realizan dos encuestas de corte transversal a loshogares, una en 1985 y otra en 1990. En 1985 se encuesta a los hogares de una muestra aleatoriaacerca de variables como ingreso, ahorro, tamao de la familia, etc. En 1990 se toma otra mues-traaleatoria de hogares usando las preguntas de la encuesta anterior. Para tener un tamao mayorde la muestra se pueden combinar los cortes transversales juntando los dos aos.Combinar (o juntar) los cortes transversales de aos distintos suele ser una buena manera deanalizar los efectos de las nuevas polticas pblicas. La idea es recolectar datos de aos ante-rioresy posteriores al cambio de la poltica. Considere, por ejemplo, la siguiente base de datossobre los precios de la vivienda tomados en 1993 y 1995, antes y despus de una reduccin enel impuesto sobre la propiedad inmobiliaria en 1994. Suponga que de 1993 se tienen datos de250 casas y de 1995 de 270 casas. Una manera de almacenar esta base de datos es como en latabla 1.4.Las observaciones 1 a 250 corresponden a casas vendidas en 1993 y de la 251 a 520 a las270 casas vendidas en 1995. Aunque el orden en que se almacenen los datos no resulta crucial,conservar el registro del ao de cada observacin suele ser muy importante. A esto se debe queen esta tabla se ingrese ao como una variable aparte.Una combinacin de corte transversal se analiza de manera muy parecida a como se analizanlos datos de corte transversal, salvo que suelen tomarse en cuenta las diferencias que presentanlas variables con el tiempo. En efecto, adems de que se incrementa el tamao de la muestra, loimportante en el anlisis de combinaciones de cortes transversales es observar cmo ha cambia-docon el tiempo una relacin clave. 30. 10 Captulo 1 La naturaleza de la econometra y los datos econmicosTABLA 1.4Combinacin de cortes transversales: precios de la vivienda en dos aos diferentesobsno ao preciov impprov piescuadr recs baos1 1993 85 500 42 1600 3 2.02 1993 67 300 36 1440 3 2.53 1993 134 000 38 2000 4 2.5250 1993 243 600 41 2600 4 3.0251 1995 65 000 16 1250 2 1.0252 1995 182 400 20 2200 4 2.0253 1995 97 500 15 1540 3 2.0520 1995 57 200 16 1100 2 1.5Datos de panel o longitudinalesUn conjunto de datos de panel (o datos longitudinales) consiste en una serie de tiempo por cadaunidad de una base de datos de corte transversal. Por ejemplo, suponga que a lo largo de diezaos se registran los datos de salario, educacin y empleo de un conjunto de personas; o quedurante cinco aos se recolecte informacin sobre inversiones y datos financieros de un mismoconjunto de empresas. Datos de panel tambin pueden recolectarse sobre unidades geogrficas.Por ejemplo, de un conjunto de condados de Estados Unidos pueden recolectarse los datos sobreel flujo de migrantes, tasas de impuestos, tasas salariales, gasto del gobierno, etc., de los aos1980, 1985 y 1990.La caracterstica fundamental de los datos de panel, que los distingue de las combinacio-nesde cortes transversales, es que durante un intervalo de tiempo se vigilan las mismas unidades(personas, empresas o condados, en los ejemplos precedentes) de un corte transversal. Los datosde la tabla 1.4 no se pueden considerar como una base de datos de panel debido a que es muyprobable que las casas vendidas en 1993 sean diferentes de las vendidas en 1995, y aunque hayaalgunas que se encuentren en los dos aos, esta cantidad puede ser demasiado pequea para tenerimportancia. En cambio, la tabla 1.5 contiene una base de datos de panel sobre actividad delicti-vay estadsticos relacionados de 150 ciudades de Estados Unidos en dos aos diferentes.En dicha tabla hay varios aspectos interesantes. Primero, a cada ciudad se le ha dado unnmero del 1 al 150. Es irrelevante a qu ciudad se le considera la nmero 1, la 2, etc. Comoocurre con los datos de corte transversal puro, el orden en el corte transversal de un conjunto dedatos de panel no tiene importancia. Tambin podran haberse usado los nombres de las ciuda-des,en lugar de los nmeros, pero suele ser til tener los dos. 31. Captulo 1 La naturaleza de la econometra y los datos econmicos 11TABLA 1.5Datos de panel, de dos aos, sobre estadsticas de delincuencia urbanaobsno ciudad ao homicidios poblacin desempl polica1 1 1986 5 350 000 8.7 4402 1 1990 8 359 200 7.2 4713 2 1986 2 64 300 5.4 754 2 1990 1 65 100 5.5 75297 149 1986 10 260 700 9.6 286298 149 1990 6 245 000 9.8 334299 150 1986 25 543 000 4.3 520300 150 1990 32 546 200 5.2 493Un segundo punto es que los datos de los dos aos de la ciudad 1 son los dos primerosrenglones u observaciones. Las observaciones 3 y 4 corresponden a la ciudad 2 y as sucesiva -mente. Como para cada una de las 150 ciudades se tienen dos filas de datos, cualquier softwareconsiderar que se tienen 300 observaciones. Esta base de datos puede tratarse como una combi-nacinde cortes transversales, en la que da la casualidad de que las mismas ciudades aparecen encada uno de los aos. Pero, como se ver en los captulos 13 y 14, la estructura de panel tambinpuede usarse para analizar cuestiones a las que no se puede responder si este conjunto de datosse ve como una simple combinacin de cortes transversales.En la tabla 1.5, los datos de los dos aos se colocan en filas contiguas, ubicando en todoslos casos el primer ao antes del segundo. Para casi cualquier fin prctico, esta es la manera quese prefiere para ordenar bases de datos de panel. Comprese la organizacin de estos datos conla manera en la que se han dispuesto los datos en la tabla 1.4. En pocas palabas, la razn paraordenar los datos como en la tabla 1.5 es que se necesitar realizar transformaciones para cadaciudad a lo largo de los dos aos.Dado que en los datos de panel se requiere que las unidades sean las mismas a lo largo deltiempo, las bases de datos de panel, en especial si son de personas, hogares o empresas, sonms difciles de obtener que las combinaciones de cortes transversales. Es comprensible queobservar las mismas unidades a lo largo del tiempo tenga diversas ventajas sobre los datos decorte transversal o aun sobre combinaciones de cortes transversales. La ventaja de importanciaen este libro es que tener varias observaciones de las mismas unidades permite controlar de-terminadascaractersticas no observadas de las personas, empresas, etc. Como se ver, el usode ms de una observacin suele facilitar la inferencia causal en situaciones en las que inferircausalidad sera muy difcil si se contara slo con un corte transversal. La segunda ventaja delos datos de panel es que permiten estudiar la importancia de desfases de conducta o los resul-tadosde la toma de decisiones. Esta informacin puede ser significativa debido a que el impactode muchas polticas econmicas slo puede esperarse despus de pasado algn tiempo. 32. 12 Captulo 1 La naturaleza de la econometra y los datos econmicosMuchos de los libros que no son para niveles de maestra o doctorado no contienen mtodoseconomtricos para datos de panel. Sin embargo, en la actualidad muchos economistas recono-cenque hay algunas cuestiones a las que es difcil, o imposible, responder de manera satisfacto-riasin el uso de datos de panel. Como se ver, con el anlisis de datos de panel, un mtodo queno es mucho ms complicado que el empleo de datos de corte transversal estndar, es posiblelograr progresos considerables.Comentario sobre las estructuras de datosLa primera parte de este libro se ocupa del anlisis de datos de corte transversal, debido a queesto presenta menos dificultades tcnicas y conceptuales. Al mismo tiempo permite ilustrar lamayor parte de los temas fundamentales del anlisis economtrico. Los mtodos e ideas delanlisis de cortes transversales sern empleados en el resto del libro.Aunque en el anlisis economtrico de las series de tiempo se usan muchas de las herra-mientaspropias del anlisis de cortes transversales, el anlisis de series de tiempo es ms com-plicadodebido a las trayectorias, de carcter altamente persistente, que presentan muchas serieseconmicas. En la actualidad es muy aceptado que los ejemplos tradicionalmente empleadospara ilustrar la aplicacin de los mtodos economtricos a las series de tiempo son inadecua-doso errneos. De manera que en un principio no tiene mucho sentido emplearlos ya que esoslo reforzar una mala prctica economtrica. Por tanto, el estudio de las series de tiempoeconomtricas se pospondr hasta la parte 2 del libro, en la que se introducen los temas que serefieren a tendencia, persistencia, dinmica y estacionalidad.En la parte 3 se vern explcitamente combinaciones de cortes transversales y datos de panel.El anlisis de cortes transversales combinados de manera independiente y el anlisis de datos depanel sencillos son extensiones bastante sencillas del anlisis de cortes transversales puro. Sinembargo, estos temas se tratarn hasta el captulo 13.1.4 Causalidad y la nocin de ceteris paribusen el anlisis economtricoEn la mayora de las pruebas de teoras econmicas, as como en la evaluacin de polticaspblicas, el objetivo de los economistas es inferir que una variable (por ejemplo, la educacin)tiene un efecto causal sobre otra variable (por ejemplo, la productividad de los trabajadores).Encontrar simplemente una relacin entre dos o ms variables puede ser sugestivo, pero no con-cluyente,a menos que pueda establecerse causalidad.El concepto ceteris paribus si todos los dems factores relevantes permanecen cons-tantestiene un papel importante en el anlisis causal. Esta idea ha estado implcita en partede lo hasta ahora dicho, en particular en los ejemplos 1.1 y 1.2, pero no se haba mencionado demanera explcita.Es probable que el lector recuerde de los cursos de introduccin a la economa, que la mayorparte de las cuestiones econmicas tienen un carcter ceteris paribus. Por ejemplo, cuando seanaliza la demanda del consumidor interesa saber el efecto que tiene una modificacin en elprecio de un determinado bien sobre la cantidad demandada, mientras todos los dems factorestales como ingreso, precios de los dems bienes y preferencias individuales se mantienenconstantes. Si no permanecen constantes los dems factores, entonces no se puede saber cul esel efecto de una modificacin en el precio sobre la cantidad demandada.Mantener los dems factores constantes tambin es crtico en el anlisis de las polticas.En el ejemplo de la capacitacin laboral (ejemplo 1.2), interesa conocer, por ejemplo, el efecto 33. Captulo 1 La naturaleza de la econometra y los datos econmicos 13de una semana ms de capacitacin sobre el salario, cuando todos los dems componentes (enparticular, educacin y experiencia) permanecen sin cambio. Si se logran mantener constantestodos los dems factores relevantes y se encuentra una relacin entre capacitacin laboral ysalarios, puede concluirse que tal capacitacin tiene un efecto causal sobre la productividad delos trabajadores. A pesar de que esto puede parecer bastante sencillo, aun ya en este n