Heck Man

download Heck Man

of 85

Transcript of Heck Man

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    211

    DATOS MICROECONMICOS,HETEROGENEIDAD

    Y LA EVALUACIN DE POLTICASPBLICAS*

    James J. Heckman**Universidad de Chicago y American Bar Foundation

    En este artculo se recogen las contribuciones de la microecono-metra al conocimiento econmico. En l se abordan cuatro gran-des temas: (1) el desarrollo por los microeconmetras de nuevasherramientas para responder a los problemas que empezaron asurgir tras la Segunda Guerra Mundial a raz del anlisis de lasnuevas fuentes de informacin microeconmica; (2) las contribu-ciones de la microeconometra a los mtodos de series tempora-les agregadas mediante la construccin de modelos que a su vezrelacionan esquemas tericos econmicos para los individuos condatos sobre el comportamiento individual; (3) la importante regu-laridad emprica que esta disciplina detect, referente a la diversi-dad y heterogeneidad del comportamiento, con importantes con-secuencias sobre la teora econmica y la prctica economtrica;(4) la sustancial contribucin de la microeconometra en materiade evaluacin cientfica de medidas de poltica econmica pblica.

    Palabras clave: microeconometra, heterogeneidad de la conducta,evaluacin economtrica de polticas, Conferencia Nobel.

    (*) Versin revisada del discurso pronunciado por James J. Heckman en Estocolmo, el 8 dediciembre de 2000, cuando recibi, junto con Daniel McFadden, el Premio en CienciasEconmicas del Banco de Suecia, creado en memoria de Alfred Nobel. El artculo escopyright de la Fundacin Nobel 2000 y se publica en RAE Revista Asturiana de Eco-noma gracias a la autorizacin de la Fundacin Nobel y con el permiso del autor. La tra-duccin ha sido realizada por Sofa Garca y la revisin tcnica corresponde a la profe-sora Arielle Beyaert.

    (**) Agradezco los muy tiles comentarios de Jaap Abbring, Pedro Carneiro, Lars Hansen,Steve Levitt, Costas Meghir, Robert Moffitt, Jeffrey Smith y Edward Vytlacil. La investi-gacin ha sido realizada gracias a la ayuda 97-09-873 de la National Science Foundation,a la ayuda 40-4043-000-85-261 del National Institute of Child Health and Human Deve-lopment y a las ayudas de la American Bar Foundation. Agradezco a estas tres institu-ciones su apoyo durante todos estos aos.

    P209-296 9/1/04 09:19 Pgina 211

    mikeText Boxhttp://www.nobelprize.org

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    212

    En nombre de todos los economistas que analizan datos microecon-micos y que emplean la microeconometra para unir la teora y la eviden-cia y para evaluar polticas de intervencin de todo tipo, acepto el Premiode Ciencias Econmicas que otorga el Banco de Suecia en memoria deAlfred Nobel.

    El campo de la microeconometra ha surgido en los ltimos 40 aos paraayudar a los economistas a describir con ms precisin la economa, a dise-ar y evaluar polticas econmicas, y a contrastar teoras econmicas y esti-mar parmetros de modelos econmicos bien planteados. Se trata de uncampo cientfico dentro del marco de la economa que relaciona teorassobre comportamientos individuales con datos individuales, y pueden serobjeto de estudio las empresas, las personas o las unidades familiares. Lainvestigacin en el campo de la microeconometra est basada en el anlisisde datos. La existencia de nuevos tipos de datos supone la aparicin de nue-vos retos y oportunidades que han estimulado los importantes avances rea-lizados en este campo y han supuesto un cambio en la percepcin de la rea-lidad econmica por parte de los economistas. La investigacin en estamateria tambin guarda una estrecha relacin con las polticas econmicas.Aquellas cuestiones de poltica econmica que pueden ser estudiadas pormedio de los datos han motivado gran parte de la investigacin en microe-conometra. El deseo de contrastar y desarrollar nuevos modelos econmi-cos tambin es determinante para la investigacin en este campo.

    En este discurso, tratar cuatro temas esenciales de la microeconome-tra, campo que ha sido reconocido por el Comit del Premio Nobel por pri-mera vez este ao. El primero est relacionado con la aparicin de datosnuevos y muy ricos sobre individuos y empresas tras la Segunda GuerraMundial, lo que permiti a los economistas comprender la economa enmayor profundidad al tiempo que enfrentaba a los econmetras a unaserie de problemas sin solucionar que no podan tratarse correctamentecon los mtodos de la econometra de ecuaciones simultneas de la Comi-sin Cowles. Los avances en microeconometra se han visto estimuladospor los problemas empricos que surgen al analizar datos econmicos.

    El segundo tema guarda una estrecha relacin con el primero. La micro-econometra naci de la econometra de la Comisin Cowles como respues-ta a las lagunas empricas de su teora. La econometra de la Comisin Cow-les fue concebida para datos agregados y en un principio fue aplicada a granescala a series temporales econmicas. Muchos de los modelos econom-tricos de la Cowles se crearon con otra aspiracin distinta a la de ofrecersoluciones a problemas especficos de toma de decisiones individuales; eincluso cuando se crearon con este objetivo, la literatura que trata el proble-ma de la agregacin en econometra estableci de manera formal que larelacin entre el tomador de decisiones y los datos agregados empleadospara estimar los modelos no era evidente. La microeconometra ha desarro-llado modelos sobre el comportamiento individual formulados con precisiny ha estimado modelos sobre datos individuales. De esta manera, la relacinentre la teora y los datos ha llegado a apreciarse con mayor claridad.

    En tercer lugar, esta conferencia aborda el tema de la emergencia deun nmero considerable de descubrimientos empricos que surgen de lainvestigacin microeconomtrica. El ms importante es la evidencia de

    P209-296 9/1/04 09:19 Pgina 212

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    213

    que, en la vida econmica, prevalecen la heterogeneidad y la diversidad.Al realizarse un estudio completo de la heterogeneidad en las respuestas,surgi una variedad de medias posibles para describir la personamedia y se descubri que el paradigma tradicional del consumidorrepresentativo careca de fundamento emprico. Esto supuso un cambioen la percepcin por los economistas de los modelos economtricos y laevaluacin de polticas econmicas. Apareci pues un nuevo modelo paralos fenmenos microeconmicos. En el contexto del anlisis de regresin,no slo las ordenadas en el origen, sino tambin los coeficientes de laspendientes, se hicieron variables, y se constat que unas y otras podranpresentar correlaciones con los regresores. Tener en cuenta la heteroge-neidad y la diversidad as como sus implicaciones para la economa y laeconometra es el primer objetivo de esta conferencia y el tema principaldel trabajo que he realizado a lo largo de mi vida.

    El cuarto tema de mi discurso aborda la importante contribucin de lamicroeconometra en materia de evaluacin cientfica de polticas econmi-cas basada en modelos economtricos, la cual ha constituido desde siem-pre un problema central de la econometra. Cuando se hicieron evidenteslas dificultades para identificar parmetros estructurales, ya fuera paradatos macroeconmicos o microeconmicos, los microeconomistas, basn-dose en las importantes sugerencias de Marshak (1953) y Hurwicz (1962),comenzaron a plantearse si era necesario recuperar todos los parmetrosde modelos estructurales para responder, de forma fundamentada, a cues-tiones especficas de poltica. A partir de entonces, se le otorga mayorimportancia a los parmetros que son especficos del problema bajo estu-dio, los llamados efectos del tratamiento (en ingls: treatment effects),que generalmente son distintos de los parmetros estructurales. Son par-metros que ofrecen respuestas a cuestiones econmicas ms limitadas peroque son ms fciles de identificar y de acotar. El conocer las ventajas y limi-taciones de estos efectos del tratamiento y el relacionarlos con los parme-tros estructurales de la literatura anterior son avances muy recientes.

    1. LA MICROECONOMETRA: ORGENES Y DEFINICINLa econometra es una rama de la economa que une la teora econ-

    mica y los mtodos estadsticos para as poder interpretar datos econ-micos y disear y evaluar polticas sociales. La teora econmica juega unpapel imprescindible en la aplicacin de los mtodos economtricos por-que, en muchos aspectos de interpretacin, los datos en s no son sufi-cientes, no hablan por s solos. La econometra hace uso de la teora eco-nmica para guiar la construccin de modelos contrafactuales y aportarcierta disciplina a la investigacin emprica en economa.

    La produccin de una amplia base de datos que puede ser empleadapara describir la economa, contrastar teoras econmicas y evaluar lapoltica econmica, es uno de los elementos ms importantes en el desa-rrollo de la economa del siglo XX. Antes de este siglo, la economa eramayoritariamente una disciplina deductiva que se basaba en observacio-nes anecdticas y en la introspeccin para contrastar la validez de la teo-ra y evaluar las polticas econmicas.

    P209-296 9/1/04 09:19 Pgina 213

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    214

    La til nocin terica de Alfred Marshall de la empresa representativay del consumidor representativo estaba fuertemente arraigada en la teo-ra econmica cuando los economistas comenzaron a recoger y a analizarde manera sistemtica datos econmicos agregados. Los primeros econ-metras se centraron en los datos agregados para medir los ciclos econmi-cos y para construir modelos que podan ser la base de un acercamientoemprico a la evaluacin de polticas macroeconmicas. Empleando siste-mas de ecuaciones lineales, estos autores desarrollaron un marco para elanlisis de modelos causales y la produccin de polticas contrafactuales.Por primera vez la causalidad se diferenciaba de la correlacin de una formaprecisa y fundamentada que poda aplicarse empricamente.

    A pesar de que constituyeran considerables aportaciones intelectuales,los resultados empricos que se obtuvieron con estos mtodos resultaronser decepcionantes. Casi desde el comienzo, los datos agregados de seriestemporales se consideraban poco tiles y los modelos macroeconmicosempricos poco efectivos para contrastar teoras y aportar consejos encuanto a las polticas econmicas a seguir (vase Morgan, 1990). A excep-cin de algunos casos notables, los macroeconmetras adoptaron losmtodos estadsticos de series temporales para las cuales la relacin entreel modelo estadstico y la teora econmica era generalmente dbil.1

    Ya en 1962, Orcutt (1962) abogaba por un programa que combinaradatos microeconmicos y macroeconmicos para obtener as una des-cripcin ms fiable de los fenmenos econmicos y contrastar teoras eco-nmicas alternativas. En la poca en que Orcutt expuso sus puntos devista, la base de datos microeconmicos era muy reducida, los ordenado-res tenan una capacidad limitada y existan numerosos problemas deriva-dos del uso de datos microeconmicos para estimar relaciones de com-portamiento que no se haban logrado entender y mucho menos resolver.Sin embargo, la propuesta de Orcutt era audaz y contribuy a la puesta enmarcha de las fuerzas motrices de la microeconometra moderna.

    La microeconometra ampli la teora de la Cowles desarrollandomodelos econmicos ms ricos en los cuales la heterogeneidad de losagentes desempean un papel fundamental y las ecuaciones que se esti-man guardan una relacin mucho ms estrecha con los datos individua-les y los modelos de eleccin individual. El centro de la teora econmicalo constituyen los individuos y sus interacciones con los mercados y otrasinstituciones sociales. Los datos necesarios para poner a prueba la teoramicroeconmica son a su vez microeconmicos. La literatura econom-trica sobre el problema de la agregacin (Theil, 1954; para una panormi-ca vase, por ejemplo, Green, 1964 o Fisher, 1969) puso de manifiesto lafragilidad de los datos agregados para inferir el tamao o el signo de las

    (1) Vase tambin, sin embargo, el importante trabajo de Fair (1976, 1994), Hansen y Sar-gent (1980, 1991) y Hansen y Singleton (1982), que constituye la excepcin a esta regla.Heckman (2000) examina este desarrollo. Estos mtodos formulan problemas de tomade decisin bien planteados para individuos al deducir su ecuacin de estimacin perola aplican a datos agregados.

    P209-296 9/1/04 09:19 Pgina 214

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    215

    relaciones microeconmicas. Al final, esta literatura tuvo resultados nega-tivos y demostr la importancia de emplear datos microeconmicoscomo elemento de base de una ciencia econmica con fundamentosempricos. Todo ello constituy la razn esencial que motiv la recogiday el anlisis de datos microeconmicos.

    Otra de las motivaciones fue el desarrollo del Estado del bienestarmoderno y una consecuente demanda de informacin sobre la caracteriza-cin, las causas y las soluciones a problemas sociales, as como una deman-da pblica de evaluacin objetiva de los programas sociales dirigidos a gru-pos determinados. La aplicacin de los principios del paradigma de la Cow-les y de su ampliacin por Theil (1961) origin una demanda deestimaciones estructurales basadas en datos microeconmicos. Durante elperiodo optimista de los aos 60 y 70, la estimacin de parmetros estruc-turales que no varan con la poltica, basados en datos microeconmicos,pasaron a ser el objetivo central del anlisis economtrico destinado a eva-luar los efectos de polticas antiguas en un entorno nuevo y a evaluar losposibles efectos de nuevas polticas que nunca se haban puesto en prctica.

    Adems del inters que presentaban para el anlisis poltico, los mode-los estructurales se emplearon para poner a prueba las teoras econmicas.La economa laboral en particular se vio enriquecida por la aplicacin deteoras neoclsicas en el mercado de trabajo. Esta demanda se vio alimen-tada por la emergencia de una teora macroeconmica basada en la micro-economa. Las magnitudes numricas de las preferencias a nivel individualy los parmetros de la produccin desempearon un papel crucial en losdebates sobre las teoras econmicas y las polticas macroeconmicas.

    Otra fuente de demanda de estimaciones estructurales surgi de lanecesidad de sintetizar e interpretar la avalancha de datos microecon-micos que presenci la economa desde mediados de los aos 50. La apa-ricin de encuestas microeconmicas se produjo en el momento de laintroduccin de los ordenadores y del desarrollo y propagacin de losmtodos de regresin mltiple de Theil (1961, 1971) y Goldberger (1964)y todo ello hizo posible que se produjeran rpidamente no cientos, sinomiles, de regresiones. La consecuente invasin de nmeros era difcil deinterpretar o de emplear para contrastar teoras o llegar a un consensobien fundado sobre poltica econmica. Surgi as una demanda demodelos de pocas dimensiones que se presten a la interpretacin econ-mica y permitan resumir las crecientes montaas de datos microecon-micos, y exista un reconocimiento cada vez ms generalizado de que losmtodos de regresin estndar no capturaban todas las caractersticas delos datos y de que tampoco ofrecan un marco para la interpretacin dedatos en modelos econmicos bien planteados.

    Antes de pasar a hablar de los avances especficos en microeconome-tra, es til considerar dos cuestiones de evaluacin de poltica econmi-ca que difieren mucho entre s en cuanto a los datos y a los supuestos quese requieren para dar respuesta a las preguntas que plantean. En la micro-econometra de los ltimos treinta aos, puede describirse una evolucinque va de responder a cuestiones estructurales complicadas a respondera las cuestiones relativamente ms simples del efecto del tratamiento.

    P209-296 9/1/04 09:19 Pgina 215

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    216

    2. POLTICA ECONMICA, MODELOS ECONMICOS Y EVALUACINECONOMTRICA DE POLTICAS

    A menudo se confunden dos cuestiones relativas a la evaluacin depolticas econmicas que son conceptualmente diferentes. La cuidadosadistincin de estas dos cuestiones representa un importante avance enmicroeconoma y constituye uno de los temas esenciales de esta confe-rencia. La primera pregunta que se plantea es la siguiente: (1) Qu efec-to tiene la puesta en prctica de un determinado programa sobre los par-ticipantes en el mismo y sobre los que no participan en contraposicin ala puesta en prctica de un programa alternativo o a no desarrollar nin-gn programa? Esto es lo que se denomina ahora el problema del efec-to del tratamiento. La segunda pregunta que surge es: (2) Qu efectopuede esperarse de un nuevo programa o de un programa antiguo apli-cado en un entorno diferente? Esta segunda pregunta plantea el mismotipo de problemas que surgen cuando se trata de estimar la demandapara un nuevo producto. Para responder a sta, es necesaria una estima-cin estructural.2

    Es ms sencillo responder a la primera pregunta que a la segunda apesar de que la literatura temprana sobre estos temas trat de aportar unarespuesta a ambas cuestiones estimando modelos estructurales. Uno delos importantes avances en materia de evaluacin de polticas econmi-cas al que yo he contribuido, ha sido clarificar las condiciones que debensatisfacerse para responder a los dos tipos de preguntas as como a otraspreguntas relacionadas con las mismas.

    El objetivo de la estimacin economtrica estructural consiste enaportar los ingredientes necesarios para resolver distintos problemas detoma de decisiones. Estos problemas engloban tareas tan distintascomo: (a) evaluar la efectividad de una poltica econmica existente, (b)hacer conjeturas sobre la efectividad que pueda tener una poltica deter-minada en circunstancias diferentes a las que esta poltica se ha aplica-do anteriormente, o (c) predecir los efectos de una nueva poltica quenunca se haba aplicado antes.3 En este discurso, considerar nica-mente aquellos problemas de decisin que surgen en el anlisis de pol-ticas econmicas.

    (2) Esta cuestin se examina en artculos bsicos de Lancaster (1966, 1971), Quandt (1970),McFadden (1974), Domencich y McFadden (1975) y Gorman (1980) (escrito por primeravez en 1956), entre otros.

    (3) Marschak (1953) insisti sobre estas caractersticas de la estimacin estructural. Al esti-mar la demanda para nuevos productos surgen cuestiones similares. Los mtodosestructurales pueden emplearse para estimar parmetros de ecuaciones de demanda enun contexto econmico dado, para predecir la demanda de bienes en contextos diferen-tes y para predecir la demanda de un nuevo producto que no se haba consumido nuncaantes. Es muy importante conocer los parmetros de las funciones de demanda paracontrastar las teoras alternativas de la demanda del consumidor y medir la importanciade los bienes complementarios y sustitutivos.

    P209-296 9/1/04 09:19 Pgina 216

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    217

    Los modelos estructurales tienen la ventaja aadida de poder serempleados para contrastar la teora econmica y evaluar cuantitativa-mente la importancia relativa de las relaciones causales en una determi-nada teora. Adems, los modelos estructurales que se basan en parme-tros invariables se prestan a comparaciones entre estudios empricos.Aunque el conocimiento emprico puede acumularse dentro de marcosestructurales, para ciertas clases importantes de problemas de toma dedecisiones, no es necesario conocer todos los parmetros estructuralesde un modelo, y en algunos casos ni si quiera es necesario conocer nin-guno de los parmetros; lo cual es una suerte porque recuperar parme-tros estructurales no siempre es tarea fcil.

    En la literatura reciente sobre evaluacin de polticas econmicas, elobjetivo implcito ha sido recuperar los ingredientes de los modelos nece-sarios para resolver problemas de toma de decisiones ms especficos.Esto puede conllevar que en algunos casos se conozcan nicamente com-binaciones de parmetros estructurales o parmetros que no son estruc-turales en ningn sentido habitual del trmino. As, la literatura modernasobre el efecto del tratamiento en economa tiene como objetivo principalla estimacin de algn parmetro de efecto del tratamiento, y no la esti-macin de todos y cada uno de los parmetros que es lo que persigue laeconometra estructural, a pesar de que, a menudo, las preguntas con-cretas a las que se responde en determinados estudios no se planteen deforma clara. Estos parmetros de tratamiento estn identificados en con-diciones ms dbiles que las requeridas para abarcar todos los parme-tros estructurales del modelo. Las distinciones que hace la Comisin Cow-les entre variables endgenas y exgenas y las distinciones posterioresentre exogeneidad dbil, fuerte y super-exogeneidad que se han venidodesarrollando en la literatura sobre estimacin de parmetros estructura-les y simulacin de polticas econmicas (Engle, Hendry y Richard, 1983)son en gran parte irrelevantes para la identificacin de parmetros de tra-tamiento de uso frecuente. Al centrarse en problemas concretos de tomade decisiones, la literatura sobre efecto del tratamiento logra su objetivocon condiciones ms dbiles y por lo tanto ms crebles que las que seinvocan en la literatura de econometra estructural. Al mismo tiempo, losparmetros que se generan de esta manera se prestan menos a ser tras-ladados a contextos diferentes para estimar los efectos de la misma pol-tica en circunstancias distintas o para estimar los efectos de una nuevapoltica, y la comparacin de los efectos en unos estudios y otros resultadifcil. La literatura sobre efecto del tratamiento debe ampliarse para posi-bilitar tales proyecciones y comparaciones y, como era de esperar, lasextensiones necesarias son versiones no paramtricas de los supuestosempleados por los econmetras de los modelos estructurales.4

    Para acotar un poco esta discusin y mantener al mismo tiempo cier-to nivel de simplicidad, consideremos el problema prototpico de deter-

    (4) Este aspecto se desarrolla de forma ms completa en Heckman, LaLonde y Smith (1999)y Heckman y Vytlacil (2001a, 2001d, 2002).

    P209-296 9/1/04 09:19 Pgina 217

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    218

    minar el impacto de impuestos y subsidios sobre la oferta de trabajo. Esteproblema promovi una literatura temprana que evaluaba el Estado delbienestar (Cain y Watts, 1973), motiv mi propia investigacin y continasiendo hoy en da un problema importante de poltica econmica.

    Aplicando la teora tradicional de la demanda del consumidor, formule-mos una ecuacin de oferta de trabajo con solucin interior en la que lashoras de trabajo H son funcin de los salarios, W, y de otras variables,denominadas X, entre las cuales se incluyen activos, estructura demogrfi-ca, y similares. Sea U una variable no observable por el economista. Comoveremos, las variables no observables desempean un papel fundamentalen microeconometra y hay muchos indicios de que stas tienen una impor-tancia emprica. La microeconometra moderna se dedica a ellas.

    Para la forma ms general de H, tenemos:

    H = (W, X, U) (1)Para simplificar, supongamos que es diferenciable en todos sus

    argumentos. La ecuacin (1) es una funcin causal marshaliana.5 Las deri-vadas de la funcin con respecto a cada argumento miden el efecto cete-ris paribus de stos sobre H. Supongamos que queremos evaluar el efec-to de un cambio en un impuesto proporcional sobre la renta. Con un tipoimpositivo sobre la renta igual a t, obtenemos el salario despus deimpuesto W(1-t). Supongamos que los agentes perciben correctamente elimpuesto e ignoran todo efecto de equilibrio general del impuesto. En ellenguaje de los efectos del tratamiento, el efecto del tratamiento o efec-to causal de un cambio en el impuesto sobre la oferta de empleo defini-da a nivel individual es (W(1 - t), X, U) - (W(1 - t), X, U) para la mismapersona sujeta a dos impuestos diferentes t y t.

    Una versin aditivamente separable de la funcin causal marshaliana(1) es

    H = (W, X)+U, E(U)=0 (2)Esta versin permite al analista definir los efectos ceteris paribus de W

    y X sobre H sin necesidad de conocer el nivel de la variable U no observa-ble y desconocida por el econmetra. Una versin paramtrica de (1) es:

    H = (W, X, U, ) (1)donde es un vector de parmetros de poca dimensin que genera el de la ecuacin (1). La ecuacin que sigue es una versin paramtrica de(2)

    H = (W, X, ) + U (2)

    (5) Vase Heckman (2000) o Heckman y Vytlacil (2001a, 2002) para una definicin rigurosa defunciones causales marshalianas.

    P209-296 9/1/04 09:19 Pgina 218

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    219

    Los parmetros reducen la dimensionalidad del anlisis de identifi-cacin haciendo que el problema de identificar una funcin de dimensininfinita se transforme en el problema de identificar un conjunto finito deparmetros. Estos parmetros desempean un papel fundamental en laprediccin de los efectos de una poltica econmica antigua en poblacio-nes diferentes, en la acumulacin de evidencia emprica de distintos estu-dios, y en la prediccin de los efectos de una nueva poltica. La represen-tacin de H lineal en funcin de los parmetros es como sigue:

    H = X+ln W+U (3)

    donde se adopta una especificacin semi-logartmica para representarmodelos frecuentemente empleados en la literatura relativa a la oferta detrabajo (vase Killinswoth, 1983).

    Como hace Marschak (1953), resulta til distinguir tres tipos de pro-blemas de evaluacin de polticas econmicas. Nos situamos en una eco-noma en la que se establece externamente un impuesto sobre su pobla-cin o sobre un subconjunto de la misma (as, el impuesto se determinaindependientemente de U, pero podra depender de X y de W que sonvariables que observamos y con respecto a las que podemos condicio-nar). En el caso 1, el impuesto t se ha aplicado en el pasado y queremospredecir sus efectos sobre una poblacin que tiene la misma distribucinde variables (W, X, U) que la que estaba en vigor cuando se midieron losefectos de la variacin del impuesto. En el caso 2, el impuesto t ya se haaplicado en el pasado pero queremos pronosticar los efectos que tendrsobre una poblacin diferente para las variables (W, X, U). En el caso 3, elimpuesto nunca ha sido aplicado y queremos predecir su efecto sobreuna poblacin inicial usada para estimar (1), o bien sobre una poblacindiferente.

    Supongamos que el objetivo del anlisis es determinar el efecto de losimpuestos sobre la oferta media de trabajo para una poblacin con distri-bucin G(W, X, U). En el caso 1, tenemos datos de la misma poblacinpara la cual queremos elaborar una prediccin. Supongamos que obser-vamos distintos regmenes de impuestos. Los agentes se ven sujetos atasas de impuestos externos tj en el rgimen j, j = 1, ..., J. En la muestrade cada rgimen podemos identificar

    E(H|W, X, tj) = (W(1-tj), X, U)dG(U|X, W) (4)Para el conjunto de la poblacin esta funcin ser:

    E(H|tj) = (W(1-tj), X, U)dG(U, X, W) (5)Se supone que esta funcin es aplicable a la poblacin que nos inte-

    resa. Si conocemos (4) o (5), podemos proyectar esas funciones a partirde los datos histricos para todos los periodos futuros, siempre y cuandolas distribuciones conjuntas de los datos sean constantes en el tiempo. Siuno de los regmenes ya ha sido experimentado en el pasado, podremosaplicar en el futuro las lecciones que de l hayamos sacado, siempre ycuando permanezcan los mismos () y G(). No es necesario construir nin-

    P209-296 9/1/04 09:19 Pgina 219

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    220

    gn estado contrafactual. Para realizar el anlisis de la poltica para elcaso 1 no es necesario conocer ninguna funcin causal de Marshall o nin-gn parmetro estructural. No es necesario descomponer (4) o (5) paraaislar de G.6

    El caso 2 se parece al caso 1 excepto por una diferencia esencial. Dadoque proyectamos ahora la misma poltica en una poblacin diferente, esnecesario separar los componentes de (4) o (5) y determinar (W(1 - tj), X,U) separado de G(U, X, W). El problema de la evaluacin de polticas eco-nmicas se vuelve mucho ms complicado. La cita de Frank Knight (1921)viene al caso: Surge un problema de conocimiento cuando el futurodifiere del pasado mientras que aparece una posibilidad de solucin adicho problema cuando el futuro es similar al pasado (p. 313).

    Los supuestos necesarios para predecir los efectos de las medidas depoltica econmica antiguas en un nuevo rgimen requieren que extrai-gamos del pasado la informacin necesaria para determinar los compo-nentes de (4) o de (5) en nuevas poblaciones. Detallamos estos supuestosa continuacin.

    a) Es necesario conocer () para la nueva poblacin. Esto podra impli-car determinar en un soporte diferente del que se ha usado en la mues-tra inicial si la poblacin objetivo tiene un soporte diferente que el de lapoblacin de origen. Llegados a este punto, la estimacin estructuralalcanza su potencial. En algunos casos nos permite extrapolar de unapoblacin de origen a una poblacin objetivo. Sin embargo es imposiblealcanzar una solucin completamente no paramtrica incluso bajo elsupuesto (2) de separabilidad aditiva estructural, a no ser que los sopor-tes de la poblacin objetivo y de la poblacin de origen coincidan.

    Debemos aplicar cierta estructura a incluso si (2) caracteriza elmodelo de oferta de trabajo. La estructura paramtrica (3) es habitual enla literatura de oferta de trabajo y los modelos lineales en los parmetrosson los que dominan en la investigacin de econometra aplicada.7

    b) Tambin es necesario conocer G() para la poblacin objetivo. En estecontexto, la exogeneidad constituye un supuesto simplificador esencial.

    (6) No es necesario ni siquiera que t est externamente especificado. Si una funcin des-criptiva de una poltica t = (X, W, U) genera t y es una relacin 1 a 1 en U y t dado (X,W), entonces cada t est asociada a una sola U dado (X, W). A condicin de que el obje-tivo del anlisis sea predecir los efectos de futuros t generados por , podemos emple-ar datos histricos para hacerlo. Si no es 1 a 1 en U y t dado (X, W), entonces no es posi-ble, en general, emplear datos histricos para predecir el efecto de la variacin de t gene-rada por sobre H media. Sin embargo, si el objetivo es predecir polticas generadas poruna nueva regla (incluidas las variaciones externas de t no relacionados con U), el caso1 ya no es relevante y es necesario hacer estimacin estructural (Lucas, 1976).

    (7) El supuesto de que (W, X) es analtica real tal que se pueda extender a otros dominioses otro supuesto estructural. Heckman y Singer (1984) explotan este supuesto pararesolver un problema de censura en anlisis de duracin.

    P209-296 9/1/04 09:19 Pgina 220

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    221

    Supuesto 1. (X, W) independiente de U.

    Si definimos la exogeneidad segn el supuesto 1, entonces G(U|X, W)= G(U).8 En ese caso, si suponemos que la distribucin de no observableses la misma en la muestra que en la prediccin o en el rgimen objetivo,G(U) = G(U), donde G(U) es la distribucin de no observables en lapoblacin objetivo, podemos proyectar hacia una nueva poblacinempleando la relacin

    E(H|W, X, tj) = (W(1-tj), X, U)dG(U) (6)a condicin de poder determinar () sobre el nuevo soporte de X, W, U.No obstante, si G G, G deber determinarse de alguna manera. Estonos lleva a emplear ciertos supuestos estructurales para determinar larelacin entre G y G.

    En el caso 3, que corresponde a la situacin en la que no se ha intro-ducido ningn impuesto anteriormente, es necesario conocer la poblacinobjetivo. Los impuestos producen sus efectos a travs del trmino W(1 - t).Si no hay variacin de los salarios en las muestras extradas del pasado,no hay manera de identificar el efecto de los impuestos sobre la oferta detrabajo ya que por hiptesis t = 0 y no es posible determinar el efecto delprimer argumento sobre la oferta de trabajo. El problema no hace ms queempeorar si suponemos que los impuestos tienen efectos sobre la ofertade trabajo independientemente de los salarios. De esta manera, incluso sise producen variaciones en los salarios, es imposible identificar los efec-tos de los impuestos o proyectarlos sobre una poblacin nueva.9

    (8) Hay muchas definiciones de este trmino. El supuesto 1 a menudo se ve completado porel supuesto adicional de que la distribucin de X no depende de los parmetros delmodelo (por ejemplo, en [1] o [2]) (vase Engle et al., 1983).

    (9) Si los salarios varan durante el periodo previo a la aplicacin de la poltica, podra no sernecesario descomponer (4) en y G, ni hacer estimacin estructural para estimar el efecto delos impuestos sobre la oferta de trabajo en un rgimen en el que se introducen los impues-tos por primera vez. Si el soporte de W(1-t)def= W* en el rgimen objetivo se encuentra en elsoporte de W en el rgimen histrico, los soportes de X son los mismos en los dos regme-nes y las distribuciones condicionales de U dado X, W y U dado X, W* son las mismas, enton-ces, el conocer (4) en el soporte de W en el rgimen histrico o de origen es suficiente paradeterminar el efecto de los impuestos en el rgimen objetivo. Ms precisamente, dejandoque histrico denote los datos pasados y que objetivo denote la poblacin objetivo parala proyeccin, podemos escribir estos supuestos como (a) soporte(X, W*)objetivo soporte(X,W )histrico y (b) G(U | X, W*)objetivo = G(U | X, W )histrico, donde W* = W(1 - t) para variables alea-torias W definidas en el nuevo rgimen y (W*)objetivo= Whistrico. En ese caso, no es necesarianinguna estimacin estructural para predecir el efecto de los impuestos sobre la oferta detrabajo en la poblacin objetivo. Es posible realizar una evaluacin de poltica completa-mente no paramtrica estimando (4) o (5) no paramtricamente (y sin descomponer E(H |X,W)en los componentes () y G()). Bajo el supuesto a, podemos encontrar el valor de con-trapartida de W(1 - t) = W* en la poblacin objetivo para cada X para insertarlo en la versinno paramtrica de (4) (o [5]). Si estas condiciones no se dan es necesario construir las fun-ciones G y en los nuevos soportes empleando las distribuciones apropiadas. Nos aden-tramos en un terreno en el que es necesaria la estimacin estructural, ya sea para ampliarel soporte de las funciones () o para determinar G(U | X, W) o ambos. Sigue siendo nece-sario determinar la relacin entre W y X en la poblacin objetivo.

    P209-296 9/1/04 09:19 Pgina 221

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    222

    Esta discusin se aplica con la misma fuerza tanto al anlisis de datosagregados como al anlisis de datos microeconmicos. El empleo devariaciones individuales en encuestas microeconmicas proporciona unanueva forma de identificar y G que no se encuentren disponibles endatos macroeconmicos. De esta manera la identificacin de parmetrosestructurales se hace ms fcil.

    La literatura sobre el efecto del tratamiento ampla el primer caso deMarschak permitiendo que el tratamiento (t) sea exgeno. Consideremos dospoblaciones, stas pueden ser subconjuntos de una poblacin general y nosreferiremos a ellas como el grupo de tratamiento y el grupo de comparacin.En una de las poblaciones el impuesto es tj y en la otra el impuesto es tk, queincluye como caso particular la ausencia de impuesto. Si las dos poblacionesson idnticas en lo que se refiere a y G y difieren nicamente en una tasaimpositiva decretada externamente, entonces es posible determinar el efec-to de tj sobre el nmero medio de horas trabajadas en comparacin con elimpuesto tk para cualquiera de las dos poblaciones y cualesquiera valoresdados de X, W; para ello, basta con comparar la media de horas en ambaspoblaciones, E(H|W, X, tj) - E(H|W, X, tk) sobre dominios de soporte comnpara W, X. No es necesario conocer ni G y, por lo tanto, no hace falta nin-guna estimacin estructural. Adems, como ya se ha anotado, hay condicio-nes (rigurosas) bajo las cuales este ejercicio es vlido incluso si t est deter-minado exgenamente por una medida de poltica econmica, siempre ycuando, esta medida sea una relacin 1 a 1 en (t y U) para X,W dados.

    En el contexto del ejemplo de la oferta de trabajo, la literatura sobreefectos del tratamiento trata de identificar las diferencia en horas mediasde trabajo en un poblacin determinada de (X,W,U) que resultaran de laaplicacin de diferentes polticas (t) impuestas externamente sin descom-poner la media de horas en sus componentes de o G, empleando datosde poblaciones en las que t no viene especificado externamente. Losexperimentos sobre medidas de poltica econmica (ya sean naturales osimulados) que cambian t y no cambian ni G identifican estos efectos.Tambin pueden emplearse instrumentos que hacen variar t sin que niG se modifiquen. As mismo se utilizan distintos mtodos para tener encuenta diferencias observadas y no observadas en las respuestas a laspolticas que no estn relacionados con la medida de poltica econmicaque est siendo evaluada. Las condiciones de identificacin necesariaspara estimar efectos del tratamiento son generalmente ms dbiles queaqullas que se precisan para identificar y G en el sentido de que sonnecesarios menos supuestos para identificar los efectos del tratamiento.Al mismo tiempo, las estimaciones producidas son especficas del pro-blema examinado y son aplicables nicamente a las poblaciones estudia-das. Los efectos del tratamiento no permiten extender a nuevos contex-tos ni interpretar en trminos de cambios ceteris paribus (efectos cau-sales) para todas las variables condicionantes excepto t.

    Esta dualidad entre efectos del tratamiento y ecuaciones estructuralesest presente en el conjunto de la literatura y en mi propio trabajo. Vol-ver a tratar este tema, pero antes explicar por qu la disposicin dedatos microeconmicos constituye el elemento desencadenante para eldesarrollo de la microeconometra.

    P209-296 9/1/04 09:19 Pgina 222

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    223

    3. NUEVAS CARACTERSTICAS DE LOS DATOS MICROECONMICOS

    La produccin de datos microeconmicos a gran escala en los aos 50hizo que se revelaran patrones y caractersticas que no podan racionali-zarse fcilmente empleando modelos estndares de demanda de los con-sumidores y de oferta de trabajo o que fuesen bien analizados por tcni-cas de regresiones convencionales. Haba importantes aspectos de laheterogeneidad y la diversidad que pudieron ser captados y hasta enton-ces haban permanecido ocultos en los datos macroeconmicos. Estosdescubrimientos pusieron de manifiesto las carencias de las herramientaseconomtricas convencionales del momento.

    El estudio de datos de corte transversal revela que individuos porotra parte observacionalmente idnticos toman decisiones distintas,ganan salarios diferentes y mantienen carteras de activos que difieren ennivel y composicin. Estos datos revelan lo inadecuado que resulta ser elparadigma tradicional del agente representativo.10 El cuadro 1 ofrece unamuestra tpica de datos de oferta de empleo. Una fraccin considerablede personas no trabaja y no observamos salarios para stas. El coefi-ciente de determinacin R2 (una medida de bondad de ajuste) de cual-quier relacin microeconmica es tpicamente baja, por lo que los noobservables provocan gran parte de la inestabilidad en las horas de tra-bajo. Segn cmo se evalen los no observables, los efectos sobre lainterpretacin de la evidencia sern diferentes. Por ejemplo, se debe eldesempleo a la atraccin no observada de los trabajadores por el tiempode ocio o a un fallo del mercado en generar ofertas de trabajo que seobservan slo si se aceptan?,11 ocupan todas las mujeres empleos tem-porales o algunas (o la mayora) tienen una vinculacin a largo plazo enel mercado laboral?12

    El uso de estos datos presenta problemas adicionales que son muchomenos aparentes en el anlisis de datos de series temporales. Los que notrabajan no tienen salario. Entonces, cmo pueden estimarse los efectosde los salarios sobre la oferta de trabajo si la informacin sobre salariosde la que disponemos slo es aplicable a los que trabajan?, Cmo pue-den interrelacionarse las distintas dimensiones de la oferta de empleo(horas de trabajo, trabajo o no trabajo, nmero de periodos en los que sehaya trabajado) para realizar un anlisis contrafactual de las medidas depoltica econmica?

    (10) Lancaster (1966, 1971), Quandt (1970), McFadden (1974) y Domencich y McFadden(1975) fueron de los primeros en poner en tela de juicio la validez emprica del para-digma del agente representativo. Vase Kirman (1992) para una valoracin reciente deese paradigma.

    (11) Flinn y Heckman (1982) analizan esta cuestin y muestran la dificultad de resolverla uti-lizando datos sobre elecciones de mercado.

    (12) Heckman y Willis (1977) y Heckman (1981a) analizan esta cuestin.

    P209-296 9/1/04 09:19 Pgina 223

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    224

    Cuadro 1DATOS DE PARTICIPACIN, HORAS TRABAJADAS Y SALARIOS,

    DATOS DE NLSY, 1979-94

    Porcentaje de R2 de las regresionespersonas que Total de horas trabajadas Logaritmo del salario en

    Grupo trabajan a la en funcin de la educacin funcin de la educacindemogrfico edad de 29 aos y de la experiencia y de la experiencia

    Hombres blancos 83,5 0,12 0,10Hombres negros 75,0 0,15 0,14Hombres hispanos 80,0 0,11 0,10Mujeres blancas 76,4 0,15 0,17Mujeres negras 69,6 0,18 0,21Mujeres hispanas 66,6 0,18 0,10

    Fuente: National Longitudinal Survey of Youth, 1979-1994, en Carneiro et al. (2001).

    El anlisis de datos nuevos ha acarreado la aparicin de nuevos pro-blemas economtricos como (a) tener en cuenta el carcter discreto de lasvariables de respuesta; (b) racionalizar la eleccin realizada tanto en losmrgenes extensivos como intensivos (modelos para elecciones discretasy para elecciones a la vez discretas y continuas) en un modelo estructuralcomn; (c) tomar en cuenta de manera sistemtica el hecho de que hayadatos ausentes, como precios o salarios, como consecuencia de las deci-siones de los individuos.

    Si nos centramos nicamente en los aspectos estadsticos de la micro-econometra ser menos evidente distinguir sus contribuciones bsicas.Despus de todo, muchos estadsticos se preocuparon de algunos deestos problemas. Goodman (1968), Haberman (1974) y Bishop, Fienberg yHolland (1975) analizaron modelos para datos discretos, aunque fueronlos economistas los que introdujeron el estudio de modelos con respues-tas discretas y continuas determinadas conjuntamente (Heckman, 1974a,1974c) y de modelos con carencia sistemtica de datos (Gronau, 1974;Heckman, 1974a, 1974c, 1976a, 1976c, 1979).13 Una contribucin importan-te de la microeconometra fue la aclaracin y la ampliacin de los lmitesde estos marcos estadsticos para estimar modelos econmicos, hacerdistinciones causales y resolver varias versiones del problema de la eva-luacin de medidas de poltica econmica descrito en la seccin 2.

    Por oposicin a los modelos desarrollados por los estadsticos, eltipo de modelos microeconomtricos desarrollados para explotar einterpretar las nuevas fuentes de datos microeconomtricos puso demanifiesto el papel de la ciencia econmica y de los marcos causales enla interpretacin de la evidencia emprica, en el establecimiento de rela-

    (13) Vase Holt (1985) para una discusin sobre la originalidad del trabajo de los econme-tras al analizar modelos para datos ausentes de forma no aleatoria.

    P209-296 9/1/04 09:19 Pgina 224

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    225

    ciones causales y en la construccin de modelos contrafactuales, ya fue-ran salarios contrafactuales que no existan en el anlisis de la oferta detrabajo femenino o estados de poltica contrafactuales que surgen en laevaluacin de polticas sociales. La investigacin en microeconometraha demostrado que hay que tener en cuenta las diferencias manifiestasentre individuos aparentemente similares. Las diferencias en los supues-tos sobre el origen de la heterogeneidad no observada tienen repercu-siones importantes sobre la estimacin y la interpretacin econmica dela evidencia emprica, sobre la evaluacin de los programas que se vie-nen aplicando, y sobre el empleo de datos para predecir nuevas polticasy evaluar el efecto que tiene el trasladar polticas existentes a nuevosentornos.

    La heterogeneidad causada por variables no medidas se convirti enun tema importante en esta literatura debido a la evidencia de sus mani-festaciones en los datos y a las nefastas consecuencias de hacer casoomiso de su existencia. El problema result incluso ms aparente cuan-do se tuvo acceso a datos microeconmicos de panel y fue entoncesposible observar diferencias persistentes en el tiempo para las mismaspersonas.

    4. RESPUESTAS POTENCIALES, CONTRAFACTUALES Y SESGO DE SELECCIN

    En un principio centr mis esfuerzos en el campo de la microeco-nometra en la construccin de modelos para capturar las caractersti-cas esenciales de datos del tipo considerado en el cuadro 1, a travsde modelos tericos bien fundados que tambin podan emplearsepara abordar problemas de evaluacin de medidas de poltica econ-mica (problemas de la cuestin 2 que se definen en la seccin 2). Meinspir en el trabajo de Mincer (1962) sobre la oferta de empleo feme-nino y me anim la oportunidad que se me brind de construir unmarco economtrico preciso para analizar las distintas dimensiones dela oferta de empleo femenino y su relacin con los salarios. Para rea-lizar esta tarea, me centr en dos conjuntos de herramientas econo-mtricas a las que tena acceso y el intento de fundir esos dos conjun-tos en una nica herramienta de investigacin desemboc a la vez enfrustracin y descubrimiento.

    Los dos conjuntos de herramientas que se encontraban a mi dispo-sicin eran (1) la teora de las ecuaciones simultneas de la ComisinCowles y (2) los modelos de eleccin discreta que tienen su origen en lapsicologa matemtica y que fueron introducidos en la economa porQuandt (1956, 1970), McFadden (1974, 1981) y Domencich y McFadden(1975). Mi objetivo era unificar estas dos corrientes para crear un mode-lo de ecuaciones simultneas de pocas dimensiones y de motivacineconmica, con variables endgenas tanto discretas como continuasque tuvieran en cuenta la ausencia sistemtica de los salarios de los queno trabajan y las diferentes dimensiones de la oferta de empleo en unmarco comn; marco que debera ser capaz de aportar una explicacina la oferta de trabajo femenino, y que constituyera la base de un riguro-

    P209-296 9/1/04 09:19 Pgina 225

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    226

    so anlisis de medidas de poltica econmica que nunca se haba desa-rrollado antes.

    El modelo estndar de la oferta de trabajo representado en la ecua-cin (1), (2) o (3) no es adecuado para tratar los datos del cuadro 1.Tampoco lo es la econometra de la Cowles. En circunstancias norma-les, los mtodos de la Cowles pueden tomar en cuenta la correlacinexistente entre W y U en la ecuacin (3), suponiendo que se han medi-do los salarios de todo el mundo. Esta correlacin puede venir dada porel error de medida de los salarios o porque hay variables no observa-bles comunes en las ecuaciones de los salarios y de la oferta de empleo(por ejemplo, las personas ms motivadas trabajan ms y obtienenunos salarios ms elevados y la motivacin es un elemento no obser-vado). Los mtodos de la Cowles no indican lo que se debe hacer cuan-do faltan salarios, cmo tomar en cuenta a los que no trabajan, o cmorelacionar la decisin de trabajar con la de cuntas horas de trabajoprestar.

    En una serie de artculos escritos entre 1972 y 1975 (Heckman, 1973,1974a, 1974c, 1976a, 1976c, 1978a)14 desarroll modelos ndice de res-puestas potenciales para unificar la econometra de la Cowles y la teorade la eleccin discreta, as como para unificar la literatura sobre seleccinmuestral, truncamientos y variables dependientes limitadas que porentonces estaba dispersa y careca de consenso entre autores.15 Tambindesarroll una variedad de estimadores en dos etapas para este tipo demodelos, con el objetivo de eludir las dificultades de cmputo que con-lleva su estimacin por mxima verosimilitud.

    Basndonos en la literatura sobre psicologa matemtica y eleccindiscreta tal y como la resume y ampla McFadden (1974, 1981), definamos

    Yi=gi(Xi, Ui), i=1,..., I (7)

    como variables aleatorias latentes que reflejan las posibles respuestas. Enel contexto de la eleccin discreta, las Yi son utilidades latentes asociadasa la eleccin i y dependen tanto de caractersticas observadas (Xi) comono observadas (Ui). Esto es lo que tambin se conoce como modelos defuncin ndice. Para cada eleccin i, el nivel de utilidad puede variar. Deforma general, al igual que en el programa de la Cowles y en especial enHaavelmo (1943), la ecuacin (7) podra representar cualquier respuestaposible, como salarios, horas de trabajo, etc. Las ecuaciones (1) y (7) son

    (14) Los primeros artculos se publicaron en 1974 (Heckman 1974a, 1974c) pero circularonampliamente antes de su publicacin. Otros dos artculos (Heckman 1976c, 1978a) seescribieron en 1973 y llegaron, en esa poca, a las manos de numerosos econmetrasveteranos.

    (15) Vase Heckman y MaCurdy (1985) para un desarrollo sistemtico de modelos de fun-cin ndice.

    P209-296 9/1/04 09:19 Pgina 226

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    227

    relaciones causales marshalianas que nos dicen cmo varan las respues-tas hipotticas de Yi cuando los argumentos del miembro derecho semodifican manteniendo todo fijo salvo la variable que se modifica.

    Dependiendo del contexto, las Yi podrn ser observadas directamenteo solamente a travs de sus manifestaciones. En modelos de eleccin dis-creta, las Yi no se observan nunca pero observamos argmaxi {Yi}. En laclase ms general de modelos que he considerado, algunas de las Yi pue-den observarse bajo ciertas condiciones.

    Para examinar estos modelos desde un planteamiento ms elemental,consideremos una versin con tres funciones de respuestas potenciales. Laliteratura analiza los modelos con muchas respuestas potenciales. Formu-lemos las respuestas potenciales en formas aditivamente separables como

    Y0 = g0(X)+U0Y1 = g1(X)+U1 (8)Y2 = g2(X)+U2

    stas son variables latentes que podran ser observadas slo de formaimperfecta. En el contexto de la teora neoclsica de la oferta de trabajo,el salario de reserva o precio de reserva establecido en cero horas de tra-bajo (demanda cero para el producto) desempea un papel central. Nosinforma de cul es el precio para el cual la gente est dispuesta a trabajarla primera hora o a comprar la primera unidad de producto. Denomine-mos esta funcin de salario de reserva potencial Y0. Sea Y1 la funcin desalario de mercado, es decir, lo que ofrece el mercado. Sin tener en cuen-ta los costes fijos de trabajo, un individuo trabaja (D = 1) si

    Y1Y0D=1 (9)

    De lo contrario, el individuo no trabaja. Las horas de trabajo potencia-les Y2 estn generadas por las mismas preferencias que producen la fun-cin de salario de reserva, de tal manera que Y2 e Y0 estn generadas porun conjunto comn de parmetros. En mi artculo de 1974c, desarrolluna clase de formas funcionales simples con las que se puede operarmatemticamente en las que

    Y0 = ln R = logaritmo del salario de reserva (10a)

    Y1 = ln W = salario de mercado (10b)

    Y2 = ln W-ln R , >0 (10c)

    y las horas de trabajo observadas se representan como

    H = Y21(ln Wln R) = ln W-ln R 1(ln W ln R)

    dnde 1(A) es un indicador que toma el valor 1 cuando A es cierto. Losimpuestos o transferencias proporcionales t introducen otra fuente devariacin en estas ecuaciones de tal manera que en el lugar de W se utili-

    P209-296 9/1/04 09:19 Pgina 227

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    228

    ce el salario neto de impuesto W(1 t). Las variables no observables U1 yU0 explican por qu agentes que de otro modo seran observacionalmen-te idnticos (con las mismas X) tienen elecciones distintas.16

    El innovador modelo de Roy (1951) sobre la auto-seleccin en el mer-cado de trabajo que fue redescubierta en los aos 70, est estrechamenterelacionado con el modelo anterior. Resulta ser una versin del modelo delas funciones ndice que acabamos de presentar.17 Como indica la ecuacin(8), Y0 e Y1 son respuestas potenciales e Y2 es una utilidad latente:

    Y2 0D = 1 e Y1 observada (11)Y2 < 0D = 0 e Y0 observada

    As, Y observada es

    Y = DY1+(1-D)Y0 (12)

    En el modelo original de Roy, Y2 = Y1 - Y0. En el modelo generalizadode Roy, Y2 est especificado de forma ms libre, pero puede depender deY1 e Y0.

    Estos modelos de respuestas potenciales contienen varias ideas dis-tintas. (1) Como en los anlisis de la Comisin Cowles, hay una superpo-blacin hipottica de valores posibles de las Yj en respuesta a cambiosceteris paribus de las X y de las U. Estos son modelos de funciones cau-sales marshalianas representadas normalmente por modelos estructura-les de pocas dimensiones para facilitar la prediccin y el anlisis de medi-das de poltica econmica. (2) Por oposicin a los modelos de la ComisinCowles, pero al igual que en los modelos de eleccin discreta, algunas de

    (16) En Heckman (1974a), presento un modelo estructural ms explcito de oferta de traba-jo, cuidado de nios y salarios, que desarrolla, entre otras cosas, el primer marco eco-nomtrico que permite analizar el efecto de impuestos progresivos y de mercados infor-males sobre la oferta de trabajo. En ese artculo, caracterizo las preferencias mediantela funcin de tasa marginal de sustitucin, genero Y0 e Y2 a partir de las curvas de indi-ferencia del consumidor, y produzco Y2 a partir de una solucin de las condiciones deprimer orden del consumidor y de las restricciones presupuestarias. En ese modelo, lasvariables no observables que afectan a las preferencias se traducen como variacionesde un consumidor a otro (o de un trabajador a otro) en las pendientes de las curvas deindiferencia. La caracterizacin de las preferencias del consumidor mediante las pen-dientes de las curvas de indiferencia facilita el anlisis de la oferta de trabajo bajo esca-las de gravamen de impuestos sobre la renta por tramos y ofrece un tipo de preferen-cias ms flexible que el que se obtiene con especificaciones para las ecuaciones de ofer-ta de trabajo que sean lineales simples o semilogartmicas. El anlisis de impuestosprogresivos para el caso convexo aparece en un apndice de Heckman (1974b). Porrazones de limitacin de espacio, el editor, T. W. Schultz, pidi una presentacin con-densada. El anlisis formal completo se public ms tarde en Heckman y MaCurdy(1981, 1985) y Heckman, Killingsworth y MaCurdy (1981). Hausman (1980, 1985) extien-de este anlisis al caso no convexo.

    (17) Roy desarrolla un modelo econmico de desigualdad de renta y de clasificacin perono se detiene en ninguna de las cuestiones economtricas que surgen en su modelo.Lee (1978) y Willis y Rosen (1979) son dos aplicaciones del modelo de Roy.

    P209-296 9/1/04 09:19 Pgina 228

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    229

    las variables latentes no se observan (lnR, por ejemplo, no se observa,pero puede revelarse en ocasiones mediante un cuestionario). (3) Poroposicin tanto a los modelos de la Comisin Cowles como a los mode-los de eleccin discreta, algunas de las variables latentes se observan,pero nicamente como consecuencia de las elecciones, es decir, que seobservan selectivamente.

    De esta manera, observamos ln W - ln R salvo por un factor multipli-cativo y observamos los salarios nicamente si ln W ln R (D = 1). Elmuestreo selectivo de respuestas potenciales da lugar al problema delsesgo de seleccin. Observamos nicamente submuestras seleccionadasde las variables de poblacin latentes. En el contexto del modelo de Royobservamos Y0 o Yi pero no ambas.

    Si no hubiese variables no observables en el modelo, este muestreoselectivo no tendra por qu preocupar. Si nos condicionsemos respecto deX, obtendramos estimadores insesgados o consistentes de las respuestasque faltan para aqullos que no trabajan usando las respuestas de los ques trabajan. Sin embargo, los datos del cuadro 1, que son habituales, reve-lan que las variables observables explican nicamente una pequea pro-porcin de la varianza de prcticamente todas las variables microeconom-tricas. Es necesario tomar en cuenta la heterogeneidad de las preferencias yel muestreo selectivo de no observables. En general, como consecuencia dela regla de seleccin (9), los salarios y las horas que observamos son mues-tras selectivas de las respuestas potenciales de una poblacin ms amplia.18El tener esto en cuenta es esencial si queremos estimar relaciones estructu-rales (los parmetros de las funciones causales) o describir el universo derespuestas potenciales (ecuaciones tales como [10a]-[10c]). Esto dio lugar alproblema del sesgo de seleccin. Para resolver dicho problema ha sidonecesario un nuevo anlisis de eleccin discreta y de eleccin mixta conti-nua y discreta que revis la econometra convencional de la Comisin Cow-les y puso de manifiesto la inadecuacin de los modelos estadsticos con-vencionales para hacer distinciones causales en datos discretos. La teora deeleccin mixta continua y discreta puso en entredicho el paradigma ya acu-ado de la Comisin Cowles relacionando la econometra de forma msdirecta con los procesos de eleccin y de toma de decisiones. En el apndi-ce A, hablo de estas revisiones. De forma sucinta, los modelos log-linealesutilizados por los estadsticos para modelizar datos discretos no permitanhacer distinciones ceteris paribus entre causalidad real y espuria, necesariaspara el anlisis economtrico de medidas de poltica econmica, y se desa-rrollaron nuevas condiciones para la coherencia de los modelos de ecua-ciones simultneas para asegurar modelos bien definidos tanto econmica-mente como desde el punto de vista de la probabilidad (Heckman, 1976c,1978a, Heckman y MaCurdy, 1986). Amemiya (1985) ofrece un resumen muytil de los principales avances en esta literatura.

    (18) Si (9) es cierto, entonces debe haber sesgo de seleccin al observar salarios o salariosde reserva salvo para casos degenerados (Heckman 1993). La seleccin en horas poten-ciales es consecuencia inmediata de (9) dado que D = 1ln W - ln R 0.

    P209-296 9/1/04 09:19 Pgina 229

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    230

    5. SESGO DE SELECCIN Y AUSENCIA DE DATOS

    El sesgo de seleccin surge de la estimacin de modelos estructuralescon respuestas potenciales observadas parcialmente. No obstante, el pro-blema del sesgo de seleccin es ms general y puede surgir cuando unaregla que no sea el muestreo aleatorio simple se emplea para muestrearla poblacin subyacente objeto de estudio. La representacin distorsiona-da de la poblacin real en una muestra como consecuencia de una reglade muestreo constituye la esencia del problema de seleccin. El problemade la identificacin se encuentra en la recuperacin, desde una muestraobservada, de las caractersticas de una poblacin hipottica (vase grfi-co 1). La poblacin hipottica puede referirse a los salarios potenciales detodos los individuos, ya sean personas que trabajan (y para las que seobservan salarios) o no, o las respuestas potenciales de cualquier proble-ma de eleccin para el cual slo se observan las elecciones que se han lle-gado a concretar de verdad. La distorsin de las reglas de seleccin puedesurgir de las decisiones de los estadsticos que se ocupan de las encues-tas de muestreo o de las decisiones econmicas de auto-seleccin del tipoque hemos mencionado anteriormente, donde, como consecuencia de laauto-seleccin, observamos nicamente subconjuntos de una poblacinde respuestas potenciales (por ejemplo Y0 o Y1 en el modelo de Roy).

    Grfico 1RELACIN ENTRE POBLACIONES HIPOTTICAS(CONTRAFACTUALES) Y DATOS OBSERVADOS

    Poblacinhipottica

    Poblacinobservada

    Proceso generador de los datos

    Regla de muestreo

    Poblacinhipottica

    Poblacinobservada

    Problema de identificacinModelo economtrico

    P209-296 9/1/04 09:19 Pgina 230

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    231

    Una muestra aleatoria de una poblacin nos aporta una descripcinde la distribucin de las caractersticas de dicha poblacin que ofrece unaenumeracin completa de modelos de respuestas potenciales presenta-dos en las secciones anteriores. Una muestra seleccionada con cualquierregla que no sea la del muestreo aleatorio nos proporciona una descrip-cin de la distribucin de las caractersticas de la poblacin que no des-cribe con precisin la distribucin real de sus caractersticas, sea cual seael tamao de la muestra.

    Hay dos caracterizaciones del problema de seleccin que presentanun inters particular. El primero, que tiene su origen en la estadstica, con-lleva caracterizar la regla de muestreo del grfico 1, como la aplicacin deun sistema de ponderacin a distribuciones hipotticas de la poblacinpara producir distribuciones observadas. El segundo, de origen econo-mtrico, trata explcitamente el problema de seleccin como un problemade ausencia de datos, y en su esencia emplea variables observables paraimputar valores a las no observables relevantes.

    5.1. Distribuciones ponderadas

    Cualquier modelo de sesgo de seleccin puede ser descrito en trmi-nos de distribuciones ponderadas. Sea Y un vector de respuestas de inte-rs y X un vector de variables de control o explicativas. La distribucinde la poblacin de (Y, X) es F(y, x). Para simplificar la exposicin suponga-mos que la densidad est bien definida y la expresamos como f(y, x).

    Cualquier regla de muestreo es equivalente a una funcin de ponde-racin no negativa (y, x) que altera la densidad de la poblacin. Losagentes son seleccionados para formar parte de la muestra de la pobla-cin mediante una regla que es diferente, por lo general, de un muestreoaleatorio. Representemos por (Y*, X*) las variables aleatorias producidaspor el muestreo. La densidad de los datos muestreados g(y*, x*) podraexpresarse de la siguiente manera:

    g(y*, x*) = (y*, x*)(y*, x*) (13)(y*,x*)(y*, x*) dy*dx*donde el denominador de la expresin se introduce para asegurar que laintegral de la funcin de densidad g(y*, x*) valga la unidad. El muestreo ale-atorio simple corresponde al caso en que (y,x) = 1. Los esquemas de mues-treo para los cuales (y, x) = 0 para algunos valores de (Y, X) ocasionan pro-blemas especiales porque no todos los valores de (Y, X) se muestrean.19

    (19) Para las muestras en las que (y, x) = 0 para una fraccin no despreciable de la pobla-cin, resulta til considerar dos casos. Una muestra truncada es una muestra en la queno se conoce cul es la probabilidad de observar la muestra a partir de la muestra ale-atoria superior. Para tal muestra, (13) es la densidad de todos los valores Y y X mues-treados. Una muestra censurada es una muestra en la que la probabilidad se conoce opuede ser estimada consistentemente.

    P209-296 9/1/04 09:19 Pgina 231

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    232

    Para muchos problemas econmicos la atencin se centra en f(y|x), ladensidad condicional de Y dado X = x. Si se seleccionan las muestrassolamente segn las variables x (seleccin segn las variables exge-nas), (y, x) = (x), y el empleo de muestras seleccionadas no constitu-ye ningn problema para hacer inferencias vlidas sobre la densidad con-dicional de la poblacin.

    Hacer muestreo tanto para y como para x se denomina muestreoestratificado general, y se pueden caracterizar varios esquemas de mues-treo distintos segn la estructura que se le da a las ponderaciones (Heck-man, 1987).

    No es posible recuperar la verdadera densidad de f(y, x) de una mues-tra de datos si no conocemos la regla de ponderacin. Por otra parte, siconocemos la ponderacin (y*, x*) y el soporte de (y, x) y si (y, x) es nonulo, entonces siempre podemos recuperar f(y, x) porque

    g(y*, x*)=

    (y*, x*)(14)(y*, x*) (y*,x*)(y*, x*) dy*dx*

    por hiptesis, conocemos tanto el numerador como el denominador delmiembro izquierdo, y sabemos que f(y*, x*)dy*dx* = 1, por lo tanto es posi-ble determinar (y*, x*)f(y*, x*)dy*dx*. Es fundamentalmente ms fcilcorregir el sesgo que resulte de planes de muestreo con ponderaciones nonegativas conocidas o ponderaciones que pueden ser estimadas por sepa-rado del modelo completo que corregir una seleccin para la cual las pon-deraciones no se conocen y deben ser estimadas conjuntamente con elmodelo.20 El muestreo con sesgo de eleccin, el muestreo con sesgo delongitud y el muestreo con sesgo de tamao son ejemplos de lo primero;el muestreo que surge de la seleccin en el modelo de las ecuaciones (10a)-(10c) o en el modelo de Roy generalizado es un ejemplo de lo segundo.21

    La exigencia de que se conozca (a) el soporte de (y, x) y de que (b) (y,x) sea no nulo no es inocua. En muchos problemas econmicos de impor-

    (20) Desde mediados de los aos 50 se han estudiado selecciones con ponderaciones cono-cidas bajo el nombre de estimaciones de Horvitz-Thompson. Rao (1965,1985) resumeesta investigacin en estadstica. Manski y Lerman (1977), Cosslett (1981) y Manski yMcFadden (1981) tuvieron contribuciones importantes a la literatura econmica sobremuestreo basado en la eleccin. El muestreo basado en criterios de longitud es analti-camente equivalente al muestreo basado en criterios de eleccin y ha sido estudiadodesde finales del siglo XIX por actuarios daneses (vase Sheps y Menken, 1973; Trivediy Baker, 1983). Heckman y Singer (1985) amplan el anlisis clsico de muestreo basadoen criterios de longitud realizado en anlisis de duracin considerando modelos con noobservables que varan entre perodos de actividad y con variables que se modificancon el tiempo. En su caso ms general, no pueden emplear mtodos simples de pon-deracin con pesos determinados independientemente del modelo.

    (21) Lewbel (2001) presenta un anlisis interesante de un modelo de seleccin basado en unmodelo de tipo Roy en el que las ponderaciones pueden construirse independiente-mente del conjunto del modelo para recuperar las distribuciones marginales de res-puestas , pero no las distribuciones completas de respuestas y de reglas de seleccin.

    P209-296 9/1/04 09:19 Pgina 232

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    233

    tancia la exigencia (b) no se cumple: la regla de muestreo no permite laobservacin de ciertos valores de (y, x), y por lo tanto es imposible deter-minar la distribucin de (Y, X) para esos valores sin recurrir a otros supues-tos. Si no se conocen ni el soporte ni la ponderacin es imposible, sin recu-rrir a fuertes supuestos, determinar si el hecho de que falten datos paraalgunos valores de (y, x) se debe al plan de muestreo o a que la densidadde la poblacin no tiene soporte para esos valores. Empleando estos mar-cos, Heckman (1987) analiza una variedad de estrategias de muestreo quepresentan inters en economa, mostrando los supuestos que hacen sobrela ponderacin y el modelo para resolver el problema de inferencia yremontar de la poblacin observada a la poblacin hipottica.

    El grfico 2 ilustra de forma simple el problema que surge de que(x, y) = 0. En el grfico 2a represento una distribucin truncada de Y condatos ausentes para los valores de Y por debajo de c. Por debajo de c cual-quier forma es posible para la verdadera densidad de la hiperpoblacin.El grfico 2b muestra una versin de regresin del mismo problema parauna funcin de oferta de trabajo H expresada en trminos de salarios W.Podemos ajustar la regresin a la muestra pero, qu se puede hacer paraproyectarla sobre nuevas muestras o sobre la poblacin hipottica?

    5.2. Una representacin en forma de modelo de regresin del problemade seleccin cuando hay seleccin sobre variables no observables

    En los trabajos de Gronau (1974), Heckman (1976a, 1976c, 1978a, 1979)y Lewis (1974) se encuentra el origen de una versin del modelo de regre-sin del problema de seleccin cuando las ponderaciones (y, x) no pue-den ser estimadas independientemente del modelo. Nace del modelo deRoy empleando (8) y suponiendo que (U0, U1, U2) son independientes deX, Z. Est estrechamente relacionada con la caracterizacin de Lester Tel-ser de sesgos de ecuaciones simultneas en un sistema convencional dela Comisin Cowles.22 Uso Z para representar las variables que afectan alas elecciones mientras que las X son las variables que afectan a las res-puestas. Es posible que X y Z tengan variables en comn. Observamos Y(vase ecuacin [12]). Entonces:

    E(Y|X, Z, D = 1) = E(Y1|X, Z, D = 1) = 1(X)+E(U1|X, Z, D=1) (15a)

    y

    E(Y|X, Z, D = 0) = E(Y0|X, Z, D = 0) = 0(X)+E(U0|X, Z, D=1) (15b)

    Las medias condicionales de Uo y U1 son las funciones de control ofunciones de sesgo tal como se introducen y definen en Heckman (1980a)y Heckman y Robb (1985, 1986). Las respuestas observadas medias (lasvariables del miembro izquierdo) estn generadas por la media de las res-puestas potenciales ms un sesgo.

    (22) Vase el sistema de ecuaciones (A1) en el apndice A. Vase Telser (1964) y las discu-siones en Heckman (1976c, 1978a, 2000).

    P209-296 9/1/04 09:19 Pgina 233

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    234

    Grfico 2aDATOS PARA Y < c AUSENTES. DOS PENDIENTES POSIBLES

    PARA LA DENSIDAD POR DEBAJO DE c

    dos formas posibles

    c y

    f(y)

    otra extrapolacin

    una extrapolacin

    soporte de W fuera de la muestrasoporte de W

    lnea de regresindentro de la muestra

    H

    0 W

    Grfico 2bEL PROBLEMA DE EXTRAPOLAR FUERA DE LA MUESTRA

    P209-296 9/1/04 09:19 Pgina 234

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    235

    Definamos P(z) = Pr(D = 1 |Z = z). Como consecuencia de la regla dedecisin (11), demuestro en Heckman (1980a) que bajo condiciones gene-rales, siempre podemos formular estas expresiones como

    E(Y|X, Z, D = 1) = 1(X)+K1(P(Z)) (16a)

    y

    E(Y|X, Z, D = 0) = 0(X)+K0(P(Z)) (16b)

    donde K1(P(Z)) y K0(P(Z)) son funciones de control y dependen de Z slo atravs de P. Las formas funcionales de las variables K dependen desupuestos especficos de distribucin. Para un catlogo de ejemplos,vase Heckman y MaCurdy (1985).

    El valor de P est relacionado con la magnitud del sesgo de seleccin.A medida que las nuestras se hacen ms representativas, P(z)1 yK1(P)0. Vase el grfico 3 que representa la funcin de control K1(P(z))en funcin de P. A medida que P1 la muestra es cada vez ms repre-sentativa puesto que la probabilidad de que cualquier individuo estincluido en la muestra es la misma (y P = 1). La funcin de sesgo decrececon P. Podemos calcular la media poblacional de Y1 en muestras con pocaseleccin (P alto). En general, las regresiones sobre muestras selecciona-das presentan sesgo para 1(X). Combinamos el sesgo de seleccin con lafuncin que nos interesa. Si hay variables en Z que no estn en X, lasregresiones sobre las muestras seleccionadas indicaran que estas varia-bles pertenecen a la regresin. La representacin de (16a) y (16b) cons-tituye la base de toda una literatura economtrica sobre sesgos de selec-cin en funciones de seleccin.23 La idea clave en toda esta literatura es elcontrol del efecto de P sobre las relaciones ajustadas.24

    Las funciones de control relacionan los datos ausentes (las variablesUo y U1) con los observables. Bajo una serie de supuestos, es posible cons-truir estas funciones, que incluirn parmetros desconocidos, e identificarlos 0(X), 1(X) y parmetros desconocidos a partir de un anlisis de regre-sin, a la vez que se controla el sesgo de seleccin (vase Heckman,1976a; Heckman y Robb 1985, 1986; Heckman y Vytlacil, 2002).

    En la literatura temprana, las formas funcionales especficas de (15) y(16) han sido derivadas suponiendo que las U tenan una distribucin con-junta normal.

    Supuesto 2. (U0, U1, U2)~N(0,)

    (23) Heckman, Ichimura, Smith y Todd (1998) presentan mtodos para contrastar la adecua-cin de esta expresin en un contexto semiparamtrico.

    (24) Heckman (1980a) propone una expansin en serie de las funciones de K1 y K0 en trmi-nos de polinomios de P y sugiere que para contrastar la ausencia de seleccin podemosbasarnos en un contraste de si el conjunto completo de polinomios es estadsticamen-te significativo en una ecuacin de respuestas. Andrews (1991) y Newey (1994) ofrecenun anlisis ms general.

    P209-296 9/1/04 09:19 Pgina 235

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    236

    Grfico 3FUNCIN DE CONTROL O SESGO DE SELECCIN

    COMO FUNCIN DE P(z)

    Supuesto 3. (U0, U1, U2) independientes de (X, Z).

    El supuesto 2 combinado con el supuesto 3 proporciona formas fun-cionales precisas para K1 y K0. Para muestras censuradas, se desarroll unprocedimiento de estimacin en dos etapas: (1) estimar P(Z) a partir de losdatos relativos a la decisin de trabajar y (2) usar P(Z) estimada para for-mar K1(P(Z)) y K0(P(Z)) que incluyen parmetros desconocidos. (16a) y(16b) pueden entonces estimarse por regresin. Esto da lugar a una cmo-da expresin lineal en los parmetros cuando 1(X) = X1 y 0(X) = X0.25Se desarroll un procedimiento de regresin directo (en una sola etapa)para muestras truncadas (vase Heckman y Robb 1985, 1986). Las ecuacio-nes (16a) y (16b) se convirtieron en la base de toda una literatura, quegeneraliz y ampli los primeros modelos y que sigue viva hoy en da.

    5.3. Resultados empricos de estos modelos y sus consecuencias para laeconoma

    El marco de regresin es til para investigar los fenmenos microe-conmicos de muestras seleccionadas en el caso general de seleccin

    (25) En Heckman (1979) y Newey y McFadden (1994) se ofrecen correcciones para emplearP(Z) estimado en la primera etapa. Los supuestos 2 y 3 tambin se emplearon para esti-mar el modelo por mxima verosimilitud como en Heckman (1974a, 1974c). La literatu-ra temprana no ofreca explicaciones claras sobre las fuentes de identificacin, sobre lanecesidad de las restricciones de exclusin y sobre el papel de la normalidad.

    Funcin decontrol o de sesgo

    K1(P(z))

    0Probabilidad de seleccin

    en la muestra P(z)

    1

    P209-296 9/1/04 09:19 Pgina 236

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    237

    que el modelo de Roy cubre. Por lo general, no existen ponderacionessimples que puedan estimarse por separado del modelo completo y quepermitan resolver el problema de seleccin en el modelo de Roy. Se hanaplicado versiones de este modelo a problemas econmicos adems de ala investigacin sobre oferta de trabajo y salarios.

    La toma de conciencia de la importancia potencial de la seleccin estdeterminando la manera en que se interpretan datos econmicos y socia-les y se evalan la efectividad de las polticas sociales. Consideremos, porejemplo, la cuestin importante de si se ha producido alguna mejora enel estatus econmico de los afro-americanos. Como lo muestra el grfico4a, la proporcin del salario mediano del varn negro con respecto alvarn blanco aument en Estados Unidos durante el periodo 1940-1980 yse estabiliz ms adelante (vase la curva negra en el grfico 4a). Estaestadstica se cita ampliamente como justificacin del conjunto completode las polticas sociales desarrolladas durante esas dcadas. En el mismoperiodo, los negros se estaban retirando de la fuerza de trabajo (P(Z) dis-minuye en ese tramo), y por lo tanto de las estadsticas utilizadas paramedir los salarios, y lo estaban haciendo en mucha mayor medida que losblancos (vase grfico 4b). Si tenemos en cuenta el sesgo muestral pro-vocado por la retirada de los trabajadores negros de bajo salario del mer-cado de trabajo, el progreso econmico de los hombres negros respectoal de los hombres blancos resulta prcticamente nulo y esto pone enentredicho las evaluaciones optimistas que se hacan al respecto.26

    Enfocar el problema de esta manera tiene repercusiones mucho msgeneralizadas. Afecta a la forma en que analizamos la desigualdad y susefectos sobre el empleo y el bienestar de otras formas de organizar elmercado laboral. En discusiones europeas, a menudo se comparan des-favorablemente los mercados de trabajo de los Estados Unidos, con fuer-tes desigualdades y salarios bajos, con los mercados europeas con pocasdesigualdades y salarios altos.

    Estas comparaciones fallan por razones similares a las que surgen enlas discusiones sobre la diferencia de salarios entre negros y blancos enEstados Unidos. En Europa, los parados y los que no trabajan no se conta-bilizan en la medicin de salarios que se emplea para evaluar el comporta-miento del mercado laboral. De esta manera, la desigualdad de salariosqueda infravalorada y el nivel de los salarios sobrevalorado para el conjun-to de la poblacin, por el hecho de computar slo a los que trabajan. Unartculo reciente de Blundell, Reed y Stoker (1999) seala la importancia

    (26) La correccin de seleccin concreta empleada para producir los nmeros que se utili-zan en este grfico tiene por objeto usar salarios medianos de trabajadores suponien-do que los trabajadores de salarios bajos son los que abandonan y que los abandonosrepresentan menos del 50 por ciento del conjunto de la poblacin. Butler y Heckman(1977) fueron los primeros en plantear esta cuestin. La investigacin posterior deBrown (1984), Juhn (1997), Chandra (2000) y Heckman, Lyons y Todd (2000) confirma laimportancia de tener en cuenta los abandonos al analizar las diferencias de salariosentre negros y blancos. La investigacin sobre esta importante cuestin es muy activa.

    P209-296 9/1/04 09:19 Pgina 237

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    238

    Grfico 4aPROPORCIN DEL SALARIO MEDIANO DEL VARN NEGRO CON

    RESPECTO AL VARN BLANCO, 1940-90

    Fuente: Heckman y Todd (1999).

    del problema de seleccin en el contexto ingls. Los datos ingleses reve-lan un incremento en los salarios reales de los trabajadores en el periodo1978-94 (vase la curva superior en el grfico 5a). Al mismo tiempo la pro-porcin de personas que trabajan ha disminuido (vase grfico 5b), y sitenemos en cuenta los abandonos, el nivel y la tasa de crecimiento de lossalarios reales se ven reducidos. Por otra parte, el incremento observadoen los salarios reales podra ser consecuencia de una mejora en los recur-sos de mano de obra especializada y de un aumento en la remuneracin

    0.8

    0.7

    0.6

    0.5

    0.4

    1940 1950 1960 1970 1980 1990

    Incluye a los que no trabajanExcluye a los que no trabajan

    Po

    rpo

    rci

    n d

    el s

    alar

    io s

    eman

    al m

    edia

    no

    60

    40

    20

    0Po

    rcen

    taje

    de

    los

    qu

    e n

    o f

    orm

    an p

    arte

    de

    la f

    uer

    za d

    e tr

    abaj

    o (

    1-P

    (Z))

    Ao

    1940 1950 1960 1970 1980 1990

    Ao

    BlancosNegros

    Grfico 4bPORCENTAJE DE VARONES QUE NO FORMAN PARTE

    DE LA FUERZA DE TRABAJO, 1940-90

    P209-296 9/1/04 09:19 Pgina 238

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    239

    de la misma (por ejemplo, 1(X)) o de mejoras en el sector ajeno al mer-cado, lo cual cambia la media condicional de las variables no observablesen la ecuacin de los salarios eliminando del mercado de trabajo a los tra-bajadores que tienen salarios potencialmente bajos. El ajuste para tomaren cuenta la seleccin (las dos curvas inferiores en el grfico 5a) reduceconsiderablemente el incremento estimado de los salarios.

    Grfico 5aPREDICCIONES DE SALARIO DE UN MODELO MICROECONMICO,

    SALARIO AGREGADO Y CORRECCIONES CON NUEVABASE EN 1978

    Fuente: Blundell et al. (1999).

    0,4

    0,3

    0,2

    0,1

    0

    Prediccin del modelo microeconmicondice agregado

    log

    arit

    mo

    del

    sal

    ario

    Ao

    Agregado corregido

    78 80 82 84 86 88 90 92 94

    0,9

    0,85

    0,8

    0,75

    Pro

    po

    rci

    n e

    mp

    lead

    a (P

    (Z))

    78 80 82 84 86 88 90 92 94 96Ao

    Grfico 5bSALARIOS Y PARTICIPACIN EN EL MERCADO DE TRABAJO,

    VARONES BRITNICOS

    P209-296 9/1/04 09:19 Pgina 239

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    240

    El tener en cuenta la seleccin tambin afecta a las medidas de lavariabilidad de los salarios en el ciclo (Bils, 1985). Los individuos con sala-rios bajos abandonan la fuerza de trabajo en las recesiones (y por tantono se encuentran representados en las estadsticas empleadas para medirlos salarios de los trabajadores) y vuelven a ella en poca de auge. Alcambiar la composicin, se compensa parcialmente la variabilidad de lasmedidas de los salarios. De esta manera, las medidas de los salarios pare-cen mostrar una variabilidad insuficiente a lo largo del ciclo econmi-co. Cuando se estima un modelo de Roy de auto-seleccin con varios sec-tores del mercado, el argumento se hace ms sutil. A lo largo del ciclo, nosolamente hay entradas y salidas en la fuerza de trabajo, sino que tam-bin se dan migraciones de los trabajadores de un sector a otro dentro dela fuerza de trabajo. Por lo tanto, las medidas de los salarios no represen-tan solamente el precio de los servicios del trabajo. Adems del efecto deseleccin estndar, las medidas de los salarios incluyen el efecto de apli-car ponderaciones sobre las distintas combinaciones de aptitudes usadaspor los trabajadores a lo largo del ciclo (Heckman y Sedlacek, 1985).

    Si tenemos en cuenta el margen extensivo as como el intensivo, estotiene repercusiones sobre nuestra percepcin del comportamiento delmercado laboral. Consideremos la ecuacin (2). Observamos nicamentelas horas de trabajo de los trabajadores. Para centrarnos en el problemade seleccin, hagamos el falso supuesto de que se han observado lossalarios de todos los individuos e ignoremos cualquier endogeneidad enlos salarios (de tal manera que W es independiente de U). Usemos D = 1para representar el trabajo. La oferta de trabajo observada condicionadaa W y a X es

    E(H|W, X, D = 1) = H(W, X) + E(U|W, X, D = 1) (17)

    donde el parmetro de la oferta de trabajo marshaliana (o parmetro cau-sal) de los salarios es H/W, es decir el cambio en la oferta de trabajodebido a un cambio en los salarios. Si tenemos en cuenta los efectosrenta, podemos construir a partir de aqu una funcin de oferta de traba-jo con utilidad constante que nos permita realizar un anlisis de bienestarpara, por ejemplo, calcular el excedente del consumidor. Pero en una fun-cin de oferta de trabajo ajustada a una muestra seleccionada de trabaja-dores, se pueden identificar dos efectos de los salarios: un efecto mars-haliano y un efecto de composicin o de seleccin debido a las entradasy salidas de la fuerza de trabajo (Heckman, 1978c). De esta manera

    E(H|W, X, D = 1) =

    H(W, X) +

    E(U|W, X, D = 1) (18)W W W

    El segundo trmino es un efecto de seleccin, o de composicin, quesurge del cambio en la composicin de las variables no observablesdebido a la entrada o a la salida de individuos de la fuerza de trabajoinducida por el cambio de los salarios. No se trata de un cambio ceterisparibus que corresponda a parmetros de la teora clsica del consumi-dor. La ecuacin (18) no nos dice en qu medida un trabajador dadocambiara su oferta de trabajo al cambiar los salarios. Sin embargo, sque nos informa de lo que un cambio de salario dentro de la muestra

    P209-296 9/1/04 09:19 Pgina 240

  • REVISTA ASTURIANA DE ECONOMA - RAE N 26 2003

    241

    producira sobre la oferta de trabajo media. Esto contesta a la preguntade evaluacin del tipo de la pregunta 1 de Marschack. Bajo condicionesadecuadas para el soporte de W, la ecuacin (18) se puede usar paraestimar los efectos dentro de la muestra de los impuestos sobre la ofer-ta de trabajo.27

    Las elasticidades de la oferta agregada de trabajo incluyen efectos dela entrada y salida de individuos de la fuerza de trabajo as como los efec-tos del desplazamiento a lo largo de la curva marshaliana de oferta de tra-bajo. Esta observacin simple ha tenido efectos sustanciales sobre laespecificacin, la estimacin, y la interpretacin de la oferta de trabajo enlos modelos macroecnomicos.

    A principios de los aos 80, apareci toda una literatura en macroe-conoma que afirmaba que las elasticidades agregadas de la oferta de tra-bajo eran demasiado pequeas y los movimientos de los salarios dema-siado importantes como para que el modelo neoclsico del mercado detrabajo permitiese explicar los datos de series temporales de Estados Uni-dos. Ya he expuesto por qu la variacin de la medida de los salariosinfravalora la variacin real del precio del trabajo. En Heckman (1984)sealo incluso que la literatura en macroeconoma se centraba exclusiva-mente en el componente de la oferta de trabajo con solucin interior, elprimer trmino del miembro derecho de (18), e ignoraba el efecto deseleccin provocado por la entrada y salida de trabajadores en/de la fuer-za de trabajo. Dado que la mitad de la oferta de trabajo agregada seencuentra en el margen extensivo (Coleman 1984), donde la elasticidadde la oferta de trabajo es mayor, los clculos estndar de los aos 80 esta-ban infravalorando la verdadera elasticidad de la oferta de trabajo agre-gada y subestimaban tambin la capacidad del modelo neoclsico deoferta de trabajo para dar cuenta de las fluctuaciones en la oferta de tra-bajo agregada. Cuando se comenz a tomar en cuenta la eleccin en losmrgenes extensivos, cambi la percepcin y la forma de modelizar elmercado laboral de los macroeconomistas (vase, por ejemplo, Hansen,1985; Rogerson, 1988).

    Los avances empricos en la literatura de la oferta de trabajo confir-maron estas conclusiones. Anteriormente, la evidencia haba puesto enentredicho la validez emprica del modelo (10). Los costes fijos del traba-jo hacen que sea poco probable que el ndice de horas de trabajo est tanestrechamente unido a la decisin de participacin en el mercado de tra-bajo como sugiere el modelo. Cuando los trabajadores se incorporan almercado laboral, suelen trabajar muchas horas, y no pocas horas, comosugiere la ecuacin (10) si las U estn distribuidas normalmente. Heck-man (1976a, 1980b) y Cogan (1981) propusieron un modelo ms generalcon coste fijos en el cual las ecuaciones de participacin y de horas de tra-bajo estn menos estrechamente relacionados. Esto da lugar a una elas-ticidad an mayor para el segundo trmino de la ecuacin (18). La evi-

    (27) La condicin necesaria es el supuesto a en la nota 9 de la seccin 2.

    P209-296 9/1/04 09:19 Pgina 241

  • JAMES J. HECKMAN. DATOS MICROECONMICOS, HETEROGENEIDAD Y LA EVALUACIN DE POLTICAS PBLICAS

    242

    dencia tambin puso en entredicho la validez del supuesto de normalidad,especialmente para los datos relativos a las horas de trabajo. Las distri-buciones de las horas trabajadas en muchos pases han revelado que pre-sentan picos en el nmero estndar de horas trabajadas.28 Esto ha lleva-do a desarrollos destinados a relajar el supuesto de normalidad usado enlos primeros modelos.

    5.4. Identificacin

    Gran parte de la literatura economtrica sobre el problema de selec-cin combina discusiones sobre la identificacin (el remontar de laspoblaciones generadas por las reglas de seleccin a la poblacin de ori-gen) con discusiones sobre la estimacin para resolver los problemasplanteados para pasar de las muestras observadas a las poblacioneshipotticas.29 Resulta analticamente til distinguir entre las condicionesnecesarias para identificar el modelo de seleccin a partir de datos ide-ales, y los numerosos e importantes problemas prcticos que surgenpara estimar el modelo. Es esencial comprender las fuentes de identifi-cacin de un modelo para entender hasta qu punto lo que estamosextrayendo de un modelo emprico es consecuencia de lo que hemosincorporado en l.

    En 1985, un congreso en el Educational Testing Service (ETS) reuni aeconomistas y estadsticos y permiti contrastes interesantes de puntosde vista sobre la construccin de modelos causales y de modelos deseleccin (vase Wainer, 1986, reeditado en 2000).30 En esa conferencia,Holland (1986) emple la ley de expectativas iteradas para expresar la dis-tribucin condicionada a X de una respuesta que denominaremos Y1, dela manera siguiente:

    F(Y1|X) = F(Y1|X, D = 1) Pr(D = 1 |X) + F(Y1|X, D = 0) Pr(D = 0 |X) (19)

    Del anlisis de (11) y (12), sabemos que observamos Y1 solamente siD = 1. En una muestra censurada,