Encuesta Panel Casen

23
PNUD CHILE PROGRAMA EQUIDAD Marzo 2009 ANÁLISIS ENCUESTA PANEL CASEN

Transcript of Encuesta Panel Casen

  • PNUD CHILE

    PROGRAMA EQUIDAD

    Marzo 2009

    ANLISIS ENCUESTA PANEL CASEN

  • 1) Datos Bsicos La encuesta panel Casen, consiste en el seguimiento a hogares y a las

    personas dentro de este, que pertenezcan a las regiones 3, 7, 8 y RM. Estas regiones representan aproximadamente al 60% de la poblacin nacional y del PIB. Actualmente se tienen datos para tres aos: 1996, 2001 y 2006, donde se siguen efectivamente a 10.287 personas.

    La encuesta consta de ocho mdulos que incluyen: - Panelcasen_m01: Residentes, patrimonio y vivienda. - Panelcasen_m02: Educacin. - Panelcasen_m03: Empleo. - Panelcasen_m04: Ingresos. - Panelcasen_m05: Salud. - Panelcasen_m06: Hitos. - Panelcasen_m07: Participacin. - Panelcasen_m08: Historia Laboral. La informacin relevante para el uso de los datos, se encuentra principalmente

    en el manual de usuario y en la descripcin metodolgica. Estos dos documentos estn disponibles en el Observatorio Social de la Universidad Alberto Hurtado. Sin embargo a continuacin se presentan algunas consideraciones bsicas a tener en cuenta.

    Los identificadores de hogares son: idhogar_96, idhogar_01, idhogar_06. Para el identificador de personas est idpersona para toda persona que alguna vez fue entrevistada. Adems hay identificadores de personas segn las encuesta que respondieron, as podemos identificar si la persona respondi una sola encuesta, dos o tres.

    Los distintos mdulos de la encuesta vienen por separado, para unir las bases el procedimiento es:

    - sort idhogar_96 idhogar_01 idhogar_06 idpersona. - merge idhogar_96 idhogar_01 idhogar_06 idpersona.

    Para los datos faltantes se sigue la convencin de que si la pregunta no aplica se pone un missing y si no hay respuesta se coloca un 9, 99 o 99999999 para cifras numricas.

    Se ha tratado de mantener consistencia en los cdigos de las preguntas a travs de los aos, sin embargo, los cuestionarios no siempre fueron iguales o la codificacin de las variables. Por lo tanto es necesario verificar las preguntas y codificacin, principalmente para el mdulo de empleo. Por ejemplo, nombres de variables no son las mismas para tipo de contrato y tipo de trabajo. Adems para el 2006 se incorpora un nuevo mdulo de historia laboral.

    La encuesta hace correcciones en base a:

    - Cuentas nacionales. - Se hacen correcciones por consistencia temporal (especialmente sexo y

    edad). No obstante, se dejan en la base todas las variables, tanto las originales como las corregidas. Se recomienda trabajar con las cifras corregidas, ya que se comprob que hay resultados muy diferentes en estadsticas de ingreso, pobreza y desigualdad. Las cifras corregidas

  • arrojan mejores resultados al comparar con las cifras obtenidas en la encuesta Casen anual.

    - Hay correccin de imputacin por omisin en el reporte de algunas

    cifras monetarias. Estos ajustes se hacen a: ingresos de ocupacin principal, ingresos por jubilacin, rentas vitalicias e ingresos por alquiler. Nuevamente se dejan las cifras corregidas y sin corregir.

    Las cifras monetarias estn en pesos corrientes de cada ao. Al hacer anlisis entre aos deben hacerse correcciones por IPC para lograr comparabilidad entre las cifras.

    La encuesta busca seguir a los hogares iniciales de la encuesta, sin embargo, hay incorporacin de individuos que no fueron encuestados en la primera ronda. Esto se debe a nacimientos y a personas que no participaron en la nueva encuesta pero que se fueron a vivir con un hogar que si fue entrevistado. Por esto la encuesta distingue entre los MOM (miembros originales de la muestra) y los MTM (miembros temporales de la muestra) la encuesta slo sigue a los MOM, siempre y cuando sigan viviendo en las regiones especificadas.

    Respecto a las reglas de seguimiento, la encuesta panel sigue a los miembros originales (MOM) sin importar si pasaron a vivir en un hogar distinto, siempre y cuando sigan viviendo en las cuatro regiones de estudio. De esta forma, si un MOM se traslada a vivir con un nuevo hogar o nuevas personas, estos nuevos miembros son seguidos como MTM y se siguen mientras el MOM viva con ellos, de la misma forma si a un hogar MOM llegan nuevos integrantes estos son seguidos como MTM y se siguen mientras vivan en el hogar MOM

    A lo largo de los aos, hay personas que no vuelven a contestar la encuesta. Las principales razones son que cambiaron de residencia a un domicilio desconocido, se movieron fuera de las regiones estudiadas, direcciones incompletas o porque no quisieron responder. La atricin es de un 28,2% para el periodo 1996-2001 y un 50,9% entre 1996 y 2006.

    En principio la prdida de observaciones se traduce en un problema de eficiencia de estimadores. Sin embargo si esta salida de la muestra no es aleatoria, entonces pueden estar existiendo problemas de sesgo en los resultados. El problema es solucionado mediante la construccin de pesos longitudinales que mantienen la consistencia de la muestra inicial a travs del tiempo.

    Por lo anterior se tienen 5 tipos de factores de expansin: tres factores de corte transversal y dos de corte longitudinal. Al trabajar a nivel anual, deben usarse los factores de expansin de corte transversal para cada ao. Si lo que se busca es analizar cambios en el tiempo deben usarse los factores de expansin longitudinales.

    Hay dos factores de expansin longitudinales, uno para el periodo 1996-2001 y otro para el periodo 1996-2001-2006. Este ltimo factor es usado para calcular estadsticas (1996-2006) o (2001-2006). Por ltimo, se recomienda que al trabajar con datos longitudinales la unidad de anlisis sea la persona en vez del hogar.

  • Factores de expansin corte transversal: Los factores de corte transversal ajustan los factores de la encuesta casen anual para corregir por seleccin de muestra. Este ajuste consiste en el cuociente entre la suma de todos los pesos de las personas de una comuna encuestadas en la casen anual y la suma de los pesos de las personas seleccionadas en esa comuna en la encuesta panel. Factores de expansin longitudinal: Estos pesos corrigen por atricin, adems de corregir por muestra. Para esto se hace un factor de ajuste segn probabilidad de respuesta. Para la primera ola, el peso longitudinal se construye en base al factor de corte transversal para 1996. Para la segunda ola el primer factor longitudinal calculado es ajustado por probabilidad de respuesta entre 2001 y 2006.

    Debido al proceso de seleccin de la muestra que va a ser encuestada, que incluye formacin de clusters, estratificacin y desiguales probabilidades de seleccin, no se puede tratar a la encuesta como una muestra iid. Generalmente la estratificacin disminuye la varianza mientras que los clusters la aumentan. La solucin entonces es aplicar un mtodo de correccin de la varianza, esto puede ser hecho de dos formas: 1) Conglomerado reg y es ten [pw= pesos_long_96_01_06], cluster(conglomerado) 2) Svy svyset conglomerado [pw= pesos_long_96_01_06], strata(estrato2) svy: reg y es ten

    Para trabajar con comandos de datos de panel, se hace necesario darle formato a la base. Cuando se va a trabajar con pocas variables, el paso ms sencillo es realizar un reshape, de la siguiente forma:

    sort idhogar_96 idhogar_01 idhogar_06 idpersona reshape long variables, i(idpersona) j(wave)

  • 2) Estadstica Descriptiva.

    1. Muestra: personas que responden por ao. La encuesta sigue efectivamente a 10287 personas. Con lo cual hay un porcentaje de atricin de 51% entre 1996 y 2006.

    Tabla1: Muestra de personas en Casen panel por ao

    Miembros originales y Miembros transitorios Personas MOM MTM TOTAL

    1996 20942 0 20942

    2001 15038 3819 18857

    2006 10287 4281 14568 Fuente: Construccin propia en base a encuesta Casen panel.

    2. Comparacin cifras Casen anual y Panel: Encuesta panel presenta dos datos,

    las cifras reportadas y las cifras ajustadas por cuentas nacionales. Panel tiende a sobreestimar cifras de pobreza, el problema es mayor para las cifras sin corregir.

    Tabla2: Tasa de Pobreza Casen anual y Panel con y sin correcciones

    Regiones 3, 7, 8 y RM Pobreza 1996 2000 2006

    Segn Mideplan 20,8 18,7 12,1

    Panel sin/correccion 25,8 22,9 13,6

    Panel con/correccion 22,8 20,9 12,7 Fuente: Construccin propia en base a encuesta Casen panel.

    3. Estadstica Descriptiva Casen anual y panel

    Variables de ingreso, como ingreso total e ingreso per cpita, son menores para la encuesta Casen Panel. Esto se da con ms fuerza para el 2001. En promedio los ingresos de la encuesta Casen panel son un 83% de las cifras de las encuestas Casen para cada ao. A continuacin se encuentra la estadstica descriptiva de algunas variables relevantes y su comparacin entre las Casen panel y la casen de los aos respectivos.

  • Tabla3: Comparacin Estadstica Descriptiva. Encuesta Casen Panel y Anual, cifras reales, regiones 3,7,8 y RM.

    Variable Obs Mean Std, Dev, Min Max Variable Obs Mean Std, Dev, Min Max

    ytotcorh_96 5.209 525.361 459.084 0 8.775.445 ytothaj_96 15676 664.635 791683 0 36.760.134

    ytotcorh_01 4.648 490.937 528.800 0 8.115.531 ytothaj_00 32803 685.055 1.102.343 0 29.869.664

    ytotcorh_06 3.769 530.907 523.825 0 12.100.000 ytothaj_06 33710 724.362 1099970 0 30.900.000

    ypccorr96 5.209 153.684 141.930 0 4.007.684 ypc96 15.676 196.030 273.753 0 12.656.684

    ypccor01 4.648 156.219 201.983 0 3.223.669 ypc00 32803 213.200 342.547 0 10.850.357

    ypccor06 3.769 151.981 152.987 0 2.410.000 ypc06 33710 229.139 394209 0 10.300.000

    np96 5.209 3,95 1,74 1 17 np96 15676 3,94 1,74 1 20

    np01 4.648 3,89 1,77 1 16 np00 32803 3,86 1,78 1 20

    np06 3.769 3,87 1,70 1 16 np06 33710 3,73 1,71 1 19

    asiste_96 7.572 0,71 0,5 0 1 asiste 22419 0,71 0,45 0 1

    trabajo_96 16.077 0,48 0,5 0 1 trabajo 48.176 0,48 0,50 0 1

    capacitac~96 11.335 0,10 0,3 0 1

    indepjefe_96 7449 0,23 0,42 0 1 indep_jefe 11437 0,28 0,45 0 1

    contratoj~96 5543 0,75 0,43 0 1 contrato_jefe 8023 0,83 0,38 0 1

    uniparent~96 5.209 0,25 0,4 0 1 uniparental 15.676 0,26 0,44 0 1

    tenencia_96 20.942 0,58 0,5 0 1 tenencia 15.676 0,56 0,50 0 1

    cotiza_96 7.449 0,65 0,5 0 1 cotiza 22788 0,67 0,47 0 1

    subviv_96 3.343 0,34 0,5 0 1 subviv_hogar 8465 0,34 0,47 0 1

    esc_96 19.599 7,09 5,0 0 20 esc 61.885 7,51 5,07 0 20

    prevision_96 20.677 0,40 0,5 0 1 prevision 38.298 0,43 0,49 0 1

    asiste_01 6.110 0,75 0,43 0 1 asiste 44627 0,75 0,44 0 1

    subviv_01 3.433 0,40 0,49 0 1 subviv 22647 0,46 0,50 0 1

    trabajo_01 14.836 0,45 0,50 0 1 trabajo 101019 0,47 0,50 0 1

    capacitac~01 10006 0,12 0,32 0 1 capacitacion 79586 0,09 0,29 0 1

    indepjefe_01 6290 0,24 0,43 0 1 indep_jefe 22621 0,28 0,45 0 1

    contratoj~01 4636 0,77 0,42 0 1 contrato_jefe 15312 0,82 0,39 0 1

    uniparent~01 4.648 0,27 0,44 0 1 uniparental 32803 0,28 0,45 0 1

    tenencia_01 18.587 0,67 0,47 0 1 tenencia 32803 0,64 0,48 0 1

    cotiza_01 6.289 0,63 0,48 0 1 cotiza 44191 0,65 0,48 0 1

    esc_01 17.648 7,60 5,02 0 20 esc 127995 7,91 5,09 0 20

    prevision_01 18.453 0,27 0,45 0 1 prevision 70964 0,35 0,48 0 1

    asiste_06 3.293 0,74 0,44 0 1 asiste 39082 0,79 0,41 0 1

    subviv 23047 0,43 0,50 0 1

    trabajo_06 12.119 0,49 0,50 0 1 trabajo 103183 0,49 0,50 0 1

    capacitac~06 14.568 0,12 0,47 0 1 capacitacion 94704 0,10 0,29 0 1

    indepjefe_06 5430 0,22 0,32 0 1 indep_jefe 22774 0,27 0,44 0 1

    contratoj~06 4014 0,81 0,39 0 1 contrato_jefe 15906 0,84 0,37 0 1

    uniparent~06 3.769 0,26 0,44 0 1 uniparental 33710 0,31 0,46 0 1

    tenencia_06 14.568 0,71 0,46 0 1 tenencia 33710 0,66 0,48 0 1

    cotiza_06 10.947 0,39 0,49 0 1 cotiza 92900 0,42 0,49 0 1

    esc_06 13.993 8,12 5,09 0 20 esc 124841 8,78 5,14 0 20

    prevision_06 13.786 0,19 0,39 0 1 prevision 118495 0,18 0,38 0 1

    Panel Casen Comparacin Casen Aos Respectivos

    Fuente: Construccin propia en base a encuesta Casen panel y encuesta Casen aos respectivos.

    1) Atricin. La atricin es un problema que se genera cuando la salida de la muestra no es

    aleatoria, lo cual puede estar sesgando las estimaciones. Si la atricin afecta variables que no son relevantes para el rea de estudio en la que nos enfocamos, no hay problemas de sesgo. Sin embargo, si la variable que nos interesa est afectada por atricin, entonces hay problemas de sesgo asociado a los resultados obtenidos usando dicha variable, esto le ocurre generalmente a las matrices de movilidad de ingreso y transicin de pobreza si es que la variable ingreso presenta atricin. Para evitar lo anterior, debe realizarse una correccin que consiste en el ajuste de los factores de expansin por la probabilidad de volver a responder en la siguiente encuesta. Esto ya est hecho en la encuesta Casen panel mediante los factores longitudinales que incluyen la correccin por muestra y por atricin. A continuacin se describen los pasos para realizar la correccin.

  • El procedimiento para corregir atricin es:

    1) Verificar existencia de atricin comparando medias entre los que vuelven a responder en la siguiente encuesta y los que no son entrevistados de nuevo. En la tabla 4 se observan las medias para algunas variables relevantes entre los dos grupos, al realizar un test de medias vemos que slo la variable sexo y contrato fueron similares en los dos grupos, para todas las dems variables analizadas hay diferencias estadsticamente significativas, lo que nos indica que la salida del panel no es aleatoria.

    Tabla 4: Evaluacin Patrn de Atricin

    A nivel de hogares 1996.

    Responden No Responden

    nmero personas 4,20 3,83 -7,489

    ypc jefe 71.084 91.892 7,380

    contrato jefe 0,31 0,33 1,684

    nios entre 15 y 18 0,21 0,18 -2,799

    zona urbana 0,80 0,86 5,845

    decil ingreso 4,76 5,40 8,239

    pobre==1 0,24 0,21 -2,815

    escolaridad 7,33 8,43 8,786

    estado civil 0,76 0,71 -4,161

    sexo jefe 0,78 0,77 -0,771

    propiedad casa 0,63 0,47 -11,135

    edad 47 44,86 -4,094

    uniparental 0,24 0,29 4,161

    N 2648 2561

    Variables 1996 Test t

    Medias

    Fuente: Construccin propia en base a encuesta panel Casen Variable dependiente: Responde de nuevo en 2006 ==1 Uso de pesos transversales

    Podemos ver que sistemticamente salen de la muestra, personas con variables asociadas a un mayor nivel de ingreso, es as como observamos un menor tamao familiar, mayores niveles de ingreso y menores ndices de pobreza, de igual forma hay ms porcentaje de personas con contrato y viviendo en zonas urbanas.

    2) Hacer un modelo logit o probit para calcular la probabilidad de respuesta. Con estos factores se determina la probabilidad predicha de respuesta para el ao 1996.

  • Tabla 5: Modelo Probit Para determinar probabilidad de respuesta en aos 1996 y 2006.

    nmero personas 0,016 0,48

    ypc 0,000 0,02

    contrato del jefe 0,171 0,02

    nios entre 15 y 18 0,315 0,00

    zona urbana -0,134 0,09

    escolaridad -0,027 0,00

    propiedad casa 0,485 0,00

    edad 0,005 0,01

    region 7 -0,125 0,29

    region 8 -0,267 0,02

    region 13 -0,286 0,01

    Pseudo R2

    Obs 5209

    resp9606 dF/dx P>z

    0,0624

    Fuente: Construccin propia en base a encuesta panel Casen Variable dependiente dicotmica. Responde de nuevo en 2006 ==1

    3) Con esta estimacin predicha se procede a calcular el factor de ajuste, que ser

    uno dividido por la probabilidad de respuesta (se determina una cota mnima para la probabilidad de respuesta, las ms usadas son 0.3 y 0.5).

    4) Para la primera ola, se corrigen los factores de expansin de corte transversal

    para el primer ao, multiplicando por el factor de ajuste (uno dividido en la probabilidad de respuesta).

    5) Para la segunda ola se repite el mismo proceso, pero el factor de expansin a

    ajustar es el longitudinal calculado en la primera ola.

    6) Chequear que problema se soluciona. Esto se hace comparando medias en periodo inicial usando pesos del ao inicial para toda la muestra inicial, con la muestra para los que vuelven a responder con los pesos del ao respectivo y con la muestra para los que vuelven responden pero con los pesos corregidos. En la tabla 6 se encuentra la comparacin de medias entre no usar correccin y usar pesos corregidos, se presentan dos alternativas de correccin, una correccin propia y la correccin usada en la encuesta panel que se encuentra incorporada en los pesos longitudinales.

    Tabla 6: Comparacin resultados sin correccin,

    Correccin propia y correccin de Casen panel (pesos longitudinales)

    w=1996 w=2006 w=2006 w=2006 Sin Con Longitudinal

    s/correccin c/correccin longitudinal Correccin Correccin

    nmero personas 3,95 4,18 3,99 3,96 -5,58 -0,97 -0,13

    ypc 109.551 95.833 101.043 105.900 4,70 2,83 1,21

    contrato jefe 0,37 0,45 0,37 0,39 -6,27 0,23 -1,65

    nios entre 15 y 18 0,62 0,72 0,19 0,19 -8,58 42,23 42,99

    zona urbana 0,89 0,88 0,88 0,88 0,70 1,02 1,05

    decil ingreso 5,89 5,58 5,68 5,88 4,53 2,98 0,04

    pobre==1 0,17 0,19 0,22 0,20 -2,40 -5,96 -3,28

    escolaridad 9,10 9,08 8,78 7,06 0,17 2,96 18,92

    estado civil 0,75 0,81 0,75 0,72 -6,57 -0,68 2,21

    sexo 0,78 0,82 0,78 0,77 -4,94 -0,11 1,03

    propiedad casa 0,55 0,56 0,56 0,57 -0,85 -1,51 -2,32

    edad 45 44 46,01 47,48 4,33 -1,43 -5,10

    5209 2648 2648 2648

    Test diferenciaMedias 1996

    Fuente: Elaboracin propia en base a encuesta Casen Panel.

  • Analizando la tabla 6, se observa que los pesos longitudinales logran corregir en gran medida los problemas de atricin, especialmente para la variable ingreso, por lo tanto las estimaciones de movilidad de ingreso y matrices de transicin de pobreza no estarn sesgadas.

    7) Movilidad.

    Los resultados mostrados a continuacin se realizan para todas las personas que fueron entrevistadas los tres aos por la encuesta, esto asciende a un total de 10287 personas, que son representativas de una poblacin de 8.187.374 personas. Se usan los pesos longitudinales para el periodo 1996-2006, los cuales corrigen por muestra representativa y atricin.

    1) Salida y Entrada a Pobreza.

    La pobreza dura o crnica, es decir las personas que permanecieron en estado de pobreza en los tres periodos es de 4,2%. Por su parte, la pobreza temporal, es decir, las personas que fueron pobres en alguno de los tres periodos es un 31,2%. En la tabla 7 se muestra la matriz de entrada y salida de la pobreza para los tres aos de la encuesta.

    Tabla 7: Estados de Pobreza.

    Aos 1996, 2001 y 2006. 1996-2001-2006

    P P P 4,2%

    P P NP 6,9%

    P NP P 1,8%

    P NP NP 10,7%

    NP P P 1,5%

    NP P NP 7,2%

    NP NP P 3,1%

    NP NP NP 64,7%

    TOTAL 100% Fuente: Construccin propia en base a encuesta Casen panel.

    Tabla 8: Entrada y Salida de Pobreza. Aos 1996, 2001 y 2006.

    1996-2001 2001-2006 1996-2006

    P P 11,1% 5,7% 5,9%

    P NP 12,5% 14,1% 17,6%

    NP P 8,7% 4,9% 4,6%

    NP NP 67,8% 75,4% 71,8%

    100,0% 100,0% 100,0% Fuente: Construccin propia en base a encuesta Casen panel.

    2) Matrices de Transicin de Pobreza.

    La tabla 8 muestra las matrices de transicin entre estados de pobreza

    para las distintas olas que se pueden construir en base a la encuesta Casen Panel. Tenemos, as las dos olas que comprenden el efecto 1996-2001 y 2001-2006, adems est el efecto total entre 1996-2006.

  • Tabla 9: Matrices de Transicin de Pobreza.

    Aos respectivos

    2001

    1996 NP P Total Fila

    NP 88,7% 11,3% 76,5%

    P 53,0% 47,0% 23,5%

    Total Columna 80,3% 19,7% 100,0%

    2006

    2001 NP P Total Fila

    NP 93,9% 6,1% 80,3%

    P 71,3% 28,7% 19,7%

    Total Columna 89,5% 10,5% 100,0%

    2006

    1996 NP P Total Fila

    NP 94,0% 6,0% 76,5%

    P 74,8% 25,2% 23,5%

    Total Columna 89,5% 10,5% 100,0% Fuente: Construccin propia en base a encuesta Casen panel.

    3) Movilidad de Ingresos.

    Tabla10: Matrices de Movilidad de Ingresos. Aos respectivos

    1 2 3 4 5 6 7 8 9 10

    1 3,41 2,75 1,11 0,85 0,61 0,36 0,25 0,27 0,08 0,04 9,74

    2 1,72 1,62 2,21 1,39 0,53 0,80 0,33 0,31 0,17 0,02 9,11

    3 1,34 1,70 1,42 1,63 1,60 1,28 0,51 0,26 0,21 0,04 9,98

    4 1,16 1,10 1,80 2,01 1,10 0,64 1,25 0,80 0,78 0,07 10,72

    5 0,52 0,51 0,68 1,46 1,53 1,66 0,86 1,45 0,47 0,32 9,47

    6 0,63 0,82 1,32 0,63 0,69 1,22 1,38 0,81 1,88 0,36 9,74

    7 0,44 0,42 0,52 1,24 1,25 1,37 1,43 1,54 0,68 0,59 9,50

    8 0,08 0,28 0,59 0,71 0,99 0,85 1,67 1,93 1,72 1,10 9,91

    9 0,28 0,29 0,14 0,33 1,09 0,82 1,59 1,33 2,15 2,45 10,47

    10 0,24 0,10 0,18 0,04 0,85 0,76 1,14 0,99 1,86 5,19 11,36

    9,83 9,59 9,98 10,31 10,26 9,76 10,41 9,69 10,00 10,17 100

    ypc1996

    ypc2001

    1 2 3 4 5 6 7 8 9 10

    1 3,75 2,42 1,01 0,91 0,57 0,29 0,38 0,37 0,21 0,27 10,17

    2 1,54 2,17 1,20 1,50 0,84 0,49 0,22 0,87 0,07 0,19 9,08

    3 1,04 1,37 1,53 0,91 1,25 1,54 0,49 0,23 0,10 0,20 8,66

    4 0,88 1,53 1,54 1,09 1,35 0,94 1,00 0,41 0,23 0,09 9,05

    5 1,06 0,96 0,88 1,56 1,40 1,52 0,94 0,53 0,39 0,12 9,36

    6 0,59 0,39 0,65 1,57 1,18 1,06 1,41 0,51 1,42 0,25 9,03

    7 0,27 0,57 1,44 0,68 1,60 1,10 1,07 1,00 2,22 0,28 10,26

    8 0,23 0,32 0,72 0,60 0,79 1,23 1,93 2,03 0,94 0,62 9,41

    9 0,13 0,08 0,27 0,75 0,43 0,87 1,74 1,58 1,93 3,44 11,22

    10 0,17 0,09 0,44 0,43 0,45 0,64 0,71 2,26 2,57 6,01 13,76

    9,66 9,90 9,68 10,00 9,85 9,69 9,90 9,81 10,06 11,46 100

    ypc2001

    ypc2006

  • 1 2 3 4 5 6 7 8 9 10

    1 3,29 1,69 1,23 0,97 0,81 0,37 0,27 0,87 0,25 0,01 9,76

    2 1,62 1,65 1,80 0,98 1,06 0,60 0,33 0,13 0,19 0,13 8,49

    3 1,23 2,01 0,96 1,35 0,69 0,85 0,62 0,38 0,84 0,07 9,00

    4 0,75 1,17 1,11 1,21 2,22 0,92 0,77 0,39 1,01 1,10 10,65

    5 0,59 0,71 0,96 1,17 0,99 1,30 1,51 1,06 0,53 0,28 9,08

    6 0,54 1,47 0,68 0,97 0,72 1,02 1,33 0,87 0,65 1,30 9,57

    7 0,39 0,49 0,89 1,49 0,95 1,15 1,47 0,96 0,79 0,45 9,05

    8 0,33 0,46 0,50 0,72 1,18 1,50 1,18 1,51 1,29 1,45 10,10

    9 0,34 0,11 0,40 0,55 0,74 1,83 1,61 1,85 2,31 1,97 11,71

    10 0,58 0,15 1,15 0,60 0,49 0,14 0,82 1,79 2,19 4,70 12,61

    total colum 9,66 9,90 9,68 10,00 9,85 9,69 9,90 9,81 10,06 11,46 100

    ypc1996

    ypc2006

    total fila

    Fuente: Construccin propia en base a encuesta Casen panel.

    4) Matrices de transicin de Ingresos.

    Tabla11: Matrices de Movilidad de Ingresos segn decil de ingreso. Permanencia, mejora y disminucin.

    1996-2001 2001-2006 1996-2006

    1 35% 37% 34%

    2 18% 24% 19%

    3 14% 18% 11%

    4 19% 12% 11%

    5 16% 15% 11%

    6 13% 12% 11%

    7 15% 10% 16%

    8 19% 22% 15%

    9 21% 17% 20%

    10 46% 44% 37%

    Total 22% 21% 18%

    Porcentaje de Permanencia

    1996-2001 2001-2006 1996-2006

    1 65% 63% 66%

    2 63% 59% 61%

    3 55% 55% 53%

    4 43% 44% 60%

    5 50% 37% 51%

    6 58% 52% 54%

    7 30% 34% 24%

    8 28% 17% 27%

    9 23% 31% 17%

    10

    Total 42% 39% 42%

    Porcentaje de Mejora en Ingreso

  • 1996-2001 2001-2006 1996-2006

    1

    2 19% 17% 19%

    3 30% 28% 36%

    4 38% 44% 28%

    5 34% 48% 38%

    6 42% 48% 46%

    7 55% 55% 59%

    8 52% 62% 58%

    9 56% 52% 63%

    10 54% 56% 63%

    Total 38% 41% 41%

    Porcentaje de Disminucin en Ingreso

    Fuente: Construccin propia en base a encuesta Casen panel.

    5) Grficos.

    El grfico 1, representa la movilidad de ingresos a travs de los deciles de ingreso per cpita. Ac podemos ver que los deciles con ms permanencia, son el primer y ltimo decil de ingresos. En efecto, el 34% de las personas que estuvieron en el primer quintil el ao 1996, siguen perteneciendo a este el 2006, la situacin es an ms drstica para el decil 10, ya que cerca del 45% de las personas que estuvieron en este decil en 1996, contina all el 2006.

    Grafico1: Movilidad de Ingresos. Segn situacin de aumento, igualdad o disminucin de decil.

    Movilidad de Ingresos 1996-2006

    0%

    10%

    20%

    30%

    40%

    50%

    60%

    70%

    1 2 3 4 5 6 7 8 9 10

    Quintiles de ypc del hogar

    Po

    rce

    nta

    je

    Igual

    Aumenta

    Disminuye

    Fuente: Construccin propia en base a encuesta Casen panel.

  • DATOS DE PANEL.

    I. Introduccin.

    Las bases de datos de panel se caracterizan por realizar un seguimiento a las

    unidades de anlisis (personas, pases, empresas) a travs del tiempo. Esto presenta numerosas ventajas por sobre las bases de corte transversal, pero tambin algunos problemas inherentes a estas bases.

    La principal ventaja de datos de panel es que al incorporar la variable tiempo,

    tenemos ms observaciones que en una base de corte transversal, y adems permiten controlar por heterogeneidad, ya sean efectos individuales especficos o efectos temporales.

    Modelo general:

    ititit XY

    El trmino de error puede descomponerse como:

    ittiit vu

    Donde, el primer trmino corresponde a efectos no observables que difieren

    entre las unidades de estudio, pero no en el tiempo, como ejemplo puede ser la habilidad, capacidades empresariales, etc. El segundo trmino representa efectos que varan en el tiempo pero no entre los individuos, por ejemplo, periodos de sequa. El ltimo trmino vendra a representar un error completamente aleatorio.

    Ventajas Datos de Panel: 1) Permite controlar por heterogeneidad no observable. 2) Entrega ms informacin, ms variabilidad y menos colinealidad. 3) Mejor para estudiar la dinmica del ajuste. 4) Permite medir ms efectos. Desventajas Datos de Panel: 1) Problemas/ Costos de diseo y recoleccin de datos. 2) Error de medicin, puede agravar el problema de sesgo. 3) Problemas de Seleccin: Autoseleccin, no respuesta, atricin. 4) Paneles muy cortos (disminuye la eficiencia)

    II. Estimacin.

    Cuando se trabaja en base a series de corte longitudinal, aparecen dos variables relevantes: el tiempo y los individuos, en base a estas dos variables se pueden establecer dos tipos de modelos: uno que contiene heterogeneidad slo a nivel de individuos (one-way error component) y otro que contiene heterogeneidad a nivel individual y temporal (two-way error component model). Cada modelo se puede estimar por efectos fijos o efectos aleatorios.

  • ONE WAY ERROR COMPONENT MODEL

    Modelo: ititit Xy `

    itiit vu

    a) Modelo con Efectos Fijos: Se asume que iu , es un parmetro fijo a ser

    determinado, mientras que itv es una variable aleatoria. Este modelo es til

    cuando estamos trabajando en toda la muestra que nos interesa y no queremos extrapolar resultados a otras muestras (ejemplo: trabajar con un conjunto de pases OECD y no extrapolar los resultados al resto de los pases) En forma matricial:

    vZZvZXy uiNT

    Esto es similar a colocar una Dummy por cada individuo, lo que puede

    no ser muy eficiente, ya que tendremos (N-1) dummy que estimar, ms la constante y beta, adems de involucrar problemas para invertir las matrices. En general, el inters estar centrado en el parmetro beta y slo vamos a querer controlar por heterogeneidad pero no estimarla. Una forma de hacer esto y simplificar el proceso es estimar los parmetros within, que consiste en estimar el modelo en desviaciones de media individuales, para esto se aplica la matriz Q que genera las desviaciones de media para cada individuo.

    )`()`(~ 1 QyXQXXQvQXQy

    b) Modelo con Efectos Aleatorios: En este caso, se considera que tanto los u

    como los v, son variables aleatorias. Bajo este supuesto y asumiendo que u y v son independientes, la varianza del error va a ser la suma de las varianzas de u y v. El problema de esto, es que, a pesar de que las varianzas son homocedsticas, hay correlacin serial al interior de cada unidad de corte transversal, dado que cada efecto individual perdura en el tiempo.

    En este caso lo que corresponde es estimar el modelo por mnimos cuadrados generalizados factibles (FGLS) el cual es equivalente a la combinacin lineal de los estimadores within (en desviaciones de media) y between (en promedios)

    betweenwithinGLS ww ~~

    21

    TWO WAY ERROR COMPONENT MODEL En este caso, la heterogeneidad es a nivel individual y temporal, es por esto

    que el error ahora incorpora estos dos componentes:

    Modelo: ititit Xy `

    ittiit vu

  • Expresando en forma matricial tenemos:

    vZZZyit

    a) Modelo con Efectos Fijos: En este caso tanto iu como t son parmetros fijos

    a ser estimados. Esto se hace mediante el estimador de within, que queda un poco ms extenso ya que hay que calcular las desviaciones de media respecto a individuo, tiempo y ambas:

    withintiittiittiit vvvvxxxxyyyy ~

    )()()( ............

    b) Modelo con Efectos Aleatorios: En este caso tanto iu como t son variables

    aleatorias. El estimador es una combinacin de los estimadores within, between y between de periodos:

    CBwGLS www ~~~

    321

    III. Otras consideraciones.

    En la seccin anterior se ha descrito como usar las bases de panel para realizar ajustes segn heterogeneidad o variables no observables. A continuacin se describen 3 problemas que surgen en las estimaciones, tanto en bases con datos de corte transversal como longitudinal.

    Error de Medicin. Si hay errores de medicin, el estimador OLS estar sesgado (si error de

    medicin es en variable independiente) y el estimador within dejar de ser consistente y puede tener sesgo. En bases cross section el error de medicin trae sesgo de atenuacin ms sesgo de variable omitida. En el caso de datos de panel slo hay sesgo de atenuacin.

    Sea una variable que es reportada con error:

    )1(2)()( 2*

    *

    *

    wxVarxVar

    xx

    xx

    itit

    ititit

    ititit

    a) Si errores de medicin no estn correlacionados ( =0), datos de panel

    tendrn mayor varianza, producida por una mayor varianza en el error de medicin.

    b) Si errores estn perfectamente correlacionados en el tiempo ( =1),

    entonces al estimar usando datos de panel, se elimina el error de medicin.

    Heterocedasticidad.

    La heterocedasticidad se produce cuando la varianza de los errores no es constante. Como resultado se obtienen estimadores consistentes pero no eficientes y los errores estndar estarn sesgados. El procedimiento es estimar el modelo mediante GLS y computar errores estndares robustos. La eficiencia de

  • este estimador est sujeto a una buena estimacin de la matriz de varianzas que es usada para estimar GLS. Autocorrelacin.

    Esto ocurre cuando los errores estn correlacionados intertemporalmente y/o no son independientes. Al ignorar este problema, se obtienen estimadores consistentes pero ineficientes, al igual que errores estndares sesgados. Lo que corresponde es establecer patrones de autocorrelacin en el error (AR1, AR2, MA1, etc)

  • COMANDOS STATA Y ENCUESTA PANEL CASEN.

    En esta seccin se ejemplifica el uso de una base de datos de panel en stata, para esto se hace uso de la encuesta panel casen 1996-2006 para discutir el tratamiento de los posibles problemas que pueden aparecer al manipular los datos. En particular se evala la ecuacin de salarios propuesta por mincer. El archivo a ocupar se llama panelmincer.dta.

    Para trabajar con bases de panel, es necesario informarle a stata que la base tiene

    formato panel. Para esto se aplica el comando: tsset panelvar timevar. La variable panelvar es la variable que identifica a las unidades que se van a seguir, en nuestro caso son individuos, por lo que usamos idpersona, la variable timevar son los periodos para los cuales tenemos observaciones, en nuestro caso es la variable aos. Por ltimo se puede explicitar el periodo de espaciado entre cada observacin, esto se hace con la opcin delta, en nuestro caso, las observaciones son recolectadas cada 5 aos. As, el comando que usamos es:

    tsset idpersona year, delta(5) Una vez que tenemos la base especificada como panel, podemos empezar a

    estimar el modelo. La manera ms sencilla de analizar datos tipo panel es la estimacin pooled, que estima por OLS sin considerar las dimensiones de tiempo de la base. Para que esta estimacin no est sesgada, es necesario que no exista correlacin entre el trmino de error y las variables independientes. El comando a usar es el mismo que se usa siempre reg.

    xi: reg lnw esc expp expp2 [w=expr]

    Tabla 12: Estimacin Ecuacin de Mincer por Pooled OLS.

    Number of obs = 10239 R-squared = 0.1243

    F( 3, 92) = 80.40

    Prob > F = 0.000 Root MSE = 1.6664

    lnw Coef. Std. Err. z P>z [95% Conf. Interval]

    esc .1813557 .0119297 15.20 0.000 .1576622 .2050491

    expp .0152086 .0065522 2.32 0.022 .0021953 .0282218

    expp2 .0000915 .0001164 0.79 0.434 -.0001396 .0003227 Fuente: Construccin propia en base a encuesta Casen panel

    En la tabla 12, se muestran los resultados de la estimacin. Podemos ver que la

    educacin tiene un retorno de un 18%. El problema de usar OLS en datos de panel, es que hay relaciones temporales que no se aprovechan al ignorar la dimensin tiempo.

  • a) Heterogeneidad. La ecuacin de salarios de mincer plantea evaluar los determinantes y su impacto

    sobre el salario pagado, algunas de las variables relevantes son la escolaridad y la experiencia. Sin embargo, tambin est la variable habilidad que est fuertemente correlacionada con la variable escolaridad, debido a que alumnos ms hbiles perciben menos costos asociados a la educacin y tienden a educarse ms. La variable habilidad es difcil de medir y no est claro que las mediciones existentes, como el IQ, sean una buena Proxy. Adems tiene la propiedad de que es especfica para cada persona, por lo cual nos incorpora heterogeneidad en la estimacin.

    El hecho de no contar con la variable habilidad y por lo tanto omitirla en nuestra

    ecuacin, nos estara generando un sesgo de omisin de variable relevante, lo que nos llevara a sobreestimar el efecto de la escolaridad en salarios (asumiendo que habilidad y escolaridad se correlacionan positivamente)

    Para eliminar el sesgo anterior, es posible eliminar el efecto de la habilidad

    haciendo un modelo en diferencias, en donde, si asumimos que la habilidad es constante, el efecto de la habilidad se cancela y se elimina el sesgo.

    Primero estimaremos un modelo de efectos fijos, es decir, asumimos que nuestra

    muestra es el total poblacional con el que queremos trabajar y no vamos a extrapolar nuestros resultados a otras muestras o poblaciones. El comando a usar es:

    xtreg lnw esc expp expp2 [w=expr], fe robust

    Tabla 13: Estimacin Ecuacin de Mincer por EF.

    Fixed-effects (within) regression Number of obs=10239

    Group variable: idpersona Number of groups=5111

    R-sq: within = 0.2634 Obs per group: min=1

    between = 0.0142 avg=2.0

    overall = 0.0015 max=3

    F(3,5125)= 115.43

    corr(u_i, Xb) = -0.8088 Prob > F=0.000

    lnw Coef. Std. Err. z P>z [95% Conf. Interval]

    esc .2210334 .0662783 3.33 0.001 .0910995 .3509673

    expp .184119 .0217013 8.48 0.000 .1415752 .2266628

    expp2 -.0004332 .000391 -1.11 0.268 -.0011998 .0003333

    sigma_u 2.73

    sigma_e 1.40

    rho .791 (fraction of variance due to u_i)

    F test that all u_i=0: test that all u_i=0: F(6876, 3481) = 1.83 Prob>F=0.00 Fuente: Construccin propia en base a encuesta Casen panel

    En la tabla 13, vemos el resultado de la estimacin, observamos que el retorno cae

    levemente. El modelo de EF, considera que la variable habilidad no es aleatoria, sino que es un parmetro y debe ser estimado para cada individuo. Si, por el contrario asumimos que la habilidad tambin es una variable aleatoria, entonces debemos estimar el modelo por efectos aleatorios:

  • En la tabla 14, vemos los resultados de la estimacin por EA. Podemos ver que el cuociente que representa el retorno de la educacin es un 20% y es menor al valor de la estimacin EF.

    xi: xtreg lnw esc expp expp2, re robust

    Tabla 14: Estimacin Ecuacin de Mincer por EA.

    Random-effects GLS regression

    Group variable: idpersona Number of obs = 10239

    Number of groups = 5111

    R-sq: within = 0.1645 Obs per group: min = 1

    between = 0.1129 avg = 2.0

    overall = 0.1119 max = 3

    Wald chi2(3) = 1259

    Random effects u_i ~ Gaussian Prob > chi2 = 0.0000

    corr(u_i, X) = 0 (assumed)

    lnw Coef. Std. Err. z P>z [95% Conf. Interval]

    esc .1988463 .0056225 35.37 0.000 .1878264 .2098662

    expp .0176501 .0048573 3.63 0.000 .0081299 .0271703

    expp2 .0000964 .0000805 1.20 0.231 -.0000613 .0002541

    sigma_u .968

    sigma_e 1.324

    rho .348 (fraction of variance due to u_i) Fuente: Construccin propia en base a encuesta Casen panel

    Para comparar entre estas tres estimaciones, hay distintos test. Para elegir entre pooled y aleatorios se usa el test de breusch y pagan, mediante el comando xttest0 aplicado despus de hacer efectos aleatorios. La hiptesis nula es la existencia de efectos aleatorios, si vemos el pvalue, nos damos cuenta que no rechazamos la existencia de efectos aleatorios, por lo cual, un modelo de efectos aleatorios es superior al pooled.

    xtreg lnw esc expp expp2 [w=expr], fe robust estimates store fixed xtreg lnw esc expp expp2, re robust xttest0

    Tabla 15: Test BP Para testear existencia de efectos aleatorios.

    Breusch and Pagan Lagrangian multiplier test for random effects

    lnw[idpersona,t] = Xb + u[idpersona] + e[idpersona,t]

    Estimated results:

    Var sd = sqrt(Var)

    lnw 2.88 1.70

    e 1.75 1.32

    u .94 .97

    Test: Var(u) = 0

    chi2(1) = 1.31

    Prob > chi2 = 0.25 Fuente: Construccin propia en base a encuesta Casen panel

  • Para elegir entre estimar un modelo de efectos fijos y el pooled, se usa el test F

    que sale al final de la estimacin por efectos fijos, este modelo testea que todos los coeficientes individuales del modelo son cero, si rechazamos la hiptesis, entonces es mejor usar efectos fijos, tal como nos sucede en este ejemplo.

    Ya hemos visto que tanto el modelo de efectos aleatorios como el de efectos fijos

    son superiores a la estimacin pooled. Para elegir el mejor modelo entre efecto fijo o aleatorio se utiliza el test de haussman. Este test se basa en la correlacin existente entre la variable individual (habilidad) y las X, el modelo de efectos aleatorios asume que no hay correlacin, si esto no se cumple, entonces los parmetros estarn sesgados y habr diferencia entre los modelos de efectos fijos y aleatorios. El test de haussman evala la diferencia entre estos dos estimadores, si la diferencia es significativa, entonces hay evidencia a favor de usar efectos fijos. Este test se aplica despus de las estimaciones.

    xi: xtreg lnw esc expp expp2 [w=expr], fe robust estimates store fixed xi: xtreg lnw esc expp expp2 , re robust hausman fixed

    Tabla 16: Test Hausman. Para testear efecto fijo versus aleatorio.

    (b) (B) (b-B) sqrt(diag(V_b-V_B))

    fixed . Difference S.E.

    esc .2210334 .1988463 .0221871 .0660394

    expp .184119 .0176501 .1664689 .0211507

    expp2 -.0004332 .0000964 -.0005296 .0003826

    b= consistent under Ho and Ha; obtained from xtreg

    B =inconsistent under Ha, efficient under Ho; obtained from xtreg

    Coefficients

    Prob>chi2 = 0.0000

    Test: Ho:difference in coefficients not systematic

    chi2(3) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 225.27

    Fuente: Construccin propia en base a encuesta Casen panel

    En la Tabla 16, vemos que la hiptesis nula se rechaza, por lo tanto hay

    diferencias sistemticas entre los dos estimadores, por lo tanto, es mejor usar efectos fijos.

    Si lo que queremos es correr un modelo con efectos temporales, basta con incluir

    variables Dummy por ao, por ejemplo para el modelo de efectos fijos: xi:xtreg lnw esc expp expp2 i.year [w=expr], fe robust

  • Tabla 17: Estimacin Two Way Fixed Effect

    Fixed-effects (within) regression Number of obs= 10239

    Group variable: idpersona Number of groups=5111

    R-sq: within = 0.3460 Obs per group: min =1

    between = 0.13 avg=2.0

    overall = 0.2140 max=3

    F(5,5123)=85.56

    corr(u_i, Xb) = -0.0523 Prob > F=0.0000

    lnw Coef. Std. Err. z P>z [95% Conf. Interval]

    esc .1072464 .1060083 1.01 0.312 -.1005751 .315068

    expp .0503409 .085521 0.59 0.556 -.1173169 .2179986

    expp2 -.0003563 .0003879 -0.92 0.358 -.0011168 .0004042

    _Iyear_2001 -.1313521 .4179658 -0.31 0.753 -.9507435 .6880394

    _Iyear_2006 1.291 .8419079 1.53 0.125 -.359038 2.941

    sigma_u 1.43

    sigma_e 1.32

    rho .54 (fraction of variance due to u_i)

    F test that all u_i=0: test that all u_i=0: F(5110, 5123) = 1.63 Prob>F=0.00 Fuente: Construccin propia en base a encuesta Casen panel

    Con este modelo obtenemos un 10% de rentabilidad de la educacin, sin embargo

    los coeficientes temporales dan no significativos, al igual que la escolaridad, lo que nos puede estar indicando que este no es la mejor especificacin.

    b) Autocorrelacin.

    An si especificamos bien el modelo en trminos de heterogeneidad. Puede ocurrir que los errores no sean independientes entre s. Para testear la presencia de autocorrelacin se usa un test desarrollado por wooldridge. La hiptesis nula es la no existencia de autocorrelacin.

    xtserial lnw esc expp expp2

    Tabla 18: Test Wooldridge. Para testear autocorrelacin.

    Wooldridge test for autocorrelation in panel data

    H0: no first order autocorrelation

    Prob > F = 0.0008

    F( 1, 1824) = 11.272

    Fuente: Construccin propia en base a encuesta Casen panel

    En la tabla 18 se encuentran los resultados del test, segn el pvalue se rechaza la

    hiptesis de no autocorrelacin, por lo tanto tenemos la presencia de autocorrelacin de orden uno en los datos.

    Si slo tenemos problemas de autocorrelacin, hay un comando en stata que

    permite incluir rezagos del error en la especificacin. As, el modelo quedara: xi:xtregar lnw esc expp expp2 , fe

  • c) Heterocedasticidad

    La heterocedasticidad ocurre cuando los errores no se distribuyen con la misma varianza. El test a usar en este caso es el test de Wald, el cual evala la hiptesis nula de que las varianzas son iguales. Para aplicar este test debemos ejecutar el comando xttest3 despus de hacer la regresin por efectos fijos.

    xtreg lnw esc expp expp2, fe xttest3

    Tabla 19: Test de Wald para Heterocedasticidad.

    Modified Wald test for groupwise heteroskedasticity

    H0: sigma(i)^2 = sigma^2 for all i

    in fixed effect regression model

    chi2 (5111) = 5.1e+35

    Prob>chi2 = 0.0000 Fuente: Construccin propia en base a encuesta Casen panel

    En la tabla 20, vemos que si existe un problema de heterocedasticidad que es

    necesario corregir. Los problemas de autocorrelacin y heterocedasticidad pueden solucionarse conjuntamente haciendo estimaciones por FGLS.

    Con problemas de heterocedasticidad y autocorrelacion: xtgls lnw esc expp expp2, panels (hetero) corr(ar1) force

    Tabla 20: Estimacin Ecuacin de Mincer usando FGLS corrigiendo por Autocorrelacin y Heterocedasticidad.

    Cross-sectional time-series FGLS regression

    Coefficients: generalized least squares

    Panels: heteroskedastic

    Correlation: common AR(1) coefficient for all panels (0.6576)

    Estimated covariances = 1931 Number of obs= 4923

    Estimated autocorrelations = 1 Number of groups=1931

    Estimated coefficients = 6 Obs per group: min=2

    avg=2.549

    max=3

    Wald chi2(5)=186771.60

    Prob > chi2=0.000

    lnw Coef. Std. Err. z P>z [95% Conf. Interval]

    esc .1245581 .0012612 98.76 0.000 .1220861 .1270301

    expp .0190296 .0015922 11.95 0.000 .015909 .0221503

    expp2 .0001559 .0000329 4.74 0.000 .0000915 .0002204

    _Iyear_2001 .1856907 .0071168 26.09 0.000 .1717421 .1996394

    _Iyear_2006 1.803 .0093047 193.85 0.000 1.785 1.821

    _cons 4.803 .023023 208.62 0.000 4.758 4.848 Fuente: Construccin propia en base a encuesta Casen panel

    Comparando las tablas de estimaciones vemos que ignorando la temporalidad y estimando por OLS obtenemos una rentabilidad de la educacin del 22%, una vez que se hacen todas las correcciones y aprovechando los datos de panel, obtenemos

  • una rentabilidad del 12% que tcnicamente est controlando por no observables individuales como la habilidad y por problemas inherentes a los datos como heterocedasticidad y autocorrelacin.