econometria250-1_grupo26
-
Upload
julio-galarraga -
Category
Documents
-
view
18 -
download
1
description
Transcript of econometria250-1_grupo26
REPORTE
Encuesta - Junio 2013
Raúl Fernández
Julio Galárraga
_________________________________________________________________________
Econometría I
Profesor: Omar Bello
15 de Noviembre de 2013
CONTENIDO
INTRODUCCIÓN..............................................................................................................................3
1. MARCO CONCEPTUAL..........................................................................................................3
2. DATOS......................................................................................................................................4
3. CONOCIMIENTO GENERAL PREVIO..................................................................................4
Participación laboral por sexo y estrato........................................................................................4
Ingreso laboral real promedio.......................................................................................................5
Educación promedio de la PEA por sexo (personas ocupadas y desocupadas).............................7
4. MODELOS Y ESTIMACIONES...............................................................................................9
Modelo básico a ser estimado........................................................................................................9
Especificaciones estimadas..........................................................................................................10
Contrastes....................................................................................................................................12
Escogencia del mejor modelo.......................................................................................................14
5. CONCLUSIONES...................................................................................................................16
6. BIBLIOGRAFÍA......................................................................................................................16
ANEXOS.........................................................................................................................................18
INTRODUCCIÓN
El objetivo de este trabajo es obtener el coeficiente de semi-elasticidad de la educación de
la regresión minceriana de los individuos que trabajan, segregando a estos por sexo. Esto
constituye un aspecto muy importante, ya que el corazón de la desigualdad social es la
deficiente distribución de riquezas en un país, donde esta última a su vez está determinada
por los ingresos recibidos por los individuos. La hipótesis a comprobar será que aquellas
personas que poseen mayor educación sí reciben mayores ingresos, además de verificar que
efectivamente existe discriminación por sexo en este tema.
Para investigar lo anterior, se realizará un proyecto empírico utilizando como base los
conocimientos aprendidos del curso de Econometría. La base de datos que se utilizará será
la Encuesta de Ocupación y Desocupación del Centro de Microdatos del Departamento de
Economía de la Universidad de Chile de Junio del 2013.
Este trabajo se encuentra dividido en 4 secciones, la primera comprende el marco
conceptual en el que se basan las estimaciones, la segunda corresponde a una breve
descripción de los datos y variables empleadas. El tercer apartado muestra estadísticas
generales que brindan un marco de conocimientos previo al cuarto inciso, donde se realizan
regresiones y contrastes para estimar un modelo que permita comprobar la hipótesis
planteada y proporcione el coeficiente de semi-elasticidad del ingreso a la educación.
1. MARCO CONCEPTUAL
Este informe basará su proceso de análisis en el modelo de regresión de Jacob Mincer, la
cual expresa la relación dependiente del ingreso con los años de educación y los años de
experiencia potencial. Mediante la aplicación del método econométrico de Mínimos
Cuadrados Ordinarios se estimarán regresiones que permitan obtener la semi-elasticidad del
ingreso a los años de educación. Adicionalmente, se realizarán algunas pruebas para
asegurar la significancia de los coeficientes y los modelos, estos emplearán el contraste de
heterocedasticidad de White y el Variance Inflation Factor para temas de
multicolinealidad.
2. DATOS
como se mencionó previamente, el conjunto de datos utilizados para las estimaciones
realizadas fue obtenido de la “Encuesta de Ocupación y Desocupación” realizada por el
Centro de Microdatos de la Facultad de Economía y Negocios de la Universidad de Chile.
Esta encuesta se realiza mensualmente y se enfoca en estudiar el mercado del trabajo
chileno en el Gran Santiago.
La base de datos empleada para este trabajo en particular posee 10195 observaciones y
comprende el período de Junio del 2013. Originalmente esta base cuenta con 59 variables
cuantitativas y cualitativas, pero para las estimaciones tanto estadísticas como
econométricas se eliminaron algunas variables y se generaron nuevas, por lo que la base de
datos modificada contiene 39 variables1.
3. CONOCIMIENTO GENERAL PREVIO
Los sujetos de estudio del presente trabajo son personas de la Región Metropolitana de
Chile pertenecientes a 34 comunas. El 51,41% de las personas encuestadas son de género
femenino y el 48,59% del masculino. Dentro del mercado laboral en general, el 6,67% de
las personas se encuentran desempleadas; por otro lado, se identificó que el 54,03% de los
consultados no pertenece a la Población Económicamente Activa (PEA) y el restante
45,97% si pertenece, dentro de las personas económicamente activas el 93,33% se
encuentran empleadas2.
Participación laboral por sexo y estrato
La participación laboral femenina general muestra que el 37,36% de las mujeres se
encuentra trabajando o en busca de trabajo, mientras que la participación laboral masculina
en general se encuentra en el orden del 53,29%3, este análisis se amplía por estrato en el
gráfico presentado a continuación.
1 La descripción de las variables se encuentra en el Anexo 1.2 Para la generación de la PEA se tomó en cuenta las personas mayores de 14 años y menores de 653 La PEA femenina se generó con personas mayores de 14 años y menores a 60 años, mientras que la PEA masculina tomó en cuenta a los menores a 65 años
Gráfico 1 – Participación Laboral Femenina y Masculina por estrato
1 2 3 4 5 6 7 80%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
11.03%7.84% 6.36%
14.63%10.60%
15.04%11.93%
22.56%
10.64%
6.66% 7.34%
16.69%
10.28%
12.37%11.23%
24.79%
Mujer Hombre
Estrato
Porc
enta
je
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
El estrato con mayor participación laboral con 47,35% es el número 8 que contiene a las
comunas de La Florida y Puente Alto, dentro de este, el 22,56% del total de mujeres
pertenece a la PEA y el 24,79% del total de hombres pertenecen a la PEA.
Ingreso laboral real promedio4
El ingreso laboral promedio de la muestra de datos se ubicó en CLP 534.481,20; de acuerdo
al género, los hombres ganan en promedio CLP 615.496,80 y las mujeres CLP 425.725,80;
lo que significa que en promedio los hombres ganan 30,83% más que las mujeres. En
particular, por estrato existen algunas diferencias en el ingreso5. En términos reales, se
realizó el análisis del ingreso por estrato a precios promedio del 2009 y a precios constantes
de diciembre de 2007.
4 En el presente trabajo se calculó el ingreso real de dos maneras, la primera deflactando por IPC a precios promedio de 2009, y la segunda por UF de Diciembre de 2007, los datos fueron obtenidos del Instituto Nacional de Estadísticas de Chile y el Servicio de Impuestos Internos de Chile. En el cálculo fueron eliminados los valores perdidos y cero.5 Esto se puede observar en el Anexo 2, donde se muestra un mapa de calor de los ingresos promedio por comuna
Tabla 1 – Ingreso promedio real por estrato y sexo (a precios promedio del 2009)
IPC (precios promedio de 2009)Sexo
Estrato
Hombre Mujer Diferencia
1 672.532,30 462.360,90 210.171,402 362.700,60 287.100,80 75.599,803 381.155,20 264.138,60 117.016,604 367.585,20 257.195,40 110.389,805 345.106,70 248.783,50 96.323,206 1.637.355,00 919.717,70 717.637,307 472.576,70 344.970,90 127.605,808 428.341,50 296.974,00 131.367,50
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Tabla 2– Ingreso promedio real por estrato y sexo (a precios constantes de diciembre de 2007)
UF (precios constantes a diciembre de 2007)Sexo
Estrato
Hombre Mujer Diferencia
1 632.394,10 434.766,30 197.627,802 341.053,90 269.966,00 71.087,903 358.407,10 248.374,20 110.032,904 345.646,90 241.845,50 103.801,405 324.510,00 233.935,60 90.574,406 1.539.634,00 864.827,00 674.807,007 444.372,30 324.382,30 119.990,008 402.777,20 279.250,00 123.527,20
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Como se puede observar en los dos gráficos, el estrato con mayor ingreso real es el 6, que
agrupa a las comunas de Providencia, Las Condes, Vitacura y Lo Barnechea. En referencia
al género, dentro del estrato 6 se evidencia una diferencia en el ingreso real a favor del
hombre, donde este gana 1,8 veces más que la mujer. El estrato donde existe menor
diferencia es el 2, y en promedio el ingreso real del hombre en todos los estratos menos el 6
es 1,4 veces mayor al de la mujer.
Educación promedio de la PEA por sexo (personas ocupadas y desocupadas)
En la muestra completa, el promedio de educación se sitúa en los 10 años de educación, las
personas con más años de educación llegaron a los 21 años. En referencia al género, no
existen diferencias ya que tanto mujeres como hombres poseen 10 años de educación
promedio; si se consideran a las personas que pertenecen a la PEA el promedio de hombres
y mujeres es 13 años de educación. Dentro del análisis por género y situación de empleo
existen algunas diferencias entre la educación promedio por estratos, esto se muestra a
continuación en un gráfico.
Gráfico 2 – Años de educación promedio por estrato y sexo (personas de la PEA desempleadas)
1 2 3 4 5 6 7 802468
101214161820
1312
9
1112
17
12 1213 13
1112 12
15
1312
Hombre Mujer
Estrato
Años
de
educ
ació
n
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Los años de educación promedio dentro de las personas desempleadas son 12 años.
Respecto al género las mujeres en promedio poseen mayor educación que los hombres,
pero esta diferencia se refleja en un valor decimal (0,15). Las personas desempleadas con
mayor educación se encuentran en el estrato 6, donde el hombre tiene en promedio 2 años
más de educación, y las de menor educación en el estrato 3, donde la mujer tiene en
promedio 2 años más de educación.
Gráfico 3 – Años de educación promedio por estrato y sexo (personas de la PEA empleadas)
1 2 3 4 5 6 7 80
2
4
6
8
10
12
14
16
18
14
11 11 12 12
16
1312
14
12 12 12 12
15
1312
Hombre Mujer
Estrato
Años
de
educ
ació
n
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Las personas que se encuentran empleadas en promedio poseen 13 años de educación;
nuevamente entre hombres y mujeres, la mujer posee mayor educación pero en una
diferencia decimal (0,13). Las personas empleadas con mayor educación se encuentran en
el estrato 6, donde el hombre en promedio tiene un año más de educación, y las de menor
educación se ubican en los estratos 2 y 3, donde la mujer tiene en promedio un año más de
educación.
4. MODELOS Y ESTIMACIONES
El objetivo principal del presente trabajo se encuentra en estimar la semi-elasticidad del
ingreso a la educación de hombres y mujeres que trabajan En esta sección se presenta el
modelo básico estimado, algunas regresiones adicionales, los contrastes y finalmente se
elige un modelo que explique de buena manera el ingreso a través de algunas variables,
dentro de las cuales la de mayor importancia es la educación.
Modelo básico a ser estimado
El modelo básico de regresión minceriana se conoce por tener como variable explicada al
ingreso y como variables explicativas a la educación y la experiencia. Con los datos
obtenidos de la encuesta se estimó la semi-elasticidad del ingreso a la educación y la
experiencia, a continuación se presentan los resultados.
Tabla 3– Estimación regresión minceriana básica
Resultados MCO - Variable dependiente: ln_ingreso
Variables independientes
(1) coef. Estd
anos_estud0,1454108 0,595039(0,00516)
exp_pot0,139101 0,2290762
(0,0011546)
constante10,66723 -
(0,755373)
Observaciones 3320R-cuadrado (ajustado) 0,2923
Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
La regresión estimada muestra que en promedio, ante un aumento de 1 año de educación,
el ingreso se incrementará en un 14,54%. Esta regresión presentó heterocedasticidad, por lo
que sus varianzas fueron corregidas por errores robustos. Todos los coeficientes son
estadísticamente significativos, y la variable que explica en mayor magnitud al ingreso es la
educación, ya que su coeficiente estandarizado es 2,6 veces mayor que el de la experiencia.
En base a este modelo se estimaron algunas regresiones con más variables que incluyen los
efectos marginales, y se eligió un modelo sobre el cual se trabajó con más detalle, los
resultados de estas regresiones se muestran en el Anexo 3.En la siguiente tabla se presentan
2 regresiones, la primera es la regresión minceriana básica para hombres y mujeres que
trabajan (Pregunta 2), y la segunda es la regresión minceriana para hombres y mujeres que
trabajan, que se seleccionó para buscar un modelo con más variables.
Tabla 4– Regresión minceriana para hombres y mujeres que trabajan (básica y seleccionada)
Resultados MCO - Variable dependiente: ln_ingresoVariables independientes (5) (6)
anos_estud0,1472926 0,144253
(0,0050036) (0,0050297)
exp_pot0,0139472 0,0266075
(0,0011163) (0,003623)
exp_pot2- -0,0002884- (0,0000797)
mujer-0,3440275 -0,3471695(0,0265061) (0,0263452)
constante10,79304 10,74591
(0,0725747) (0,0742183)(Condicionada a personas que trabajan, empleo=1)
R-cuadrado (ajustado) 0,3360 0,3395Observaciones 3320
Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Especificaciones estimadas
A partir de la regresión minceriana seleccionada se estimaron especificaciones adicionales
con el propósito de obtener un modelo para los hombres y mujeres que trabajan, con
mejores características, a continuación se presentan las estimaciones realizadas.
Tabla 5– Otros modelos estimados
Resultados MCO - Variable dependiente: ln_ingresoVariables independientes (7) (8) (9) (10) (11)*
anos_estud 0,0751367 0,1463848 0,1403378 0,1537891 0,1334249(0,0042486) (0,0050229) (0,0050716) (0,0052128) (0,0063635)
exp_pot 0,03206 0,0216899 0,0224869 0,0260498 0,0177902(0,0032977) (0,0034352) (0,0036685) (0,0036748) (0,0034491)
exp_pot2 -0,0004704 -0,2964784 -0,0002464 -0,0002784 -0,0001653(0,0000686) (0,0254471) -0,0000795 (0,0000811) (0,0000761)
mujer -0,3309978 -0,2964784 -0,3269825 - -0,55981(0,0212077) (0,0254471) (0,0262711) - (0,1153211)
ln_ingfam 0,5670973 - - - -(0,0215361) - - - -
horas - 0,0178493 - - 0,017872- (0,0011935) - - (0,0011779)
numper_pcoh - - -0,010601 - -0,0106765- - (0,0018992) - (0,0016955)
mujer_estud - - - -0,0238291 0,0224058- - - (0,0021424) (0,0091942)
constante 3,889291 9,960041 10,93616 10,61218 10,26018(0,2645446) (0,0930862) (0,0815534) (0,0747153) (0,1073616)
(Condicionada a personas que trabajan, empleo=1)R-cuadrado (ajustado) 0,5755 0,4085 0,3456 0,3311 0,4166
Observaciones 3205 3239 3320 3320 3239*Esta regresión fue seleccionada como el mejor modelo
Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
En la búsqueda de un mejor modelo, se realizaron algunas combinaciones en las
regresiones y se incluyeron variables con las que se contaba en la base de datos, que
pudieran explicar de alguna manera el ingreso promedio de los hombres y mujeres que
trabajan. Dentro de esto también se realizaron dos interacciones entre variables, la primera
entre el número de personas del hogar y la relación con el jefe del hogar, esto con el
propósito de explicar que mientras más hijos y mayor jerarquía en la familia podría existir
una relación con un mayor ingreso. La segunda comprende la interacción entre años de
estudio y la variable binaria mujer (que representa el sexo), ya que se encontró que las
mujeres de la PEA tienen en promedio una mayor educación y esto podría afectar a la
pendiente de la regresión.
Contrastes
Las regresiones estimadas deben pasar por un proceso de contraste que permita descartar
problemas de heterocedasticidad y temas de multicolinealidad, además de significancia
estadística. Por simplicidad se toma como supuesto que existe normalidad asintótica y que
no existe correlación entre las variables independientes y el error debido al gran tamaño de
la muestra. A continuación se presentan las pruebas de significancia de los estimadores,
significancia global, coeficientes estandarizados, heterocedasticidad de White y
multicolinealidad medida por VIF, de las regresiones estimadas.
Tabla 6– Contrastes modelos 1 al 5
Contrastes MCO - Variable dependiente: ln_ingreso
Variables independientes (1) (2) (3) (4) (5)
anos_estudp-value - t 0,000 0,000 0,000 0,000 0,000
Coeficiente beta 0,595039 -0,5226449 -0,3619937 0,5829148 0,6027397
exp_potp-value - t 0,000 0,000 0,000 0,000 0,000
Coeficiente beta 0,2290762 0,5778489 0,2004411 0,4144848 0,2296867
anos_estud2p-value - t - 0,000 0,000 - -
Coeficiente beta - 1,104412 0,9654416 - -
exp_pot2p-value - t - 0,000 - 0,002 -
Coeficiente beta - -0,4069773 - -0,1977751 -
mujerp-value - t - - - - 0,000
Coeficiente beta - - - - -0,2097202
constantep-value - t 0,000 0,000 0,000 0,000 0,000
Coeficiente beta - - - - -
Significancia Global - Prob. F 0,000 0,000 0,000 0,000 0,000
Test de WhiteP-value – Chi2 0,000 0,000 0,000 0,000 0,000
Conclusión Heterocedástica Heterocedástica Heterocedástica Heterocedástica Heterocedástica
VIF (medio) 1,21 20,4 16,93 9,29 1,14
Observaciones 3320 3320 3320 3320 3320
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
En las primeras cinco regresiones se observa que todas son heterocedásticas, por lo que se
procedió a corregir este problema por la metodología de errores robustos. Una vez aplicada,
los cinco modelos presentaron coeficientes estadísticamente significativos; y también
significancia global. Dentro de los temas de multicolinealidad existen dos modelos, el (2) y
(3) cuyo VIF es mayor a diez, por lo que podrían presentar una alta multicolinealidad entre
variables.
Tabla 7– Contrastes modelos 6 al 10
Contrastes MCO - Variable dependiente: ln_ingreso
Variables independientes (6) (7) (8) (9) (10)
anos_estudp-value - t 0,000 0,000 0,000 0,000 0,000
Coeficiente beta 0,5903011 0,3087923 0,5966879 0,5742798 0,6293241
exp_potp-value - t 0,000 0,000 0,000 0,000 0,000
Coeficiente beta 0,4381804 0,5280641 0,3559024 0,3703222 0,428997
exp_pot2p-value - t 0,000 0,000 0,008 0,002 0,001
Coeficiente beta -0,222394 -0,3613052 -0,1570509 -0,1900031 -0,2146127
mujerp-value - t 0,000 0,000 0,000 0,000 -
Coeficiente beta -0,2116356 -0,2030372 -0,1802653 -0,1993295 -
ln_ingfamp-value - t - 0,000 - - -
Coeficiente beta - 0,5539698 - - -
horasp-value - t - - 0,000 - -
Coeficiente beta - - 0,2639724 - -
numper_pcohp-value - t - - - 0,000 -
Coeficiente beta - - - -0,878361 -
mujer_estudp-value - t - - - - 0,000
Coeficiente beta - - - - -0,196209
constantep-value - t 0,000 0,000 0,000 0,000 0,000
Coeficiente beta - - - - -
Significancia Global - Prob. F 0,000 0,000 0,000 0,000 0,000
Test de WhiteP-valor - Chi2 0,000 0,000 0,000 0,000 0,000
Conclusión Heterocedástica Heterocedástica Heterocedástica Heterocedástica Heterocedástica
VIF (medio) 7,23 6,09 6,02 6,22 7,25
Observaciones 3320 3205 3239 3320 3320
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Todos los modelos presentados en la tabla 7 son heterocedásticos, por lo que se procedió a
la corrección de varianzas por errores robustos. Una vez realizado el proceso se encontró
que todos los coeficientes en las cinco regresiones son estadísticamente significativos,
adicionalmente todas tienen significancia global y mantienen niveles de multicolinealidad
menores a 10. En cuatro de las cinco regresiones el coeficiente estandarizado de la
educación es el mayor, en la regresión (7) el coeficiente estandarizado del ingreso familiar
es el mayor. Los contrastes del modelo (11) se presentan en la siguiente sección donde se
realiza la elección del mejor modelo, y los contrastes de otras regresiones estimadas se
encuentran en los anexos.
Escogencia del mejor modelo
Mediante la estimación de algunas regresiones, y utilizando como herramienta de
comparación el R-cuadrado ajustado, se realizó la selección de un modelo que a criterio del
grupo de trabajo fue el que se estimó de mejor manera, ya que contiene 3239
observaciones, algunas interacciones interesantes que se consideraron de acuerdo a los
datos disponibles y los resultados del análisis de conocimiento general. El modelo
seleccionado es el número (11), los contrastes de este se muestran a continuación.
Tabla 8– Contrastes mejor modelo
Contrastes MCO - Variable dependiente: ln_ingresoVariables independientes (11)*
anos_estud p-value - t 0,000Coeficiente beta 0,5438613
exp_pot p-value - t 0,000Coeficiente beta 0,2919129
exp_pot2 p-value - t 0,030Coeficiente beta -0,1268187
mujer p-value - t 0,000Coeficiente beta -0,3403766
horas p-value - t 0,000Coeficiente beta 0,2643085
mujer_estud p-value - t 0,015Coeficiente beta 0,1839882
numper_pcoh p-value - t 0,000Coeficiente beta -0,0881812
constante p-value - t 0,000Coeficiente beta -
Significancia Global - Prob. F 0,000Test de White P-valor - Chi2 0,000
Conclusión HeterocedásticaVIF (medio) 9,25
Observaciones 3239
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
El modelo elegido presentó heterocedasticidad, por lo que se procedió a corregir sus
varianzas por errores robustos, su VIF promedio es menor a diez, además todos los
coeficientes resultaron estadísticamente significativos a un 95% de confianza, y también
tiene un nivel bueno de significancia global. La regresión y su interpretación se muestran
seguidamente.
Tabla 9– Mejor modelo (seleccionado)
Resultados MCO - Variable dependiente: ln_ingreso
Variables independientes (11)*
anos_estud0,1334249
(0,0063635)
exp_pot0,0177902
(0,0034491)
exp_pot2-0,0001653(0,0000761)
mujer-0,55981
(0,1153211)
horas0,017872
(0,0011779)
mujer_estud0,0224058
(0,0091942)
numper_pcoh-0,0106765(0,0016955)
constante10,26018
(0,1073616)(Condicionada a personas que trabajan, empleo=1)
R-cuadrado (ajustado) 0,4166Observaciones 3239
Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar
Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Como se observa en la tabla 9, el modelo posee un R-cuadrado de 0,4166; el cual se
encuentra en un buen nivel aplicando criterios más empíricos que teóricos. Cabe destacar
que este no es el modelo con el R-cuadrado más elevado, como se observará en los anexos,
sin embargo es el con mejor interpretación económica. Por otro lado, el coeficiente
estandarizado de la educación es el que explica en mayor magnitud al ingreso. Es decir,
ante una variación de un año de educación el ingreso de los hombres que trabajan varía en
13,34%, y el de las mujeres en 15,59%; esto siempre tomando en cuenta que las mujeres
parten con un menor ingreso, lo que se refleja en el coeficiente de la variable mujer que
disminuye el intercepto en 5,46%.
5. CONCLUSIONES
Este trabajo empírico permitió, en primer lugar, aplicar todos los conocimientos adquiridos
durante el semestre en el curso de Econometría, tanto en el manejo teórico econométrico
como en el manejo de bases de datos y utilización del software STATA.
En segundo lugar, se pudo comprobar que mediante la aplicación de una regresión
minceriana (ampliada con algunas variables) la hipótesis planteada. Se llegó que a través
del modelo elegido que el factor educación tiene una gran influencia en el ingreso de los
sujetos de la Región Metropolitana de Santiago de Chile, ya que ante una variación de un
año de educación el ingreso de los hombres que trabajan, varía en 13,34%, y el de las
mujeres en 15,59%. Por otro lado, se comprobó que existe discriminación por sexo en
términos del ingreso, esto se refleja en que la mujer parte con un intercepto 5,46% menor.
En tercer -y último- lugar, al obtener esta potente regresión utilizando los datos del Centro
de Microdatos del Departamento de Economía de la Universidad de Chile, se puede
proyectar y evaluar qué impacto tendrá la alteración de alguna de estas variables6.
6. BIBLIOGRAFÍA
Wooldridge, J. M. (2010). Introducción a la Econometría. México: CENGAGE.
6 Es decir los efectos marginales de cada variable.
ANEXOS
ANEXO 1 – Descripción de los datos
Tabla 10 – Variables de la Base de datos reducida
Variable Descripción Media Desviación estd. Mínimo Máximo
edad Edad del integrante del hogar 35 22 0 99
horasTotal de horas trabajadas durante la semana de referencia por los ocupados o desocupados
44 12 1 120
diasTotal de días trabajados durante la semana de referencia por los ocupados o desocupados
5 0,9879 1 7
numper Total de integrantes del hogar 4 2 1 13
ingfam2Total de ingresos familiares percibidos en el mes anterior (sin valores cero o perdidos)
$ 1.009.591,00 1193910 $
12.000,00 $ 12.000.000,00
empleo Personas que se encuentran trabajando 45% 50% 0 1
ingresoTotal de ingresos del trabajo percibidos en el mes anterior (sin valores cero o perdidos)
$ 534.481,20 720.394,40 $
10.000,00 $ 10.000.000,00
IPCIPC de Junio 2013 a precios promedio del 2009
109,51 0 109,51 109,51
ingreso_realIngreso real a precios promedio de 2009 por IPC
488066,10 657834,30 9.132 9131586,00
UF Deflactor por UF a Diciembre de 2007 0,8586594 0 0,8586594 0,8586594
ingreso_UFIngreso real a precios de Diciembre de 2007 por UF
458937,3 618573,4 8.587 8586594
anos_estud Años de estudio 10 5 0 21
exp_pot7 Experiencia Potencial 21 13 0 58
num_trab
Número de trabajadores contratados por los empleadores o trabajadores por cuenta propia (sin valores cero o perdidos)
3 19 0 200
Fuente: DESCRIPCIÓN ARCHIVO MAGNÉTICO – Centro de MicrodatosElaboración: Grupo de trabajo
7 En el cálculo de la experiencia potencial se generaron algunos valores negativos, estos fueron eliminados del cálculo ya que corresponden a personas que estudian y trabajan o que ingresaron a la universidad en una edad temprana
Variable Descripción
estrato Agrupación comunal
pcoh Parentesco con el jefe del hogar
sexo Sexo del integrante del hogar
est_act Asiste a un establecimiento educacional actualmente
curso Curso que realiza actualmente o último curso aprobado si no estudia actualmente
tipo Tipo de estudios que realiza o último tipo de estudios aprobado si no estudia actualmente
sitocup1 Situación ocupacional de la población de 14 o más años
mujer Sexo Mujer
hombre Sexo Hombre
PEA Población Económicamente Activa
PEA_fem Mujeres de la Población Económicamente Activa
PEA_masc Hombres de la Población Económicamente Activa
PLF Participación Laboral Femenina
PLM Participación Laboral Masculina
ingtrabTotal de ingresos del trabajo percibidos en el mes anterior (corresponde a la suma de sueldos y salarios e ingresos por actividades independientes)
ln_ingreso Logaritmo natural del ingreso
anos_estud2 Años de estudio al cuadrado (rendimientos marginales)
exp_pot2 Experiencia potencial al cuadrado (rendimientos marginales)
ntrab Número de trabajadores contratados por los empleadores o trabajadores por cuenta propia
ingfam Total de ingresos familiares percibidos en el mes anterior
ln_ingfam Logaritmo natural del ingreso familiar
numper_pcoh
Variable interactiva entrenumper y pcoh
mujer_estud Variable interactiva entre mujer y años de estudio
ingreso100 Variable generada para deflactar el ingreso
factor Factor de expansión
Fuente: DESCRIPCIÓN ARCHIVO MAGNÉTICO – Centro de MicrodatosElaboración: Grupo de trabajo
ANEXO 2 – Mapa de calor de ingresos por estrato
Gráfico 4 – Ingreso promedio por estrato y sexo
8
Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
El mapa muestra que el estrato 6 con las comunas de: Lo Barnechea, Providencia, Vitacura
y Las Condes, es en el que las personas tienen mayor ingreso. Las comunas de Quilicura,
Huechuraba, Conchalí, Renca, Independencia, Recoleta y Estación Central son las que
presentan un menor ingreso promedio.
8 Este mapa se generó en STATA a partir de un archivo .shp que contiene las coordenadas para dibujar el mapa, dentro del archivo .shp 4 comunas se encontraban erróneamente especificadas y se tuvo que manipular la imagen con Adobe Illustrador, el proceso para generar el mapa se adjunta en un DO file aparte
ANEXO 3 - Elección de la regresión básica
Tabla 11– Elección regresión minceriana básica
Resultados MCO - Variable dependiente: ln_ingresoVariables independientes (1) (2) (3) (4)
anos_estud0,1454108 -0,1277197 -0,0884611 0,1426923(0,00516) (0,0227097) (0,21345) (0,0051826)
exp_pot0,139101 0,0350885 0,0121713 0,0251686
(0,0011546) (0,003523) (0,0011582) 0,0036772
anos_estud2- 0,0109443 0,0095672 -
(0,0008952) (0,0008547)
exp_pot2- -0,0005279 -0,0002565
(0,0000796) (0,770224)
constante10,66723 12,13274 12,02555 10,6243
(0,755373) (0,1470893) (0,1425743) (0,0770224)
VIF (medio) 1,21 20,4 16,93 9,29R-cuadrada 0,2927 0,3424 0,3309 0,2956
Observaciones 3320
Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar
Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
La regresión minceriana seleccionada es la número (4), esta si bien es heterocedástica como
las demás, fue corregida por errores robustos y no presenta temas de multicolinealidad
(promedio), adicionalmente es la de mayor R-cuadrado entre las regresiones con VIF
promedio menor a 10.
ANEXO 4 – Otros modelos estimados
Tabla 12– Otros modelos generados
Resultados MCO - Variable dependiente: ln_ingresoVariables independientes
(12) (13) (14)
anos_estud 0,1469362 0,0349926 0,0294497(0,0050874
)(0,0127875
)(0,0128781
)exp_pot 0,0234194 0,0047853 0,0316975
(0,0035195)
(0,0030536)
(0,0100174)
exp_pot2 -0,0002289 - -0,0005952(0,0000783
)- (0,0001824
)mujer -0,3172501 -0,95781 -0,9565452
(0,0262533)
(0,2621837)
(0,26184)
ln_ingfam - 0,6647947 0,6703209- (0,0587806
)(0,0551144
)horas - - 0,0112979
- - (0,0016516)
mujer_estud - 0,0414693 0,043935- (0,0221881
)(0,0218551
)numper_pcoh - -0,0563946 -0,05498
- (0,0075775)
(0,0071677)
dias 0,1618821 0,1309121 -(0,0154563
)(0,0237442
)-
num_trab - 0,0049139 0,0048614- (0,0011346
)(0,0011239
)constante 9,894767 2,943678 2,915731
(0,1144548)
(0,6737041)
(0,636367)
(Condicionada a personas que trabajan, empleo=1)R-cuadrado (ajustado) 0,3758 0,6637 0,6844
Observaciones 3239 580 580Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar
Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo
Estos modelos son parte de las combinaciones generadas para tratar de determinar cuáles
variables concuerdan más con un modelo en el cual exista un buen número de
observaciones y buenos contrastes, a continuación se presentan estos.
Tabla 13– Contrastes otros modelos generados
Contrastes MCO - Variable dependiente: ln_ingresoVariables independientes (12) (13) (14)
anos_estud p-value - t 0,000 0,006 0,023Coeficiente
beta0,5989357 0,1153429 0,0970721
exp_pot p-value - t 0,000 0,118 0,002Coeficiente
beta0,3842808 0,0576456 0,3818427
exp_pot2 p-value - t 0,003 - 0,001Coeficiente
beta-0,1755646 - -0,3573053
mujer p-value - t 0,000 0,000 0,000Coeficiente
beta-0,192895 -0,4246218 -0,4240611
ln_ingfam p-value - t - 0,000 0,000Coeficiente
beta- 0,5571444 0,5617758
horas p-value - t - - 0,000Coeficiente
beta- - 0,1955964
mujer_estud p-value - t - 0,062 0,045Coeficiente
beta- 0,238399 0,252574
numper_pcoh
p-value - t - 0,000 0,000Coeficiente
beta- -0,273543 -0,2666813
dias p-value - t 0,000 0,000 -Coeficiente
beta0,1894912 0,1675128 -
num_trab p-value - t - 0,000 0,000Coeficiente
beta- 0,0927916 0,0917996
constante p-value - t 0,000 0,000 0,000
Coeficiente beta
- - -
Significancia Global - Prob. F 0,000 0,000 0,000Test de White
P-valor - Chi2 0,000 0,000 0,000Conclusión Heterocedástic
aHeterocedástic
aHeterocedástic
a
VIF (medio) 6,01 4,65 7,19Observaciones 3239 580 580
Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo