econometria250-1_grupo26

39
REPORTE Encuesta - Junio 2013 Raúl Fernández Julio Galárraga _____________________________________________________________ ____________ Econometría I

description

Econometria, regresion minceriana

Transcript of econometria250-1_grupo26

Page 1: econometria250-1_grupo26

REPORTE

Encuesta - Junio 2013

Raúl Fernández

Julio Galárraga

_________________________________________________________________________

Econometría I

Profesor: Omar Bello

15 de Noviembre de 2013

Page 2: econometria250-1_grupo26

CONTENIDO

INTRODUCCIÓN..............................................................................................................................3

1. MARCO CONCEPTUAL..........................................................................................................3

2. DATOS......................................................................................................................................4

3. CONOCIMIENTO GENERAL PREVIO..................................................................................4

Participación laboral por sexo y estrato........................................................................................4

Ingreso laboral real promedio.......................................................................................................5

Educación promedio de la PEA por sexo (personas ocupadas y desocupadas).............................7

4. MODELOS Y ESTIMACIONES...............................................................................................9

Modelo básico a ser estimado........................................................................................................9

Especificaciones estimadas..........................................................................................................10

Contrastes....................................................................................................................................12

Escogencia del mejor modelo.......................................................................................................14

5. CONCLUSIONES...................................................................................................................16

6. BIBLIOGRAFÍA......................................................................................................................16

ANEXOS.........................................................................................................................................18

Page 3: econometria250-1_grupo26

INTRODUCCIÓN

El objetivo de este trabajo es obtener el coeficiente de semi-elasticidad de la educación de

la regresión minceriana de los individuos que trabajan, segregando a estos por sexo. Esto

constituye un aspecto muy importante, ya que el corazón de la desigualdad social es la

deficiente distribución de riquezas en un país, donde esta última a su vez está determinada

por los ingresos recibidos por los individuos. La hipótesis a comprobar será que aquellas

personas que poseen mayor educación sí reciben mayores ingresos, además de verificar que

efectivamente existe discriminación por sexo en este tema.

Para investigar lo anterior, se realizará un proyecto empírico utilizando como base los

conocimientos aprendidos del curso de Econometría. La base de datos que se utilizará será

la Encuesta de Ocupación y Desocupación del Centro de Microdatos del Departamento de

Economía de la Universidad de Chile de Junio del 2013.

Este trabajo se encuentra dividido en 4 secciones, la primera comprende el marco

conceptual en el que se basan las estimaciones, la segunda corresponde a una breve

descripción de los datos y variables empleadas. El tercer apartado muestra estadísticas

generales que brindan un marco de conocimientos previo al cuarto inciso, donde se realizan

regresiones y contrastes para estimar un modelo que permita comprobar la hipótesis

planteada y proporcione el coeficiente de semi-elasticidad del ingreso a la educación.

1. MARCO CONCEPTUAL

Este informe basará su proceso de análisis en el modelo de regresión de Jacob Mincer, la

cual expresa la relación dependiente del ingreso con los años de educación y los años de

experiencia potencial. Mediante la aplicación del método econométrico de Mínimos

Cuadrados Ordinarios se estimarán regresiones que permitan obtener la semi-elasticidad del

ingreso a los años de educación. Adicionalmente, se realizarán algunas pruebas para

asegurar la significancia de los coeficientes y los modelos, estos emplearán el contraste de

heterocedasticidad de White y el Variance Inflation Factor para temas de

multicolinealidad.

Page 4: econometria250-1_grupo26

2. DATOS

como se mencionó previamente, el conjunto de datos utilizados para las estimaciones

realizadas fue obtenido de la “Encuesta de Ocupación y Desocupación” realizada por el

Centro de Microdatos de la Facultad de Economía y Negocios de la Universidad de Chile.

Esta encuesta se realiza mensualmente y se enfoca en estudiar el mercado del trabajo

chileno en el Gran Santiago.

La base de datos empleada para este trabajo en particular posee 10195 observaciones y

comprende el período de Junio del 2013. Originalmente esta base cuenta con 59 variables

cuantitativas y cualitativas, pero para las estimaciones tanto estadísticas como

econométricas se eliminaron algunas variables y se generaron nuevas, por lo que la base de

datos modificada contiene 39 variables1.

3. CONOCIMIENTO GENERAL PREVIO

Los sujetos de estudio del presente trabajo son personas de la Región Metropolitana de

Chile pertenecientes a 34 comunas. El 51,41% de las personas encuestadas son de género

femenino y el 48,59% del masculino. Dentro del mercado laboral en general, el 6,67% de

las personas se encuentran desempleadas; por otro lado, se identificó que el 54,03% de los

consultados no pertenece a la Población Económicamente Activa (PEA) y el restante

45,97% si pertenece, dentro de las personas económicamente activas el 93,33% se

encuentran empleadas2.

Participación laboral por sexo y estrato

La participación laboral femenina general muestra que el 37,36% de las mujeres se

encuentra trabajando o en busca de trabajo, mientras que la participación laboral masculina

en general se encuentra en el orden del 53,29%3, este análisis se amplía por estrato en el

gráfico presentado a continuación.

1 La descripción de las variables se encuentra en el Anexo 1.2 Para la generación de la PEA se tomó en cuenta las personas mayores de 14 años y menores de 653 La PEA femenina se generó con personas mayores de 14 años y menores a 60 años, mientras que la PEA masculina tomó en cuenta a los menores a 65 años

Page 5: econometria250-1_grupo26

Gráfico 1 – Participación Laboral Femenina y Masculina por estrato

1 2 3 4 5 6 7 80%

5%

10%

15%

20%

25%

30%

35%

40%

45%

50%

11.03%7.84% 6.36%

14.63%10.60%

15.04%11.93%

22.56%

10.64%

6.66% 7.34%

16.69%

10.28%

12.37%11.23%

24.79%

Mujer Hombre

Estrato

Porc

enta

je

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

El estrato con mayor participación laboral con 47,35% es el número 8 que contiene a las

comunas de La Florida y Puente Alto, dentro de este, el 22,56% del total de mujeres

pertenece a la PEA y el 24,79% del total de hombres pertenecen a la PEA.

Ingreso laboral real promedio4

El ingreso laboral promedio de la muestra de datos se ubicó en CLP 534.481,20; de acuerdo

al género, los hombres ganan en promedio CLP 615.496,80 y las mujeres CLP 425.725,80;

lo que significa que en promedio los hombres ganan 30,83% más que las mujeres. En

particular, por estrato existen algunas diferencias en el ingreso5. En términos reales, se

realizó el análisis del ingreso por estrato a precios promedio del 2009 y a precios constantes

de diciembre de 2007.

4 En el presente trabajo se calculó el ingreso real de dos maneras, la primera deflactando por IPC a precios promedio de 2009, y la segunda por UF de Diciembre de 2007, los datos fueron obtenidos del Instituto Nacional de Estadísticas de Chile y el Servicio de Impuestos Internos de Chile. En el cálculo fueron eliminados los valores perdidos y cero.5 Esto se puede observar en el Anexo 2, donde se muestra un mapa de calor de los ingresos promedio por comuna

Page 6: econometria250-1_grupo26

Tabla 1 – Ingreso promedio real por estrato y sexo (a precios promedio del 2009)

IPC (precios promedio de 2009)Sexo

Estrato

Hombre Mujer Diferencia

1 672.532,30 462.360,90 210.171,402 362.700,60 287.100,80 75.599,803 381.155,20 264.138,60 117.016,604 367.585,20 257.195,40 110.389,805 345.106,70 248.783,50 96.323,206 1.637.355,00 919.717,70 717.637,307 472.576,70 344.970,90 127.605,808 428.341,50 296.974,00 131.367,50

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Tabla 2– Ingreso promedio real por estrato y sexo (a precios constantes de diciembre de 2007)

UF (precios constantes a diciembre de 2007)Sexo

Estrato

Hombre Mujer Diferencia

1 632.394,10 434.766,30 197.627,802 341.053,90 269.966,00 71.087,903 358.407,10 248.374,20 110.032,904 345.646,90 241.845,50 103.801,405 324.510,00 233.935,60 90.574,406 1.539.634,00 864.827,00 674.807,007 444.372,30 324.382,30 119.990,008 402.777,20 279.250,00 123.527,20

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Como se puede observar en los dos gráficos, el estrato con mayor ingreso real es el 6, que

agrupa a las comunas de Providencia, Las Condes, Vitacura y Lo Barnechea. En referencia

al género, dentro del estrato 6 se evidencia una diferencia en el ingreso real a favor del

hombre, donde este gana 1,8 veces más que la mujer. El estrato donde existe menor

Page 7: econometria250-1_grupo26

diferencia es el 2, y en promedio el ingreso real del hombre en todos los estratos menos el 6

es 1,4 veces mayor al de la mujer.

Educación promedio de la PEA por sexo (personas ocupadas y desocupadas)

En la muestra completa, el promedio de educación se sitúa en los 10 años de educación, las

personas con más años de educación llegaron a los 21 años. En referencia al género, no

existen diferencias ya que tanto mujeres como hombres poseen 10 años de educación

promedio; si se consideran a las personas que pertenecen a la PEA el promedio de hombres

y mujeres es 13 años de educación. Dentro del análisis por género y situación de empleo

existen algunas diferencias entre la educación promedio por estratos, esto se muestra a

continuación en un gráfico.

Gráfico 2 – Años de educación promedio por estrato y sexo (personas de la PEA desempleadas)

1 2 3 4 5 6 7 802468

101214161820

1312

9

1112

17

12 1213 13

1112 12

15

1312

Hombre Mujer

Estrato

Años

de

educ

ació

n

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Los años de educación promedio dentro de las personas desempleadas son 12 años.

Respecto al género las mujeres en promedio poseen mayor educación que los hombres,

pero esta diferencia se refleja en un valor decimal (0,15). Las personas desempleadas con

mayor educación se encuentran en el estrato 6, donde el hombre tiene en promedio 2 años

Page 8: econometria250-1_grupo26

más de educación, y las de menor educación en el estrato 3, donde la mujer tiene en

promedio 2 años más de educación.

Gráfico 3 – Años de educación promedio por estrato y sexo (personas de la PEA empleadas)

1 2 3 4 5 6 7 80

2

4

6

8

10

12

14

16

18

14

11 11 12 12

16

1312

14

12 12 12 12

15

1312

Hombre Mujer

Estrato

Años

de

educ

ació

n

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Las personas que se encuentran empleadas en promedio poseen 13 años de educación;

nuevamente entre hombres y mujeres, la mujer posee mayor educación pero en una

diferencia decimal (0,13). Las personas empleadas con mayor educación se encuentran en

el estrato 6, donde el hombre en promedio tiene un año más de educación, y las de menor

educación se ubican en los estratos 2 y 3, donde la mujer tiene en promedio un año más de

educación.

Page 9: econometria250-1_grupo26

4. MODELOS Y ESTIMACIONES

El objetivo principal del presente trabajo se encuentra en estimar la semi-elasticidad del

ingreso a la educación de hombres y mujeres que trabajan En esta sección se presenta el

modelo básico estimado, algunas regresiones adicionales, los contrastes y finalmente se

elige un modelo que explique de buena manera el ingreso a través de algunas variables,

dentro de las cuales la de mayor importancia es la educación.

Modelo básico a ser estimado

El modelo básico de regresión minceriana se conoce por tener como variable explicada al

ingreso y como variables explicativas a la educación y la experiencia. Con los datos

obtenidos de la encuesta se estimó la semi-elasticidad del ingreso a la educación y la

experiencia, a continuación se presentan los resultados.

Tabla 3– Estimación regresión minceriana básica

Resultados MCO - Variable dependiente: ln_ingreso

Variables independientes

(1) coef. Estd

anos_estud0,1454108 0,595039(0,00516)

exp_pot0,139101 0,2290762

(0,0011546)

constante10,66723 -

(0,755373)

Observaciones 3320R-cuadrado (ajustado) 0,2923

Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

La regresión estimada muestra que en promedio, ante un aumento de 1 año de educación,

el ingreso se incrementará en un 14,54%. Esta regresión presentó heterocedasticidad, por lo

que sus varianzas fueron corregidas por errores robustos. Todos los coeficientes son

estadísticamente significativos, y la variable que explica en mayor magnitud al ingreso es la

Page 10: econometria250-1_grupo26

educación, ya que su coeficiente estandarizado es 2,6 veces mayor que el de la experiencia.

En base a este modelo se estimaron algunas regresiones con más variables que incluyen los

efectos marginales, y se eligió un modelo sobre el cual se trabajó con más detalle, los

resultados de estas regresiones se muestran en el Anexo 3.En la siguiente tabla se presentan

2 regresiones, la primera es la regresión minceriana básica para hombres y mujeres que

trabajan (Pregunta 2), y la segunda es la regresión minceriana para hombres y mujeres que

trabajan, que se seleccionó para buscar un modelo con más variables.

Tabla 4– Regresión minceriana para hombres y mujeres que trabajan (básica y seleccionada)

Resultados MCO - Variable dependiente: ln_ingresoVariables independientes (5) (6)

anos_estud0,1472926 0,144253

(0,0050036) (0,0050297)

exp_pot0,0139472 0,0266075

(0,0011163) (0,003623)

exp_pot2- -0,0002884- (0,0000797)

mujer-0,3440275 -0,3471695(0,0265061) (0,0263452)

constante10,79304 10,74591

(0,0725747) (0,0742183)(Condicionada a personas que trabajan, empleo=1)

R-cuadrado (ajustado) 0,3360 0,3395Observaciones 3320

Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Especificaciones estimadas

A partir de la regresión minceriana seleccionada se estimaron especificaciones adicionales

con el propósito de obtener un modelo para los hombres y mujeres que trabajan, con

mejores características, a continuación se presentan las estimaciones realizadas.

Page 11: econometria250-1_grupo26

Tabla 5– Otros modelos estimados

Resultados MCO - Variable dependiente: ln_ingresoVariables independientes (7) (8) (9) (10) (11)*

anos_estud 0,0751367 0,1463848 0,1403378 0,1537891 0,1334249(0,0042486) (0,0050229) (0,0050716) (0,0052128) (0,0063635)

exp_pot 0,03206 0,0216899 0,0224869 0,0260498 0,0177902(0,0032977) (0,0034352) (0,0036685) (0,0036748) (0,0034491)

exp_pot2 -0,0004704 -0,2964784 -0,0002464 -0,0002784 -0,0001653(0,0000686) (0,0254471) -0,0000795 (0,0000811) (0,0000761)

mujer -0,3309978 -0,2964784 -0,3269825 - -0,55981(0,0212077) (0,0254471) (0,0262711) - (0,1153211)

ln_ingfam 0,5670973 - - - -(0,0215361) - - - -

horas - 0,0178493 - - 0,017872- (0,0011935) - - (0,0011779)

numper_pcoh - - -0,010601 - -0,0106765- - (0,0018992) - (0,0016955)

mujer_estud - - - -0,0238291 0,0224058- - - (0,0021424) (0,0091942)

constante 3,889291 9,960041 10,93616 10,61218 10,26018(0,2645446) (0,0930862) (0,0815534) (0,0747153) (0,1073616)

(Condicionada a personas que trabajan, empleo=1)R-cuadrado (ajustado) 0,5755 0,4085 0,3456 0,3311 0,4166

Observaciones 3205 3239 3320 3320 3239*Esta regresión fue seleccionada como el mejor modelo

Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

En la búsqueda de un mejor modelo, se realizaron algunas combinaciones en las

regresiones y se incluyeron variables con las que se contaba en la base de datos, que

pudieran explicar de alguna manera el ingreso promedio de los hombres y mujeres que

trabajan. Dentro de esto también se realizaron dos interacciones entre variables, la primera

entre el número de personas del hogar y la relación con el jefe del hogar, esto con el

propósito de explicar que mientras más hijos y mayor jerarquía en la familia podría existir

una relación con un mayor ingreso. La segunda comprende la interacción entre años de

estudio y la variable binaria mujer (que representa el sexo), ya que se encontró que las

mujeres de la PEA tienen en promedio una mayor educación y esto podría afectar a la

pendiente de la regresión.

Page 12: econometria250-1_grupo26

Contrastes

Las regresiones estimadas deben pasar por un proceso de contraste que permita descartar

problemas de heterocedasticidad y temas de multicolinealidad, además de significancia

estadística. Por simplicidad se toma como supuesto que existe normalidad asintótica y que

no existe correlación entre las variables independientes y el error debido al gran tamaño de

la muestra. A continuación se presentan las pruebas de significancia de los estimadores,

significancia global, coeficientes estandarizados, heterocedasticidad de White y

multicolinealidad medida por VIF, de las regresiones estimadas.

Tabla 6– Contrastes modelos 1 al 5

Contrastes MCO - Variable dependiente: ln_ingreso

Variables independientes (1) (2) (3) (4) (5)

anos_estudp-value - t 0,000 0,000 0,000 0,000 0,000

Coeficiente beta 0,595039 -0,5226449 -0,3619937 0,5829148 0,6027397

exp_potp-value - t 0,000 0,000 0,000 0,000 0,000

Coeficiente beta 0,2290762 0,5778489 0,2004411 0,4144848 0,2296867

anos_estud2p-value - t - 0,000 0,000 - -

Coeficiente beta - 1,104412 0,9654416 - -

exp_pot2p-value - t - 0,000 - 0,002 -

Coeficiente beta - -0,4069773 - -0,1977751 -

mujerp-value - t - - - - 0,000

Coeficiente beta - - - - -0,2097202

constantep-value - t 0,000 0,000 0,000 0,000 0,000

Coeficiente beta - - - - -

Significancia Global - Prob. F 0,000 0,000 0,000 0,000 0,000

Test de WhiteP-value – Chi2 0,000 0,000 0,000 0,000 0,000

Conclusión Heterocedástica Heterocedástica Heterocedástica Heterocedástica Heterocedástica

VIF (medio) 1,21 20,4 16,93 9,29 1,14

Observaciones 3320 3320 3320 3320 3320

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

En las primeras cinco regresiones se observa que todas son heterocedásticas, por lo que se

procedió a corregir este problema por la metodología de errores robustos. Una vez aplicada,

los cinco modelos presentaron coeficientes estadísticamente significativos; y también

significancia global. Dentro de los temas de multicolinealidad existen dos modelos, el (2) y

Page 13: econometria250-1_grupo26

(3) cuyo VIF es mayor a diez, por lo que podrían presentar una alta multicolinealidad entre

variables.

Tabla 7– Contrastes modelos 6 al 10

Contrastes MCO - Variable dependiente: ln_ingreso

Variables independientes (6) (7) (8) (9) (10)

anos_estudp-value - t 0,000 0,000 0,000 0,000 0,000

Coeficiente beta 0,5903011 0,3087923 0,5966879 0,5742798 0,6293241

exp_potp-value - t 0,000 0,000 0,000 0,000 0,000

Coeficiente beta 0,4381804 0,5280641 0,3559024 0,3703222 0,428997

exp_pot2p-value - t 0,000 0,000 0,008 0,002 0,001

Coeficiente beta -0,222394 -0,3613052 -0,1570509 -0,1900031 -0,2146127

mujerp-value - t 0,000 0,000 0,000 0,000 -

Coeficiente beta -0,2116356 -0,2030372 -0,1802653 -0,1993295 -

ln_ingfamp-value - t - 0,000 - - -

Coeficiente beta - 0,5539698 - - -

horasp-value - t - - 0,000 - -

Coeficiente beta - - 0,2639724 - -

numper_pcohp-value - t - - - 0,000 -

Coeficiente beta - - - -0,878361 -

mujer_estudp-value - t - - - - 0,000

Coeficiente beta - - - - -0,196209

constantep-value - t 0,000 0,000 0,000 0,000 0,000

Coeficiente beta - - - - -

Significancia Global - Prob. F 0,000 0,000 0,000 0,000 0,000

Test de WhiteP-valor - Chi2 0,000 0,000 0,000 0,000 0,000

Conclusión Heterocedástica Heterocedástica Heterocedástica Heterocedástica Heterocedástica

VIF (medio) 7,23 6,09 6,02 6,22 7,25

Observaciones 3320 3205 3239 3320 3320

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Todos los modelos presentados en la tabla 7 son heterocedásticos, por lo que se procedió a

la corrección de varianzas por errores robustos. Una vez realizado el proceso se encontró

que todos los coeficientes en las cinco regresiones son estadísticamente significativos,

adicionalmente todas tienen significancia global y mantienen niveles de multicolinealidad

menores a 10. En cuatro de las cinco regresiones el coeficiente estandarizado de la

educación es el mayor, en la regresión (7) el coeficiente estandarizado del ingreso familiar

Page 14: econometria250-1_grupo26

es el mayor. Los contrastes del modelo (11) se presentan en la siguiente sección donde se

realiza la elección del mejor modelo, y los contrastes de otras regresiones estimadas se

encuentran en los anexos.

Escogencia del mejor modelo

Mediante la estimación de algunas regresiones, y utilizando como herramienta de

comparación el R-cuadrado ajustado, se realizó la selección de un modelo que a criterio del

grupo de trabajo fue el que se estimó de mejor manera, ya que contiene 3239

observaciones, algunas interacciones interesantes que se consideraron de acuerdo a los

datos disponibles y los resultados del análisis de conocimiento general. El modelo

seleccionado es el número (11), los contrastes de este se muestran a continuación.

Tabla 8– Contrastes mejor modelo

Contrastes MCO - Variable dependiente: ln_ingresoVariables independientes (11)*

anos_estud p-value - t 0,000Coeficiente beta 0,5438613

exp_pot p-value - t 0,000Coeficiente beta 0,2919129

exp_pot2 p-value - t 0,030Coeficiente beta -0,1268187

mujer p-value - t 0,000Coeficiente beta -0,3403766

horas p-value - t 0,000Coeficiente beta 0,2643085

mujer_estud p-value - t 0,015Coeficiente beta 0,1839882

numper_pcoh p-value - t 0,000Coeficiente beta -0,0881812

constante p-value - t 0,000Coeficiente beta -

Significancia Global - Prob. F 0,000Test de White P-valor - Chi2 0,000

Conclusión HeterocedásticaVIF (medio) 9,25

Observaciones 3239

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Page 15: econometria250-1_grupo26

El modelo elegido presentó heterocedasticidad, por lo que se procedió a corregir sus

varianzas por errores robustos, su VIF promedio es menor a diez, además todos los

coeficientes resultaron estadísticamente significativos a un 95% de confianza, y también

tiene un nivel bueno de significancia global. La regresión y su interpretación se muestran

seguidamente.

Tabla 9– Mejor modelo (seleccionado)

Resultados MCO - Variable dependiente: ln_ingreso

Variables independientes (11)*

anos_estud0,1334249

(0,0063635)

exp_pot0,0177902

(0,0034491)

exp_pot2-0,0001653(0,0000761)

mujer-0,55981

(0,1153211)

horas0,017872

(0,0011779)

mujer_estud0,0224058

(0,0091942)

numper_pcoh-0,0106765(0,0016955)

constante10,26018

(0,1073616)(Condicionada a personas que trabajan, empleo=1)

R-cuadrado (ajustado) 0,4166Observaciones 3239

Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar

Fuente: ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Como se observa en la tabla 9, el modelo posee un R-cuadrado de 0,4166; el cual se

encuentra en un buen nivel aplicando criterios más empíricos que teóricos. Cabe destacar

que este no es el modelo con el R-cuadrado más elevado, como se observará en los anexos,

sin embargo es el con mejor interpretación económica. Por otro lado, el coeficiente

estandarizado de la educación es el que explica en mayor magnitud al ingreso. Es decir,

ante una variación de un año de educación el ingreso de los hombres que trabajan varía en

13,34%, y el de las mujeres en 15,59%; esto siempre tomando en cuenta que las mujeres

Page 16: econometria250-1_grupo26

parten con un menor ingreso, lo que se refleja en el coeficiente de la variable mujer que

disminuye el intercepto en 5,46%.

5. CONCLUSIONES

Este trabajo empírico permitió, en primer lugar, aplicar todos los conocimientos adquiridos

durante el semestre en el curso de Econometría, tanto en el manejo teórico econométrico

como en el manejo de bases de datos y utilización del software STATA.

En segundo lugar, se pudo comprobar que mediante la aplicación de una regresión

minceriana (ampliada con algunas variables) la hipótesis planteada. Se llegó que a través

del modelo elegido que el factor educación tiene una gran influencia en el ingreso de los

sujetos de la Región Metropolitana de Santiago de Chile, ya que ante una variación de un

año de educación el ingreso de los hombres que trabajan, varía en 13,34%, y el de las

mujeres en 15,59%. Por otro lado, se comprobó que existe discriminación por sexo en

términos del ingreso, esto se refleja en que la mujer parte con un intercepto 5,46% menor.

En tercer -y último- lugar, al obtener esta potente regresión utilizando los datos del Centro

de Microdatos del Departamento de Economía de la Universidad de Chile, se puede

proyectar y evaluar qué impacto tendrá la alteración de alguna de estas variables6.

6. BIBLIOGRAFÍA

Wooldridge, J. M. (2010). Introducción a la Econometría. México: CENGAGE.

6 Es decir los efectos marginales de cada variable.

Page 17: econometria250-1_grupo26
Page 18: econometria250-1_grupo26

ANEXOS

Page 19: econometria250-1_grupo26

ANEXO 1 – Descripción de los datos

Tabla 10 – Variables de la Base de datos reducida

Variable Descripción Media Desviación estd. Mínimo Máximo

edad Edad del integrante del hogar 35 22 0 99

horasTotal de horas trabajadas durante la semana de referencia por los ocupados o desocupados

44 12 1 120

diasTotal de días trabajados durante la semana de referencia por los ocupados o desocupados

5 0,9879 1 7

numper Total de integrantes del hogar 4 2 1 13

ingfam2Total de ingresos familiares percibidos en el mes anterior (sin valores cero o perdidos)

$ 1.009.591,00 1193910 $

12.000,00 $ 12.000.000,00

empleo Personas que se encuentran trabajando 45% 50% 0 1

ingresoTotal de ingresos del trabajo percibidos en el mes anterior (sin valores cero o perdidos)

$ 534.481,20 720.394,40 $

10.000,00 $ 10.000.000,00

IPCIPC de Junio 2013 a precios promedio del 2009

109,51 0 109,51 109,51

ingreso_realIngreso real a precios promedio de 2009 por IPC

488066,10 657834,30 9.132 9131586,00

UF Deflactor por UF a Diciembre de 2007 0,8586594 0 0,8586594 0,8586594

ingreso_UFIngreso real a precios de Diciembre de 2007 por UF

458937,3 618573,4 8.587 8586594

anos_estud Años de estudio 10 5 0 21

exp_pot7 Experiencia Potencial 21 13 0 58

num_trab

Número de trabajadores contratados por los empleadores o trabajadores por cuenta propia (sin valores cero o perdidos)

3 19 0 200

Fuente: DESCRIPCIÓN ARCHIVO MAGNÉTICO – Centro de MicrodatosElaboración: Grupo de trabajo

7 En el cálculo de la experiencia potencial se generaron algunos valores negativos, estos fueron eliminados del cálculo ya que corresponden a personas que estudian y trabajan o que ingresaron a la universidad en una edad temprana

Page 20: econometria250-1_grupo26

Variable Descripción

estrato Agrupación comunal

pcoh Parentesco con el jefe del hogar

sexo Sexo del integrante del hogar

est_act Asiste a un establecimiento educacional actualmente

curso Curso que realiza actualmente o último curso aprobado si no estudia actualmente

tipo Tipo de estudios que realiza o último tipo de estudios aprobado si no estudia actualmente

sitocup1 Situación ocupacional de la población de 14 o más años

mujer Sexo Mujer

hombre Sexo Hombre

PEA Población Económicamente Activa

PEA_fem Mujeres de la Población Económicamente Activa

PEA_masc Hombres de la Población Económicamente Activa

PLF Participación Laboral Femenina

PLM Participación Laboral Masculina

ingtrabTotal de ingresos del trabajo percibidos en el mes anterior (corresponde a la suma de sueldos y salarios e ingresos por actividades independientes)

ln_ingreso Logaritmo natural del ingreso

anos_estud2 Años de estudio al cuadrado (rendimientos marginales)

exp_pot2 Experiencia potencial al cuadrado (rendimientos marginales)

ntrab Número de trabajadores contratados por los empleadores o trabajadores por cuenta propia

ingfam Total de ingresos familiares percibidos en el mes anterior

ln_ingfam Logaritmo natural del ingreso familiar

numper_pcoh

Variable interactiva entrenumper y pcoh

mujer_estud Variable interactiva entre mujer y años de estudio

ingreso100 Variable generada para deflactar el ingreso

factor Factor de expansión

Fuente: DESCRIPCIÓN ARCHIVO MAGNÉTICO – Centro de MicrodatosElaboración: Grupo de trabajo

Page 21: econometria250-1_grupo26

ANEXO 2 – Mapa de calor de ingresos por estrato

Gráfico 4 – Ingreso promedio por estrato y sexo

8

Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

El mapa muestra que el estrato 6 con las comunas de: Lo Barnechea, Providencia, Vitacura

y Las Condes, es en el que las personas tienen mayor ingreso. Las comunas de Quilicura,

Huechuraba, Conchalí, Renca, Independencia, Recoleta y Estación Central son las que

presentan un menor ingreso promedio.

8 Este mapa se generó en STATA a partir de un archivo .shp que contiene las coordenadas para dibujar el mapa, dentro del archivo .shp 4 comunas se encontraban erróneamente especificadas y se tuvo que manipular la imagen con Adobe Illustrador, el proceso para generar el mapa se adjunta en un DO file aparte

Page 22: econometria250-1_grupo26

ANEXO 3 - Elección de la regresión básica

Tabla 11– Elección regresión minceriana básica

Resultados MCO - Variable dependiente: ln_ingresoVariables independientes (1) (2) (3) (4)

anos_estud0,1454108 -0,1277197 -0,0884611 0,1426923(0,00516) (0,0227097) (0,21345) (0,0051826)

exp_pot0,139101 0,0350885 0,0121713 0,0251686

(0,0011546) (0,003523) (0,0011582) 0,0036772

anos_estud2- 0,0109443 0,0095672 -

(0,0008952) (0,0008547)

exp_pot2- -0,0005279 -0,0002565

(0,0000796) (0,770224)

constante10,66723 12,13274 12,02555 10,6243

(0,755373) (0,1470893) (0,1425743) (0,0770224)

VIF (medio) 1,21 20,4 16,93 9,29R-cuadrada 0,2927 0,3424 0,3309 0,2956

Observaciones 3320

Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar

Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

La regresión minceriana seleccionada es la número (4), esta si bien es heterocedástica como

las demás, fue corregida por errores robustos y no presenta temas de multicolinealidad

(promedio), adicionalmente es la de mayor R-cuadrado entre las regresiones con VIF

promedio menor a 10.

Page 23: econometria250-1_grupo26

ANEXO 4 – Otros modelos estimados

Tabla 12– Otros modelos generados

Resultados MCO - Variable dependiente: ln_ingresoVariables independientes

(12) (13) (14)

anos_estud 0,1469362 0,0349926 0,0294497(0,0050874

)(0,0127875

)(0,0128781

)exp_pot 0,0234194 0,0047853 0,0316975

(0,0035195)

(0,0030536)

(0,0100174)

exp_pot2 -0,0002289 - -0,0005952(0,0000783

)- (0,0001824

)mujer -0,3172501 -0,95781 -0,9565452

(0,0262533)

(0,2621837)

(0,26184)

ln_ingfam - 0,6647947 0,6703209- (0,0587806

)(0,0551144

)horas - - 0,0112979

- - (0,0016516)

mujer_estud - 0,0414693 0,043935- (0,0221881

)(0,0218551

)numper_pcoh - -0,0563946 -0,05498

- (0,0075775)

(0,0071677)

dias 0,1618821 0,1309121 -(0,0154563

)(0,0237442

)-

num_trab - 0,0049139 0,0048614- (0,0011346

)(0,0011239

)constante 9,894767 2,943678 2,915731

(0,1144548)

(0,6737041)

(0,636367)

(Condicionada a personas que trabajan, empleo=1)R-cuadrado (ajustado) 0,3758 0,6637 0,6844

Observaciones 3239 580 580Nota: Las cantidades entre paréntesis bajo las estimaciones son los errores estándar

Page 24: econometria250-1_grupo26

Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo

Estos modelos son parte de las combinaciones generadas para tratar de determinar cuáles

variables concuerdan más con un modelo en el cual exista un buen número de

observaciones y buenos contrastes, a continuación se presentan estos.

Tabla 13– Contrastes otros modelos generados

Contrastes MCO - Variable dependiente: ln_ingresoVariables independientes (12) (13) (14)

anos_estud p-value - t 0,000 0,006 0,023Coeficiente

beta0,5989357 0,1153429 0,0970721

exp_pot p-value - t 0,000 0,118 0,002Coeficiente

beta0,3842808 0,0576456 0,3818427

exp_pot2 p-value - t 0,003 - 0,001Coeficiente

beta-0,1755646 - -0,3573053

mujer p-value - t 0,000 0,000 0,000Coeficiente

beta-0,192895 -0,4246218 -0,4240611

ln_ingfam p-value - t - 0,000 0,000Coeficiente

beta- 0,5571444 0,5617758

horas p-value - t - - 0,000Coeficiente

beta- - 0,1955964

mujer_estud p-value - t - 0,062 0,045Coeficiente

beta- 0,238399 0,252574

numper_pcoh

p-value - t - 0,000 0,000Coeficiente

beta- -0,273543 -0,2666813

dias p-value - t 0,000 0,000 -Coeficiente

beta0,1894912 0,1675128 -

num_trab p-value - t - 0,000 0,000Coeficiente

beta- 0,0927916 0,0917996

constante p-value - t 0,000 0,000 0,000

Page 25: econometria250-1_grupo26

Coeficiente beta

- - -

Significancia Global - Prob. F 0,000 0,000 0,000Test de White

P-valor - Chi2 0,000 0,000 0,000Conclusión Heterocedástic

aHeterocedástic

aHeterocedástic

a

VIF (medio) 6,01 4,65 7,19Observaciones 3239 580 580

Fuente:ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN– Centro de MicrodatosElaboración: Grupo de trabajo