Capítulo 1 - Econometría - Gujarati

25
NATURALEZA DEL ANÁLISIS DE REGRESIÓN

description

Diapositivas que resumen el primer capítulo del libro "Econometría" de Gujarati.

Transcript of Capítulo 1 - Econometría - Gujarati

Page 1: Capítulo 1 - Econometría - Gujarati

NATURALEZA DEL ANÁLISIS DE REGRESIÓN

Page 2: Capítulo 1 - Econometría - Gujarati

Origen del término Regresión

• El término Regresión fue acuñado por Francis Galton en su Estudio “Family Likeness in Stature” (1886).• La ley de regresión universal de Galton consiste en un fenómeno

mediante el cual la estatura de los hijos de padres inusualmente altos o inusualmente bajos tiende a dirigirse, a “regresar”, a la estatua promedio de la población.

Page 3: Capítulo 1 - Econometría - Gujarati

Interpretación moderna de la regresión• El análisis de regresión trata del estudio de la dependencia de una

variable (variable dependiente) respecto de una o más variables (variables explicativas) con el objetivo de estimar o predecir la media o valor promedio poblacional de la primera en términos de los valores conocidos o fijos (en muestras repetidas) de las segundas.*

*Gujarati & Porter (2010). Econometría (4° Edición). México: Mcgraw-Hill/Interamericana Editores.

Page 4: Capítulo 1 - Econometría - Gujarati

Estaturas de los hijos correspondientes a las

estaturas de los padres.• Se busca predecir la estatura

promedio de los hijos a partir de la estatura de los padres (valores fijos).

• Para cualquier estatura de un padre existe un rango de estatura de los hijos.

• Las cruces dentro de los círculos indican la estatura promedio de los hijos que corresponde a una estatura determinada de los padres.

• Dichos promedios se conectan para obtener la recta de regresión. A partir de ella se aprecia que el promedio de la estatura de los hijos aumenta conforme crece la de los padres.

Eje

mp

lo d

e a

nális

is d

e r

eg

resi

ón

Diagrama de dispersión

Page 5: Capítulo 1 - Econometría - Gujarati

Estaturas correspondientes a

edades seleccionadas

• Existe un rango (distribución) de estaturas correspondiente a cada edad.

• En promedio, la estatura se incrementa con la edad.

• Si se conoce la edad, se predice la estatura promedio de dicha edad mediante la recta de regresión

Eje

mp

lo d

e a

nális

is d

e r

eg

resi

ón

Diagrama de dispersión

Page 6: Capítulo 1 - Econometría - Gujarati

Tasa de cambio de los salarios nominales en relación con a tasa de desempleo

• La curva de esta figura es un ejemplo de la curva de Phillips.

• Permite predecir el cambio promedio en los salarios nominales con una cierta tasa de desempleo.

Eje

mp

lo d

e a

nális

is d

e r

eg

resi

ón

Page 7: Capítulo 1 - Econometría - Gujarati

Tenencia de dinero en relación con la tasa de

inflación

• Si se mantienen constantes otros factores, cuanto mayor sea la tasa de inflación, menor será la proporción k del ingreso que la gente deseará mantener en forma de dinero.

• Un análisis cuantitativo de esta relación permite predecir la cantidad de dinero, como proporción del ingreso, que la gente deseará mantener con diversas tasas de inflación.

Eje

mp

lo d

e a

nális

is d

e r

eg

resi

ón

Page 8: Capítulo 1 - Econometría - Gujarati

Relaciones Estadísticas• En las relaciones estadísticas entre

variables se analizan variables aleatorias o estocásticas*.• Ejemplo: El rendimiento de un

cultivo depende de la temperatura, lluvia, Sol y fertilizantes. Esta relación es estadística porque las variables explicativas no permiten predecir de manera exacta el rendimiento del cultivo debido a los errores propios de la medición de estas variables y a otra serie de factores (variables) que en conjunto afectan el rendimiento pero son difíciles de identificar individualmente.

Relaciones deterministas• En las relaciones deterministas,

las variables no son aleatorios o estocásticas. Se determinan automáticamente y sin error.• Ejemplo: La ley de la gravedad

de Newton.

• De haber errores de medición, por ejemplo, en la G de la ley de la gravedad, la relación que de otra forma habría sido determinista se convierte en una relación estadística.

*Una variable aleatoria o estocástica es la que toma cualquier conjunto de valores con una probabilidad dada.

Page 9: Capítulo 1 - Econometría - Gujarati

Regresión y causalidad

• A pesar de que el análisis de regresión tiene que ver con la dependencia de una variable respecto de otras variables, esto no implica causalidad necesariamente. • Según Kendall y Stuart (1961): “Una relación estadística, por más

fuerte y sugerente que sea, nunca podrá establecer una conexión causal: nuestras ideas de causalidad deben provenir de estadísticas externas y, en último término, de una u otra teoría”.

Page 10: Capítulo 1 - Econometría - Gujarati

Análisis de correlación

En el análisis de regresión hay una asimetría en el tratamiento a las variables dependientes y explicativas.• La variable dependiente es

estadística, aleatoria o estocástica. • Las variables explicativas tienen

valores fijos.

En el análisis de correlación, se tratan dos variables cualesquiera en forma simétrica; no hay distinción entre las variables dependiente y explicativa. Las dos variables se consideran aleatorias.

Su objetivo principal es medir la fuerza o el grado de asociación lineal entre dos variables, en donde el coeficiente de correlación mide esta

fuerza de asociación.

Regresión Correlación

Page 11: Capítulo 1 - Econometría - Gujarati

Terminología

• Análisis de regresión simple: estudia la dependencia de una variable respecto de una única variable explicativa.

• Análisis de regresión múltiple: estudia la dependencia de una variable respecto de más de una variable explicativa.

Page 12: Capítulo 1 - Econometría - Gujarati

Tipos de datos

Datos de series de tiempoUna serie de tiempo es un conjunto de observaciones sobre los valores de una variable en diferentes momentos. Tal información debe recopilarse en intervalos regulares.

Datos transversalesLos datos transversales consisten en datos de una o más variables recopilados en el mismo punto del tiempo.

Datos combinadosLos datos combinados reúnen elementos de series de tiempo y transversales.• Datos en Panel: tipo especial de datos combinados en el cual se estudia a

través del tiempo la misma unidad transversal

Page 13: Capítulo 1 - Econometría - Gujarati

Fuentes de datosLos datos para el análisis empírico pueden provenir de una dependencia gubernamental, un organismo internacional, una organización privada o un particular.Los datos recopilados por estas organizaciones pueden ser:• Experimentales: frecuentes en las

ciencias naturales, el investigador suele recabar los datos con algunos factores constantes, con el fin de evaluar el efecto de otros en un fenómeno dado.• No experimentales: frecuentes en

las ciencias sociales, no están sujetos al control del investigador.

Limitaciones de datosLa calidad de los datos no siempre es adecuada:• Se puede incurrir en errores de

observación (datos no experimentales) o en errores de medición (datos experimentales).

• Los métodos de muestreo para obtención de datos llegan a variar tanto que a menudo es difícil comparar los resultados de las diversas muestras.

• Las cifras económicas suelen estar disponibles en niveles muy agregados que pueden no ilustrar mucho sobre los sujetos o las microunidades objeto de estudio.

• Debido a su carácter confi dencial, ciertos datos sólo pueden publicarse en forma muy agregada.

Page 14: Capítulo 1 - Econometría - Gujarati

Escala de medición de las variables

Escala de razón

Para la variable X, al tomar dos valores X1 y X2, la razón X1/X2 y la distancia (X2 − X1) son cantidades con un significado. Asimismo, hay un ordenamiento natural de los valores a lo largo de la escala.

Escala de intervalo

Para la variable X, al tomar los valores X1 y X2, la distancia (X2 − X1) es una cantidades con significado. Asimismo, hay un ordenamiento natural de los valores.

Escala ordinal

• Las variables de esta categoría tienen un ordenamiento natural.

Escala nominal

Las variables de esta categoría no tienen ninguna característica de las variables en escala de razón.

Page 15: Capítulo 1 - Econometría - Gujarati

Análisis de regresión con dos variables

Algunas ideas básicas

Page 16: Capítulo 1 - Econometría - Gujarati

Ejemplo hipotético

Los datos de la tabla se refieren a la población total de 60 familias de una comunidad hipotética, así como a su ingreso semanal (X) y su gasto de consumo semanal (Y), en dólares. Las 60 familias se dividen en 10 grupos de ingresos (de 80 dólares a 260); asimismo, aparecen los gastos semanales de cada familia de los diversos grupos. Por consiguiente, hay 10 valores fijos de X y los correspondientes valores Y para cada valor X; así, hay 10 subpoblaciones Y.

Page 17: Capítulo 1 - Econometría - Gujarati

Se observa una variación considerable en el consumo semanal de cada grupo de ingreso. No obstante, en promedio, el consumo semanal se incrementa a medida que aumenta el ingreso.

Page 18: Capítulo 1 - Econometría - Gujarati

Hay 10 valores medios para las 10 subpoblaciones de Y. A estos valores medios se les llama valores esperados condicionales, en virtud de que dependen de los valores de la variable (condicional) X. Se denota E(Y|X).

Page 19: Capítulo 1 - Econometría - Gujarati

• En este caso, el valor esperado incondicional del consumo semanal, E(Y), se obtiene de sumar los consumos semanales de las 60 familias que forman la población y dividir este número entre 60:

• Los diferentes valores esperados condicionales de Y varían respecto del valor esperado incondicional de Y, igual a 121.20 dólares.• Conocer el nivel de ingreso permite predecir mejor el valor medio del

consumo que si se ignora esa información.

Page 20: Capítulo 1 - Econometría - Gujarati

• Los puntos oscuros dentro de círculos de la figura muestran los valores medios condicionales de Y, graficados en función de los diferentes valores de X. Al unir esos valores obtenemos la línea de regresión poblacional (LRP), o, más general, la curva de regresión poblacional (CRP).5 Con palabras más sencillas, es la regresión de Y sobre X.

• Así, desde el punto de vista geométrico, una curva de regresión poblacional es tan sólo el lugar geométrico de las medias condicionales de la variable dependiente para los valores fijos de la(s) variable(s) explicativa(s).

Page 21: Capítulo 1 - Econometría - Gujarati

Función de regresión poblacional (FRP)

• Cada media condicional E(Y|Xi) es función de Xi, donde Xi es un valor dado de X.• Simbólicamente,

donde ƒ(Xi) denota alguna función de la variable explicativa X.• La ecuación se conoce como función de esperanza condicional (FEC), función

de regresión poblacional (FRP) o regresión poblacional (RP).

¿Qué forma adopta la función ƒ(Xi)? Como en una situación real no disponemos de toda la población para efectuar el análisis, la forma funcional de la FRP es una pregunta empírica, aunque en casos específicos la teoría tiene algo que decir.

Page 22: Capítulo 1 - Econometría - Gujarati

• Por ejemplo, un economista puede plantear que el consumo manifiesta una relación lineal con el ingreso. Por tanto, como primera aproximación o hipótesis de trabajo, podemos suponer que la FRP E(Y|Xi) es una función lineal de Xi, del tipo

donde β1 y β2 son parámetros no conocidos pero fijos que se denominan coeficientes de regresión;• La ecuación se conoce como función de regresión poblacional lineal.• En el análisis de regresión, la idea es estimar las FRP como la ecuación

anterior; es decir, estimar los valores no conocidos de β1 y β2 con base en las observaciones de Y y X.

Page 23: Capítulo 1 - Econometría - Gujarati

Significado del término lineal

• El primer significado de linealidad es aquel en que la esperanza condicional de Y es una función lineal de Xi de la forma:

• Geométricamente, la curva de regresión en este caso es una recta.

Page 24: Capítulo 1 - Econometría - Gujarati

Linealidad en los parámetros• La segunda interpretación de linealidad se presenta cuando la esperanza condicional

de Y, E(Y|Xi), es una función lineal de los parámetros, los β; puede ser o no lineal en la variable X.

• Así, los siguientes modelos de E(Y|Xi) son de regresión lineal; es decir, son modelos lineales en los parámetros.

Page 25: Capítulo 1 - Econometría - Gujarati

• En adelante, el término regresión “lineal” siempre significará una regresión lineal en los parámetros; los β (es decir, los parámetros) se elevan sólo a la primera potencia. Puede o no ser lineal en las variables explicativas X.