03 Violacion_supuestos Multicolinealidad

download 03 Violacion_supuestos Multicolinealidad

of 156

description

violación supuestos multicolinial

Transcript of 03 Violacion_supuestos Multicolinealidad

  • UNIVERSIDAD NACIONAL

    SANTIAGO ANTUNEZ DE MAYOLO

    Facultad de Economa y Contabilidad

    Escuela Acadmico Profesional de Economa

    ECONOMETRIA

    II

  • VIOLACIN A LOS

    SUPUESTOS DEL MCRL:

    MULTICOLINEALIDAD

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    INTRODUCCION

    El modelo de Gauss, modelo clsico o estndar de regresin lineal

    (MCRL), es el cimiento de la mayor parte de la teora economtrica y

    plantea siete supuestos.

    1. Modelo de regresin lineal, o lineal en los parmetros.

    2. Los valores de las regresoras, X, son fijos en muestreo repetido

    3. Para X dadas, el valor medio de la perturbacin es cero.

    4. Para X dadas, las varianzas de es constante u homocedstica.

    5. Para X dadas, no hay autocorrelacin en las perturbaciones.

    6. Si las X son estocsticas, el trmino de perturbacin y las X

    (estocsticas) son independientes, o lo menos, no estn

    correlacionadas.

    7. El nmero de observaciones debe ser mayor que el nmero de

    regresoras.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    INTRODUCCION

    8. Debe haber suficiente variabilidad en los valores que toman las

    regresoras.

    9. El modelo de regresin est correctamente especificado

    10. No hay relacin lineal exacta (es decir, no hay multicolinealidad)

    en las regresoras.

    11. El trmino estocstico (de perturbacin) est normalmente

    distribuido.

    El supuesto 2 lo estudiaremos en los modelos de ecuaciones

    simultneas.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    INTRODUCCION

    Respecto al supuesto 3, si no se satisface este supuesto, no podemos

    estimar el intercepto original 1 o podemos obtener una estimacin

    sesgada de 1. Sin embargo, en muchas situaciones prcticas el

    intercepto, 1, es de poca importancia; los parmetros con mayor

    significado son los coeficientes de pendiente, que permanecen

    inalterados aunque se viole el supuesto 3. Adems, en muchas

    aplicaciones el trmino del intercepto no tiene interpretacin alguna.

    Supuesto 10. Este supuesto no es esencial si el objetivo es solamente

    la estimacin. Con el supuesto de normalidad, sin embargo, es

    posible establecer que los estimadores de MCO de los coeficientes

    de regresin siguen la distribucin normal y que pueden utilizarse

    las pruebas t y F para verificar diversas hiptesis estadsticas, sin

    importar el tamao de la muestra.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    INTRODUCCION

    Pero, qu sucede si las ui no estn normalmente distribuidas?

    El hecho de que los estimadores de MCO sigan una distribucin

    normal asinttica (segn el supuesto de varianza homoscedstica y

    valores fijos de X) aunque las perturbaciones no tengan distribucin

    normal es de poca ayuda para los analistas econmicos, que pocas

    veces disponen de datos de muestras grandes.

    Por tanto, el supuesto de normalidad adquiere importancia para los

    fines de pruebas de hiptesis y prediccin. Entonces, teniendo en

    mente los problemas de estimacin y de pruebas de hiptesis, y

    debido a que las muestras pequeas son la regla ms que la excepcin

    en la mayora de los anlisis econmicos, debemos mantener el

    supuesto de normalidad.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    INTRODUCCION

    Por supuesto, esto significa que, cuando se trata de una muestra finita,

    se debe realizar la prueba explcita del supuesto de normalidad

    (Anderson-Darling y Jarque-Bera). Se sugiere aplicar stas u otras

    pruebas de normalidad a los residuos de la regresin Se debe tener en

    cuenta que en muestras finitas sin el supuesto de normalidad, los

    estadsticos usuales t y F pueden no seguir las distribuciones t y F.

    Los supuestos 6, 7 y 8 estn estrechamente interrelacionados y se

    analizan en el tema sobre multicolinealidad.

    El supuesto 4 se estudia en el captulo sobre heteroscedasticidad.

    El supuesto 5, en el captulo sobre autocorrelacin.

    El supuesto 9, en el captulo sobre especificacin de modelos y prueba

    de diagnstico.

    El supuesto 1 se analizar como tema especial.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    El supuesto 8 del modelo clsico de regresin lineal (MCRL) plantea

    que no existe multicolinealidad entre las regresoras incluidas en el

    modelo de regresin. En este captulo consideramos en forma crtica

    el supuesto de no multicolinealidad en busca de respuestas a las

    siguientes preguntas:

    1. Cul es la naturaleza de la multicolinealidad?

    2. Es la multicolinealidad realmente un problema?

    3. Cules son sus consecuencias prcticas?

    4. Cmo se detecta?

    5. Qu medidas pueden tomarse para aliviar el problema de

    multicolinealidad?

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    En este captulo tambin analizaremos el supuesto 6 del MCRL, a

    saber, que el nmero de observaciones en la muestra debe ser mayor

    que el de regresoras, as como el supuesto 7, que requiere una

    variabilidad suficiente en los valores de las regresoras, en vista de que

    ambos estn estrechamente relacionados con el supuesto de la

    multicolinealidad. Al supuesto 6 se le ha denominado, tambin como

    el problema de la micronumerosidad, lo cual simplemente significa

    un tamao pequeo de muestra.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    NATURALEZA DE LA MULTICOLINEALIDAD

    El trmino multicolinealidad originalmente, designaba una relacin

    lineal perfecta o exacta entre algunas o todas las variables

    explicativas de un modelo de regresin. Para la regresin con k

    variables que incluye las variables explicativas X1, X2, . . . , Xk (donde

    X1= 1 para todas las observaciones de forma que den cabida al

    trmino del intercepto), se dice que existe una relacin lineal exacta si

    se satisface la siguiente condicin:

    11 + 22 + + = 0

    Donde:

    1 , 2 son constantes tal que no todas son simultneamente igual a cero.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Hoy en da, sin embargo, el trmino multicolinealidad incluye el caso

    de multicolinealidad perfecta, como lo indica:

    11 + 22 + + = 0

    y tambin el caso en el cual hay X variables intercorrelacionadas pero

    no en forma perfecta, de la siguiente manera:

    11 + 22 + + + = 0

    donde es un trmino de error estocstico.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Para apreciar la diferencia entre multicolinealidad perfecta y

    multicolinealidad menos que perfecta suponga, que 20. Entonces:

    11 + 22 + + = 0

    se escribe como

    que muestra la forma como 2 est exactamente relacionada de manera lineal con otras variables, o cmo se deriva de una

    combinacin lineal de otras variables X.

    En esta situacin, el coeficiente de correlacin entre la variable 2 y la combinacin lineal del lado derecho de la ltima ecuacin est

    obligado a ser igual a uno.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    En forma similar, si 20, la ecuacin:

    11 + 22 + + + = 0

    se escribe como

    lo cual muestra que 2 no es una combinacin lineal exacta de otras Xporque est determinada tambin por el trmino de error estocstico

    .

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Por ejemplo:

    Es evidente que X3i =5X2i. Por consiguiente, hay colinealidad perfecta

    entre X2 y X3, pues el coeficiente de correlacin r23 es la unidad.

    La variable 3 se cre de X3 agregndole simplemente los siguientes

    nmeros, tomados de una tabla de nmeros aleatorios: 2, 0, 7, 9, 2.

    Ahora ya no hay multicolinealidad perfecta entre X2 y 3. Sin

    embargo, las dos variables estn muy correlacionadas, pues los

    clculos indicarn que el coeficiente de correlacin entre ellas es

    0.9959

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    El diagrama de Ballentine representa grficamente el problema de la

    multicolinealidad.. En esta figura los crculos Y, X2 y X3, representan

    las variaciones en Y (la variable dependiente) y en X2 y X3, (las

    variables explicativas). El grado de colinealidad se mide por la

    magnitud de la interseccin (rea sombreada) de los crculos X2 y X3, .

    En la figura (a) no hay interseccin entre X2 y X3, y, por tanto, no hay

    colinealidad. En las figuras (b) (c) (d) y (e), el grado de colinealidad

    va de bajo a alto: entre mayor sea la interseccin entre X2 y X3,

    (es decir, entre mayor sea el rea sombreada), mayor ser el grado de

    colinealidad. En el extremo, si X2 y X3, estuvieran superpuestos

    completamente (o si X2 estuviera por completo dentro de X3, o

    viceversa), la colinealidad sera perfecta.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Observe que la multicolinealidad, como la definimos, se refiere slo a

    relaciones lineales entre las variables X. Este concepto no aplica a las

    relaciones no lineales entre ellas. Por ejemplo, considere el siguiente

    modelo de regresin:

    = 0 + 1 + 22 + 3

    3 + Donde:

    : Costo total de produccin

    : Produccin

    Las variables 2 (produccin al cuadrado) y

    3 (produccin al cubo)

    por supuesto estn funcionalmente relacionadas con , pero la relacin es no lineal. De manera estricta, por consiguiente, modelos

    como no lineales no violan el supuesto de no multicolinealidad.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Sin embargo, en aplicaciones concretas, el coeficiente de correlacin

    medido de forma convencional demostrar que , 2

    3 estn

    altamente correlacionadas, lo cual dificultar estimar los parmetros

    de este modelo regresional con mayor precisin (es decir, con errores

    estndar pequeos).

    Por qu supone el modelo clsico de regresin lineal que no hay

    multicolinealidad entre las X?

    El razonamiento es el siguiente: Si la multicolinealidad es perfecta,

    los coeficientes de regresin de las variables X son indeterminados y

    sus errores estndar, infinitos. Si la multicolinealidad es menos que

    perfecta, los coeficientes de regresin, aunque sean determinados,

    poseen grandes errores estndar (en relacin con los coeficientes

    mismos), lo cual significa que los coeficientes no pueden ser

    estimados con gran precisin o exactitud.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Existen diversas fuentes de multicolinealidad y puede deberse a los

    siguientes factores:

    1. El mtodo de recoleccin de informacin. Por ejemplo, la

    obtencin de muestras en un intervalo limitado de valores tomados

    por las regresoras en la poblacin.

    2. Restricciones en el modelo o en la poblacin objeto de muestreo.

    Por ejemplo, en la regresin del consumo de electricidad sobre el

    ingreso (2) y el tamao de las viviendas (3) hay una restriccin fsica en la poblacin, pues las familias con ingresos ms altos

    suelen habitar viviendas ms grandes que las familias con ingresos

    ms bajos.

    3. Especificacin del modelo. Por ejemplo, la adicin de trminos

    polinomiales a un modelo de regresin, en especial cuando el

    rango de la variable X es pequeo.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    4. Un modelo sobredeterminado. Esto sucede cuando el modelo tiene

    ms variables explicativas que el nmero de observaciones. Esto

    puede suceder en investigacin mdica, donde en ocasiones hay

    un nmero reducido de pacientes sobre quienes se rene

    informacin respecto de un gran nmero de variables.

    5. Otra razn para la multicolinealidad, sobre todo en los datos de

    series de tiempo, puede ser que las regresoras del modelo

    compartan una tendencia comn; es decir, que todas aumenten o

    disminuyan a lo largo del tiempo. Por tanto, en la regresin del

    gasto de consumo sobre el ingreso, la riqueza y la poblacin, las

    regresoras ingreso, riqueza y poblacin tal vez todas crezcan con

    el tiempo a una tasa aproximadamente igual, con lo cual se

    presentara la colinealidad entre dichas variables.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD

    PERFECTA

    Un modelo de regresin con tres variables, expresado con la forma de

    desviacin, en la cual todas la variables se expresan como

    desviaciones de sus medias muestrales, se escribe de la siguiente

    manera:

    = 22 + 33 + Los estimadores 2 y 3 se calculan de la siguiente manera:

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Suponga ahora que 3 = 2 en donde es una constante diferente de cero (por ejemplo, 2, 4, 1.8, etc.). Si sustituimos esto en la

    ecuacin que define 2 obtenemos

    Que es una expresin indeterminada.

    Se puede demostrar que 3 tambin es indeterminada.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Porqu obtenemos obtenemos 2 =0

    0?

    Recuerde el significado de 2: da la tasa de cambio en el valor promedio de Y a medida que 2 cambia en una unidad, manteniendo

    3 constante. Pero si 3 y 2 son perfectamente colineales, no hay forma de que 3 se mantenga constante: a medida que 2 cambia, tambin lo hace 3 por el factor .

    Esto significa, entonces, que no hay forma de desenredar las

    influencias separadas de 2 y 3 de la muestra dada: para fines prcticos, 2 y 3 son indistinguibles. En la econometra aplicada, este problema ocasiona mucho dao, pues la idea consiste en separar

    los efectos parciales de cada X sobre la variable dependiente.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Otra forma de ver el mismo cuadro es la siguiente:

    Sustituya 3 = 2 en:

    = 22 + 33 + se obtiene lo siguiente:

    = 22 + 32 +

    = 2 2 + 3 +

    = 2 +

    Donde

    = 2 + 3

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Al aplicar la conocida frmula de MCO a

    = 2 +

    Obtenemos:

    = 2 + 3 = 2

    22

    Por consiguiente, aunque se puede estimar en forma nica, no hay forma de estimar 2 y 3 en forma igualmente nica.

    Matemticamente:

    = 2 + 3

    nos proporciona una sola ecuacin con dos incgnitas (observe que

    est dada) y existen infinidad de soluciones para = 2 + 3 con

    valores dados de y .

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Para expresar esto en trminos concretos, sea = 0.8 y = 2. Entonces:

    0.8 = 2 + 23

    2 = 0.8 23

    Ahora seleccione un valor de 3 arbitrariamente y tendr una solucin para 2. Seleccione otro valor para 3 y tendr otra solucin para 2. No importa cunto lo intente, no existe un valor nico para 2.

    En conclusin, en el caso de multicolinealidad perfecta, no puede

    obtenerse una solucin nica para los coeficientes de regresin

    individual. Sin embargo, se puede obtener una solucin nica para

    combinaciones lineales de estos coeficientes.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    La combinacin lineal 2 + 3 se estima en forma nica con ,

    dado el valor de .

    Asimismo, observe que en el caso de multicolinealidad perfecta, las

    varianzas y los errores estndar de 2 y 3 individualmente son infinitos.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD

    ALTA PERO IMPERFECTA

    La situacin de multicolinealidad perfecta es un extremo patolgico.

    Por lo general no existe una relacin lineal exacta entre las variables

    X, en especial en informacin econmica relacionada con series de

    tiempo.

    Por tanto, de regreso al modelo de tres variables en forma de

    desviacin:

    = 22 + 33 + en lugar de multicolinealidad exacta podemos tener

    3 = 2 + Donde 0 y donde es un trmino de error estocstico tal que 2

    = 0

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD

    ALTA PERO IMPERFECTA

    En este caso, sera posible la estimacin de los coeficientes de

    regresin 2 y 3. Por ejemplo, al sustituir 3 = 2 + en

    Obtenemos:

    Donde se aprovecha que 2 = 0 Se deriva una expresin similar

    para 3

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD

    ALTA PERO IMPERFECTA

    Ahora, a diferencia del clculo de 2 anterior, esta beta si puede estimarse. Desde luego, si es lo bastante pequeo, es decir, muy cercano a cero, la ecuacin

    3 = 2 + indicar colinealidad casi perfecta, y regresaremos al caso

    indeterminado.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD

    En el MCRL, si se satisfacen los supuestos, los estimadores de MCO

    de los coeficientes de regresin son MELI. Sin embargo, puede

    demostrarse que, aunque la multicolinealidad sea muy alta, los

    estimadores de MCO conservarn la propiedad MELI.

    Entonces, cules son los inconvenientes de la multicolinealidad?

    Christopher Achen comenta al respecto:

    Los novatos en el estudio de la metodologa en ocasiones se

    preocupan porque sus variables independientes estn

    correlacionadas: el llamado problema de multicolinealidad. Sin

    embargo, la multicolinealidad no viola los supuestos bsicos de la

    regresin...

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD

    Se presentarn estimaciones consistentes e insesgadas y sus errores

    estndar se estimarn en la forma correcta. El nico efecto de la

    multicolinealidad tiene que ver con la dificultad de obtener los

    coeficientes estimados con errores estndar pequeos. Sin embargo,

    se presenta el mismo problema al contar con un nmero reducido de

    observaciones o al tener variables independientes con varianzas

    pequeas. (De hecho, en el nivel terico, los conceptos de

    multicolinealidad, nmero reducido de observaciones y varianzas

    pequeas en las variables independientes forman parte esencial del

    mismo problema.) Por tanto, la pregunta qu debe hacerse

    entonces con la multicolinealidad? es similar a qu debe hacerse

    si no se tienen muchas observaciones? Al respecto no hay una

    respuesta estadstica.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD

    Para referirse a la importancia del tamao de la muestra, Goldberger

    acu el trmino micronumerosidad, como contraparte del extico

    nombre polislabo de multicolinealidad.

    De acuerdo con Goldberger, la micronumerosidad exacta (la

    contraparte de multicolinealidad exacta) surge cuando n, el tamao de

    la muestra, es cero, en cuyo caso es imposible cualquier clase de

    estimacin. La casi micronumerosidad, igual que la casi

    multicolinealidad, surge cuando el nmero de observaciones

    escasamente excede al nmero de parmetros que se va a estimar.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD

    1. Es cierto que aun en el caso de casi multicolinealidad los

    estimadores de MCO son insesgados. Pero el insesgamiento es una

    propiedad multimuestral o de muestreo repetido. Esto significa que, si

    mantenemos fijos los valores de X, si obtenemos muestras repetidas y

    calculamos los estimadores de MCO para cada una de esas muestras,

    el promedio de los valores muestrales se aproximar a los verdaderos

    valores poblacionales de los estimadores a medida que aumenta el

    nmero de las muestras. Pero esto nada dice sobre las propiedades de

    los estimadores en una muestra dada.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD

    2. Es cierto que la colinealidad no destruye la propiedad de varianza

    mnima: en la clase de los estimadores lineales insesgados, los

    estimadores de MCO tienen varianza mnima; es decir, son eficientes.

    Pero esto no significa que la varianza de un estimador de MCO

    necesariamente sea pequea (en relacin con el valor del estimador)

    en cualquier muestra dada.

    3. La multicolinealidad es en esencia un fenmeno (de regresin)

    muestral en el sentido en que, aunque las variables X no estn

    linealmente relacionadas en la poblacin, pueden estarlo en la muestra

    particular disponible: cuando se postula la funcin de regresin

    terica o poblacional (FRP), se considera que todas las variables X

    incluidas del modelo ejercen una influencia separada o independiente

    sobre la variable dependiente Y.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD

    Pero puede suceder que en cualquier muestra dada con que se pruebe

    la FRP, alguna o todas las variables X sean tan colineales que no sea

    posible aislar su influencia individual sobre Y. Es decir, la muestra

    falla aunque la teora establezcaque todas las X son importantes. En

    resumen, la muestra puede no ser lo bastante rica para acomodar

    todas las variables X en el anlisis.

    Por todas estas razones, el hecho de que los estimadores de MCO sean

    MELI a pesar de la presencia de multicolinealidad es poco consuelo

    en la prctica.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS PRCTICAS DE LA MULTICOLINEALIDAD.

    En los casos de casi o alta multicolinealidad es probable que se

    presenten las siguientes consecuencias:

    1. Aunque los estimadores de MCO son MELI (Mejor Estimador

    Lineal Insesgado) (Insesgado: su valor promedio o esperado,

    (2), es igual al valor verdadero, 2), presentan varianzas y covarianzas grandes que dificultan la estimacin precisa.

    2. Debido a la consecuencia (1), los intervalos de confianza tienden a

    ser mucho ms amplios, lo cual propicia una aceptacin ms fcil

    de la hiptesis nula cero (es decir, que el verdadero coeficiente

    poblacional es cero).

    3. Tambin debido a la consecuencia (1), la razn t de uno o ms

    coeficientes tiende a ser estadsticamente no significativa.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    CONSECUENCIAS PRCTICAS DE LA MULTICOLINEALIDAD.

    4. Aunque la razn t de uno o ms coeficientes sea estadsticamente

    no significativa, 2, la medida global de bondad de ajuste, puede ser muy alta.

    5. Los estimadores de MCO y sus errores estndar son sensibles a

    pequeos cambios en los datos.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Estimadores de MCO con varianzas y covarianzas grandes

    Si r23 es el coeficiente de correlacin entre X2 y X3 y si las varianzas y

    covarianzas estn dadas por:

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Estimadores de MCO con varianzas y covarianzas grandes

    De 2 y 3 se desprende que, a medida que r23 tiende a 1,

    es decir, a medida que aumenta la colinealidad, tambin lo hacen las

    varianzas de los dos estimadores y, en el lmite, cuando r23= 1, son

    infinitas.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Estimadores de MCO con varianzas y covarianzas grandes

    En el caso de 2, 3 , es igualmente claro que, a medida que r23aumenta hacia 1, la covarianza de los dos estimadores tambin

    aumenta en valor absoluto.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Estimadores de MCO con varianzas y covarianzas grandes

    La velocidad con que se incrementan las varianzas y covarianzas se ve

    con el factor inflacionario de la varianza (FIV), que se define como:

    El FIV muestra la forma en que la varianza de un estimador se infla

    por la presencia de la multicolinealidad. A medida que 232 se acerca a

    1, el FIV se acerca a infinito. Es decir, a medida que el grado de

    colinealidad aumenta, la varianza de un estimador tambin y, en el

    lmite, se vuelve infinita. Como se aprecia, si no hay colinealidad

    entre X2 y X3, el FIV ser 1.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Estimadores de MCO con varianzas y covarianzas grandes

    As, las varianzas de los estimadores se definen::

    Cabe observar que el inverso del FIV se conoce como tolerancia

    (TOL). Es decir,

    Cuando 2 = 1 (es decir, colinealidad perfecta), = 0, y cuando

    2 = 0 (es decir, no existe ninguna colinealidad), = 1.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Intervalos de confianza ms amplios

    Debido a los errores estndar grandes, los intervalos de confianza para los

    parmetros poblacionales relevantes tienden a ser mayores.

    En casos de alta multicolinealidad, los datos muestrales pueden ser

    compatibles con un diverso conjunto de hiptesis. De ah que aumente la

    probabilidad de aceptar una hiptesis.

    Razones t no significativas

    Recuerde que para probar la hiptesis nula de que, por ejemplo, 2 = 0,

    utilizamos la razn t, es decir, 2/ = 0 2 y comparamos el valor testimado con el valor t crtico de la tabla t. Pero, como vimos, en casos de

    alta colinealidad los errores estndar estimados aumentan drsticamente, lo

    que disminuye los valores t. Por consiguiente, en tales casos se acepta cada

    vez con mayor facilidad la hiptesis nula de que el verdadero valor

    poblacional relevante es cero.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    alta pero pocas razones t significativas

    Consideremos el modelo de regresin lineal con k variables:

    = 1 + 22 + + +

    En casos de alta colinealidad es posible encontrar, como acabamos de

    mencionar, que uno o ms coeficientes parciales de pendiente son, de

    manera individual, no significativos estadsticamente con base en la prueba

    t. Aun as, en tales situaciones puede ser tan alto, digamos, superior

    a 0.9, que, con base en la prueba F, es posible rechazar convincentemente la

    hiptesis de que

    2 = 3 = = = 0

    En realidad, sta es una de las seales de multicolinealidad: valores t no

    significativos pero un global alto (y un valor F significativo).

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Sensibilidad de los estimadores de MCO y sus errores estndar ante

    cambios pequeos en los datos

    Siempre que la multicolinealidad no sea perfecta, es posible la estimacin de

    los coeficientes de regresin; sin embargo, las estimaciones y sus errores

    estndar se tornan muy sensibles aun al ms ligero cambio de los datos.

    Por ejemplo, considere los siguientes datos hipotticos:

    Y X2 X3

    1 2 4

    2 0 2

    3 4 12

    4 6 0

    5 8 16

    DATOS HIPOTETICOS DE Y, X2 y X3 Con base en estos datos obtenemos la

    siguiente regresin mltiple:

    = 1.1639 + 0.44632 + 0.00303 0.7737 0.1848 (0.0851)

    = 1.5431 2.4151 (0.0358)

    2 = 0.8101 23 = 0.5523

    2, 3 = 0.00868 = 2

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ahora considere la tabla adjunta en que se

    intercambiaron el tercer y el cuarto valores de

    X3. Con esta informacin obtenemos:

    = 1.2108 + 0.40142 + 0.02703 0.7480 0.2721 (0.1252)

    = 1.6187 1.4752 (0.2158)

    2 = 0.8143 23 = 0.8285

    2, 3 = 0.0282 = 2

    Como resultado de un ligero cambio en los datos vemos que 2, antes estadsticamente significativo en un nivel de significancia de 10%, deja

    ahora de serlo aun en ese nivel. Observe tambin que antes, la

    2 , 3 = 0.00868 mientras que ahora es 0.0282, un aumento superior a tres veces su valor inicial.

    Y X2 X3

    1 2 4

    2 0 2

    3 4 0

    4 6 12

    5 8 16

    DATOS HIPOTETICOS DE Y, X2 y X3

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    = 1.2108 + 0.40142 + 0.02703 0.7480 0.2721 (0.1252)

    = 1.6187 1.4752 (0.2158)

    2 = 0.8143 23 = 0.8285

    2, 3 = 0.0282 = 2

    Todos estos cambios pueden atribuirse a un aumento de la multicolinealidad:

    * Inicialmente, 23 = 0.5523; ahora, 23 = 0.8285. En forma similar, los errores estndar de 2 3 aumentan entre las dos

    regresiones, sntoma caracterstico de la colinealidad.

    En presencia de alta colinealidad, no se pueden estimar los coeficientes de regresin individuales en forma precisa, pero las combinaciones

    lineales de estos coeficientes se estiman con mayor exactitud. Esto se

    confirma con las regresiones anteriores.

    Y X2 X3

    1 2 4

    2 0 2

    3 4 0

    4 6 12

    5 8 16

    DATOS HIPOTETICOS DE Y, X2 y X3

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    = 1.2108 + 0.40142 + 0.02703 0.7480 0.2721 (0.1252)

    = 1.6187 1.4752 (0.2158)

    2 = 0.8143 23 = 0.8285

    2, 3 = 0.0282 = 2

    En la primera regresin, la suma de los dos coeficientes parciales de las pendientes es 0.4493, en tanto que en la segunda regresin dicha suma es

    0.4284, prcticamente la misma.

    No slo eso: sus errores estndar son prcticamente los mismos, 0.1550 frente a 0.1823. Los errores estandar se obtienen de:

    Observe, sin embargo, que el coeficiente de X3 cambi en forma notoria, de 0.003 a 0.027.

    = 1.1639 + 0.44632 + 0.00303 0.7737 0.1848 (0.0851)

    = 1.5431 2.4151 (0.0358)

    2 = 0.8101 23 = 0.5523

    2, 3 = 0.00868 = 2

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo:

    y X2 X3

    70 80 810

    65 100 1009

    90 120 1273

    95 140 1425

    110 160 1633

    115 180 1876

    120 200 2052

    140 220 2201

    155 240 2435

    150 260 2686

    Datos hipoteticos sobre consumo,

    ingreso y riqueza

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo:Resumen

    Estadsticas de la regresin

    Coeficiente de correlacin mltiple 0.98158

    Coeficiente de determinacin R^2 0.96350

    R^2 ajustado 0.95308

    Error tpico 6.80804

    Observaciones 10

    ANLISIS DE VARIANZA

    Grados de

    libertad

    Suma de

    cuadrados

    Promedio de

    los cuadrados F

    Regresin 2 8565.55407 4282.77704 92.40196

    Residuos 7 324.44593 46.34942

    Total 9 8890

    Coeficientes Error tpico Estadstico t Probabilidad

    Intercepcin 24.77473 6.75250 3.66897 0.00798

    Variable X 1 0.94154 0.82290 1.14417 0.29016

    Variable X 2 -0.04243 0.08066 -0.52606 0.61509

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    La regresin muestra que el ingreso y la riqueza explican en conjunto

    alrededor de 96% de la variacin en los gastos de consumo. A pesar de esto,

    ningn coeficiente de las pendientes es estadsticamente significativo de

    manera individual. Adems, no slo la variable riqueza es estadsticamente

    no significativa, sino que tambin tiene el signo incorrecto. A priori, se

    esperara una relacin positiva entre el consumo y la riqueza.

    A pesar de que los estimadores no son significativos individualmente en

    trminos estadsticos, si se prueba la hiptesis de que 2=3=0

    simultneamente, esta hiptesis puede rechazarse.

    En la hoja de respuesta de la regresin, podemos ver que el estadstico F es

    altamente significativo con el valor de F=92.4019

    El valor F se puede calcular teniendo en cuenta la suma de los errores al

    cuadrado de la regresin y de los residuos; luego dividimos estos valores

    entre su correspondiente grados de libertad. El resultado de dicha divisin se

    vuelve a dividir.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    El ejemplo muestra en forma muy evidente lo que hace la multicolinealidad.

    El hecho de que la prueba F sea significativa pero los valores t de X2 y X3

    no sean significativos individualmente implica que las dos variables estn

    tan correlacionadas que es imposible aislar el impacto individual del ingreso

    o de la riqueza sobre el consumo.

    Regresionar: X3 sobre X2

    Regresionar: Y sobre X2

    Regresionar: Y sobre X3

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio 10.27

    La tabla 10.13 proporciona cifras sobre importaciones (M), PIB e ndice de

    precios al consumidor (IPC) de Estados Unidos de 1975 a 2005. Se le pide

    considerar el siguiente modelo:

    Ln Mt=1+ 2 lnPIBt + 3 ln IPCt + mt

    a) Estime los parmetros de este modelo con la informacin de la tabla.

    b) Sospecha multicolinealidad en los datos?

    c) Efecte las siguientes regresiones:

    1) Ln Mt= A1 + A2 ln PBIt

    2) ln Mt = B1 + B1 ln IPCt

    3) ln PBIt = C1 + C2 ln IPCt

    Con base en estas regresiones, qu puede decir sobre la naturaleza de la

    multicolinealidad en los datos?

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio 10.27

    Ln Mt=1+ 2 lnPIBt + 3 ln IPCt + mt

    a) Estime los parmetros de este modelo con la informacin de la tabla.

    El alto valor de R2 y el

    valor no significativo de t

    del coeficiente de Ln IPC

    indican que

    probablemente existe

    multicolinealaidad en los

    datos.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio 10.27

    c) Efecte las siguientes regresiones: 1) Ln Mt= A1 + A2 ln PBIt

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio 10.27

    c) Efecte las siguientes regresiones: 2) ln Mt = B1 + B1 ln IPCt

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio 10.27

    c) Efecte las siguientes regresiones: 3) ln PBIt = C1 + C2 ln IPCt

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio 10.27

    Con base en estas regresiones, qu puede decir sobre la naturaleza de la

    multicolinealidad en los datos?

    La regresin LnPBI sobre LnIPC muestran alta correlacin entre estas dos

    variables, lo que sugiere que los datos sufren del problema de colinealidad.

    La mejor solucin sera expresar

    las importaciones y el PBI en

    trminos reales, dividiendo cada

    uno por el IPC (recordar el

    mtodo de la razn que se

    discuti en el captulo anterior.

    Los resultados son los

    siguientes:

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo 10.7: Funcin de consumo para EE.UU

    A continuacin consideraremos un grupo de datos sobre gasto de consumo

    real (C), ingreso personal disponible real (Yd), riqueza real (W) y tasa de

    inters real (I) para Estados Unidos, de 1947 a 2000. Hallar la regresin de

    los datos, empleando lo siguiente:

    = 1 + 2 + 3 + 4 + En este modelo, los coeficientes 2 y 3 dan las elasticidades del ingreso y la riqueza, respectivamente; 4 da la semielasticidad.

    Los resultados de la regresin se presentan en la siguiente tabla:

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo 10.7: Funcin de consumo para EE.UU

    Los resultados demuestran que

    todos los coeficientes estimados

    son significativos desde el punto

    de vista estadstico, pues sus

    valores p son muy pequeos.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo 10.7: Funcin de consumo para EE.UU

    Los coeficientes estimados se

    interpretan como sigue: la

    elasticidad del ingreso es 0.80,

    lo que indica que, cuando las

    dems variables se mantienen

    constantes, si el Yd aumenta 1%,

    la media del gasto de C aumenta

    0.8%. El coeficiente de riqueza

    es 0.20, lo que significa que si

    la riqueza aumenta 1%, la media

    del consumo se incrementa slo

    0.2%, de nuevo cuando las

    variables se mantienen

    constantes.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo 10.7: Funcin de consumo para EE.UU

    El coeficiente de la variable

    tasa de inters indica que, a

    medida que la tasa de inters

    aumenta un punto porcentual,

    el gasto de consumo disminuye

    0.26%, ceteris paribus.

    Todas las regresoras tienen

    signos que concuerdan con las

    expectativas previas, es decir,

    el ingreso y la riqueza tienen

    efecto positivo en el consumo,

    pero la tasa de inters produce

    un efecto negativo.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo 10.7: Funcin de consumo para EE.UU

    Hay que preocuparse por el

    problema de la multicolinealidad

    en este caso? Al parecer no,

    porque todos los coeficientes

    tienen los signos correctos, cada

    coeficiente es muy significativo

    estadsticamente en lo individual

    y el valor F tambin es

    estadsticamente muy

    significativo, lo que indica que, en

    conjunto, todas las variables

    tienen efecto significativo en el

    gasto de consumo. El valor R2

    tambin es muy alto.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo 10.7: Funcin de consumo para EE.UU

    Por supuesto, casi siempre

    existe cierto grado de

    colinealidad entre las variables

    econmicas. Con tal de que no

    sea exacto se pueden estimar

    los parmetros del modelo. Por

    el momento, lo nico que se

    puede decir es que, en el

    presente ejemplo, la

    colinealidad, si la hay, no

    parece muy marcada.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    Cmo conocer la presencia de colinealidad en cualquier situacin dada, en

    especial en modelos con ms de dos variables explicativas?

    Advertencias:

    1. La multicolinealidad es una cuestin de grado y no de clase. La distincin

    importante no es entre presencia o ausencia de multicolinealidad, sino entre

    sus diferentes grados.

    2. Como la multicolinealidad se refiere a la condicin de las variables

    explicativas que son no estocsticas por supuestos, es una caracterstica de la

    muestra y no de la poblacin.

    Por consiguiente, no es necesario llevar a cabo pruebas sobre

    multicolinealidad, pero, si se desea, es posible medir su grado en cualquier muestra determinada.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    Como la multicolinealidad es en esencia un fenmeno de tipo muestral que

    surge de informacin sobre todo no experimental recopilada en la mayora

    de las ciencias sociales, no hay un mtodo nico para detectarla o medir su

    fuerza. Lo que se tiene en realidad son ciertas reglas prcticas, algunas

    informales y otras formales, pero todas reglas prcticas. Consideremos

    algunas de ellas.

    1. Una R2 elevada pero pocas razones t significativas. Como ya

    mencionamos, es un sntoma clsico de multicolinealidad. Si R2 es alta (por encima de 0.8), la prueba F, en la mayora de los casos,

    rechazar la hiptesis de que los coeficientes parciales de pendiente son

    simultneamente iguales a cero, pero las pruebas t individuales

    mostrarn que ningn coeficiente parcial de pendiente, o muy pocos,

    son estadsticamente diferentes de cero (ver ejemplo de consumo-

    ingreso-riqueza).

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    2. Altas correlaciones entre parejas de regresoras. Otra regla prctica

    recomendable consiste en observar el coeficiente de correlacin de

    orden cero o entre dos regresoras. Si ste es alto (superior a 0.8), la

    multicolinealidad es un problema grave.

    La desventaja con este criterio es que, aunque las altas correlaciones de

    orden cero pueden sugerir la presencia de colinealidad, no es necesario

    que dichas correlaciones sean altas para tener colinealidad en un

    determinado caso especfico. En trminos un poco tcnicos: las

    correlaciones de orden cero elevadas son una condicin suficiente pero

    no necesaria para la existencia de multicolinealidad, debido a que puede

    existir a pesar de que las correlaciones de orden cero o correlaciones

    simples sean comparativamente bajas (es decir, inferiores a 0.50).

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    En los modelos donde hay ms de dos variables explicativas, la

    correlacin simple o de orden cero no proporciona una gua infalible

    sobre la presencia de multicolinealidad. Claro que si slo existen dos

    variables explicativas, bastarn las correlaciones de orden cero.

    3. Examen de las correlaciones parciales. Debido al problema recin

    descrito, que se basa en correlaciones de orden cero, otros sugieren que

    debe observarse, en lugar de ellas, los coeficientes de correlacin

    parcial. De esta forma, en la regresin de Y sobre X2, X3 y X4, si se

    encuentra que 1.2342 es muy elevada pero 12.34

    2 , 13.242 y 14.24

    2 son

    comparativamente bajas, esto puede sugerir que las variables X2, X3 y X4estn muy intercorrelacionadas y que por lo menos una de estas

    variables es superflua.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    4. Regresiones auxiliares. Como la multicolinealidad surge porque una o

    ms de las regresoras son combinaciones lineales exactas o aproximadas

    de las dems regresoras, una forma de determinar cul variable X est

    relacionada con las dems variables X es efectuar la regresin de cada Xi

    sobre las variables X restantes y calcular la R2 correspondiente; cada una

    de estas regresiones se denomina regresin auxiliar de Y sobre las X.

    As, conforme a la relacin entre F y R2, la variable:

    Sigue la distribucin F con k-2 y n-k+1 gl. En la ecuacin n es el tamao

    de la muestra, k es el nmero de variables explicativas, incluyendo el

    intercepto y 1.232 es el coeficiente de determinacin en la

    regresin de la variable sobre las variables X restantes.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    Si la F calculada excede a la Fi crtica en el nivel de significancia

    seleccionado, se dice que la Xi particular es colineal con las dems X; si

    no excede a la Fi crtica, se dice que sta no es colineal con las dems X,

    en cuyo caso se puede mantener la variable en el modelo. Si Fi es

    estadsticamente significativa, an hay que decidir si la Xi en

    consideracin debe eliminarse del modelo.

    Sin embargo, este mtodo no carece de desventajas, pues si la

    multicolinealidad comprende slo unas cuantas variables, de forma que

    las regresiones auxiliares no sufran de multicolinealidad extensa, los

    coeficientes estimados pueden revelar la naturaleza de la dependencia

    lineal entre las regresoras. Por desgracia, si existen diversas

    asociaciones lineales complejas, este ejercicio de ajuste de curva puede

    no tener gran valor, pues ser difcil identificar las interrelaciones

    separadas.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    En lugar de probar formalmente todos los valores R2 auxiliares, se puede

    adoptar la regla prctica de Klein, que sugiere que la multicolinealidad

    puede ser un problema complicado solamente si la R2 obtenida de una

    regresin auxiliar es mayor que la R2 global, es decir, si se obtiene de la

    regresin de Y sobre todas las regresoras. Por cierto, al igual que todas

    las dems reglas prcticas, sta debe utilizarse con buen criterio.

    5. Valores propios e ndice de condicin. Mediante EViews y Stata

    podemos calcular los valores propios y el ndice de condicin para

    diagnosticar la multicolinealidad. A partir de estos valores propios puede

    derivarse lo que se conoce como nmero de condicin k, definido

    como:

    =

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    y el ndice de condicin (IC), definido como:

    Entonces tenemos esta regla prctica: Si k est entre l00 y 1000, existe una

    multicolinealidad que va de moderada a fuerte, mientras que si excede de

    1000, existe multicolinealidad grave.

    De otro modo, si el IC est entre 10 y 30, hay multicolinealidad entre

    moderada y fuerte, y si excede de 30, una multicolinealidad grave.

    Algunos autores consideran que e1 ndice de condicin es el mejor

    diagnstico de multicolinealidad disponible. Sin embargo, esta opinin no es

    muy aceptada. As, el IC es slo una regla prctica, quiz un poco ms

    compleja.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    6. Tolerancia y factor de inflacin de la varianza. Ya vimos el FIV y la

    TOL. Conforme 2 -el coeficiente de determinacin en la regresin de

    la regresora Xj sobre las regresoras restantes del modelo- se aproxima a

    la unidad, es decir, conforme se incrementa la colinealidad de Xj con las

    dems regresoras, FIV tambin aumenta, y en el lmite puede ser

    infinito.

    Algunos autores utilizan, por consiguiente, el FIV como indicador de la

    multicolinealidad: entre mayor es el valor del FIVj, mayor problema

    o colinealidad tiene la variable Xj. Pero, cunto debe ascender el FIV

    antes de que una regresora se convierta en un problema? Como regla

    prctica, si el FIV de una variable es superior a 10 (esto sucede si 2

    excede de 0.90), se dice que esa variable es muy colineal.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    Desde luego, puede utilizarse TOLj como medida de la

    multicolinealidad, en vista de su estrecha conexin con FIVj. Mientras

    ms cerca est TOLj de cero, mayor ser el grado de colinealidad de esa

    variable respecto de las dems regresoras. Por otra parte, mientras ms

    cerca est TOLj de 1, mayor ser la evidencia de que Xj no es colineal

    con las dems regresoras.

    7. Diagrama de dispersin. Es una buena prctica usar un diagrama de

    dispersin para ver cmo se relacionan las diversas variables de un

    modelo de regresin. La siguiente figura presenta el diagrama de

    dispersin del ejemplo de consumo analizado anteriormente.

    Se trata de un diagrama de cuatro por cuatro cuadros porque hay cuatro

    variables en el modelo, una variable dependiente (C) y tres variables

    explicativas: ingreso personal disponible real (Yd), riqueza real (W) y

    tasa de inters real (I).

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    0

    1000

    2000

    3000

    4000

    5000

    6000

    7000

    -12 -8 -4 0 4 8

    I

    C0

    1

    0

    1000

    2000

    3000

    4000

    5000

    6000

    7000

    0 10000 20000 30000 40000

    W

    C0

    1

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    0

    1000

    2000

    3000

    4000

    5000

    6000

    7000

    0 1000 2000 3000 4000 5000 6000 7000

    YD

    C0

    1

    4000

    8000

    12000

    16000

    20000

    24000

    28000

    32000

    36000

    40000

    -12 -8 -4 0 4 8

    I

    W

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    0

    1000

    2000

    3000

    4000

    5000

    6000

    7000

    -12 -8 -4 0 4 8

    I

    YD

    4000

    8000

    12000

    16000

    20000

    24000

    28000

    32000

    36000

    40000

    0 1000 2000 3000 4000 5000 6000 7000

    YD

    W

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    0

    1000

    2000

    3000

    4000

    5000

    6000

    7000

    C0

    1

    -12

    -8

    -4

    0

    4

    8

    I

    4000

    8000

    12000

    16000

    20000

    24000

    28000

    32000

    36000

    40000

    W

    0

    1000

    2000

    3000

    4000

    5000

    6000

    7000

    0 1000 2000 3000 4000 5000 6000 7000

    C01

    YD

    -12 -8 -4 0 4 8

    I

    0 10000 20000 30000 40000

    W

    0 1000 2000 3000 4000 5000 6000 7000

    YD

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    DETECCIN DE LA MULTICOLINEALIDAD:

    Concluyendo, los diversos mtodos de deteccin de la multicolinealidad,

    son, en esencia expediciones de pesca, pues no puede decirse cules funcionan en una aplicacin particular. Sin embargo, no se puede hacer

    mucho al respecto, pues la multicolinealidad es un problema especfico de

    una muestra dada sobre la cual el investigador puede no tener mucho

    control, sobre todo si los datos son no experimentales por naturaleza, como

    es lo comn para los investigadores de las ciencias sociales.

    Respecto a la micronumerosidad, recordemos que es un problema slo si el

    tamao pequeo de la muestra de la muestra y la falta de variabilidad en las

    variables explicativas pueden ocasionar problemas por lo menos tan graves

    como los debidos a la multicolinealidad.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    En general, hay dos posibilidades:

    1. No hacer nada. Oliver Blanchard expresa de la siguiente manera la

    corriente de pensamiento que aboga por no hacer nada:

    Cuando los estudiantes efectan por primera vez la regresin de MCO,

    el primer problema que suelen afrontar es el de la multicolinealidad.

    Muchos concluyen que hay algo malo con los MCO; otros recurren a

    nuevas y con frecuencia creativas tcnicas a fi n de darle la vuelta al

    problema. Pero eso est mal. La multicolinealidad es la voluntad de

    Dios, no un problema con los MCO ni con la tcnica estadstica en

    general.

    Lo que Blanchard afirma es que la multicolinealidad es en esencia un

    problema de deficiencia de datos (micronumerosidad), y en algunas

    ocasiones no hay opcin respecto de los datos disponibles para el anlisis

    emprico.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    Asimismo, no es que todos los coeficientes en un modelo de regresin

    sean estadsticamente insignificantes. Al contrario, aunque no se puedan

    estimar uno o ms coeficientes de regresin con gran precisin, es

    posible calcular una combinacin lineal de ellos (es decir, una funcin

    estimable) con relativa eficiencia.

    2. Reglas prcticas. El xito de estas reglas depende de la gravedad de la

    multicolinealidad.

    A. Informacin a priori. Suponga que consideramos el modelo

    = 1 + 22 + 33 + Y: Consumo, X2: ingreso y X3: riqueza.

    Como ya mencionamos, las variables ingreso y riqueza tienden a ser

    muy colineales.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    = 1 + 22 + 33 + Y: Consumo, X2: ingreso y X3: riqueza.

    Suponga que, a priori, creemos que 3=0.102; es decir, la tasa de

    cambio del consumo respecto de la riqueza es una dcima parte de la

    correspondiente respecto del ingreso. Podemos entonces efectuar la

    siguiente regresin:

    = 1 + 22 + 0.123 + = 1 + 2 +

    Donde = 2 + 0.13. Una vez obtenido 2 podemos estimar 3 a partir de la relacin postulada entre 2 y 3.

    Cmo obtener informacin a priori? Puede provenir de un trabajo

    emprico anterior, en donde el problema de colinealidad result ser

    menos grave o de la teora relevante que soporta el campo de estudio.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    Por ejemplo, en la funcin de produccin tipo Cobb-Douglas,

    desarrollada en el item anterior, = 1223

    3; si esperamos que prevalezcan los rendimientos constantes a escala, entonces 2 + 3 = 1, en cuyo caso podemos efectuar la regresin de la razn producto-trabajo

    sobre la razn capital-trabajo.

    t=(-4.0612) (28.1056)

    Valor p= (0.0007) (0.0000)

    R2=0.9777 SCRR=0.0166

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    Si existe colinealidad entre el trabajo y el capital, como suele ser el caso

    en la mayor parte de la informacin muestral, dicha transformacin

    puede reducir o eliminar el problema de colinealidad.

    Pero es preciso hacer una advertencia aqu respecto de la imposicin

    de esas restricciones a priori, . . . pues en general se desean probar las

    predicciones a priori de la teora econmica en lugar de imponerlas

    simplemente sobre los datos para los cuales pueden no ser vlidas.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    2. Reglas prcticas.

    B. Combinacin de informacin de corte transversal y de series de

    tiempo. Una variante de la tcnica de informacin externa o a priori es la

    combinacin de datos de corte transversal y de series de tiempo,

    conocida como mezcla de datos.

    Suponga que deseamos estudiar la demanda de automviles en Estados

    Unidos y que tenemos informacin de series de tiempo sobre el nmero

    de automviles vendidos, su precio promedio y el ingreso del

    consumidor. Adems, suponga que

    = 1 + 2 + 3 + donde Y: nmero de automviles vendidos, P: precio promedio, I:

    ingreso y t tiempo. El objetivo es estimar la elasticidad precio 2 y la elasticidad ingreso 3.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    B. Combinacin de informacin de corte transversal y de series de

    tiempo.

    En la informacin de series de tiempo, las variables precio e ingreso

    tienden a ser muy colineales. Por consiguiente, si deseamos efectuar la

    anterior regresin, debemos enfrentar el problema usual de

    multicolinealidad.

    Una salida a esto, sostiene que si hay informacin de corte transversal

    (por ejemplo, informacin generada a travs de paneles de

    consumidores o estudios sindicados realizados por varias agencias

    privadas y estatales), puede obtenerse una estimacin relativamente

    confiable de la elasticidad ingreso 3, pues, con tal informacin, que est en un punto en el tiempo, los precios no varan mucho. Sea 3 la elasticidad ingreso estimada a partir de los datos de corte transversal.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    B. Combinacin de informacin de corte transversal y de series de

    tiempo.

    Con esta estimacin, la anterior regresin de series de tiempo se escribe

    como

    = 1 + 2 +

    dondeY=lnY3. Es decir, Y* representa ese valor de Y despus de eliminarle el efecto del ingreso. Ahora se puede obtener una estimacin

    de la elasticidad precio 2 de la regresin anterior.

    Aunque es una tcnica atractiva, la mezcla de datos de series de tiempo

    y de corte transversal de esta forma puede crear problemas de

    interpretacin porque se supone implcitamente que la elasticidad

    ingreso estimada a partir de datos de corte transversal es igual a la que

    se habra obtenido a partir de un anlisis puro de series de tiempo.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    B. Combinacin de informacin de corte transversal y de series de

    tiempo.

    = 1 + 2 +

    Sin embargo, se ha empleado esta tcnica en muchas aplicaciones y es

    en particular valiosa en situaciones en donde las estimaciones de corte

    transversal no varan sustancialmente de una seccin transversal a otra.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    C. Eliminacin de una(s) variable(s) y el sesgo de especificacin.

    Al enfrentar el problema de multicolinealidad grave, una de las

    soluciones ms simples consiste en omitir del modelo una de las

    variables colineales. As, en el ejemplo consumo-ingreso-riqueza, al

    omitir la variable riqueza, obtenemos una regresin la cual muestra que

    mientras en el modelo original la variable ingreso no era

    estadsticamente significativa, ahora se vuelve altamente significativa.

    = 24.45 + 0.50912(6.4138) (0.0357)

    t=(3.551) (13.29) R2=0.9567

    Sin embargo, al eliminar una variable del modelo se puede incurrir en

    un sesgo de especificacin o error de especificacin, que surge de la

    especificacin incorrecta del modelo utilizado en el anlisis.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    C. Eliminacin de una(s) variable(s) y el sesgo de especificacin.

    As, si la teora econmica afirma que tanto el ingreso como la riqueza

    deben incluirse en el modelo que explica el gasto de consumo, al

    eliminar la variable riqueza se incurrira en un sesgo de especificacin.

    Por tanto, el remedio suele ser peor que la enfermedad en algunas

    situaciones porque, mientras que la multicolinealidad puede obstaculizar

    la estimacin precisa de los parmetros del modelo, la omisin de una

    variable generara graves equivocaciones respecto de los verdaderos

    valores de los parmetros. Recuerde que los estimadores de MCO son

    MELI a pesar de la presencia de multicolinealidad perfecta.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    D. Transformacin de variables. Suponga que tenemos informacin de

    series de tiempo sobre el gasto de consumo, el ingreso y la riqueza. Una

    razn de la alta multicolinealidad entre el ingreso y la riqueza en tal

    informacin es que, con el tiempo, las dos variables tienden a moverse

    en la misma direccin. Una forma de reducir esta dependencia es

    proceder de la siguiente manera.

    Si la relacin:

    = 1 + 22 + 33 + se cumple en el periodo t, tambin debe cumplirse en el periodo t - 1,

    pues el origen del tiempo es, de todas formas, arbitrario. Por

    consiguiente, tenemos que:

    1 = 1 + 22,1 + 33,1 + 1

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    D. Transformacin de variables.

    Si restamos las funciones anteriores, tenemos:

    1 = 2 2 2,1 + 3 3 3,1 +

    donde = 1.

    La ltima ecuacin se conoce como la forma en primeras diferencias

    porque no se hace la regresin sobre las variables originales, sino sobre

    las diferencias de los valores sucesivos de dichas variables.

    El modelo de regresin que utiliza primeras diferencias a menudo

    reduce la gravedad de la multicolinealidad porque, aunque los niveles de

    2 y 3 estn muy correlacionados, no hay razn a priori para pensar que sus diferencias tambin lo estn.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    D. Transformacin de variables.

    1 = 2 2 2,1 + 3 3 3,1 +

    Una ventaja incidental de la transformacin de primeras diferencias

    consiste en que puede hacer que una serie de tiempo no estacionaria se

    convierta en estacionaria. En general, mencionaremos que, una serie de

    tiempo, por ejemplo , es estacionaria si su media y varianza no cambian de manera sistemtica a travs del tiempo.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    D. Transformacin de variables.

    Otra transformacin comn es la transformacin de razn.

    Considere el siguiente modelo:

    = 1 + 22 + 33 + donde Y: Gasto de consumo ($ reales), 2: PIB y 3: poblacin total.

    Como el PIB y la poblacin aumentan con el tiempo, es muy probable

    que estn correlacionados. Una solucin a este problema consiste en

    expresar el modelo mediante una base per cpita; es decir, dividir la

    funcin entre 3 para obtener:

    Dicha transformacin tal vez reduzca la colinealidad en las variables

    originales.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    D. Transformacin de variables.

    Sin embargo, la transformacin que utiliza primeras diferencias o las

    transformaciones de razn crean otros problemas. Por ejemplo, el

    trmino de error puede no satisfacer el supuesto del MCRL que las perturbaciones no estn serialmente correlacionadas; si esto ocurre, el

    remedio puede ser peor que la enfermedad. Adems, se pierde una

    observacin debido al procedimiento de diferenciacin y, por

    consiguiente, los grados de libertad se reducen en 1. En una muestra

    pequea esto puede ser un factor que al menos se debe considerar. Por

    aadidura, el procedimiento de primeras diferencias puede no ser el

    adecuado en los datos de corte transversal, donde no hay un

    ordenamiento lgico de las observaciones.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    D. Transformacin de variables.

    Del mismo modo, en el modelo de la razn, el trmino de error

    ser heteroscedstico, si el trmino de error original es homoscedstico, como veremos ms adelante. Una vez ms, el remedio

    quiz resulte peor que la enfermedad de la colinealidad.

    En resumen, se debe tener cuidado con las primeras diferencias o el

    mtodo de la razn para transformar los datos a fin de resolver el

    problema de la multicolinealidad.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    E. Nuevos datos adicionales.

    Como la multicolinealidad es una caracterstica de la muestra, es posible

    que en otra muestra con las mismas variables la colinealidad no sea tan

    grave como en la primera. A veces, con slo aumentar el tamao de la

    muestra (si esto es posible) se atena el problema de colinealidad.

    Sin embargo, La obtencin de datos adicionales o mejores no siempre

    es tan sencilla, pues, por desgracia, muy pocas veces pueden los

    economistas obtener informacin adicional sin incurrir en altos costos, y

    mucho menos pueden seleccionar los valores de las variables

    explicativas que desean. Adems, al agregar variables en situaciones no

    controladas, se debe tener cuidado de no agregar observaciones

    generadas en un proceso diferente del asociado al conjunto original de

    datos; es decir, se debe estar seguro de que la estructura econmica

    asociada a las nuevas observaciones sea igual a la estructura original.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    F. Reduccin de la colinealidad en las regresiones polinomiales. Una

    caracterstica especial de los modelos de regresin polinomial, es que

    las variables explicativas aparecen elevadas a diversas potencias. Por

    tanto, en la funcin cbica de costos totales que implica la regresin del

    costo total sobre la produccin, como en:

    = 0 + 1 + 22 + 3

    3 + los diversos trminos de la produccin van a estar correlacionados, lo

    que dificulta la estimacin precisa de los diversos coeficientes de

    pendiente. No obstante, en la prctica se ha visto que si las variables

    explicativas estn expresadas en forma de desviacin (es decir,

    desviaciones del valor medio), la multicolinealidad se reduce

    sustancialmente. Pero, si el problema persiste, tal vez convenga

    considerar tcnicas como la de los polinomios ortogonales.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    MEDIDAS CORRECTIVAS

    G. Otros mtodos de remediar la multicolinealidad. Las tcnicas

    estadsticas multivariadas como el anlisis de factores y el de

    componentes principales, o como la regresin en cadena, son comunes

    para resolver el problema de la multicolinealidad.

    Desafortunadamente, estas tcnicas estn fuera del alcance de este

    curso, pues no pueden analizarse en forma competente sin recurrir al

    lgebra matricial.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    LA MULTICOLINEALIDAD NO ES NECESARIAMENTE MALA SI

    EL UNICO OBJETIVO ES SOLO LA PREDICCION

    si el nico propsito del anlisis de regresin es el pronstico o la

    prediccin, la multicolinealidad no es un problema grave, pues, entre ms

    alta sea la R2, mejor ser la prediccin. Pero esto sucede siempre que los

    valores de las variables explicativas, para los cuales se desean las

    predicciones, obedezcan las mismas dependencias lineales casi exactas de la

    matriz X [de datos] del diseo original.

    Por tanto, si en una regresin estimada se encuentra que X2=2 X3aproximadamente, entonces, en una muestra futura para pronosticar Y, X2tambin debe ser aproximadamente igual a 2 X3, condicin difcil de cumplir

    en la prctica, en cuyo caso la prediccin ser cada vez ms incierta.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    LA MULTICOLINEALIDAD NO ES NECESARIAMENTE MALA SI

    EL UNICO OBJETIVO ES SOLO LA PREDICCION

    Ms an, si el objetivo del anlisis no es slo la prediccin sino tambin la

    estimacin confiable de los parmetros, la presencia de una alta

    multicolinealidad puede ser un problema porque genera grandes errores

    estndar en los estimadores.

    Una de las situaciones en que la multicolinealidad no representa un

    problema grave, es el caso en el cual se tiene una R2 elevada y los

    coeficientes de regresin son significativos individualmente. Aun as, los

    diagnsticos de multicolinealidad, (ndice de condicin), indican que los

    datos presentan colinealidad grave. Esto puede suceder si los coeficientes

    individuales resultan estar numricamente muy por encima del valor

    verdadero, de forma que el efecto siga visible, a pesar de los errores estndar

    inflados y/o debido a que el valor verdadero es en s mismo tan grande que,

    aunque se obtenga una estimacin subestimada, contine siendo

    significativa.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejemplo ampliado

    Los siguientes datos, originalmente se obtuvieron para evaluar la exactitud

    del clculo computacional de las estimaciones de mnimos cuadrados de

    varios paquetes de software: los datos Longley. Estos se convirtieron en

    ejemplo para ilustrar diversos problemas economtricos, como la

    multicolinealidad. Los datos se reproducen en la siguiente tabla y son series

    de tiempo de 1947 a 1962, donde:

    Y: nmero de personas con trabajo (en miles)

    X1: ndice implcito de deflacin de precios para el PIB

    X2: PIB (en millones de dlares)

    X3: nmero de desempleados (en miles)

    X4: nmero de personas enlistadas en las fuerzas armadas

    X5: poblacin no institucionalizada mayor de 14 aos de edad

    X6: ao (igual a 1 para 1947, 2 para 1948 y 16 para 1962).

    Suponga que nuestro objetivo es predecir Y con base en las seis variables X.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ao Y X1 X2 X3 X4 X5 X6

    1947 60323 830 234289 2356 1590 107608 1

    1948 61122 885 259426 2325 1456 108632 2

    1949 60171 882 258054 3682 1616 109773 3

    1950 61187 895 284599 3351 1650 110929 4

    1951 63221 962 328975 2099 3099 112075 5

    1952 63639 981 346999 1932 3594 113270 6

    1953 64989 990 365385 1870 3547 115094 7

    1954 63761 1000 363112 3578 3350 116219 8

    1955 66019 1012 397469 2904 3048 117388 9

    1956 67857 1046 419180 2822 2857 118734 10

    1957 68169 1084 442769 2936 2798 120445 11

    1958 66513 1108 444546 4681 2637 121950 12

    1959 68655 1126 482704 3813 2552 123366 13

    1960 69564 1142 502601 3931 2514 125368 14

    1961 69331 1157 518173 4806 2572 127852 15

    1962 70551 1169 554894 4007 2827 130081 16

    Datos Longley

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    A primera vista, dichos

    resultados sugieren que se tiene

    un problema de colinealidad,

    pues el valor R2 es muy alto; sin

    embargo, unas cuantas variables

    son estadsticamente no

    significativas (X1, X2 y X5), lo

    cual constituye un sntoma

    caracterstico de

    multicolinealidad.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Para arrojar ms luz a este problema, en la siguiente tabla se presentan las

    intercorrelaciones entre las seis regresoras. Esta tabla se conoce como matriz

    de correlacin.

    X1 1.00000 0.99159 0.62063 0.46474 0.97916 0.99115

    X2 0.99159 1.00000 0.60426 0.44644 0.99109 0.99527

    X3 0.62063 0.60426 1.00000 -0.17742 0.68655 0.66826

    X4 0.46474 0.44644 -0.17742 1.00000 0.36442 0.41725

    X5 0.97916 0.99109 0.68655 0.36442 1.00000 0.99395

    X6 0.99115 0.99527 0.66826 0.41725 0.99395 1.00000

    MATRIZ DE CORRELACIONES

    El primer rengln de esta tabla proporciona la correlacin de X1 con las

    otras variables X. Por ejemplo, 0.991589 es la correlacin entre X1 y X2;

    0.620633 es la correlacin entre X1 y X3, y as sucesivamente.

    Varias de estos pares de correlaciones son muy altos, lo cual sugiere que hay

    un grave problema de colinealidad. Por supuesto, debe recordarse la

    advertencia de que tales correlaciones tal vez sean una condicin suficiente,

    pero no necesaria, para la multicolinealidad.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Observe ahora las regresiones auxiliares; es decir, la regresin de cada

    variable X sobre las restantes variables X. En la siguiente tabla se presentan

    slo los valores R2 obtenidos con base en esas regresiones,

    Variable

    dependiente Valor de R2

    Tolerancia (TOL)

    = 1 R2

    X1 0.9926 0.0074

    X2 0.9994 0.0006

    X3 0.9702 0.0298

    X4 0.7213 0.2787

    X5 0.9970 0.0030

    X6 0.9986 0.0014

    Como los valores R2 de las regresiones

    auxiliares son muy altos (con la

    posible excepcin de la regresin de

    X4) sobre las restantes variables X, al

    parecer existe un grave problema de

    colinealidad.

    La misma informacin se obtiene a partir de los factores de tolerancia.

    Como ya mencionamos, mientras ms cercano a cero est el factor de

    tolerancia, mayor ser la evidencia de colinealidad.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Al aplicar la regla prctica de Klein observamos que los valores R2

    obtenidos de las regresiones auxiliares exceden el valor general R2 (es decir,

    el que se obtuvo de la regresin de Y sobre todas las variables X), que es

    igual a 0.9954, en 3 de 6 regresiones auxiliares, lo cual de nuevo sugiere que

    sin duda los datos Longley estn plagados del problema de

    multicolinealidad.

    Aplicar la prueba F y la variacin ante pequeos cambios.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Qu acciones podemos aplicar para revertir esta situacin de

    multicolinealidad?

    1. El PIB puede expresarse no en trminos nominales, sino en trminos

    reales, lo cual se realiza al dividir el PIB nominal entre el ndice de

    deflacin del precio implcito.

    2. En vista de que la poblacin no institucional mayor de 14 aos aumenta

    con el tiempo debido al crecimiento natural de la poblacin, estar muy

    correlacionada con el tiempo, la variable X6 del modelo. Por tanto, en

    lugar de conservar esas dos variables, mantenemos la variable X5 y

    desechamos X6.

    3. En tercer lugar, no hay ninguna razn de peso para incluir X3, el

    nmero de personas desempleadas; quiz la tasa de desempleo fuese una

    mejor medida de las condiciones del mercado de trabajo; sin embargo,

    no hay ningn dato al respecto. Por tanto, eliminamos la variable X3.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Qu acciones podemos aplicar para revertir esta situacin de

    multicolinealidad?

    Con estos cambios obtenemos los siguientes resultados de la regresin:

    Aunque R2 disminuy un poco en

    comparacin con la R2 original,

    an es muy alta. Ahora todos los

    coeficientes estimados son

    significativos y sus signos tienen

    sentido desde el punto de vista

    econmico.

    Podemos probar otros modelos y

    observar la forma en que cambian

    los resultados. Tenga en cuenta la

    advertencia respecto de la

    utilizacin del mtodo de la razn.

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio

    Suponga el siguiente modelo de regresin aplicado a la economa de Estados

    Unidos:

    = 1 + 22 + 33 + 44 + : consumo; 2: ingreso salarial; 3: ingreso no salarial, no procedente del campo; 4: ingreso procedente del campo.

    Pero, como se espera que 2:, 3: y 4: sean muy colineales, obtuvieron las siguientes estimaciones de 3 y 4 del anlisis de corte transversal: 3 =0.752 y 4 = 0.6252. Con estas estimaciones reformularon su funcin de consumo de la siguiente manera:

    = 1 + 2 2 + 0.753 + 0.6254 + = 1 + 2 + a) Ajuste el modelo modificado a los datos que se presentan en la siguiente

    tabla y obtenga estimaciones de 1 a 4.

    b) Como interpretara la variable Z?

  • ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

    Ejercicio

    Ao Y X2 X3 X4

    1936 62.8 43.41 17.10 3.96

    1937 65.0 46.44 18.65 5.48

    1938 63.9 44.35 17.09 4.37

    1939 67.5 47.82 19.28 4.51

    1940 71.3 51.02 23.24 4.88

    1941 76.6 58.71 28.11 6.37

    1945 86.3 87.69 30.29 8.96

    1946 95.7 76.73 28.26 9.76

    1947 98.3 75.91 27.91 9.31

    1948 100.3 77.62 32.30 9.85

    1949 103.2 78.01 31.39 7.21

    1950 108.9 83.57 35.61 7.39

    1951 108.5 90.59 37.58 7.98

    1952 111.4 95.47 35.17 7.42

    DATOS DEL PROBLEMA

  • (11.593)(0.002) (0.209)

    Ejemplo:OBS GDP PR M1 RS

    1952:1 87.875 0.1975607 126.537 1.64

    1952:2 88.125 0.1981673 127.506 1.677667 GDP: Producto Domestico Bruto

    1952:3 89.625 0.2001787 129.385 1.828667 M1: Medio Circulante

    1952:4 92.875 0.2012459 128.512 1.923667 PR: Nivel de precio (GDP deflactor)

    1953:1 94.625 0.2010517 130.587 2.047333 RS: Tasa a 3 meses del tesoro

    1953:2 95.55 0.2014442 130.341 2.202667

    1953:3 95.425 0.2022359 131.389 2.021667

    1953:4 94.175 0.2027231 129.891 1.486333

    1954:1 94.075 0.2034164 130.173 1.083667

    1954:2 94.2 0.203841 131.385 0.8143333

    1954:3 95.45 0.2042913 134.627 0.8696667 Solo 2 Click rpidos para

    1954:4 97.36375 0.204374 134.252 1.036333 ingresar a la base de datos

    1955:1 100.725 0.2056032 136.413 1.256333 de EXCEL1955:2 102.825 0.2062274 136.471 1.614333

    1955:3 104.925 0.207762 138.377 1.861333

    1955:4 106.6 0.2099975 137.244 2.349333

    1956:1 107.275 0.2120478 138.053 2.379333

    1956:2 108.675 0.2133287 138.375 2.596667

    1956:3 109.875 0.2161404 138.993 2.596667

    1956:4 112.125 0.2170651 139.087 3.063667

    tttt PRLnRSGDPLnMLn )(**)(*)1( 321

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • La interpretacin de loscoeficientes depende de la

    naturaleza de la variable del

    modelo. Para nuestro casoutiliza utilizar series en

    logaritmo, los coeficientes

    representan la elasticidaddemanda por circulante. Si el

    producto domstico bruto (GDP)

    aumenta en 1% la demanda dedinero aumenta en 0.46%.

    Si la tasa de inters (RS) aumenta en un punto porcentual, elcirculante disminuye en 0.027% y si el nivel de precios (PR)

    aumenta en 1% la demanda por circulante aumenta en 0.56%, por

    ultimo la constate se interpreta que para valores nulos de RS, GDPy PR, la probabilidad que aumente el circulante es de 3.69%.

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • STD.Error: Error estndar de los coeficientes a estimar.

    t-Statistic: Valor del estadstico t, bajo la hiptesis individual que las

    variables (H0: i =0).Con n-k grados de libertad, Indica que la variable contribuye a explicar la variable endgena.

    Prob: Si los Valores son superiores al 5% (=5%) no se rechaza la hiptesis nula y la variable exgena no sirve para explicar el modelo.

    R squared: Es el R cuadrado de la ecuacin y representa el porcentaje de la variabilidad de la variable dependiente explicada por

    la variable independiente.

    Adjusted R-squared: Permite medir el incremento neto de R

    cuadrado, cuando se incluye un nuevo regresor.

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Durbin-Watson stat: Sirve para contrastar la hiptesis deincorrelacin entre perturbaciones aleatorias frente a la presencia de

    autocorrelacin.

    Mean depent var: Representa la media de la variable dependiente.

    S.D depent var: Representa la cuasidesviacin tpica de la muestra.

    F-statistic: Es el estadstico que esta asociado a la hiptesis

    conjunta de que los parmetros asociados son iguales a cero(excepto el intercepto). H0 : 1 =2 =3 =i

    Prob (F-statistic): Mide la probabilidad de cometer el erro tipo I. Secalcula con la distribucin F de Snedecor Fk-1;T-k-1.

    Criterios de Informacin: Son el Akaike info criterion y Schwarz

    criterion, estos criterios nos dan informacin de la capacidadexplicativa del modelo y permite realizar comparaciones de los

    modelos analizados.

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Antes de empezar a calcular los intervalo de confianza para los

    parmetros. Vamos a introducirnos en el uso de comandos en EViews.

    Comandos en EViews

    En el rea de comandos podremos escribir y ejecutar los diferentes

    comandos, y cuyos resultados se irn almacenando en el Workfile.

    Para ejecutar un comando hay que situarse en el rea de sintaxis y

    escribir la sentencia completa del comando, para luego pulsar la tecla

    Intro para ejecute dicho comando.

    Esta rea acta como una calculadora cientfica, donde se pueden

    realizar transformaciones (algebraicas o estadsticas) a la variables

    para luego obtener los resultados.

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Si necesitamos el nmero de

    observaciones de la regresin

    digitaremos: =@regobs y si

    queremos guardar este dato en el

    archivo de trabajo digitamos

    Scalar, para que sea almacenado

    como un escalar, entonces

    tenemos que digitar primero el

    escalar, luego un nombre como T

    igual al comando e Intro:

    Scalar T =@regobs.

    El escalar se graba como t

    El escalar se graba como t

    Si hacemos doble Click sobre t, en la parte inferior de la ventana se muestra el valor de 180 observaciones usadas en la regresin.

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Si queremos usar los valores de los coeficientes de la regresin hay

    que digitar Matrix, porque es una matriz de coeficientes, seguido de

    @coefs. Si queremos, esta amatriz lo podemos guardar en el

    Workfile con el nombre de Coef. Entonces, debemos digitar los

    siguiente: Matrix Coef=@coefsSe guarda la matriz con el nombre Coef.

    Al hacer doble click sobre la

    carpeta @coef, se muestra la

    siguiente ventana:

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Tipo de Funcin Empieza con el Nombre

    Distribucin Acumulada (CDF) @c

    Densidad o probabilidad @d

    Inversa de CDF @q

    Generador del Nmero Aleatorio @r

    Tambin se pueden obtener, mediante los comandosdistribuciones que se utilizan tanto estadstica como en

    econometra.

    Los comandos ms usados en Econometra, son:

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Distribucin Funcin Densidad/Funcin de probabilidad

    Chi-square @cchisq(x,v),

    @dchisq(x,v),

    @qchisq(p,v),

    @rchisq(v)

    F-distibucin @cfdist(x,v1,v2),

    @dfdist(x,v1,v2),

    @qfdist(p,v1,v2),

    @rfdist(v1,v1)

    Normal(Gaussian) @cnorm(x),

    @dnorm(x),

    @qnorm(p),

    @rnorm, nrnd

    T-Students @ctdist(x,v),

    @dtdist(x,v),

    @qtdist(p,v),

    @rtdist(v)

    v,v1,v2: Son los grados de libertad.

    X: Es el /2 o valor calculado p: Probabilidad de confianza.

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Si queremos obtener la probabilidad acumulada de la t-Student al 5%

    de significancia con 20 grados de libertad. El comando a digitar es:

    =@qtdist(0.05,20) y Intro. Proporciona como resultado -1.725 por

    simetra 1.725

    Si queremos obtener la probabilidad acumulada de la chi-cuadrado al

    10% de significancia con 15 grados de libertad. El comando a digitar es:

    =@qchisq(0.90,15) y Intro, proporciona como resultado 22.31

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Otros comandos usados en EViews son:

    Funciones Descripcin

    Genr Genera directamente una operacin entre variables.

    Log(X) Logaritmo natural.

    exp(X) o @exp(X) Funcin exponencial e^x.

    Abs o @abs(X) Valor absoluto X.

    Sqr o @Sqr(X) Raz cuadrada.

    @sin(X) Funcin Seno

    @cos(X) Funcin Coseno.

    @asin(X) Arco seno.

    @acos(X) Arco coseno.

    @tan(X) Funcin tengente.

    rnd Nmero aleatorio entre cero y uno.

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Funciones Descripcin

    nrnd Nmero aleatorio con media cero y varianza uno.

    @obs(X) Nmero de observaciones de X.

    @se Error estndar de la regresin.

    @ssr Suma de cuadrados de los residuos.

    Cross(x,y) Producto cruzado de x e y.

    @cov(x,y) Covarianza entre x e y.

    @aic Criterio de Informacin del Akaike

    @coefcov(i,j) Matrix de Covarianza de i,j

    @coefs(i) Valor del coeficiente i en la regresin.

    @dw El estadistico Durbin-Watson de la regresin.

    @f La F-estadstica

    @fprob La probabilidad de la F-estadstica

    ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA

    MULTICOLINEALIDAD

    MULTICOLINEALIDAD

  • Funciones Descripcin

    @hq Criterio de Informacin de Hannan-Quinn .

    @jstat La J-estadstica para la funcin de GMM .

    @logl El valor de la funcin de probabilidad de log .

    @meandep Media de la variable dependiente

    @ncoef el nmero de coeficientes estimados.

    @r2 R-cuadrado.

    @rbar2 R-cuadrado ajustado.

    @coefcov Matriz de coeficientes

    @regobs El nmero de observaciones en la regresin.

    @schwarz El criterio de informacin de Schwarz.

    @sddep La desviacin normal