Tema 1. Informacion

download Tema 1. Informacion

of 38

Transcript of Tema 1. Informacion

  • 8/18/2019 Tema 1. Informacion

    1/38

  • 8/18/2019 Tema 1. Informacion

    2/38

    INTRODUCCION

    - Econometría: este vocablo procede del griego y significa “medida

    de la economía”

    - Esta definición no caracteriza completamente el contenido de lamateria, pero pone de manifiesto su carácter necesariamente

    cuantitativo

    - ! lo largo del tiempo, la Econometría "a ido ampliando su

    contenido debido fundamentalmente a # aspectos:

    o El desarrollo de la $eoría Económica

    o %os avances en la $eoría Estadística

    o El desarrollo de la &nformática y la creciente disponibilidad y

    fácil acceso a grandes bases de datos 'tanto a nivel macro

    como micro(- )or tanto, el continuo avance de esta disciplina "ace *ue no "aya

    una definición generalmente aceptada

    - &ntriligator '1+( define Econometría como a*uella rama de la

    Economía *ue se ocupa de medir desde el punto de vista empírico

    cual*uier relación entre variables económicas

    - .e acuerdo con esta definición, los dos ingredientes básicos de la

    Econometría son: 1( %a $eoría Económica y /( %os datos

    - %a característica fundamental de esta disciplina es *ue debe saber 

    con0ugar perfectamente ambos ingredientes En otras palabras, un

    económetra no puede defender la medición sin teoría, pero

    tampoco la teoría sin datos

    - aber con0ugar perfectamente teoría, datos y t2cnicas estadísticas

    es lo más difícil, pero tambi2n lo más atractivo de la Econometría

    !lguien di0o *ue “la Econometría sería más fácil sin datos”

    - En definitiva, la Econometría debe complementar a la $eoría

    Económica, para validar determinadas relaciones *ue postula

    usando datos En este sentido, el económetra no puede prescindir 

    de la $eoría, ni el teórico de lo *ue “dicen los datos”

    Relaciones entre la Teoría Económica y la Econometría

    '1( %a Econometría necesita primero de la $eoría Económica para

    *ue le proporcione un marco conceptual concreto )or e0emplo, la

    teoría de 3eynes proporciona un marco en el *ue se relacionan

    dos variables económicas: 4onsumo ' C ( y 5enta 'Y (, en donde,

    además se postula *ue el C  es una función de la Y : ' (C f Y =  y noa la inversa En ocasiones, el económetra puede partir no de una

    teoría, sino del sentido com6n o de la intuición de *ue e7ista unarelación entre un con0unto de variables )or e0emplo, puede

    /

  • 8/18/2019 Tema 1. Informacion

    3/38

     preguntarse si un tipo de inter2s a corto plazo depende de su

     propia "istoria pasada o no

    '/( %a teoría económica tambi2n necesita de la econometría para

     poder validar, contrastar, determinadas "ipótesis postuladas por el

    teórico En el e0emplo de la función de consumo 3eynesiana, se postula una función lineal entre C  e Y : C a bY  = + , donde a  es el

    consumo autónomo y b   la propensión marginal a consumir

    !demás, se supone *ue 8 1b≤ ≤ 9sando datos, el económetra

     puede contrastar si esta restricción se cumple o no

    '( %a teoría económica necesita de la econometría para poder seguir 

    desarrollándose Es decir, la evidencia empírica obtenida con los

    datos puede ayudar a reformular teorías ya e7istentes o incluso,

    sugerir nuevas En el e0emplo anterior, se puede contrastar si la

    relación entre C  e Y  es lineal o no !demás, se puede contrastar 

    si la relación entre C  e Y  es estática Es decir, el C  en un instante

     puede depender de la Y  en ese momento, pero tambi2n del C  e Y 

     pasados

    Pasos en un Estudio Econométrico:

    '1( )ara *ue la teoría económica pueda utilizarse en un estudio

    econom2trico necesita de una elaboración matemática *ue de lugar 

    a un modelo y en concreto, a un modelo econométrico 9n modeloeconom2trico no es un modelo geom2trico ni un modelomatemático En un modelo geom2trico se representan mediante

    gráficos o diagramas relaciones entre variables económicas

    '&;%

  • 8/18/2019 Tema 1. Informacion

    4/38

    C  e Y  %a interpretación de ε   es la influencia combinada sobre elC   de variables distintas a la Y  En concreto, en la función de

    consumo, ε    puede recoger factores como las e7pectativas de los

    agentes, factores estacionales, tipos de inter2s En esta función

    asumimos *ue el factor determinante del C   es la Y , pero esto essólo una apro7imación En general, ε   recogerá “todos los fallos del

    modelo” %as "ipótesis *ue "agamos sobre estas variables aleatorias

    son fundamentales para decidir *u2 t2cnica econom2trica usar

    c( El tama>o El modelo debe ser pe*ue>o, escueto Esto *uiere

    decir *ue tiene *ue tener pocos parámetros *ue le caracterizen

    a Aormalmente, son gratuitos

    .atos de sección cruzada: miden una variable en un momento

    determinado del tiempo para distintas entidades Estas entidades

     pueden ser individuos, familias, países, empresas, 4omunidades

    !utónomas, sectores empresariales, etc )or e0emplo, podemos

    tener una función de consumo familiar: i i iC a bY    ε = + + , donde elsubíndice i "ace referencia a la familia

    Estos datos fundamentalmente se obtienen a partir de entrevistas o

    encuestas "ec"as a las entidades correspondientes %as dos fuentes

    #

  • 8/18/2019 Tema 1. Informacion

    5/38

    más importantes de este tipo de datos son: la E)@ 'Encuesta de

    )resupuestos @amiliares( y la 4? '4entral de ?alances(

    .atos de panel: surgen al cruzar una sección cruzada con una serie

    temporal En nuestro e0emplo, tendríamos el dato de consumo deuna familia a lo largo de una serie de a>os 9n panel supone

    disponer de muc"a más información *ue en una sección cruzada, ya

    *ue tenemos distintas observaciones de una misma variable

    'consumo( para una misma unidad 'familia( Esto es difícil

    conseguir en una ciencia no e7perimental como es la Economía

    En un panel se pueden analizar o contrastar "ipótesis *ue no es

     posible con una sección cruzada )or e0emplo, contrastar si "a

    "abido diferencias en el comportamiento del consumo de las

    familias despu2s de un cambio de política económica 'impuestos(

    en un momento determinado del tiempo

    $anto las secciones cruzadas como los paneles no suele ser 

    información gratuita

    '( 9na vez *ue se "a especificado el modelo y *ue se dispone de los

    datos adecuados de todas las variables, se pasa a la etapa de

    estimación  del mismo 4onsiste en medir empíricamente los parámetros *ue caracterizan el modelo y a*uí entra la estadística,sobre todo la inferencia estadística '*ue usa la información

    muestral disponible para inferir características de toda una

     población(

    '#( 9na vez *ue el modelo "a sido estimado usando las técnicaseconométricas adecuadas, llegamos al paso de la verificación oalidación del modelo e establecen criterios 'gráficos yestadísticos( para rec"azar o aceptar el modelo !*uí comienza un

     proceso iterativo en la modelización, ya *ue si no aceptamos un

    modelo, no lo usamos, sino *ue reformulamos el modelo teórico, o bien, tratamos de una forma más adecuada los datos ! veces, es

    fácil teorizar sobre relaciones entre variables *ue están definidas de

    forma precisa, pero otra cosa es obtener datos seguros de estas

    variables )or e0emplo, es difícil siempre obtener datos razonables

    de los beneficios de una empresa, de un tipo de inter2s o del stocB 

    de capital de una economía En algunos casos, no e7iste

    contrapartida observable para una variable teórica

    C

  • 8/18/2019 Tema 1. Informacion

    6/38

    Usos de un modelo econométrico estimado: )ueden ser varios:

    '1( !nálisis estructural e usa el modelo estimado para medir la

    relación entre variables económicas !lgunos e0emplos, son la

    medición de la propensión marginal a consumir de un país, de laelasticidad demanda-precio de un bien, de la elasticidad de la

     producción-input de una empresa, de la curva de )"illips 'inflación

    y paro(, de la relación entre ventas y publicidad de un producto en

    una empresa, de la relación entre el rendimiento y riesgo de un

    activo financiero, de la relación entre el salario y el nivel de

    educación de un individuo, etc

    '/( )redicción Es el uso más frecuente de un modelo econom2trico e

    usa para predecir el valor futuro de una variable de inter2s %as

     predicciones se usan para tomar decisiones )or e0emplo, todo el

    mundo predice &nflación, )&? o 4onsumo @uera de la economía,

    todos los días se "acen previsiones meteorológicas

    '( Evaluación de políticas económicas e usa para simular el valor 

    futuro de una variable ba0o distintos supuestos de evolución de otras

    En nuestro e0emplo, sería predecir el patrón de evolución de

    consumo ba0o distintos escenarios de evolución de la renta i una

    autoridad controla algunas variables, como la cantidad de dinero,

     puede evaluar el efecto sobre la tasa de inflación ante distintos

    escenarios de crecimiento monetario

    Clasi!icación de aria"les en un modelo econométrico

    %a principal clasificación es la de:

    Dariable Endógena: es a*uella e7plicada por otras variables Es denotada

     por  y

    Dariables E7ógenas: e7plican a la endógena pero no pueden estar influidas

     por ella )uede "aber k   variables e7plicativas y son denotadas por 

    1 /, ,, k  x x x

    ay *ue tener en cuenta *ue esta distinción varía dependiendo del modelo

    econom2trico en particular y su ob0etivo !sí, una e7ógena en un modelo

     puede pasar a ser la endógena de otro E0 ' (C f Y    ε = +   y ' (Y f M    ε = + ,donde  M   es cantidad de dinero

    Dariables continuas: pueden tomar valores en todos los puntos de la recta

    real 'C  e Y (

    Dariables discretas: sólo toman valores en algunos puntos de la recta real

    F

  • 8/18/2019 Tema 1. Informacion

    7/38

    9n e0emplo son las variables ficticias o dummies *ue toman valor uno o

    cero %a idea es *ue "ay características *ue no se pueden medir 'en euros,

    en Bilos, etc(, pero *ue pueden ser factores relevantes a la "ora de e7plicar 

    a otra variable )or e0emplo, en la función de consumo familiar, además de

    la renta, el "ec"o de *ue la familia viva en el campo o en la ciudad puedeser relevante para e7plicar diferencias en el consumo )ara ello, se

    construye una variable ficticia *ue toma uno para las familias *ue viven en

    la ciudad y cero para las *ue viven en el campo '   i D ( y se introduce como

    una e7ógena más en el modelo

  • 8/18/2019 Tema 1. Informacion

    8/38

    TEMA #$ E% MODE%O DE RE&RE'I(N %INEA% 'IMP%E )&ENERA%

    El ob0etivo es especificar, estimar y contrastar relaciones entre variableseconómicas usando datos

    )ara ello, es necesario "acer una serie de "ipótesis simplificatorias

    '1( *i+ótesis de linealidad en los +ar,metros Establece la linealidaden los parámetros en la relación entre la variable endógena y las

    e7ógenas Es decir, en la función de consumo tendremos

    1 /t t t C Y β β ε = + +

    donde 1β   y /β   son los parámetros de esta relación Ao "ay *ue confundir 

    esta "ipótesis de linealidad con la linealidad entre las variables )or 

    e0emplo, en las relaciones entre  y  y  x  *ue se dan a continuación, sólo la

     primera es formalmente lineal in embargo, cumplen la "ipótesis de

    linealidad en los parámetros las tres:

    1 / y xβ β = +

    1 /

     x

     y eβ β = +1 /

    ln y xβ β = +

    En determinadas relaciones económicas no se cumple la "ipótesis de

    linealidad en los coeficientes 9n e0emplo sencillo es la función de

     producción de tipo 4obb-.ouglas, donde Y   representa el output de la

    empresa,  L  es traba0o y K  es el stocB de capital:

    Y AK Lα β =

    %os parámetros desconocidos de esta función son  A   'parámetro de

    eficiencia(, α    'elasticidad del output con respecto al capital( y β 

    'elasticidad del output con respecto al traba0o( 9na simple transformación

    logarítmica en los datos, "ace *ue esta relación cumpla la linealidad en los

     parámetros Es decir:

    ln ln ln lnY A K Lα β = + +

  • 8/18/2019 Tema 1. Informacion

    9/38

    E0emplos de relaciones entre variables económicas no lineales en los

     parámetros "ay muc"os, por e0emplo, en una función de 4onsumo no lineal

    como:

    c

    C a bY  = +

    donde a, b  y c son los parámetros *ue caracterizan esta relación En este

    caso, "abría *ue estimar estos tres parámetros dada una muestra de C  y Y 

    4ontrastar una relación lineal entre C   y Y , e*uivale a contrastar si el

     parámetro c es unitario o no

    '/( *i+ótesis de es+eci!icación correcta Esta "ipótesis supone *ue lask   variables e7plicativas del modelo son a*uellas variables

    relevantes *ue e7plican el comportamiento de la endógena G *ue

    están todas Ao e7iste ninguna variable i x  *ue no e7pli*ue nada de

    la  y Es decir, el modelo está bien planteado o especificado

    Esta "ipótesis supone aceptar en la práctica dos cosas no siempre

    ciertas:

    'a( !ceptar *ue siempre "ay una teoría detrás *ue me permite

    saber c6ales son las variables relevantes en cada modelo

    'b( !ceptar *ue sobre estas variables dispongo siempre de

    información muestral adecuada

    El incumplimiento de esta "ipótesis se da en muc"os casos E0emplo: i

    uno *uiere estimar con datos de sección cruzada una función de consumo

    Beynesiana, además de la renta familiar, e7isten otras muc"as variables *ue

    e7plican el comportamiento del consumo de una familia )or e0emplo, el

    n6mero de "i0os, la edad del cabeza de familia, si la mu0er traba0a o no, si

    se vive en el campo o en la ciudad, etc in embargo, nunca será posible

    incluir todas y cada una de las variables *ue determinan el consumo de una

    familia

    '( *i+ótesis de -rados de li"ertad +ositios %os grados de libertadde un modelo se definen como la diferencia entre el n6mero de datos

    ' n ( y el n6mero de variables e7plicativas ' k ( Es decir, 8 gl n k = − ≥

    Esta "ipótesis supone *ue, como mínimo, es necesario disponer de

    tantos datos como parámetros a estimar Ao obstante, es preferible

    siempre disponer de más datos *ue parámetros a estimar En el e0emplo

    de la función de consumo Beynesiana "ay *ue estimar dos parámetros 'ay b( 4on un 6nico dato, no sería posible estimar de forma 6nica ambos

    +

  • 8/18/2019 Tema 1. Informacion

    10/38

     parámetros 4on dos datos, sería posible obtener una 6nica estimación

    de a  y b,  pero para *ue la estimación sea estable, es me0or tener una

    nube de datos y pocos parámetros a estimar

    '#( *i+ótesis de +ar,metros constantes Esta "ipótesis supone *ue los parámetros 1 /, ,, k β β β   son constantes en el tiempo

    i traba0amos con n datos en la función de consumo Beynesiana,

    suponer *ue la propensión marginal a consumir es constante en el

    tiempo, implica *ue se obtiene una estimación *ue "a de interpretarse

    como la propensión marginal a consumir media en ese período de

    tama>o n i el período muestral con el *ue se traba0a es muy amplio y

    "eterog2neo 'por e0emplo, incluye períodos de crisis y de auge(, es más

    difícil mantener esta "ipótesis *ue si la muestra es "omog2nea

    'C( *i+ótesis de inde+endencia lineal entre las aria"lese.+licatias Esta "ipótesis implica *ue cada variable e7plicativacontiene información adicional sobre la endógena *ue no está

    contenida en otras i "ubiera información repetida, "abría variables

    e7plicativas dependientes linealmente de otras @ormalmente, se

     puede resumir la información muestral sobre las k   variables

    e7plicativas 'regresores( en una matriz, denotada por  X  , de tama>on k ×  con la siguiente estructura:

    11 1

    1

    n nk 

     x x

     x x

      ÷ ÷ ÷  

    M O M

    L

    donde cada columna recoge los datos asociados a cada variable  x El

    "ec"o de *ue cada columna sea linealmente independiente de las otras

    implica *ue el rango de la matriz  X   es completo, es decir, igual a k  i

    alguna variable x

      es linealmente dependiente de otra, decimos *uee7iste un problema de multicolinealidad e7acta

    'F( *i+ótesis de re-resores no estoc,sticos Esta "ipótesis implica *uelos datos de las variables e7plicativas son fi0os en muestras

    repetidas Es decir, el valor de las variables e7plicativas es constante

    en la función de distribución de la endógena

    E7isten tres situaciones en Econometría donde no es posible

    mantener esta "ipótesis:

    18

  • 8/18/2019 Tema 1. Informacion

    11/38

    'F1(

  • 8/18/2019 Tema 1. Informacion

    12/38

    '1( Esperanza nula en todo instante de tiempo: ' ( 8, 1,/,t  " t nε    = ∀ =   K  Ga*ue t ε   es tratado como la suma de muc"os efectos individuales sobre la

    endógena, donde el signo de cada uno es desconocido, no e7iste ninguna

    razón para esperar cual*uier valor distinto de cero upongamos *ue

    ' (t  "   ε µ = , entonces el modelo 1 /   t t  xβ β ε + +   es el mismo *ue1 /

    ' ( ' (t t 

     xβ µ β ε µ  + + + − , donde el nuevo t2rmino de error:   Ht t ε ε µ = − , es tal

    *ue laH' ( 8t 

     "  ε    =

    9na situación en la *ue se incumple esta "ipótesis, es cuando a su vez,

    se incumple otra, como es omitir en el modelo una variable relevante i

    la verdadera función de consumo es

    t t t t  C a bY ci   ε = + + +

    donde t i es un tipo de inter2s y se traba0a con un modelo *ue omite esta

    variable:

    t t t C a bY    ν = + +

    donde t ν   es el t2rmino de error de esta ecuación y además, se sabe *ue

    t t t ciν ε = + Es fácil comprobar *ue ' ( 8t t  " ciν    = ≠ , aun*ue t ε    tenga

    esperanza nula e usan las "ipótesis de parámetros constantes yregresores no estocásticos

    '/( Darianza constante 'omocedasticidad( upone *ue al cumplirse

    '1(, la/ /var' ( ' ( , 1,/, ,

    t t  " t nε ε σ = = ∀ =   K  i la variabilidad 'o dispersión

    alrededor de la media( de las perturbaciones cambia con el tiempo

    "ablamos de "eterocedasticidad

    Es muy frecuente la "eterocedasticidad en modelos donde se usan datos

    de sección cruzada i tenemos la función de consumo familiar utilizada

    "asta a"ora, es fácil comprender *ue a*uellas familias con mayor nivel

    de renta tengan mayor variabilidad en su consumo 'además de satisfacer 

    necesidades básicas, pueden consumir otras cosas( )uesto *ue el error 

    del modelo está relacionado con el consumo, lo *ue ocurrirá es *ue a

    mayor renta, mayor varianza en el consumo y por tanto, mayor varianza

    en el error

    '( !usencia de autocorrelación en todo instante de tiempo &mplica

    *ue la cov' ( ' ( 8, , 1,/, ,t # t # " t # n t #ε ε ε ε  = = ∀ = ≠K  i "ay autocorrelación, elerror en un momento del tiempo ayudaría a predecir el error en un

    1/

  • 8/18/2019 Tema 1. Informacion

    13/38

    momento posterior y los errores tendrían inercia i no "ay

    autocorrelación, la "istoria pasada no ayuda a predecir el

    comportamiento futuro y los errores son completamente aleatorios e

    imprevisibles

    Es muy frecuente el incumplimiento de esta "ipótesis en modelos

    donde se usan datos de series temporales

    Estas restricciones se imponen para e7igir “un buen

    comportamiento” a las variables t ε  , aun*ue tambi2n "ay razones

    t2cnicas *ue nos obligan a "acer estas "ipótesis )uesto *ue tenemos n

    variables aleatorias 1, /' , (nε ε ε K  , su caracterización e7ige "ablar, al

    menos, de sus dos primeros momentos 'media y varianza(:

  • 8/18/2019 Tema 1. Informacion

    14/38

    %a información asociada a la variable endógena se almacena en un

    vector columna Y  de tama>o 1n × :

    Y I

    1

    n

     y

     y

      ÷ ÷ ÷  

    %a información asociada a las variables e7plicativas se recoge en una

    matriz llamada X  de tama>o n k × :

     X  I

    11 1

    1

    n nk 

     x x

     x x

      ÷ ÷ ÷  

    %as perturbaciones en un vector ε   de tama>o 1n ×  y los parámetros enun vector β  de tama>o 1k × :

    ε   /1

    n

    ε 

    ε 

      ÷ ÷ ÷  

      J β   I

    1

    β 

    β 

      ÷ ÷ ÷  

    El modelo lineal general '

  • 8/18/2019 Tema 1. Informacion

    15/38

    Estimación del modelo lineal sim+le:

    upongamos *ue *ueremos estimar los parámetros de la función de

    consumo Beynesiana 'modelo de regresión lineal simple(:

    t t t C a bY    ε = + +

    donde a  es el consumo autónomo y b  la propensión marginal a

    consumir )ara ello, se dispone de una muestra de n datos de consumo y

    renta *ue se puede representar en el plano t C    e t Y  4ada punto

    representa el par de valores de 4onsumo y 5enta observados en ese

     período 'a>o( concreto Esto se denomina A9?E .E )9A$= real,

    donde "abrá tantos puntos como datos utilizados

    Kráfico: Aube de puntos real y recta de a0uste

    500

    1000

    1500

    2000

    2500

    500 1000 1500 2000 2500 3000

    RENTA

         C     O     N     S     U     M     O

    i suponemos un modelo lineal entre ambas variables, dada la nube de

     puntos, una estimación del modelo viene dada por una recta llamada

    5E4$! .E !N9$E definida por:

    OOt 

    a bY +

    donde Oa   representa una estimación del consumo autónomo y Ob   una

    estimación de la propensión marginal a consumir )ara cada valor de t Y ,

    la recta de a0uste genera un valor de consumo *ue denotamos por Ot C  ,

    *ue no tiene por *u2 coincidir con el consumo real t C  i dado un valor 

    de la t Y , el modelo predice un valor de consumo tal *ue Ot t C C = , en eseinstante de tiempo el modelo a0usta perfectamente i dado un valor de

    la t Y , el modelo genera un valor del consumo tal *ue Ot t C C < , el modeloinfraestima el verdadero valor del consumo en ese a>o y comete un

    error Este error es medible y se denomina 5E&.9=, es decir 

    1C

  • 8/18/2019 Tema 1. Informacion

    16/38

    OOt t t 

    C C ε   = − El residuo puede ser nulo, positivo o negativo, si el modeloacierta, infraestima o sobrestima el verdadero valor de consumo En

    general, en todos los puntos de la nube real por encima de la recta de

    a0uste, el verdadero valor de consumo está por encima de lo *ue predice

    la rectaJ en los puntos sobre la recta de a0uste el modelo no se e*uivocay en los puntos de la nube real por deba0o de la recta, el verdadero valor 

    de consumo está por deba0o de lo *ue a0usta el modelo 'la recta(

    El ob0etivo a"ora es conseguir una estimación de a y b de manera *ue se

    cumpla alg6n criterio de optimalidad )or e0emplo, un criterio sería

    minimizar la suma de los residuos cometidos en toda la muestra:

    1 1

    OO Omin minn n

    t t t 

    t t 

    C a bY  ε 

    = =

    = − −∑ ∑

    Este no es un buen criterio, ya *ue los errores individuales *ue comete

    el modelo pueden ser muy grandes, pero al tener signo los errores

    grandes y positivos se pueden compensar con los grandes y negativos

    %a solución obvia es eliminar en este criterio el signo de los residuos,

    tomando por e0emplo el valor absoluto:

    1

    Ominn

    ε 

    =

    En este caso, el problema es la dificultad analítica de obtener una

    solución para Oa   y Ob Ao obstante, otra forma de eliminar el signo de

    una variable es elevarla al cuadrado El criterio de optimalidad sería

    obterner una e7presión de Oa  y Ob  *ue minimize la suma de los cuadrados

    de los residuos:

    / /

    1 1

    OO Omin min ' (n n

    t t t 

    t t 

    C a bY  ε 

    = =

    = − −∑ ∑

    *ue tiene las venta0as de '1( eliminar la compensación de errores por el

    signo, '/( penalizar más los errores grandes *ue los pe*ue>os y '(

    llevar a una solución analítica sencilla Este criterio de estimación es el

    más conocido en Econometría y se denomina

  • 8/18/2019 Tema 1. Informacion

    17/38

    / /

    1 1

    OO Omin min ' (n n

    t t t 

    t t 

    C a bY  ε = =

    = − −∑ ∑

    olución: 4ondiciones de primer orden:

    /

    1

    1

    OOO/ ' ( 8

    O

    n

    t    nt 

    t t 

    C a bY  a

    ε =

    =

    = − − − =∂

    ∑∑

    /

    1

    1

    OOO/ ' ( 8

    O

    n

    t    nt 

    t t t 

    C a bY Y  b

    ε =

    =

    ∂= − − − =

    ∑∑

    Este es un sistema de dos ecuaciones con dos incógnitas .e la primeracondición, se obtiene *ue:

    1 1

    O OO O8n n

    t t 

    t t 

    C na b Y a C bY  = =

    − + + = ⇒ = −∑ ∑

    donde C  e Y   representan las medias muestrales de 4onsumo y 5enta,

    respectivamente 9sando la segunda condición de primer orden y la

    solución para Oa , se obtiene:

    / /

    1 1 1 1 1 1

    O O OO 8 ' ( 8n n n n n n

    t t t t t t t t  

    t t t t t t  

    C Y a Y b Y C Y C bY Y b Y  = = = = = =

    − + + = ⇒ − + − + =∑ ∑ ∑ ∑ ∑ ∑

    y operando:

    /

    1 1 1 1

    O' (n n n n

    t t t t t  

    t t t t  

    b Y Y Y C Y C Y  = = = =

    − = − ⇒∑ ∑ ∑ ∑

    1 1

    / / /

    1 1

    ' (' (O

    ' (

    n n

    t t t t  

    t t 

    n n

    t t 

    t t 

    C Y nCY C C Y Y  

    b

    Y nY Y Y  

    = =

    = =

    − − −= =

    − −

    ∑ ∑

    ∑ ∑

    %as dos fórmulas en los recuadros son los estimadores

  • 8/18/2019 Tema 1. Informacion

    18/38

    E0ercicio para el estudiante: 4omprobar *ue la solución obtenida es un

    mínimo Es decir, mostrar *ue el "essiano es definido positivo:

    / / / /

    /

    / / / /

    /

    O O

    OO' ( OO O

    O OO ' (

    t t 

    t t 

    a   a b % 

    b a b

    ε ε 

    ε ε 

    ∂ ∂  

    ∂   ∂ ∂ = ∂ ∂ ∂ ∂ ∂

    ∑ ∑

    ∑ ∑

    Estimación del modelo lineal -eneral 0M%&1:

    .ada la formulación matricial del o compatible y  A  una matriz

    cuadrada %a solución analítica a las condiciones de primer orden es:

    1

  • 8/18/2019 Tema 1. Informacion

    19/38

    O! !  X X X Y β  =

    Este es un sistema de k ecuaciones con k   incógnitas '   1 /O O O, ,,

    k β β β  (,

    llamado sistema de ecuaciones normales El estimador Oβ   *ue satisface

    este sistema se llama estimador por o ' k k × (, teniendo *ue:

    1O ' (! !  X X X Y β    −=

    E0ercicio para el estudiante: 4omprobar *ue la solución obtenida es un

    mínimo

    Pro+iedades estadísticas del estimador MCO de β :

    %inealidad: El estimador

  • 8/18/2019 Tema 1. Informacion

    20/38

    donde se "an usado las "ipótesis de '1( parámetros constantes, '/(

    regresores fi0os e independientes linealmente y '( esperanza nula del

    t2rmino de error

    E!iciencia:  El estimador

  • 8/18/2019 Tema 1. Informacion

    21/38

    Prue"a: El vector de residuos o ' (n n× es la llamada matriz de proyección*ue tiene propiedades importantes: '1( es sim2trica, '/( idempotente ,'(

    no tiene inversa y '#( es ortogonal a la matriz  X  , es decir, 8 MX  =

    E0ercicio para el estudiante: )robar estas cuatro propiedades de la matriz M 

    ! partir de la relación anterior y de las propiedades de la matriz  M  , se

    obtiene: O ' ( MY M X M ε β ε ε  = = + = )or tanto, siempre *ue se desee la

    suma de cuadrados de los residuos se puede escribir como una formacuadrática:

    O O! !  M ε ε ε ε  =

    @inalmente, la esperanza de esa suma es igual a:

    / /

    O O' ( ' ( P ' (Q P ' (Q

    P ' (Q P ' (Q P Q P Q

    ! ! ! !  

    ! ! 

     " " M " t* M " t* M 

    t* " M t* M" t* M t* M  

    ε ε ε ε ε ε εε  

    εε εε σ σ  

    = = = =

    = = = =

    y la traza de la matriz  M :

    1 1 1' ( P ' ( Q P ' ( Q P' ( Q! ! ! ! ! !  t* M t* $ X X X X n t* X X X X n t* X X X X n k  − − −= − = − = − = −

    ya *ue la matriz  M   es cuadrada y de dimensión n  y 1' (!  X X   −  de tama>o' (k k × .e "ec"o, la prueba de *ue esta matriz no tiene inversa esinmediata, ya *ue el rango de una matriz idempotente coincide con su

    traza

    9na vez obtenido un estimador insesgado de la varianza residual, dada

    cual*uier muestra de Y   y  X   en el

  • 8/18/2019 Tema 1. Informacion

    22/38

    E0ercicio para el estudiante: )robar *ue el estimador de la varianza delOβ   

  • 8/18/2019 Tema 1. Informacion

    23/38

    Pro+iedades al-e"raicas del criterio de estimación MCO

    ay *ue distinguir las propiedades algebraicas del criterio

  • 8/18/2019 Tema 1. Informacion

    24/38

    Prue"a: ! partir de la primera ecuación normal de un modelo conconstante:

    O OO O O' ( 8 ' ( 8 8 8

    ! ! ! ! !  

    t i X i Y i Y X i Y Y iβ β ε ε  = ⇒ − = ⇒ − = ⇒ = ⇒ =∑Pro+iedad 7 En el

  • 8/18/2019 Tema 1. Informacion

    25/38

    Prue"a:  %a suma de cuadrados de residuos

  • 8/18/2019 Tema 1. Informacion

    26/38

    E0ercicio para el estudiante: 4omprobar *ue se cumplen estas F

     propiedades con los datos del e0ercicio num2rico 1

    Medidas de "ondad de ao en los EE99 y el AS de

    cigue>as en ese mismo a>o y estados %a estimación del modelo *ue

    e7plica el AS de nacimientos en función del AS de cigue>as proporciona

    un /   muy elevado y esto sabemos *ue es esp6reo %a razón es *ue en

    ese a>o la correlación muestral entre ambas variables fue muy alta y

    /F

  • 8/18/2019 Tema 1. Informacion

    27/38

    aun*ue no "ay ninguna relación causal entre ambas, el coeficiente de

    determinación es bueno, pero enga>oso

    En relaciones donde tiene sentido relacionar determinadas variables

    '4onsumo y 5enta(, el coeficiente de determinación puede ser e7cesivamente alto si en el período muestral considerado ambas

    variables evolucionan de forma muy parecida o presentan una tendencia

    com6n

    =tro problema distinto del /    convencional es *ue nunca empeora

    cuando en el modelo introducimos variables e7plicativas adicionales Es

    decir, aun*ue una nueva variable no sea muy relevante, su incorporación

    "ace *ue, en el peor de los casos, el /  no cambie, o bien, con un poco

    de suerte, aumente &ntroducir un nuevo regresor en el modelo tiene dos

    efectos: '1( disminuyen los grados de libertad y 2ste es negativo y '/(

    disminuye la suma residual y 2ste es positivo i el peso del efecto

    negativo es mayor *ue la me0ora en el a0uste, no compensará introducir 

    esta nueva variable y a la inversa

    %a solución a 2ste 6ltimo problema es utilizar el llamado /   a0ustado o

    corregido de grados de libertad '   /  ( *ue se calcula como:

    / /1

    1 '1 (

    n

      n k 

    = − −−

    En esta formulación del /    se tienen en cuenta dos efectos: '1( i

    aumenta el n6mero de regresores en el modelo, disminuyen los grados

    de libertad y esto se penaliza, es decir:/1nk n k

    n k 

    −↑ ⇒↓ − ⇒↑ ⇒↓

    − y '/(

    Esos nuevos regresores pueden me0orar el modelo en t2rminos de a0uste,

    es decir:   / /k + ↑ ⇒↓ ⇒↑ ⇒↑ i el efecto de penalización es menor *ue el efecto de me0ora en el a0uste, el /    aumentará e indicará *ue

    compensa la introducción de esas nuevas variables y a la inversa

    4omo e0emplo, supongamos *ue se "an estimado dos funciones de

    consumo alternativas:

    /O OO   J 88t t t 

    C a bY ε = + + =/O OO O   J 8

    t t t t  C a bY ci ν = + + + =

    donde t i  es un $ipo de inter2s !mbos modelos están anidados ya *ue se

    *uiere e7plicar el 4onsumo en función de la 5enta 'en el primero( o bien, introducir un nuevo regresor '$ipo de inter2s( en el modelo más

    /

  • 8/18/2019 Tema 1. Informacion

    28/38

    sencillo El "ec"o de *ue el /   sea mayor en el modelo más complicado

    indica *ue el $ipo de inter2s es una variable *ue compensa introducir 

    'en t2rminos de a0uste( a pesar de *ue los grados de libertad "ayan

    disminuido

    Deriación del /  : e obtiene a partir del /   convencional

    /   ;1 1;

    +, +, n ,

    +! +! n= − = −

    donde dividiendo por n la uma 5esidual y la uma $otal, esta medida

    se puede interpretar como un ratio de varianzas &mplantando la

    restricción de *ue los estimadores de las varianzas residual y de la

    variable endógena sean insesgados, se obtiene el /    corregido de los

    grados de libertad:

    / /; 11 1 '1 (; 1

    + n k n 

    +! n n k  

    − −= − = − −

    − −

    E0ercicio para el estudiante: 4alcular el /   convencional y el corregido

    usando los datos del e0ercicio num2rico 1 &nterpretar este coeficiente

    Pr,ctica con los datos de Anscom"e y Eie=s$

    En un conocido traba0o publicado por @N !nscombe en 1+ '“Krap"s

    in tatistical !nalysis”, !/e Ame*ican +tati#tician, /, pp1-/1(, se

    ilustran algunos aspectos básicos del análisis de regresión lineal usando

    los datos simulados *ue figuran en la tabla siguiente 'tambi2n en

    ''')ucm)e#0info0ecocuan0ect*1(:

    t    1t  y /t  y :t  y #t  y 1t  x /t  x

    1 8# +1# #F FC 1888 88/ F+C 1# F CF 88 88

    C # 1/# 1 188 88

    # 1 11 # +88 88

    C +/F 1 # 1188 88

    F ++F 18 # 8# 1#88 88

    /# F1 F8 C/C F88 88

    #/F 18 C+ 1/C8 #88 1+88

    + 18# +1 1C CCF 1/88 88

    18 #/ /F F#/ +1 88 8811 CF ## C F+ C88 88

    /

  • 8/18/2019 Tema 1. Informacion

    29/38

    .ada esta información se pide:

    '1( Estimar por

  • 8/18/2019 Tema 1. Informacion

    30/38

  • 8/18/2019 Tema 1. Informacion

    31/38

    '/( 5epresente gráficamente la nube de puntos real 0unto con la

    recta a0ustada en cada uno de los cuatro modelos

    considerados:

    &

    10

    12

    2 & 10 12 1 1&

    1

         Y     1

    2

    &

    10

    2 & 10 12 1 1&

    1

         Y     2

    &

    10

    12

    1

    2 & 10 12 1 1&

    1

         Y     3

    &

    10

    12

    1

    5 10 15 20

    2

         Y     0

    En el modelo 'a( la relación entre las variables es más o menos

    lineal, luego la "ipótesis de linealidad en los parámetros "ace *ue el

    a0uste sea razonable

    En el modelo 'b( la relación entre las variables es claramente no

    lineal y el a0uste podría me0orar claramente especificando el modelo deotras formas, como por e0emplo:

    /

    1 / :t t t t   y x xβ β β ε  = + + +

    1 /ln

    t t t  y xβ β ε = + +

    En el modelo 'c( todos los puntos de la nube real, e7ceptuando uno,

    se a0ustan casi perfectamente en una recta *ue no es la estimada por*ue

    ese valo* atípico 'el tercer par de valores( "ace *ue la recta de a0uste

    cambie de pendiente y el a0uste sea peor En este caso, se aprende *ue la presencia de una o más observaciones atípicas pueden alterar todos los

    1

  • 8/18/2019 Tema 1. Informacion

    32/38

    resultados de la estimación )or tanto, el tratamiento de atípicos antes de

    estimar una relación puede ser crucial

    En el modelo 'd( tenemos otro problema diferente en los datos %os

    datos de la variable e7plicativa /t  x  son todos igual a , e7ceptuando eloctavo valor, *ue es igual a 1+ .e "ec"o, 2ste es el dato *ue "ace *ue la

    recta de a0uste est2 anclada donde está i elimináramos el par de

    valores de la endógena y de la e7ógena para el instante t.2, no sería

     posible estimar por ?IMA @ERO'IMI%ITUD

    Es otro m2todo de estimación del vector de parámetrosβ 

      en ela y en el me0or de

    los casos, aleatoria Kracias al $eorema 4entral del %ímite,

    se puede demostrar *ue si e7iste un n6mero grande de

    variables aleatorias independientes e id2nticamente

    distribuidas, la suma de todas ellas seguirá una normal

    /

  • 8/18/2019 Tema 1. Informacion

    33/38

    'b( 9na variante del $eorema 4entral del %ímite afirma *ue

    aun*ue el n6mero de variables no sea muy grande o no

    sean estrictamente independientes, su suma puede seguir 

    teniendo una distribución normal

    'c( 4on el supuesto de normalidad, se pueden obtener fácilmente las distribuciones *ue siguen los estimadores

  • 8/18/2019 Tema 1. Informacion

    34/38

    ; / / ; / /

    /

    1' ( ' ( '/ ( e7p ' ( ' ( ' , (

    /

    n n !  f Y f Y X Y X Lε σ β β β σ  σ 

    − −   = = Π − − − =

    siendo la función de verosimilitud cuando depende de los parámetros β 

    y /σ  , dada una muestra de Y   y  X  Esta es la función de densidadcon0unta de Y   y  X , dados los valores de los parámetros β   y /σ 

    =btener la e7presión de los estimadores por má7ima verosimilitud de β 

    y /σ  , supone ma7imizar la función de verosimilitud,/' , ( L  β σ  )ara *ue

    sea más fácil y puesto *ue no cambia el óptimo se ma7imiza el

    logaritmo neperiano de la función de verosimilitud:

    / /

    /

    1ma7 ln ' , ( ln / ln ' ( ' (

    / / /

    ! n n L Y X Y X β σ σ β β  σ 

    = − Π − − − −

    4ondiciones de primer orden:

    /1

    /

    ln ' , ( 1 O' / / ( 8 ' (/

    ! ! ! !  

     M5 

     L X Y X X X X X Y 

    β σ β β 

    β σ 

    −∂ = − − + = ⇒ =∂

    //

    / / #

    O Oln ' , ( ' ( ' ( 1O8

    / /

    ! ! 

     M5 

     L n Y X Y X 

    n

    β σ β β ε ε  σ 

    σ σ σ 

    ∂ − −    = − − − = ⇒ =   ÷∂    

    )or tanto, el estimador

  • 8/18/2019 Tema 1. Informacion

    35/38

    Pro+iedades estadísticas del estimador M@: %a cota de 4ramer 5ao proporciona la mínima varianza *ue puede alcanzar cual*uier estimador 

    insesgado de un vector de parámetros .ic"a cota viene dada por la

    inversa de la matriz de información ' $ (, donde 2sta viene definida por laesperanza del "essiano cambiada de signo Es decir:

    /

    /

    ln ' ( L $ " 

      θ 

    θ 

    ∂= −   ∂

    , siendo /β 

    θ σ 

    $omando las derivadas segundas a las condiciones de primer orden, se

    tiene *ue:

    / /

    / /ln ' , (

      ! 

     L X X β σ β σ 

    ∂ = −∂

    / /

    / #

    ln ' , ( P Q

    ' (' (

    !  L X X Y β σ β 

    β σ σ 

    ∂ −=

    ∂ ∂

    / /

    / / # F

    ln ' , ( P Q P Q

    ' (' ( /

    !  L n Y X Y X β σ β β  

    σ σ σ σ  

    ∂ − −= −

    ∂ ∂

    y formando el "essiano:

    / #

    # F

    P Q

    P Q P Q

    /

    ! ! 

     X X X X Y 

     % n Y X Y X  

    β 

    σ σ 

    β β 

    σ σ 

    −−

    =− −

    − −

    %a esperanza de los t2rminos del "essiano es igual a:

    / /

    ! !  X X X X  " 

    σ σ  − = −

    # #

    P Q8

    ! !  X X Y X  " " 

    β ε 

    σ σ 

    −= =

    /

    # F # F # F #

    P Q P Q P Q

    / / / /

    ! ! n Y X Y X n " n n n " 

      β β ε ε σ  

    σ σ σ σ σ σ σ  

    − −− = − = − = −

    C

  • 8/18/2019 Tema 1. Informacion

    36/38

    )uesto *ue la matriz de información es diagonal por blo*ues, su inversa

    tambi2n y tiene la e7presión:

    / 1

    1

    #

    ' ( 8

    /8

    !  X X 

     $ n

    σ 

    σ 

    =

    Esta matriz indica *ue la cota inferior para la varianza de un estimador 

    insesgado de β   es / 1' (!  X X σ    −  y la cota inferior para la varianza de un

    estimador insesgado de /σ   es la e7presión#/

    n

    σ 

    En el caso

  • 8/18/2019 Tema 1. Informacion

    37/38

    %a varianza del estimador de β  llamado HOβ   es:

    H H H /O O Ovar' ( P' (' ( Q ' (! ! ! !   " " C C CC β β β β β εε σ  = − − = =

    !un*ue todavía no son comparables ambas matrices de varianzas y

    covarianzas, es posible siempre descomponer una matriz fi0a como la C 

    en la suma de otras dos: C ( D= + , donde 8 D ≠  y postmultiplicando por 

    la matriz  X   esa identidad, tenemos *ue CX (X DX  = + 4omo k CX $ = , por insesgadez y k (X $ = , por definición, es obvio *ue 8 DX  = )or tanto:

    H / / / / / /Ovar' ( ' (' (! ! ! ! ! !  CC ( D ( D (( DD D( (Dβ σ σ σ σ σ σ  = = + + = + + +

    teniendo en cuenta *ue1' (! ! (( X X    −=  y 8! !  D( (D= = , se obtiene :

    H / 1 / H /O O Ovar' ( ' ( var' ( var' (! ! !  X X DD DDβ σ σ β β σ  −= + ⇒ = +

    y la matriz /   !  DDσ   es definida positiva por construcción

    A+éndice 7$ .istribuciones de los estimadores

  • 8/18/2019 Tema 1. Informacion

    38/38

    ! partir de este resultado podemos derivar inmediatamente la

    distribución del estimador de /σ   por