Modelos de elecciónModelos de elección discreta para datos de panel, utilizables en el análisis...

Revista Ingenierías Universidad de Medellín

ISSN: 1692-3324

[email protected]

Universidad de Medellín

Colombia

Franco Arbeláez, Luis Ceferino; Zuluaga Díaz, Francisco Iván

Modelos de elección discreta para datos de panel, utilizables en el análisis de riesgo financiero

Revista Ingenierías Universidad de Medellín, vol. 4, núm. 7, julio-diciembre, 2005, pp. 69-81


Medellín, Colombia

Disponible en: http://www.redalyc.org/articulo.oa?id=75004706

Cómo citar el artículo

Número completo

Más información del artículo

Página de la revista en redalyc.org

Sistema de Información Científica

Red de Revistas Científicas de América Latina, el Caribe, España y Portugal

Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

http://www.redalyc.org/revista.oa?id=750

http://www.redalyc.org/articulo.oa?id=75004706

http://www.redalyc.org/comocitar.oa?id=75004706

http://www.redalyc.org/fasciculo.oa?id=750&numero=10445

http://www.redalyc.org/articulo.oa?id=75004706

http://www.redalyc.org/revista.oa?id=750

http://www.redalyc.org

69


RESUMENRESUMENRESUMENRESUMENRESUMEN

En este artículo se hace una revisión formal de losprincipales modelos de elección discreta para datosde panel, mostrando sus ventajas y desventajas;el énfasis es hecho en modelos estáticos, aunquela problemática es extensible a modelos dinámicos,consideramos que este campo de la econometríatiene gran aplicabilidad en la modelación de riesgofinanciero, concretamente en las temáticas deriesgo de crédito y operacional.

PALABRAS CLAVEPALABRAS CLAVEPALABRAS CLAVEPALABRAS CLAVEPALABRAS CLAVE

Datos de Panel, Máxima Verosimilitud, ParámetroAccidental, Score Máximo, Perfil Modificado

Modelos de eleccióndiscreta para datos de panel,

utilizables en el análisisde riesgo financiero

LLLLLuis Ceferino Franco Arbeláezuis Ceferino Franco Arbeláezuis Ceferino Franco Arbeláezuis Ceferino Franco Arbeláezuis Ceferino Franco ArbeláezProfesor del Programa de Ingeniería Financiera de la Universidad de Medellín ([email protected])

Francisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazFrancisco Iván Zuluaga DíazProfesor del Programa de Ingeniería Financiera de la Universidad de Medellín ([email protected])

RECIBIDO: 05/08/2005ACEPTADO:30/09/2005

Modelos de elección discreta para datos de panel...

70

Revista Ingenierías

ABSTRACTABSTRACTABSTRACTABSTRACTABSTRACT

In this Paper becomes a formal revision of the mainmodels of discrete election for panel data, showingto its advantages and disadvantages; the emphasisis done in static models, although the problematicit applies a partly to dynamic models, weconsidered that this field of Econometric has greatapplicability in the modeling of financial risk,concretely in the thematic of risk operational andrisk credit.

KEY WORDSKEY WORDSKEY WORDSKEY WORDSKEY WORDS

Panel Data, Maximum likelihood, IncidentalParameter, Maximum Score, Modified Profile.

Franco & Zuluaga

71


1. IntroducciónPara el estudio de las propiedades estadísticas delos métodos de inferencia en econometría,generalmente se utilizan aproximacionesasintóticas TP. Si N (número de individuos) espequeño y T (número de períodos) es grande sepuede afirmar que se tienen N variables a explicar

, sobre las cuales se tienen

observaciones de series de tiempo. En este tipode situaciones las aproximaciones importantes sonpara N fijo y T . Ahora, en micro-paneles, lautilización de resultados asintóticos para Tno necesariamente proporcionará buenasaproximaciones a las distribuciones de losestimadores. Por eso generalmente se asume eneste tipo de modelación que N y T fijo. Asíse puede pensar que se tienen T variables aexplicar sobre las que se

tienen N observaciones de corte transversal.

En el estudio de las propiedades asintóticas paraestimadores de datos de panel dinámicos lineales,Arellano y Álvarez (2003) han demostrado que losestimadores de máxima verosimilitud coninformación limitada y el método generalizado delos momentos resultan ser consistentes

cuando para T fijo; mientras que el

estimador Intra-Grupo resulta no serlo. De igual

manera para el caso en el cual , donde C

es una constante positiva, los autores demuestranque cada uno de los estimadores anterioresexhiben sesgos asintóticos negativos.

En el campo de los estimadores para modelos nolineales, que es nuestro interés, el estudio secomplica más. Por ejemplo, la dificultad deencontrar estimadores consistentes a las tasa como en el caso del modelo estático probit deefectos fijos, y las dificultades se vuelven másserias para modelos dinámicos de elección

discreta, ya que en este tipo de modelos,elementos como la dependencia en el estado,regresores predeterminados y correlación serial sevuelven trascendentales. Por ejemplo, Heckman(1981) muestra que cuando se incluye una variabledependiente rezagada, el desempeño del estimadorde máxima verosimilitud para modelos probit esmuy deficiente. En este sentido hay mucho queestudiar en la construcción de argumentosasintóticos y en la aproximación de distribucionesmuestrales para los modelos de datos de panel nolineales.

2. EL MODELO TEÓRICOA continuación se hará una presentación formalde los modelos de elección discreta para datos depanel y las complicaciones que surgen de ellos. Elenfoque será para modelos estáticos pero laproblemática también es extensible a modelosdinámicos.

2.1 El modelo básicoEl modelo básico a considerar es el siguiente

Donde los son distribuidos independien-temente con función de distribución condicional

sobre de modo que

La función de Log-Verosimilitud de (1.1)suponiendo que los son condicionalmenteindependientes de estará dada por

(1.3)

(1.1)

(1.2)


72


Donde , ahora definiendo

(1.4)

Diferenciando (1.4) tenemos

De donde se desprende que

(1.5)

(1.6)

representa la función de densidadcorrespondiente a . (1.5) y (1.6) se conocencomo los scores, los cuales se denotarán como

y respectivamente.

En el caso del modelo logit, F es la función dedistribución logística

(1.7)

En este caso

Por lo tanto en esta situación

En este tipo de situación, para β dado, elestimador de máxima verosimilitud de ηi estarádado por

(1.8)

Donde resuelve

(1.9)

Y el estimador de Máxima Verosimilitud de β estarádado por

(1.10)

es conocida como la función deLog-Verosimilitud concentrada. La condición deprimer orden que permite encontrar (1.10) es

Por (1.9) esta expresión se transforma en

(1.11)

Franco & Zuluaga

73


La dificultad con (1.11) es que esta expresiónevaluada en β = β

0 no convergerá a cero en

probabilidad cuando para T fijo. Estefenómeno es conocido como el problema delparámetro accidental. Para entender un poco esteproblema considérese el siguiente ejemplo en elcual T = 2, f es simétrica, β es un escalar, y xit esuna dummy temporal tal que xi1= 0 y xi2=1.

Ahora, para el caso en el cual

tenemos que

Ahora tomando como base el modelo logit

(1.12)

Diferenciando (1.12) con respecto a η e igualandoa cero:

cuya solución se tiene con , lo que implica

que

Ahora para el caso en el cual

Diferenciando (1.13) con respecto a η e igualandoa cero:

Donde se tiene que y

Por último, para tenemos

Diferenciando (1.14) con respecto a η e igualandoa cero

De donde se tiene

(1.15)

(1.15) también es el valor que se obtiene

con . El desarrollo anterior tiene

como interpretación que la contribución de lasobservaciones (0,0) y (1,1) a la función de Log-Verosimilitud concentrada es cero, la observación

(0,1) contribuye con , y la

(1.13)

(1.14)


74


observación (1, 0) contribuye con

por lo tanto la función de Log-Verosimilitudconcentrada estará dada por

(Donde y

. Ahora diferenciando

(1.16) con respecto a e igualando a cero

Por lo tanto el estimador Máximo verosímil

de es

(1.17)

Denotando tenemos que

(1.18)

Ahora dado que

��

es la contraparte muestralde , por lotanto se tiene que

De donde

Donde G es la función de distribución

de , ahora obsérvese que

La cual no depende de η y por lotanto ( )� �

� β= Λ . Reemplazando esta expresiónen (1.19) se tiene

(1.21).

Por lo tanto, este estimador no es consistente.

2.2 Estimación por máxima verosimilitudcondicional

El objetivo de este método es usar la función de

verosimilitud condicionada sobre un estadístico

suficiente para ηi, para hacer inferencias acerca

de β0. Según Hsiao (2003) la idea de usar el modelo

logit es basarse en el hecho de que es un

estadístico suficiente para �

η , con lo cual(1.19)

(1.16)

(1.20)

Franco & Zuluaga

75


(1.22)

Donde Bi es el conjunto de todas las sucesiones

de ceros y unos tales que = . Para el caso

en el cual T = 2 y según (1.20) tenemos

(1.23)

Basándonos en (1.4), (1.20), y (1.23) la función deLog-Verosimilitud condicionada sobre estará dada por

(1.24)

Diferenciando (1.24) tenemos

De donde se tiene el siguiente score

(1.25)

2.3 Estimación por Score máximoEl procedimiento anterior descansa sobre elsupuesto de la distribución logística para los

errores. Manski (1987) propone un método

alternativo en el cual el supuesto requerido es que

. Este supuesto

impone estacionariedad, pero permite correlación

serial y heterocedasticidad en el corte transversal;

las implicaciones de este supuesto son las

siguientes, para el caso en cual T = 2:

(1.26)

La prueba de (1.26) parte del hecho de que paratodo � se tiene que

porlo cual

(1.27)

Donde , ahora de (1.27) y del

supuesto de estacionariedad, se desprende que

(1.28)

De donde se desprende inmediatamente (1.26).Reescribiendo (1.26) en términos de primerasdiferencias se tiene la siguiente representaciónequivalente:


76


(1.29)

Como anota Manski (1987) el supuesto deestacionariedad permite identificar a como unmodelo de regresión de mediana sobre datos desección cruzada, lo que hace natural que elproblema de datos de panel tenga unainterpretación de regresión de mediana.

Ahora, dado que , la diferencia será igual a 1 ó -1; de modo que la mediana será1 o -1 dependiendo de cuando

por tanto

(1.30)

Donde sgn es la función signo definida como

Es decir sgn (u) = 1 si u > 0, sgn (u) = 0 si u = 0,y sgn (u) = -1 si u < 0. Ahora por (1.29) tenemosque

Es decir

Manski prueba que el vector de coeficientes

estandarizado está identificado.

El problema con (1.32) es que no se puede utilizar

para definir un estimador GMM, ya que la funciónsigno no es invertible. Manski propone estimar β0

seleccionando el valor que haga coincidir el signode con el de para tantas observacionescomo sea posible en la submuestra. El estimadorpropuesto es el del score máximo que maximiza lasiguiente función criterio

Donde el espacio de parámetros B está dado por

(1.34)

Ahora SN (β) tendrá varios máximos locales, lo

que implicará que la elección de los valores iniciales

de los parámetros es fundamental. Un problema

con este estimador es que no es asintóticamente

normal a la tasa de convergencia , lo cual no

hace posible realizar pruebas de hipótesis

asintóticas en la forma habitual. La función dada

por (1.33) da el número de éxitos menos el número

de fracasos.

Una forma alternativa de la función score es

(1.35)

Nótese que el score es el número de prediccionescorrectas que se pueden hacer si predecimos que

cuando .

2.4 Función de verosimilitud de perfilmodificado

(1.31)

(1.32)

(1.33)

Franco & Zuluaga

77


Este método fue desarrollado por Cox y Reid (1987)y ampliado por Lancaster (1997-2000). En él seconsidera el problema de hacer inferencia acercade los parámetros de interés cuando no se tieneconocimiento acerca de ηi. Este tipo de inferenciase puede realizar introduciendo información deortogonalidad; tal información requiere que enpromedio las derivadas cruzadas sean cero. Debidoa que esta condición no ocurre generalmente enlos modelos de elección discreta, se hace necesario

introducir una reparametrización de (β, ηi) a

(β, λ i) de tal manera que β y λ i sean

ortogonales en información. Por tanto

ηi =η (β, λi) es elegida tal que

(1.36)

Donde es la función de Log-Verosimilitudreparametrizada satisfaciendo

Diferenciando (1.36)

Por tanto

(1.38)

De (1.38) se desprende que

(1.39)

Ahora, dado que , la

matriz de información esperada nos queda así

(1.40)

Por último, reemplazando (1.37) en (1.40) nosqueda que η(β, λi) debe satisfacer la ecuacióndiferencial parcial

(1.41)

La solución de (1.41) determina la dependenciade ηi sobre β. El efecto fijo ortogonalizado λi

puede ser introducido como la constante deintegración arbitraria, pero teniendo presente queno existe un único efecto fijo ortogonalizado, yaque cualquier función de tal efecto es tambiénortogonal a los parámetros comunes.

Ahora de (1.6) tenemos que

y por lo tanto

(1.42)

Y de (1.5)

(1.43)

(1.37)


78


Dado que (1.42) es diferente de cero, se hace necesariauna reparametrización ortogonal de ηi que satisfaga(1.41) así

La reparametrización de Lancaster (2000) se puede

obtener a partir del siguiente calculo, sea

, por lo cual

(1.45)

Y teniendo presente que

Ahora de (1.45) y (1.46) se desprende que

(1.47)

Donde resolviendo (1.47) obtenemos lareparametrización ortogonal

En un resultado anterior ya habíamos obtenidoque en el caso de la distribución logística

Con lo cual h(r) = fit, que coincide con la funciónde densidad logística de modo que el efectoortogonal en el caso del modelo logit es

(1.49)

2.5 Función de verosimilitud concentradamodificadaCox y Reid (1987) proponen hacer inferenciaacerca de β sobre la función de verosimilitudcondicional basados en el estimativo de máximaverosimilitud de λi, tomando β como conocido.En este caso, cuando existe un estadísticosuficiente para λi es posible definir la función deverosimilitud condicional sobre este estadístico. Loque sucede en general es que la distribucióncondicional exacta es difícil de identificar. Cox yReid (1987) proponen una fórmula aproximadapara la función de verosimilitud condicional dadapor

Donde , por lo tanto la función

de Log-Verosimilitud Concentrada Modificada

(1.44)

(1.46)

(1.48)

(1.50)

Franco & Zuluaga

79


puede ser escrita como

Donde es el logaritmo de (1.50).

El primer término del lado derecho de es

la función de Log-Verosimiltud concentrada cuyo

máximo provee el estimativo de máxima

verosimilitud de β. El segundo término modifica

la función de Log-Verosimilitud concentrada y su

papel es penalizar los valores de β para los cuales

la información acerca de los efectos es

relativamente grande. El score modificado estará

dado por

(1.52)

Tal como demuestran Cox y Reid (1991), una

ventaja de usar es que, mientras la

diferencia entre el score con λi conocido y el score

concentrado es en general de orden Op(1), con el

score concentrado modificado es de orden

.

Siguiendo a Cox y Reid (1987), el término

puede ser calculado como el producto de la

información de Fisher en la parametrización

(β,η i) y el cuadrado del Jacobiano de la

transformación de (β,ηi) a (β,ηi) , de (1.36)

tenemos

El término se hace cero en . Por lo

tanto de (1.53) tenemos

(1.54)

De esta manera, puede ser escrita como

(1.55)

Ahora de (1.41) tenemos

Y en virtud de (1.46)

(1.51)

(1.53)

(1.56)

(1.57)


80


2.6 Función de verosimilitud concentradamodificada para elección discretaLos desarrollos anteriores nos permitirán encontrarla función de Log-verosimilitud ConcentradaModificada para el modelo logia. Remplazando(1.47) en (1.54) tenemos

(1.58)

Y de (1.5)

(1.59)

Ahora de (1.7) y (1.49) se desprende que

(1.60)

El cual no depende de β y por tanto se convierteen un estadístico suficiente para el efecto fijo. Ahoraobsérvese que para el modelo logit

Y por tanto la función de Log-VerosimilitudConcentrada Modificada para el modelo logit es

(1.61)

3. CONCLUSIONESLa presentación formal realizada en este artículo,muestra las complicaciones que surgen en eltratamiento de los modelos de elección discretapara datos de panel y sus posibles soluciones. Estees un campo promisorio en la modelacióncuantitativa del riesgo financiero.

� ÁLVAREZ, J. y M. ARELLANO., �The Time Series and Cross-Section Asymptotics of Dynamic Panel DataEstimators�, Econometrica, 2003,71,1121-1159,2003

� AMEMIYA, T., Advanced Econometrics, Harvard University Press,Cambridge, 1985.

� ARELLANO, M., �Discrete choices with Panel Data�,Investigaciones Económicas XXVII(3),423-458,2003

� ARELLANO, M y B. Honore.,�Panel Data Models: Some Recent Developments�, in Heckman,J.J. and E.Leamer(eds.),Handbook of Econometrics,vol 5,chapter 53,North-Holland, 2001.

� COX, D. R. and N. Reid �Parameter ortogonality and approximate conditional inference�, Journal of theRoyal Statistical Society, Series B, 1-39, 1987.

� CHAMBERLAIN, G. �Analysis of covariance with qualitative data�, Review of Economic Studies 47, 225-238, 1980.

BIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIA

Franco & Zuluaga

81


� CHAMBERLAIN, G. �Panel Data�, in 2, Griliches and M.D. Intriligator (eds), Handbook of Econometrics,vol. 2, El sevier Science, Amsterdam, 1984.

� HECKMAN, J. J., �The incidental parameters problem and the problem of initial conditions in estimation adiscrete time-discrete data stochastic process�. In: Manski,C.f.

� MCFADDEN, D.(Eds), Structural Analysis of Discrete Data with Econometric Applications. MITPress,Cambridge Mass,1981

� HSIAO, C., Analysis of Panel Data, Second Edition, Cambridge University Press, 2003.

� LANCASTER, T., �The Incidental Parameter Problem Since 1948�, Journal of Econometrics 95,391-413,2000.

� LANCASTER, T., �Orthogonal Parameters and Panel Data�, Review of Economic Studies 69,647-666,2002.

� MANSKI, C., �Semi parametric Analysis of Random Effect Linear Models from Binary Panel�, Econometrica55,357-362,1987.


Modelos de elecciónModelos de elección discreta para datos de panel, utilizables en el análisis...

Documents

Transcript of Modelos de elecciónModelos de elección discreta para datos de panel, utilizables en el análisis...