Uso de modelos Mixed Logit en modelación de elecciones discretas

Post on 30-Dec-2015

34 views 0 download

description

Uso de modelos Mixed Logit en modelación de elecciones discretas. Marcela A. Munizaga Ricardo Alvarez-Daziano Universidad de Chile Santiago, 30 November, 2014. Contenido de la Presentación. Correlación del término de error Análisis de Simulación logverosimilitud y parámetros - PowerPoint PPT Presentation

Transcript of Uso de modelos Mixed Logit en modelación de elecciones discretas

Uso de modelos Mixed Logit en modelación de elecciones discretas

Marcela A. MunizagaRicardo Alvarez-DazianoUniversidad de Chile

Santiago, 19 April 2023

Contenido de la Presentación

Correlación del término de errorAnálisis de Simulación

logverosimilitud y parámetrositeraciones y tiempo de convergenciadiferencias en modalidad predictiva

Análisis con datos realesequivalencia entre modelos capacidad de recuperar efectos de correlación

Elección Discreta y Utilidad Aleatoria

Teoría de la Utilidad AleatoriaIndividuo maximiza su Utilidad, función de atributos de la alternativa y características de los individuos (Domencich y McFadden, 1975)Modelador no posee información completa del sistema

Hay componentes y atributos que se desconocen o no se pueden medir; aleatoriedad inherente a la naturaleza humana

ininin VU

Elección Discreta (cont.)

Logit Multinomial MNL (McFadden, 1974)Supone errores iid Gumbel Expresión cerrada de la probabilidad de elección:

nCjjn

inin V

VP

)exp(

)exp(

KI2

2

2

2

00

0

0

00

No se puede asegurar con certeza qué alternativa será escogida

Supuestos sobre distribución de Modelo de elección específico (Ortúzar y Willumsen, 1994)

),,Pr()/Pr( ijCjVVCiP njnjnininnin

¿Por qué usar algo distinto del MNL?

Correlación: Dependencia Heteroscedasticidad: Distinta varianza Dependencia probabilidades y parámetros inconsistentes, predicciones poco confiablesPropiedad de independencia de alternativas irrelevantes (patrones de sustitución constantes)Avances en computación y métodos numéricos permiten considerar modelos más generales

Correlación del término de error

Motivación: el estudio de correlaciónFuentes de correlación: alternativas similares, alternativas con componente común, variaciones en los gustos, agregaciónModelos adecuados: Logit Jerárquico, Probit, Mixed Logit

Logit Jerárquico

Agrupa las alternativas similares en nidosUi=Vi+i+j alt i nido jMatriz de covarianza:

correlación, homoscedasticidad

222

22

2

221

21

2

00

00

00

00

NL

222

Probit

Ui=Vi+i i ~ Normal

Matriz de covarianza general, sujeto a restricciones de identificabilidad

Permite modelar correlación y heteroscedasticidad

2

11

1

2221

12121

JJJJ

JJ

J

Modelo Mixed Logit

Se deriva de suponer

iid Gumbel, término aleatorio adicional que distribuye f(*) (Ben Akiva y Bolduc, 1996; McFadden y Train, 1997)

Si es iid Gumbel probabilidad condicional en

Por lo tanto, la probabilidad total es:

inininin VU

j

V

V

innjnjn

inin

e

eLiP

)()/(

dfLP inin *)/()(

Modelo Mixed Logit (cont.)

Caso Particular (Modelo lineal de error compuesto):

inintin

V

int

in

inin

zxU

zin atributos relacionados con alternativa i e individuo n

PropiedadesML aproxima cualquier modelo de utilidad aleatoria (McFadden y Train, 1997): ML con parámetros distribuidos normal, aproxima a un Probit.

Razón de probabilidades depende de todo el conjunto de alternativas disponibles.

Modelo Mixed Logit (cont.)

EstimaciónCondicional en *, se obtiene un valor Pin() tiene forma Logit. Proceso se repite R veces:

R

r

rinin P

RP

1

)(1~

Probabilidad Simulada de escoger la alternativaSe maximiza la log verosimilitud simulada

n Cj

jnjn

n

Pyl~

ln

Modelos de elección (cont.)

Nested Mixed LogitBrownstone and Train (1999).

Ui=Vi+i+j i ~ iid Gumbel j ~ NormalMatriz de covarianza:

correlación, heteroscedasticidad

222

22

22

222

221

21

21

221

00

00

00

00

ML

Análisis de Simulación

Objetivo: estudiar los modelos en un caso en que se cumplen todos los supuestosMetodología:

atributos según base de datos realse asume ciertos parámetros de gustose genera las componentes determinística y aleatoria de la función de utilidadse calcula la elección de acuerdo a máx Use calibra los modelos con la base generadaestímulo de políticas

Análisis de Simulación

Uso del simulador en modalidad predictivaPredicciones con los modelos calibrados

¿En qué nos podemos fijar?Diferencias entre parámetros conocidos y calibradosDiferencias entre predicciones del simulador (realidad virtual) y predicciones modeladas

Influencia del Nº Repeticiones

4000 Observaciones4 alternativasCorrelación: 0,5 (Nido con dos alternativas)Dimensión: 3

Probit (Nº de alternativas - 1)ML (Estructura homsc. anidada: 1 componente común + 2 términos independientes)

Influencia del Nº Repeticiones

Parámetro de Correlación : Probit

0.0

0.2

0.4

0.6

0.8

1.0

1.2

0 250 500 750 1000

Nº Rep

Upper Limit

Parameter

Lower Limit

Real

Influencia del Nº Repeticiones

Parámetro de Correlación : MLR

-6

-4.5

-3

-1.5

0

1.5

3

4.5

6

0 250 500 750 1000

Nº Rep

Upper Limit

Parameter

Lower Limit

Real

Influencia del Nº Repeticiones

Parámetro de Correlación : MLH

-0.5

0.0

0.5

1.0

1.5

2.0

0 250 500 750 1000

Nº Rep

Upper Limit

Parameter

Lower Limit

Real

Influencia del Nº Repeticiones

log verosimilitud

-1.056

-1.052

-1.048

-1.044

-1.04

0 250 500 750 1000

Nº Rep

l( )

Probit

ML H

ML R

Influencia del Nº Repeticiones

Diferencias en modalidad predictiva

0

3

6

9

12

15

18

0 250 500 750 1000

Nº Rep

2

Probit

ML H

ML R

Base

Influencia del Nº Repeticiones

Iteraciones and tiempo de convergencia

0

3

6

9

12

15

0 250 500 750 1000

Nº Rep

Iter

atio

ns Probit

ML H

ML R

0

100

200

300

400

500

600

700

0 250 500 750 1000

Nº RepT

ime

for co

nver

genc

e

Probit

ML H

ML R

Caso: alternativas correlacionadas

Síntesis8000 Observaciones / = 0,5 / He & HoMejor verosimilitud para MLML: recupera adecuadamente todos los parámetrosProbit: importante subestimación de la correlación LJ: efectos de escala, al usar datos heteroscedásticos NL – Probit – ML: buen nivel de respuestaMNL: pobre nivel de respuesta en comparación con ML y LJ

Datos reales

Contexto: Corredor Las Condes - Centro, RP 9 alternativas, se incluye combinaciones

auto chofer, auto acompañante, taxi colectivo, metro, bus, auto chofer-metro, auto acompañante -metro, taxi colectivo-metro, bus-metro

697 observaciones

Datos reales

Estructura anidada 1

Transporte Público

Bus Taxi Metro

Taxi Metro

Bus Metro

Auto Chofer

Auto Acomp

ACh Metro

AAc Metro

Datos reales: Estructura 1

Datos reales

Estructura anidada 2

Transporte Público

Bus Taxi Metro

Taxi Metro

Bus Metro

Auto Chofer

Auto Acomp

AChMetro

AAcMetro

Auto

Datos reales: estructura 2

Síntesis y Discusión

ML es un modelo útil, flexible y aplicable La estructura de covarianza se deduce de la especificación y debe ser debidamente justificada Nested Mixed Logit no es equivalente al LJProbit aparece como un modelo costoso y muestra dificultades para recoger correlación