Post on 24-May-2015
description
Regresión logística
INDICE
INTRODUCCIÓN
TIPOLOGÍA DE MODELOS LOGIT
ETAPAS PARA CONSTRUIR UN MODELO LOGIT
APLICACIÓN PRÁCTICA
INTRODUCCIÓN (I)
TÉCNICA DE ANALISIS DE GRUPOS
– Método– Variables explicativas– Resultado
ANÁLISIS DE REGRESIÓNY = f (X1, X2, …, XK)
con Y: variable categórica
f(): función logística
- Análisis Discriminante
- Regresión logísticaDiferencias
INTRODUCCIÓN (II)
AJUSTE LINEAL
-0.5
0.0
0.5
1.0
1.5
0 10 20 30 40 50 60
XI
EN
DO
GE
NA
Regresión tradicional Regresión logística
NUBE DE PUNTOS A AJUSTAR
PROBLEMAS DEL AJUSTE LINEAL:
– Distribución no normal de la perturbación aleatoria– Heterocedasticidad– Valor estimado fuera del rango 0-1
0
2
4
6
8
10
0 2 4 6 8 10
X1
EN
DO
GE
NA
ENDOGENA vs. X1
INTRODUCCIÓN (III)
AJUSTE NO LINEAL
1
0
0,5
i
sX
udseYii
22/1
2
)2(
1
Logit
Probit
Modelo Probit
iX
X
iXi ue
eu
eY
ikk
ikk
ikk
11
1
Modelo Logit
INDICE
INTRODUCCIÓN
TIPOLOGÍA DE MODELOS LOGIT
ETAPAS PARA CONSTRUIR UN MODELO LOGIT
APLICACIÓN PRÁCTICA
TIPOLOGÍA DE MODELOS LOGIT(I)
LOGIT
Respuesta binaria: LOGIT DICOTÓMICO
(0, 1)
Respuesta múltiple
(1, 2, …, J)
Datos no ordenados:
LOGIT MULTINOMIAL
Datos ordenados:
LOGIT ORDINAL
TIPOLOGÍA DE MODELOS LOGIT(II)
LOGIT DICOTÓMICO
kik
ikk
ikk X
X
Xi e
e
eYob
11
1)1(Pr )(
Se modeliza una ecuación cuyo resultado se interpreta como probabilidad de pertenencia al grupo codificado como 1.
Características:
Expresión general del modelo:
ii
ii
ii XX
XX
XXi e
e
eYob
2211
2211
2211 11
1)1(Pr
Ejemplo:
Para el caso de dos variables explicativas
TIPOLOGÍA DE MODELOS LOGIT(III)
LOGIT MULTINOMIAL
- Se modelizan tantas ecuaciones como alternativas tiene Y.- Para cada variable se estiman tantos parámetros como alternativas de Y menos una.- Es necesario identificar una categoría de referencia.
Características:
Expresión general del modelo:
0 para 1
1)0(Pr 1
1
'
je
Yob J
j
Xi
kikj
)1( ..., ,2 ,1 para 1
)(Pr 1
1
'
'
Jje
ejYob J
j
X
X
ikikj
kikj
TIPOLOGÍA DE MODELOS LOGIT(IV)
LOGIT MULTINOMIALEjemplo:
Para el caso de 3 alternativas de Y (la primera es la que se toma como referencia) y 2 variables explicativas
iiii XXXXi eeYob
223113322211221
1)1(Pr
iiii
ii
XXXX
XX
i ee
eYob
22311332221122
2221122
1)2(Pr
iiii
ii
XXXX
XX
i ee
eYob
22311332221122
2231133
1)3(Pr
TIPOLOGÍA DE MODELOS LOGIT(V)
LOGIT ORDINAL
- Se modelizan tantas ecuaciones como alternativas tiene Y.- Se estima un parámetro para cada variable explicativa y tantos parámetros “límites” como alternativas tiene Y menos una.
Características:
Expresión general del modelo:
)'()0(Pr ikki XYob
)'()'()1(Pr 1 ikkiki kXXYob
)'()'()2(Pr 12 kikkiki XXYob
)'(1))1((Pr )2( ikkJi XJYob
...
TIPOLOGÍA DE MODELOS LOGIT(VI)
LOGIT ORDINALEjemplo:
Para el caso de 3 alternativas de Y y 2 variables explicativas
ii XXLIMITi eYob
221111
1)1(Pr
iiii XXLIMITXXLIMITi eeYob
2211122112 1
1
1
1)2(Pr
ii XXLIMITi eYob
221121
11)3(Pr
INDICE
INTRODUCCIÓN
TIPOLOGÍA DE MODELOS LOGIT
ETAPAS PARA CONSTRUIR UN MODELO LOGIT
APLICACIÓN PRÁCTICA
ETAPAS PARA CONSTRUIR UN MODELO LOGIT(I)
ESPECIFICACIÓN
ESTIMACIÓN
VALIDACION
UTILIZACIÓN
Definición de la variable endógena, explicativas y forma funcional
Cálculo de los parámetros
Individual: Ver que variables resultan significativas estadísticamente
Conjunta: Ver si en conjunto el modelo es aceptable
Predicción
Interpretación de los parámetros
ETAPAS PARA CONSTRUIR UN MODELO LOGIT(II)
ESTIMACIÓN
Método de máxima verosimilitud
)log() log())(log( max
)(*...*)(*)()( max
0y ...y 0y 0 max
0 max
ˆ max
21
21
Ltudverosimilidefunciónuf
ufufufuf
uuuprob
uprob
YYprob
n
n
i
ii
i
i
i
i
X
X
iX
X
i e
eY
e
eYL
11ln)1(
1lnlog
RESOLUCIÓN A TRAVÉS DE UN ALGORITMO DE OPTIMICACIÓN
ETAPAS PARA CONSTRUIR UN MODELO LOGIT(III)
VALIDACIÓNINDIVIDUAL: Contraste de hipótesis
CONJUNTA
0:0 H
Estadístico de contraste Wald
2
)ˆ(
ˆ
DT
Distrib. similar a t2
1.
2.
Regla de decisión
0,00
0,05
0,10
0,15
0,20
0,25
0,30
1 3 5 7 9
11
13
15
17
19
Acepto H0 si:
Valor de estadístico Wald < Niv. sig. >
3.
1. Pseudo R2 =)(log
)(log1
reducidoL
completoL
2. Porcentaje de aciertos: a través de un punto de corte
2/knt
2/
3. Razón de Verosimilitud = X2 = )(log2)(log2 completoLreducidoL
2
)ˆ(
ˆ
DT
Distrib. similar a t2 si H0 cierta
2/knt
2/knt
ETAPAS PARA CONSTRUIR UN MODELO LOGIT(IV)
UTILIZACIÓN
PREDICCIÓNikk Xi
eY
ˆˆ1
1ˆ
INTERPRETACIÓN DEL PARÁMETRO:
ix
i
i eY
Y ˆ1
ˆRatio odds:
j
i
x
x
j
j
i
i
e
e
Y
Y
Y
Y
ˆ1
ˆ
ˆ1
ˆRazón entre odds:
Caso especial: Obs j con x=x Obs i con x=x+1
ee xx
Signo
Cuantía
Efecto Marginal: )ˆ1(*ˆ*ˆiiki YYEM
INDICE
INTRODUCCIÓN
TIPOLOGÍA DE MODELOS LOGIT
ETAPAS PARA CONSTRUIR UN MODELO LOGIT
APLICACIÓN PRÁCTICA
APLICACIÓN PRÁCTICA
1. LOGIT DICOTÓMICO
- Salida básica
- Salida completa
- Identificación de atípicos
- Otros estadísticos para la valoración global del modelo
- Elección del punto de corte óptimo: Curva COR
- Tratamiento de las variables categóricas
- Cálculo del Efecto Marginal
- Estimación por pasos
2. LOGIT MULTINOMIAL
3. LOGIT ORDINAL