UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD...

16
UNIVERSIDAD DE ANTIOQUIA UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD FACULTAD NACIONAL DE SALUD PÚBLICA PÚBLICA Héctor Abad Gómez” Héctor Abad Gómez” ltad Nacional de Salud Pública “Héctor Abad Gómez” [email protected]. edu.co

Transcript of UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD...

Page 1: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

•UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA•FACULTAD NACIONAL DE SALUD FACULTAD NACIONAL DE SALUD PÚBLICAPÚBLICA•““Héctor Abad Gómez”Héctor Abad Gómez”

•Facultad Nacional de Salud Pública “Héctor Abad Gómez”

[email protected]

Page 2: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

Regresión logística Binaria

Planteamiento: •Una variable dependiente que tiene únicamente dos opciones. (dicotómica)• Se quiere calcular la probabilidad de que ocurra una u otra a partir de una serie de informaciones (variables independientes).

Ejemplos:

• “Vota o no vota en unas elecciones”• “Cumple la dieta o no la cumple”• “Diagnóstico positivo o negativo en una prueba médica”

Page 3: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

• Mantiene cierta analogía con el análisis de regresión múltiple excepto que la variable dependiente es dicotómica.

• Es algo así como un caso particular del análisis discriminante, en el que la variable dependiente tiene dos estados, los supuestos son menos restrictivos y se admiten variables independientes categóricas.

Regresión logística

Page 4: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

• Un investigador médico está interesado en determinar si la probabilidad de un ataque al corazón puede predecirse conociendo la presión de la sangre del paciente, el nivel de colesterol, la ingesta de calorías, el sexo y el estilo de vida.

Regresión logística

Page 5: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

• En general, con k variables independientes:.

Regresión logística

kk110k21 X....X)]X...X,X/ME(oddsln[

kk110 X....X]p1

pln[

P es la probabilidad de que se prediga que una persona puede tener un ataque al corazón teniendo en cuenta las variables independientes Xi.

Page 6: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

• La ecuación anterior modeliza el logaritmo neperiano de las odds como una función lineal de las variables independientes y es equivalente a una ecuación de regresión múltiple con el ln de las odds como variable dependiente.

• Las variables independientes pueden ser continuas y categóricas.

• El ln (log) de las odds se conoce como logit. De ahí viene el nombre de regresión logística múltiple.

Regresión logística

Page 7: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

• Si sólo hay una variable independiente:.

Regresión logística

110 X]p1

pln[

)X( 110e1

1p

Probabilidad del éxito (sí vota, sí tiene la enfermedad...)

Page 8: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

El objetivo primordial que resuelve esta técnica es el de modelar cómo influye en la probabilidad de aparición de un suceso, habitualmente dicotómico, la presencia o no de diversos factores y el valor o nivel de los mismos. También puede ser usada para estimar la probabilidad de aparición de cada una de las posibilidades de un suceso con más de dos categorías (politómico).

•http://www.seh-lelha.org/rlogis1.htmPreparado por León Darío Bello P.

Page 9: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

REGRESION LOGISTICA•La regresión logística resulta útil para los casos en los que se desea predecir la presencia o ausencia de una característica según los valores de un conjunto de variables predictoras. la variable dependiente es dicotómica. Los coeficientes de regresión logística pueden utilizarse para estimar la razón de las ventajas (odds ratio) de cada variable independiente del modelo.

Preparado por León Darío Bello P.

Cociente de dos ODDS

Page 10: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

Calcular el odds de presencia de hipertensión cuando el consumo de sal es inferior a esa cantidad.

Si dividimos el primer odds entre el segundo, hemos calculado un cociente de odds, esto es un odds ratio, que de alguna manera cuantifica cuánto más probable es la aparición de hipertensión cuando se consume mucha sal (primer odds) respecto a cuando se consume poca.

REGRESION LOGISTICA

Page 11: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

REGRESION LOGISTICA

• ¿Qué características del estilo de vida son factores de riesgo de enfermedad cardiovascular? Dada una muestra de pacientes a los que se mide la situación de fumador, dieta, ejercicio, consumo de alcohol, y estado de enfermedad cardiovascular, se puede construir un modelo utilizando las cuatro variables de estilo de vida para predecir la presencia o ausencia de enfermedad cardiovascular en una muestra de pacientes.

Preparado por León Darío Bello P.

Page 12: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

REGRESION LOGISTICADisponer de al menos 10 * (k + 1) casos para estimar un modelo con k variables independientes; es decir, al menos 10 casos por cada variable que interviene en el modelo, considerando también la variable dependiente (la probabilidad del suceso).

Sí las variables que intervienen están muy correlacionadas, lo que conduce a un modelo desprovisto de sentido y por lo tanto a unos valores de los coeficientes no interpretables. A esta situación, de variables independientes correlacionadas, se la denomina colinealidad.

Page 13: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

REGRESION LOGISTICA• COEFICIENTES

El coeficiente logístico compara la probabilidad de ocurrencia de un suceso con la probabilidad de que no ocurra (odds ratio)

Prob (Evento)

Prob (No Evento)

ESTADISTICO WALDH0= ßj = 0la información que se perdería al

eliminar Xj en el siguiente caso no es significativa

PUNTUACION EFICIENTE DE RAO

H0= ßj = 0la información que aportaría la

nueva variable no sería significativa.

= eb0 + b1 X1 +b2 X2 + ...

Preparado por León Darío Bello P.

Page 14: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

REGRESION LOGISTICA• BONDAD DEL AJUSTEBONDAD DEL AJUSTE

Se utiliza –2 logaritmo del valor de verosimilitud y se representa por –2LL.

Un modelo con un buen ajuste tendrá un valor pequeño para –2LL.

El contraste Chi cuadrado para la reducción en el logaritmo del valor de verosimilitud proporciona una medida de mejora debida a la introducción de variables independientes.

R2 de COX Y SNELLSimilar al R2 de la regresión

lineal.

R2 de NAGELKERKECorrección del anterior.

Preparado por León Darío Bello P.

Page 15: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

Ejemplo

Café No caféUrbano Rural Urbano Rural

Cáncer 32 1 15 2No cáncer 15 10 15 10

Mediante un modelo de regresión logística, determine la posible asociación entre el cáncer de vejiga, el consumo de café y la procedencia. Se eligen 50 pacientes con cáncer y 50 sin él y se definen 3 variables: CÁNCER (0=sin cáncer, 1= con cáncer), CAFÉ (0=sin consumo, 1= con consumo), MEDIO (0=rural, 1=urbano)

Desarróllelo usando el SPSS.

Preparado por León Darío Bello P.

Page 16: UNIVERSIDAD DE ANTIOQUIAUNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICAFACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad GómezHéctor Abad Gómez.

Prueba de Hosmer-LemeshowCompara los valores observados y los esperados, por lo tanto, si SIG es mayor de 0.05 no se puede rechazar la hipótesis nula de que no hay diferencia significativa entre los valores observados y los que predice el modelo. Por lo tanto, el modelo tiene un buen ajuste.

Prueba de Hosmer y Lemeshow

1.177 2 .555Paso1

Chi-cuadrado gl Sig.

Preparado por León Darío Bello P.