Modelo predictivo de duración de periodos de incapacidad ...

101
1 TESIS DOCTORAL MODELO PREDICTIVO DE DURACIÓN DE PERIODOS DE INCAPACIDAD TEMPORAL EN LA ENFERMEDAD COMÚN César González Ramírez Departamento de Terapéutica Médico-Quirúrgica 2015

Transcript of Modelo predictivo de duración de periodos de incapacidad ...

Page 1: Modelo predictivo de duración de periodos de incapacidad ...

1

TESIS DOCTORAL

MODELO PREDICTIVO DE DURACIÓN DE PERIODOS DE INCAPA CIDAD TEMPORAL EN LA ENFERMEDAD COMÚN

César González Ramírez

Departamento de Terapéutica Médico-Quirúrgica

2015

Page 2: Modelo predictivo de duración de periodos de incapacidad ...

2

TESIS DOCTORAL

MODELO PREDICTIVO DE DURACIÓN DE PERIODOS DE INCAPA CIDAD TEMPORAL EN LA ENFERMEDAD COMÚN

César González Ramírez

Departamento de Terapéutica Médico-Quirúrgica

Conformidad de los Directores

Fdo: Diego Peral Pacheco Fdo: Jesús Montanero Fernández

2015

Page 3: Modelo predictivo de duración de periodos de incapacidad ...

3

ÍNDICE

LISTA DE TABLAS ......................................................................................... 5

LISTA DE GRÁFICOS .................................................................................... 7

LISTA DE ABREVIATURAS ........................................................................... 8

1. INTRODUCCIÓN ....................................................................................... 10

1.1. Incapacidad Temporal ......................................................................... 14

2. OBJETIVOS ............................................................................................... 21

3. MATERIAL Y MÉTODOS .......................................................................... 22

3.1. Consideraciones previas sobre los datos ............................................ 22

3.2. Variables a considerar y modelo predictivo ......................................... 27

3.2.1. Modelo Lineal y selección de las fuentes de variabilidad a contemplar en lo sucesivo ......................................................................... 27

3.2.2. Estudio comparativo de los diferentes modelos de predicción ..... 34

3.2.2.1. Modelo Lineal ............................................................................ 34

3.2.2.2. Árbol de regresión ..................................................................... 36

3.2.2.3. Modelo de regresión gamma ..................................................... 37

3.2.2.4. Modelo de predicción categórica ............................................... 40

3.2.2.4.1. Categorización de pronósticos lineal y gamma ......................... 40

3.2.2.4.2. Regresión logística binaria ........................................................ 41

3.2.2.4.3. Árbol de decisión ....................................................................... 41

3.2.2.4.4. Método mixto lineal-gamma ...................................................... 44

3.2.2.4.5. Predicción con tres categorías .................................................. 45

3.2.3. Conclusión: modelo predictivo a considerar y variables de interés 46

4. RESULTADOS .......................................................................................... 49

4.1. Diagnóstico ......................................................................................... 50

4.2. Cuenta ................................................................................................. 52

4.3. Pago .................................................................................................... 53

4.4. Ocupación ........................................................................................... 54

4.5. Edad .................................................................................................... 56

4.6. Codiagnóstico ..................................................................................... 58

4.7. Hijos .................................................................................................... 59

4.8. Provincia ............................................................................................. 61

Page 4: Modelo predictivo de duración de periodos de incapacidad ...

4

4.9. Tipo de contrato .................................................................................. 63

4.10. Recaída ............................................................................................ 64

4.11. Estado civil ....................................................................................... 65

4.12. Interacción diagnóstico - sexo .......................................................... 66

4.13. Interacción diagnóstico - tipo de pago ............................................. 68

4.14. Interacción Número episodio - hábito tabáquico .............................. 72

5. DISCUSIÓN ............................................................................................... 74

6. CONCLUSIONES ...................................................................................... 85

7. BIBLIOGRAFIA .......................................................................................... 88

8. ANEXOS .................................................................................................... 93

ANEXO I. Documento de autorización de Ibermutuamur para el análisis de los datos ........................................................................................................ 94

ANEXO II. Distribución de diagnósticos por epígrafe .................................... 99

ANEXO III. Algoritmo del árbol de decisión del modelo .............................. 100

Page 5: Modelo predictivo de duración de periodos de incapacidad ...

5

LISTA DE TABLAS

Tabla 3.1: Prueba Anova de los efectos de las variables

Tabla 3.2: Comparativa de los errores cometidos por los modelos lineal,

gamma y mixto.

Tabla 3.3: Resultados de la categorización de los pronósticos de los modelos

lineal y gamma

Tabla 3.4: Sensibilidad del punto de corte 80 días en árbol de decisión

Tabla 3.5: Sintaxis SPSS del algoritmo de decisión

Tabla 4.1: Distribución de las frecuencias de los tramos de duración de los

procesos

Tabla 4.2: Distribución de las frecuencias de los diagnósticos de los procesos

Tabla 4.3: Distribución de la duración de los procesos según diagnóstico

Tabla 4.4: Distribución de la duración de los procesos según la cuenta

Tabla 4.5: Distribución de la duración de los diagnósticos según la cuenta

Tabla 4.6: Distribución de la duración de los diagnósticos según el tipo de pago

Tabla 4.7: Distribución de la duración de los diagnósticos según ocupación (I)

Tabla 4.8: Distribución de la duración de los diagnósticos según ocupación (II)

Tabla 4.9: Distribución de la duración de los procesos según el tramo de edad

Tabla 4.10: Distribución de la duración de los diagnósticos según el tramo de

edad

Tabla 4.11: Evolución de la frecuencia de los tramos de edad en el periodo

2008-2012

Tabla 4.12: Distribución de la duración de los procesos según el codiagnóstico

Tabla 4.13: Distribución de la duración de los procesos según la descendencia

Page 6: Modelo predictivo de duración de periodos de incapacidad ...

6

Tabla 4.14: Distribución de la duración de los diagnósticos según la

descendencia

Tabla 4.15: Distribución de la duración de los procesos según la provincia de

origen

Tabla 4.16: Distribución de la frecuencia de los tramos de duración según la

provincia de origen

Tabla 4.17: Distribución de la duración de los procesos según el tipo de

contrato

Tabla 4.18: Distribución de la duración de los diagnósticos según el tipo de

contrato

Tabla 4.19: Distribución de la duración de los procesos según la recaída

Tabla 4.20: Distribución de la duración de los procesos según el estado civil

Tabla 4.21: Distribución de la duración de los procesos según el sexo

Tabla 4.22: Distribución de la frecuencia de los tramos de duración según el

sexo

Tabla 4.23: Distribución del genero según el tramo de edad

Tabla 4.24: Distribución de la frecuencia de los diagnósticos según el sexo

Tabla 4.25: Distribución de la duración de los diagnósticos según el tipo de

Pago

Tabla 4.26: Distribución de la frecuencia de los diagnósticos según el tipo de

Pago

Tabla 4.27: Distribución de la duración de los diagnósticos según el hábito

tabáquico

Tabla 4.28: Distribución de la duración de los procesos en función del número

de episodio y del hábito tabáquico

Page 7: Modelo predictivo de duración de periodos de incapacidad ...

7

LISTA DE GRÁFICOS

Gráfico 1.1: Relación entre el gasto de IT del Sistema y el PIB en el periodo

2007-2012

Gráfico 1.2: Duraciones medias de los periodos de IT del INSS, ISM y

MUCOSS en el periodo 2007-2012

Gráfico 1.3: Tiempos que influyen en el coste de los procesos de IT

Gráfico 3.1: Distribución de las duraciones de los procesos según su frecuencia

Gráfico 3.2: Análisis de los residuos del modelo

Gráfico 3.3: Diagrama de dispersión de los residuos frente a los valores

ajustados

Gráfico 3.4: Diagrama de dispersión de los valores ajustados frente a los

valores del logaritmo

Gráfico 3.5: Histograma de los errores del pronóstico final

Gráfico 3.6: Diagrama de dispersión de los valores predichos frente a los reales

Gráfico 3.7: Distribución de los residuos brutos

Gráfico 3.8: Histograma de los valores pronosticados frente a los reales

Gráfico 3.9: Importancia normalizada de las variables del modelo

Gráfico 4.1: Duraciones medias de los diagnósticos según la ocupación

Gráfico 4.2: Duraciones medias de los diagnósticos según la presencia de

codiagnóstico

Gráfico 4.3: Distribución de los tramos de duración de los procesos según el

tipo de Pago

Page 8: Modelo predictivo de duración de periodos de incapacidad ...

8

LISTA DE ABREVIATURAS

CNO 04: Clasificación Nacional de Ocupaciones

IT: Incapacidad temporal

INSS: Instituto Nacional de la Seguridad Social

ISM: Instituto Social de la Marina

LGSS: Ley General de la Seguridad Social

MCP: Mínimos Cuadrados Ponderados

MUCOSS: Mutuas colaboradoras con la Seguridad Social

PIB: Producto Interior Bruto

Page 9: Modelo predictivo de duración de periodos de incapacidad ...

9

AGRADECIMIENTOS

A mi padre, Manolo, y mi madre, Ana, por haberme transmitido los valores

fundamentales de la vida y la importancia del esfuerzo y la dedicación para

conseguir metas y objetivos.

A mi mujer, Carmen, y mi hija, Aitana, por lo que son y lo que representan.

A mis directores de Tesis por su ayuda y colaboración incondicional.

A mi amigo Rafael por apoyarme en mis inquietudes investigadoras.

Page 10: Modelo predictivo de duración de periodos de incapacidad ...

10

1. INTRODUCCIÓN

El concepto Incapacidad/Discapacidad está presente en la evolución del

hombre a lo largo de su historia.

Desde la Prehistoria (edad de piedra y edad de los metales) en la que la forma

oral era la manera de pasar las tradiciones, enseñanzas y sucesos, tenemos

constancia a través de estudios antropológicos de la existencia de personas

discapacitadas y de instrumentos por ellas utilizadas.

En la “sima de los huesos” de Atapuerca se han encontrado restos de más de

30 individuos que vivieron hace 300.000 años1 . Uno de estos antepasados, el

Homo Hedilbergensis, presentaba un crecimiento anormal de sus huesos que

le afectaba al conducto auditivo y, a consecuencia de esta patología, se deduce

que la sordera era casi inevitable. Por tanto, puede que este individuo sea la

primera persona sorda conocida en la historia.

En restos encontrados en el valle del Neander , en el estado alemán de

Renania, se encontró en los años 50 del pasado siglo al primer Neanderthal,

especie del género Homo que habitó Europa y partes de Asia Occidental desde

hace 230 millones hasta hace 29 millones de años, durante lo que conocemos

como Paleolítico medio. En casi todos los restos óseos de neanderthales

adultos encontrados se observan señales de heridas o enfermedades, entre las

que destacan las articulares degenerativas.

Probablemente estas dolencias estaban provocadas por las duras condiciones

de vida que tenían que soportar.

1 Cermi. (Internet). Madrid: Grupo Editorial Cinca; 2008 (citado 28 agosto 2013).Disponible en:

http://www.cermi.es/esES/ColeccionesCermi/Cermi.es/Lists/Coleccion/Attachments/60/Laimagensocia ldelaspersonascondiscapacidad.pdf

Page 11: Modelo predictivo de duración de periodos de incapacidad ...

11

Puede que el Neanderthal más célebre de la historia con discapacidad fuera

descubierto en 1908 al Sur de la actual Francia, con una antigüedad de 35.000

a 45.000 años. Se trata de un individuo que vivió entre 50 y 55 años con

padecimiento de artritis que afectaba al cráneo, a la mandíbula, a la columna

vertebral, a la cadera y a los pies. También tenía fracturada una costilla y había

perdido la gran mayoría de sus dientes.

Teniendo en cuenta que la edad media de esta especie rondaba la treintena, es

fácil imaginar que este individuo dependiente necesitará de la ayuda de sus

congéneres para poder sobrevivir en las condiciones de la época. Es posible

que aportara algo a la comunidad desarrollando tareas compatibles con sus

limitaciones, es decir, estaríamos hablando de una capacidad parcial, germen

de las diferentes situaciones de Incapacidad vigentes hoy en día.

Existen diferentes estudios que evidencian que, a pesar de los estereotipos

populares sobre la evolución de las especies, en la prehistoria la vida incluía la

capacidad y voluntad de ayudar a los enfermos crónicos y discapacitados. No

podemos afirmar que esta manera de actuar fuera la habitual, ya que en la

mayoría de las épocas, las enfermedades, los trastornos mentales o cualquier

incapacidad y/o deficiencia eran consideradas como un mal, un tabú o un

castigo de Dios.

En Egipto a las personas con malformaciones se les consideraban especiales y

se encontraban al servicio de los faraones2.

Los hebreos dieron un tratamiento diferente a las personas con limitaciones

pudiendo participar en los asuntos religiosos. El Judaísmo precursor del

cristianismo al elevar la dignidad de la persona humana, hizo que se convirtiera

en deber la atención a las personas con discapacidad.

En Persia y Mesopotamia la discapacidad era considerada como un castigo de

dioses aunque también había posiciones más humanas como las de

Zaratustra, profeta iraní creador del zoroastrismo3.

2 Inzua Canales, Víctor. Una conciencia histórica y la discapacidad. Revista trabajo social Nueva Época.2001; 3: 77

Page 12: Modelo predictivo de duración de periodos de incapacidad ...

12

En las culturas mesoamericanas4 (Olmecas, Mayas y Aztecas) las personas

discapacitadas eran consideradas divinidades. Esta situación cambiaría

posteriormente a partir del siglo XVI seguramente como consecuencia de la

conquista española. Cabe mencionar como ejemplo el caso de una mujer de

Oxaca que solicita le otorguen una Licencia de Ayuntamiento de la Ciudad de

México para poder exhibir a su hijo discapacitado (enano) con la finalidad de

poder ayudar a su esposo que estaba enfermo en su lecho.

En la Grecia antigua, en su culto a la belleza y a la perfección física, a los

discapacitados los expulsaban de las ciudades o los exterminaban. En Esparta

en el siglo IX antes a.C. las leyes de Licurgo dictaminaban que los recién

nacidos débiles o deformes fueran arrojados desde los alto del monte Taigeto.

Esto cambió tras la reforma de Pericles (499-429 dc) donde se comienza a

atender en centros asistenciales.

En Roma se encontraban actitudes contrapuestas desde infanticidios a

comercio con personas con discapacidad para diversión hasta el

establecimiento de medidas para cuidar a personas con discapacidad y la

creación de hospitales5

En la edad media y posteriormente en el cristianismo, las personas deformes o

discapacitadas seguían siendo objeto de burla y segregación, pero poco a poco

fue cambiando la consideración de estas personas debido en parte al cambio

ideológico más humanista y moral.

En La Cofradía de los Hermanos de la Costa6, que era una asociación de

bucaneros del siglo XVII con centro de operaciones fijado en La Tortuga,

pequeña isla al noroeste de La Española, actual Haití, tenían contemplado la

5 Aguado Díaz, Antonio León. Historia de las Deficiencias. Colección Tesis y Praxis. Madrid.

Escuela Libre Editorial, Fundación ONCE. 1993

6Isladelcofre (internet). 2013 (citado21 de agosto 2013). Disponible en: http://www.isladelcofre com/01normas.htm

Page 13: Modelo predictivo de duración de periodos de incapacidad ...

13

indemnización a los lisiados en las batallas y abordajes. Llama la atención que

incluso hacían distinciones en cuanto a la indemnización dependiendo se

tratase de la amputación del brazo derecho (600 pesos o seis esclavos) o del

izquierdo (500 pesos o cinco esclavos). No cabe duda que es la antesala de las

actuales prestaciones por incapacidad temporal o permanente.

Posteriormente en la edad moderna es más patente el cambio y el tratamiento

hacia los discapacitados y enfermos, pasando a reconocer la responsabilidad

de la sociedad hacia este colectivo.

La evolución histórica de la discapacidad como hemos visto tiene varios

enfoques. En primer lugar, podemos hablar de un enfoque mágico-religioso de

las culturas antiguas con actitud social mayoritariamente de rechazo e incluso

muerte. Sigue con un enfoque técnico y secularizado, entendiendo la

discapacidad como resultado de fenómenos naturales que requieren terapia

adecuada al igual que otras enfermedades, caracterizándose socialmente por

la reclusión y cuidados para los necesitados.

Posteriormente a finales del Siglo XIX y segunda guerra mundial es claro el

enfoque médico y asistencial con creación de centros especiales de educación

y atención que inevitablemente llevarían a estigmas de discriminación social y

laboral.

Por último desde la segunda mitad del siglo XX la prevención y rehabilitación

son claves para conseguir la reinserción comunitaria de los discapacitados.

El termino discapacidad según la OMS es un término que abarca las

deficiencias, las limitaciones de la actividad y las restricciones de la

participación. Las deficiencias son problemas que afectan a una estructura o

función corporal; las limitaciones de la actividad son dificultades para ejecutar

acciones o tareas, y las restricciones de la participación son problemas para

participar en situaciones vitales

Por consiguiente, la discapacidad es un fenómeno complejo que refleja una

interacción entre las características del organismo humano y las características

de la sociedad y del medioambiente en el que vive.

Page 14: Modelo predictivo de duración de periodos de incapacidad ...

14

Esto lleva a que la discapacidad es el resultado de la condición de la salud de

cada individuo más sus factores personales y ambientales, es decir, la

interacción entre las limitaciones humanas y el medio en el que se encuentre.

Este medio se trata del medio social, que a su vez se segrega en otros estratos

como el laboral, personal, etc.

1.1. Incapacidad Temporal

Hasta ahora hemos hablado de manera genérica del término discapacidad. El

tema que nos trata, la Incapacidad Laboral (temporal), sigue los mismo

patrones en cuanto su génesis y lleva asociado la interacción de los mismos

factores.

La discapacidad como tal lleva implícito un carácter permanente, el individuo no

vuelve a recuperar las funciones perdidas salvo avance médico importante. En

la incapacidad temporal (IT), el individuo va a presentar una serie de

limitaciones funcionales, bien sean físicas o psíquicas, que le van a impedir

temporalmente el desarrollo de sus actividades laborales habituales y/o

actividades de la vida diaria.

Las limitaciones que va a condicionar una situación de incapacidad o

discapacidad son fruto de la pérdida de salud que sufra el individuo. El término

enfermedad opera más como un hecho científico. Para entender mejor el

concepto de IT, sería más correcto utilizar el término de dolencia, que desde un

punto de vista antropológico sería la condición de falta de salud de un individuo

o población.

Esta condición de falta o ausencia de salud no necesariamente implica el

desarrollo de una enfermedad.

No podemos olvidar la influencia de la diversidad cultural en la percepción de la

salud y subsidiariamente de la enfermedad.

La falta o ausencia de salud determina las limitaciones que tendrá el individuo

para desarrollar sus actividades. Estas las podemos dividir en dos grandes

bloques, personales y laborales.

Page 15: Modelo predictivo de duración de periodos de incapacidad ...

15

Dentro de las personales incluimos todas aquellas actividades o tareas que

pertenecen a la parcela personal y social, así como su interacción. El bloque

laboral sin embargo atañe exclusivamente a la actividad o desempeños que

realiza el individuo en su trabajo.

El concepto de Incapacidad temporal en relación con el trabajo redimensiona el

concepto inicial, haciendo que aparezcan connotaciones económicas y de otras

índoles en su tratamiento.

En España desde la Ley de la seguridad Social, de 21 de abril de 1966 y el RD

3158/1966 de 23 de diciembre, por el que se aprueba el Reglamento General

que determina la cuantía de las prestaciones económicas del Régimen General

Seguridad Social y las condiciones para el derecho a las mimas, los cambios

normativos en la regulación de la IT han sido numerosos.

El Capítulo IV del Real Decreto Legislativo 1/1994, de 20 de junio, por el que se

aprueba el Texto Refundido de la Ley General de la Seguridad Social define el

concepto de IT como aquella situación en la que se encuentra el trabajador

que, por causa de enfermedad común o accidente no laboral, esté impedido

para el trabajo y necesite la asistencia sanitaria de la Seguridad Social.

La IT estaría definida por la situación de enfermedad, la necesidad de

tratamiento por los Servicios públicos de Salud y la incapacidad para

desarrollar su actividad laboral habitual.

Cuando la IT tiene origen exclusivamente laboral, es decir, producida por

accidentes laborales o enfermedades profesionales hablamos de IT por

Contingencia Profesional. De mismo modo cuando la IT es debida a

enfermedad común o accidente no laboral hablamos de IT por Contingencia

Común.

La declaración de la situación de IT se realiza a través del parte médico de baja

laboral expedido por el médico del Servicio público de salud o de la Mutua

colaboradora con la seguridad Social (Mutua de Accidente de trabajo y

Enfermedad Profesional de la Seguridad Social antes de la Ley 35/2014). La

emisión de dicho parte lleva asociado el reconocimiento del derecho a la

prestación por IT.

Page 16: Modelo predictivo de duración de periodos de incapacidad ...

16

• Hay que cumplir unos requisitos mínimos para poder percibir dicha

prestación (art. 130 LGSS):

• Recibir asistencia sanitaria

• Estar afiliado de la Seguridad Social y estar en situación de alta o

asimilada

• Tener cubierto un periodo mínimo de cotización que será de 180 días en

los cinco años antes del hecho causante en el caso de la contingencia

común. En el caso de contingencia profesional no es necesario dicho

periodo.

El elemento clave para la percepción de dicha prestación es la incapacidad

para el desarrollo de la actividad laboral constituyendo la valoración de dicha

incapacidad el principal elemento de control, es decir, para que un persona

tenga derecho a la prestación por IT es necesario que exista un menoscabo

funcional para desarrollar su actividad laboral. Pongamos un ejemplo: Un

teleoperador que sufra un esguince leve de tobillo tendría una patología pero

podría desarrollar su actividad laboral por lo que no le correspondería recibir la

prestación de IT.

La prestación que reciben los trabajadores cuando están en un periodo de IT

varía en función se trate de una u otra contingencia.

En el caso de la contingencia profesional el trabajador percibe el 75% de su

base reguladora7 desde el día 1º del nacimiento del derecho. En el caso de la

contingencia común el trabajador percibe el 60% de la base reguladora8 desde

el 4º al 20º día y el 75% del día 21º en adelante. En la contingencia común la

mutua asume el pago de la prestación a partir del decimoquinto día en el caso

del Régimen General de trabajadores y a partir del tercer día en el caso de los

trabajadores del Régimen General de Trabajadores Autónomos.

7 Se calcula dividiendo la base de cotización del mes anterior entre el número de días que corresponde a dicha cotización. A esto se le sumaría la cotización por horas extraordinarias en el año anterior dividido entre 365 días.

8 Se calcula dividiendo la base de cotización del mes anterior entre 30 días si tiene salario mensual o 28, 29 y 31 si tiene salario diario.

Page 17: Modelo predictivo de duración de periodos de incapacidad ...

17

Hablar de IT es hablar de un problema con dimensiones sanitarias, sociales y

económicas. El gasto de IT del Sistema (INSS, ISM, MUCOSS) en España9 y la

evolución del Producto Interior Bruto10 (PIB) se ha comportado en el periodo

estudiado como figura en el gráfico 1.1:

Gráfico 1.1. Relación entre el gasto de IT del Sistema y el PIB en el periodo

2007-2012

Se observa un descenso en ambos ítems motivado principalmente por la

situación de crisis económica, a pesar de esto es importante resaltar que el

porcentaje promedio que representa el gasto por IT en relación al PIB se sitúa

en el 0,65%, hecho que hace relevante el disponer de medios y poner en

marcha mecanismos para disminuir dicho coste.

9 Seg-social: Anexo al informe económico financiero. Presupuestos ejercicio 2012 (internet). Madrid: Seguridad Social; 2012 (citado el 24 de julio 2013 ). Disponible en: http://www.seg-social.es/prdi00/groups/public/documents/binario/169364.pdf

10 Datosmacro (internet). Madrid. Abril 2015 (citado el 5 de mayo de 2015). Disponible en: http://www.datosmacro.com/pib/espana

Page 18: Modelo predictivo de duración de periodos de incapacidad ...

18

La principal línea de ataque para conseguir disminuir el gasto de IT es la

duración media de los procesos de IT. Si atendemos a la contingencia común

hay una tendencia ascendente en la duración media de los procesos de IT en

el Sistema (INSS, MUCOSS e ISM) de 2007 a 2012, según datos del Ministerio

del Ministerio de Empleo y Seguridad Social11.

Al desagregar las duraciones medias de los procesos del sistema según se

trate de procesos del INSS, ISM o procesos de las MUCOSS, tenemos que hay

diferencias bastantes significativas entre las duraciones (gráfico 1.2):

Gráfico 1.2. Duraciones medias de los periodos de IT del INSS, ISM y

MUCOSS en el periodo 2007-2012

11 Seg-social (internet). Madrid: Seguridad Social; 2015 (citado el 24 de julio 2013). Disponible en http://www.segsocial.es/Internet_1/Estadistica/Est/Otras_PrestacionesdelaSeguridadSocial/ Incapacidad_Temporal/index.htm

Page 19: Modelo predictivo de duración de periodos de incapacidad ...

19

Sin embargo la incidencia de procesos de IT se comporta de manera

descendente en las series estudiadas, mediado en parte por la crisis

económica y la disminución de trabajadores afiliados a la seguridad social.

La duración de un proceso de IT responde a una serie de tiempos que influyen

directamente sobre el coste de cada uno (Gráfico1.3):

Gráfico 1.3. Tiempos que influyen en el coste de los procesos de IT

Los tiempos de gestión administrativa y tiempos de gestión engloban todos los

tiempos intermedios de aquellas tareas no médicas, es decir, emisión de partes

de IT, reconocimiento del derecho a la prestación, citaciones, toma de

decisiones, etc.

Los tiempos de espera asistencial derivan de las listas de espera que haya en

cada comunidad. Por último los tiempos biológicos atañen exclusivamente a la

duración de cada patología y que se verá modificada por las diferentes

variables que influyen en la curación o factores de corrección como veremos

más adelante.

Page 20: Modelo predictivo de duración de periodos de incapacidad ...

20

La gestión de la IT en España tiene varios actores, por un lado tenemos al

INSS o ISM, por otro lado tenemos a los servicios Médicos de la Inspección

Sanitaria y por último a las MUCOSS.

Actualmente en la gestión de los procesos de IT se inician actuaciones una vez

se ha producido la baja laboral. Existen patrones de incidencia de

determinadas enfermedades en las distintas épocas del año según el

comportamiento observado en serie temporales, como por ejemplo el aumento

de la incidencia de la patología respiratoria de octubre a febrero. Esto permite

plantear medidas generales en relación a la gestión de cada patrón.

Con un modelo predictivo de duración de procesos en IT se podría estimar la

duración de cada proceso a partir de algunas de las posibles variables o

factores que intervienen.

Este tipo de información es de gran ayuda para todos los organismos que

intervengan en la gestión de la IT.

Page 21: Modelo predictivo de duración de periodos de incapacidad ...

21

2. OBJETIVOS

• Recoger y sistematizar los registros de procesos de incapacidad temporal

del periodo 2008-2012 en España de una Mutua Colaboradora con la

Seguridad Social.

• Conocer el comportamiento de dichos procesos en relación con las

variables de estudio.

• Comparar métodos estadísticos en relación a la predicción de duración la

de incapacidad temporal en la enfermedad común

• Establecer un modelo idóneo de predicción para la duración de procesos de

incapacidad temporal en la enfermedad común.

Page 22: Modelo predictivo de duración de periodos de incapacidad ...

22

3. MATERIAL Y MÉTODOS

Para el desarrollo de esta tesis se ha utilizado el paquete estadístico SPSS

v19.0, el programa R v3.1, el programa Microsoft Excel 2010, el programa

Microsoft Access 2010 y el editor de texto Microsoft Word 2010.

3.1. Consideraciones previas sobre los datos

La base de datos sobre la que se desarrolla el estudio fue proporcionada por

Ibermutuamur, Mutua de Accidentes de Trabajo y Enfermedades Profesionales

de la seguridad social nº 274. En Anexo I se adjunta la el documento de

autorización para el análisis de los datos.

Se trata de una base anónima con procesos de 1.085.824 pacientes que

hubieran sido alta médica tras un episodio de IT por contingencia común

durante el periodo comprendido del 01/01/2008 al 31/12/2012.

La base inicial constaba de 39 variables de cada uno de los procesos lo que

lleva a un total de 42.347.136 entradas.

Las variables iniciales fueron:

1. Fecha de baja: Indica la fecha en la que el trabajador es baja médica por

IT.

2. Fecha de alta: Indica la fecha en la que el trabajador es alta médica por

IT.

3. Días en baja: Indica número de días en los que el trabajador ha estado

en situación de baja médica. Variable cuantitativa discreta.

4. Sexo: Indica el sexo del trabajador. Variable cualitativa nominal.

5. Edad: Indica la edad en años del trabajador. Variable cuantitativa

discreta.

Page 23: Modelo predictivo de duración de periodos de incapacidad ...

23

6. Ocupación: Indica la ocupación del trabajador según la Clasificación

Nacional de Ocupaciones del 2004 (C.N.O 04). Variable cualitativa

nominal.

7. Recaída: Indica si el trabajador ha tenido recaída de un episodio previo.

Variable cualitativa nominal.

8. Número de episodio: Indica el número de procesos que ha tenido en

baja en el periodo estudiado. Variable cuantitativa discreta.

9. Tipo de contrato: Indica el tipo de contrato del trabajador según sea

indefinido o de duración determinada, a tiempo completo o parcial.

Variable cualitativa nominal.

10. Provincia: Indica la provincia de residencia del trabajador. Variable

cualitativa nominal.

11. Municipio: Indica el municipio de residencia del trabajador. Variable

cualitativa nominal.

12. Diagnóstico: Indica el diagnóstico principal según la CIE 9 MC que

motiva la baja médica. Variable cualitativa nominal.

13. Codiagnóstico 1-4: Indica los codiagnósticos que tenga cada trabajador.

Variable cualitativa nominal.

14. Base reguladora: Indica la base de cotización diaria de cada trabajador.

Variable cuantitativa continua.

15. Tiempo Baja-Recepción: Indica el tiempo transcurrido entre la fecha de

emisión del parte de baja médica hasta la fecha de recepción de dicho

parte en la Muta. Variable cuantitativa discreta.

16. Tiempo Recepción-Grabación: Indica el tiempo transcurrido entre la

fecha de recepción del parte de baja médica en la mutua hasta la fecha

de grabación de dicho parte. Variable cuantitativa discreta.

17. Cuenta: Indica si el trabajador está afiliado al régimen General de la

Seguridad Social (cuenta ajena) o al Régimen especial de Trabajadores

autónomos (cuenta propia). Variable cualitativa nominal.

18. Pago: Variable cualitativa nominal.

19. Estado Civil: Indica el estado civil de cada trabajador. Variable cualitativa

nominal.

20. Número de hijos: indica el número de hijos de cada trabajador. Variable

cuantitativa discreta.

Page 24: Modelo predictivo de duración de periodos de incapacidad ...

24

21. Fumador: Indica el hábito tabáquico de cada trabajador. Variable

cualitativa nominal.

22. Bebedor: Indica el hábito alcohólico de cada trabajador. Variable

cualitativa nominal.

23. Antecedentes: Se segrega en 16 variable dicotómicas que son:

Hipertensión, dislipemia, diabetes tipo I, diabetes tipo II, cardiopatía

isquémica, sobrepeso, neoplasia de colon, neoplasia de mama, linfoma,

leucemia, trastorno de ansiedad, enfermedad pulmonar obstructiva

crónica, artrosis, fibromialgia y artritis reumatoide. Variables cualitativas

nominales.

Posteriormente se realizó una recodificación de las variables quedando las

anteriores más:

1. Quintil episodio: Indica el quintil del número de episodio del cada

proceso.

2. LN días baja: Indica el logaritmo neperiano de la duración de cada

proceso.

3. Quintil edad: Indica el quintil de la edad de cada trabajador.

4. Antecedentes: Indica si el trabajador tiene o no antecedentes. Variable

cualitativa nominal.

5. Hijos: Indica si el trabajador tiene o no hijos. Variable cualitativa nominal

6. Quintil base reguladora: Indica el quintil de la base reguladora de cada

proceso.

7. Contrato 1: Indica si el trabajador tiene contrato a tiempo completo o a

tiempo parcial.

8. Contrato 2: Indica si el trabajador tiene contrato indefinido o de duración

determinada.

9. Codiagnóstico: Indica si el proceso tiene o no tiene codiagnóstico.

Variable cualitativa nominal.

10. Numero codiagnóstico: Indica el número de codiagnósticos de cada

proceso. Variable cuantitativa discreta.

11. Codiagnóstico 1: Indica que codiagnóstico tiene cada proceso. Variable

cualitativa nominal.

Page 25: Modelo predictivo de duración de periodos de incapacidad ...

25

12. Comunidad: Indica la comunidad autónoma de residencia de cada

trabajador. Variable cualitativa nominal.

Finalmente las variables que se tuvieron en cuenta después de la exploración

inicial de datos fueron el diagnóstico, el tipo de cuenta, el tipo de pago, la

ocupación, el tramo de edad de los registros, la existencia o no de

codiagnóstico, el hecho de tener hijos o no, la provincia de origen, el tipo de

contrato, la existencia de recaída previa, el estado civil, el sexo, el número de

episodios previos de IT y el hábito tabáquico.

Desde el punto de vista de método se encontraron algunas limitaciones como:

• Elevado número de diagnósticos de la CIE-9 Mc que implica mucha

variabilidad previa en la codificación y hace imposible incluir todas las

entradas en el modelo.

• Identificación de error en codificación por subregistro. Esto obligó a

eliminar aquellos registros con incongruencia entre duración y

diagnóstico.

• Elevada cantidad de valores perdidos en registro de algunas variables

de procesos que hacían imposible obtener resultados y conclusiones

fiables.

Como criterios de exclusión de casos se definieron los siguientes:

• Diagnósticos con menos de 2500 casos.

• Casos con duración superior a 365 días

• Subregistros por error en codificación.

• Casos en los que lo aparecía diagnóstico codificado.

Posteriormente la base se inicial se redujo a los casos pertenecientes a 47

diagnósticos que se distribuyeron en 29 epígrafes obteniendo finalmente una

base de 370.076 casos. La codificación diagnóstica utilizada es la CIE-9MC, en

Anexo II se muestra la distribución de los 46 diagnósticos en los 29 epígrafes

finales.

Page 26: Modelo predictivo de duración de periodos de incapacidad ...

26

Desde el punto de vista estadístico se plantearon dos problemas

fundamentales: determinar las fuentes de variabilidad de las que depende la

duración de la baja y proponer un modelo predictivo en consonancia para

pronosticar dicha duración. No obstante, una vez escogido el modelo predictivo

se reconsideró la importancia de las variables seleccionadas en primera

instancia.

Se partió con las ventajas que se derivan de la gran cantidad de información

disponible, tanto en lo relativo al tamaño muestral como al número de variables

explicativas. No obstante y como reverso de la moneda, la gran cantidad de

información conlleva ciertas dificultades de análisis que no se presentan en

estudios más someros.

En primer lugar, el gran tamaño muestral se traduce en resultados significativos

para la gran mayoría de los contrastes de hipótesis que podamos plantearnos,

de ahí que no pudimos contar con una herramienta tan tradicional en la

estadística como es el test de hipótesis a la hora de tomar decisiones. No

obstante, en las últimas décadas, propiciado por el uso del software estadístico

y la necesidad de analizar grandes archivos de datos, se han popularizados un

conjunto de técnicas no paramétricas (es decir, que no suponen modelo alguno

de distribución de los datos, sino que buscan un ajuste a toda costa de las

observaciones, aunque ello implique perder la explicación o interpretación

global del modelo que trasmiten los parámetros), que reciben la denominación

genérica de Minería de Datos y que, a la postre, han tenido en nuestro estudio

un protagonismo superior al de las técnicas paramétricas clásicas.

En segundo lugar, el manejo de una gran cantidad de variables explicativas

puede considerarse un reto desde el punto de vista estadístico que, cuando

todas ellas son de tipo cualitativo, como es nuestro caso, se convierte en un

serio problema, dado que nos impidió abordar nuestro estudio mediante el uso

de algoritmos automáticos de selección de variables que están ideados en

principio para variables numéricas.

Con la intención de no caer en la trampa de convertir nuestro estudio en un

rastreo incierto de modelos predictivos más o menos novedosos, optamos por

fijar como punto de partida el análisis de los datos a través del Modelo Lineal

Page 27: Modelo predictivo de duración de periodos de incapacidad ...

27

Normal, que constituye el núcleo de la Estadística Paramétrica. Obramos así

con el doble objeto de obtener una idea preliminar (aunque a la postre resultará

muy certera) de la capacidad predictiva de nuestras variables, y de fijar las

fuentes de variabilidad que debemos contemplar en modelos alternativos, dado

que un modelo completo que contemplara todas las posibles interacciones

entre las diferentes variables predictivas sería inviable debido a la enorme

cantidad de parámetros del mismo. A continuación, una vez centrados en dicha

fuentes de variabilidad, procedimos a comparar la validez de todos aquellos

modelos predictivos que juzgamos a priori razonables para nuestros datos,

obteniendo como resultado de la comparativa un modelo de predicción

definitivo. Posteriormente, la importancia de las variables seleccionadas en

primera instancia se volvió a someter a valoración.

3.2. Variables a considerar y modelo predictivo

Una vez definidas las variables dividimos el método estadístico en tres pasos:

3.2.1. Modelo Lineal y selección de las fuentes de variabilidad a

contemplar en lo sucesivo (paso nº1)

Así pues, nuestro primer objetivo era entender qué variables explicativas son

realmente importantes en el pronóstico del tiempo de baja y cómo cuantificar, al

menos en primera instancia, la capacidad predictiva de dichas variables.

El modelo lineal a contemplar en esta fase del estudio debía poseer un número

de parámetros manejable en la práctica. En definitiva, nos enfrentamos a un

laborioso trabajo de ensayo con diferentes combinaciones de factores e

interacciones, buscando el modelo más sencillo posible entre todos aquellos

que proporcionen un buen ajuste a las observaciones.

Page 28: Modelo predictivo de duración de periodos de incapacidad ...

28

Los diferentes métodos estadísticos deben proporcionar parámetros que

informen del ajuste del modelo a los datos reales, como pueden ser el

coeficiente de correlación lineal múltiple R2 de Pearson, el coeficiente R2

corregido, la devianza, el logaritmo de la verosimilitud, el Criterio de

Información Bayesiano (BIC), el Criterio de Información de Akaike (AIC), o los

pseudocoeficientes R2 de Nagalkerkel y de Cox-Snell, si bien el parámetro que

goza de una interpretación más diáfana desde un punto de vista formal es el

primero de los mencionados: el coeficiente R2 que proporciona el modelo lineal.

No obstante y por lo dicho anteriormente, en nuestro caso deberíamos

empezar prestando atención a algún parámetro que penalice la inclusión de

variables predictoras no esenciales, como por ejemplo el R2 corregido o en el

BIC.

Por ello, el objetivo en esta fase del estudio fue ajustar nuestros datos con un

modelo lineal haciendo uso de diferentes combinaciones de factores e

interacciones, con el objeto de encontrar un alto valor de R2 con el menor grado

de libertad posible o mejor, y para establecer un criterio más objetivo,

maximizar el BIC. No pretendíamos obtener así un modelo definitivo sino

seleccionar los factores e interacciones fundamentales con los que trabajar

tanto en el modelo lineal como en otros posteriores, como el modelo de

regresión gamma, el logístico o el árbol de decisión (modelos de regresión de

Cox12 como en el caso de Barceló13 no han sido contemplados, dado que

estamos interesados en la predicción de la duración del proceso de IT).

Un simple vistazo a la variable respuesta (gráfico nº 3.1), el tiempo en días que

dura la baja, con un pronunciado sesgo positivo, reveló la incapacidad de

ajuste de un modelo lineal normal.

12 Van Belle G., Fisher L.D., Heagerty P.J., Lumley T. Bioestadistics. A methodology for the Health Sciences. 2ª ed. Wiley ;2004

13 Barceló M.A. Modelos Marginales y Condicionales en el Análisis de Supervivencia Multivariante. Gac. Sanit. 2002;16 (2):59-68

Page 29: Modelo predictivo de duración de periodos de incapacidad ...

29

Gráfico 3.1. Distribución de las duraciones de los procesos según su frecuencia

Efectivamente, cuando se trabaja con variables que expresan tiempos de

espera puede parecer en principio más ortodoxo contemplar modelos

probabilísticos tipo exponencial o, más en general, Gamma14 . No obstante y

por las razones indicadas anteriormente, optamos por una solución muy común

(que a la postre resultará prácticamente equivalente), consistente en ajustar

mediante un modelo lineal normal el logaritmo del tiempo de baja. Pudimos

apreciar que, tras aplicar el logaritmo, el sesgo positivo se reduce

considerablemente, como cabría esperar, aunque persistía una cola de valores

extremos a la derecha. Estamos hablando de un colectivo de individuos cuyos

tiempos de baja eran extremos. Ese colectivo podría entenderse como una

subpoblación que se identificaría fácilmente mediante un análisis clúster 15 .

Pero dicho análisis no deja de ser una partición ad hoc de la muestra estudiada

14 Benavides F.G. et al. Reincorporación al trabajo después de un episodio de Incapacidad Temporal por contingencia común: Papel de la edad, el sexo, la actividad económica y la comunidad autónoma. Rev. Esp. Salud Pública. 2007;81(2):183-190

15 Everitt B., Horton T., An Introduction to Applied Multivariante Analysis with R. Londres: Springer Science+Business Media; 2011.

Page 30: Modelo predictivo de duración de periodos de incapacidad ...

30

que, en nuestro caso, no correlaciona claramente con ninguna de las variables

explicativas consideradas. Éste es, en esencia, el verdadero problema con el

que nos topamos en nuestro estudio, como detallaremos más adelante.

A pesar de todo, el modelo lineal aplicado al logaritmo logró un ajuste bastante

aceptable en nuestra opinión, tal y como se muestra en el Anova de la tabla nº

3.1.

Tabla 3.1. Prueba Anova de los efectos de las variables

Hemos de especificar que éste fue el modelo, de entre todos los considerados

en una fase inicial de ensayo, que aportó un máximo valor del Criterio de

Información Bayesiano (BIC=1072221) y del R2 corregido. Inicialmente, obtuvo

un coeficiente de correlación lineal múltiple R2=0.600, es decir, que se explica

el 60% de la varianza total del logaritmo de los días de baja si conocemos los

valores de las variables predictivas. Para valorar este parámetro en su justa

medida hemos de tener en cuenta que la varianza viene a ser una media de los

Pruebas de los efectos inter-sujetos b

Variable dependiente:Lndiasbaj

Origen

Suma de

cuadrados tipo

III gl

Media

cuadrática F Sig.

Eta al cuadrado

parcial

Modelo corregido 170104,533a 124 1371,811 2876,552 ,000 ,638

Intersección 23130,433 1 23130,433 48502,245 ,000 ,193

RDGT 16496,023 28 589,144 1235,376 ,000 ,146

CUENTA 831,375 1 831,375 1743,312 ,000 ,009

PAGO 6558,222 1 6558,222 13751,947 ,000 ,064

OCUPACION 105,375 10 10,537 22,096 ,000 ,001

TRAMEDAD 783,383 4 195,846 410,669 ,000 ,008

CODGTdico 1009,214 1 1009,214 2116,223 ,000 ,010

HIJOSDICO 180,592 1 180,592 378,683 ,000 ,002

Rprov 2105,407 3 701,802 1471,611 ,000 ,021

CONTRAT1 78,077 1 78,077 163,720 ,000 ,001

RECAIDA 451,256 1 451,256 946,239 ,000 ,005

RDGT * SEX 787,255 29 27,147 56,924 ,000 ,008

RDGT * PAGO 1943,491 28 69,410 145,547 ,000 ,020

TRAMEPI * FUMADICO 184,262 11 16,751 35,125 ,000 ,002

ECIVIL 693,908 5 138,782 291,012 ,000 ,007

Error 96552,926 202462 ,477

Total 1006380,690 202587

Total corregida 266657,459 202586

a. R cuadrado = ,638 (R cuadrado corregida = ,638)

b. Regresión de mínimos cuadrados ponderados - Ponderada por Ponderación para Lndiasbaj de WLS, MOD_4

PAGONUM** -1,000

Page 31: Modelo predictivo de duración de periodos de incapacidad ...

31

errores cuadráticos respecto a la estimación, es decir, que penaliza los grandes

errores. Además, se apreció que los individuos que tenían pago delegado

presentaban claramente mayor dispersión, lo cual fue compensado mediante la

técnica de Mínimos Cuadrados Ponderados16 (MCP), es decir, ponderando

inversamente en el modelo según la varianza obtenida en las distintas

categorías de dicha variable, con lo cual el valor de R2 se incrementó a 0.638

(aunque, al tratarse de un Modelo Lineal con MCP, ya no puede interpretarse

como antes de manera literal). El modelo resultante consta de un total de 124

parámetros. Su aptitud viene dada por el alto valor de R2 y porque el hecho de

incluir nuevos factores o interacciones en el modelo no lograría incrementarlo.

Indicar una medida clara de la fiabilidad global del modelo inicial de referencia

(R2=0.638) supone una ventaja frente a otros estudios en los que se proponen

técnicas, en principio interesantes, pero no se aportan medidas sobre la

capacidad predictiva de las mismas. Un valor R2=0.638 mediante un

procedimiento lineal clásico nos informa de una importante capacidad de

predicción en general, aunque también revela ya de entrada una clara

deficiencia a la hora de efectuar una pronóstico exacto. Esta deficiencia podría

ser solventada en principio mediantes métodos de predicción alternativos,

como describiremos en el 2º paso, aunque adelantamos aquí que no fue el

caso.

Valorar el ajuste del modelo únicamente en función de R2 sería incorrecto y nos

vimos obligados a complementarlo con un análisis de los residuos. En el gráfico

3.2 podemos apreciar los residuos brutos y en el gráfico 3.3 los residuos frente

a los valores ajustados.

16 Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regression Analysis. 2ª Ed. New York: Springer; 1998

Page 32: Modelo predictivo de duración de periodos de incapacidad ...

32

Gráfico 3.2. Análisis de los residuos del modelo

Gráfico 3.3. Diagrama de dispersión de los residuos frente a los valores

ajustados

Page 33: Modelo predictivo de duración de periodos de incapacidad ...

33

Por último, en el gráfico 3.4 podemos ver los valores ajustados frente a los

valores reales del logaritmo del tiempo de baja.

Gráfico 3.4. Diagrama de dispersión de los valores ajustados frente a los

valores del logaritmo

A grandes rasgos se aprecia un comportamiento bastante satisfactorio. Un

análisis más detallado del gráfico 3.3 puede revelar la presencia de valores

altos de la respuesta no explicados por las variables del modelo. Pero hemos

de recalcar que consideramos aceptable el ajuste logrado por el modelo lineal

normal con MCP para el logaritmo del tiempo.

La propia tabla del Anova (tabla 3.1) nos muestra en su última columna las

estimaciones de los tamaños de los efectos. Estos parámetros, que en rigor

debemos entenderlos como sucedáneos de los coeficientes de correlación

Page 34: Modelo predictivo de duración de periodos de incapacidad ...

34

parcial propios del análisis de regresión lineal, nos dieron una idea orientativa

del peso de las diferentes fuentes de variabilidad en la variable respuesta.

Cabe destacar en ese sentido, como cabía esperar, la gran influencia del

diagnóstico. También pudimos resaltar una gran importancia del tipo de pago.

3.2.2. Estudio comparativo de los diferentes modelos de

predicción (paso nº2)

Tras determinar las fuentes de variabilidad que se contemplaron en lo sucesivo

pasamos a aplicar diferentes modelos a priori razonables con la idea de

seleccionar el que proporcionase predicciones más fiables. Para evitar el efecto

de sobreajuste propio de cualquier modelo estadístico, en especial los de tipo

no paramétrico, optamos por dividir la muestra en dos partes: un 70% de los

datos (entrenamiento) los utilizamos para elaborar los algoritmos de los

diferentes modelos, que fueron aplicados al 30% restante (validación) para

probar la fiabilidad de las predicciones.

3.2.2.1. Modelo Lineal

El primer modelo a evaluar en la muestra de validación es el lineal17 . En el

apartado anterior aplicamos un modelo lineal con ponderación al logaritmo del

tiempo de baja. Ello implica aplicar dos transformaciones a la variable

respuesta que debemos deshacer si pretendemos efectuar una predicción del

tiempo de baja. En el gráfico 3.5 presentamos un histograma con los errores de

pronóstico final. En la tabla 3.2 se muestra una descriptiva de los mismos.

17 Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regression Analysis. 2ª Ed. New York: Springer; 1998

Page 35: Modelo predictivo de duración de periodos de incapacidad ...

35

Gráfico 3.5. Histograma de los errores del pronóstico final

En el gráfico 3.6 podemos apreciar una diagrama de dispersión de los valores

predichos frente a los reales, asociado a un coeficiente de correlación de

Pearson r=0.587, aunque esta medida no puede interpretarse adecuadamente

cuando la relación entre las variables no es lineal, como ocurre en nuestro

caso. Se observaron claros desajustes en los individuos con tiempos de baja

muy elevados, que provocaron a su vez desajustes en los individuos con

menores tiempos de baja. Como cabría esperar, la relación entre los rangos

descrita por el coeficiente de correlación de Spearman es más elevada

(rS=0.767). Este coeficiente es más apropiado para describir el comportamiento

de nuestro modelo.

Page 36: Modelo predictivo de duración de periodos de incapacidad ...

36

Gráfico 3.6. Diagrama de dispersión de los valores predichos frente a los reales

3.2.2.2. Árbol de regresión

Esta alternativa no paramétrica al análisis de la varianza no es de aplicación en

este caso pues, dado que todas las variables predictoras son categóricas y que

la predicción para cada nodo terminal consiste en el valor medio del mismo, si

no imponemos restricciones en la profundidad del árbol podemos considerarlo

equivalente a un modelo factorial completo del análisis de la varianza (modelo

lineal), que no debería aplicarse a la variable tiempo sino a su logaritmo. No

obstante, la variante categórica de este método, el árbol de decisión, tendrá un

papel central en nuestro estudio, como veremos más adelante.

Page 37: Modelo predictivo de duración de periodos de incapacidad ...

37

3.2.2.3. Modelo de regresión gamma

Como hemos comentado anteriormente, aplicar un modelo de regresión

gamma18 puede resultar en principio más natural que transformar los datos

para forzar la aplicación de un modelo lineal. El primer dilema que se nos

presentó es qué función de enlace debemos considerar: ¿el logaritmo o la

función inversa? Sobre este particular no existe unanimidad de criterios,

aunque el logaritmo es la opción que suele considerarse por defecto. No

obstante, hemos de advertir que en este trabajo hemos ensayado con las dos y

las predicciones resultantes varían de manera casi imperceptible. Mostraremos

aquí únicamente los resultados del modelo gamma con enlace logarítmico (log-

gamma).

Lo más destacable es que los pronósticos basados en el modelo lineal

presentaron una correlación lineal de Pearson r=0.977 con los pronósticos

basados en el modelo log-gamma (con la muestra de validación), es decir,

presentaron un comportamiento muy similar con la salvedad de que el modelo

gamma aportó tiempos de baja sistemáticamente más altos, como queda

patente en la tabla 3.2. En los gráficos 3.7 y 3.8 aparecen el histograma para

los residuos brutos y el diagrama de dispersión de los valores pronosticados

frente a los reales, al cual corresponde coeficiente de correlación de Pearson y

Spearman r=0.600 y rS=0.760, respectivamente.

18 Ahan H. Log-gamma regression modeling through regression tree, Communications in Statistics, Theory an methods. Arkansas: National center for toxicology Research, Food and Drug Administration; 1996

Page 38: Modelo predictivo de duración de periodos de incapacidad ...

38

Gráfico 3.7. Distribución de los residuos brutos

Gráfico 3.8. Histograma de los valores pronosticados frente a los reales

Page 39: Modelo predictivo de duración de periodos de incapacidad ...

39

Tabla nº 3.2. Comparativa de los errores cometidos por los modelos lineal,

gamma y mixto

Que los modelos lineal con logaritmo y gamma aporten predicciones

fuertemente correlacionadas es de esperar aunque los métodos de estimación

de los parámetros del modelo sean diferentes. Efectivamente, en el primer caso

hemos intentado explicar linealmente, a partir de las variables controladas, la

media del logaritmo del tiempo; en el segundo, hemos intentado explicar

linealmente el logaritmo de la media. En ambos casos estamos asumiendo

implícitamente una relación multiplicativa entre los factores controlados y la

respuesta. Ello puede explicar que, en nuestro caso, ambos modelos

conduzcan a conclusiones similares. Algo parecido puede decirse del modelo

de regresión de Cox, con la salvedad de que, en tal caso, se asume una

relación multiplicativa de los factores con la denominada función de riesgo.

Dado que no puede considerarse un modelo predictivo no haremos hincapié en

este último.

En definitiva, la diferencia entre el pronóstico lineal y el gamma consistió

básicamente en que el segundo predijo por término medio unos 11 día más de

baja. No es fácil decidir de manera objetiva si este comportamiento mejora o no

el ajuste. Como ya hemos comentado, existen diversos valores relacionados

con la bondad de ajuste del modelo lineal generalizado, como la devianza, pero

no son de utilidad para nosotros porque en el caso lineal se ha llevado a cabo

una transformación logarítmica seguida de una ponderación en función del tipo

de pago. En todo caso, según hemos indicado antes, el modelo gamma

presenta una correlación algo más fuerte con el valor real de la respuesta. Si

nos atuviéramos a las medias y teniendo en cuenta que las desviaciones

típicas son similares, según se aprecia en la tabla nº 3.2 (elaborada a partir de

la muestra de validación), el modelo gamma sería claramente mejor, pues casi

Media Mediana

Desviación

típica Percentil 25 Percentil 75 N válido

Error_lineal 10.770 .000 43.716 -3.000 7.000 N=61014

Error_gamma -.769 -2.304 43.080 -14.170 1.707 N=61014

Residuo_lineal_gamma 2.433 -1.000 42.446 -7.000 3.000 N=61014

Page 40: Modelo predictivo de duración de periodos de incapacidad ...

40

acierta en media, pero la conclusión sería contraria si nos centráramos en el

análisis de los cuartiles, pues el modelo lineal acierta en mediana, mientras que

el modelo gamma tiende a predecir tiempos de baja excesivos a una gran

cantidad de individuos que obtienen el alta relativamente pronto.

No obstante, esta discusión queda zanjada por el simple hecho de que ambos

conducen a predicciones muy poco fiables del tiempo exacto de baja y, por lo

tanto y en nuestra opinión, poco útiles en términos prácticos. Estas opciones

quedan pues desechadas por el momento, aunque volveremos sobre ellas más

adelante.

3.2.2.4. Modelo de predicción categórica

No obstante, si rebajamos nuestras pretensiones iniciales podemos sacar

provecho a la cuantiosa información que aportó la muestra. Nuestro nuevo

objetivo, más modesto aunque de gran utilidad, es determinar si la baja del

paciente se prolongará más de 15 días, fecha en la que las MUCOSS asumen

la prestación económica de los trabajadores pertenecientes al Régimen

General como ya hemos comentado previamente. En ese caso, la respuesta es

una variable categórica dicotómica.

3.2.2.4.1. Categorización de pronósticos lineal y gamma

Inicialmente, procedimos a categorizar los pronósticos obtenidos mediante los

modelos lineal y gamma con los resultados siguientes (para la muestra de

validación). Los resultados se presentan en la tabla 3.3, donde quedó

nuevamente patente que el modelo gamma tiende a dar pronósticos más

elevados. Parece claro que ambos modelos, en especial el gamma, fracasan a

la hora de detectar las bajas breves.

Page 41: Modelo predictivo de duración de periodos de incapacidad ...

41

Tabla 3.3. Resultados de la categorización de los pronósticos de los modelos

lineal y gamma

3.2.2.4.2. Regresión logística binaria

Un modelo que se antoja más natural para abordar este problema de decisión

es el de regresión logística binaria19, considerando las fuentes de variabilidad

que fijamos en la sección anterior. Apreciamos un comportamiento bastante

aceptable del modelo. Concretamente, se obtuvo un R2 de Nagelkerke de

0.631 para la muestra de entrenamiento, y una estimación las probabilidades

de acierto a partir de la muestra de validación del 88.0% y 80.8%, según se

muestra en la tabla 4 (85.3% en términos globales). La prueba de Hosmer-

Lemeshov aportó un resultado no significativo (P=0.066) lo cual nos induce a

pensar que no existe un modelo alternativo que mejore sustancialmente estas

predicciones (como confirmaremos posteriormente). Si aplicamos un algoritmo

de selección de variables (adelante-Wald) podemos eliminar algunas fuentes

de variabilidad pero, por el contrario, la probabilidad de acierto cae al 74.1% en

el grupo de las bajas prolongadas, por lo cual optamos por desechar esta

opción.

3.2.2.4.3. Árbol de decisión

Todos los métodos mencionados hasta el momento salvo éste son de tipo

paramétrico, es decir, el modelo de distribución de las observaciones

(contemplando posibles transformaciones de las mismas) queda determinado

de antemano excepto por el desconocimiento de ciertos parámetros que

19 Hosmer D.W. &Lemeshow S..Applied Logistic Regression. 2ª ed. New York .Willey; 1989

% acierto baja <15 % acierto baja>15

Lineal categorizado 43.5 88.5

Gamma categorizado 36.5 96.2

Page 42: Modelo predictivo de duración de periodos de incapacidad ...

42

debemos estimar. La mayoría de las técnicas que abordamos a partir de este

momento son de carácter no paramétrico y se circunscriben, como dijimos al

inicio de la sección, a la rama de la Estadística denominada Minería de Datos19.

En el problema que nos atañe, si en lugar de buscar el pronóstico exacto del

tiempo de baja nos conformamos con una decisión categórica (mayor a menor

de 15 días), el método no paramétrico más apropiado es el denominado árbol

de decisión20, que aplicamos considerando todas las variables explicativas

fijadas en la fase inicial.

En primer lugar, debimos decantarnos por un árbol de decisión simple o por un

procedimiento iterativo basado en el mismo. En esta segunda categoría

consideraremos dos opciones: el bosque aleatorio y el Adaboost.

Cuando se aplica un árbol de decisión simple conviene estimar las

probabilidades de acierto dividiendo la muestra al azar en dos bloques:

entrenamiento y validación. Dicha división introduce una componente aleatoria

que es fuente de variabilidad en la estrategia resultante, lo cual puede

compensarse mediante un remuestreo o bootstrap. Cuando contamos con

muchas variables explicativas, siendo una de ellas preponderante en la

predicción (tal es el caso de la variable diagnóstico), el remuestreo por sí sólo

no suele conducir a una reducción de la variabilidad, pero ésta puede

conseguirse si, para cada submuestra y en cada nodo, se eligen al azar una

pequeña cantidad de variables explicativas para construir a partir de las

mismas nodos filiales. Dicha técnica se denomina bosque aleatorio y puede

aplicarse haciendo uso del paquete randomForest del programa R. Es para

muchos la técnica idónea para obtener el mejor ajuste en el problema de

clasificación21 .

20 Hastie T., Tibshirani R., Friedman J. The elements of Statistical Learning. 2ª Ed. California: Springer; 2008

21 James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning. Londres: Springer. 2013

21 Freund, Y. and Schapire, R. A decision-theoretic generalization of online learning and an application to boosting. Journal of Computer and System Sciences. 1997: 55;119-139.

Page 43: Modelo predictivo de duración de periodos de incapacidad ...

43

Sin embargo, nosotros optamos por desechar el algoritmo de bosque aleatorio

por tres razones: primero, porque no proporciona un algoritmo entendible que

pueda implementarse de manera fácil sin la necesidad de contar con la base de

datos completa; segundo, porque la variabilidad mencionada anteriormente

quedó muy reducida en nuestro caso por el gran tamaño de la muestra; por

último, el propio tamaño de la muestra no permitió la aplicación del comando

randomForest en un ordenador convencional a la muestra completa.

Otro técnica tipo Boosting20 basada en el árbol de decisión simple que pudo

contemplarse en nuestro caso es el algoritmo Adaboost 21, método cuyo

resultado depende de una suma ponderada de diferentes árboles de decisión

que se van añadiendo iterativamente con la intención de explicar el

comportamiento de los datos peor ajustados. Se aplicó esta técnica con 10

iteraciones haciendo uso del paquete Adabag del programa R, proporcionando

unas proporciones de acierto del 90.3% para las bajas inferiores a 15 y del

75.0% para las superiores a 15 días, lo cual nos lleva a desecharla en beneficio

del árbol de decisión simple, que aporta unos resultados similares, como

veremos a continuación.

Para aplicar el algoritmo de árbol de clasificación simple y de acuerdo con la

literatura estadística (Hastie et al. (2008)), optamos por el método más natural

que es, hasta donde sabemos, el CART, considerando en principio la medida

de impureza Gini, que goza de una interpretación bastante intuitiva en términos

estadísticos. No obstante, se ensayó con otras posibilidades. Dado el gran

tamaño de la muestra no fue necesario imponer cotas especiales a los tamaños

de los nodos. Aunque el método CART construye por defecto árboles con un

máximo de 5 niveles ensayamos con la posibilidad de incluir hasta 10.

Aplicado a la variable dicotómica (<15 o >15) se obtuvo como resultado unas

probabilidades de clasificación correcta de 90.2% (<15) y 76.0% (>15) para la

muestra de validación, tal y como queda reflejado en la tabla (85.9% en

términos globales). El resultado fue levemente mejor en términos globales que

el de la regresión logística binaria (algo mejor para las bajas breves y algo peor

para las largas).

Page 44: Modelo predictivo de duración de periodos de incapacidad ...

44

3.2.2.4.4. Método mixto lineal-gamma

Dado que no queríamos resignarnos a una predicción dicotómica del tiempo de

baja, optamos por obrar de manera similar a Ahan (1996) y ajustar el tiempo de

baja (logaritmo) mediante un modelo lineal para los individuos con un

pronóstico inferior a 15 días, según el árbol, y ajustar el tiempo de baja

mediante un modelo log-gamma para los demás. Optamos por este diseño

teniendo en cuenta que el modelo gamma aporta tiempos de baja superiores al

lineal. La fase inicial de este método consistió en decidir si el paciente estaría

más o menos de 15 días de baja. Para ello elegimos el árbol de decisión

porque aplicar la regresión logística conllevaría someter los mismos datos a

dos variantes del modelo lineal generalizado.

De esta forma, las predicciones sobre la muestra de validación aportaron una

correlación con el tiempo real de r=0.615 (rS=0.745), lo cual podría interpretarse

como una leve mejora de las correlaciones obtenidas por el método lineal

(r=0.587) y el gamma (r=0.600). Los valores típicos de los residuos se

muestran en la tabla 3.2. Seguíamos pensando que estos valores eran

insuficientes para dar un pronóstico aceptable. Nuestra percepción fue que

para aspirar a predecir el tiempo exacto de la duración de la baja

necesitábamos algún tipo de un información (variable explicativa) con el que no

contábamos en esos momentos y que nos permitiría distinguir claramente a los

pacientes cuyas bajas se van a prolongar inopinadamente. De todas formas, de

tener que elegir una ecuación, sería la que se obtiene por este método, que

cuenta con 248 parámetros. Otra opción que descartamos también fue aplicar,

bien el modelo lineal al logaritmo del tiempo o bien el log-gamma al tiempo de

baja, pero incluyendo como covariable la probabilidad de que la baja sea

inferior a 15 días, estimada por el árbol de decisión, pero no conseguimos

mejorar en nada la predicción, a juzgar al menos por las correlaciones

obtenidas.

Page 45: Modelo predictivo de duración de periodos de incapacidad ...

45

3.2.2.4.5. Predicción con tres categorías

Así pues, todo parecía indicar que la información de la que disponíamos sólo

podría ser útil para distinguir entre bajas breves y prolongadas, pero no para

dar una estimación precisa. No obstante y como solución intermedia, probamos

a introducir un nuevo punto de corte por encima de los 15 días de baja (1 mes,

2, meses, tres meses, etc.) y comprobar nuestra capacidad de predicción

categórica. En principio probamos mediante un modelo logístico multinomial.

En tal caso, el problema consistía en ensayar con diferentes puntos de cortes

para poner a prueba la aptitud de los datos a la hora de detectar la respuesta.

En la práctica, el algoritmo de la regresión logística multinomial se mostró

demasiado inestable ante semejante cantidad de datos y de fuentes de

variabilidad, por lo que nos vimos obligado a desechar esta opción a favor del

árbol de decisión, que admitía sin problemas la inclusión de variables

categóricas no dicotómicas.

Lo primero que constatamos es que el método (para tres categorías) tenía

mucha dificultadas para detectar bajas muy largas. De hecho, sólo detectaba

un 16.1% de las bajas superiores a tres meses y, a partir de ahí, las

probabilidades caen a cero. Esto volvió a confirmarnos que no contábamos con

la información necesaria para identificar a los pacientes cuyas bajas serán muy

largas. Tampoco fue capaz de distinguir bajas de entre 15 días y un mes. Así

pues, de establecer un nuevo punto de corte, debería estar en torno a los 2

meses de baja. Por ello, procedimos a ensayar con los puntos de corte 40, 45,

50, 55, 60, 65, 70, 75 y 80 para encontrar las mejores probabilidades de

acierto. Destacamos que en todos los casos se obtuvo una proporción global

de acierto en torno al 78%, aunque el algoritmo mostró una máxima

sensibilidad para diferenciar entre bajas de duración media o alta cuando se

estableció el punto de corte de 80 días, según se aprecia en la tabla 3.4. En

todo caso, consideramos que las proporciones de bajas de duración media o

alta reconocidas por el modelo son bajas, es decir, que el modelo no es capaz

de distinguir satisfactoriamente entre tres categorías.

Page 46: Modelo predictivo de duración de periodos de incapacidad ...

46

Clasificación

Observado

Pronosticado

<15 15-80 >80

Porcentaje

correcto

<15 241557 14392 579 94,2%

15-64 33203 38895 7305 49,0%

>65 6900 16884 10361 30,3%

Porcentaje global 76,1% 19,0% 4,9% 78,6%

Métodos de crecimiento: CRT

Variable dependiente: Tiempo_80

Tabla 3.4. Sensibilidad del punto de corte 80 días en árbol de decisión

3.2.3. Conclusión: modelo predictivo a considerar y variables de

interés (paso nº3)

Como ya hemos comentado, el resultado obtenido por el árbol de decisión con

la muestra de validación fue levemente mejor que el de la regresión logística.

En relación con este último, apreciamos además como ventaja que el algoritmo

del diagrama de árbol fue más similar al típico protocolo médico que el de la

regresión logística, basado en una ecuación. Todo ello y a la vista de los

resultados obtenidos nos condujo a aplicar un algoritmo de árbol de decisión ,

a nuestros datos, considerando las variables RDGT, CUENTA, PAGO,

TRAMEPI, OCUPACION, TRAMEDAD, FUMADICO, CODGTdico, HIJOSDICO,

Rprov, CONTRAT1, RECAIDA ,SEX y ECIVIL, para pronosticar si la duración

de la baja sería superior a los 15 días. Tras ensayar con las diferentes

opciones que ofrece SPSS para ejecutar el árbol de decisión, optamos por el

método CRT con índice de impureza de Gini, una profundidad máxima

permitida de 10 ramificaciones y un coeficiente de poda de 0.5. (Tabla 3.5).

Page 47: Modelo predictivo de duración de periodos de incapacidad ...

47

Tabla 3.5. Sintaxis SPSS del algoritmo de decisión

Para valorar la importancia de cada variable en el modelo predictivo pudimos

basarnos en el gráfico 3.9, resultado de cuantificar el grado de participación de

cada variable predictiva en la reducción del índice de Gini a lo largo y ancho del

árbol de decisión obtenido. No obstante, encontramos una clara similitud entre

las conclusiones que aportan el gráfico 3.9 y la columna de tamaños de los

efectos (eta cuadrado parcial) en la tabla 3.1 Así pues, teniendo en cuenta

dicho gráfico, la lista de variables que intervienen de manera efectiva en la

toma de decisión, por orden de importancia, fue la siguiente: diagnóstico, pago,

cuenta, estado civil, hijos, codiagnóstico, ocupación, edad, provincia, fumador y

sexo. El resto de variables resultaron de poco interés en este estudio.

TREE Real15 [n] BY RDGT CUENTA PAGO TRAMEPI OCUPACION

TRAMEDAD FUMADICO CODGTdico HIJOSDICO

Rprov CONTRAT1 RECAIDA SEX ECIVIL

/TREE DISPLAY=TOPDOWN NODES=STATISTICS BRANCHSTATISTICS=YES

NODEDEFS=YES SCALE=AUTO

/DEPCATEGORIES USEVALUES=[1 2]

/PRINT MODELSUMMARY CLASSIFICATION RISK

/SAVE PREDVAL PREDPROB

/METHOD TYPE=CRT MAXSURROGATES=AUTO PRUNE=SE(0.5)

/GROWTHLIMIT MAXDEPTH=10 MINPARENTSIZE=100 MINCHILDSIZE=50

/VALIDATION TYPE=SPLITSAMPLE(70) OUTPUT=BOTHSAMPLES

/CRT IMPURITY=GINI MINIMPROVEMENT=0.0001

/COSTS EQUAL

/PRIORS FROMDATA ADJUST=NO

/MISSING NOMINALMISSING=MISSING.

Page 48: Modelo predictivo de duración de periodos de incapacidad ...

48

Gráfico 3.9. Importancia normalizada de las variables del modelo

Page 49: Modelo predictivo de duración de periodos de incapacidad ...

49

4. RESULTADOS

En el Anexo III se adjunta el gráfico del algoritmo de decisión y podemos

apreciar la importancia de las variables en dicho algoritmo. A continuación

describiremos de manera pormenorizada la influencia de dichas variables, en

orden de importancia, en la duración real de la baja. Estas variables serán

estudiadas de manera conjunta cuando apreciemos un considerable tamaño

del efecto en la interacción entre ellas, según se refleja en la tabla nº 3.1.

Consideramos que los resultados del estudio descriptivo que exponemos a

continuación pueden ser en buena medida extrapoladas al global de la

población dado el gran tamaño de la muestra.

El promedio de días de duración de los procesos se sitúa en 26,14 días con

una mediana de 7 días. Esto traduce que la mayoría de los procesos duran

menos de 15 días tal y como muestra la tabla 4.1.

Tabla 4.1. Distribución de las frecuencias de los tramos de duración de los

procesos

Page 50: Modelo predictivo de duración de periodos de incapacidad ...

50

4.1. Diagnóstico

La distribución de los diagnósticos en función de su frecuencia podemos

observarla en la tabla 4.2.

Recuento

% del N de la

tabla

LUMBALGIA 48933 13,2%

GASTROENTERITIS 40780 11,0%

FARINGITIS AGUDA 29449 8,0%

RESFRIADO COMUN 26171 7,1%

GRIPE 24169 6,5%

LIUMBOCIATICA 21801 5,9%

ANSIEDAD 19857 5,4%

CERVICALGIA 17886 4,8%

AMIGDALITIS AGUDA 16373 4,4%

GASTOENTERITIS NO

INFECCIOSAS 16342 4,4%

BRONQUITIS 11482 3,1%

ANGINA STRP 10374 2,8%

VERTIGO Y MAREOS 9379 2,5%

COLICO RENAL 7850 2,1%

GRIPE OTRAS

MANIFEST RESP 7137 1,9%

AMENAZA DE ABORTO 6986 1,9%

ESGUINCE TOBILLO 6571 1,8%

DEPRESION 6437 1,7%

HERNIA INGUINAL 6044 1,6%

ESGUINCE CERVICAL 4156 1,1%

DORSALGIA 4144 1,1%

DIARREA 3909 1,1%

TUNEL CARPIANO 3859 1,0%

OTRAS COMPLIC. ESP

EMBARAZO 3822 1,0%

CEFALEA 3622 1,0%

BRONQUITIS NO

AGUDA NO CRONICA 3461 ,9%

MIGRAÑA 3202 ,9%

REACCIÓN

ADAPTACIÓN 3079 ,8%

MENISCOPATIA

INTERNA 2801 ,8%

PERDIDOS 0 ,0%

Tabla 4.2. Distribución de las frecuencias de los diagnósticos de los procesos

Page 51: Modelo predictivo de duración de periodos de incapacidad ...

51

La lumbalgia se presenta como el diagnóstico más frecuente con 13,2% de los

casos. La patología osteomuscular es una de las causas más frecuentes de IT

en la población general seguida de las enfermedades infecciosas.

Al realizar un estudio descriptivo de los diagnósticos según su duración tal y

como figura en la tabla 4.3, tenemos:

Tabla 4.3. Distribución de la duración de los procesos según diagnóstico

Límite inferior

Límite superior 25 50 75

LUMBALGIA 35,18 34,74 35,63 15,00 49,863 37 6,00 15,00 43,00

GASTROENTERITIS 3,83 3,75 3,91 3,00 8,041 3 1,00 3,00 4,00

FARINGITIS AGUDA 4,79 4,70 4,89 3,00 8,299 3 2,00 3,00 5,00

RESFRIADO COMUN 5,44 5,33 5,55 4,00 9,015 4 2,00 4,00 6,00

LIUMBOCIATICA 59,89 58,93 60,84 32,00 71,947 69 11,00 32,00 80,00

GRIPE 6,30 6,21 6,40 5,00 7,547 5 3,00 5,00 8,00

ANSIEDAD 61,81 60,78 62,84 32,00 73,940 73 11,00 32,00 84,00

CERVICALGIA 50,47 49,62 51,32 31,00 58,000 63 9,00 31,00 72,00

GASTOENTERITIS NO INFECCIOSAS 4,54 4,36 4,71 3,00 11,536 2

2,00 3,00 4,00

ESGUINCE TOBILLO 24,11 23,36 24,85 15,00 30,704 18 9,00 15,00 27,00

BRONQUITIS 11,71 11,34 12,09 8,00 20,571 8 4,00 8,00 12,00

ANGINA STRP 4,79 4,68 4,90 4,00 5,726 4 2,00 4,00 6,00

VERTIGO Y MAREOS 24,71 23,76 25,66 8,00 46,823 17 3,00 8,00 20,00

COLICO RENAL 19,99 19,19 20,79 8,00 35,974 14 4,00 8,00 18,00

GRIPE OTRAS MANIFEST RESP

6,56 6,38 6,74 5,00 7,737 44,00 5,00 8,00

AMENAZA DE ABORTO 68,98 67,28 70,67 38,00 72,291 82 15,00 38,00 97,00

DEPRESION 82,39 80,26 84,52 49,00 87,094 107 15,00 49,00 121,50

HERNIA INGUINAL 52,75 51,71 53,80 43,00 41,451 27 32,00 43,00 59,00

ESGUINCE CERVICAL 61,11 59,58 62,63 50,00 50,209 59 25,00 50,00 84,00

DORSALGIA 32,13 30,62 33,65 11,00 49,758 35 4,00 11,00 39,00

DIARREA 6,39 5,78 7,00 3,00 19,389 3 2,00 3,00 5,00

TUNEL CARPIANO 78,04 75,92 80,17 57,00 67,242 60 35,00 57,00 95,00

OTRAS COMPLIC. ESP EMBARAZO 58,16 56,68 59,64 46,00 46,611 47

27,00 46,00 74,00

CEFALEA 17,80 16,49 19,11 4,00 40,210 11 1,00 4,00 12,00

BRONQUITIS NO AGUDA NO CRONICA

10,77 10,09 11,46 7,00 20,551 7 4,00 7,00 11,00

MIGRAÑA 10,79 9,74 11,83 2,00 30,138 5 1,00 2,00 6,00

REACCIÓN ADAPTACIÓN 106,99 103,93 110,05 82,00 86,625 112 40,00 82,00 152,00

MENISCOPATIA INTERNA 90,23 87,43 93,03 64,00 75,620 83 37,00 64,00 120,00

AMIGDALITIS AGUDA 5,37 5,27 5,47 4,00 6,489 3 3,00 4,00 6,00

Desv. típ.Amplitud

intercuartilMedia

Intervalo de confianza para la

MedianaDIASBAJA

Percentiles

Descriptivos

Estadístico

dIAGNOSTICO

Page 52: Modelo predictivo de duración de periodos de incapacidad ...

52

4.2. Cuenta

Otra variable de interés es el tipo de cuenta del trabajador. El 93,2 % de los

trabajadores pertenecen a la cuenta ajena mientras que sólo el 6,8%

pertenecen a la cuenta propia (autónomos). La duración agregada de los

procesos en función de esta variable es significativa, siendo de 22,59 días para

la cuenta ajena y de 66,07 días para la cuenta propia tal y como figura en la

tabla 4.4.

Tabla 4.4. Distribución de la duración de los procesos según la cuenta

Al segregar por diagnóstico se siguen manteniendo estas diferencias como

vemos en la tabla 4.5.

Page 53: Modelo predictivo de duración de periodos de incapacidad ...

53

Tabla 4.5. : Distribución de la duración de los diagnósticos según la cuenta

4.3. Pago

Mostramos en la tabla 4.6 una descripción de la duración de los diagnósticos

en función del tipo de pago:

Page 54: Modelo predictivo de duración de periodos de incapacidad ...

54

Tabla 4.6. : Distribución de la duración de los diagnósticos según el tipo de

pago

4.4. Ocupación

La ocupación más frecuente es la de servicios, restauración y protección

(5,8%) seguidos de Técnicos y profesionales de apoyo (4,8%) y trabajadores

no cualificados (4,7%).

Las duraciones medias por ocupación se muestran en el gráfico 4.1.

Gráfico 4.1. Duraciones medias de los diagnósticos según la ocupación

Page 55: Modelo predictivo de duración de periodos de incapacidad ...

55

En las tablas 4.7 y 4.8 se detallan las duraciones por ocupación segregando

por diagnósticos. Observamos como en las fuerzas armadas los diagnósticos

que más duran son los relacionados con la patología mental, al igual que

ocurre en directivos, científicos e intelectuales, técnicos y profesionales de

apoyo, administrativos, construcción, operadores y trabajadores no

cualificados.

La patología osteomuscular tiene mayor duración ocupaciones relacionadas

con agricultura y pesca.

La patología infecciosa es la de menor duración en todas las ocupaciones.

Tabla 4.7. Distribución de la duración de los diagnósticos según ocupación (I)

FUERZAS ARMADASDIRECCION EMPRESAS

CIENTIFICOS E INTELECTUALES

TECNICOS Y PROFESIONALES

DE APOYOEMPLEADOS

ADMINISTRATIVOS

LUMBALGIA 30,74 63,12 36,75 40,86 34,98

GASTROENTERITIS 20,17 4,71 4,78 4,75 3,74

FARINGITIS AGUDA 8,40 7,82 5,83 5,85 5,18

RESFRIADO COMUN 10,00 11,08 6,47 6,62 5,75

LIUMBOCIATICA 81,73 90,31 56,67 62,54 52,62

GRIPE 7,44 9,39 6,68 6,49 7,41

ANSIEDAD 86,75 92,81 70,12 73,89 65,80

CERVICALGIA 87,00 76,30 42,31 55,56 46,89

GASTOENTERITIS NO INFECCIOSAS 2,00 4,36 5,43 5,29 4,52

ESGUINCE TOBILLO 27,50 43,42 30,24 30,88 25,66

BRONQUITIS 37,14 21,05 13,60 13,19 11,22

ANGINA STRP 23,00 3,72 4,60 5,33 5,68

VERTIGO Y MAREOS 34,00 59,22 26,95 33,67 25,25

COLICO RENAL 51,00 22,15 19,96 22,93 20,00

GRIPE OTRAS MANIFEST RESP 7,57 6,63 7,44 6,89

AMENAZA DE ABORTO 43,00 79,11 70,00 63,71 65,66

DEPRESION 115,50 116,05 84,58 95,31 88,28

HERNIA INGUINAL 43,80 53,63 38,96 41,29 37,43

ESGUINCE CERVICAL 108,00 73,58 58,19 59,43 60,08

DORSALGIA 61,53 30,38 44,32 21,57

DIARREA 21,00 6,70 8,54 7,96

TUNEL CARPIANO 197,33 80,52 58,68 66,90 63,69

OTRAS COMPLIC. ESP EMBARAZO 98,00 51,32 54,94 54,79 62,92

CEFALEA 42,00 48,40 26,54 25,16 16,59

BRONQUITIS NO AGUDA NO CRONICA

8,00 10,94 9,75 10,77 11,15

MIGRAÑA 118,00 32,00 20,68 15,03 10,10

REACCIÓN ADAPTACIÓN

296,00 149,91 98,44 117,38 103,36

MENISCOPATIA INTERNA 73,20 84,92 60,40 79,97 61,65

AMIGDALITIS AGUDA 8,00 7,76 7,06 5,87 5,87

Total 55,56 62,94 32,59 34,79 28,39

Media

OCUPACION

Page 56: Modelo predictivo de duración de periodos de incapacidad ...

56

Tabla 4.8. Distribución de la duración de los diagnósticos según ocupación (II)

4.5. Edad

De los procesos estudiados el tramo de edad más frecuente en los hombres se

da entre los 43 y 51 años a diferencia de las mujeres que son entre los 32 y 37

años.

SERVICIOS RESTAURACION Y

PROTECCIONAGRICULATURA

Y PESCA

MANUFACTURAS, CONSTRUCCION

Y MINERIAOPERADORES Y MONTADORES

TRABAJADORES NO

CUALIFICADOS PERDIDOS

LUMBALGIA 43,24 51,82 41,96 37,03 42,12 32,29

GASTROENTERITIS 4,62 3,31 4,46 4,02 4,70 3,65

FARINGITIS AGUDA 5,92 3,84 5,22 4,96 5,09 4,59

RESFRIADO COMUN 7,00 4,59 5,45 5,24 5,91 5,19

LIUMBOCIATICA 67,63 75,48 71,63 70,69 71,35 56,12

GRIPE 7,04 7,54 6,14 6,41 6,89 6,17

ANSIEDAD 72,58 65,47 70,97 67,50 71,58 56,13

CERVICALGIA 52,53 68,19 57,39 52,06 57,19 48,30

GASTOENTERITIS NO INFECCIOSAS 5,28 9,80 4,59 4,60 4,76 4,36

ESGUINCE TOBILLO 28,07 41,43 26,71 26,19 33,13 21,01

BRONQUITIS 14,59 21,02 12,01 13,09 15,76 10,82

ANGINA STRP 5,57 4,46 5,22 6,05 5,88 4,63

VERTIGO Y MAREOS 28,55 19,82 31,15 34,00 35,15 21,68

COLICO RENAL 24,50 38,68 24,55 23,18 20,45 18,77

GRIPE OTRAS MANIFEST RESP 7,65 7,95 6,73 6,80 6,28 6,39

AMENAZA DE ABORTO 78,98 62,71 84,17 59,77 91,89 67,45

DEPRESION 96,92 114,00 88,95 91,64 98,38 75,54

HERNIA INGUINAL 50,50 52,28 60,72 53,78 57,45 52,73

ESGUINCE CERVICAL 63,21 69,69 59,14 62,83 62,14 60,60

DORSALGIA 29,31 55,67 40,59 38,63 37,20 30,13

DIARREA 6,50 8,58 6,70 6,90 5,40 6,12

TUNEL CARPIANO 81,94 77,77 84,28 76,09 80,36 78,02

OTRAS COMPLIC. ESP EMBARAZO

74,75 165,00 73,24 77,00 77,76 55,59

CEFALEA 22,68 3,89 20,22 23,42 20,40 16,04

BRONQUITIS NO AGUDA NO CRONICA 16,45 17,17 12,58 16,82 13,39 9,71

MIGRAÑA 13,66 11,79 12,74 16,55 14,93 9,36

REACCIÓN ADAPTACIÓN

97,59 63,75 109,23 120,86 102,88 106,47

MENISCOPATIA INTERNA

96,73 152,67 100,69 99,04 99,72 89,74

AMIGDALITIS AGUDA 6,15 5,39 5,56 5,61 6,04 5,18

Total 35,95 36,36 31,89 28,98 33,02 23,08

Media

OCUPACION

Page 57: Modelo predictivo de duración de periodos de incapacidad ...

57

En la tabla 4.9 se muestra el promedio de duración de días en baja por tramo

de edad de manera agregada. Es el tramo de más de 52 años el que presenta

una duración media mayor.

Tabla 4.9. Distribución de la duración de los procesos según el tramo de edad

Al exponer los resultados segregados por diagnósticos observamos igual

comportamiento tanto en medias como en medianas de duración tal y como

aparece en la tabla 4.10.

Tabla 4.10. Distribución de la duración de los diagnósticos según el tramo de

edad

Page 58: Modelo predictivo de duración de periodos de incapacidad ...

58

Si tenemos en cuenta el año en el que se produce el periodo de incapacidad y

tal y como se muestra en la tabla 4.11 observamos que, conforme van pasando

los años, el tramo de edad se va rejuveneciendo de 2008 a 2012, siendo el

tramo de 43 a 51 años el más frecuente en 2008 y el de menos de 31 en 2012.

Tabla 4.11. Evolución de la frecuencia de los tramos de edad en el periodo

2008-2012

4.6. Codiagnóstico

En la tabla 4.12 se muestra la diferencia entre duraciones de los procesos que

si tienen codiagnóstico y los que no:

Tabla 4.12. Distribución de la duración de los procesos según el codiagnóstico

El codiagnóstico influye claramente en la duración de los procesos tal y como

podemos observar en el gráfico 4.2, donde podemos apreciar que el efecto del

AÑO

2008 2009 2010 2011 2012

% de la fila % de la fila % de la fila % de la fila % de la fila

TRAMEDAD <= 31 17,7% 19,3% 20,9% 23,2% 18,9%

32 – 37 17,9% 19,6% 21,4% 22,6% 18,5%

38 – 42 19,1% 20,5% 21,3% 22,0% 17,2%

43 – 51 19,4% 21,1% 20,9% 21,5% 17,2%

52+ 21,0% 21,0% 21,4% 20,5% 16,1%

Page 59: Modelo predictivo de duración de periodos de incapacidad ...

59

codiagnóstico sobre el aumento de la duración de los procesos es más patente

en las enfermedades infecciosas.

Gráfico 4.2. Duraciones medias de los diagnósticos según la presencia de

codiagnóstico

4.7. Hijos

Otra de las variables que explican la varianza de la duración de los procesos es

la de tener o no tener hijos. En el primer caso la duración media es de 48,61

días de forma agregada mientras que los que no tienen hijos tiene una duración

de 26,29 días. Destaca la diferencia en días medios de duración situación que

se mantiene al tener en cuenta las medianas de duración (tabla 4.13).

Page 60: Modelo predictivo de duración de periodos de incapacidad ...

60

Tabla nº 4.13. Distribución de la duración de los procesos según la

descendencia

Al segregar esta variable por diagnóstico sigue siendo la duración media y

mediana más elevada en todos los diagnósticos de registros que si tienen hijos,

tabla nº 4.14.

Tabla 4.14. Distribución de la duración de los procesos según la descendencia

Page 61: Modelo predictivo de duración de periodos de incapacidad ...

61

Al segregar por sexo, las mujeres que si tienen descendencia tienen una

duración media agregada de 51,49 días frente a los 45,38 días de los hombres.

4.8. Provincia

La provincia de origen de los registros también influye en la duración de los

procesos, se optó por realizar un clúster con todas las provincias agrupándose

en cuatro conjuntos:

En el grupo nº 1(8,9% del total de registros) están: Almería, Badajoz, Cáceres,

León, Lugo, Orense, Pontevedra, Salamanca, Valencia y Zamora.

En el grupo nº2 (35,4% del total de registros) están: Albacete, Alicante,

Asturias, Ávila, Castellón, Ciudad Real, Córdoba, Cuenca, Granada,

Guipúzcoa, Huelva, Jaén, La Coruña, Vigo, Murcia, Palencia, Sevilla, Tenerife,

Teruel y Vizcaya.

En el grupo nº 3(19,9% del total de registros) están: Baleares, Burgos, Cádiz,

Cantabria, Gerona, Huesca, Las Palmas, Lérida, Málaga, Melilla, Segovia,

Soria, Toledo y Valladolid

Y en el grupo nº4(35,9% del total de registros): Álava, Barcelona, Ceuta,

Guadalajara, La Rioja, Madrid, Navarra, Tarragona y Zaragoza.

Las duraciones por grupo se muestran en la tabla 4.15

Page 62: Modelo predictivo de duración de periodos de incapacidad ...

62

Tabla 4.15. Distribución de la duración de los procesos según la provincia de

origen

Al segregar las duraciones por tramos de duración en relación al clúster de

provincias tenemos comportamiento muy similar a diferencia del grupo n4, que

es el único grupo donde la duración más frecuente es en el tramo menor de 15

días. En la tabla 4.16 se observa el resto de datos.

Tabla 4.16. Distribución de la frecuencia de los tramos de duración según la

provincia de origen

Page 63: Modelo predictivo de duración de periodos de incapacidad ...

63

4.9. Tipo de contrato

La duración de los procesos en función del tipo de contrato según sea a tiempo

parcial o a tiempo completo se muestra en la tabla 4.17.

Tabla 4.17. Distribución de la duración de los procesos según el tipo de

contrato

Llama la atención el hecho de que los registros que tiene un contrato a tiempo

parcial tienen más duración que los que lo tienen a tiempo completo. La mayor

desviación en cuanto a duraciones se da en las patologías relacionadas con la

esfera mental según se muestra en la tabla 4.18.

Page 64: Modelo predictivo de duración de periodos de incapacidad ...

64

Tabla 4.18. Distribución de la duración de los diagnósticos según el tipo de

contrato

4.10. Recaída

El 29,1 % de los procesos han tenido recaída de su patología siendo en las

mujeres más frecuente la recaída (15,4%) que en los hombres (13,9%).

Page 65: Modelo predictivo de duración de periodos de incapacidad ...

65

En la tabla 4.19 se muestran las duraciones medias en el caso de haber o no

tenido recaída:

Tabla 4.19. Distribución de la duración de los procesos según la recaída

Sólo en los casos con diagnósticos de hernia inguinal y en otras

complicaciones del embarazo la duración media de los procesos es menor en

el caso de no haber tenido recaída previa.

4.11. Estado civil

El estado civil juega también un papel en la duración de los procesos de IT. En

la tabla 4.20 se muestra como los pacientes con estado civil viudo son los que

tienen mayores duraciones probablemente vinculado a la edad, seguido por los

pacientes divorciados y las parejas de hecho:

Tabla 4.20. Distribución de la duración de los procesos según el estado civil

Son las casadas, mujeres en pareja de hecho y solteras las que tienen

mayores duraciones medias a diferencia de los viudos. En el caso de los

Page 66: Modelo predictivo de duración de periodos de incapacidad ...

66

divorciados y divorciadas las duraciones son similares: 49,09 días para los

primeros y 49,01 para las segundas.

4.12. Interacción diagnóstico - sexo

Las mujeres presentan las duraciones medias y medianas mayores. Hay

diferencia entre las duración de los proceso entre hombres y mujeres tal y

como podemos ver en la tabla 4.21.

Tabla 4.21. Distribución de la duración de los procesos según el sexo

En cuanto a la duración de los procesos detectamos diferencias según el sexo.

El tramo de duración inferior a 15 días es el más frecuente en ambos sexos

aunque en mayor medida para los hombres. El segundo tramo más frecuente

es el de 31 a 60 días en ambos sexos. Tabla 4.22.

Tabla 4.22. Distribución de la frecuencia de los tramos de duración según el

sexo

Page 67: Modelo predictivo de duración de periodos de incapacidad ...

67

La distribución por sexos según el tramo de edad se muestra en la tabla 4.23.

SEX

H M

% de la fila

% del N total de

tabla % de la fila

% del N total de

tabla

TRAMEDAD <= 31 49,5% 11,7% 50,5% 12,0%

32 - 37 44,0% 11,0% 56,0% 14,0%

38 - 42 48,2% 8,2% 51,8% 8,8%

43 - 51 53,4% 9,9% 46,6% 8,7%

52+ 57,2% 8,7% 42,8% 6,5%

Tabla 4.23. Distribución del género según el tramo de Edad

En relación a la distribución de diagnósticos por sexos tenemos que la

lumbalgia es el diagnóstico más frecuente. La lumbalgia es más frecuente entre

las mujeres con un 7,1 % frente a un 6,1 % de los hombres. En la tabla 4.24

podemos observar el comportamiento en todos los diagnósticos.

Page 68: Modelo predictivo de duración de periodos de incapacidad ...

68

Tabla 4.24. Distribución de la frecuencia de los diagnósticos según el sexo

4.13. Interacción diagnóstico - tipo de pago

Dado que la interacción entre el diagnóstico y el pago es una fuente de

variabilidad a tener en cuenta se muestra en la tabla 4.25 las duraciones

medias y medianas en función de estas dos variables:

Page 69: Modelo predictivo de duración de periodos de incapacidad ...

69

Tabla 4.25. Distribución de la duración de los diagnósticos según el tipo de

Pago

En el gráfico 4.3 se pone de manifiesto esta variabilidad que sigue

manteniéndose al tener en cuenta los tramos de duración de los procesos en

función del tipo de pago.

Se observa cómo la mayor parte de los procesos se encuentran en el tramo de

menor duración y éste es mayoritario en el pago delegado, al contrario que en

el pago directo donde es el tramo de 31-60 días el más frecuente.

Page 70: Modelo predictivo de duración de periodos de incapacidad ...

70

Gráfico 4.3. Distribución de los tramos de duración de loa procesos según el

tipo de Pago

Como se puede observar en la tabla 4.26, el tipo de pago delegado es el más

frecuente en todos los diagnósticos.

Page 71: Modelo predictivo de duración de periodos de incapacidad ...

71

Tabla 4.26. Distribución de la frecuencia de los diagnósticos según el tipo de

pago

Al segregar por tipo de pago llama la atención el comportamiento de la

frecuencia de la lumbalgia que representa el 21,8% de los casos.

Page 72: Modelo predictivo de duración de periodos de incapacidad ...

72

4.14. Interacción Número episodio - hábito tabáquic o

Los pacientes que tienen hábito tabáquico tienen mayores duraciones medias y

menores duraciones medianas frente a los que no lo tienen (tabla 4.27).

Tabla 4.27. Distribución de la duración de los diagnósticos según el hábito

tabáquico

La distribución de las duraciones teniendo en cuenta el número de episodio del

trabajador y su hábito tabáquico la podemos observar en la tabla 4.28:

Page 73: Modelo predictivo de duración de periodos de incapacidad ...

73

Tabla 4.28. Distribución de la duración de los procesos en función del número

de episodio y del hábito tabáquico

En los casos que hayan tenido un episodio de IT y de dos a tres, tanto las

duraciones medias como medianas son superiores en el caso de los

fumadores. Esta situación se invierte cuando los casos tengan de cuatro a siete

episodios o más de siete.

Page 74: Modelo predictivo de duración de periodos de incapacidad ...

74

5. DISCUSIÓN

No cabe duda que hay muchos factores que influyen en las duración de los

procesos que no hemos incluido debido a su difícil manejo o medida, tal y como

expone Castejón22. Al clasificar los factores que influyen en la historia natural

de la IT podemos hablar de:

1. Factores Biológicos propios de individuo (edad, sexo, estado civil, etc.)

2. Factores Biológicos propios de la patología(diagnostico, comorbolidad,

hábitos, vivencia de la enfermedad en la sociedad del bienestar, etc.)

3. Factores Sociales (estilo de vida, carga familiar, nivel cultural,

inmigración, lugar de residencia, etc.)

4. Factores Profesionales (Tamaño empresa, jornada laboral, cargas,

prevención, clima laboral, grado de satisfacción, etc.)

5. Factores Económicos (Nivel de renta, régimen de Seguridad social)

6. Factores Sanitarios (Características del médico evaluador, accesibilidad

al sistema sanitario, etc.)

Es evidente la dificultad de medida de muchos de ellos y consecuentemente la

imposibilidad de incluirlos en nuestro modelo.

En primera instancia y la vista del Gráfico 1.2. donde se pueden ver las

duraciones medias de los periodos de IT del INSS, ISM y MUCOSS en el

periodo 2007-2012 observamos claras diferencias. La menor duración de los

procesos en las MUCOOS puede tener varios motivos. Los médicos

evaluadores de la capacidad laboral en las mutuas tienen una dedicación

exclusiva en este cometido a diferencia de los médicos de atención primaria,

hecho que puede influir en los tiempos medios de duración. Por otro lado en las

mutuas se reducen los tiempos de gestión a la hora de realizar pruebas y/o 22 Castejón J. et al. La Incapacitat Laboral per Coningencias Comunes en Catalunya. Barcelona: Consell de Treball, Economic i Social de Catalunya. 2003

Page 75: Modelo predictivo de duración de periodos de incapacidad ...

75

tratamientos, hecho que se alarga más en atención primaria. Podemos hablar

de una mayor especialización como médico evaluador en los profesionales

pertenecientes a las mutuas e INSS. No cabe duda de que existen más causas

que expliquen estas diferencias pero obviamente no son objeto de este trabajo.

Por otro lado hay que destacar el papel del cambio de ciclo económico de la

crisis española que comenzó en el 2008 sobre la IT. Al tener en cuenta la tasa

de absentismo laboral23, es decir, porcentaje de la población que está en

situación de IT, y las jornadas perdidas por trabajador, tenemos que durante la

época de crisis ambos indicadores han disminuido. Frente a lo anterior hay un

dato muy llamativo: las duraciones medias de los procesos durante estos años

se han mantenido en cifras similares. Esto implica que la crisis no ha producido

sesgo importante sobre nuestro modelo de predicción.

Tal y como se ha expuesto en los resultados la variable con más peso a la hora

de explicar la varianza de la duración de los procesos de IT es el diagnóstico.

Este hecho está en consonancia con otros estudios como los realizados por

Juan Luis Cabanillas24 y Esther Álvarez25. En sentido contrario tenemos

estudios26 que dan una importancia secundaria al diagnóstico dentro de la

historia natural del proceso de IT sin entrar en análisis estadísticos posteriores.

No siendo el objetivo de estos estudios el desarrollar un modelo predictivo de

duración estamos en completo desacuerdo el considerar el diagnostico como

factor secundario a la hora de determinar la duración de un proceso de IT a la

vista de los resultados expuestos previamente.

23

Adecco (internet). Madrid. 7 de agosto 2016. Disponible en www.adecco.es

24 Cabanillas J.L. et al. Tiempos óptimos personalizados en Incapacidad temporal. Consejería de Salud y Bienestar Social de la Junta de Andalucía. Sevilla;2012

25 Álvarez Theurer E. et al. Análisis de la duración de los periodos de incapacidad temporal de los procesos de Andalucía. Factores asociados. Aten. Primaria:2009;41 (7):387-393

26 Villaplana García M.A. .El Absentismo laboral por Incapacidad Temporal derivada de Contingencia Comunes en el periodo 2005-2010. Tesis Doctoral. Universidad de Murcia. 2012

Page 76: Modelo predictivo de duración de periodos de incapacidad ...

76

Existen estudios27 28 donde se pone de manifiesto la importancia del

diagnóstico en la duración de los procesos no teniendo como objetivo realizar

una predicción de duración como el caso que nos trata.

En relación a la predicción de duración existe poca bibliografía que aborde el

tema que nos ocupa explicado en parte por la dificultad que ello conlleva. Hay

muchos trabajos que analizan factores de corrección29 30 31 32 que influyen en la

duración de los procesos pero sin entrar en diagnósticos. E. Álvarez33 a través

de una regresión lineal múltiple tras análisis multivariante desarrolla un modelo

pero sólo para el diagnóstico de lumbalgia, hecho fundamentado porque la

patología osteomuscular es la más prevalente tal y como se ha puesto de

manifiesto en nuestro estudio y otros34. Hay otros autores que van la línea

utilizando sólo un diagnóstico (ansiedad) como es el caso de Carlos Catalina y

colaboradores35.

27 Allen Cheadle et al. Factor influencing the Duration of Work.Related Disability: A Population Based Sutdy of Washington State Workers Compensation. American Journal of Public health. 1994; 84(2):194

28 González Barcala F.J. et al. Determinantes de la Duración de la Incapacidad temporal y vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria. 2006;37(8):431-8

29 Bayona X. et al. Variables que influyen en la resolución de una Incapacidad Temporal por contingencia comunes de muy larga duración. Arch. Prev. Riesgos Labor. 2004;7(2):64-69

30 Benavides F.G. et al. Reincorporación al trabajo después de un episodio de Incapacidad temporal por contingencia común: Papel de la edad, el sexo, la actividad económica y la Comunidad Autónoma. Rev. Esp. Salud pública.2007;81:183-190

31 Alavinia S.M. Determinats of works ability and its predictive value for diasability. Occupational Medicine. 2009;59:32-37

32 Villaplana M. Grado de efecto de las variables sociodemográficas, laborales, organizativas y del entorno en la duración de la Incapacidad Temporal por contingencias comunes en España. Aten. Primaria. 2015;47(2):90-98

33 Álvarez Theurer et al. Modelo Predictivo de la duración de Incapacidad temporal por Lumbalgia. Factores determinantes. 2005;14(3):10-17

34 Delclos J. et al. Duración de la Incapacidad temporal por contingencia común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-187

35 Catalina C. et al. Predictores de la duración de Incapacidad Temporal por Contingencias comunes en los Trastornos de Ansiedad. Gaceta Sanitaria. 2011;27(1):40-46

Page 77: Modelo predictivo de duración de periodos de incapacidad ...

77

Desde un punto de vista antropológico el diagnóstico médico es la vivencia de

la enfermedad en el sujeto y entramos en lo que Laplantin36 denomina el

“campo del enfermo “que se caracteriza por el sufrimiento y la conciencia de la

experiencia mórbida; es fácil de entender la gran variabilidad interindividual y

su repercusión sobre el tiempo de recuperación. No podemos obviar los efectos

de la sociedad del bienestar donde cada vez se objetiva mejor como patologías

o enfermedades banales representan un sufrimiento mayor en la población no

justificado por la entidad clínica de la patología.

Junto a esta variabilidad y tal y como como la antropología sociocultural ha

demostrado como expone Guerrero37 en su trabajo, las percepciones de buena

y mala salud (enfermedad) se encuentran culturalmente construidas, hecho que

complica más aun el desarrollo del modelo, más aun cuando no disponemos de

magnitud que pueda ayudar a su medida.

En relación con la variable cuenta si hay estudios en concordancia con el

nuestro38 39 40.

La razón por la cual los procesos de IT duran más en el Régimen Especial de

Trabajadores Autónomos que en el Régimen General puede deberse a varios

factores como más precariedad laboral, menor control en medidas de

protección, existencia de un suplemento en cuotas de cotización para estar

protegido en el accidente laboral y el concepto de “prestación refugio”.

La prestación por IT tiene como ya se ha expuesto anteriormente una duración

máxima de 12 meses, prorrogables 6 meses más si hay estimación de curación

o mejoría que permita reanudar la actividad laboral. Posteriormente puede

36 Laplantin F. Antropología de la Enfermedad. Paris:Editions Payot;1965

37 Guerrero F. Salud. Enfermedad y Muerte: Lecturas desde la antropología Sociocultural. Revista Mad.2004;10:1

38 Benavides F.G. et al. Evaluación de la gestión de los casos de Incapacidad Temporal por contingencia común de más de 15 días en Cataluña. Gac. Sanit. 2010; 24(3):215-219

39 Delclos J. et al. Duración de la Incapacidad temporal por contingencia común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-187

40 Royo-Bordonada M.A. La duración de la Incapacidad Laboral y sus factores asociados. Gac. Sanit. 1999;13(3):177-184

Page 78: Modelo predictivo de duración de periodos de incapacidad ...

78

iniciarse otro proceso de IT por el mismo motivo por una sola vez con derecho

a prestación con una duración máxima de 18 meses41. En este sentido la

conjunción de situaciones desfavorables como quiebras de empresas, negocios

no viables y otras, junto a la existencia inicial de patología que justifique un

periodo de IT convierten la prestación por incapacidad en una prestación

refugio para no entrar en situación de exclusión social42.

Respecto a la variable tipo de pago no encontramos bibliografía relacionada. La

mayor duración de los procesos que están en situación de pago directo se

debe fundamentalmente al recibir el alta médica y por tanto la finalización de su

periodo de incapacidad, dejan de recibir la prestación económica. Aludo al

concepto antes expuesto de prestación refugio.

La ocupación del trabajador también influye en la duración de los procesos tal y

como hemos expuesto y en comparación con otros estudios43 44 45. La

distribución por diagnóstico más prevalente en las ocupaciones va en relación a

las cargas laborales (físicas, posturales, mentales y neurosensoriales) de cada

profesión. En las profesiones con cargas mentales elevadas muestran más

frecuencia de patologías relacionadas con la esfera mental, al revés que ocurre

con profesiones menos cualificadas que al tener mayores cargas físicas y

posturales tiene más incidencia de patología osteomuscular. No habiéndose

tratado en nuestro trabajo es importante comentar el trabajo de Santamaría,

P.46 donde pone de relevancia la relación existente entre la simulación de

patologías y la profesión del trabajador, hecho que produce un sesgo en la

41 Art. 131 bis del RD Legislativo 1/1994, de 20 de junio, por el que se aprueba el Texto Refundido de la Ley General de seguridad social

42 Arrina, A. El concepto de Exclusión en la Política Social. Trabajo social Hoy. 2002;34:47-46

43 Rivas P. Salud Mental e incapacidad Temporal en población laboral de Cataluña. Arch. Prev. Riesgos Labor. 2008;11(2):81-86

44 García Álvarez, G. Conceptos básicos en incapacidad temporal. Jano. 2003;65(1495):1770-1773

45 Benavides F.G..Ocuppational categories and sickness absence certified as attributable to common disease. European Journal of Public Health. 2003:13 (1);51-55.

46 Santamaría P. et al. Prevalencia de Simulación en Incapacidad Temporal: Percepción de los profesionales de la Salud. Clínica y Salud. 2013;24:139-151

Page 79: Modelo predictivo de duración de periodos de incapacidad ...

79

duraciones reales por ocupación. No se ha encontrado bibliografía que pueda

aclarar la relación entre la simulación y la mayor duración de los procesos

según el tipo de régimen laboral (variable cuenta de nuestro estudio) y la

naturaleza del pago de la prestación (variable pago de nuestro estudio).

La edad es otra variable que influye en la duración de los procesos de IT y está

presente en la mayoría de los estudios previos y otros como, E. Álvarez (2005)

y Torá I.47 Como era de esperar la mayor duración de los procesos se

encuentra en el tramo de edad superior a 52 años, no sólo por la aparición de

patologías propias de ese tramo sino también porque hay una disminución en

la capacidad de recuperación frente a otros tramos. Esta realidad hace que

desde las administraciones del estado se desarrollen planes para lo que Mauro

Brigeiro48 denomina “envejecimiento exitoso”, es decir, conseguir las mejores

condiciones socio sanitarias posibles en la etapa final de la vida. A esto habría

que sumar otros factores o variables que inciden sobre la ancianidad y la

vivencia de la enfermedad como expone Guijarro J. L.49 que influyen sobre la

duración de los procesos, como son la invalidez que puede llegar a provocar,

amenaza ante la pérdida de integridad del sujeto, etc. No cabe duda que estos

factores también influyen en otras edades pero en menor medida.

En la tabla 4.11 se observaba como de 2008 a 2012 el tramo de edad de

procesos de IT se va rejuveneciendo. Al contrastar estos datos con los

porcentajes de población activa sobre población total en España en el mismo

periodo y en los mismos tramos de edad, encontramos que el tramo de menos

de 31 años es más frecuente en todos los años del periodo50 aunque disminuye

en frecuencia año a año a diferencia del resto de tramos que aumenta en

meseta ascendente.

47 Tora Rocamora I. et al. Duración de los episodios de Incapacidad temporal por contingencia común según regiones sanitarias en Cataluña. Rev. Esp. Salud Pública. 2010;84(1):61-69

48 Mauro Brigeiro. Envejecimiento exitoso y tercer edad. Problemas y retos para la promoción de la salud. Investigación y Educación en Enfermeria.2005;23 (1):102-109

49 Guijarro J.L.. Las Enfermedades en la Ancianidad. Anales Sis. San. Navarra. 199;2 (1):85-94

50 Instituto Nacional de Estadística (internet). Madrid. Agosto 2015. Disponible en: www.ine.es/welcomo.shtml

Page 80: Modelo predictivo de duración de periodos de incapacidad ...

80

La existencia de otra patología coexistente con la causa principal de

diagnóstico aumenta la duración de los procesos. En la mayoría de la

bibliografía revisada no se incluye la existencia o no de más de un diagnóstico

en los análisis realizados. Cabanillas J.L.51 introduce esta variable a través del

índice de Comorbilidad de Charlson52 que coincide con nuestro estudio al

definir la comorbilidad como variable predictora de la duración de los procesos.

Llama la atención en los procesos estudiados que en los diagnósticos

relacionados con patología infecciosa es donde más influye el hecho de tener o

no otro diagnóstico. Esto puede estar causado por la influencia del efecto de

este tipo de patologías sobre el estado general del individuo haciendo que la

existencia de otro diagnóstico tenga mayor repercusión sobra la capacidad de

recuperación. No hemos encontrado bibliografía que trate este aspecto.

Coincidiendo con nuestro trabajo tenemos muchos estudios (Álvarez E.,

Catalina C., Benavides F. G., etc.) que afirman que el hecho de tener o no

tener descendencia influye y es determinante en la duración de la IT. Es

importante destacar que al segregar por sexo el hecho de tener descendencia

alarga más la duración en el caso de las mujeres. La razón de este

comportamiento cabe entender que obedece a varias circunstancias como,

entre otras, la atribución histórica por un lado del cuidado materno de los hijos y

la responsabilidad de la salud familiar por parte de la mujer como exponen

Pezo M.C.53 y Hernandez I.54

La provincia de origen tiene también importancia en nuestro modelo predictivo.

En otros estudios como los ya mencionados de Álvarez E. (2005), F.G.

Benavides (2007) y Villaplana M. (2013) se pone de manifiesto. En el primer

51 Cabanillas Moruno J.L. et al. Tiempos óptimos personalizados en Incapacidad temporal. Consejería de salud y Bienestar social de la Junta de Andalucía. Sevilla. 2012.

52 Charlson M.A. et al. A new Method of Clasifying cognosis comorbidity in longitudinal studies, development and validation. J chronics dis.1987:40;373-83

53 Pezo Silva María Concepción, Souza Praça Neide de, Costa Stefanelli Maguida. La mujer responsable de la salud de la familia: Constatando la universalidad cultural del cuidado. Index Enferm [revista en la Internet]. 2004 Nov [citado 2015 Jul 30] ; 13(46): 13-17. Disponible en: http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1132-12962004000200003&lng=es.

54 Hernández Tezoquipa I. El cuidado a la salud en el ámbito doméstico. Rev. Saude Pública.2001;35 (5):443-50

Page 81: Modelo predictivo de duración de periodos de incapacidad ...

81

estudio se hace referencia al origen rural del proceso como explicativo de

mayor duración, hecho que está en concordancia con nuestro trabajo aunque

no se haya estudiado específicamente de esta manera. González F.J.55 expone

igualmente en su estudio similares resultados. En el segundo caso la

importancia que se le da a la provincia es menor que en nuestro estudio, esta

diferencia puede estar motivada por la agrupación previa por provincias de

características similares que realizamos. Las condiciones de accesibilidad al

sistema sanitario pueden influir en este aspecto sin olvidar otros determinantes

como la mayor añosidad de los colectivos del medio rural. Al igual que

Corrales56 el hecho de esta diferencia de duraciones obedece a múltiples

factores que bien podían ser objeto de un estudio más pormenorizado.

Al igual que Villaplana M. (2013) encontramos que el hecho de tener un trabajo

a tiempo completo alarga la duración media de los procesos en similar medida

en ambos estudios. Para explicar esta diferencia habría que tener en cuenta la

existencia de más factores como la precariedad laboral de los contratos a

tiempo parcial, las modificaciones de la Ley de Reforma Laboral y el efecto de

la crisis en los diferentes tipos de contrato según sean a tiempo completo o

parcial.

Los procesos que son recaída de un episodio previo de IT tienen menor

duración que los que no lo tienen, salvo en el caso de la hernia inguinal que por

su naturaleza quirúrgica presentan una posibilidad de recaída reducida y en los

casos de complicaciones del embarazo condicionados por las fechas de parto

que implican alta en el proceso de incapacidad y nueva baja por maternidad,

encontrando por tanto un sesgo es la duración.

El estado civil del trabajador también muestra diferencias en las duraciones que

concuerda con otros estudios, Catalina C. (2011), Noceda J.57, Bassols A.58 y

55 González-Barcala F.G. et al. Determinantes de la duración de la incapacidad temporal y la vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria. 2006;37 (8);431-8

56 Corrales H. et al. La duración de las bajas por accidente laboral en España ¿Se justifican las diferencias entre comunidades autónomas?. Revista de economía laboral. 2008;5:73-98

57 Noceda J.J. Características del dolor Osteomuscular crónico en paciente de Atención Primaria. Resultados de centro rural y otro urbano. Rev. Soc. Ep. Dolor. 2006;5:287-293

Page 82: Modelo predictivo de duración de periodos de incapacidad ...

82

otros. En los trabajadores viudos la razón de su mayor duración probablemente

está ligada a la edad con patología más prevalente y pluripatologia unido a las

ciertas situaciones de menor número de familiares convivientes. El hecho de

estar soltero muestra en nuestro estudio menor tiempo medio en la duración de

los procesos de IT en contraposición al trabajo de Vaquero59 que encuentra

mayor duración en las personas que viven sin pareja. Al segregar por sexo, los

viudos tienen mayor duración que las viudas probablemente relacionado con el

tradicional papel de cuidadora de la familia de la mujer.

La diversidad de estudios y de resultados en relación a esta variable traduce la

complejidad del manejo y de su explicación. Es evidente que existen factores

de difícil mesura que entendemos están en estrecha relación con las

condiciones sociales y de vida de cada individuo.

En cuanto a la interacción del diagnóstico con el sexo coincidimos con

Aurrekoetxea60 en relación a la mayor prevalencia de la patología

osteomuscular en ambos sexos y la mayor duración en mujeres. La mayor

duración de los procesos en mujeres es una constante en todos los estudios

revisados.

En el caso de las mujeres es posible que exista un subregistro de los

diagnósticos de complicaciones del embarazo por deslizamiento hacia los

epígrafes relacionados con patología osteomuscular, es decir, gestantes que

tengan diagnóstico de lumbalgia cuando realmente deberían tener el de Otras

complicaciones específicas del embarazo. En este sentido llama la atención

que en el caso del diagnóstico de lumbociatica es de los pocos que junto a

vértigos tienen mayor duración en el sexo masculino. Esta diferencia puede ser

explicada por las mayores cargas posturales y físicas en los trabajos en

hombres. En el caso de los vértigos aun siendo más frecuente en mujeres dura 58 Bassols A. et al. El dolor de espalda en la población catalana. Prevalencia, características y conducta terapéutica. Gac. Sanit. 2003;17(2):97-107

59 Vaquero M. Factores que influyen en la Incapacidad temporal de larga duración: propuestas de screening y de intervención. Disponible en: http://www.seg-social.es/prdi00/groups/public/documents/binario/168544.pdf.

60 Aurrekoetxea et al. Repetición de los procesos de Incapacidad temporal según diagnóstico. Aten. Primaria. 2009;41(8):439-45

Page 83: Modelo predictivo de duración de periodos de incapacidad ...

83

más en hombres, sería necesario un análisis más profundo para poder explicar

dicha diferencia.

Un problema comentado y que puede afectar a más diagnósticos es la calidad

del registro de los mismos; hemos encontrado estudios como el de Álvarez

Theurer61donde considera aceptable la calidad del diagnóstico de los partes de

baja de IT.

Otra interacción que demostró importancia en el análisis lineal inicial es entre el

diagnóstico y el tipo de pago. La gran diferencia existente puede deberse entre

otras causas a lo que ya mencionada anteriormente prestación refugio, que

entendemos juega el papel más importante en esta variabilidad.

La última variable que explica la duración de los procesos es la interacción

entre el número de episodios de cada proceso y el hábito tabáquico. No se ha

encontrado bibliografía relacionada. Como cabe esperar el hecho de fumar

prolonga la duración media de los procesos, no así la duración mediana.

Observamos un comportamiento no esperado al disminuir las duraciones en los

fumadores a partir del tercer episodio de IT. Este hecho no puede ser explicado

en este análisis debido a no disponer del diagnóstico de cada uno de los

episodios de IT previos de cada proceso ni otros factores relacionados con la

comorbilidad asociada.

En las variables que formaron parte del Anova inicial no se encontraba el sexo

salvo en la interacción con el diagnóstico. En el árbol de decisión final el sexo

tiene importancia como variable independiente aunque en menor medida que

otras.

Para intentar saber el porqué de la mayor duración en mujeres habría que

revisar el papel de la mujer en la sociedad actual y su evolución histórica.

Podemos hablar de una serie de factores que pueden explicar este aumento

como el rol de cuidadora en diferentes ámbitos62, menor accesibilidad al

61 Álvarez Theurer E. Medicina del trabajo y calidad del diagnóstico de los procesos causante de Incapacidad Temporal. Med. Segur. Trab. 2009;55(214):72-79

62 García-Calvente, M. et al. El impacto de cuidar en la salud y la calidad de vida de las mujeres. Gac. Sanit. 2004; 18(2):83-92

Page 84: Modelo predictivo de duración de periodos de incapacidad ...

84

mercado laboral con más precariedad, situaciones de doble jornada de trabajo,

es decir, la de la actividad profesional específica y la relacionada con la unidad

familiar63 y otras desigualdades sociales que hacen que la mujer esté en peor

situación de salud que el hombre64.

63 García, Y. La dualidad del rol de la mujer trabajadora. Colegio Oficial de Psicólogos. Madrid. 1990

64 Borrel C. et al. La Salud pública desde la perspectiva del género y clase social.2004:18(1):2-6

Page 85: Modelo predictivo de duración de periodos de incapacidad ...

85

6. CONCLUSIONES

El análisis de las frecuencias de las variables estudiadas y la capacidad de

explicación de la varianza de la duración de los procesos ha permitido

identificar el perfil del trabajador en baja por incapacidad temporal.

Las variables que más influyen en el tiempo de duración de los procesos de

incapacidad temporal son el diagnóstico, la cuenta, el tipo de pago, la

ocupación, la edad, la existencia de codiagnóstico, el hecho de tener o no

descendencia, la provincia, el tipo de contrato del trabajador, el hecho de tener

recaída o no de un episodio anterior, el estado civil, el tener hábito tabáquico y

el sexo.

La variable que mejor explica la duración de los procesos en incapacidad

temporal es el diagnóstico. Los rangos de duración de los mismos son muy

amplios en algunos casos pudiendo atribuirse a falta de cambio de diagnóstico

final respecto al inicial y la calidad de la codificación de los mismos.

El tipo de pago de cada proceso y la cuenta son la segunda y tercera variable

respectivamente que mejor explican la duración. Esto se puede explicar por las

repercusiones socioeconómicas que tiene el alta en los dos tipos de pago y

cuenta quedando en algunas situaciones el trabajador sin ingresos, una vez

finalice su periodo de incapacidad temporal en los casos de pago directo y

cuenta propia que cesan actividad. Esto condiciona en parte la duración de

cada diagnóstico en función de un tipo de pago u otro.

La ocupación también influye en la duración de los procesos habiendo relación

entre el tipo de ocupación y las cargas propias de cada una.

La edad incrementa la duración de los procesos a medida que aumenta. Este

efecto va en relación con el deterioro psicofísico progresivo propio del

Page 86: Modelo predictivo de duración de periodos de incapacidad ...

86

envejecimiento, que hace que aumenten los periodos de recuperación y a la

vez el efecto negativo de la aparición de nuevas patologías ligadas a la edad.

La existencia de otro diagnóstico tiene un efecto de incremento en la duración

como no podía ser de otra forma. Cabe inferir que esta variable tenga mayor

importancia en la duración pudiendo ser objeto de siguientes estudios.

El estado civil es la cuarta variable en importancia en cuanto a explicar la

duración de los procesos. Parece haber una relación entre la mayor duración

en viudos y divorciados, tanto hombres como mujeres, y las intercurrentes

dificultades sociales que pueden incidir en estos colectivos. Asimismo el hecho

de tener descendencia alarga la duración probablemente relacionado con la

atención y cumplimiento de las necesidades y responsabilidades inherentes a

la familia y descendencia.

El hecho de residir en una u otra provincia tiene un efecto sobre la duración

que parece ir más en relación con las diferencias en cuanto a la accesibilidad al

sistema sanitario entre el medio rural y urbano.

De forma genérica los procesos de incapacidad temporal de trabajadores con

contrato a tiempo completo tiene mayor duración que los de tiempo parcial.

Los procesos que son recaída de un episodio previo tienen menor duración

probablemente relacionado con el alta precoz del primer episodio.

La duración de los procesos es mayor en el sexo femenino en todos los

diagnósticos.

La variabilidad de la duración de los procesos de incapacidad temporal tiene un

componente multifactorial que implica un hándicap importante a la hora de

realizar una predicción de la misma. Una aproximación válida para este fin se

consigue a través de un árbol de decisión que identifica duraciones mayores o

menores de 15 días teniendo en cuenta el diagnóstico, el tipo de pago, la

cuenta, el estado civil, la existencia o no de descendencia, la existencia o no de

codiagnósticos, la ocupación, la edad, la provincia de origen, la existencia o no

de hábito tabáquico, el sexo y el considerar recaída o no de episodio anterior.

Page 87: Modelo predictivo de duración de periodos de incapacidad ...

87

Para conseguir una predicción más precisa sería necesario disponer de más

variables no contempladas en este estudio que complementaran los resultados

actuales pudiendo ser objeto de trabajos posteriores.

El árbol de decisión obtenido es una herramienta útil a efectos de la gestión de

la incapacidad temporal en el sistema público de salud permitiendo la

planificación y distribución de recursos utilizados en esta prestación. Disponer

de un modelo predictivo de la duración de la incapacidad temporal en los

procesos derivados de la enfermedad común, mejora la toma de decisiones en

todo lo relacionado con la gestión de esta prestación al poder estimar la

duración de cada proceso. Esto permite conocer el impacto asistencial y

económico derivado de los mismos y consecuentemente desarrollar una

planificación estratégica global ajustada a la realidad, sabiendo en el momento

de producirse y dependiendo de las variables utilizadas, la duración estimada

para cada uno de ellos.

Page 88: Modelo predictivo de duración de periodos de incapacidad ...

88

7. BIBLIOGRAFIA

• Aguado Díaz, Antonio León. Historia de las Deficiencias. Colección Tesis y

Praxis. Escuela Libre Editorial, Fundación ONCE. Madrid, España, 1993.

• Ahan H. Log-gamma regression modeling through regression tree,

Communications in Statistics, Theory an methods. Arkansas: National

center for toxicology Research, Food and Drug Administration; 1996

• Alavinia S.M. Determinats of works ability and its predictive value for

diasability. Occupational Medicine. 2009;59:32-37

• Álvarez Theurer et al. Modelo Predictivo de la duración de Incapacidad

temporal por Lumbalgia. Factores determinantes. 2005;14(3):10-17

• Álvarez Theurer E. Medicina del trabajo y calidad del diagnóstico de los

procesos causante de Incapacidad Temporal. Med. Segur. Trab.

2009;55(214):72-79

• Álvarez Theurer E. et al. Analisis de la duración de los periodos de

incapacidad temporal de los procesos de Andalucia. Factores asociados.

Aten. Primaria:2009;41 (7):387-393

• Allen Cheadle et al. Factor influencing the Duration of Work.Related

Disability: A Population Based Sutdy of Washington State Workers

Compensation. American Journal of Public health. 1994; 84(2):194

• Arrina, A. El concepto de Exclusión en la Política Social. Trabajo social Hoy.

2002;34:47-46

• Aurrekoetxea et al. Repetición de lso procesos de Incapacidad temporal

según diagnóstico. Aten. Primaria. 2009;41(8):439-45

• Bayona X. et al. Variables que influyen en la resolución de una Incapacidad

Temporal por contingencia comunes de muy larga duración. Arch. Prev.

Riesgos Labor. 2004;7(2):64-69

• Barceló M.A. Modelos Marginales y Condicionales en el Análisis de

Supervivencia Multivariante. Gac. Sanit. 2002;16 (2):59-68

Page 89: Modelo predictivo de duración de periodos de incapacidad ...

89

• Bassols A. et al. El dolor de espalda en la población catalana. Prevalencia,

características y conducta terapéutica. Gac. Sanit. 2003;17(2):97-107

• Benavides F.G..Ocuppational categories and sickness absence certified as

attributable to comon disease. European journal of Public Health. 2003:13

(1);51-55.

• Benavides F.G. et al. Reincorporación al trabajo después de un episodio de

Incapacidad Temporal por contingencia común: Papel de la edad, el sexo, la

actividad económica y la comunidad autónoma. Rev. Esp. Salud Pública.

2007;81(2):183-190

• Benavides F.G. et al. Evaluación de la gestión de los casos de Incapacidad

Temporal por contingencia común de más de 15 días en Cataluña. Gac.

Sanit. 2010; 24(3):215-219

• Borrel C. et al. La Salud pública desde la perspectiva del género y clase

social.2004:18(1):2-6

• Cabanillas J.L. et al. Tiempos óptimos personalizados en Incapacidad

temporal. Consejeria de Salud y Bienestar Social de la Junta de Andalucia.

Sevilla;2012

• Castejón J. et al. La Incapacitat Laboral per Coningencias Comunes en

Catalunya. Barcelona: Consell de Treball, Economic i Social de Catalunya.

2003

• Catalina C. et al. Predictores de la duración de Incapacidad Temporal por

Contingencias comunes en los Trastornos de Ansiedad. Gaceta Sanitaria.

2011;27(1):40-46

• Cermi. (Internet). Madrid: Grupo Editorial Cinca; 2008 (citado 28 agosto

2013).Disponibleen:http://www.cermi.es/esES/ColeccionesCermi/Cermi.es/L

ists/Coleccion/Attachments/60/Laimagensocialdelaspersonascondiscapacid

ad.pdf

• Charlson M.A. et al. A new Method of Clasifying cognosis comorbidity in

longitudinal studies, development and validation. J chronics

dis.1987:40;373-83

• Corrales H. et al. La duración de las bajas por accidente laboral en España

¿Se justifican las diferencias entre comunidades autónomas?.Revsita de

economía laboral. 2008;5:73-98

Page 90: Modelo predictivo de duración de periodos de incapacidad ...

90

• Datosmacro (internet). Madrid. Abril 2015 (citado el 5 de mayo de 2015).

Disponible en: http://www.datosmacro.com/pib/espana

• Delclos J. et al. Duración de la Incapacidad temporal por contingencia

común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-

187

• Everitt B., Horton T., An Introduction to Applied Multivariante Analysis with

R. Londres: Springer Science+Business Media; 2011.

• Freund, Y. and Schapire, R. A decision-theoretic generalization of online

learning and an application to boosting. Journal of Computer and System

Sciences. 1997: 55;119-139.

• García Álvarez, G. Conceptos básicos en incapacidad temporal. Jano.

2003;65(1495):1770-1773

• García-Calvente, M. et al. El impacto de cuidar en la salud y la calidad de

vida de las mujeres. Gac. Sanit. 2004; 18(2):83-92

• García, Y. La dualidad del rol de la mujer trabajadora. Colegio Oficial de

Psicólogos. Madrid. 1990

• González Barcala F.J. et al. Determinantes de la Duración de la Incapacidad

temporal y vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria.

2006;37(8):431-8

• Guerrero F. Salud. Enfermedad y Muerte: Lecturas desde la antropología

Sociocultural. Revista Mad.2004;10:1

• Guijarro J.L.. Las Enfermedades en la Ancianidad. Anales Sis. San.

Navarra. 199;2 (1):85-94

• Hastie T., Tibshirani R., Friedman J. The elements of Statistical Learning. 2ª

Ed. California: Springer; 2008

• Hernández Tezoquipa I. El cuidado a la salud en el ámbito doméstico. Rev.

Saude Pública.2001;35 (5):443-50

• Hosmer D.W. &Lemeshow S..Applied Logistic Regression. 2ª ed. New York

.Willey; 1989

• Inzua Canales, Victor. “Una conciencia histórica y la discapacidad”. Revista

trabajo social Nueva Época.2001; 3: 77

• Isladelcofre (internet). 2013 (citado21 de agosto 2013). Disponible en:

http://www.isladelcofre.com/01normas.htm

Page 91: Modelo predictivo de duración de periodos de incapacidad ...

91

• James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical

Learning. Londres: Springer; 2013

• Laplantin F. Antropología de la Enfermedad. Paris:Editions Payot;1965

• Mauro Brigeiro. Envejecimiento exitoso y tercer edad. Problemas y retos

para la promoción de la salud. Investigación y Educación en

Enfermeria.2005;23 (1):102-109

• Noceda J.J. Características del dolor Osteomuscular crónico en paciente de

Atención Primaria. Resultados de centro rural y otro urbano. Rev. Soc. Ep.

Dolor. 2006;5:287-293

• Pezo Silva María Concepción, Souza Praça Neide de, Costa Stefanelli

Maguida. La mujer responsable de la salud de la familia: Constatando la

universalidad cultural del cuidado. Index Enferm [revista en la Internet].

2004 Nov [citado 2015 Jul 30]; 13(46): 13-17. Disponible en:

http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1132-

12962004000200003&lng=es.

• Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regresion Analysis. 2ª

Ed. New York: Springer; 1998

• Rivas P. Salud Mental e incapacidad Temporal en población laboral de

Cataluña. Arch. Prev. Riesgos Labor. 2008;11(2):81-86

• Royo-Bordonada M.A. La duración de la Incapacidad Laboral y sus factores

asociados. Gac. Sanit. 1999;13(3):177-184

• Santamaria P. et al. Prevalencia de Simulación en Incapacidad Temporal:

Percepción de los profesionales de la Salud. Clínica y Salud. 2013;24:139-

151

• Tora Rocamora I. et al. Duración de los episodios de Incapacidad temporal

por contingencia común según regiones sanitarias en Cataluña. Rev. Esp.

Salud Pública. 2010;84(1):61-69

• Seg-social:Anexo al informe económico financiero. Presupuestos ejercicio

2012 (internet). Madrid: Seguridad Social; 2012 (citado el 24 de julio 2013 ).

Disponible en: http://www.seg-social.es/prdi00/groups/public/ documentos/

binario/169364.pdf

• Seg-social (internet). Madrid: Seguridad Social; 2015 (citado el 24 de julio

2013). Disponible en :http://www.segsocial.es/Internet_1/ Estadística/Est/

Page 92: Modelo predictivo de duración de periodos de incapacidad ...

92

Otras_Prestaciones_de_la_Seguridad_Social/Incapacidad_Temporal/index.

htm

• Van Belle G., Fisher L.D., Heagerty P.J., Lumley T. Bioestadistics. A

methodology for the Health Sciences. 2ª ed. Wiley ;2004

• Vaquero M. Factores que influyen en la Incapacidad temporal de larga

duración: propuestas de secreening y de intervención. Disponible en:

http://www.segsocial.es/prdi00/groups/public/documents/binario/168544.pdf.

• Villaplana García M.A. .El Absentismo laboral por Incapacidad Temporal

derivada de Contingencia Comunes en el periodo 2005-2010. Tesis

Doctoral. Universidad de Murcia. 2012

• Villaplana M. Grado de efecto de las variables sociodemográficas, laborales,

organizativas y del entorno en la duración de la Incapacidad Temporal por

contingencias comunes en España. Aten. Primaria. 2015;47(2):90-98

Page 93: Modelo predictivo de duración de periodos de incapacidad ...

93

8. ANEXOS

Page 94: Modelo predictivo de duración de periodos de incapacidad ...

94

ANEXO I. Documento de autorización de Ibermutuamur para el

análisis de los datos

Page 95: Modelo predictivo de duración de periodos de incapacidad ...

95

Page 96: Modelo predictivo de duración de periodos de incapacidad ...

96

Page 97: Modelo predictivo de duración de periodos de incapacidad ...

97

Page 98: Modelo predictivo de duración de periodos de incapacidad ...

98

Page 99: Modelo predictivo de duración de periodos de incapacidad ...

99

ANEXO II. Distribución de diagnósticos por epígrafe

EPIGRAFEGASTROENTERITIS 009.0 009.1 009.2LUMBOCIATICA 722.10 724.3RESFRIADO COMUN 465 460

OTRAS GASTROENTERITIS Y COLITIS NO INFECCIOSAS

558 558.9

ANSIEDAD 300.0 300.09 293.84 300.02 300.00ESGUINCE TOBILLO 845.00 845.0BRONQUITIS 466 466.0MIGRAÑA 346.9 346 346.90 346.1 346.10 346.00DEPRESION 311 300.4LUMBALGIA 724.2FARINGITIS AGUDA 462GRIPE 487CERVICALGIA 723.1AMIGDALITIS AGUDA 463ANGINA ESTREPTOCOCICA

034.0

VERTIGO Y MAREOS 780.4COLICO RENAL 788.0GRIPE CON OTRAS MANIFESTACIONES RESPIRATORIAS

487.1

AMENAZA DE ABORTO 640

HERNIA INGUINAL 550

ESGUINCE CERVICAL 847

DORSALGIA 724.1DIARREA 787.9SINDROME DEL TUNEL CARPIANO

354.0

OTRAS COMPLICACIONES ESPECIFICAS DEL EMBARAZO

646.8

CEFALEA 784.0

BRONQUITIS NO AGUDA NO CRONICA

490

REACCION DE ADAPTACION

309

MENISCOPATIA INTERNA 836.0

DIAGNOSTICOS INCLUÍDOS

Page 100: Modelo predictivo de duración de periodos de incapacidad ...

100

ANEXO III. Algoritmo del árbol de decisión del mode lo

Page 101: Modelo predictivo de duración de periodos de incapacidad ...

Nodo 0

Categoría % n

69,3 76691<1530,7 34022>15

Total 100,0 110713

dIAGNOSTICOMejora=0,163

Real15

Nodo 1

Categoría % n

36,0 16821<1564,0 29946>15

Total 42,2 46767

PAGOMejora=0,018

LUMBALGIA; LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; ESGUINCE TOBILLO; AMENAZA DE ABORTO; DEPRESION; HERNIA INGUINAL; ESGUINCE CERVICAL; DORSALGIA; TUNEL CARPIANO; OTRAS COMPLIC. ESP EMBARAZO; REACCIÓN ADAPTACIÓN; MENISCOPATIA INTERNA

Nodo 2

Categoría % n

93,6 59870<156,4 4076>15

Total 57,8 63946

PAGOMejora=0,007

GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; BRONQUITIS; ANGINA STRP; VERTIGO Y MAREOS; COLICO RENAL; GRIPE OTRAS MANIFEST RESP; DIARREA; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA; MIGRAÑA; AMIGDALITIS AGUDA

Nodo 3

Categoría % n

43,0 16249<1557,0 21500>15

Total 34,1 37749

dIAGNOSTICOMejora=0,013

DELEGADO

Nodo 4

Categoría % n

6,3 572<1593,7 8446>15

Total 8,1 9018

DIRECTO

Nodo 5

Categoría % n

94,8 59420<155,2 3276>15

Total 56,6 62696

dIAGNOSTICOMejora=0,004

DELEGADO

Nodo 6

Categoría % n

36,0 450<1564,0 800>15

Total 1,1 1250

dIAGNOSTICOMejora=0,001

DIRECTO

Nodo 7

Categoría % n

49,4 15075<1550,6 15418>15

Total 27,5 30493

ECIVILMejora=0,007

LUMBALGIA; LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; ESGUINCE TOBILLO; DEPRESION; DORSALGIA

Nodo 8

Categoría % n

16,2 1174<1583,8 6082>15

Total 6,6 7256

AMENAZA DE ABORTO; HERNIA INGUINAL; ESGUINCE CERVICAL; TUNEL CARPIANO; OTRAS COMPLIC. ESP EMBARAZO; REACCIÓN ADAPTACIÓN; MENISCOPATIA INTERNA

Nodo 9

Categoría % n

81,2 8206<1518,8 1896>15

Total 9,1 10102

codiag dicoMejora=0,001

BRONQUITIS; VERTIGO Y MAREOS; COLICO RENAL; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA

Nodo 10

Categoría % n

97,4 51214<152,6 1380>15

Total 47,5 52594

codiag dicoMejora=0,001

GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; ANGINA STRP; GRIPE OTRAS MANIFEST RESP; DIARREA; MIGRAÑA; AMIGDALITIS AGUDA

Nodo 11

Categoría % n

15,4 111<1584,6 612>15

Total 0,7 723

BRONQUITIS; VERTIGO Y MAREOS; COLICO RENAL; DIARREA; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA; MIGRAÑA

Nodo 12

Categoría % n

64,3 339<1535,7 188>15

Total 0,5 527

CUENTAMejora=0,000

GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; ANGINA STRP; GRIPE OTRAS MANIFEST RESP; AMIGDALITIS AGUDA

Nodo 13

Categoría % n

57,6 10999<1542,4 8085>15

Total 17,2 19084

codiag dicoMejora=0,002

DESCONOCIDO

Nodo 14

Categoría % n

35,7 4076<1564,3 7333>15

Total 10,3 11409

dIAGNOSTICOMejora=0,002

CASADO/A; SOLTERO/A; DIVORCIADO/A; PAREJA HECHO; VIUDO/A

Nodo 15

Categoría % n

81,8 8201<1518,2 1822>15

Total 9,1 10023

No

Nodo 16

Categoría % n

6,3 5<1593,7 74>15

Total 0,1 79

Si

Nodo 17

Categoría % n

97,4 51207<152,6 1344>15

Total 47,5 52551

No

Nodo 18

Categoría % n

16,3 7<1583,7 36>15

Total 0,0 43

Si

Nodo 19

Categoría % n

35,9 42<1564,1 75>15

Total 0,1 117

AJENA

Nodo 20

Categoría % n

72,4 297<1527,6 113>15

Total 0,4 410

PROPIA

Nodo 21

Categoría % n

58,4 10989<1541,6 7813>15

Total 17,0 18802

dIAGNOSTICOMejora=0,002

No

Nodo 22

Categoría % n

3,5 10<1596,5 272>15

Total 0,3 282

Si

Nodo 23

Categoría % n

27,8 1726<1572,2 4476>15

Total 5,6 6202

LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; DEPRESION

Nodo 24

Categoría % n

45,1 2350<1554,9 2857>15

Total 4,7 5207

SEXMejora=0,001

LUMBALGIA; ESGUINCE TOBILLO; DORSALGIA

Nodo 25

Categoría % n

49,0 3300<1551,0 3436>15

Total 6,1 6736

OCUPACIONMejora=0,001

LIUMBOCIATICA; ANSIEDAD; DEPRESION

Nodo 26

Categoría % n

63,7 7689<1536,3 4377>15

Total 10,9 12066

SEXMejora=0,001

LUMBALGIA; CERVICALGIA; ESGUINCE TOBILLO; DORSALGIA

Nodo 27

Categoría % n

54,9 1385<1545,1 1138>15

Total 2,3 2523

HIJOSDICOMejora=0,000

H

Nodo 28

Categoría % n

36,0 965<1564,0 1719>15

Total 2,4 2684

M

Nodo 29

Categoría % n

53,4 2687<1546,6 2346>15

Total 4,5 5033

cluster provinciaMejora=0,000

MANUFACTURA, CONSTRUCCION Y MINERIA; 99; AGRICULTURA Y PESCA

Nodo 30

Categoría % n

36,0 613<1564,0 1090>15

Total 1,5 1703

DIRECCION EMPRESAS; OPERADORES Y MONTADORES; TRABAJADORES NO CUALIFICADOS; EMPLEADOS ADMINIISTRATIVOS; TECNICOS Y PROFESIONALES DE APOYO; CIENTIFICOS E INTELECTUALES; SERVICIOS RESTAURACION Y PROTECCION; FUERZAS ARMADAS

Nodo 31

Categoría % n

72,7 4043<1527,3 1515>15

Total 5,0 5558

dIAGNOSTICOMejora=0,001

H

Nodo 32

Categoría % n

56,0 3646<1544,0 2862>15

Total 5,9 6508

cluster provinciaMejora=0,000

M

Nodo 33

Categoría % n

49,6 601<1550,4 611>15

Total 1,1 1212

TRAMEDADMejora=0,000

SI

Nodo 34

Categoría % n

59,8 784<1540,2 527>15

Total 1,2 1311

NO

Nodo 35

Categoría % n

59,7 1794<1540,3 1210>15

Total 2,7 3004

3,0; 4,0

Nodo 36

Categoría % n

44,0 893<1556,0 1136>15

Total 1,8 2029

1,0; 2,0

Nodo 37

Categoría % n

56,5 892<1543,5 688>15

Total 1,4 1580

cluster provinciaMejora=0,000

CERVICALGIA; ESGUINCE TOBILLO

Nodo 38

Categoría % n

79,2 3151<1520,8 827>15

Total 3,6 3978

LUMBALGIA; DORSALGIA

Nodo 39

Categoría % n

61,1 2247<1538,9 1433>15

Total 3,3 3680

3,0; 4,0

Nodo 40

Categoría % n

49,5 1399<1550,5 1429>15

Total 2,6 2828

dIAGNOSTICOMejora=0,000

1,0; 2,0

Nodo 41

Categoría % n

55,3 403<1544,7 326>15

Total 0,7 729

<= 43 - 51

Nodo 42

Categoría % n

41,0 198<1559,0 285>15

Total 0,4 483

> 43 - 51

Nodo 43

Categoría % n

64,3 480<1535,7 267>15

Total 0,7 747

3,0; 4,0

Nodo 44

Categoría % n

49,5 412<1550,5 421>15

Total 0,8 833

dIAGNOSTICOMejora=0,000

1,0; 2,0

Nodo 45

Categoría % n

47,1 1154<1552,9 1294>15

Total 2,2 2448

TRAMEDADMejora=0,000

LUMBALGIA; CERVICALGIA

Nodo 46

Categoría % n

64,5 245<1535,5 135>15

Total 0,3 380

ESGUINCE TOBILLO; DORSALGIA

Nodo 47

Categoría % n

41,0 182<1559,0 262>15

Total 0,4 444

CERVICALGIA

Nodo 48

Categoría % n

59,1 230<1540,9 159>15

Total 0,4 389

ESGUINCE TOBILLO

Nodo 49

Categoría % n

44,8 811<1555,2 998>15

Total 1,6 1809

<= 38 - 42

Nodo 50

Categoría % n

53,7 343<1546,3 296>15

Total 0,6 639

> 38 - 42

<15>15