Modelo predictivo de duración de periodos de incapacidad ...
Transcript of Modelo predictivo de duración de periodos de incapacidad ...
1
TESIS DOCTORAL
MODELO PREDICTIVO DE DURACIÓN DE PERIODOS DE INCAPA CIDAD TEMPORAL EN LA ENFERMEDAD COMÚN
César González Ramírez
Departamento de Terapéutica Médico-Quirúrgica
2015
2
TESIS DOCTORAL
MODELO PREDICTIVO DE DURACIÓN DE PERIODOS DE INCAPA CIDAD TEMPORAL EN LA ENFERMEDAD COMÚN
César González Ramírez
Departamento de Terapéutica Médico-Quirúrgica
Conformidad de los Directores
Fdo: Diego Peral Pacheco Fdo: Jesús Montanero Fernández
2015
3
ÍNDICE
LISTA DE TABLAS ......................................................................................... 5
LISTA DE GRÁFICOS .................................................................................... 7
LISTA DE ABREVIATURAS ........................................................................... 8
1. INTRODUCCIÓN ....................................................................................... 10
1.1. Incapacidad Temporal ......................................................................... 14
2. OBJETIVOS ............................................................................................... 21
3. MATERIAL Y MÉTODOS .......................................................................... 22
3.1. Consideraciones previas sobre los datos ............................................ 22
3.2. Variables a considerar y modelo predictivo ......................................... 27
3.2.1. Modelo Lineal y selección de las fuentes de variabilidad a contemplar en lo sucesivo ......................................................................... 27
3.2.2. Estudio comparativo de los diferentes modelos de predicción ..... 34
3.2.2.1. Modelo Lineal ............................................................................ 34
3.2.2.2. Árbol de regresión ..................................................................... 36
3.2.2.3. Modelo de regresión gamma ..................................................... 37
3.2.2.4. Modelo de predicción categórica ............................................... 40
3.2.2.4.1. Categorización de pronósticos lineal y gamma ......................... 40
3.2.2.4.2. Regresión logística binaria ........................................................ 41
3.2.2.4.3. Árbol de decisión ....................................................................... 41
3.2.2.4.4. Método mixto lineal-gamma ...................................................... 44
3.2.2.4.5. Predicción con tres categorías .................................................. 45
3.2.3. Conclusión: modelo predictivo a considerar y variables de interés 46
4. RESULTADOS .......................................................................................... 49
4.1. Diagnóstico ......................................................................................... 50
4.2. Cuenta ................................................................................................. 52
4.3. Pago .................................................................................................... 53
4.4. Ocupación ........................................................................................... 54
4.5. Edad .................................................................................................... 56
4.6. Codiagnóstico ..................................................................................... 58
4.7. Hijos .................................................................................................... 59
4.8. Provincia ............................................................................................. 61
4
4.9. Tipo de contrato .................................................................................. 63
4.10. Recaída ............................................................................................ 64
4.11. Estado civil ....................................................................................... 65
4.12. Interacción diagnóstico - sexo .......................................................... 66
4.13. Interacción diagnóstico - tipo de pago ............................................. 68
4.14. Interacción Número episodio - hábito tabáquico .............................. 72
5. DISCUSIÓN ............................................................................................... 74
6. CONCLUSIONES ...................................................................................... 85
7. BIBLIOGRAFIA .......................................................................................... 88
8. ANEXOS .................................................................................................... 93
ANEXO I. Documento de autorización de Ibermutuamur para el análisis de los datos ........................................................................................................ 94
ANEXO II. Distribución de diagnósticos por epígrafe .................................... 99
ANEXO III. Algoritmo del árbol de decisión del modelo .............................. 100
5
LISTA DE TABLAS
Tabla 3.1: Prueba Anova de los efectos de las variables
Tabla 3.2: Comparativa de los errores cometidos por los modelos lineal,
gamma y mixto.
Tabla 3.3: Resultados de la categorización de los pronósticos de los modelos
lineal y gamma
Tabla 3.4: Sensibilidad del punto de corte 80 días en árbol de decisión
Tabla 3.5: Sintaxis SPSS del algoritmo de decisión
Tabla 4.1: Distribución de las frecuencias de los tramos de duración de los
procesos
Tabla 4.2: Distribución de las frecuencias de los diagnósticos de los procesos
Tabla 4.3: Distribución de la duración de los procesos según diagnóstico
Tabla 4.4: Distribución de la duración de los procesos según la cuenta
Tabla 4.5: Distribución de la duración de los diagnósticos según la cuenta
Tabla 4.6: Distribución de la duración de los diagnósticos según el tipo de pago
Tabla 4.7: Distribución de la duración de los diagnósticos según ocupación (I)
Tabla 4.8: Distribución de la duración de los diagnósticos según ocupación (II)
Tabla 4.9: Distribución de la duración de los procesos según el tramo de edad
Tabla 4.10: Distribución de la duración de los diagnósticos según el tramo de
edad
Tabla 4.11: Evolución de la frecuencia de los tramos de edad en el periodo
2008-2012
Tabla 4.12: Distribución de la duración de los procesos según el codiagnóstico
Tabla 4.13: Distribución de la duración de los procesos según la descendencia
6
Tabla 4.14: Distribución de la duración de los diagnósticos según la
descendencia
Tabla 4.15: Distribución de la duración de los procesos según la provincia de
origen
Tabla 4.16: Distribución de la frecuencia de los tramos de duración según la
provincia de origen
Tabla 4.17: Distribución de la duración de los procesos según el tipo de
contrato
Tabla 4.18: Distribución de la duración de los diagnósticos según el tipo de
contrato
Tabla 4.19: Distribución de la duración de los procesos según la recaída
Tabla 4.20: Distribución de la duración de los procesos según el estado civil
Tabla 4.21: Distribución de la duración de los procesos según el sexo
Tabla 4.22: Distribución de la frecuencia de los tramos de duración según el
sexo
Tabla 4.23: Distribución del genero según el tramo de edad
Tabla 4.24: Distribución de la frecuencia de los diagnósticos según el sexo
Tabla 4.25: Distribución de la duración de los diagnósticos según el tipo de
Pago
Tabla 4.26: Distribución de la frecuencia de los diagnósticos según el tipo de
Pago
Tabla 4.27: Distribución de la duración de los diagnósticos según el hábito
tabáquico
Tabla 4.28: Distribución de la duración de los procesos en función del número
de episodio y del hábito tabáquico
7
LISTA DE GRÁFICOS
Gráfico 1.1: Relación entre el gasto de IT del Sistema y el PIB en el periodo
2007-2012
Gráfico 1.2: Duraciones medias de los periodos de IT del INSS, ISM y
MUCOSS en el periodo 2007-2012
Gráfico 1.3: Tiempos que influyen en el coste de los procesos de IT
Gráfico 3.1: Distribución de las duraciones de los procesos según su frecuencia
Gráfico 3.2: Análisis de los residuos del modelo
Gráfico 3.3: Diagrama de dispersión de los residuos frente a los valores
ajustados
Gráfico 3.4: Diagrama de dispersión de los valores ajustados frente a los
valores del logaritmo
Gráfico 3.5: Histograma de los errores del pronóstico final
Gráfico 3.6: Diagrama de dispersión de los valores predichos frente a los reales
Gráfico 3.7: Distribución de los residuos brutos
Gráfico 3.8: Histograma de los valores pronosticados frente a los reales
Gráfico 3.9: Importancia normalizada de las variables del modelo
Gráfico 4.1: Duraciones medias de los diagnósticos según la ocupación
Gráfico 4.2: Duraciones medias de los diagnósticos según la presencia de
codiagnóstico
Gráfico 4.3: Distribución de los tramos de duración de los procesos según el
tipo de Pago
8
LISTA DE ABREVIATURAS
CNO 04: Clasificación Nacional de Ocupaciones
IT: Incapacidad temporal
INSS: Instituto Nacional de la Seguridad Social
ISM: Instituto Social de la Marina
LGSS: Ley General de la Seguridad Social
MCP: Mínimos Cuadrados Ponderados
MUCOSS: Mutuas colaboradoras con la Seguridad Social
PIB: Producto Interior Bruto
9
AGRADECIMIENTOS
A mi padre, Manolo, y mi madre, Ana, por haberme transmitido los valores
fundamentales de la vida y la importancia del esfuerzo y la dedicación para
conseguir metas y objetivos.
A mi mujer, Carmen, y mi hija, Aitana, por lo que son y lo que representan.
A mis directores de Tesis por su ayuda y colaboración incondicional.
A mi amigo Rafael por apoyarme en mis inquietudes investigadoras.
10
1. INTRODUCCIÓN
El concepto Incapacidad/Discapacidad está presente en la evolución del
hombre a lo largo de su historia.
Desde la Prehistoria (edad de piedra y edad de los metales) en la que la forma
oral era la manera de pasar las tradiciones, enseñanzas y sucesos, tenemos
constancia a través de estudios antropológicos de la existencia de personas
discapacitadas y de instrumentos por ellas utilizadas.
En la “sima de los huesos” de Atapuerca se han encontrado restos de más de
30 individuos que vivieron hace 300.000 años1 . Uno de estos antepasados, el
Homo Hedilbergensis, presentaba un crecimiento anormal de sus huesos que
le afectaba al conducto auditivo y, a consecuencia de esta patología, se deduce
que la sordera era casi inevitable. Por tanto, puede que este individuo sea la
primera persona sorda conocida en la historia.
En restos encontrados en el valle del Neander , en el estado alemán de
Renania, se encontró en los años 50 del pasado siglo al primer Neanderthal,
especie del género Homo que habitó Europa y partes de Asia Occidental desde
hace 230 millones hasta hace 29 millones de años, durante lo que conocemos
como Paleolítico medio. En casi todos los restos óseos de neanderthales
adultos encontrados se observan señales de heridas o enfermedades, entre las
que destacan las articulares degenerativas.
Probablemente estas dolencias estaban provocadas por las duras condiciones
de vida que tenían que soportar.
1 Cermi. (Internet). Madrid: Grupo Editorial Cinca; 2008 (citado 28 agosto 2013).Disponible en:
http://www.cermi.es/esES/ColeccionesCermi/Cermi.es/Lists/Coleccion/Attachments/60/Laimagensocia ldelaspersonascondiscapacidad.pdf
11
Puede que el Neanderthal más célebre de la historia con discapacidad fuera
descubierto en 1908 al Sur de la actual Francia, con una antigüedad de 35.000
a 45.000 años. Se trata de un individuo que vivió entre 50 y 55 años con
padecimiento de artritis que afectaba al cráneo, a la mandíbula, a la columna
vertebral, a la cadera y a los pies. También tenía fracturada una costilla y había
perdido la gran mayoría de sus dientes.
Teniendo en cuenta que la edad media de esta especie rondaba la treintena, es
fácil imaginar que este individuo dependiente necesitará de la ayuda de sus
congéneres para poder sobrevivir en las condiciones de la época. Es posible
que aportara algo a la comunidad desarrollando tareas compatibles con sus
limitaciones, es decir, estaríamos hablando de una capacidad parcial, germen
de las diferentes situaciones de Incapacidad vigentes hoy en día.
Existen diferentes estudios que evidencian que, a pesar de los estereotipos
populares sobre la evolución de las especies, en la prehistoria la vida incluía la
capacidad y voluntad de ayudar a los enfermos crónicos y discapacitados. No
podemos afirmar que esta manera de actuar fuera la habitual, ya que en la
mayoría de las épocas, las enfermedades, los trastornos mentales o cualquier
incapacidad y/o deficiencia eran consideradas como un mal, un tabú o un
castigo de Dios.
En Egipto a las personas con malformaciones se les consideraban especiales y
se encontraban al servicio de los faraones2.
Los hebreos dieron un tratamiento diferente a las personas con limitaciones
pudiendo participar en los asuntos religiosos. El Judaísmo precursor del
cristianismo al elevar la dignidad de la persona humana, hizo que se convirtiera
en deber la atención a las personas con discapacidad.
En Persia y Mesopotamia la discapacidad era considerada como un castigo de
dioses aunque también había posiciones más humanas como las de
Zaratustra, profeta iraní creador del zoroastrismo3.
2 Inzua Canales, Víctor. Una conciencia histórica y la discapacidad. Revista trabajo social Nueva Época.2001; 3: 77
12
En las culturas mesoamericanas4 (Olmecas, Mayas y Aztecas) las personas
discapacitadas eran consideradas divinidades. Esta situación cambiaría
posteriormente a partir del siglo XVI seguramente como consecuencia de la
conquista española. Cabe mencionar como ejemplo el caso de una mujer de
Oxaca que solicita le otorguen una Licencia de Ayuntamiento de la Ciudad de
México para poder exhibir a su hijo discapacitado (enano) con la finalidad de
poder ayudar a su esposo que estaba enfermo en su lecho.
En la Grecia antigua, en su culto a la belleza y a la perfección física, a los
discapacitados los expulsaban de las ciudades o los exterminaban. En Esparta
en el siglo IX antes a.C. las leyes de Licurgo dictaminaban que los recién
nacidos débiles o deformes fueran arrojados desde los alto del monte Taigeto.
Esto cambió tras la reforma de Pericles (499-429 dc) donde se comienza a
atender en centros asistenciales.
En Roma se encontraban actitudes contrapuestas desde infanticidios a
comercio con personas con discapacidad para diversión hasta el
establecimiento de medidas para cuidar a personas con discapacidad y la
creación de hospitales5
En la edad media y posteriormente en el cristianismo, las personas deformes o
discapacitadas seguían siendo objeto de burla y segregación, pero poco a poco
fue cambiando la consideración de estas personas debido en parte al cambio
ideológico más humanista y moral.
En La Cofradía de los Hermanos de la Costa6, que era una asociación de
bucaneros del siglo XVII con centro de operaciones fijado en La Tortuga,
pequeña isla al noroeste de La Española, actual Haití, tenían contemplado la
5 Aguado Díaz, Antonio León. Historia de las Deficiencias. Colección Tesis y Praxis. Madrid.
Escuela Libre Editorial, Fundación ONCE. 1993
6Isladelcofre (internet). 2013 (citado21 de agosto 2013). Disponible en: http://www.isladelcofre com/01normas.htm
13
indemnización a los lisiados en las batallas y abordajes. Llama la atención que
incluso hacían distinciones en cuanto a la indemnización dependiendo se
tratase de la amputación del brazo derecho (600 pesos o seis esclavos) o del
izquierdo (500 pesos o cinco esclavos). No cabe duda que es la antesala de las
actuales prestaciones por incapacidad temporal o permanente.
Posteriormente en la edad moderna es más patente el cambio y el tratamiento
hacia los discapacitados y enfermos, pasando a reconocer la responsabilidad
de la sociedad hacia este colectivo.
La evolución histórica de la discapacidad como hemos visto tiene varios
enfoques. En primer lugar, podemos hablar de un enfoque mágico-religioso de
las culturas antiguas con actitud social mayoritariamente de rechazo e incluso
muerte. Sigue con un enfoque técnico y secularizado, entendiendo la
discapacidad como resultado de fenómenos naturales que requieren terapia
adecuada al igual que otras enfermedades, caracterizándose socialmente por
la reclusión y cuidados para los necesitados.
Posteriormente a finales del Siglo XIX y segunda guerra mundial es claro el
enfoque médico y asistencial con creación de centros especiales de educación
y atención que inevitablemente llevarían a estigmas de discriminación social y
laboral.
Por último desde la segunda mitad del siglo XX la prevención y rehabilitación
son claves para conseguir la reinserción comunitaria de los discapacitados.
El termino discapacidad según la OMS es un término que abarca las
deficiencias, las limitaciones de la actividad y las restricciones de la
participación. Las deficiencias son problemas que afectan a una estructura o
función corporal; las limitaciones de la actividad son dificultades para ejecutar
acciones o tareas, y las restricciones de la participación son problemas para
participar en situaciones vitales
Por consiguiente, la discapacidad es un fenómeno complejo que refleja una
interacción entre las características del organismo humano y las características
de la sociedad y del medioambiente en el que vive.
14
Esto lleva a que la discapacidad es el resultado de la condición de la salud de
cada individuo más sus factores personales y ambientales, es decir, la
interacción entre las limitaciones humanas y el medio en el que se encuentre.
Este medio se trata del medio social, que a su vez se segrega en otros estratos
como el laboral, personal, etc.
1.1. Incapacidad Temporal
Hasta ahora hemos hablado de manera genérica del término discapacidad. El
tema que nos trata, la Incapacidad Laboral (temporal), sigue los mismo
patrones en cuanto su génesis y lleva asociado la interacción de los mismos
factores.
La discapacidad como tal lleva implícito un carácter permanente, el individuo no
vuelve a recuperar las funciones perdidas salvo avance médico importante. En
la incapacidad temporal (IT), el individuo va a presentar una serie de
limitaciones funcionales, bien sean físicas o psíquicas, que le van a impedir
temporalmente el desarrollo de sus actividades laborales habituales y/o
actividades de la vida diaria.
Las limitaciones que va a condicionar una situación de incapacidad o
discapacidad son fruto de la pérdida de salud que sufra el individuo. El término
enfermedad opera más como un hecho científico. Para entender mejor el
concepto de IT, sería más correcto utilizar el término de dolencia, que desde un
punto de vista antropológico sería la condición de falta de salud de un individuo
o población.
Esta condición de falta o ausencia de salud no necesariamente implica el
desarrollo de una enfermedad.
No podemos olvidar la influencia de la diversidad cultural en la percepción de la
salud y subsidiariamente de la enfermedad.
La falta o ausencia de salud determina las limitaciones que tendrá el individuo
para desarrollar sus actividades. Estas las podemos dividir en dos grandes
bloques, personales y laborales.
15
Dentro de las personales incluimos todas aquellas actividades o tareas que
pertenecen a la parcela personal y social, así como su interacción. El bloque
laboral sin embargo atañe exclusivamente a la actividad o desempeños que
realiza el individuo en su trabajo.
El concepto de Incapacidad temporal en relación con el trabajo redimensiona el
concepto inicial, haciendo que aparezcan connotaciones económicas y de otras
índoles en su tratamiento.
En España desde la Ley de la seguridad Social, de 21 de abril de 1966 y el RD
3158/1966 de 23 de diciembre, por el que se aprueba el Reglamento General
que determina la cuantía de las prestaciones económicas del Régimen General
Seguridad Social y las condiciones para el derecho a las mimas, los cambios
normativos en la regulación de la IT han sido numerosos.
El Capítulo IV del Real Decreto Legislativo 1/1994, de 20 de junio, por el que se
aprueba el Texto Refundido de la Ley General de la Seguridad Social define el
concepto de IT como aquella situación en la que se encuentra el trabajador
que, por causa de enfermedad común o accidente no laboral, esté impedido
para el trabajo y necesite la asistencia sanitaria de la Seguridad Social.
La IT estaría definida por la situación de enfermedad, la necesidad de
tratamiento por los Servicios públicos de Salud y la incapacidad para
desarrollar su actividad laboral habitual.
Cuando la IT tiene origen exclusivamente laboral, es decir, producida por
accidentes laborales o enfermedades profesionales hablamos de IT por
Contingencia Profesional. De mismo modo cuando la IT es debida a
enfermedad común o accidente no laboral hablamos de IT por Contingencia
Común.
La declaración de la situación de IT se realiza a través del parte médico de baja
laboral expedido por el médico del Servicio público de salud o de la Mutua
colaboradora con la seguridad Social (Mutua de Accidente de trabajo y
Enfermedad Profesional de la Seguridad Social antes de la Ley 35/2014). La
emisión de dicho parte lleva asociado el reconocimiento del derecho a la
prestación por IT.
16
• Hay que cumplir unos requisitos mínimos para poder percibir dicha
prestación (art. 130 LGSS):
• Recibir asistencia sanitaria
• Estar afiliado de la Seguridad Social y estar en situación de alta o
asimilada
• Tener cubierto un periodo mínimo de cotización que será de 180 días en
los cinco años antes del hecho causante en el caso de la contingencia
común. En el caso de contingencia profesional no es necesario dicho
periodo.
El elemento clave para la percepción de dicha prestación es la incapacidad
para el desarrollo de la actividad laboral constituyendo la valoración de dicha
incapacidad el principal elemento de control, es decir, para que un persona
tenga derecho a la prestación por IT es necesario que exista un menoscabo
funcional para desarrollar su actividad laboral. Pongamos un ejemplo: Un
teleoperador que sufra un esguince leve de tobillo tendría una patología pero
podría desarrollar su actividad laboral por lo que no le correspondería recibir la
prestación de IT.
La prestación que reciben los trabajadores cuando están en un periodo de IT
varía en función se trate de una u otra contingencia.
En el caso de la contingencia profesional el trabajador percibe el 75% de su
base reguladora7 desde el día 1º del nacimiento del derecho. En el caso de la
contingencia común el trabajador percibe el 60% de la base reguladora8 desde
el 4º al 20º día y el 75% del día 21º en adelante. En la contingencia común la
mutua asume el pago de la prestación a partir del decimoquinto día en el caso
del Régimen General de trabajadores y a partir del tercer día en el caso de los
trabajadores del Régimen General de Trabajadores Autónomos.
7 Se calcula dividiendo la base de cotización del mes anterior entre el número de días que corresponde a dicha cotización. A esto se le sumaría la cotización por horas extraordinarias en el año anterior dividido entre 365 días.
8 Se calcula dividiendo la base de cotización del mes anterior entre 30 días si tiene salario mensual o 28, 29 y 31 si tiene salario diario.
17
Hablar de IT es hablar de un problema con dimensiones sanitarias, sociales y
económicas. El gasto de IT del Sistema (INSS, ISM, MUCOSS) en España9 y la
evolución del Producto Interior Bruto10 (PIB) se ha comportado en el periodo
estudiado como figura en el gráfico 1.1:
Gráfico 1.1. Relación entre el gasto de IT del Sistema y el PIB en el periodo
2007-2012
Se observa un descenso en ambos ítems motivado principalmente por la
situación de crisis económica, a pesar de esto es importante resaltar que el
porcentaje promedio que representa el gasto por IT en relación al PIB se sitúa
en el 0,65%, hecho que hace relevante el disponer de medios y poner en
marcha mecanismos para disminuir dicho coste.
9 Seg-social: Anexo al informe económico financiero. Presupuestos ejercicio 2012 (internet). Madrid: Seguridad Social; 2012 (citado el 24 de julio 2013 ). Disponible en: http://www.seg-social.es/prdi00/groups/public/documents/binario/169364.pdf
10 Datosmacro (internet). Madrid. Abril 2015 (citado el 5 de mayo de 2015). Disponible en: http://www.datosmacro.com/pib/espana
18
La principal línea de ataque para conseguir disminuir el gasto de IT es la
duración media de los procesos de IT. Si atendemos a la contingencia común
hay una tendencia ascendente en la duración media de los procesos de IT en
el Sistema (INSS, MUCOSS e ISM) de 2007 a 2012, según datos del Ministerio
del Ministerio de Empleo y Seguridad Social11.
Al desagregar las duraciones medias de los procesos del sistema según se
trate de procesos del INSS, ISM o procesos de las MUCOSS, tenemos que hay
diferencias bastantes significativas entre las duraciones (gráfico 1.2):
Gráfico 1.2. Duraciones medias de los periodos de IT del INSS, ISM y
MUCOSS en el periodo 2007-2012
11 Seg-social (internet). Madrid: Seguridad Social; 2015 (citado el 24 de julio 2013). Disponible en http://www.segsocial.es/Internet_1/Estadistica/Est/Otras_PrestacionesdelaSeguridadSocial/ Incapacidad_Temporal/index.htm
19
Sin embargo la incidencia de procesos de IT se comporta de manera
descendente en las series estudiadas, mediado en parte por la crisis
económica y la disminución de trabajadores afiliados a la seguridad social.
La duración de un proceso de IT responde a una serie de tiempos que influyen
directamente sobre el coste de cada uno (Gráfico1.3):
Gráfico 1.3. Tiempos que influyen en el coste de los procesos de IT
Los tiempos de gestión administrativa y tiempos de gestión engloban todos los
tiempos intermedios de aquellas tareas no médicas, es decir, emisión de partes
de IT, reconocimiento del derecho a la prestación, citaciones, toma de
decisiones, etc.
Los tiempos de espera asistencial derivan de las listas de espera que haya en
cada comunidad. Por último los tiempos biológicos atañen exclusivamente a la
duración de cada patología y que se verá modificada por las diferentes
variables que influyen en la curación o factores de corrección como veremos
más adelante.
20
La gestión de la IT en España tiene varios actores, por un lado tenemos al
INSS o ISM, por otro lado tenemos a los servicios Médicos de la Inspección
Sanitaria y por último a las MUCOSS.
Actualmente en la gestión de los procesos de IT se inician actuaciones una vez
se ha producido la baja laboral. Existen patrones de incidencia de
determinadas enfermedades en las distintas épocas del año según el
comportamiento observado en serie temporales, como por ejemplo el aumento
de la incidencia de la patología respiratoria de octubre a febrero. Esto permite
plantear medidas generales en relación a la gestión de cada patrón.
Con un modelo predictivo de duración de procesos en IT se podría estimar la
duración de cada proceso a partir de algunas de las posibles variables o
factores que intervienen.
Este tipo de información es de gran ayuda para todos los organismos que
intervengan en la gestión de la IT.
21
2. OBJETIVOS
• Recoger y sistematizar los registros de procesos de incapacidad temporal
del periodo 2008-2012 en España de una Mutua Colaboradora con la
Seguridad Social.
• Conocer el comportamiento de dichos procesos en relación con las
variables de estudio.
• Comparar métodos estadísticos en relación a la predicción de duración la
de incapacidad temporal en la enfermedad común
• Establecer un modelo idóneo de predicción para la duración de procesos de
incapacidad temporal en la enfermedad común.
22
3. MATERIAL Y MÉTODOS
Para el desarrollo de esta tesis se ha utilizado el paquete estadístico SPSS
v19.0, el programa R v3.1, el programa Microsoft Excel 2010, el programa
Microsoft Access 2010 y el editor de texto Microsoft Word 2010.
3.1. Consideraciones previas sobre los datos
La base de datos sobre la que se desarrolla el estudio fue proporcionada por
Ibermutuamur, Mutua de Accidentes de Trabajo y Enfermedades Profesionales
de la seguridad social nº 274. En Anexo I se adjunta la el documento de
autorización para el análisis de los datos.
Se trata de una base anónima con procesos de 1.085.824 pacientes que
hubieran sido alta médica tras un episodio de IT por contingencia común
durante el periodo comprendido del 01/01/2008 al 31/12/2012.
La base inicial constaba de 39 variables de cada uno de los procesos lo que
lleva a un total de 42.347.136 entradas.
Las variables iniciales fueron:
1. Fecha de baja: Indica la fecha en la que el trabajador es baja médica por
IT.
2. Fecha de alta: Indica la fecha en la que el trabajador es alta médica por
IT.
3. Días en baja: Indica número de días en los que el trabajador ha estado
en situación de baja médica. Variable cuantitativa discreta.
4. Sexo: Indica el sexo del trabajador. Variable cualitativa nominal.
5. Edad: Indica la edad en años del trabajador. Variable cuantitativa
discreta.
23
6. Ocupación: Indica la ocupación del trabajador según la Clasificación
Nacional de Ocupaciones del 2004 (C.N.O 04). Variable cualitativa
nominal.
7. Recaída: Indica si el trabajador ha tenido recaída de un episodio previo.
Variable cualitativa nominal.
8. Número de episodio: Indica el número de procesos que ha tenido en
baja en el periodo estudiado. Variable cuantitativa discreta.
9. Tipo de contrato: Indica el tipo de contrato del trabajador según sea
indefinido o de duración determinada, a tiempo completo o parcial.
Variable cualitativa nominal.
10. Provincia: Indica la provincia de residencia del trabajador. Variable
cualitativa nominal.
11. Municipio: Indica el municipio de residencia del trabajador. Variable
cualitativa nominal.
12. Diagnóstico: Indica el diagnóstico principal según la CIE 9 MC que
motiva la baja médica. Variable cualitativa nominal.
13. Codiagnóstico 1-4: Indica los codiagnósticos que tenga cada trabajador.
Variable cualitativa nominal.
14. Base reguladora: Indica la base de cotización diaria de cada trabajador.
Variable cuantitativa continua.
15. Tiempo Baja-Recepción: Indica el tiempo transcurrido entre la fecha de
emisión del parte de baja médica hasta la fecha de recepción de dicho
parte en la Muta. Variable cuantitativa discreta.
16. Tiempo Recepción-Grabación: Indica el tiempo transcurrido entre la
fecha de recepción del parte de baja médica en la mutua hasta la fecha
de grabación de dicho parte. Variable cuantitativa discreta.
17. Cuenta: Indica si el trabajador está afiliado al régimen General de la
Seguridad Social (cuenta ajena) o al Régimen especial de Trabajadores
autónomos (cuenta propia). Variable cualitativa nominal.
18. Pago: Variable cualitativa nominal.
19. Estado Civil: Indica el estado civil de cada trabajador. Variable cualitativa
nominal.
20. Número de hijos: indica el número de hijos de cada trabajador. Variable
cuantitativa discreta.
24
21. Fumador: Indica el hábito tabáquico de cada trabajador. Variable
cualitativa nominal.
22. Bebedor: Indica el hábito alcohólico de cada trabajador. Variable
cualitativa nominal.
23. Antecedentes: Se segrega en 16 variable dicotómicas que son:
Hipertensión, dislipemia, diabetes tipo I, diabetes tipo II, cardiopatía
isquémica, sobrepeso, neoplasia de colon, neoplasia de mama, linfoma,
leucemia, trastorno de ansiedad, enfermedad pulmonar obstructiva
crónica, artrosis, fibromialgia y artritis reumatoide. Variables cualitativas
nominales.
Posteriormente se realizó una recodificación de las variables quedando las
anteriores más:
1. Quintil episodio: Indica el quintil del número de episodio del cada
proceso.
2. LN días baja: Indica el logaritmo neperiano de la duración de cada
proceso.
3. Quintil edad: Indica el quintil de la edad de cada trabajador.
4. Antecedentes: Indica si el trabajador tiene o no antecedentes. Variable
cualitativa nominal.
5. Hijos: Indica si el trabajador tiene o no hijos. Variable cualitativa nominal
6. Quintil base reguladora: Indica el quintil de la base reguladora de cada
proceso.
7. Contrato 1: Indica si el trabajador tiene contrato a tiempo completo o a
tiempo parcial.
8. Contrato 2: Indica si el trabajador tiene contrato indefinido o de duración
determinada.
9. Codiagnóstico: Indica si el proceso tiene o no tiene codiagnóstico.
Variable cualitativa nominal.
10. Numero codiagnóstico: Indica el número de codiagnósticos de cada
proceso. Variable cuantitativa discreta.
11. Codiagnóstico 1: Indica que codiagnóstico tiene cada proceso. Variable
cualitativa nominal.
25
12. Comunidad: Indica la comunidad autónoma de residencia de cada
trabajador. Variable cualitativa nominal.
Finalmente las variables que se tuvieron en cuenta después de la exploración
inicial de datos fueron el diagnóstico, el tipo de cuenta, el tipo de pago, la
ocupación, el tramo de edad de los registros, la existencia o no de
codiagnóstico, el hecho de tener hijos o no, la provincia de origen, el tipo de
contrato, la existencia de recaída previa, el estado civil, el sexo, el número de
episodios previos de IT y el hábito tabáquico.
Desde el punto de vista de método se encontraron algunas limitaciones como:
• Elevado número de diagnósticos de la CIE-9 Mc que implica mucha
variabilidad previa en la codificación y hace imposible incluir todas las
entradas en el modelo.
• Identificación de error en codificación por subregistro. Esto obligó a
eliminar aquellos registros con incongruencia entre duración y
diagnóstico.
• Elevada cantidad de valores perdidos en registro de algunas variables
de procesos que hacían imposible obtener resultados y conclusiones
fiables.
Como criterios de exclusión de casos se definieron los siguientes:
• Diagnósticos con menos de 2500 casos.
• Casos con duración superior a 365 días
• Subregistros por error en codificación.
• Casos en los que lo aparecía diagnóstico codificado.
Posteriormente la base se inicial se redujo a los casos pertenecientes a 47
diagnósticos que se distribuyeron en 29 epígrafes obteniendo finalmente una
base de 370.076 casos. La codificación diagnóstica utilizada es la CIE-9MC, en
Anexo II se muestra la distribución de los 46 diagnósticos en los 29 epígrafes
finales.
26
Desde el punto de vista estadístico se plantearon dos problemas
fundamentales: determinar las fuentes de variabilidad de las que depende la
duración de la baja y proponer un modelo predictivo en consonancia para
pronosticar dicha duración. No obstante, una vez escogido el modelo predictivo
se reconsideró la importancia de las variables seleccionadas en primera
instancia.
Se partió con las ventajas que se derivan de la gran cantidad de información
disponible, tanto en lo relativo al tamaño muestral como al número de variables
explicativas. No obstante y como reverso de la moneda, la gran cantidad de
información conlleva ciertas dificultades de análisis que no se presentan en
estudios más someros.
En primer lugar, el gran tamaño muestral se traduce en resultados significativos
para la gran mayoría de los contrastes de hipótesis que podamos plantearnos,
de ahí que no pudimos contar con una herramienta tan tradicional en la
estadística como es el test de hipótesis a la hora de tomar decisiones. No
obstante, en las últimas décadas, propiciado por el uso del software estadístico
y la necesidad de analizar grandes archivos de datos, se han popularizados un
conjunto de técnicas no paramétricas (es decir, que no suponen modelo alguno
de distribución de los datos, sino que buscan un ajuste a toda costa de las
observaciones, aunque ello implique perder la explicación o interpretación
global del modelo que trasmiten los parámetros), que reciben la denominación
genérica de Minería de Datos y que, a la postre, han tenido en nuestro estudio
un protagonismo superior al de las técnicas paramétricas clásicas.
En segundo lugar, el manejo de una gran cantidad de variables explicativas
puede considerarse un reto desde el punto de vista estadístico que, cuando
todas ellas son de tipo cualitativo, como es nuestro caso, se convierte en un
serio problema, dado que nos impidió abordar nuestro estudio mediante el uso
de algoritmos automáticos de selección de variables que están ideados en
principio para variables numéricas.
Con la intención de no caer en la trampa de convertir nuestro estudio en un
rastreo incierto de modelos predictivos más o menos novedosos, optamos por
fijar como punto de partida el análisis de los datos a través del Modelo Lineal
27
Normal, que constituye el núcleo de la Estadística Paramétrica. Obramos así
con el doble objeto de obtener una idea preliminar (aunque a la postre resultará
muy certera) de la capacidad predictiva de nuestras variables, y de fijar las
fuentes de variabilidad que debemos contemplar en modelos alternativos, dado
que un modelo completo que contemplara todas las posibles interacciones
entre las diferentes variables predictivas sería inviable debido a la enorme
cantidad de parámetros del mismo. A continuación, una vez centrados en dicha
fuentes de variabilidad, procedimos a comparar la validez de todos aquellos
modelos predictivos que juzgamos a priori razonables para nuestros datos,
obteniendo como resultado de la comparativa un modelo de predicción
definitivo. Posteriormente, la importancia de las variables seleccionadas en
primera instancia se volvió a someter a valoración.
3.2. Variables a considerar y modelo predictivo
Una vez definidas las variables dividimos el método estadístico en tres pasos:
3.2.1. Modelo Lineal y selección de las fuentes de variabilidad a
contemplar en lo sucesivo (paso nº1)
Así pues, nuestro primer objetivo era entender qué variables explicativas son
realmente importantes en el pronóstico del tiempo de baja y cómo cuantificar, al
menos en primera instancia, la capacidad predictiva de dichas variables.
El modelo lineal a contemplar en esta fase del estudio debía poseer un número
de parámetros manejable en la práctica. En definitiva, nos enfrentamos a un
laborioso trabajo de ensayo con diferentes combinaciones de factores e
interacciones, buscando el modelo más sencillo posible entre todos aquellos
que proporcionen un buen ajuste a las observaciones.
28
Los diferentes métodos estadísticos deben proporcionar parámetros que
informen del ajuste del modelo a los datos reales, como pueden ser el
coeficiente de correlación lineal múltiple R2 de Pearson, el coeficiente R2
corregido, la devianza, el logaritmo de la verosimilitud, el Criterio de
Información Bayesiano (BIC), el Criterio de Información de Akaike (AIC), o los
pseudocoeficientes R2 de Nagalkerkel y de Cox-Snell, si bien el parámetro que
goza de una interpretación más diáfana desde un punto de vista formal es el
primero de los mencionados: el coeficiente R2 que proporciona el modelo lineal.
No obstante y por lo dicho anteriormente, en nuestro caso deberíamos
empezar prestando atención a algún parámetro que penalice la inclusión de
variables predictoras no esenciales, como por ejemplo el R2 corregido o en el
BIC.
Por ello, el objetivo en esta fase del estudio fue ajustar nuestros datos con un
modelo lineal haciendo uso de diferentes combinaciones de factores e
interacciones, con el objeto de encontrar un alto valor de R2 con el menor grado
de libertad posible o mejor, y para establecer un criterio más objetivo,
maximizar el BIC. No pretendíamos obtener así un modelo definitivo sino
seleccionar los factores e interacciones fundamentales con los que trabajar
tanto en el modelo lineal como en otros posteriores, como el modelo de
regresión gamma, el logístico o el árbol de decisión (modelos de regresión de
Cox12 como en el caso de Barceló13 no han sido contemplados, dado que
estamos interesados en la predicción de la duración del proceso de IT).
Un simple vistazo a la variable respuesta (gráfico nº 3.1), el tiempo en días que
dura la baja, con un pronunciado sesgo positivo, reveló la incapacidad de
ajuste de un modelo lineal normal.
12 Van Belle G., Fisher L.D., Heagerty P.J., Lumley T. Bioestadistics. A methodology for the Health Sciences. 2ª ed. Wiley ;2004
13 Barceló M.A. Modelos Marginales y Condicionales en el Análisis de Supervivencia Multivariante. Gac. Sanit. 2002;16 (2):59-68
29
Gráfico 3.1. Distribución de las duraciones de los procesos según su frecuencia
Efectivamente, cuando se trabaja con variables que expresan tiempos de
espera puede parecer en principio más ortodoxo contemplar modelos
probabilísticos tipo exponencial o, más en general, Gamma14 . No obstante y
por las razones indicadas anteriormente, optamos por una solución muy común
(que a la postre resultará prácticamente equivalente), consistente en ajustar
mediante un modelo lineal normal el logaritmo del tiempo de baja. Pudimos
apreciar que, tras aplicar el logaritmo, el sesgo positivo se reduce
considerablemente, como cabría esperar, aunque persistía una cola de valores
extremos a la derecha. Estamos hablando de un colectivo de individuos cuyos
tiempos de baja eran extremos. Ese colectivo podría entenderse como una
subpoblación que se identificaría fácilmente mediante un análisis clúster 15 .
Pero dicho análisis no deja de ser una partición ad hoc de la muestra estudiada
14 Benavides F.G. et al. Reincorporación al trabajo después de un episodio de Incapacidad Temporal por contingencia común: Papel de la edad, el sexo, la actividad económica y la comunidad autónoma. Rev. Esp. Salud Pública. 2007;81(2):183-190
15 Everitt B., Horton T., An Introduction to Applied Multivariante Analysis with R. Londres: Springer Science+Business Media; 2011.
30
que, en nuestro caso, no correlaciona claramente con ninguna de las variables
explicativas consideradas. Éste es, en esencia, el verdadero problema con el
que nos topamos en nuestro estudio, como detallaremos más adelante.
A pesar de todo, el modelo lineal aplicado al logaritmo logró un ajuste bastante
aceptable en nuestra opinión, tal y como se muestra en el Anova de la tabla nº
3.1.
Tabla 3.1. Prueba Anova de los efectos de las variables
Hemos de especificar que éste fue el modelo, de entre todos los considerados
en una fase inicial de ensayo, que aportó un máximo valor del Criterio de
Información Bayesiano (BIC=1072221) y del R2 corregido. Inicialmente, obtuvo
un coeficiente de correlación lineal múltiple R2=0.600, es decir, que se explica
el 60% de la varianza total del logaritmo de los días de baja si conocemos los
valores de las variables predictivas. Para valorar este parámetro en su justa
medida hemos de tener en cuenta que la varianza viene a ser una media de los
Pruebas de los efectos inter-sujetos b
Variable dependiente:Lndiasbaj
Origen
Suma de
cuadrados tipo
III gl
Media
cuadrática F Sig.
Eta al cuadrado
parcial
Modelo corregido 170104,533a 124 1371,811 2876,552 ,000 ,638
Intersección 23130,433 1 23130,433 48502,245 ,000 ,193
RDGT 16496,023 28 589,144 1235,376 ,000 ,146
CUENTA 831,375 1 831,375 1743,312 ,000 ,009
PAGO 6558,222 1 6558,222 13751,947 ,000 ,064
OCUPACION 105,375 10 10,537 22,096 ,000 ,001
TRAMEDAD 783,383 4 195,846 410,669 ,000 ,008
CODGTdico 1009,214 1 1009,214 2116,223 ,000 ,010
HIJOSDICO 180,592 1 180,592 378,683 ,000 ,002
Rprov 2105,407 3 701,802 1471,611 ,000 ,021
CONTRAT1 78,077 1 78,077 163,720 ,000 ,001
RECAIDA 451,256 1 451,256 946,239 ,000 ,005
RDGT * SEX 787,255 29 27,147 56,924 ,000 ,008
RDGT * PAGO 1943,491 28 69,410 145,547 ,000 ,020
TRAMEPI * FUMADICO 184,262 11 16,751 35,125 ,000 ,002
ECIVIL 693,908 5 138,782 291,012 ,000 ,007
Error 96552,926 202462 ,477
Total 1006380,690 202587
Total corregida 266657,459 202586
a. R cuadrado = ,638 (R cuadrado corregida = ,638)
b. Regresión de mínimos cuadrados ponderados - Ponderada por Ponderación para Lndiasbaj de WLS, MOD_4
PAGONUM** -1,000
31
errores cuadráticos respecto a la estimación, es decir, que penaliza los grandes
errores. Además, se apreció que los individuos que tenían pago delegado
presentaban claramente mayor dispersión, lo cual fue compensado mediante la
técnica de Mínimos Cuadrados Ponderados16 (MCP), es decir, ponderando
inversamente en el modelo según la varianza obtenida en las distintas
categorías de dicha variable, con lo cual el valor de R2 se incrementó a 0.638
(aunque, al tratarse de un Modelo Lineal con MCP, ya no puede interpretarse
como antes de manera literal). El modelo resultante consta de un total de 124
parámetros. Su aptitud viene dada por el alto valor de R2 y porque el hecho de
incluir nuevos factores o interacciones en el modelo no lograría incrementarlo.
Indicar una medida clara de la fiabilidad global del modelo inicial de referencia
(R2=0.638) supone una ventaja frente a otros estudios en los que se proponen
técnicas, en principio interesantes, pero no se aportan medidas sobre la
capacidad predictiva de las mismas. Un valor R2=0.638 mediante un
procedimiento lineal clásico nos informa de una importante capacidad de
predicción en general, aunque también revela ya de entrada una clara
deficiencia a la hora de efectuar una pronóstico exacto. Esta deficiencia podría
ser solventada en principio mediantes métodos de predicción alternativos,
como describiremos en el 2º paso, aunque adelantamos aquí que no fue el
caso.
Valorar el ajuste del modelo únicamente en función de R2 sería incorrecto y nos
vimos obligados a complementarlo con un análisis de los residuos. En el gráfico
3.2 podemos apreciar los residuos brutos y en el gráfico 3.3 los residuos frente
a los valores ajustados.
16 Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regression Analysis. 2ª Ed. New York: Springer; 1998
32
Gráfico 3.2. Análisis de los residuos del modelo
Gráfico 3.3. Diagrama de dispersión de los residuos frente a los valores
ajustados
33
Por último, en el gráfico 3.4 podemos ver los valores ajustados frente a los
valores reales del logaritmo del tiempo de baja.
Gráfico 3.4. Diagrama de dispersión de los valores ajustados frente a los
valores del logaritmo
A grandes rasgos se aprecia un comportamiento bastante satisfactorio. Un
análisis más detallado del gráfico 3.3 puede revelar la presencia de valores
altos de la respuesta no explicados por las variables del modelo. Pero hemos
de recalcar que consideramos aceptable el ajuste logrado por el modelo lineal
normal con MCP para el logaritmo del tiempo.
La propia tabla del Anova (tabla 3.1) nos muestra en su última columna las
estimaciones de los tamaños de los efectos. Estos parámetros, que en rigor
debemos entenderlos como sucedáneos de los coeficientes de correlación
34
parcial propios del análisis de regresión lineal, nos dieron una idea orientativa
del peso de las diferentes fuentes de variabilidad en la variable respuesta.
Cabe destacar en ese sentido, como cabía esperar, la gran influencia del
diagnóstico. También pudimos resaltar una gran importancia del tipo de pago.
3.2.2. Estudio comparativo de los diferentes modelos de
predicción (paso nº2)
Tras determinar las fuentes de variabilidad que se contemplaron en lo sucesivo
pasamos a aplicar diferentes modelos a priori razonables con la idea de
seleccionar el que proporcionase predicciones más fiables. Para evitar el efecto
de sobreajuste propio de cualquier modelo estadístico, en especial los de tipo
no paramétrico, optamos por dividir la muestra en dos partes: un 70% de los
datos (entrenamiento) los utilizamos para elaborar los algoritmos de los
diferentes modelos, que fueron aplicados al 30% restante (validación) para
probar la fiabilidad de las predicciones.
3.2.2.1. Modelo Lineal
El primer modelo a evaluar en la muestra de validación es el lineal17 . En el
apartado anterior aplicamos un modelo lineal con ponderación al logaritmo del
tiempo de baja. Ello implica aplicar dos transformaciones a la variable
respuesta que debemos deshacer si pretendemos efectuar una predicción del
tiempo de baja. En el gráfico 3.5 presentamos un histograma con los errores de
pronóstico final. En la tabla 3.2 se muestra una descriptiva de los mismos.
17 Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regression Analysis. 2ª Ed. New York: Springer; 1998
35
Gráfico 3.5. Histograma de los errores del pronóstico final
En el gráfico 3.6 podemos apreciar una diagrama de dispersión de los valores
predichos frente a los reales, asociado a un coeficiente de correlación de
Pearson r=0.587, aunque esta medida no puede interpretarse adecuadamente
cuando la relación entre las variables no es lineal, como ocurre en nuestro
caso. Se observaron claros desajustes en los individuos con tiempos de baja
muy elevados, que provocaron a su vez desajustes en los individuos con
menores tiempos de baja. Como cabría esperar, la relación entre los rangos
descrita por el coeficiente de correlación de Spearman es más elevada
(rS=0.767). Este coeficiente es más apropiado para describir el comportamiento
de nuestro modelo.
36
Gráfico 3.6. Diagrama de dispersión de los valores predichos frente a los reales
3.2.2.2. Árbol de regresión
Esta alternativa no paramétrica al análisis de la varianza no es de aplicación en
este caso pues, dado que todas las variables predictoras son categóricas y que
la predicción para cada nodo terminal consiste en el valor medio del mismo, si
no imponemos restricciones en la profundidad del árbol podemos considerarlo
equivalente a un modelo factorial completo del análisis de la varianza (modelo
lineal), que no debería aplicarse a la variable tiempo sino a su logaritmo. No
obstante, la variante categórica de este método, el árbol de decisión, tendrá un
papel central en nuestro estudio, como veremos más adelante.
37
3.2.2.3. Modelo de regresión gamma
Como hemos comentado anteriormente, aplicar un modelo de regresión
gamma18 puede resultar en principio más natural que transformar los datos
para forzar la aplicación de un modelo lineal. El primer dilema que se nos
presentó es qué función de enlace debemos considerar: ¿el logaritmo o la
función inversa? Sobre este particular no existe unanimidad de criterios,
aunque el logaritmo es la opción que suele considerarse por defecto. No
obstante, hemos de advertir que en este trabajo hemos ensayado con las dos y
las predicciones resultantes varían de manera casi imperceptible. Mostraremos
aquí únicamente los resultados del modelo gamma con enlace logarítmico (log-
gamma).
Lo más destacable es que los pronósticos basados en el modelo lineal
presentaron una correlación lineal de Pearson r=0.977 con los pronósticos
basados en el modelo log-gamma (con la muestra de validación), es decir,
presentaron un comportamiento muy similar con la salvedad de que el modelo
gamma aportó tiempos de baja sistemáticamente más altos, como queda
patente en la tabla 3.2. En los gráficos 3.7 y 3.8 aparecen el histograma para
los residuos brutos y el diagrama de dispersión de los valores pronosticados
frente a los reales, al cual corresponde coeficiente de correlación de Pearson y
Spearman r=0.600 y rS=0.760, respectivamente.
18 Ahan H. Log-gamma regression modeling through regression tree, Communications in Statistics, Theory an methods. Arkansas: National center for toxicology Research, Food and Drug Administration; 1996
38
Gráfico 3.7. Distribución de los residuos brutos
Gráfico 3.8. Histograma de los valores pronosticados frente a los reales
39
Tabla nº 3.2. Comparativa de los errores cometidos por los modelos lineal,
gamma y mixto
Que los modelos lineal con logaritmo y gamma aporten predicciones
fuertemente correlacionadas es de esperar aunque los métodos de estimación
de los parámetros del modelo sean diferentes. Efectivamente, en el primer caso
hemos intentado explicar linealmente, a partir de las variables controladas, la
media del logaritmo del tiempo; en el segundo, hemos intentado explicar
linealmente el logaritmo de la media. En ambos casos estamos asumiendo
implícitamente una relación multiplicativa entre los factores controlados y la
respuesta. Ello puede explicar que, en nuestro caso, ambos modelos
conduzcan a conclusiones similares. Algo parecido puede decirse del modelo
de regresión de Cox, con la salvedad de que, en tal caso, se asume una
relación multiplicativa de los factores con la denominada función de riesgo.
Dado que no puede considerarse un modelo predictivo no haremos hincapié en
este último.
En definitiva, la diferencia entre el pronóstico lineal y el gamma consistió
básicamente en que el segundo predijo por término medio unos 11 día más de
baja. No es fácil decidir de manera objetiva si este comportamiento mejora o no
el ajuste. Como ya hemos comentado, existen diversos valores relacionados
con la bondad de ajuste del modelo lineal generalizado, como la devianza, pero
no son de utilidad para nosotros porque en el caso lineal se ha llevado a cabo
una transformación logarítmica seguida de una ponderación en función del tipo
de pago. En todo caso, según hemos indicado antes, el modelo gamma
presenta una correlación algo más fuerte con el valor real de la respuesta. Si
nos atuviéramos a las medias y teniendo en cuenta que las desviaciones
típicas son similares, según se aprecia en la tabla nº 3.2 (elaborada a partir de
la muestra de validación), el modelo gamma sería claramente mejor, pues casi
Media Mediana
Desviación
típica Percentil 25 Percentil 75 N válido
Error_lineal 10.770 .000 43.716 -3.000 7.000 N=61014
Error_gamma -.769 -2.304 43.080 -14.170 1.707 N=61014
Residuo_lineal_gamma 2.433 -1.000 42.446 -7.000 3.000 N=61014
40
acierta en media, pero la conclusión sería contraria si nos centráramos en el
análisis de los cuartiles, pues el modelo lineal acierta en mediana, mientras que
el modelo gamma tiende a predecir tiempos de baja excesivos a una gran
cantidad de individuos que obtienen el alta relativamente pronto.
No obstante, esta discusión queda zanjada por el simple hecho de que ambos
conducen a predicciones muy poco fiables del tiempo exacto de baja y, por lo
tanto y en nuestra opinión, poco útiles en términos prácticos. Estas opciones
quedan pues desechadas por el momento, aunque volveremos sobre ellas más
adelante.
3.2.2.4. Modelo de predicción categórica
No obstante, si rebajamos nuestras pretensiones iniciales podemos sacar
provecho a la cuantiosa información que aportó la muestra. Nuestro nuevo
objetivo, más modesto aunque de gran utilidad, es determinar si la baja del
paciente se prolongará más de 15 días, fecha en la que las MUCOSS asumen
la prestación económica de los trabajadores pertenecientes al Régimen
General como ya hemos comentado previamente. En ese caso, la respuesta es
una variable categórica dicotómica.
3.2.2.4.1. Categorización de pronósticos lineal y gamma
Inicialmente, procedimos a categorizar los pronósticos obtenidos mediante los
modelos lineal y gamma con los resultados siguientes (para la muestra de
validación). Los resultados se presentan en la tabla 3.3, donde quedó
nuevamente patente que el modelo gamma tiende a dar pronósticos más
elevados. Parece claro que ambos modelos, en especial el gamma, fracasan a
la hora de detectar las bajas breves.
41
Tabla 3.3. Resultados de la categorización de los pronósticos de los modelos
lineal y gamma
3.2.2.4.2. Regresión logística binaria
Un modelo que se antoja más natural para abordar este problema de decisión
es el de regresión logística binaria19, considerando las fuentes de variabilidad
que fijamos en la sección anterior. Apreciamos un comportamiento bastante
aceptable del modelo. Concretamente, se obtuvo un R2 de Nagelkerke de
0.631 para la muestra de entrenamiento, y una estimación las probabilidades
de acierto a partir de la muestra de validación del 88.0% y 80.8%, según se
muestra en la tabla 4 (85.3% en términos globales). La prueba de Hosmer-
Lemeshov aportó un resultado no significativo (P=0.066) lo cual nos induce a
pensar que no existe un modelo alternativo que mejore sustancialmente estas
predicciones (como confirmaremos posteriormente). Si aplicamos un algoritmo
de selección de variables (adelante-Wald) podemos eliminar algunas fuentes
de variabilidad pero, por el contrario, la probabilidad de acierto cae al 74.1% en
el grupo de las bajas prolongadas, por lo cual optamos por desechar esta
opción.
3.2.2.4.3. Árbol de decisión
Todos los métodos mencionados hasta el momento salvo éste son de tipo
paramétrico, es decir, el modelo de distribución de las observaciones
(contemplando posibles transformaciones de las mismas) queda determinado
de antemano excepto por el desconocimiento de ciertos parámetros que
19 Hosmer D.W. &Lemeshow S..Applied Logistic Regression. 2ª ed. New York .Willey; 1989
% acierto baja <15 % acierto baja>15
Lineal categorizado 43.5 88.5
Gamma categorizado 36.5 96.2
42
debemos estimar. La mayoría de las técnicas que abordamos a partir de este
momento son de carácter no paramétrico y se circunscriben, como dijimos al
inicio de la sección, a la rama de la Estadística denominada Minería de Datos19.
En el problema que nos atañe, si en lugar de buscar el pronóstico exacto del
tiempo de baja nos conformamos con una decisión categórica (mayor a menor
de 15 días), el método no paramétrico más apropiado es el denominado árbol
de decisión20, que aplicamos considerando todas las variables explicativas
fijadas en la fase inicial.
En primer lugar, debimos decantarnos por un árbol de decisión simple o por un
procedimiento iterativo basado en el mismo. En esta segunda categoría
consideraremos dos opciones: el bosque aleatorio y el Adaboost.
Cuando se aplica un árbol de decisión simple conviene estimar las
probabilidades de acierto dividiendo la muestra al azar en dos bloques:
entrenamiento y validación. Dicha división introduce una componente aleatoria
que es fuente de variabilidad en la estrategia resultante, lo cual puede
compensarse mediante un remuestreo o bootstrap. Cuando contamos con
muchas variables explicativas, siendo una de ellas preponderante en la
predicción (tal es el caso de la variable diagnóstico), el remuestreo por sí sólo
no suele conducir a una reducción de la variabilidad, pero ésta puede
conseguirse si, para cada submuestra y en cada nodo, se eligen al azar una
pequeña cantidad de variables explicativas para construir a partir de las
mismas nodos filiales. Dicha técnica se denomina bosque aleatorio y puede
aplicarse haciendo uso del paquete randomForest del programa R. Es para
muchos la técnica idónea para obtener el mejor ajuste en el problema de
clasificación21 .
20 Hastie T., Tibshirani R., Friedman J. The elements of Statistical Learning. 2ª Ed. California: Springer; 2008
21 James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning. Londres: Springer. 2013
21 Freund, Y. and Schapire, R. A decision-theoretic generalization of online learning and an application to boosting. Journal of Computer and System Sciences. 1997: 55;119-139.
43
Sin embargo, nosotros optamos por desechar el algoritmo de bosque aleatorio
por tres razones: primero, porque no proporciona un algoritmo entendible que
pueda implementarse de manera fácil sin la necesidad de contar con la base de
datos completa; segundo, porque la variabilidad mencionada anteriormente
quedó muy reducida en nuestro caso por el gran tamaño de la muestra; por
último, el propio tamaño de la muestra no permitió la aplicación del comando
randomForest en un ordenador convencional a la muestra completa.
Otro técnica tipo Boosting20 basada en el árbol de decisión simple que pudo
contemplarse en nuestro caso es el algoritmo Adaboost 21, método cuyo
resultado depende de una suma ponderada de diferentes árboles de decisión
que se van añadiendo iterativamente con la intención de explicar el
comportamiento de los datos peor ajustados. Se aplicó esta técnica con 10
iteraciones haciendo uso del paquete Adabag del programa R, proporcionando
unas proporciones de acierto del 90.3% para las bajas inferiores a 15 y del
75.0% para las superiores a 15 días, lo cual nos lleva a desecharla en beneficio
del árbol de decisión simple, que aporta unos resultados similares, como
veremos a continuación.
Para aplicar el algoritmo de árbol de clasificación simple y de acuerdo con la
literatura estadística (Hastie et al. (2008)), optamos por el método más natural
que es, hasta donde sabemos, el CART, considerando en principio la medida
de impureza Gini, que goza de una interpretación bastante intuitiva en términos
estadísticos. No obstante, se ensayó con otras posibilidades. Dado el gran
tamaño de la muestra no fue necesario imponer cotas especiales a los tamaños
de los nodos. Aunque el método CART construye por defecto árboles con un
máximo de 5 niveles ensayamos con la posibilidad de incluir hasta 10.
Aplicado a la variable dicotómica (<15 o >15) se obtuvo como resultado unas
probabilidades de clasificación correcta de 90.2% (<15) y 76.0% (>15) para la
muestra de validación, tal y como queda reflejado en la tabla (85.9% en
términos globales). El resultado fue levemente mejor en términos globales que
el de la regresión logística binaria (algo mejor para las bajas breves y algo peor
para las largas).
44
3.2.2.4.4. Método mixto lineal-gamma
Dado que no queríamos resignarnos a una predicción dicotómica del tiempo de
baja, optamos por obrar de manera similar a Ahan (1996) y ajustar el tiempo de
baja (logaritmo) mediante un modelo lineal para los individuos con un
pronóstico inferior a 15 días, según el árbol, y ajustar el tiempo de baja
mediante un modelo log-gamma para los demás. Optamos por este diseño
teniendo en cuenta que el modelo gamma aporta tiempos de baja superiores al
lineal. La fase inicial de este método consistió en decidir si el paciente estaría
más o menos de 15 días de baja. Para ello elegimos el árbol de decisión
porque aplicar la regresión logística conllevaría someter los mismos datos a
dos variantes del modelo lineal generalizado.
De esta forma, las predicciones sobre la muestra de validación aportaron una
correlación con el tiempo real de r=0.615 (rS=0.745), lo cual podría interpretarse
como una leve mejora de las correlaciones obtenidas por el método lineal
(r=0.587) y el gamma (r=0.600). Los valores típicos de los residuos se
muestran en la tabla 3.2. Seguíamos pensando que estos valores eran
insuficientes para dar un pronóstico aceptable. Nuestra percepción fue que
para aspirar a predecir el tiempo exacto de la duración de la baja
necesitábamos algún tipo de un información (variable explicativa) con el que no
contábamos en esos momentos y que nos permitiría distinguir claramente a los
pacientes cuyas bajas se van a prolongar inopinadamente. De todas formas, de
tener que elegir una ecuación, sería la que se obtiene por este método, que
cuenta con 248 parámetros. Otra opción que descartamos también fue aplicar,
bien el modelo lineal al logaritmo del tiempo o bien el log-gamma al tiempo de
baja, pero incluyendo como covariable la probabilidad de que la baja sea
inferior a 15 días, estimada por el árbol de decisión, pero no conseguimos
mejorar en nada la predicción, a juzgar al menos por las correlaciones
obtenidas.
45
3.2.2.4.5. Predicción con tres categorías
Así pues, todo parecía indicar que la información de la que disponíamos sólo
podría ser útil para distinguir entre bajas breves y prolongadas, pero no para
dar una estimación precisa. No obstante y como solución intermedia, probamos
a introducir un nuevo punto de corte por encima de los 15 días de baja (1 mes,
2, meses, tres meses, etc.) y comprobar nuestra capacidad de predicción
categórica. En principio probamos mediante un modelo logístico multinomial.
En tal caso, el problema consistía en ensayar con diferentes puntos de cortes
para poner a prueba la aptitud de los datos a la hora de detectar la respuesta.
En la práctica, el algoritmo de la regresión logística multinomial se mostró
demasiado inestable ante semejante cantidad de datos y de fuentes de
variabilidad, por lo que nos vimos obligado a desechar esta opción a favor del
árbol de decisión, que admitía sin problemas la inclusión de variables
categóricas no dicotómicas.
Lo primero que constatamos es que el método (para tres categorías) tenía
mucha dificultadas para detectar bajas muy largas. De hecho, sólo detectaba
un 16.1% de las bajas superiores a tres meses y, a partir de ahí, las
probabilidades caen a cero. Esto volvió a confirmarnos que no contábamos con
la información necesaria para identificar a los pacientes cuyas bajas serán muy
largas. Tampoco fue capaz de distinguir bajas de entre 15 días y un mes. Así
pues, de establecer un nuevo punto de corte, debería estar en torno a los 2
meses de baja. Por ello, procedimos a ensayar con los puntos de corte 40, 45,
50, 55, 60, 65, 70, 75 y 80 para encontrar las mejores probabilidades de
acierto. Destacamos que en todos los casos se obtuvo una proporción global
de acierto en torno al 78%, aunque el algoritmo mostró una máxima
sensibilidad para diferenciar entre bajas de duración media o alta cuando se
estableció el punto de corte de 80 días, según se aprecia en la tabla 3.4. En
todo caso, consideramos que las proporciones de bajas de duración media o
alta reconocidas por el modelo son bajas, es decir, que el modelo no es capaz
de distinguir satisfactoriamente entre tres categorías.
46
Clasificación
Observado
Pronosticado
<15 15-80 >80
Porcentaje
correcto
<15 241557 14392 579 94,2%
15-64 33203 38895 7305 49,0%
>65 6900 16884 10361 30,3%
Porcentaje global 76,1% 19,0% 4,9% 78,6%
Métodos de crecimiento: CRT
Variable dependiente: Tiempo_80
Tabla 3.4. Sensibilidad del punto de corte 80 días en árbol de decisión
3.2.3. Conclusión: modelo predictivo a considerar y variables de
interés (paso nº3)
Como ya hemos comentado, el resultado obtenido por el árbol de decisión con
la muestra de validación fue levemente mejor que el de la regresión logística.
En relación con este último, apreciamos además como ventaja que el algoritmo
del diagrama de árbol fue más similar al típico protocolo médico que el de la
regresión logística, basado en una ecuación. Todo ello y a la vista de los
resultados obtenidos nos condujo a aplicar un algoritmo de árbol de decisión ,
a nuestros datos, considerando las variables RDGT, CUENTA, PAGO,
TRAMEPI, OCUPACION, TRAMEDAD, FUMADICO, CODGTdico, HIJOSDICO,
Rprov, CONTRAT1, RECAIDA ,SEX y ECIVIL, para pronosticar si la duración
de la baja sería superior a los 15 días. Tras ensayar con las diferentes
opciones que ofrece SPSS para ejecutar el árbol de decisión, optamos por el
método CRT con índice de impureza de Gini, una profundidad máxima
permitida de 10 ramificaciones y un coeficiente de poda de 0.5. (Tabla 3.5).
47
Tabla 3.5. Sintaxis SPSS del algoritmo de decisión
Para valorar la importancia de cada variable en el modelo predictivo pudimos
basarnos en el gráfico 3.9, resultado de cuantificar el grado de participación de
cada variable predictiva en la reducción del índice de Gini a lo largo y ancho del
árbol de decisión obtenido. No obstante, encontramos una clara similitud entre
las conclusiones que aportan el gráfico 3.9 y la columna de tamaños de los
efectos (eta cuadrado parcial) en la tabla 3.1 Así pues, teniendo en cuenta
dicho gráfico, la lista de variables que intervienen de manera efectiva en la
toma de decisión, por orden de importancia, fue la siguiente: diagnóstico, pago,
cuenta, estado civil, hijos, codiagnóstico, ocupación, edad, provincia, fumador y
sexo. El resto de variables resultaron de poco interés en este estudio.
TREE Real15 [n] BY RDGT CUENTA PAGO TRAMEPI OCUPACION
TRAMEDAD FUMADICO CODGTdico HIJOSDICO
Rprov CONTRAT1 RECAIDA SEX ECIVIL
/TREE DISPLAY=TOPDOWN NODES=STATISTICS BRANCHSTATISTICS=YES
NODEDEFS=YES SCALE=AUTO
/DEPCATEGORIES USEVALUES=[1 2]
/PRINT MODELSUMMARY CLASSIFICATION RISK
/SAVE PREDVAL PREDPROB
/METHOD TYPE=CRT MAXSURROGATES=AUTO PRUNE=SE(0.5)
/GROWTHLIMIT MAXDEPTH=10 MINPARENTSIZE=100 MINCHILDSIZE=50
/VALIDATION TYPE=SPLITSAMPLE(70) OUTPUT=BOTHSAMPLES
/CRT IMPURITY=GINI MINIMPROVEMENT=0.0001
/COSTS EQUAL
/PRIORS FROMDATA ADJUST=NO
/MISSING NOMINALMISSING=MISSING.
48
Gráfico 3.9. Importancia normalizada de las variables del modelo
49
4. RESULTADOS
En el Anexo III se adjunta el gráfico del algoritmo de decisión y podemos
apreciar la importancia de las variables en dicho algoritmo. A continuación
describiremos de manera pormenorizada la influencia de dichas variables, en
orden de importancia, en la duración real de la baja. Estas variables serán
estudiadas de manera conjunta cuando apreciemos un considerable tamaño
del efecto en la interacción entre ellas, según se refleja en la tabla nº 3.1.
Consideramos que los resultados del estudio descriptivo que exponemos a
continuación pueden ser en buena medida extrapoladas al global de la
población dado el gran tamaño de la muestra.
El promedio de días de duración de los procesos se sitúa en 26,14 días con
una mediana de 7 días. Esto traduce que la mayoría de los procesos duran
menos de 15 días tal y como muestra la tabla 4.1.
Tabla 4.1. Distribución de las frecuencias de los tramos de duración de los
procesos
50
4.1. Diagnóstico
La distribución de los diagnósticos en función de su frecuencia podemos
observarla en la tabla 4.2.
Recuento
% del N de la
tabla
LUMBALGIA 48933 13,2%
GASTROENTERITIS 40780 11,0%
FARINGITIS AGUDA 29449 8,0%
RESFRIADO COMUN 26171 7,1%
GRIPE 24169 6,5%
LIUMBOCIATICA 21801 5,9%
ANSIEDAD 19857 5,4%
CERVICALGIA 17886 4,8%
AMIGDALITIS AGUDA 16373 4,4%
GASTOENTERITIS NO
INFECCIOSAS 16342 4,4%
BRONQUITIS 11482 3,1%
ANGINA STRP 10374 2,8%
VERTIGO Y MAREOS 9379 2,5%
COLICO RENAL 7850 2,1%
GRIPE OTRAS
MANIFEST RESP 7137 1,9%
AMENAZA DE ABORTO 6986 1,9%
ESGUINCE TOBILLO 6571 1,8%
DEPRESION 6437 1,7%
HERNIA INGUINAL 6044 1,6%
ESGUINCE CERVICAL 4156 1,1%
DORSALGIA 4144 1,1%
DIARREA 3909 1,1%
TUNEL CARPIANO 3859 1,0%
OTRAS COMPLIC. ESP
EMBARAZO 3822 1,0%
CEFALEA 3622 1,0%
BRONQUITIS NO
AGUDA NO CRONICA 3461 ,9%
MIGRAÑA 3202 ,9%
REACCIÓN
ADAPTACIÓN 3079 ,8%
MENISCOPATIA
INTERNA 2801 ,8%
PERDIDOS 0 ,0%
Tabla 4.2. Distribución de las frecuencias de los diagnósticos de los procesos
51
La lumbalgia se presenta como el diagnóstico más frecuente con 13,2% de los
casos. La patología osteomuscular es una de las causas más frecuentes de IT
en la población general seguida de las enfermedades infecciosas.
Al realizar un estudio descriptivo de los diagnósticos según su duración tal y
como figura en la tabla 4.3, tenemos:
Tabla 4.3. Distribución de la duración de los procesos según diagnóstico
Límite inferior
Límite superior 25 50 75
LUMBALGIA 35,18 34,74 35,63 15,00 49,863 37 6,00 15,00 43,00
GASTROENTERITIS 3,83 3,75 3,91 3,00 8,041 3 1,00 3,00 4,00
FARINGITIS AGUDA 4,79 4,70 4,89 3,00 8,299 3 2,00 3,00 5,00
RESFRIADO COMUN 5,44 5,33 5,55 4,00 9,015 4 2,00 4,00 6,00
LIUMBOCIATICA 59,89 58,93 60,84 32,00 71,947 69 11,00 32,00 80,00
GRIPE 6,30 6,21 6,40 5,00 7,547 5 3,00 5,00 8,00
ANSIEDAD 61,81 60,78 62,84 32,00 73,940 73 11,00 32,00 84,00
CERVICALGIA 50,47 49,62 51,32 31,00 58,000 63 9,00 31,00 72,00
GASTOENTERITIS NO INFECCIOSAS 4,54 4,36 4,71 3,00 11,536 2
2,00 3,00 4,00
ESGUINCE TOBILLO 24,11 23,36 24,85 15,00 30,704 18 9,00 15,00 27,00
BRONQUITIS 11,71 11,34 12,09 8,00 20,571 8 4,00 8,00 12,00
ANGINA STRP 4,79 4,68 4,90 4,00 5,726 4 2,00 4,00 6,00
VERTIGO Y MAREOS 24,71 23,76 25,66 8,00 46,823 17 3,00 8,00 20,00
COLICO RENAL 19,99 19,19 20,79 8,00 35,974 14 4,00 8,00 18,00
GRIPE OTRAS MANIFEST RESP
6,56 6,38 6,74 5,00 7,737 44,00 5,00 8,00
AMENAZA DE ABORTO 68,98 67,28 70,67 38,00 72,291 82 15,00 38,00 97,00
DEPRESION 82,39 80,26 84,52 49,00 87,094 107 15,00 49,00 121,50
HERNIA INGUINAL 52,75 51,71 53,80 43,00 41,451 27 32,00 43,00 59,00
ESGUINCE CERVICAL 61,11 59,58 62,63 50,00 50,209 59 25,00 50,00 84,00
DORSALGIA 32,13 30,62 33,65 11,00 49,758 35 4,00 11,00 39,00
DIARREA 6,39 5,78 7,00 3,00 19,389 3 2,00 3,00 5,00
TUNEL CARPIANO 78,04 75,92 80,17 57,00 67,242 60 35,00 57,00 95,00
OTRAS COMPLIC. ESP EMBARAZO 58,16 56,68 59,64 46,00 46,611 47
27,00 46,00 74,00
CEFALEA 17,80 16,49 19,11 4,00 40,210 11 1,00 4,00 12,00
BRONQUITIS NO AGUDA NO CRONICA
10,77 10,09 11,46 7,00 20,551 7 4,00 7,00 11,00
MIGRAÑA 10,79 9,74 11,83 2,00 30,138 5 1,00 2,00 6,00
REACCIÓN ADAPTACIÓN 106,99 103,93 110,05 82,00 86,625 112 40,00 82,00 152,00
MENISCOPATIA INTERNA 90,23 87,43 93,03 64,00 75,620 83 37,00 64,00 120,00
AMIGDALITIS AGUDA 5,37 5,27 5,47 4,00 6,489 3 3,00 4,00 6,00
Desv. típ.Amplitud
intercuartilMedia
Intervalo de confianza para la
MedianaDIASBAJA
Percentiles
Descriptivos
Estadístico
dIAGNOSTICO
52
4.2. Cuenta
Otra variable de interés es el tipo de cuenta del trabajador. El 93,2 % de los
trabajadores pertenecen a la cuenta ajena mientras que sólo el 6,8%
pertenecen a la cuenta propia (autónomos). La duración agregada de los
procesos en función de esta variable es significativa, siendo de 22,59 días para
la cuenta ajena y de 66,07 días para la cuenta propia tal y como figura en la
tabla 4.4.
Tabla 4.4. Distribución de la duración de los procesos según la cuenta
Al segregar por diagnóstico se siguen manteniendo estas diferencias como
vemos en la tabla 4.5.
53
Tabla 4.5. : Distribución de la duración de los diagnósticos según la cuenta
4.3. Pago
Mostramos en la tabla 4.6 una descripción de la duración de los diagnósticos
en función del tipo de pago:
54
Tabla 4.6. : Distribución de la duración de los diagnósticos según el tipo de
pago
4.4. Ocupación
La ocupación más frecuente es la de servicios, restauración y protección
(5,8%) seguidos de Técnicos y profesionales de apoyo (4,8%) y trabajadores
no cualificados (4,7%).
Las duraciones medias por ocupación se muestran en el gráfico 4.1.
Gráfico 4.1. Duraciones medias de los diagnósticos según la ocupación
55
En las tablas 4.7 y 4.8 se detallan las duraciones por ocupación segregando
por diagnósticos. Observamos como en las fuerzas armadas los diagnósticos
que más duran son los relacionados con la patología mental, al igual que
ocurre en directivos, científicos e intelectuales, técnicos y profesionales de
apoyo, administrativos, construcción, operadores y trabajadores no
cualificados.
La patología osteomuscular tiene mayor duración ocupaciones relacionadas
con agricultura y pesca.
La patología infecciosa es la de menor duración en todas las ocupaciones.
Tabla 4.7. Distribución de la duración de los diagnósticos según ocupación (I)
FUERZAS ARMADASDIRECCION EMPRESAS
CIENTIFICOS E INTELECTUALES
TECNICOS Y PROFESIONALES
DE APOYOEMPLEADOS
ADMINISTRATIVOS
LUMBALGIA 30,74 63,12 36,75 40,86 34,98
GASTROENTERITIS 20,17 4,71 4,78 4,75 3,74
FARINGITIS AGUDA 8,40 7,82 5,83 5,85 5,18
RESFRIADO COMUN 10,00 11,08 6,47 6,62 5,75
LIUMBOCIATICA 81,73 90,31 56,67 62,54 52,62
GRIPE 7,44 9,39 6,68 6,49 7,41
ANSIEDAD 86,75 92,81 70,12 73,89 65,80
CERVICALGIA 87,00 76,30 42,31 55,56 46,89
GASTOENTERITIS NO INFECCIOSAS 2,00 4,36 5,43 5,29 4,52
ESGUINCE TOBILLO 27,50 43,42 30,24 30,88 25,66
BRONQUITIS 37,14 21,05 13,60 13,19 11,22
ANGINA STRP 23,00 3,72 4,60 5,33 5,68
VERTIGO Y MAREOS 34,00 59,22 26,95 33,67 25,25
COLICO RENAL 51,00 22,15 19,96 22,93 20,00
GRIPE OTRAS MANIFEST RESP 7,57 6,63 7,44 6,89
AMENAZA DE ABORTO 43,00 79,11 70,00 63,71 65,66
DEPRESION 115,50 116,05 84,58 95,31 88,28
HERNIA INGUINAL 43,80 53,63 38,96 41,29 37,43
ESGUINCE CERVICAL 108,00 73,58 58,19 59,43 60,08
DORSALGIA 61,53 30,38 44,32 21,57
DIARREA 21,00 6,70 8,54 7,96
TUNEL CARPIANO 197,33 80,52 58,68 66,90 63,69
OTRAS COMPLIC. ESP EMBARAZO 98,00 51,32 54,94 54,79 62,92
CEFALEA 42,00 48,40 26,54 25,16 16,59
BRONQUITIS NO AGUDA NO CRONICA
8,00 10,94 9,75 10,77 11,15
MIGRAÑA 118,00 32,00 20,68 15,03 10,10
REACCIÓN ADAPTACIÓN
296,00 149,91 98,44 117,38 103,36
MENISCOPATIA INTERNA 73,20 84,92 60,40 79,97 61,65
AMIGDALITIS AGUDA 8,00 7,76 7,06 5,87 5,87
Total 55,56 62,94 32,59 34,79 28,39
Media
OCUPACION
56
Tabla 4.8. Distribución de la duración de los diagnósticos según ocupación (II)
4.5. Edad
De los procesos estudiados el tramo de edad más frecuente en los hombres se
da entre los 43 y 51 años a diferencia de las mujeres que son entre los 32 y 37
años.
SERVICIOS RESTAURACION Y
PROTECCIONAGRICULATURA
Y PESCA
MANUFACTURAS, CONSTRUCCION
Y MINERIAOPERADORES Y MONTADORES
TRABAJADORES NO
CUALIFICADOS PERDIDOS
LUMBALGIA 43,24 51,82 41,96 37,03 42,12 32,29
GASTROENTERITIS 4,62 3,31 4,46 4,02 4,70 3,65
FARINGITIS AGUDA 5,92 3,84 5,22 4,96 5,09 4,59
RESFRIADO COMUN 7,00 4,59 5,45 5,24 5,91 5,19
LIUMBOCIATICA 67,63 75,48 71,63 70,69 71,35 56,12
GRIPE 7,04 7,54 6,14 6,41 6,89 6,17
ANSIEDAD 72,58 65,47 70,97 67,50 71,58 56,13
CERVICALGIA 52,53 68,19 57,39 52,06 57,19 48,30
GASTOENTERITIS NO INFECCIOSAS 5,28 9,80 4,59 4,60 4,76 4,36
ESGUINCE TOBILLO 28,07 41,43 26,71 26,19 33,13 21,01
BRONQUITIS 14,59 21,02 12,01 13,09 15,76 10,82
ANGINA STRP 5,57 4,46 5,22 6,05 5,88 4,63
VERTIGO Y MAREOS 28,55 19,82 31,15 34,00 35,15 21,68
COLICO RENAL 24,50 38,68 24,55 23,18 20,45 18,77
GRIPE OTRAS MANIFEST RESP 7,65 7,95 6,73 6,80 6,28 6,39
AMENAZA DE ABORTO 78,98 62,71 84,17 59,77 91,89 67,45
DEPRESION 96,92 114,00 88,95 91,64 98,38 75,54
HERNIA INGUINAL 50,50 52,28 60,72 53,78 57,45 52,73
ESGUINCE CERVICAL 63,21 69,69 59,14 62,83 62,14 60,60
DORSALGIA 29,31 55,67 40,59 38,63 37,20 30,13
DIARREA 6,50 8,58 6,70 6,90 5,40 6,12
TUNEL CARPIANO 81,94 77,77 84,28 76,09 80,36 78,02
OTRAS COMPLIC. ESP EMBARAZO
74,75 165,00 73,24 77,00 77,76 55,59
CEFALEA 22,68 3,89 20,22 23,42 20,40 16,04
BRONQUITIS NO AGUDA NO CRONICA 16,45 17,17 12,58 16,82 13,39 9,71
MIGRAÑA 13,66 11,79 12,74 16,55 14,93 9,36
REACCIÓN ADAPTACIÓN
97,59 63,75 109,23 120,86 102,88 106,47
MENISCOPATIA INTERNA
96,73 152,67 100,69 99,04 99,72 89,74
AMIGDALITIS AGUDA 6,15 5,39 5,56 5,61 6,04 5,18
Total 35,95 36,36 31,89 28,98 33,02 23,08
Media
OCUPACION
57
En la tabla 4.9 se muestra el promedio de duración de días en baja por tramo
de edad de manera agregada. Es el tramo de más de 52 años el que presenta
una duración media mayor.
Tabla 4.9. Distribución de la duración de los procesos según el tramo de edad
Al exponer los resultados segregados por diagnósticos observamos igual
comportamiento tanto en medias como en medianas de duración tal y como
aparece en la tabla 4.10.
Tabla 4.10. Distribución de la duración de los diagnósticos según el tramo de
edad
58
Si tenemos en cuenta el año en el que se produce el periodo de incapacidad y
tal y como se muestra en la tabla 4.11 observamos que, conforme van pasando
los años, el tramo de edad se va rejuveneciendo de 2008 a 2012, siendo el
tramo de 43 a 51 años el más frecuente en 2008 y el de menos de 31 en 2012.
Tabla 4.11. Evolución de la frecuencia de los tramos de edad en el periodo
2008-2012
4.6. Codiagnóstico
En la tabla 4.12 se muestra la diferencia entre duraciones de los procesos que
si tienen codiagnóstico y los que no:
Tabla 4.12. Distribución de la duración de los procesos según el codiagnóstico
El codiagnóstico influye claramente en la duración de los procesos tal y como
podemos observar en el gráfico 4.2, donde podemos apreciar que el efecto del
AÑO
2008 2009 2010 2011 2012
% de la fila % de la fila % de la fila % de la fila % de la fila
TRAMEDAD <= 31 17,7% 19,3% 20,9% 23,2% 18,9%
32 – 37 17,9% 19,6% 21,4% 22,6% 18,5%
38 – 42 19,1% 20,5% 21,3% 22,0% 17,2%
43 – 51 19,4% 21,1% 20,9% 21,5% 17,2%
52+ 21,0% 21,0% 21,4% 20,5% 16,1%
59
codiagnóstico sobre el aumento de la duración de los procesos es más patente
en las enfermedades infecciosas.
Gráfico 4.2. Duraciones medias de los diagnósticos según la presencia de
codiagnóstico
4.7. Hijos
Otra de las variables que explican la varianza de la duración de los procesos es
la de tener o no tener hijos. En el primer caso la duración media es de 48,61
días de forma agregada mientras que los que no tienen hijos tiene una duración
de 26,29 días. Destaca la diferencia en días medios de duración situación que
se mantiene al tener en cuenta las medianas de duración (tabla 4.13).
60
Tabla nº 4.13. Distribución de la duración de los procesos según la
descendencia
Al segregar esta variable por diagnóstico sigue siendo la duración media y
mediana más elevada en todos los diagnósticos de registros que si tienen hijos,
tabla nº 4.14.
Tabla 4.14. Distribución de la duración de los procesos según la descendencia
61
Al segregar por sexo, las mujeres que si tienen descendencia tienen una
duración media agregada de 51,49 días frente a los 45,38 días de los hombres.
4.8. Provincia
La provincia de origen de los registros también influye en la duración de los
procesos, se optó por realizar un clúster con todas las provincias agrupándose
en cuatro conjuntos:
En el grupo nº 1(8,9% del total de registros) están: Almería, Badajoz, Cáceres,
León, Lugo, Orense, Pontevedra, Salamanca, Valencia y Zamora.
En el grupo nº2 (35,4% del total de registros) están: Albacete, Alicante,
Asturias, Ávila, Castellón, Ciudad Real, Córdoba, Cuenca, Granada,
Guipúzcoa, Huelva, Jaén, La Coruña, Vigo, Murcia, Palencia, Sevilla, Tenerife,
Teruel y Vizcaya.
En el grupo nº 3(19,9% del total de registros) están: Baleares, Burgos, Cádiz,
Cantabria, Gerona, Huesca, Las Palmas, Lérida, Málaga, Melilla, Segovia,
Soria, Toledo y Valladolid
Y en el grupo nº4(35,9% del total de registros): Álava, Barcelona, Ceuta,
Guadalajara, La Rioja, Madrid, Navarra, Tarragona y Zaragoza.
Las duraciones por grupo se muestran en la tabla 4.15
62
Tabla 4.15. Distribución de la duración de los procesos según la provincia de
origen
Al segregar las duraciones por tramos de duración en relación al clúster de
provincias tenemos comportamiento muy similar a diferencia del grupo n4, que
es el único grupo donde la duración más frecuente es en el tramo menor de 15
días. En la tabla 4.16 se observa el resto de datos.
Tabla 4.16. Distribución de la frecuencia de los tramos de duración según la
provincia de origen
63
4.9. Tipo de contrato
La duración de los procesos en función del tipo de contrato según sea a tiempo
parcial o a tiempo completo se muestra en la tabla 4.17.
Tabla 4.17. Distribución de la duración de los procesos según el tipo de
contrato
Llama la atención el hecho de que los registros que tiene un contrato a tiempo
parcial tienen más duración que los que lo tienen a tiempo completo. La mayor
desviación en cuanto a duraciones se da en las patologías relacionadas con la
esfera mental según se muestra en la tabla 4.18.
64
Tabla 4.18. Distribución de la duración de los diagnósticos según el tipo de
contrato
4.10. Recaída
El 29,1 % de los procesos han tenido recaída de su patología siendo en las
mujeres más frecuente la recaída (15,4%) que en los hombres (13,9%).
65
En la tabla 4.19 se muestran las duraciones medias en el caso de haber o no
tenido recaída:
Tabla 4.19. Distribución de la duración de los procesos según la recaída
Sólo en los casos con diagnósticos de hernia inguinal y en otras
complicaciones del embarazo la duración media de los procesos es menor en
el caso de no haber tenido recaída previa.
4.11. Estado civil
El estado civil juega también un papel en la duración de los procesos de IT. En
la tabla 4.20 se muestra como los pacientes con estado civil viudo son los que
tienen mayores duraciones probablemente vinculado a la edad, seguido por los
pacientes divorciados y las parejas de hecho:
Tabla 4.20. Distribución de la duración de los procesos según el estado civil
Son las casadas, mujeres en pareja de hecho y solteras las que tienen
mayores duraciones medias a diferencia de los viudos. En el caso de los
66
divorciados y divorciadas las duraciones son similares: 49,09 días para los
primeros y 49,01 para las segundas.
4.12. Interacción diagnóstico - sexo
Las mujeres presentan las duraciones medias y medianas mayores. Hay
diferencia entre las duración de los proceso entre hombres y mujeres tal y
como podemos ver en la tabla 4.21.
Tabla 4.21. Distribución de la duración de los procesos según el sexo
En cuanto a la duración de los procesos detectamos diferencias según el sexo.
El tramo de duración inferior a 15 días es el más frecuente en ambos sexos
aunque en mayor medida para los hombres. El segundo tramo más frecuente
es el de 31 a 60 días en ambos sexos. Tabla 4.22.
Tabla 4.22. Distribución de la frecuencia de los tramos de duración según el
sexo
67
La distribución por sexos según el tramo de edad se muestra en la tabla 4.23.
SEX
H M
% de la fila
% del N total de
tabla % de la fila
% del N total de
tabla
TRAMEDAD <= 31 49,5% 11,7% 50,5% 12,0%
32 - 37 44,0% 11,0% 56,0% 14,0%
38 - 42 48,2% 8,2% 51,8% 8,8%
43 - 51 53,4% 9,9% 46,6% 8,7%
52+ 57,2% 8,7% 42,8% 6,5%
Tabla 4.23. Distribución del género según el tramo de Edad
En relación a la distribución de diagnósticos por sexos tenemos que la
lumbalgia es el diagnóstico más frecuente. La lumbalgia es más frecuente entre
las mujeres con un 7,1 % frente a un 6,1 % de los hombres. En la tabla 4.24
podemos observar el comportamiento en todos los diagnósticos.
68
Tabla 4.24. Distribución de la frecuencia de los diagnósticos según el sexo
4.13. Interacción diagnóstico - tipo de pago
Dado que la interacción entre el diagnóstico y el pago es una fuente de
variabilidad a tener en cuenta se muestra en la tabla 4.25 las duraciones
medias y medianas en función de estas dos variables:
69
Tabla 4.25. Distribución de la duración de los diagnósticos según el tipo de
Pago
En el gráfico 4.3 se pone de manifiesto esta variabilidad que sigue
manteniéndose al tener en cuenta los tramos de duración de los procesos en
función del tipo de pago.
Se observa cómo la mayor parte de los procesos se encuentran en el tramo de
menor duración y éste es mayoritario en el pago delegado, al contrario que en
el pago directo donde es el tramo de 31-60 días el más frecuente.
70
Gráfico 4.3. Distribución de los tramos de duración de loa procesos según el
tipo de Pago
Como se puede observar en la tabla 4.26, el tipo de pago delegado es el más
frecuente en todos los diagnósticos.
71
Tabla 4.26. Distribución de la frecuencia de los diagnósticos según el tipo de
pago
Al segregar por tipo de pago llama la atención el comportamiento de la
frecuencia de la lumbalgia que representa el 21,8% de los casos.
72
4.14. Interacción Número episodio - hábito tabáquic o
Los pacientes que tienen hábito tabáquico tienen mayores duraciones medias y
menores duraciones medianas frente a los que no lo tienen (tabla 4.27).
Tabla 4.27. Distribución de la duración de los diagnósticos según el hábito
tabáquico
La distribución de las duraciones teniendo en cuenta el número de episodio del
trabajador y su hábito tabáquico la podemos observar en la tabla 4.28:
73
Tabla 4.28. Distribución de la duración de los procesos en función del número
de episodio y del hábito tabáquico
En los casos que hayan tenido un episodio de IT y de dos a tres, tanto las
duraciones medias como medianas son superiores en el caso de los
fumadores. Esta situación se invierte cuando los casos tengan de cuatro a siete
episodios o más de siete.
74
5. DISCUSIÓN
No cabe duda que hay muchos factores que influyen en las duración de los
procesos que no hemos incluido debido a su difícil manejo o medida, tal y como
expone Castejón22. Al clasificar los factores que influyen en la historia natural
de la IT podemos hablar de:
1. Factores Biológicos propios de individuo (edad, sexo, estado civil, etc.)
2. Factores Biológicos propios de la patología(diagnostico, comorbolidad,
hábitos, vivencia de la enfermedad en la sociedad del bienestar, etc.)
3. Factores Sociales (estilo de vida, carga familiar, nivel cultural,
inmigración, lugar de residencia, etc.)
4. Factores Profesionales (Tamaño empresa, jornada laboral, cargas,
prevención, clima laboral, grado de satisfacción, etc.)
5. Factores Económicos (Nivel de renta, régimen de Seguridad social)
6. Factores Sanitarios (Características del médico evaluador, accesibilidad
al sistema sanitario, etc.)
Es evidente la dificultad de medida de muchos de ellos y consecuentemente la
imposibilidad de incluirlos en nuestro modelo.
En primera instancia y la vista del Gráfico 1.2. donde se pueden ver las
duraciones medias de los periodos de IT del INSS, ISM y MUCOSS en el
periodo 2007-2012 observamos claras diferencias. La menor duración de los
procesos en las MUCOOS puede tener varios motivos. Los médicos
evaluadores de la capacidad laboral en las mutuas tienen una dedicación
exclusiva en este cometido a diferencia de los médicos de atención primaria,
hecho que puede influir en los tiempos medios de duración. Por otro lado en las
mutuas se reducen los tiempos de gestión a la hora de realizar pruebas y/o 22 Castejón J. et al. La Incapacitat Laboral per Coningencias Comunes en Catalunya. Barcelona: Consell de Treball, Economic i Social de Catalunya. 2003
75
tratamientos, hecho que se alarga más en atención primaria. Podemos hablar
de una mayor especialización como médico evaluador en los profesionales
pertenecientes a las mutuas e INSS. No cabe duda de que existen más causas
que expliquen estas diferencias pero obviamente no son objeto de este trabajo.
Por otro lado hay que destacar el papel del cambio de ciclo económico de la
crisis española que comenzó en el 2008 sobre la IT. Al tener en cuenta la tasa
de absentismo laboral23, es decir, porcentaje de la población que está en
situación de IT, y las jornadas perdidas por trabajador, tenemos que durante la
época de crisis ambos indicadores han disminuido. Frente a lo anterior hay un
dato muy llamativo: las duraciones medias de los procesos durante estos años
se han mantenido en cifras similares. Esto implica que la crisis no ha producido
sesgo importante sobre nuestro modelo de predicción.
Tal y como se ha expuesto en los resultados la variable con más peso a la hora
de explicar la varianza de la duración de los procesos de IT es el diagnóstico.
Este hecho está en consonancia con otros estudios como los realizados por
Juan Luis Cabanillas24 y Esther Álvarez25. En sentido contrario tenemos
estudios26 que dan una importancia secundaria al diagnóstico dentro de la
historia natural del proceso de IT sin entrar en análisis estadísticos posteriores.
No siendo el objetivo de estos estudios el desarrollar un modelo predictivo de
duración estamos en completo desacuerdo el considerar el diagnostico como
factor secundario a la hora de determinar la duración de un proceso de IT a la
vista de los resultados expuestos previamente.
23
Adecco (internet). Madrid. 7 de agosto 2016. Disponible en www.adecco.es
24 Cabanillas J.L. et al. Tiempos óptimos personalizados en Incapacidad temporal. Consejería de Salud y Bienestar Social de la Junta de Andalucía. Sevilla;2012
25 Álvarez Theurer E. et al. Análisis de la duración de los periodos de incapacidad temporal de los procesos de Andalucía. Factores asociados. Aten. Primaria:2009;41 (7):387-393
26 Villaplana García M.A. .El Absentismo laboral por Incapacidad Temporal derivada de Contingencia Comunes en el periodo 2005-2010. Tesis Doctoral. Universidad de Murcia. 2012
76
Existen estudios27 28 donde se pone de manifiesto la importancia del
diagnóstico en la duración de los procesos no teniendo como objetivo realizar
una predicción de duración como el caso que nos trata.
En relación a la predicción de duración existe poca bibliografía que aborde el
tema que nos ocupa explicado en parte por la dificultad que ello conlleva. Hay
muchos trabajos que analizan factores de corrección29 30 31 32 que influyen en la
duración de los procesos pero sin entrar en diagnósticos. E. Álvarez33 a través
de una regresión lineal múltiple tras análisis multivariante desarrolla un modelo
pero sólo para el diagnóstico de lumbalgia, hecho fundamentado porque la
patología osteomuscular es la más prevalente tal y como se ha puesto de
manifiesto en nuestro estudio y otros34. Hay otros autores que van la línea
utilizando sólo un diagnóstico (ansiedad) como es el caso de Carlos Catalina y
colaboradores35.
27 Allen Cheadle et al. Factor influencing the Duration of Work.Related Disability: A Population Based Sutdy of Washington State Workers Compensation. American Journal of Public health. 1994; 84(2):194
28 González Barcala F.J. et al. Determinantes de la Duración de la Incapacidad temporal y vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria. 2006;37(8):431-8
29 Bayona X. et al. Variables que influyen en la resolución de una Incapacidad Temporal por contingencia comunes de muy larga duración. Arch. Prev. Riesgos Labor. 2004;7(2):64-69
30 Benavides F.G. et al. Reincorporación al trabajo después de un episodio de Incapacidad temporal por contingencia común: Papel de la edad, el sexo, la actividad económica y la Comunidad Autónoma. Rev. Esp. Salud pública.2007;81:183-190
31 Alavinia S.M. Determinats of works ability and its predictive value for diasability. Occupational Medicine. 2009;59:32-37
32 Villaplana M. Grado de efecto de las variables sociodemográficas, laborales, organizativas y del entorno en la duración de la Incapacidad Temporal por contingencias comunes en España. Aten. Primaria. 2015;47(2):90-98
33 Álvarez Theurer et al. Modelo Predictivo de la duración de Incapacidad temporal por Lumbalgia. Factores determinantes. 2005;14(3):10-17
34 Delclos J. et al. Duración de la Incapacidad temporal por contingencia común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-187
35 Catalina C. et al. Predictores de la duración de Incapacidad Temporal por Contingencias comunes en los Trastornos de Ansiedad. Gaceta Sanitaria. 2011;27(1):40-46
77
Desde un punto de vista antropológico el diagnóstico médico es la vivencia de
la enfermedad en el sujeto y entramos en lo que Laplantin36 denomina el
“campo del enfermo “que se caracteriza por el sufrimiento y la conciencia de la
experiencia mórbida; es fácil de entender la gran variabilidad interindividual y
su repercusión sobre el tiempo de recuperación. No podemos obviar los efectos
de la sociedad del bienestar donde cada vez se objetiva mejor como patologías
o enfermedades banales representan un sufrimiento mayor en la población no
justificado por la entidad clínica de la patología.
Junto a esta variabilidad y tal y como como la antropología sociocultural ha
demostrado como expone Guerrero37 en su trabajo, las percepciones de buena
y mala salud (enfermedad) se encuentran culturalmente construidas, hecho que
complica más aun el desarrollo del modelo, más aun cuando no disponemos de
magnitud que pueda ayudar a su medida.
En relación con la variable cuenta si hay estudios en concordancia con el
nuestro38 39 40.
La razón por la cual los procesos de IT duran más en el Régimen Especial de
Trabajadores Autónomos que en el Régimen General puede deberse a varios
factores como más precariedad laboral, menor control en medidas de
protección, existencia de un suplemento en cuotas de cotización para estar
protegido en el accidente laboral y el concepto de “prestación refugio”.
La prestación por IT tiene como ya se ha expuesto anteriormente una duración
máxima de 12 meses, prorrogables 6 meses más si hay estimación de curación
o mejoría que permita reanudar la actividad laboral. Posteriormente puede
36 Laplantin F. Antropología de la Enfermedad. Paris:Editions Payot;1965
37 Guerrero F. Salud. Enfermedad y Muerte: Lecturas desde la antropología Sociocultural. Revista Mad.2004;10:1
38 Benavides F.G. et al. Evaluación de la gestión de los casos de Incapacidad Temporal por contingencia común de más de 15 días en Cataluña. Gac. Sanit. 2010; 24(3):215-219
39 Delclos J. et al. Duración de la Incapacidad temporal por contingencia común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-187
40 Royo-Bordonada M.A. La duración de la Incapacidad Laboral y sus factores asociados. Gac. Sanit. 1999;13(3):177-184
78
iniciarse otro proceso de IT por el mismo motivo por una sola vez con derecho
a prestación con una duración máxima de 18 meses41. En este sentido la
conjunción de situaciones desfavorables como quiebras de empresas, negocios
no viables y otras, junto a la existencia inicial de patología que justifique un
periodo de IT convierten la prestación por incapacidad en una prestación
refugio para no entrar en situación de exclusión social42.
Respecto a la variable tipo de pago no encontramos bibliografía relacionada. La
mayor duración de los procesos que están en situación de pago directo se
debe fundamentalmente al recibir el alta médica y por tanto la finalización de su
periodo de incapacidad, dejan de recibir la prestación económica. Aludo al
concepto antes expuesto de prestación refugio.
La ocupación del trabajador también influye en la duración de los procesos tal y
como hemos expuesto y en comparación con otros estudios43 44 45. La
distribución por diagnóstico más prevalente en las ocupaciones va en relación a
las cargas laborales (físicas, posturales, mentales y neurosensoriales) de cada
profesión. En las profesiones con cargas mentales elevadas muestran más
frecuencia de patologías relacionadas con la esfera mental, al revés que ocurre
con profesiones menos cualificadas que al tener mayores cargas físicas y
posturales tiene más incidencia de patología osteomuscular. No habiéndose
tratado en nuestro trabajo es importante comentar el trabajo de Santamaría,
P.46 donde pone de relevancia la relación existente entre la simulación de
patologías y la profesión del trabajador, hecho que produce un sesgo en la
41 Art. 131 bis del RD Legislativo 1/1994, de 20 de junio, por el que se aprueba el Texto Refundido de la Ley General de seguridad social
42 Arrina, A. El concepto de Exclusión en la Política Social. Trabajo social Hoy. 2002;34:47-46
43 Rivas P. Salud Mental e incapacidad Temporal en población laboral de Cataluña. Arch. Prev. Riesgos Labor. 2008;11(2):81-86
44 García Álvarez, G. Conceptos básicos en incapacidad temporal. Jano. 2003;65(1495):1770-1773
45 Benavides F.G..Ocuppational categories and sickness absence certified as attributable to common disease. European Journal of Public Health. 2003:13 (1);51-55.
46 Santamaría P. et al. Prevalencia de Simulación en Incapacidad Temporal: Percepción de los profesionales de la Salud. Clínica y Salud. 2013;24:139-151
79
duraciones reales por ocupación. No se ha encontrado bibliografía que pueda
aclarar la relación entre la simulación y la mayor duración de los procesos
según el tipo de régimen laboral (variable cuenta de nuestro estudio) y la
naturaleza del pago de la prestación (variable pago de nuestro estudio).
La edad es otra variable que influye en la duración de los procesos de IT y está
presente en la mayoría de los estudios previos y otros como, E. Álvarez (2005)
y Torá I.47 Como era de esperar la mayor duración de los procesos se
encuentra en el tramo de edad superior a 52 años, no sólo por la aparición de
patologías propias de ese tramo sino también porque hay una disminución en
la capacidad de recuperación frente a otros tramos. Esta realidad hace que
desde las administraciones del estado se desarrollen planes para lo que Mauro
Brigeiro48 denomina “envejecimiento exitoso”, es decir, conseguir las mejores
condiciones socio sanitarias posibles en la etapa final de la vida. A esto habría
que sumar otros factores o variables que inciden sobre la ancianidad y la
vivencia de la enfermedad como expone Guijarro J. L.49 que influyen sobre la
duración de los procesos, como son la invalidez que puede llegar a provocar,
amenaza ante la pérdida de integridad del sujeto, etc. No cabe duda que estos
factores también influyen en otras edades pero en menor medida.
En la tabla 4.11 se observaba como de 2008 a 2012 el tramo de edad de
procesos de IT se va rejuveneciendo. Al contrastar estos datos con los
porcentajes de población activa sobre población total en España en el mismo
periodo y en los mismos tramos de edad, encontramos que el tramo de menos
de 31 años es más frecuente en todos los años del periodo50 aunque disminuye
en frecuencia año a año a diferencia del resto de tramos que aumenta en
meseta ascendente.
47 Tora Rocamora I. et al. Duración de los episodios de Incapacidad temporal por contingencia común según regiones sanitarias en Cataluña. Rev. Esp. Salud Pública. 2010;84(1):61-69
48 Mauro Brigeiro. Envejecimiento exitoso y tercer edad. Problemas y retos para la promoción de la salud. Investigación y Educación en Enfermeria.2005;23 (1):102-109
49 Guijarro J.L.. Las Enfermedades en la Ancianidad. Anales Sis. San. Navarra. 199;2 (1):85-94
50 Instituto Nacional de Estadística (internet). Madrid. Agosto 2015. Disponible en: www.ine.es/welcomo.shtml
80
La existencia de otra patología coexistente con la causa principal de
diagnóstico aumenta la duración de los procesos. En la mayoría de la
bibliografía revisada no se incluye la existencia o no de más de un diagnóstico
en los análisis realizados. Cabanillas J.L.51 introduce esta variable a través del
índice de Comorbilidad de Charlson52 que coincide con nuestro estudio al
definir la comorbilidad como variable predictora de la duración de los procesos.
Llama la atención en los procesos estudiados que en los diagnósticos
relacionados con patología infecciosa es donde más influye el hecho de tener o
no otro diagnóstico. Esto puede estar causado por la influencia del efecto de
este tipo de patologías sobre el estado general del individuo haciendo que la
existencia de otro diagnóstico tenga mayor repercusión sobra la capacidad de
recuperación. No hemos encontrado bibliografía que trate este aspecto.
Coincidiendo con nuestro trabajo tenemos muchos estudios (Álvarez E.,
Catalina C., Benavides F. G., etc.) que afirman que el hecho de tener o no
tener descendencia influye y es determinante en la duración de la IT. Es
importante destacar que al segregar por sexo el hecho de tener descendencia
alarga más la duración en el caso de las mujeres. La razón de este
comportamiento cabe entender que obedece a varias circunstancias como,
entre otras, la atribución histórica por un lado del cuidado materno de los hijos y
la responsabilidad de la salud familiar por parte de la mujer como exponen
Pezo M.C.53 y Hernandez I.54
La provincia de origen tiene también importancia en nuestro modelo predictivo.
En otros estudios como los ya mencionados de Álvarez E. (2005), F.G.
Benavides (2007) y Villaplana M. (2013) se pone de manifiesto. En el primer
51 Cabanillas Moruno J.L. et al. Tiempos óptimos personalizados en Incapacidad temporal. Consejería de salud y Bienestar social de la Junta de Andalucía. Sevilla. 2012.
52 Charlson M.A. et al. A new Method of Clasifying cognosis comorbidity in longitudinal studies, development and validation. J chronics dis.1987:40;373-83
53 Pezo Silva María Concepción, Souza Praça Neide de, Costa Stefanelli Maguida. La mujer responsable de la salud de la familia: Constatando la universalidad cultural del cuidado. Index Enferm [revista en la Internet]. 2004 Nov [citado 2015 Jul 30] ; 13(46): 13-17. Disponible en: http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1132-12962004000200003&lng=es.
54 Hernández Tezoquipa I. El cuidado a la salud en el ámbito doméstico. Rev. Saude Pública.2001;35 (5):443-50
81
estudio se hace referencia al origen rural del proceso como explicativo de
mayor duración, hecho que está en concordancia con nuestro trabajo aunque
no se haya estudiado específicamente de esta manera. González F.J.55 expone
igualmente en su estudio similares resultados. En el segundo caso la
importancia que se le da a la provincia es menor que en nuestro estudio, esta
diferencia puede estar motivada por la agrupación previa por provincias de
características similares que realizamos. Las condiciones de accesibilidad al
sistema sanitario pueden influir en este aspecto sin olvidar otros determinantes
como la mayor añosidad de los colectivos del medio rural. Al igual que
Corrales56 el hecho de esta diferencia de duraciones obedece a múltiples
factores que bien podían ser objeto de un estudio más pormenorizado.
Al igual que Villaplana M. (2013) encontramos que el hecho de tener un trabajo
a tiempo completo alarga la duración media de los procesos en similar medida
en ambos estudios. Para explicar esta diferencia habría que tener en cuenta la
existencia de más factores como la precariedad laboral de los contratos a
tiempo parcial, las modificaciones de la Ley de Reforma Laboral y el efecto de
la crisis en los diferentes tipos de contrato según sean a tiempo completo o
parcial.
Los procesos que son recaída de un episodio previo de IT tienen menor
duración que los que no lo tienen, salvo en el caso de la hernia inguinal que por
su naturaleza quirúrgica presentan una posibilidad de recaída reducida y en los
casos de complicaciones del embarazo condicionados por las fechas de parto
que implican alta en el proceso de incapacidad y nueva baja por maternidad,
encontrando por tanto un sesgo es la duración.
El estado civil del trabajador también muestra diferencias en las duraciones que
concuerda con otros estudios, Catalina C. (2011), Noceda J.57, Bassols A.58 y
55 González-Barcala F.G. et al. Determinantes de la duración de la incapacidad temporal y la vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria. 2006;37 (8);431-8
56 Corrales H. et al. La duración de las bajas por accidente laboral en España ¿Se justifican las diferencias entre comunidades autónomas?. Revista de economía laboral. 2008;5:73-98
57 Noceda J.J. Características del dolor Osteomuscular crónico en paciente de Atención Primaria. Resultados de centro rural y otro urbano. Rev. Soc. Ep. Dolor. 2006;5:287-293
82
otros. En los trabajadores viudos la razón de su mayor duración probablemente
está ligada a la edad con patología más prevalente y pluripatologia unido a las
ciertas situaciones de menor número de familiares convivientes. El hecho de
estar soltero muestra en nuestro estudio menor tiempo medio en la duración de
los procesos de IT en contraposición al trabajo de Vaquero59 que encuentra
mayor duración en las personas que viven sin pareja. Al segregar por sexo, los
viudos tienen mayor duración que las viudas probablemente relacionado con el
tradicional papel de cuidadora de la familia de la mujer.
La diversidad de estudios y de resultados en relación a esta variable traduce la
complejidad del manejo y de su explicación. Es evidente que existen factores
de difícil mesura que entendemos están en estrecha relación con las
condiciones sociales y de vida de cada individuo.
En cuanto a la interacción del diagnóstico con el sexo coincidimos con
Aurrekoetxea60 en relación a la mayor prevalencia de la patología
osteomuscular en ambos sexos y la mayor duración en mujeres. La mayor
duración de los procesos en mujeres es una constante en todos los estudios
revisados.
En el caso de las mujeres es posible que exista un subregistro de los
diagnósticos de complicaciones del embarazo por deslizamiento hacia los
epígrafes relacionados con patología osteomuscular, es decir, gestantes que
tengan diagnóstico de lumbalgia cuando realmente deberían tener el de Otras
complicaciones específicas del embarazo. En este sentido llama la atención
que en el caso del diagnóstico de lumbociatica es de los pocos que junto a
vértigos tienen mayor duración en el sexo masculino. Esta diferencia puede ser
explicada por las mayores cargas posturales y físicas en los trabajos en
hombres. En el caso de los vértigos aun siendo más frecuente en mujeres dura 58 Bassols A. et al. El dolor de espalda en la población catalana. Prevalencia, características y conducta terapéutica. Gac. Sanit. 2003;17(2):97-107
59 Vaquero M. Factores que influyen en la Incapacidad temporal de larga duración: propuestas de screening y de intervención. Disponible en: http://www.seg-social.es/prdi00/groups/public/documents/binario/168544.pdf.
60 Aurrekoetxea et al. Repetición de los procesos de Incapacidad temporal según diagnóstico. Aten. Primaria. 2009;41(8):439-45
83
más en hombres, sería necesario un análisis más profundo para poder explicar
dicha diferencia.
Un problema comentado y que puede afectar a más diagnósticos es la calidad
del registro de los mismos; hemos encontrado estudios como el de Álvarez
Theurer61donde considera aceptable la calidad del diagnóstico de los partes de
baja de IT.
Otra interacción que demostró importancia en el análisis lineal inicial es entre el
diagnóstico y el tipo de pago. La gran diferencia existente puede deberse entre
otras causas a lo que ya mencionada anteriormente prestación refugio, que
entendemos juega el papel más importante en esta variabilidad.
La última variable que explica la duración de los procesos es la interacción
entre el número de episodios de cada proceso y el hábito tabáquico. No se ha
encontrado bibliografía relacionada. Como cabe esperar el hecho de fumar
prolonga la duración media de los procesos, no así la duración mediana.
Observamos un comportamiento no esperado al disminuir las duraciones en los
fumadores a partir del tercer episodio de IT. Este hecho no puede ser explicado
en este análisis debido a no disponer del diagnóstico de cada uno de los
episodios de IT previos de cada proceso ni otros factores relacionados con la
comorbilidad asociada.
En las variables que formaron parte del Anova inicial no se encontraba el sexo
salvo en la interacción con el diagnóstico. En el árbol de decisión final el sexo
tiene importancia como variable independiente aunque en menor medida que
otras.
Para intentar saber el porqué de la mayor duración en mujeres habría que
revisar el papel de la mujer en la sociedad actual y su evolución histórica.
Podemos hablar de una serie de factores que pueden explicar este aumento
como el rol de cuidadora en diferentes ámbitos62, menor accesibilidad al
61 Álvarez Theurer E. Medicina del trabajo y calidad del diagnóstico de los procesos causante de Incapacidad Temporal. Med. Segur. Trab. 2009;55(214):72-79
62 García-Calvente, M. et al. El impacto de cuidar en la salud y la calidad de vida de las mujeres. Gac. Sanit. 2004; 18(2):83-92
84
mercado laboral con más precariedad, situaciones de doble jornada de trabajo,
es decir, la de la actividad profesional específica y la relacionada con la unidad
familiar63 y otras desigualdades sociales que hacen que la mujer esté en peor
situación de salud que el hombre64.
63 García, Y. La dualidad del rol de la mujer trabajadora. Colegio Oficial de Psicólogos. Madrid. 1990
64 Borrel C. et al. La Salud pública desde la perspectiva del género y clase social.2004:18(1):2-6
85
6. CONCLUSIONES
El análisis de las frecuencias de las variables estudiadas y la capacidad de
explicación de la varianza de la duración de los procesos ha permitido
identificar el perfil del trabajador en baja por incapacidad temporal.
Las variables que más influyen en el tiempo de duración de los procesos de
incapacidad temporal son el diagnóstico, la cuenta, el tipo de pago, la
ocupación, la edad, la existencia de codiagnóstico, el hecho de tener o no
descendencia, la provincia, el tipo de contrato del trabajador, el hecho de tener
recaída o no de un episodio anterior, el estado civil, el tener hábito tabáquico y
el sexo.
La variable que mejor explica la duración de los procesos en incapacidad
temporal es el diagnóstico. Los rangos de duración de los mismos son muy
amplios en algunos casos pudiendo atribuirse a falta de cambio de diagnóstico
final respecto al inicial y la calidad de la codificación de los mismos.
El tipo de pago de cada proceso y la cuenta son la segunda y tercera variable
respectivamente que mejor explican la duración. Esto se puede explicar por las
repercusiones socioeconómicas que tiene el alta en los dos tipos de pago y
cuenta quedando en algunas situaciones el trabajador sin ingresos, una vez
finalice su periodo de incapacidad temporal en los casos de pago directo y
cuenta propia que cesan actividad. Esto condiciona en parte la duración de
cada diagnóstico en función de un tipo de pago u otro.
La ocupación también influye en la duración de los procesos habiendo relación
entre el tipo de ocupación y las cargas propias de cada una.
La edad incrementa la duración de los procesos a medida que aumenta. Este
efecto va en relación con el deterioro psicofísico progresivo propio del
86
envejecimiento, que hace que aumenten los periodos de recuperación y a la
vez el efecto negativo de la aparición de nuevas patologías ligadas a la edad.
La existencia de otro diagnóstico tiene un efecto de incremento en la duración
como no podía ser de otra forma. Cabe inferir que esta variable tenga mayor
importancia en la duración pudiendo ser objeto de siguientes estudios.
El estado civil es la cuarta variable en importancia en cuanto a explicar la
duración de los procesos. Parece haber una relación entre la mayor duración
en viudos y divorciados, tanto hombres como mujeres, y las intercurrentes
dificultades sociales que pueden incidir en estos colectivos. Asimismo el hecho
de tener descendencia alarga la duración probablemente relacionado con la
atención y cumplimiento de las necesidades y responsabilidades inherentes a
la familia y descendencia.
El hecho de residir en una u otra provincia tiene un efecto sobre la duración
que parece ir más en relación con las diferencias en cuanto a la accesibilidad al
sistema sanitario entre el medio rural y urbano.
De forma genérica los procesos de incapacidad temporal de trabajadores con
contrato a tiempo completo tiene mayor duración que los de tiempo parcial.
Los procesos que son recaída de un episodio previo tienen menor duración
probablemente relacionado con el alta precoz del primer episodio.
La duración de los procesos es mayor en el sexo femenino en todos los
diagnósticos.
La variabilidad de la duración de los procesos de incapacidad temporal tiene un
componente multifactorial que implica un hándicap importante a la hora de
realizar una predicción de la misma. Una aproximación válida para este fin se
consigue a través de un árbol de decisión que identifica duraciones mayores o
menores de 15 días teniendo en cuenta el diagnóstico, el tipo de pago, la
cuenta, el estado civil, la existencia o no de descendencia, la existencia o no de
codiagnósticos, la ocupación, la edad, la provincia de origen, la existencia o no
de hábito tabáquico, el sexo y el considerar recaída o no de episodio anterior.
87
Para conseguir una predicción más precisa sería necesario disponer de más
variables no contempladas en este estudio que complementaran los resultados
actuales pudiendo ser objeto de trabajos posteriores.
El árbol de decisión obtenido es una herramienta útil a efectos de la gestión de
la incapacidad temporal en el sistema público de salud permitiendo la
planificación y distribución de recursos utilizados en esta prestación. Disponer
de un modelo predictivo de la duración de la incapacidad temporal en los
procesos derivados de la enfermedad común, mejora la toma de decisiones en
todo lo relacionado con la gestión de esta prestación al poder estimar la
duración de cada proceso. Esto permite conocer el impacto asistencial y
económico derivado de los mismos y consecuentemente desarrollar una
planificación estratégica global ajustada a la realidad, sabiendo en el momento
de producirse y dependiendo de las variables utilizadas, la duración estimada
para cada uno de ellos.
88
7. BIBLIOGRAFIA
• Aguado Díaz, Antonio León. Historia de las Deficiencias. Colección Tesis y
Praxis. Escuela Libre Editorial, Fundación ONCE. Madrid, España, 1993.
• Ahan H. Log-gamma regression modeling through regression tree,
Communications in Statistics, Theory an methods. Arkansas: National
center for toxicology Research, Food and Drug Administration; 1996
• Alavinia S.M. Determinats of works ability and its predictive value for
diasability. Occupational Medicine. 2009;59:32-37
• Álvarez Theurer et al. Modelo Predictivo de la duración de Incapacidad
temporal por Lumbalgia. Factores determinantes. 2005;14(3):10-17
• Álvarez Theurer E. Medicina del trabajo y calidad del diagnóstico de los
procesos causante de Incapacidad Temporal. Med. Segur. Trab.
2009;55(214):72-79
• Álvarez Theurer E. et al. Analisis de la duración de los periodos de
incapacidad temporal de los procesos de Andalucia. Factores asociados.
Aten. Primaria:2009;41 (7):387-393
• Allen Cheadle et al. Factor influencing the Duration of Work.Related
Disability: A Population Based Sutdy of Washington State Workers
Compensation. American Journal of Public health. 1994; 84(2):194
• Arrina, A. El concepto de Exclusión en la Política Social. Trabajo social Hoy.
2002;34:47-46
• Aurrekoetxea et al. Repetición de lso procesos de Incapacidad temporal
según diagnóstico. Aten. Primaria. 2009;41(8):439-45
• Bayona X. et al. Variables que influyen en la resolución de una Incapacidad
Temporal por contingencia comunes de muy larga duración. Arch. Prev.
Riesgos Labor. 2004;7(2):64-69
• Barceló M.A. Modelos Marginales y Condicionales en el Análisis de
Supervivencia Multivariante. Gac. Sanit. 2002;16 (2):59-68
89
• Bassols A. et al. El dolor de espalda en la población catalana. Prevalencia,
características y conducta terapéutica. Gac. Sanit. 2003;17(2):97-107
• Benavides F.G..Ocuppational categories and sickness absence certified as
attributable to comon disease. European journal of Public Health. 2003:13
(1);51-55.
• Benavides F.G. et al. Reincorporación al trabajo después de un episodio de
Incapacidad Temporal por contingencia común: Papel de la edad, el sexo, la
actividad económica y la comunidad autónoma. Rev. Esp. Salud Pública.
2007;81(2):183-190
• Benavides F.G. et al. Evaluación de la gestión de los casos de Incapacidad
Temporal por contingencia común de más de 15 días en Cataluña. Gac.
Sanit. 2010; 24(3):215-219
• Borrel C. et al. La Salud pública desde la perspectiva del género y clase
social.2004:18(1):2-6
• Cabanillas J.L. et al. Tiempos óptimos personalizados en Incapacidad
temporal. Consejeria de Salud y Bienestar Social de la Junta de Andalucia.
Sevilla;2012
• Castejón J. et al. La Incapacitat Laboral per Coningencias Comunes en
Catalunya. Barcelona: Consell de Treball, Economic i Social de Catalunya.
2003
• Catalina C. et al. Predictores de la duración de Incapacidad Temporal por
Contingencias comunes en los Trastornos de Ansiedad. Gaceta Sanitaria.
2011;27(1):40-46
• Cermi. (Internet). Madrid: Grupo Editorial Cinca; 2008 (citado 28 agosto
2013).Disponibleen:http://www.cermi.es/esES/ColeccionesCermi/Cermi.es/L
ists/Coleccion/Attachments/60/Laimagensocialdelaspersonascondiscapacid
ad.pdf
• Charlson M.A. et al. A new Method of Clasifying cognosis comorbidity in
longitudinal studies, development and validation. J chronics
dis.1987:40;373-83
• Corrales H. et al. La duración de las bajas por accidente laboral en España
¿Se justifican las diferencias entre comunidades autónomas?.Revsita de
economía laboral. 2008;5:73-98
90
• Datosmacro (internet). Madrid. Abril 2015 (citado el 5 de mayo de 2015).
Disponible en: http://www.datosmacro.com/pib/espana
• Delclos J. et al. Duración de la Incapacidad temporal por contingencia
común por grupos diagnósticos. Arch. Prev. Riesgos labor. 2010; 13(4):180-
187
• Everitt B., Horton T., An Introduction to Applied Multivariante Analysis with
R. Londres: Springer Science+Business Media; 2011.
• Freund, Y. and Schapire, R. A decision-theoretic generalization of online
learning and an application to boosting. Journal of Computer and System
Sciences. 1997: 55;119-139.
• García Álvarez, G. Conceptos básicos en incapacidad temporal. Jano.
2003;65(1495):1770-1773
• García-Calvente, M. et al. El impacto de cuidar en la salud y la calidad de
vida de las mujeres. Gac. Sanit. 2004; 18(2):83-92
• García, Y. La dualidad del rol de la mujer trabajadora. Colegio Oficial de
Psicólogos. Madrid. 1990
• González Barcala F.J. et al. Determinantes de la Duración de la Incapacidad
temporal y vuelta al trabajo en un área sanitaria de Galicia. Aten. Primaria.
2006;37(8):431-8
• Guerrero F. Salud. Enfermedad y Muerte: Lecturas desde la antropología
Sociocultural. Revista Mad.2004;10:1
• Guijarro J.L.. Las Enfermedades en la Ancianidad. Anales Sis. San.
Navarra. 199;2 (1):85-94
• Hastie T., Tibshirani R., Friedman J. The elements of Statistical Learning. 2ª
Ed. California: Springer; 2008
• Hernández Tezoquipa I. El cuidado a la salud en el ámbito doméstico. Rev.
Saude Pública.2001;35 (5):443-50
• Hosmer D.W. &Lemeshow S..Applied Logistic Regression. 2ª ed. New York
.Willey; 1989
• Inzua Canales, Victor. “Una conciencia histórica y la discapacidad”. Revista
trabajo social Nueva Época.2001; 3: 77
• Isladelcofre (internet). 2013 (citado21 de agosto 2013). Disponible en:
http://www.isladelcofre.com/01normas.htm
91
• James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical
Learning. Londres: Springer; 2013
• Laplantin F. Antropología de la Enfermedad. Paris:Editions Payot;1965
• Mauro Brigeiro. Envejecimiento exitoso y tercer edad. Problemas y retos
para la promoción de la salud. Investigación y Educación en
Enfermeria.2005;23 (1):102-109
• Noceda J.J. Características del dolor Osteomuscular crónico en paciente de
Atención Primaria. Resultados de centro rural y otro urbano. Rev. Soc. Ep.
Dolor. 2006;5:287-293
• Pezo Silva María Concepción, Souza Praça Neide de, Costa Stefanelli
Maguida. La mujer responsable de la salud de la familia: Constatando la
universalidad cultural del cuidado. Index Enferm [revista en la Internet].
2004 Nov [citado 2015 Jul 30]; 13(46): 13-17. Disponible en:
http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1132-
12962004000200003&lng=es.
• Rawlings, J.O., Pantula S.G., Dickey D.A. Applied Regresion Analysis. 2ª
Ed. New York: Springer; 1998
• Rivas P. Salud Mental e incapacidad Temporal en población laboral de
Cataluña. Arch. Prev. Riesgos Labor. 2008;11(2):81-86
• Royo-Bordonada M.A. La duración de la Incapacidad Laboral y sus factores
asociados. Gac. Sanit. 1999;13(3):177-184
• Santamaria P. et al. Prevalencia de Simulación en Incapacidad Temporal:
Percepción de los profesionales de la Salud. Clínica y Salud. 2013;24:139-
151
• Tora Rocamora I. et al. Duración de los episodios de Incapacidad temporal
por contingencia común según regiones sanitarias en Cataluña. Rev. Esp.
Salud Pública. 2010;84(1):61-69
• Seg-social:Anexo al informe económico financiero. Presupuestos ejercicio
2012 (internet). Madrid: Seguridad Social; 2012 (citado el 24 de julio 2013 ).
Disponible en: http://www.seg-social.es/prdi00/groups/public/ documentos/
binario/169364.pdf
• Seg-social (internet). Madrid: Seguridad Social; 2015 (citado el 24 de julio
2013). Disponible en :http://www.segsocial.es/Internet_1/ Estadística/Est/
92
Otras_Prestaciones_de_la_Seguridad_Social/Incapacidad_Temporal/index.
htm
• Van Belle G., Fisher L.D., Heagerty P.J., Lumley T. Bioestadistics. A
methodology for the Health Sciences. 2ª ed. Wiley ;2004
• Vaquero M. Factores que influyen en la Incapacidad temporal de larga
duración: propuestas de secreening y de intervención. Disponible en:
http://www.segsocial.es/prdi00/groups/public/documents/binario/168544.pdf.
• Villaplana García M.A. .El Absentismo laboral por Incapacidad Temporal
derivada de Contingencia Comunes en el periodo 2005-2010. Tesis
Doctoral. Universidad de Murcia. 2012
• Villaplana M. Grado de efecto de las variables sociodemográficas, laborales,
organizativas y del entorno en la duración de la Incapacidad Temporal por
contingencias comunes en España. Aten. Primaria. 2015;47(2):90-98
93
8. ANEXOS
94
ANEXO I. Documento de autorización de Ibermutuamur para el
análisis de los datos
95
96
97
98
99
ANEXO II. Distribución de diagnósticos por epígrafe
EPIGRAFEGASTROENTERITIS 009.0 009.1 009.2LUMBOCIATICA 722.10 724.3RESFRIADO COMUN 465 460
OTRAS GASTROENTERITIS Y COLITIS NO INFECCIOSAS
558 558.9
ANSIEDAD 300.0 300.09 293.84 300.02 300.00ESGUINCE TOBILLO 845.00 845.0BRONQUITIS 466 466.0MIGRAÑA 346.9 346 346.90 346.1 346.10 346.00DEPRESION 311 300.4LUMBALGIA 724.2FARINGITIS AGUDA 462GRIPE 487CERVICALGIA 723.1AMIGDALITIS AGUDA 463ANGINA ESTREPTOCOCICA
034.0
VERTIGO Y MAREOS 780.4COLICO RENAL 788.0GRIPE CON OTRAS MANIFESTACIONES RESPIRATORIAS
487.1
AMENAZA DE ABORTO 640
HERNIA INGUINAL 550
ESGUINCE CERVICAL 847
DORSALGIA 724.1DIARREA 787.9SINDROME DEL TUNEL CARPIANO
354.0
OTRAS COMPLICACIONES ESPECIFICAS DEL EMBARAZO
646.8
CEFALEA 784.0
BRONQUITIS NO AGUDA NO CRONICA
490
REACCION DE ADAPTACION
309
MENISCOPATIA INTERNA 836.0
DIAGNOSTICOS INCLUÍDOS
100
ANEXO III. Algoritmo del árbol de decisión del mode lo
Nodo 0
Categoría % n
69,3 76691<1530,7 34022>15
Total 100,0 110713
dIAGNOSTICOMejora=0,163
Real15
Nodo 1
Categoría % n
36,0 16821<1564,0 29946>15
Total 42,2 46767
PAGOMejora=0,018
LUMBALGIA; LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; ESGUINCE TOBILLO; AMENAZA DE ABORTO; DEPRESION; HERNIA INGUINAL; ESGUINCE CERVICAL; DORSALGIA; TUNEL CARPIANO; OTRAS COMPLIC. ESP EMBARAZO; REACCIÓN ADAPTACIÓN; MENISCOPATIA INTERNA
Nodo 2
Categoría % n
93,6 59870<156,4 4076>15
Total 57,8 63946
PAGOMejora=0,007
GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; BRONQUITIS; ANGINA STRP; VERTIGO Y MAREOS; COLICO RENAL; GRIPE OTRAS MANIFEST RESP; DIARREA; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA; MIGRAÑA; AMIGDALITIS AGUDA
Nodo 3
Categoría % n
43,0 16249<1557,0 21500>15
Total 34,1 37749
dIAGNOSTICOMejora=0,013
DELEGADO
Nodo 4
Categoría % n
6,3 572<1593,7 8446>15
Total 8,1 9018
DIRECTO
Nodo 5
Categoría % n
94,8 59420<155,2 3276>15
Total 56,6 62696
dIAGNOSTICOMejora=0,004
DELEGADO
Nodo 6
Categoría % n
36,0 450<1564,0 800>15
Total 1,1 1250
dIAGNOSTICOMejora=0,001
DIRECTO
Nodo 7
Categoría % n
49,4 15075<1550,6 15418>15
Total 27,5 30493
ECIVILMejora=0,007
LUMBALGIA; LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; ESGUINCE TOBILLO; DEPRESION; DORSALGIA
Nodo 8
Categoría % n
16,2 1174<1583,8 6082>15
Total 6,6 7256
AMENAZA DE ABORTO; HERNIA INGUINAL; ESGUINCE CERVICAL; TUNEL CARPIANO; OTRAS COMPLIC. ESP EMBARAZO; REACCIÓN ADAPTACIÓN; MENISCOPATIA INTERNA
Nodo 9
Categoría % n
81,2 8206<1518,8 1896>15
Total 9,1 10102
codiag dicoMejora=0,001
BRONQUITIS; VERTIGO Y MAREOS; COLICO RENAL; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA
Nodo 10
Categoría % n
97,4 51214<152,6 1380>15
Total 47,5 52594
codiag dicoMejora=0,001
GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; ANGINA STRP; GRIPE OTRAS MANIFEST RESP; DIARREA; MIGRAÑA; AMIGDALITIS AGUDA
Nodo 11
Categoría % n
15,4 111<1584,6 612>15
Total 0,7 723
BRONQUITIS; VERTIGO Y MAREOS; COLICO RENAL; DIARREA; CEFALEA; BRONQUITIS NO AGUDA NO CRONICA; MIGRAÑA
Nodo 12
Categoría % n
64,3 339<1535,7 188>15
Total 0,5 527
CUENTAMejora=0,000
GASTROENTERITIS; FARINGITIS AGUDA; RESFRIADO COMUN; GRIPE; GASTOENTERITIS NO INFECCIOSAS; ANGINA STRP; GRIPE OTRAS MANIFEST RESP; AMIGDALITIS AGUDA
Nodo 13
Categoría % n
57,6 10999<1542,4 8085>15
Total 17,2 19084
codiag dicoMejora=0,002
DESCONOCIDO
Nodo 14
Categoría % n
35,7 4076<1564,3 7333>15
Total 10,3 11409
dIAGNOSTICOMejora=0,002
CASADO/A; SOLTERO/A; DIVORCIADO/A; PAREJA HECHO; VIUDO/A
Nodo 15
Categoría % n
81,8 8201<1518,2 1822>15
Total 9,1 10023
No
Nodo 16
Categoría % n
6,3 5<1593,7 74>15
Total 0,1 79
Si
Nodo 17
Categoría % n
97,4 51207<152,6 1344>15
Total 47,5 52551
No
Nodo 18
Categoría % n
16,3 7<1583,7 36>15
Total 0,0 43
Si
Nodo 19
Categoría % n
35,9 42<1564,1 75>15
Total 0,1 117
AJENA
Nodo 20
Categoría % n
72,4 297<1527,6 113>15
Total 0,4 410
PROPIA
Nodo 21
Categoría % n
58,4 10989<1541,6 7813>15
Total 17,0 18802
dIAGNOSTICOMejora=0,002
No
Nodo 22
Categoría % n
3,5 10<1596,5 272>15
Total 0,3 282
Si
Nodo 23
Categoría % n
27,8 1726<1572,2 4476>15
Total 5,6 6202
LIUMBOCIATICA; ANSIEDAD; CERVICALGIA; DEPRESION
Nodo 24
Categoría % n
45,1 2350<1554,9 2857>15
Total 4,7 5207
SEXMejora=0,001
LUMBALGIA; ESGUINCE TOBILLO; DORSALGIA
Nodo 25
Categoría % n
49,0 3300<1551,0 3436>15
Total 6,1 6736
OCUPACIONMejora=0,001
LIUMBOCIATICA; ANSIEDAD; DEPRESION
Nodo 26
Categoría % n
63,7 7689<1536,3 4377>15
Total 10,9 12066
SEXMejora=0,001
LUMBALGIA; CERVICALGIA; ESGUINCE TOBILLO; DORSALGIA
Nodo 27
Categoría % n
54,9 1385<1545,1 1138>15
Total 2,3 2523
HIJOSDICOMejora=0,000
H
Nodo 28
Categoría % n
36,0 965<1564,0 1719>15
Total 2,4 2684
M
Nodo 29
Categoría % n
53,4 2687<1546,6 2346>15
Total 4,5 5033
cluster provinciaMejora=0,000
MANUFACTURA, CONSTRUCCION Y MINERIA; 99; AGRICULTURA Y PESCA
Nodo 30
Categoría % n
36,0 613<1564,0 1090>15
Total 1,5 1703
DIRECCION EMPRESAS; OPERADORES Y MONTADORES; TRABAJADORES NO CUALIFICADOS; EMPLEADOS ADMINIISTRATIVOS; TECNICOS Y PROFESIONALES DE APOYO; CIENTIFICOS E INTELECTUALES; SERVICIOS RESTAURACION Y PROTECCION; FUERZAS ARMADAS
Nodo 31
Categoría % n
72,7 4043<1527,3 1515>15
Total 5,0 5558
dIAGNOSTICOMejora=0,001
H
Nodo 32
Categoría % n
56,0 3646<1544,0 2862>15
Total 5,9 6508
cluster provinciaMejora=0,000
M
Nodo 33
Categoría % n
49,6 601<1550,4 611>15
Total 1,1 1212
TRAMEDADMejora=0,000
SI
Nodo 34
Categoría % n
59,8 784<1540,2 527>15
Total 1,2 1311
NO
Nodo 35
Categoría % n
59,7 1794<1540,3 1210>15
Total 2,7 3004
3,0; 4,0
Nodo 36
Categoría % n
44,0 893<1556,0 1136>15
Total 1,8 2029
1,0; 2,0
Nodo 37
Categoría % n
56,5 892<1543,5 688>15
Total 1,4 1580
cluster provinciaMejora=0,000
CERVICALGIA; ESGUINCE TOBILLO
Nodo 38
Categoría % n
79,2 3151<1520,8 827>15
Total 3,6 3978
LUMBALGIA; DORSALGIA
Nodo 39
Categoría % n
61,1 2247<1538,9 1433>15
Total 3,3 3680
3,0; 4,0
Nodo 40
Categoría % n
49,5 1399<1550,5 1429>15
Total 2,6 2828
dIAGNOSTICOMejora=0,000
1,0; 2,0
Nodo 41
Categoría % n
55,3 403<1544,7 326>15
Total 0,7 729
<= 43 - 51
Nodo 42
Categoría % n
41,0 198<1559,0 285>15
Total 0,4 483
> 43 - 51
Nodo 43
Categoría % n
64,3 480<1535,7 267>15
Total 0,7 747
3,0; 4,0
Nodo 44
Categoría % n
49,5 412<1550,5 421>15
Total 0,8 833
dIAGNOSTICOMejora=0,000
1,0; 2,0
Nodo 45
Categoría % n
47,1 1154<1552,9 1294>15
Total 2,2 2448
TRAMEDADMejora=0,000
LUMBALGIA; CERVICALGIA
Nodo 46
Categoría % n
64,5 245<1535,5 135>15
Total 0,3 380
ESGUINCE TOBILLO; DORSALGIA
Nodo 47
Categoría % n
41,0 182<1559,0 262>15
Total 0,4 444
CERVICALGIA
Nodo 48
Categoría % n
59,1 230<1540,9 159>15
Total 0,4 389
ESGUINCE TOBILLO
Nodo 49
Categoría % n
44,8 811<1555,2 998>15
Total 1,6 1809
<= 38 - 42
Nodo 50
Categoría % n
53,7 343<1546,3 296>15
Total 0,6 639
> 38 - 42
<15>15