Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el...

7
Cir Esp. 2007;81(1):31-7 31 Introducción Los recientes cambios sociales están teniendo un pro- fundo impacto en la práctica médica, en general, y quirúr- gica, en particular. El cirujano ha perdido parte de su pro- tagonismo y los resultados de la cirugía se toman en consideración y debaten no sólo en publicaciones espe- Originales Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el sistema POSSUM Fernando Machado a , Carlos Barberousse a , Pablo Santiago a , Enrique Barrios b y Luis Carriquiry a a Clínica Quirúrgica. Hospital Maciel. Unidad de Bioestadística. Departamento de Biofísica. Facultad de Medicina de Montevideo. Montevideo. Uruguay. b Unidad de Bioestadística. Departamento de Biofísica. Facultad de Medicina de Montevideo. Uruguay. Resumen Objetivo. Validar la aplicación en Uruguay del siste- ma POSSUM como puntuación predictiva de los re- sultados de la cirugía y como método para comparar los resultados de la asistencia entre instituciones con características diferentes en Montevideo. Pacientes y métodos. Se estudió prospectivamente a 815 pacientes, de 2 instituciones de asistencia dife- rentes, una pública y otra privada, con asignación de puntuaciones POSSUM, cálculo de morbilidad y mor- talidad esperadas de acuerdo a esas puntuaciones (y los de la variante p-POSSUM) y registro de las com- plicaciones y muertes postoperatorias. Resultados. Las cifras de morbilidad y mortalidad observadas estaban dentro de los rangos predichos por POSSUM (y p-POSSUM) y el uso de estas puntua- ciones mostró que no había una diferencia significa- tiva en los resultados de la cirugía entre ambas insti- tuciones, teniendo en cuenta las diferentes categorías de pacientes y operaciones realizadas. Conclusiones. Los autores concluyen que POS- SUM es una puntuación de riesgo quirúrgico que puede usarse en diferentes contextos quirúrgicos y que será muy útil en el futuro para comparar diferen- tes resultados de la cirugía entre instituciones, regio- nes y países de todo el mundo. Palabras clave: Índices de gravedad. Riesgo quirúrgico. Sistema POSSUM. COMPARISON OF SURGICAL OUTCOMES IN TWO POPULATIONS WITH RISK ADJUSTMENT USING THE POSSUM SYSTEM Objective. To validate the application of the Physio- logical and Operative Severity Score for the enumera- tion of Mortality and morbidity (POSSUM) system in Uruguay in order to validate its broader utility not only for predicting surgical results but also for com- paring surgical outcomes in two different healthcare institutions in Montevideo. Methodology. A total of 815 patients in two institu- tions (one public and the other private) were prospec- tively studied. A POSSUM score was assigned, ex- pected morbidity and mortality according to POSSUM [(and its variant, Portsmouth PSSUM (p-POSSUM)] were calculated, and postoperative complications and deaths were registered. Results. Observed morbidity and mortality were within the range predicted by POSSUM (and p-POS- SUM) application. The use of these scores showed no significant differences in surgical outcomes between the two institutions, considering the different mix of patients and interventions. Conclusion. The authors conclude that the POS- SUM scoring system can be used in different surgical settings. In the future, this system will be highly use- ful to compare different surgical outcomes among in- stitutions, regions and countries all over the world. Key words: Severity illness index. Surgical risk. POS- SUM system. La Comisión Sectorial de Investigación Científica (CSIC) de la Universidad de la República ha financiado en parte este trabajo. Correspondencia: Dr. C. Barberousse Carrara. Simón Bolívar, 1359, apto. 801. CP11300 Montevideo. Uruguay. Correo electrónico: [email protected] Manuscrito recibido el 10-11-2005 y aceptado el 4-7-2006. 143.196

Transcript of Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el...

Cir Esp. 2007;81(1):31-7 31

Introducción

Los recientes cambios sociales están teniendo un pro-fundo impacto en la práctica médica, en general, y quirúr-gica, en particular. El cirujano ha perdido parte de su pro-tagonismo y los resultados de la cirugía se toman enconsideración y debaten no sólo en publicaciones espe-

Originales

Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgomediante el sistema POSSUMFernando Machadoa, Carlos Barberoussea, Pablo Santiagoa, Enrique Barriosb y Luis Carriquirya

aClínica Quirúrgica. Hospital Maciel. Unidad de Bioestadística. Departamento de Biofísica. Facultad de Medicina de Montevideo.Montevideo. Uruguay.b Unidad de Bioestadística. Departamento de Biofísica. Facultad de Medicina de Montevideo. Uruguay.

Resumen

Objetivo. Validar la aplicación en Uruguay del siste-ma POSSUM como puntuación predictiva de los re-sultados de la cirugía y como método para compararlos resultados de la asistencia entre institucionescon características diferentes en Montevideo.

Pacientes y métodos. Se estudió prospectivamentea 815 pacientes, de 2 instituciones de asistencia dife-rentes, una pública y otra privada, con asignación depuntuaciones POSSUM, cálculo de morbilidad y mor-talidad esperadas de acuerdo a esas puntuaciones (ylos de la variante p-POSSUM) y registro de las com-plicaciones y muertes postoperatorias.

Resultados. Las cifras de morbilidad y mortalidadobservadas estaban dentro de los rangos predichospor POSSUM (y p-POSSUM) y el uso de estas puntua-ciones mostró que no había una diferencia significa-tiva en los resultados de la cirugía entre ambas insti-tuciones, teniendo en cuenta las diferentescategorías de pacientes y operaciones realizadas.

Conclusiones. Los autores concluyen que POS-SUM es una puntuación de riesgo quirúrgico quepuede usarse en diferentes contextos quirúrgicos yque será muy útil en el futuro para comparar diferen-tes resultados de la cirugía entre instituciones, regio-nes y países de todo el mundo.

Palabras clave: Índices de gravedad. Riesgo quirúrgico.Sistema POSSUM.

COMPARISON OF SURGICAL OUTCOMES IN TWOPOPULATIONS WITH RISK ADJUSTMENT USING THE POSSUM SYSTEM

Objective. To validate the application of the Physio-logical and Operative Severity Score for the enumera-tion of Mortality and morbidity (POSSUM) system inUruguay in order to validate its broader utility notonly for predicting surgical results but also for com-paring surgical outcomes in two different healthcareinstitutions in Montevideo.

Methodology. A total of 815 patients in two institu-tions (one public and the other private) were prospec-tively studied. A POSSUM score was assigned, ex-pected morbidity and mortality according to POSSUM[(and its variant, Portsmouth PSSUM (p-POSSUM)]were calculated, and postoperative complicationsand deaths were registered.

Results. Observed morbidity and mortality werewithin the range predicted by POSSUM (and p-POS-SUM) application. The use of these scores showed nosignificant differences in surgical outcomes betweenthe two institutions, considering the different mix ofpatients and interventions.

Conclusion. The authors conclude that the POS-SUM scoring system can be used in different surgicalsettings. In the future, this system will be highly use-ful to compare different surgical outcomes among in-stitutions, regions and countries all over the world.

Key words: Severity illness index. Surgical risk. POS-SUM system.

La Comisión Sectorial de Investigación Científica (CSIC) de laUniversidad de la República ha financiado en parte este trabajo.

Correspondencia: Dr. C. Barberousse Carrara.Simón Bolívar, 1359, apto. 801. CP11300 Montevideo. Uruguay.Correo electrónico: [email protected]

Manuscrito recibido el 10-11-2005 y aceptado el 4-7-2006.

143.196

cializadas, sino también diariamente en la prensa ordina-ria. Esta situación ha llevado en las últimas décadas aldesarrollo y a la aplicación de sistemas objetivos de audi-toría en los que se puede establecer el margen de riesgopara un paciente y una intervención determinados y per-mitir de esta manera una evaluación más equilibrada delresultado final de la práctica quirúrgica.

Estos sistemas, que utilizan puntuaciones objetivas,pueden predecir el riesgo de la cirugía para una determi-nada población de pacientes. A su vez, permiten compa-rar los resultados quirúrgicos entre servicios o cirujanosdentro de una misma institución o entre diferentes institu-ciones a partir de la medida de morbilidad y mortalidadpara situaciones parecidas.

Desde la introducción del sistema ASA de la SociedadAmericana de Anestesiología, se han desarrollado múlti-ples sistemas de evaluación quirúrgica y del riesgo gene-ral de los pacientes, y probablemente el sistema APA-CHE sea el más utilizado en la actualidad.

El sistema POSSUM (Physiological and Operative Seve-rity Score for the enUmeration of Mortality and morbidity)lo desarrolló Copeland et al1 en 1991 como un método deestratificación de todos los tipos de pacientes quirúrgicosde acuerdo a su grado de riesgo, y en el que únicamentese utilizan hallazgos clínicos, exámenes de laboratorio ylos datos del protocolo operatorio, de modo que puede uti-lizarse en una gran variedad de situaciones diferentes.

Se desarrolló a partir de un análisis aleatorizado, multi-variado, de 62 variables diferentes, durante 6 meses enuna etapa inicial y luego con 35 variables durante un pe-ríodo similar, antes de llegar a su actual formulación.Este índice permite evaluar los rangos esperados demorbilidad y mortalidad ajustadas por riesgo para unadeterminada situación, a partir de la consideración de 2puntuaciones: una fisiológica, con 12 factores, y la otrade gravedad operatoria, que utiliza 6 factores.

Distintos estudios2-4 han validado este sistema, espe-cialmente en el Reino Unido, y, en menor medida, enotros países europeos, que tanto consideran su versiónoriginal como la modificación metodológica realizada porWhiteley et al5 en Portsmouth (p-POSSUM).

Pacientes y métodos

Se estudiaron 2 series consecutivas de pacientes pertenecientes a 2unidades quirúrgicas diferentes, entre febrero de 1998 y junio de 2000.La unidad 1 correspondió a un servicio de cirugía general de un Hospi-tal público en el que se realiza docencia universitaria (Clínica Quirúrgi-ca 2, Hospital Maciel). La unidad 2 correspondió a un servicio de ciru-gía general en un centro de asistencia de salud privado.

Se incluyó en el estudio a todos los pacientes mayores de 15 años,tanto los sometidos a procedimientos quirúrgicos de elección, como deurgencia. Su seguimiento se extendió hasta los 30 días del postopera-torio o hasta su muerte, si ésta ocurrió dentro de este período. Única-mente se excluyó a los pacientes a los que se operó de modo ambula-torio y a los que requirieron procedimientos muy complejos, conparticipación de equipos multidisciplinarios en su tratamiento.

La información se recolectó de modo prospectivo en una hoja de re-cogida de datos similar a la publicada por Copeland et al1. Se registra-ron datos demográficos, diagnóstico clínico e intraoperatorio, procedi-mientos quirúrgicos realizados y evolución final de los pacientes.

La muerte intrahospitalaria o dentro los primeros 30 días del posto-peratorio se aceptó como definición de mortalidad. Se aceptaron las de-finiciones de complicación postoperatoria establecidas por Copeland ensu publicación original.

A cada paciente se le asignó una puntuación fisiológica antes de la

intervención quirúrgica y una puntuación de gravedad operatoria des-pués de ella. Los datos de la puntuación fisiológica se recogieron almomento del ingreso del paciente, una vez que se contó con el resulta-do de los exámenes de laboratorio. La puntuación de gravedad operato-ria se pudo completar una vez definidos todos los aspectos inherentesa la cirugía requeridos por ésta: entidad del sangrado, presencia o node contaminación peritoneal, etc. No hubo diferencias entre las unida-des respecto a la forma de preparación preoperatoria de los pacientes.

La puntuación fisiológica tomó en cuenta 12 factores (edad, estadocardíaco, estado respiratorio, presión arterial, pulso, escala de Glas-gow, hemoglobina, leucocitosis, nitrógeno ureico en sangre, ionogramay electrocardiograma) y se establecieron 4 grados con asignación depuntuaciones de modo exponencial (1, 2, 4, 8) con el consiguiente ran-go entre 12 y 84 puntos (tabla 1). La puntuación de gravedad operatoriaincluyó 6 factores (tipo y número de procedimientos, pérdida total esti-mada de sangre, contaminación peritoneal, presencia de malignidad yoportunidad de la cirugía).

En cuanto a la apreciación de la entidad del procedimiento quirúrgicoefectuado (cirugía menor, moderada, mayor o mayor +), se utilizaron loscriterios originales; de esta forma, la cirugía de moderada gravedad in-cluyó: apendicectomía, colecistectomía, mastectomía; ejemplos de ciru-gía mayor fueron: resección intestinal, colecistectomía con coledocoto-mía, cirugía vascular periférica o amputación mayor. Se considerócomo “cirugía mayor+” la cirugía aórtica, la cirugía de resección rectal,la resección pancreática o hepática y la esofagectomía.

Se asignó una puntuación en escala exponencial similar a la puntua-ción fisiológica, resultando un rango de 6 a 44 puntos (tabla 2). La pun-tuación POSSUM total tuvo un rango de 18 a 128 puntos.

Toda la información fue recolectada manualmente en formularios im-presos y posteriormente transferidos a una planilla de Microsoft Excel(Microsoft Corporation, Washington, District of Columbia, USA) para suanálisis.

El riesgo individual de morbilidad se calculó a partir de la ecuación:Loge (R/ [1-R]) = -5,91 + (0,16 × puntuación fisiológica) + (0,19 × pun-tuación de gravedad operatoria) propuesto por Copeland et al y valida-do en publicaciones previas.

El riesgo individual de mortalidad se calculó a partir de la ecuación:Loge (R/ [1-R]) = -9,37 + (0,19 × puntuación fisiológica) + (0,15 × pun-tuación de gravedad operatoria), propuesto en p-POSSUM, que se haconsiderado más seguro en las estudios ulteriores6.

Se compararon las tasas de morbilidad y mortalidad entre las unida-des y se efectuó, además, mediante un análisis lineal, una estratifica-ción en grupos de riesgo en la que para cada estrato se comparó lamorbilidad y la mortalidad observadas/esperada.

Las comparaciones se ajustaron mediante el test χ2 para las varia-bles cualitativas y mediante el test de la t de Student para las variablescuantitativas. Las diferencias de distribución de las puntuaciones entreambas unidades quirúrgicas se ajustaron mediante el test de Kolmogo-rov-Smirnov. El nivel de significación utilizado fue del 5%.

Para evaluar la validez externa de los modelos ajustados hay queconsiderar 2 aspectos: la discriminación y la calibración. La discrimina-ción es la capacidad del modelo para distinguir entre 2 individuos conresultados opuestos y puede cuantificarse mediante el área bajo la cur-va ROC7.

Puede demostrarse que cuanto mayor sea esta área, tanto mejorserá la capacidad discriminatoria del modelo.

La calibración establece el grado de semejanza entre el resultadoobservado y el predicho por el modelo, tomando en cuenta la evalua-ción de las probabilidades de ocurrencia del fallo en las distintas cate-gorías (deciles). Esto se cuantifica mediante la prueba de Hosmer y Le-meshow (HL)8, que tiene como resultado el valor de un coeficiente cuyasignificación puede ensayarse mediante una prueba de χ2. Cuanto ma-yor sea el valor de p en este test, tanto mejor será la calibración delmodelo.

El área bajo la curva ROC se calculó a partir de la población total(ambas unidades) para analizar la capacidad de discriminación de losmodelos de ajuste7. La calibración del modelo se evaluó mediante eltest estadístico χ2 de HL8.

Resultados

Se estudió a un total de 815 pacientes, 471 pertene-cientes a la unidad 1 y 344 a la unidad 2. La distribuciónpor edad, sexo y oportunidad de la cirugía fue similar en

Machado F et al. Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el sistema POSSUM

32 Cir Esp. 2007;81(1):31-7

ambas unidades (tabla 3). El tipo de cirugía realizadatambién era comparable en ambas, a pesar de un predo-minio de la cirugía colorrectal y mamaria en la unidad 2 yde la cirugía de trauma en la unidad 1 (tabla 4).

La mortalidad fue de 3,6% en la unidad 1 y de 2,9% enla unidad 2, diferencia no significativa (χ2 = 0,31, p >0,05).

La morbilidad fue de 27,3% para la unidad 1 y de30,5% para la unidad 2, diferencia que tampoco fue sig-nificativa (χ2 = 0,95, p > 0,05).

Como se ha expresado antes, la capacidad discrimi-nante del modelo se evaluó mediante el cálculo del áreabajo la curva ROC (tabla 5).

La distribución de las puntuaciones fisiológica y de gra-vedad operatoria presentó curvas similares en ambas po-blaciones (tabla 6).

Si se considera la población total de pacientes estratifi-cados de acuerdo con los deciles de probabilidad, el mo-delo en general predijo un número mayor de muertes es-peradas en relación con las finalmente observadas,excepto en el segundo decil (tabla 7). De todas formas, elmodelo fue un predictor aceptable de mortalidad (HL =9,21 p = 0,10) pero un predictor menos seguro de morbi-lidad (HL = 82,5 p < 0,001) (tabla 8).

Un grupo importante de pacientes en ambas poblacio-nes se encontró dentro de puntuaciones bajas; es decir,

Machado F et al. Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el sistema POSSUM

Cir Esp. 2007;81(1):31-7 33

TABLA 1. POSSUM. Puntuación fisiológica

Puntuación

1 2 4 8

Edad (años) ≤ 60 61-70 ≥ 71

Signos cardíacos Sin falla Diuréticos, digoxina, Edema periférico; Hipertensión venosa tratamiento anti- tratamiento con yugularhipertensivo o por warfarinacardiopatía isquémica

Radiografía de tórax Cardiomegalia límite Cardiomegalia

Historia respiratoria Sin disnea Disnea de esfuerzo Disnea limitante Disnea de reposo

Radiografía de tórax EPOC leve EPOC moderado Fibrosis o consolidación

Tensión sistólica (mmHg) 110/130 131/170 ≥ 171 -

Pulso (lat/min) 50-80 81-100 101-120 ≥ 121

40-49

Escala de coma de Glasgow 15 12-14 9-11 ≤ 8

Hemoglobina (g/100 ml) 13-16 11,5-12,9 10,0-11,4 ≥ 18,1

16,1-17,0 17,1-18,0

Leucocitosis (× 1012/l) 4-10 10,1-20,0 o 3,1-4,0 ≥ 20,1 o ≤ 3,0

Urea (mmol/l) ≤ 7,5 7,6-10,0 10,1-15,0 ≥ 15,1

Sodio (mmol /l) ≥ 136 131-135 126-130 ≤ 125

Potasio (mmol/l) 3,5-5,0 3,2-3,4 o 5,1-5,3 2,9-3,1 o 5,4-5,9 ≤ 2,8 o ≥ 6,0

Electrocardiograma Normal Fibrilación auricular Cualquier arritmia o ≥ 5 extrasístoles/min

Ondas Q o cambios ST/T

EPOC: enfermedad pulmonar obstructiva crónica.

TABLA 2. POSSUM. Puntuación de gravedad operatoria

Puntuación

1 2 4 8

Gravedad operatoria Menor Moderada Mayor Mayor+Múltiples procedimientos 1 2 > 2Pérdida total de sangre (ml) ≤ 100 101-500 501-999 ≥ 1.000Contaminación peritoneal Ninguna Menor (fluido seroso) Pus localizado Contenido intestinal

libre, sangre o pusPresencia de malignidad Ninguna Sólo tumor primario Metástasis ganglionares Metástasis a distanciaModo de cirugía Electiva Reanimación urgente Emergencia (cirugía

> 2 h intervención quirúrgica inmediata) < 2 h < 24 h después de la admisión desde la admisión

pacientes de bajo riesgo, sometidos a operaciones decomplejidad baja. La media de la puntuación fisiológicafue de 17,68 para la unidad 1 y de 17,89 para la unidad 2(no significativa). La puntuación de gravedad operatoriafue igualmente similar: 11,55 y 11,47, respectivamente.

Sin embargo, si se tiene en cuenta la evolución final delos pacientes, se encontró una marcada diferencia en lamedia de la puntuación POSSUM para los pacientes quetuvieron una buena evolución postoperatoria y fueron da-dos de alta (unidad 1: 28,70; unidad 2: 28,90) compara-

dos con los que murieron después de la intervención qui-rúrgica (unidad 1: 43,88; unidad 2: 44,40), sin diferenciassignificativas entre ambas unidades (p = 0,90).

El análisis lineal (tablas 9-12) de la morbilidad y la mor-talidad observada/esperada mostró en ambas unidadesresultados globales similares, y se confirmaron las pre-dicciones de la ecuación POSSUM de morbilidad y p-POSSUM de mortalidad.

En la tabla 13 se muestra la relación de mortalidad es-tandarizada, que expresa la relación observado/esperadode la mortalidad total para cada unidad.

Discusión

Las tasas brutas de morbilidad y mortalidad son medi-dores poco fieles de los resultados de la intervención qui-rúrgica, ya que no consideran los caracteres particularesde la población, así como tampoco la complejidad delprocedimiento a realizar. En los últimos años, han surgi-do como respuesta a esta deficiencia sistemas más ade-cuados para evaluar los resultados de la cirugía. En algu-nas revisiones se han analizado los diferentes sistemasde evaluación de riesgo y pronósticos, propuestos en lasúltimas décadas9. Pese a ser uno de los sistemas deaparición más reciente –a principios de la década de losaños noventa-, el POSSUM ha sido validado como uninstrumento muy útil y seguro de un muy amplio espectrode la actividad quirúrgica. Éste ofrece 3 ventajas en rela-

Machado F et al. Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el sistema POSSUM

34 Cir Esp. 2007;81(1):31-7

TABLA 3. Distribución demográfica de los pacientes

Unidad 1 Unidad 2 p

Edad (media) 50,7 58,5 NSSexo V : M 248 : 223 154 : 190 NSCirugía urgente (%) 175 (37) 140 (41)Cirugía electiva (%) 296 (63) 204 (59) NS

M: mujer; NS: no significativo; V: varón.

TABLA 5. Área bajo la curva ROC

ABC LIIC LSIC

0,71 0,66 0,750,81 0,72 0,89

ABC: área bajo la curva ROC; IC: intervalo de confianza; LIIC: límite inferior del IC del95%; LSIC: límite superior del IC del 95%.

TABLA 4. Operaciones realizadas

Unidad 1 Unidad 2 p

Pared abdominal 64 (13,6) 43 (12,5) NSMama 3 (0,6) 25 (7,3) < 0,05Tiroides 15 (3,2) 13 (3,8) NSVesícula biliar 100 (21,2) 59 (17,2) NSGastroduodenal 25 (5,3) 11 (3,3) NSIntestino delgado 20 (4,3) 20 (5,9) NSHepato-bilio-pancreática 53 (11,3) 34 (10,0) NSEsófago 4 (0,8) 5 (1,5) NSColorrectal 32 (6,8) 47 (13,7) 0,002Apéndice 46 (9,8) 31 (9,0) NSAmputaciones 21 (4,4) 10 (3,0) NSVascular 31 (6,6) 20 (5,8) NSTrauma 17 (3,6) 0 (0) -Miscelánea 40 (8,5) 22 (6,4) NSTotal 471 (100) 344 (100)

NS: no significativo.Los valores entre paréntesis son porcentajes.

TABLA 6. Distribución de las puntuaciones POSSUM

Puntuación POSSUM* Unidad 1 (%) Unidad 2 (%)

18–25 187 (40) 138 (40)26–35 199 (42) 134 (39)36–45 62 (13) 47 (14)46–55 17 (4) 21 (6)56–65 6 (1) 4 (1)Total 471 344

ks = 0.0486, p = 0.6975ks: Test de Kolmogorov-Smirnov (ver el texto).*Suma de la puntuación fisiológica más la puntuación de gravedad operatoria.

TABLA 7. Estadístico de Hosmer-Lemeshow (HL) paramortalidad

Número Observados Esperados O/E

0,0 < R ≤ 0,1 729 9 11,239481 0,80074870,1 < R ≤ 0,2 38 6 5,339956 1,12360490,2 < R ≤ 0,3 20 5 5,102255 0,97995880,3 < R ≤ 0,4 13 3 4,343168 0,69074010,4 < R ≤ 0,5 4 0 1,742062 0,00000000,5 < R ≤ 0,6 5 1 2,809651 0,35591600,6 < R ≤ 1,0 6 3 4,576594 0,6555093

HL: 9.21; O/E: relación de muertes observadas frente a esperadas.p = 0,10.Se presentan las muertes observadas y las esperadas. Se estratificó a los pacientes endeciles de riesgo (ver p. 142-3 en Hosmer y Lemeshow8), donde R representa la proba-bilidad de muerte en cada grupo. Los pacientes con probabilidad mayor de 0,6 se consi-deraron como un grupo.

TABLA 8. Estadístico Hosmer-Lemeshow (HL) para morbilidad

Número Observados Esperados O/E

0,0 < R ≤ 0,1 143 17 11,18372 1,52006600,1 < R ≤ 0,2 209 30 29,42145 1,01966430,2 < R ≤ 0,3 122 45 29,84714 1,50768220,3 < R ≤ 0,4 84 22 29,30025 0,75084680,4 < R ≤ 0,5 72 27 32,26561 0,83680420,5 < R ≤ 0,6 46 22 24,90864 0,88322750,6 < R ≤ 1,0 139 71 109,53273 0,6482081

HL: 82,51288; O/E: relación de muertes observadas frente a esperadas.p < 0,001.Se presentan complicaciones observadas y esperadas. Los pacientes se han estratifica-do en deciles de riesgo (ver tabla 7), donde R representa la probabilidad de morbilidaden cada grupo. Los pacientes con probabilidad mayor de 0,6 se consideraron como ungrupo.

Machado F et al. Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el sistema POSSUM

Cir Esp. 2007;81(1):31-7 35

TABLA 9. Muertes observadas/esperadas en la unidad 1. Análisis lineal

Mortalidad (%) Número Mortalidad Muertes Muertes esperadas, Muertes observadas/de pacientes media (%) observadas p-POSSUM esperadas

< 10 427 1,58 6 6,75 0,8910–19 21 14,15 5 2,97 1,6820–29 9 25,68 1 2,31 0,4330–39 8 32,39 2 2,59 0,7740–49 1 40,85 0 0,41 0,0050–59 2 55,72 0 1,11 0,0060–69 1 65,70 1 0,66 1,5270–79 0 - - - -80–89 2 86,95 2 1,74 1,15≥ 90 0 - - - -Total 471 3,94 17 18,56 0,92

TABLA 10. Morbilidad observada/esperada en la unidad 1. Análisis lineal

Morbilidad (%) Número de Morbilidad Morbilidad Morbilidad esperada, Morbilidad observada/pacientes media (%) observada p-POSSUM esperada

< 10 74 8,02 10 5,94 1,6810–19 126 13,83 23 17,42 1,3220–29 68 24,65 25 16,76 1,4930–39 55 35,12 14 19,32 0,7240–49 45 44,52 13 20,04 0,6550–59 31 53,92 12 16,71 0,7260–69 21 64,00 7 13,44 0,5270–79 16 73,90 6 11,82 0,5180–89 19 85,46 8 16,24 0,49≥ 90 16 94,79 11 15,17 0,73Total 471 32,45 129 152,53 0,85

TABLA 11. Muertes observadas/esperadas en la unidad 2. Análisis lineal

Mortalidad (%) Número Mortalidad Muertes Muertes esperadas, Muertes observadas/de pacientes media (%) observadas p-POSSUM esperadas

< 10 302 1,46 3 4,40 0,6810–19 17 13,82 1 2,35 0,4320–29 11 25,45 4 2,80 1,4330–39 5 35,20 1 1,76 0,5740–49 3 44,67 0 1,34 0,0050–59 2 54,50 1 1,09 0,9260–69 3 63,33 0 1,90 0,0070–79 0 - - - -80–89 1 88,00 0 0,88 0,00≥ 90 0 - - - -Total 344 4,80 10 16,51 0,61

TABLA 12. Morbilidad observada/esperada en la unidad 2. Análisis lineal

Morbilidad (%) Número de Morbilidad Morbilidad Morbilidad esperada, Morbilidad observada/pacientes media (%) observada p-POSSUM esperada

< 10 62 7,35 7 4,56 1,5410–19 89 14,09 6 12,54 0,4820–29 55 24,04 21 13,22 1,5930–39 28 34,18 7 9,57 0,7340–49 25 44,68 13 11,17 1,1650–59 17 53,41 11 9,08 1,2160–69 22 64,32 11 14,15 0,7870-79 15 74,67 7 11,20 0,6280–89 12 84,58 10 10,15 0,99≥ 90 19 94,47 12 17,95 0,67Total 344 33,02 105 113,58 0,92

ción con el APACHE ll, probablemente el sistema másutilizado en los últimos años: la consideración tanto de lamortalidad como de la morbilidad quirúrgica, su capaci-dad para usarlo en todo tipo de pacientes, y no sólo enlos internados en unidades de cuidados intensivos o si-milares, y su fácil accesibilidad, dado que requiere única-mente la recolección de datos clínicos y de laboratoriosimples. Se ha considerado superior al APACHE ll inclusoen pacientes internados en unidades de alta dependen-cia10. Pero, al igual que el POSSUM, la mayoría de losestudios de validación se han diseñado en el Reino Uni-do y muy pocos en otros países europeos.

Una revisión en PubMed reveló únicamente un estudiopublicado acerca de la aplicación del POSSUM en siste-mas de control sanitario en países subdesarrollados, igual-mente con muy buenos resultados11. Pero, como sus auto-res reconocen, la mayoría de los cirujanos en Malasia hanestudiado y obtenido sus títulos de posgrado en el ReinoUnido y se rigen por el sistema británico de atención.

De este modo, hemos decidido evaluar la aplicabilidady la validez del POSSUM en un país de Sudamérica, conuna tradición diferente en el cuidado sanitario y en el en-trenamiento quirúrgico, para así reafirmar la universali-dad del sistema.

Algunos autores británicos12 han cuestionado la aplica-bilidad del POSSUM en poblaciones quirúrgicas corrien-tes y han encontrado en su experiencia que sólo el 30%de los pacientes operados se han asignado adecuada-mente a una puntuación POSSUM determinada. Nuestraexperiencia ha sido totalmente distinta: los datos clínicosy operatorios, así como los estudios de laboratorio, for-man parte de la información corrientemente requerida enla evaluación preoperatoria de todo paciente sometido acirugía. En lo que respecta al cuestionamiento acerca delos estudios de laboratorio requeridos, quizás el ionogra-ma pudo haberse excluido en la evaluación de pacientesde bajo riesgo, pero, en la actualidad, dado que la mayorparte de los estudios se realizan con máquinas automáti-cas, éste no supone un esfuerzo adicional ni aumentasignificativamente los costes.

Desde el inicio seleccionamos la ecuación POSSUMoriginal para el estudio de la morbilidad y la ecuación p-POSSUM para el estudio de la mortalidad. La aplicaciónde la ecuación POSSUM para analizar la mortalidad sis-temáticamente sobrestima la mortalidad global, especial-mente en el grupo de menor riesgo. A pesar de que estasobrestimación puede prevenirse mediante el uso de unanálisis exponencial, ello exigiría un trabajo matemáticoadicional que no estaría justificado.

El análisis de la población global reveló un ajuste mejorcon la ecuación p-POSSUM para los datos de mortalidad(HL = 9,21), en comparición con la aplicación del POS-SUM para la morbilidad (HL = 82,5).

También intentamos utilizar el POSSUM para estable-cer una comparación válida entre la evolución postopera-toria en 2 grupos diferentes de pacientes, en diferentessituaciones de atención sanitaria. En Uruguay, se ha ex-presado, y en general se acepta, aunque sin cifras que lodemuestren, que los resultados de la actividad quirúrgicadesarrollada en los servicios universitarios son peoresque los de la actividad privada. Esto obedecería a facto-res múltiples y bien conocidos: desnutrición y peor mediosocioeconómico en los pacientes asistidos en mediosuniversitarios, dificultades logísticas de la asistencia pú-blica de Uruguay, gran número de intervenciones quirúr-gicas llevadas a cabo por cirujanos en formación, etc. To-das estas variables contribuirían a generar esta supuestadiferencia. Hemos utilizado el POSSUM para determinaresta verdad asumida empíricamente de un modo científi-co y nuestros resultados no han confirmado esta hipóte-sis. La mortalidad esperada y la observada fue similarentre ambas unidades, sin diferencias significativas a pe-sar de las ligeras diferencias entre ambos grupos, con unpredominio de la cirugía mamaria y colorrectal en la uni-dad 2 y de la cirugía del trauma en la unidad 1 (tabla 4).Un aspecto interesante encontrado en el análisis de lamortalidad, y no mencionado en publicaciones previas,fue el hallazgo de una marcada diferencia en la puntua-ción POSSUM entre los pacientes que supervivieron ylos que fallecieron después de la intervención quirúrgica.La puntuación fue inferior a 30 en los pacientes supervi-vientes y mayor de 40 en los fallecidos. A pesar de quePOSSUM y p-POSSUM se elaboraron para auditar po-blaciones y no para predecir evoluciones individuales13,esta diferencia podría ofrecer una orientación sobre laalta probabilidad de una evolución desfavorable en unpaciente determinado.

Conclusiones

No hay antecedentes en Uruguay de la aplicación desistemas objetivos de auditoría para evaluar y compararlos resultados de la práctica quirúrgica en diferentes cir-cunstancias.

La utilización del sistema POSSUM con esta intenciónha demostrado que es posible y razonablemente segurodentro de un sistema asistencial muy diferente a aquéldonde se creó. Por otra parte, su aplicación ha permitidoa los autores mostrar que no hay diferencias significati-vas en los resultados entre 2 unidades diferentes de estesistema, contrariamente a lo ampliamente aceptado, peroque nunca se ha demostrado científicamente.

Agradecimientos

Los autores agradecen a Rafael Alonso, profesor ad-junto de Bioestadística en la Unidad de Métodos Cuanti-tativos de la Facultad de Medicina de Montevideo, por suinvalorable colaboración en este proyecto.

Machado F et al. Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el sistema POSSUM

36 Cir Esp. 2007;81(1):31-7

TABLA 13. Relación de mortalidad estandarizada (SMR,standardized mortality ratio, razón de observados/esperadospara datos totales de mortalidad) para cada unidad.Resultados de la calibración de los datos de mortalidad porunidad

Unidad 1 Unidad 2

Estadístico HL 8,13 5,61Valor p 0,42 0,69SMR 0,92 0,60

HL: Hosmer y Lemeshow.

Bibliografía1. Copeland GP, Jones D, Walters M. POSSUM: a scoring system for

surgical audit. Br J Surg. 1991;78:355-60.2. Sagar PM, Hartley MN, Mancey-Jones B, Sedman PC, May J, Mac-

Fie J. Comparative audit of colorectal resection with the POSSUMscoring system. Br J Surg. 1994;81:1492-4.

3. Sagar PM, Hartley MN, MacFie J, Taylor BA, Copeland GP. Compa-rison of individual surgeon’s performance: risk-adjusted analysis withPOSSUM scoring system. Dis Colon Rectum. 1996;39:654-8.

4. Brunelli A, Fianchini A, Gesuita R, Carle F. POSSUM scoring sys-tem as an instrument of audit in luna resection surgery. Ann Thorac.Surg. 1999;67:329-31.

5. Whiteley MS, Prytherch DR, Higgins B, Weaver PC, Prout WG. Anevaluation of the POSSUM surgical scoring system. Br J Surg.1996;83:812-5.

6. Prytherch DR, Whiteley MS, Higgins B, Weaver PC, Prout WG, Po-well SJ. POSSUM and Portsmouth-POSSUM for predicting morta-lity. Br J Surg. 1998;85:1217-20.

7. Hanley JA, McNeil BJ. The meaning and use of the area under thereceiver operating characteristic (ROC) curve. Radiology. 1982;143:29-36.

8. Hosmer DW, Lemeshow S. Applied logistic regression. 2nd ed. NewYork: John Wiley; 2000.

9. Jones HJ, De Cossart L. Risk scoring in surgical patients. Br JSurg. 1999;86:149-57.

10. Jones DR, Copeland GP, De Cossart L. Comparison of POSSUMwith APACHE ll for prediction of outcome from a surgical high-de-pendency unit. Br J Surg. 1992;79:1293-6.

11. Yii MK, Ng KJ. Risk-adjusted surgical audit with the POSSUM scoring system in a developing country. Br J Surg. 2002;89:110-3.

12. Bann SD, Sarin S. Comparative audit: the trouble with POSSUM. JR Soc Med. 2001;94:632-4.

13. Copeland GP. The POSSUM system of surgical audit. Arch Surg.2002;137:15-9.

Machado F et al. Comparación de resultados de la cirugía en dos poblaciones ajustadas por riesgo mediante el sistema POSSUM

Cir Esp. 2007;81(1):31-7 37