Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte...

6
VI IBEROLAB 1 DETERMINACIÓN Y VALIDACIÓN DE UN VALOR DE CORTE EN UN MÉTODO DESARROLLADO PARA LA CONFIRMACIÓN DE INTOXICACIONES POR INGESTA DE FOSFURO DE ALUMINIO C. Roque 1 1 Laboratorios Criminalísticos y de Ciencias Forenses, Dirección de Medicina Forense. Edif. Martínez Boquín, barrio Guacerique. Tegucigalpa, Honduras. C.A. E-mail: [email protected] ÁREA TEMÁTICA. REQUISITOS TÉCNICOS RESUMEN. La determinación de fosfuro de aluminio en especímenes biológicos es un ensayo de alta demanda en el campo forense de Honduras. Para cubrir esta necesidad, el Laboratorio Químico Toxicológico desarrolló un método de cuantificación de aluminio elemental en contenido gástrico por espectrofotometría de absorción atómica electrotérmica, bajo el supuesto de una diferencia significativa entre los niveles de individuos que ingirieron el fumigante y aquellos que murieron por otras causas. Para lograr ese propósito se determinó un límite de referencia realizando mediciones a 32 especímenes organizados en tres conjuntos, identificados respectivamente como “verdaderos positivos”, “verdaderos negativos 1” y “verdaderos negativos 2”. Se calcularon las concentraciones utilizando un modelo de calibración de segundo orden estimado en condiciones de precisión entre días, aplicando ajustes por efectos de matriz y de dilución. Partiendo de las mediciones y considerando sus fuentes de variabilidad, se generaron de cada grupo poblaciones de 10000 valores probables, por medio de un modelo estadístico de simulación con la técnica de Monte Carlo. Con la población simulada a partir de “verdaderos negativos 1” se estableció un límite de corte que fue evaluado con los grupos restantes. Se obtuvo estadísticamente una sensitividad de 99,98 %, una especificidad de 97,50% y una eficiencia del 98,74 %, además de unos índices de falsos negativos y falsos positivos apropiados. Se demostró por medio de ensayos y aproximaciones probabilísticas que el límite de corte es eficaz y él método desarrollado adecuado para su propósito. PALABRAS CLAVE. Cut-off, valor de corte, límite de detección, validación, métodos cualitativos. 1.- Introducción Debido a la alta incidencia de intoxicaciones por ingesta de fosfuro de aluminio se hizo necesario desarrollar un método que fuera rápido, eficaz y resolutivo. Existen métodos de ensayos en fluidos biológicos ampliamente conocidos para identificar el ion fosfuro, entre los más comunes y accesibles están los de coloración, sin embargo sus límites de detección no siempre resultan satisfactorios (Raina, Shrivastava, Mathur, & Dogra, 2004). También se ha propuesto la cromatografía de gases con detección termoiónica que es más sensible y específica (Musshoff, Preuss, & Madea, 2008) aunque requiere de una manipulación preanalítica en extremo cuidadosa, y sin embargo no está exento de falsos negativos y falsos positivos, prevaleciendo los problemas con la recuperación debido a la volatilidad del analito y la posible la presencia de interferentes desconocidos. En todo caso, el Laboratorio Químico Toxicológico no cuenta con un detector termoiónico. Consecuentemente, se decidió desarrollar un método propio. El método desarrollado se fundamenta en una confirmación indirecta por medio de la cuantificación de un producto secundario de la reacción entre el fosfuro de aluminio y el ácido clorhídrico del jugo gástrico. Cuando el fosfuro de aluminio reacciona se transforma en fosfina gaseosa, en tanto que el aluminio forma sales, principalmente cloruros, las cuales permanecen en el saco estomacal y son fácilmente recuperables en la recolección del contenido gástrico. Se espera entonces que una ingesta de fosfuro de aluminio produzca colateralmente un incremento significativo de las concentraciones típicas en el contenido gástrico. Se trata entonces de un método cualitativo basado en mediciones, con el cual se clasifica un espécimen como “normal” o como “atípico” en función de su concentración de aluminio. Esta distinción se logra naturalmente por medio de un límite de referencia adecuado. Por tanto, además de una evaluación de los parámetros de desempeño cuantitativos, la validación del método exige una caracterización escrupulosa de parámetros cualitativos, concretamente la evaluación de la probabilidad de falsos positivos y falsos negativos, así como la sensibilidad, especificidad y eficiencia. Las mediciones de aluminio en contenido gástrico por múltiples razones conllevan una variabilidad grande, por lo que el límite de corte debe ubicarse en un punto tal que cumpla los siguientes requisitos especificados: -Se encuentre ampliamente por encima del límite de detección del método y sea coherente con el límite de cuantificación. -Implique un riesgo de falsos negativos con una probabilidad menor al 5 %. -Implique un riesgo de falsos positivos con una probabilidad menor al 5 %. -Permita una sensitividad y especificidad mayores o iguales al 90%, y una eficiencia no menor al 95%.

description

Publicación Iberlolab C Roque (Requisitos Tecnicos 0075)

Transcript of Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte...

Page 1: Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte Carlo

VI IBEROLAB

1

DETERMINACIÓN Y VALIDACIÓN DE UN VALOR DE CORTE EN UN MÉTODO DESARROLLADO PARA LA CONFIRMACIÓN DE INTOXICACIONES POR INGESTA DE FOSFURO DE ALUMINIO

C. Roque1

1 Laboratorios Criminalísticos y de Ciencias Forenses, Dirección de Medicina Forense. Edif. Martínez Boquín, barrio Guacerique. Tegucigalpa, Honduras. C.A. E-mail: [email protected] ÁREA TEMÁTICA. REQUISITOS TÉCNICOS RESUMEN. La determinación de fosfuro de aluminio en especímenes biológicos es un ensayo de alta demanda en el campo forense de Honduras. Para cubrir esta necesidad, el Laboratorio Químico Toxicológico desarrolló un método de cuantificación de aluminio elemental en contenido gástrico por espectrofotometría de absorción atómica electrotérmica, bajo el supuesto de una diferencia significativa entre los niveles de individuos que ingirieron el fumigante y aquellos que murieron por otras causas. Para lograr ese propósito se determinó un límite de referencia realizando mediciones a 32 especímenes organizados en tres conjuntos, identificados respectivamente como “verdaderos positivos”, “verdaderos negativos 1” y “verdaderos negativos 2”. Se calcularon las concentraciones utilizando un modelo de calibración de segundo orden estimado en condiciones de precisión entre días, aplicando ajustes por efectos de matriz y de dilución. Partiendo de las mediciones y considerando sus fuentes de variabilidad, se generaron de cada grupo poblaciones de 10000 valores probables, por medio de un modelo estadístico de simulación con la técnica de Monte Carlo. Con la población simulada a partir de “verdaderos negativos 1” se estableció un límite de corte que fue evaluado con los grupos restantes. Se obtuvo estadísticamente una sensitividad de 99,98 %, una especificidad de 97,50% y una eficiencia del 98,74 %, además de unos índices de falsos negativos y falsos positivos apropiados. Se demostró por medio de ensayos y aproximaciones probabilísticas que el límite de corte es eficaz y él método desarrollado adecuado para su propósito. PALABRAS CLAVE. Cut-off, valor de corte, límite de detección, validación, métodos cualitativos.

1.- Introducción Debido a la alta incidencia de intoxicaciones por ingesta de fosfuro de aluminio se hizo necesario desarrollar un método que fuera rápido, eficaz y resolutivo. Existen métodos de ensayos en fluidos biológicos ampliamente conocidos para identificar el ion fosfuro, entre los más comunes y accesibles están los de coloración, sin embargo sus límites de detección no siempre resultan satisfactorios

(Raina, Shrivastava, Mathur, & Dogra, 2004). También se ha propuesto la cromatografía de gases con detección termoiónica que es más sensible y específica (Musshoff, Preuss, & Madea, 2008) aunque requiere de una manipulación preanalítica en extremo cuidadosa, y sin embargo no está exento de falsos negativos y falsos positivos, prevaleciendo los problemas con la recuperación debido a la volatilidad del analito y la posible la presencia de interferentes desconocidos. En todo caso, el Laboratorio Químico Toxicológico no cuenta con un detector termoiónico. Consecuentemente, se decidió desarrollar un método propio. El método desarrollado se fundamenta en una confirmación indirecta por medio de la cuantificación de un producto secundario de la reacción entre el fosfuro de aluminio y el ácido clorhídrico del jugo gástrico. Cuando el fosfuro de aluminio reacciona se transforma en fosfina gaseosa, en tanto que el aluminio forma sales, principalmente cloruros, las cuales permanecen en el saco estomacal y son fácilmente recuperables en la recolección del contenido gástrico. Se espera entonces que una ingesta de fosfuro de aluminio produzca colateralmente un incremento significativo de las concentraciones típicas en el contenido gástrico. Se trata entonces de un método cualitativo basado en mediciones, con el cual se clasifica un espécimen como “normal” o como “atípico” en función de su concentración de aluminio. Esta distinción se logra naturalmente por medio de un límite de referencia adecuado. Por tanto, además de una evaluación de los parámetros de desempeño cuantitativos, la validación del método exige una caracterización escrupulosa de parámetros cualitativos, concretamente la evaluación de la probabilidad de falsos positivos y falsos negativos, así como la sensibilidad, especificidad y eficiencia. Las mediciones de aluminio en contenido gástrico por múltiples razones conllevan una variabilidad grande, por lo que el límite de corte debe ubicarse en un punto tal que cumpla los siguientes requisitos especificados: -Se encuentre ampliamente por encima del límite de detección del método y sea coherente con el límite de cuantificación. -Implique un riesgo de falsos negativos con una probabilidad menor al 5 %. -Implique un riesgo de falsos positivos con una probabilidad menor al 5 %. -Permita una sensitividad y especificidad mayores o iguales al 90%, y una eficiencia no menor al 95%.

Page 2: Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte Carlo

VI IBEROLAB

2

Para determinar un valor de corte se requiere disponer de un conjunto representativo de especímenes como referentes, cuya procedencia esté apropiadamente documentada y la causa de muerte registrada sea contundente. La factibilidad de reunir una cantidad conveniente de especímenes postmortem es poca, así que se aplicó una simulación de Monte Carlo que permitió generar estadísticamente 30000 datos partiendo de un conjunto de 32 muestras recolectadas durante las autopsias que rutinariamente se practican. Se utilizaron 10000 valores para estimar el límite de corte, calculándose de ellos el límite superior de un intervalo de confianza con una significancia del 5 % como referente. Las 20000 concentraciones simuladas a partir de 16 especímenes se organizaron en Tablas de contingencias, según cayeran a un lado u otro del valor de corte en prueba, estableciendo cuatro categorías de resultados: verdaderos positivos, falsos positivos (error tipo I), verdaderos negativos y falsos negativos (error tipo II). 2.- Equipo y materiales 2.1 Equipo instrumental -Espectrofotómetro de absorción atómica, marca Varian, modelo SpectrAA 200. -Atomizador de horno de grafito, marca Varian, modelo GTA 100. -Agitador eléctrico de alta velocidad, Vórtex, modelo Genier, marca Fisher. -Microcentrífuga, Abbot®, Velocidad única de 12500 rpm. 2.2 Equipo volumétrico -Micropipeta, Eppendorf® con rango operativo de (10 – 100) Μl. -Pipeta volumétrica de 1 mL de capacidad, clase A. -Matraces volumétricos de vidrio de 5 mL de capacidad, Pyrex®, clase A. -Tubos para microcentrífuga de 1,5 ml, de polipropileno. -Dilutor Repipet®, de vidrio Pyrex®, Teflon y resina fluorocarbono. -Beackers, probetas y otros contenedores, de polietileno o polimetilpenteno. El material de vidrio fue lavado con solución de ácido nítrico al 50% previo a su uso. Los matraces se mantuvieron permanentemente llenos con ácido nítrico al 50%, y fueron lavados con abundante agua desionizada antes de su uso. 2.3 Solventes y reactivos -Agua destilada y desionizada. -Solución de ácido clorhídrico 1% v/v y ácido cítrico 50% p/v: preparada con ácido clorhídrico (ACS), ácido cítrico

monohidrato (p.a.) y agua destilada y desionizada. -Solución de ácido nítrico 1% v/v y ácido cítrico 1% p/v: preparada con ácido nítrico (ultratrazas, TraceSelect), marca Fluka, ácido cítrico monohidrato (p.a.), marca Fisher, y agua destilada y desionizada. -Solución de nitrato de magnesio 1 g/L, en ácido nítrico. -1%, grado ultratrazas, marca Fluka.

2.4 Materiales de referencia -Solución de cloruro de aluminio, 1,001 g/L en ácido clorhídrico, trazable con BAM -Fosfuro de aluminio en formulación comercial: Tabletas de 3 gramos, “CELPHOS 56 FT®”, con 56% de ingrediente activo según etiqueta. 3.- Selección y manipulación de especímenes Los especímenes fueron clasificados en dos grupos: 1. Verdaderos negativos (VN): especímenes cuya historia médico legal confirma que la causa de muerte fue ajena a intoxicaciones por ingestión de fosfuro de aluminio. Estos fueron subdivididos en: -verdaderos negativos 1 (VN1) constituido por 16 especímenes; y -verdaderos negativos 2 (VN2), constituido por 6 especímenes. De estos, 3 fueron acidificados adicionando 100 µL de solución de ácido clorhídrico 3 M para evaluar un efecto de especiación, provocando la formación de cloruros de aluminio, ya que el pH de los contenidos estomacales tiende a incrementar durante el almacenamiento favoreciendo especies hidróxido. 2. Verdaderos positivos (VP): constituido por 4 muestras provenientes de individuos cuya historia médico legal confirma la muerte fue por ingestión de tabletas de fosfuro de aluminio y 6 muestras preparadas a partir de los especímenes del grupo VN2, tomando una alícuota de cada una y fortificándola con distintas cantidades de formulación de fosfuro de aluminio pulverizada y homogenizada. La preparación del grupo VN2 y las muestras fortificadas de VP se detallan en la Tabla 1. Las muestras fueron preservadas adicionando una solución de ácido clorhídrico 1% y ácido cítrico 50% como estabilizador, conforme a los pasos 1 al 4 del procedimiento de ensayo y se mantuvieron a -20 °C durante los períodos de almacenamiento. Tabla 1. Preparación de especímenes VN2 y fortificados de VP.

Especímen Volumen Ácido

clorhídrico

Volumen inicial

de alícuota

Cantidad adicionada de formulación

Volumen final de alícuota*

100 µL 1,0 mL 24,8 mg 1,5 mL M1

1,5 mL ----- 1,5 mL 1,0 mL 28,1 mg 1,5 mL

M2 1,5 mL ----- 1,5 mL

100 µL 1,0 mL 45,6 mg 1,5 mL M3

1,5 mL ----- 1,5 mL 1,0 mL 45,6 mg 1,5 mL

M4 1,5 mL ----- 1,5 mL

Page 3: Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte Carlo

VI IBEROLAB

3

Especímen Volumen Ácido

clorhídrico

Volumen inicial

de alícuota

Cantidad adicionada de formulación

Volumen final de alícuota*

100 µL 1,0 mL 70,2 mg 1,5 mL M5

1,5 mL ----- 1,5 mL 1,0 mL 77,1 mg 1,5 mL

M6 1,5 mL ----- 1,5 mL

*El volumen de las alícuotas fue completado con el mismo espécimen 4.- Procedimiento de ensayo El procedimiento consta de los siguientes pasos: -se homogeniza el contenido gástrico en agitador Vórtex -se transfieren aproximadamente 1,5 ml del espécimen a un tubo de microcentrífuga -se adiciona a la alícuota 100 µL de solución de ácido clorhídrico 1% y ácido cítrico 50% (estabilizador) -se homogeniza la mezcla en Vórtex -si la mezcla tiene muchas partículas groseras se centrifuga por no más de 2 minutos -se transvasan 100 µL a un matraz volumétrico de 5 mL y se diluye a volumen de aforo con solución de ácido nítrico 1% y ácido cítrico 1% (solvente) -se transfieren 25 µL de la mezcla diluida a un segundo tubo de microcentrífuga y se adicionan 1,5 mL de solvente. Los calibradores se preparan a partir de este paso de la misma manera que las muestras, diluyendo diferentes porciones de 50 µL (1, 2, 3 y 4 porciones respectivamente) -cada tubo de microcentrífuga se instala directamente en el automuestreador del espectrofotómetro y se ejecuta la medición bajo las condiciones operativas programadas. -se registran la absorbancias de las muestras y un blanco de solvente y se estima la concentración de aluminio elemental en la muestra aplicando la siguiente ecuación:

( )·FR1

DFa1Vd1V

22·b

blkAxA0b2b21bb1

expC −⋅⋅−−−+−

=

(1)

donde, b2, b1 y b0 = coeficientes de regresión del modelo de calibración cuadrático, Ax = absorbancia de la muestra, Ablk = absorbancia del blanco de solvente, Va1 = volumen de la alícuota en el paso 6 (0,1 mL), Vd1 = volumen de la dilución en el paso 6 (5,0 mL), FD = factor de ajuste por efecto de dilución, FR = factor de ajuste por efecto de matriz, FD = resultado de una función de segundo orden del factor de dilución efectuado en el paso 6. En tanto se efectúe la dilución como está establecido en el procedimiento, FD tendrá un valor constante de 1,08. FR es resultado de una aproximación cuadrática de ajuste por efecto de matriz, establecida al verificarse un efecto sistemático variable sobre la recuperación en función de la concentración del analito. La función de corrección es: FR = -0,00022276·C2 – 0,00852853·C + 1,36764562 (2)

donde, C = concentración calculada por la ecuación (3)

( )22·b

blkAxA0b2b21bb1

C

−−−+−= (3)

5.- Desarrollo y validación del valor de corte 5.1 Límites analíticos: Valor crítico (LC), límite de detección (LD) y límite de cuantificación (LQ) Se determinó el límite de detección midiendo la absorbancia de 6 réplicas de blanco de solvente durante 5 días consecutivos, para establecer la concentración calculada máxima que puede ser atribuida a los mismos. Se calculó el desvío típico y la media, de la absorbancia, en condiciones de reproducibilidad entre días (Sblk y Ablk respectivamente) considerándose como la máxima imprecisión para establecer un límite crítico. Se estimó el límite superior del intervalo de confianza del blanco, con una significancia del 5% como valor de respuesta crítico (ALC) según la ecuación (4)

ALC = Ablk + t(4;1-α) · Sblk (4)

Se calculó el valor crítico de concentración (CLC) insertando ALc como equivalente de la expresión Ax - Ablk en la ecuación (3), la cual se aplica al no haber dilución ni la presencia de matriz. Partiendo de CLc se obtiene el límite de detección (CLD) por la siguiente ecuación:

t(4;1-α) CLD = CLC + 2·b2·CLC + b1

· (S2R(TOTAL)) 1/2

(5)

donde, b1 y b2 = coeficientes de regresión de la ecuación (1) para una curva preparada en condiciones de reproducibilidad entre días y, S2R(TOTAL) = varianza total del modelo de calibración, compuesta por la varianza residual, la precisión entre días y la repetibilidad. El límite de cuantificación se define como la concentración mínima (CLQ) que puede ser determinada con una incertidumbre relativa máxima especificada, que para el método es de 33,3%, equivalente a tres veces CLC:

CLQ = 3·CLC (6)

Con el fin de verificar los requisitos especificados para los límites de detección y cuantificación, CLD y CLQ fueron ajustados con el factor de dilución, FR y FD, suponiéndoles como muestras con matriz biológica.

Page 4: Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte Carlo

VI IBEROLAB

4

5.2 Valor de corte (VC) Se determinaron las concentraciones de aluminio en las muestras VN1 y se verificó la distribución normal del grupo de datos obtenidos aplicando un test de Anderson-Darling. Consecuentemente se calcularon la media y el desvío estándar y se realizó el experimento de simulación de Monte Carlo para estimar el límite superior del intervalo de valores que pueden catalogarse como típicos. Se estableció como valor de corte la concentración que puede atribuirse estadísticamente a más del 95% de las muestras negativas (α = 0,05) con la ecuación siguiente: VC = Cx(sim) + Z(1-α)·σ(sim) (7) donde, Cx(sim) = concentración media calculada de 10000 datos simulados y σ(sim) su la desviación estándar. El software utilizado para la simulación fue Quantum XL, que opera como complemento de Microsoft Excel® y simula resultados introduciendo las variables deseadas de fórmulas creadas en las hojas de cálculo. Para la simulación de los valores Cx probables se insertó la ecuación (3) en la ecuación (2), y a su vez esta combinación se insertó en la ecuación (1). Asumiendo que el procedimiento será ejecutado como se ha especificado, se definieron Va1, Vd1, FD como términos fijos, y b2, b1, b0, Ax, y Ablk como los términos variables. El software genera una población de valores para los términos variables, dentro de un intervalo definido por su desvío estándar y caracterizado por una función de densidad de probabilidad, con una confianza determinada. Luego estas variables son combinadas para generar una población de resultados probables, calculando a la vez una media de todos los datos creados con su desvío estándar. Se asumió una distribución normal para todos los términos variables. Los desvíos estándar de Ablk y los coeficientes de regresión b2, b1 y b0 se estimaron en condiciones de precisión entre días, tomando en cuenta que el blanco y la curva de calibración deben prepararse con cada lote de ensayos. Para estimar la variabilidad de los coeficientes de regresión se ajustó una curva de calibración conformada por 6 sets de calibradores preparados y medidos uno cada día. 5.3 Índice de falsos positivos, índice de falsos negativos, sensitividad, especificidad y eficiencia Se repitió el experimento de simulación descrito anteriormente, con los grupos VN2 y VP. Para la simulación de VN2 se programó la contabilización de las concentraciones por encima del cut-off (falsos positivos) y para VP se programó el conteo de valores más bien por debajo (falsos negativos). Las muestras fueron de esta manera identificadas como “negativas” o “positivas” en base al valor de corte (VC) Con los datos reales y los simulados se construyeron Tablas de contingencia clasificando los resultados como:

-vn: valores en VN2 inferiores a VC; -fp: valores en VN2 superiores a VC; -fn: valores en VP inferiores a VC; y -vp: valores en VN2 superiores a VC. La Tabla construida siguió el modelo de la Tabla 2. Tabla 2. Modelo de Tabla de contingencia.

Resultados en base a VC Negativo Positivo Total

Negativo vn fp vn + fp

Positivo fn vp fn + vp Datos reales Total vn + fn fp + vp T

Con los datos obtenidos se calcularon los parámetros cualitativos de desempeño seleccionados: -Índice de falsos positivos: la probabilidad de que una muestra verdaderamente negativa resulte positiva.

fpvp

fp

+=fpr (8)

-Índice de falsos negativos: la probabilidad de que una muestra realmente positiva resulte negativa.

fnvp

fn

+=fnr (9)

-Sensitividad (%): la probabilidad de un resultado positivo para una muestra verdaderamente positiva, expresada en términos porcentuales.

vp Sensitividad[%] =

vp + fn X 100

(10)

-Especificidad (%): la probabilidad de un resultado negativo para una muestra verdaderamente negativa, expresada en términos porcentuales.

vn Especificidad[%] =

vn + fp X 100

(11)

-Eficiencia (%): la capacidad general del método para acertar; es decir, para clasificar muestras negativas y positivas verdaderas como tales, expresada como una probabilidad en términos porcentuales

vn+vp Eficiencia[%] =

T X 100

(12)

6.- Resultados y discusión 6.1 Límites analíticos: Valor crítico (LC), límite de detección (LD) y límite de cuantificación (LQ) De las mediciones de los blancos se estimó un límite crítico de 1,01 mg/L, un límite detección de 2,08 mg/L y un límite de cuantificación de 6,25 mg/L. Estos dos últimos fueron multiplicados por el factor de dilución (5/0,1) y por un factor de ajuste por efecto de matriz de 1,35 y 1,31

Page 5: Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte Carlo

VI IBEROLAB

5

respectivamente, seguidamente se dividieron por el factor de ajuste por efecto de dilución (1,08). Las variables involucradas en el proceso y sus resultados se exponen en la Tabla 3. Tabla 3. Cálculos para los límites analíticos. Absorbancia media de los blancos (n = 30), Ablk [mUA] 0,0763 Desvío estándar, Sblk [mUA] 0,0151 Valor crítico, ALC [mUA] 0,1085 Varianza del modelo de calibración, S2R(TOTAL) [mUA] 0,00043 Límite de concentración crítico, CLC [mg/L] 1,010 Límite de detección ajustado, LD [mg/L] 130,0 Límite de cuantificación ajustado, LC [mg/L] 379,1

6.2 Diferencias entre grupos y valor de corte (VC) Se efectuaron las mediciones de concentración de aluminio elemental en los tres grupos preparados. Se corroboró la distribución normal de cada uno y verificado este supuesto se realizaron los experimentos de simulación. Las absorbancias y concentraciones calculadas de los tres grupos de presentan en la Tabla 4. Tabla 4. Absorbancias y concentraciones calculadas en grupo de especímenes VN1.

Verdaderos negativos 1 (grupo VN1)

Nº Absorbancia Concentración

(mg/L) Nº Absorbancia

Concentración (mg/L)

1 0,0562 78,1 9 0,0536 70,3 2 0,0576 82,2 10 0,0486 55,4 3 0,0515 64,1 11 0,0497 58,7 4 0,0473 51,6 12 0,0477 52,8 5 0,0474 51,9 13 0,0501 59,9 6 0,0467 49,8 14 0,0495 58,1 7 0,0498 59,0 15 0,0550 74,5 8 0,0422 36,4 16 0,0526 67,3 Verdaderos negativos 2 (VN2) Verdaderos positivos (VP)

Nº Absorbancia Concentración

(mg/L) Nº Absorbancia

Concentración (mg/L)

1 0,0765 138,6 1 0,2029 516,0 2 0,0416 34,6 2 0,1897 476,8 3 0,0606 91,2 3 0,2121 543,3 4 0,0955 195,3 4 0,2301 596,3 5 0,0609 92,0 5 0,2628 691,6 6 0,0480 53,7 6 0,2717 717,2 7 0,2336 606,6 8 0,4278 1123,6 9 0,2760 729,5 10 0,2256 583,1

Absorbancia del blanco: 0,0573 En el grupo VN1 se puede observar que las absorbancias son indistinguibles del blanco y consecuentemente producen niveles por debajo de los límites analíticos. Al determinar las concentraciones de las muestras VN2 se verificó una consistencia en el comportamiento de los especímenes negativos. Aunque al cotejar las varianzas de VN1 y VN2, a través de una prueba de Fisher resultaron significativamente diferentes, con una probabilidad de error del 10-4%, no se encontró evidencia de diferencias significativas entre las medias muestrales al aplicarse una prueba de t de student, con una probabilidad de error del 16%.

En cambio, las diferencias entre VP y los grupos VN1 y VN2 sí resultaron ampliamente significativas, con probabilidades de error del 2,9x10-6% y 1,3x10-6% respectivamente. Por otra parte, no se encontró diferencia significativa entre las muestras fortificadas y los especímenes reales que conformaron el grupo VP. Estos datos experimentales permiten comprobar la hipótesis planteada originalmente sobre la diferencia tangible entre las concentraciones de ambos grupos de estudio. Se procedió a los experimentos de simulación para crear un valor de corte y evaluar sus probabilidades de error. Las medias y desvíos estándares de las variables expuestas en la Tabla 5 fueron los términos con los que se programó la simulación de cada población. Se generaron 10000 concentraciones probables para cada grupo y se verificó la una distribución normal por una prueba de Smirnov-Kolgomorov. Las medias poblacionales y sus desvíos estándares se exponen en la Tabla 6, junto con sus respectivos estimadores. La diferencia entre las medias y desvíos estándar experimentales y las simuladas pueden ser explicadas por las condiciones de reproducibilidad entre días con las que se generaron estas últimas, contra las condiciones de repetibilidad con las que se determinaron las mediciones experimentales. De los niveles simulados en VN1 se contabilizaron 3623 por debajo del límite de detección, sólo 5 de ellos fueron números negativos. El 99,99 % de los datos fueron inferiores a 291,04 mg/L y basado en este dato se estableció entonces un límite de corte de 300 mg/L De las 10000 concentraciones simuladas a partir de VN2 se contabilizaron 250 superiores al valor de corte, de éstas 14 superaron el límite de cuantificación. Por otra parte, de los datos generados por VP, con una media de 6 a 10 veces mayor que las muestras negativas, se registraron sólo 21 especímenes inferiores al límite de cuantificación y sólo 2 menores al valor de corte. Se puede observar una franca dicotomía entre los especímenes negativos y los positivos. Ambas poblaciones mantienen la suficiente distancia para dar un margen de riesgo estrecho. La probabilidad de que las medias de VN1 y VP sean estadísticamente iguales es prácticamente nula a aplicarse la prueba Z de significancia (P <10-10). Se elaboraron también histogramas de ambas poblaciones, en los que puede apreciarse gráficamente su relación con el valor de corte (ver figuras 1 y 2). Tabla 5. Variables de entrada para la simulación. Software: Quantum XL Banyan Tree Engine

Generación de números aleatorios: Mersenne Twister, 10000 simulaciones

Variable Media Desvío estándar

Distribución

Coeficiente de segundo orden, b2 -0,00017867 2,9085x10-7 Normal

Coeficiente de primer orden, b1 0,021278 1,1377x10-5 Normal Intercepto, b0 0,08722 8,0970x10-5 Normal Absorbancia del blanco, Ablk 0,07629 0,0151 Normal Absorbancia, Ax (VN1) 0,0503 0,0040 Normal Absorbancia, Ax (VN2) 0,0639 0,0196 Normal Absorbancia, Ax (VP) 0,2338 0,0306 Normal

Page 6: Desarrollo de un método de ensayo y validación de un límite de corte por simulación de Monte Carlo

VI IBEROLAB

6

Tabla 6. Concentraciones medias y desvíos estándar de las determina-ciones experimentales y los valores generados por simulación de Monte Carlo.

Experimentales Simuladas

Variable Media Desvío estándar

Media Desvío estándar

VN1 (n = 16) 60,6 mg/L 11,8 mg/L 117,5 mg/L 46,7 mg/L VN2 (n = 6) 100,9 mg/L 58,5 mg/L 155,8 mg/L 74,5 mg/L VP (n = 10) 658,4 mg/L 184,0 mg/L 661,6 mg/L 98,8 mg/L

Se observa que el límite corte supera ampliamente al límite de detección y esto es favorable para lograr un bajo riesgo de falsos negativos. Por otra parte, el cut-off es menor al límite de cuantificación, ello sugiere tener precaución con concentraciones inferiores a 400 mg/L y la incertidumbre es importante en ese margen.

Fig. 1. Histograma de datos generados por simulación de Monte Carlo partiendo del grupo VN.

Fig. 2. Histograma de datos generados por simulación de Monte Carlo partiendo del grupo VP.

6.3 Parámetros cualitativos

Los resultados se organizaron en Tablas de contingencias, tanto para las mediciones en muestras reales como los datos generados por simulación de Monte Carlo. Tabla 7. Tabla de contingencia de mediciones reales

Resultados de ensayo Negativo Positivo Total

Verdaderos negativos (VN2) 6 0 6 Verdaderos positivos (VP) 0 10 10

Total 6 10 16 Tabla 8. Tabla de contingencia de datos simulados.

Resultados de ensayo Negativo Positivo Total

Verdaderos negativos (VN2) 9750 250 10000

Verdaderos positivos (VP) 2 9998 10000

Total 9752 10248 20000

La Tabla 9 resume los cualitativos de desempeño calculados tanto con resultados de ensayos reales y como con datos generados por simulación Tabla 9. Parámetros cualitativos de desempeño.

Parámetro Ensayos Simulación

Índice de falsos positivos 0 0,0250

Índice de falsos negativos 0 0,0002

Sensitividad 100% 99,98%

Especificidad 100% 97,50%

Eficiencia 100% 98,74%

Es factible realizar algunas estimaciones probabilísticas a partir de estos resultados. Se observa por ejemplo que al establecer 300 mg/L como valor de corte la probabilidad de que un espécimen del grupo VN1 sobrepase este valor es del 0,0046%, aproximadamente 5 por cada 100000 muestras, en tanto que la probabilidad de falsos positivos en el grupo VN2 es del 2,5% y de falsos negativos del 0,02%. Se debe tener presente entonces que la aproximación estadística supone un mismo comportamiento en todos los especímenes sometidos al proceso de medición, incluyendo la especiación, efecto de matriz, dilución entre otras condiciones y puede haber ciertas diferencias entre poblaciones de una misma categoría. En general, el método desarrollado tiene una probabilidad de no acertar en un 1,26 % de los casos. 7.- Conclusiones Se desarrolló un método propio evaluando los parámetros de desempeño de rigor para ensayos cuantitativos, pero también se evaluaron parámetros cualitativos que tradicionalmente se aplican a otras técnicas analíticas. El uso de estos recursos, fortalecidos por la potente técnica estadística de Monte Carlo para generar un gran número de datos, resultaron indicadores de desempeño útiles para valorar la habilidad discriminativa de un método de ensayo destinando a un propósito cualitativo siendo su base eminentemente cuantitativa y que opera sobre una matriz de escasa existencia, de la cual difícilmente se podrá recolectar un número conveniente de especímenes reales para establecer un intervalo de referencia de forma taxativa.

Bibliografía JCGM (Joint Committee for Guides in Metrology). (2008). Evaluation of measurement data — Supplement 1 to the “Guide to the expression of

uncertainty in measurement” — Propagation of distributions using a

Monte Carlo method. JCGM. Roque, C. (2010). Desarrollo y validación de un método de determinación

de aluminio en contenido gástrico por espectrofotometría de absorción

atómica electrotérmica, para la confirmación de intoxicaciones por fosfuro de aluminio. León: UNAN-León. Trullols, E., Ruisánchez, I., & Rius, F. X. (2004). Validation of qualitative analytical methods. Trends in Analytical Chemistry , 23 (2).