EXCEL en química analítica

download EXCEL en química analítica

of 47

Transcript of EXCEL en química analítica

Aplicacin de Microsoft Excel a la Qumica Analtica: validacin de mtodos analticos Jos Marcos Jurado Departamento de Qumica Analtica1 de abril de 2008 1. Estadstica bsica. 1.1. Concepto de poblacin y muestra Enestadstica,sedefinepoblacincomoelconjuntodeindividuosportadoresde informacin del fenmeno que se estudia. Una muestra sera un conjunto de individuos representativosdedichapoblacin,conjuntoquepermitiraestudiarelfenmenosin prdidasignificativadeinformacin.As,sisepretendeanalizarelcontenidoen sulfatos de un lago, la poblacin sera el propio lago y la muestrasera una porcin de aguarepresentativadelmismo.Deestemodo,apartirdelanlisisdelamuestra,debe ser posible conocer el contenido en sulfatos de la poblacin. Cuandonosreferimosadatosobtenidosexperimentalmenteenellaboratorio,la poblacin se refiere a la totalidad de medidas posibles, mientras que la muestra sera un conjunto de estas medidas.1.2. Media aritmtica. Sedefinelamediaaritmtica comolasumadeunaseriedeindividuosdivididaporel nmerodeindividuosconsiderados.Enelcasodeunapoblacin,esdecir,cuando realizsemosunaserieinfinitademedidasobtendramoslamediadelapoblacin, generalmentedesignada por.Cuandoserealiceunaseriedemedidasrepresentativas de la poblacin se debe hablar de media muestral. La media muestral se calcula como: 1niixxn== (1) siendo xi cada uno de los valores obtenidos y n el nmero de valores considerados. J. M. JuradoEXCEL para Qumica Analtica 2 1.3. Desviacin estndar. Ladesviacinestndaresunparmetroquedacuentadeladispersindelosdatos obtenidos.Enelcasodeunapoblacinhablaremosdeladesviacinestndardela poblacin, . Para una muestra se calcula con la siguiente frmula: 21( )1niix xsn== (2) Alcuadradodeladesviacinestndarseledenominavarianza(s2).Apartirdela desviacin estndarsepuedetambincalcularelcoeficientedevariacinodesviacin estndar relativa, que es una medida del error relativo y se usa para comparar resultados medidos en distintas escalas. 100sCV RSDx= = (3) 1.4. Distribucin de medidas repetidas. Cuando realizamos medidas de una poblacin, en ausencia de errores sistemticos, stas puedentomarcualquiervalorentornoalvalorverdaderoomediadelapoblacin, dependiendodeladesviacinestndardelamisma(delerroraleatoriopuro).Sise dispusiera de todas las medidas y se representasen las frecuencias con que aparece cada valor, frente a los propios valores, se podra ver la distribucin de los datos en torno a la mediadelapoblacin.Enlascondicionesmencionadasseobtieneunadistribucin normal o gaussiana como la de la figura. Figura 1. Distribucin normal J. M. JuradoEXCEL para Qumica Analtica 3 La distribucin normal viene descrita por la ecuacin { }2 21exp ( ) / 22y x = (4) En una distribucin normal de media y desviacin estndar , aproximadamente el 68 % de los valores de la poblacin caen dentro del intervalo 1 , el95 % dentro de 2 y el 99.7 % dentro de 3. En realidad solo vamos a realizar una serie finita de medidas (replicados) a partir de las cualesseobtienelamediadelamuestraysudesviacinestndar.Lamediadela muestraserunaestimacindeyladesviacinestndardelamuestraseruna estimacinde . Por lo tanto, la distribucin de esta muestra ser tambin normal y se cumplirnlasmismascaractersticasanteriormentemencionadas.Grficamente,donde antes obtenamos una curva ahora obtendremos un histograma. Sidispusisemosdeunaseriedemedias,cadaunaobtenidadeunaseriedemedidas individuales, se observara que estas medias se encuentran ms agrupadas en torno a que las medidas individuales. La distribucin de todas las medias muestrales posibles se denomina distribucin muestral de la media o distribucin en el muestreo de la media. Su media es la misma que la media de la poblacin original. Su desviacin estndar se denominaerrorestndardelamedia(e.e.m.).Existeunarelacinmatemticaexacta entreele.e.m.yladesviacinestndar,,dela poblacin: e.e.m.=/ n .Amayorn, menorserele.e.m.ymenorladispersindelasmediasmuestralesentornoa.El e.e.m. nos da una medida de la variabilidad dex , adems, aunque la distribucin de las medidas no sea una distribucin normal,la distribucin de las medias muestrales tiende aserloamedidaqueaumentan.EstoseconocecomolateoradelLmiteCentral.Se asume que las medias de muestras muy pequeas (0.999.Otromtodosebasaenqueladesviacinestndar J. M. JuradoEXCEL para Qumica Analtica 12 relativa de la pendiente no supere el 5%. Esta es la conocida como linealidad online. El porcentaje de linealidad se calcula como [5]: % 100 1bsLinb| |= |\ (24) Estosparmetrosnosondeltodofidedignos,siendolocorrectorealizarunanlisis estadsticodelosresidualesmedianteelanlisisdelavarianza(ANOVA)ola aproximacinprcticadeHuber[6].Ambosprocedimientoslosexplicaremos detenidamente cuando estudiemos la aplicacin de EXCEL. Elintervalodinmicoorangolinealeselrangodeconcentracionesdondeexisteuna relacinlinealentreestasylassealesanalticas.Enesteintervalo,losvaloresdeben presentarunnivelaceptabledeprecisinyexactitud,conlocual,nopuedenser inferiores al lmite de cuantificacin.2.8. Robustez Es la inercia que presenta un mtodo analtico a modificar su seal cuando tienen lugar pequeoscambiosenlascondicionesambientalesuoperativas,queseconsideranlas variablesquegobiernanelexperimentodemedida.Paraelestudioderobustez,estas condiciones se modifican ligeramente, siguiendo un determinado diseo experimental, y secompruebasuinfluenciaenlasealanaltica.Conello,sepuedeconcluirque variables son ms significativas a la hora de realizar las medidas y por tanto, deben ser mejor controladas. 2.9. mbito de validacin de mtodos analticos Como ya hemos dicho, el tipo de validacin que debemos realizar va a depender de los requisitos de nuestro mtodo.ParmetroAnlisis CualitativoAnlisis CuantitativoAnlisis de trazas EspecificidadXXX PrecisinXX VeracidadXX LinealidadXX RangoX LOD/LOQLODLOQ RobustezXXX J. M. JuradoEXCEL para Qumica Analtica 13 3. EXCEL como herramienta en el proceso de validacin. Las utilidades estadsticas de EXCELque emplearemos en validacin sern: Prueba F de Snedecor-Fisher Prueba t de Student ANOVA de un factor Estadstica descriptiva (media, mediana, varianza) Regresin 3.1. Herramientas para anlisis. Aunque todo esto se puede hacer de forma manual, es decir, introduciendo formulas en la hoja de clculo, EXCEL incluye un paquete de herramientas para realizar este tipo de anlisisdemanerasencilla.Elprimerpasosercomprobarqueestinstaladoo activado. Para ello hay que abrir el men Herramientas>Complementos y ver si aparece la opcin Herramientas para anlisis. SinoaparecedebemosactivarelpaqueteenC:\Archivosdeprograma\Microsoft Office\OFFICE11\Macros\Anlisis\ANALYS32. En este momento dispondremos de la herramienta anlisis de datos. J. M. JuradoEXCEL para Qumica Analtica 14 3.2. Prueba F de Snedecor- Fisher. En una prueba estadstica empleada para la comparacin de varianzas. Sean dos conjuntos de datos: {x1} con varianza21sy tamao n1 {x2} con varianza 22sy tamao n2 Consideramoslahiptesisnulaquedicequelasvarianzasnopresentandiferencias significativasentres.H0: 2 21 2 = .Si 2 22 1s s , 22211sFs= .SecomparaconFtab(0.05, n2-1,n1-1).SiFAnlisisdedatosusamoslaherramientaPruebaFpara varianza de dos muestras Pulsamos en la flecha roja del cuadro rango para la variable 1 y seleccionamos el rango A2:A7.Enrangoparalavariable2seleccionamoselrangoB2:B9.Simarcamos Rtulos,elprogramaconsideraqueenlaprimeraceldadelrangoseleccionadose encuentraelnombredelconjuntodedatos(deberamoshaberseleccionadoA1:A7y B1:B9). Alfa es el indica la probabilidad o nivel de confianza que usaremos (0.05 es un 95%).Enrangodesalidaseindicalaprimeraceldadelrangodondesecolocarnlos resultados.Esaconsejablequeseaenunextremoparaquenosobrescribanada.Otra opcin es hacerlo en una hoja nueva. Supongamos que hemos elegido la celda D1 como rango de salida. El resultado ser: J. M. JuradoEXCEL para Qumica Analtica 16 Se comprueba que F < Fcrit, ambos mtodos son igual de precisos. SinecesitsemoselvalordeFcrticoparacompararlasvarianzasamanossepuede obtener de tablas o bien con la formula =DISTR.F.INV(0.05,5,7), en este caso. 3.3. Prueba t de Student. 3.3.1. Comparacin de valores medios de dos conjuntos de datos. Dados dos conjuntos de datos: ConjuntoMediaVarianzaNmero de datos 1 1x21s1n2 2x22s2n Paradecidirsilasmediasmuestrales 1x y 2x difierensignificativamentesetomala hiptesis nula H0: 1 2 = . Primerosecompruebaque 2 21 2s s = mediantelapruebaFdeFisher.Astenemosdos posibilidades: a) Si 2 21 2s s =se calcula una varianza promedio( ) ( )2 21 1 2 2 21 21 12n s n ssn n + =+ (25) Se calcula el estadstico t:1 21 21 1x xtsn n=+ (26) ,quetendrn1 +n22gradosdelibertad.Estevalordetsecomparaconelvalor tabuladot(0.05,n1 +n2-2).SitAnlisisdedatosseescogelaopcinPruebatparadosmuestras suponiendo varianzas iguales J. M. JuradoEXCEL para Qumica Analtica 18 La forma de escoger los rangos, nivel de confianza y rango de salida son similares a la prueba F. Ntese que es posible tomar distintas hiptesis nulas en la casilla Diferencia hipottica entre las medias. El resultado es: Como en valor absoluto el t calculado es menor que el t crtico (contraste de dos colas), lahiptesisnulasetomacomociertaylasdosmediasmuestralesnodifieren significativamente.Elhechodeusaruncontrastededoscolasimplicaquenonos interesaelsentidoenquedifierenlasmedias(esdecirsiladiferenciaespositivao negativa).Sipretendemosversolosiunvaloraumentaenrelacinalotroseusaun contraste de una cola. b) conjunto de datos con varianzas distintas. Considrese el conjunto de datos: J. M. JuradoEXCEL para Qumica Analtica 19 Al aplicar el test F: Lasvarianzasdifierensignificativamente.Alahoraderealizarelcontratet,sedebe elegirPruebatparadosmuestrassuponiendovarianzasdesiguales.Losrangos, probabilidad e hiptesis nula se introducen de igual modo que en el ejemplo anterior. El resultado es: Comparandoconelvalordetcrticoparadoscolas,lasmediasnodifieren significativamente.Ntesequelosgradosdelibertadefectivosson5(enrealidad 5.2868, pero se ajusta al entero ms prximo). 3.3.2. Prueba t para valores emparejados. Supongamosque tenemos un conjunto demuestras de valores 1,... ,...i nx x x . Ntese que setratadenmuestrasdistintas,porloquelascantidades 1... ...i nx x x .Se determinanlosvaloresmediantedosmtodosysepretendecomprobarquenoexisten diferenciassignificativasentrelosresultadosobtenidosporambos.Alaplicarcada mtodoseobtienenlosvalores 11 1 1,... ,...i nx x x conelmtodo1y 21 2 2,... ,...i nx x x conel J. M. JuradoEXCEL para Qumica Analtica 20 mtodo2.Secalculanlasdiferencias 1 2 i i id x x = ,elvalormediodetodaslas diferencias y su desviacin estndar: niiddn= (29) ( )1niidd dsn= (30) Si los mtodos son equivalentes y levan al mismo resultado las diferencias di deben ser nulas.EstoeslomismoqueconsiderarlahiptesisnulaH0:d =0.Secalculael estadstico t: /dt d n s =(31) El nmero de grados de libertad de t es n-1. Se compara este valor con t(0.05,n-1).3.3.2.1. Aplicaciones. Se aplica en el caso de que las muestras analizadas por los dos mtodos no sean grandes yseanecesarioutilizardistintasmuestrasenelestudio.Esdecir,seanalizandistintas muestras por ambos mtodos y no una misma muestra replicada por ambos mtodos. 3.3.2.2. Resolucin con EXCEL Consideramoselejemplodeladeterminacindeparacetamolendiezpastillasde distintos lotes mediante un mtodo espectrofotomtrico y otro de espectroscopa IR [7]. Se utiliza la Prueba t para dos muestras emparejadas del men Herramientas>Anlisis dedatos.El formulario de entradadedatos essimilar a losdelosejemplosanteriores. El resultado es: J. M. JuradoEXCEL para Qumica Analtica 21 Comoelvalorexperimental(0.88)esmenorqueelcrtico(2.26)losmtodosno proporcionan resultados significativamente diferentes. 3.4. ANOVA de un factor. Elanlisisdelavarianza(ANOVA)esunmtodoqueseempleaparacomparar resultadosobtenidospordistintosmtodos,laboratorios,analistas,etc,cuandoel nmerodemediasobtenidasessuperiorados.Tambinpermitesepararlas contribuciones de uno o ms factores ala varianza global del sistema. Enelcasoderealizamedidasreplicadasvariandounodelosfactoresanteriormente mencionadossiempreexistendosfuentesdeerror,laprimera,elerroraleatoriode medida,lasegundaloserroresdebidosal cambiodemtodo, laboratorio,analista,etc. MedianteelANOVAsepuedecontrolarelerrorintroducidoporestasegundafuente, con lo que se habla de ANOVA de un factor. Si tuvisemos un caso en que el anlisis se realiza por distintos laboratorios utilizando distintos mtodos, deberamos controlar dos factores y se utilizara un ANOVA de dos factores. Consideremos que realizamos un mismo anlisis por i mtodos distintos (i vara de 1 a h) y realizamos j replicados (j varia de 1 a n) con cada mtodo.La media obtenida para cada mtodo ser: nijjixxn= (32) La media global obtenida por todos los mtodos se calcular como: hiixxh= (33) J. M. JuradoEXCEL para Qumica Analtica 22 Media Mtodo 1 11x12x... 1 jx... 1nx1xMtodo 2 21x22x... 2 jx... 2nx2x. . . . . . . . . . . . . . . . . . . . . . . . Mtodo i 1 ix2 ix... ijx... inxix. . . . . . . . . . . . . . . . . . . . . . . . Mtodo h 1 hx2 hx... hjx... hnxhxMedia globalx Para cada mtodo se tiene una varianza calculada como: ( )221nij ijix xsn= (34) En el ANOVA la hiptesis nula es que todas las muestras se extraen de unapoblacin de media y varianza 2 . Esta varianza se puede estimar de dos formas, estudiando la variacin dentro de las muestras y la variacin entre muestras. La varianza debida al error puramente aleatorio, 2PEs , tambin conocida como varianzadentrodelasmuestras(odelgrupo),secalculacomopromediodelasvarianzas individuales 2is : ( )222 2( 1)h nhij iii jiPEx xssh h n= =(35) La varianza debida al factor (en nuestro caso a los distintos mtodos usados), conocida comovarianzaentremuestras(oentregrupos),esunaestimacindelavarianzadela poblacin, 2 .Sitodaslasmedidasseextraendeunapoblacindevarianza 2 , entoncessusmedias(obtenidasvariandoelmtodoempleado,esdecir,variandoun factorcontrolado)procedendeunapoblacindevarianza 2/ n (Vaseseccin1.4). En general, la varianza debida al factor se calcula como: J. M. JuradoEXCEL para Qumica Analtica 23 ( )22 21hiiFactorn x xsh=(36) Silahiptesisnulaescorrecta,lasdosestimacionesnodeberandiferir significativamente,esdecir,quelavariacindebidaalfactornodebese significativamente distinta a la varianza de error puro. Esto es lo mismo que decir que el hechodevariarelfactor(elmtododemedidaennuestroejemplo)nointroduceun errorsignificativoencomparacinconelpuramentealeatorio.Secompruebaesto mediante un test de Fisher, calculando F como: 22FactorPEsFs=(37) SecomparaFconelvalortabuladoF(0.05,h-1,h(n-1))paracontrastedeunacola (puesto que nos interesa saber si la varianza del factor es mayor que la de error puro, no solosidifieren).SielvalordeFcalculadoesmenorqueeltabulado,noexisten diferenciassignificativasentrelasdosvarianzas,esdecir,elhechodevariarelfactor (cambiar de mtodo) no introduce un error significativo. Silahiptesisnulaesverdaderaexisteunaterceraformadeestimarlavarianzaque consiste en tratar los datos como si fueran una muestra grande de varianza: ( )221h niji jTotalx xshn= (38) Pero esta frmula no se usa en el contraste.Hastaahorahemossupuestoquelahiptesisnulaesverdadera.Peropuedequenolo sea, es decir, que F sea mayor que el valor de F crtico. Un resultado significativo en el ANOVApuededeberse avariascosas:queuna mediadifieramucho alasdems,que todaslasmediasdifieranentresoqueexistanvariosgruposdemediasdistintas,etc. Parapoderverloqueocurresecolocanlasmediasordenadasdeformacrecienteyse comparanlasdiferenciasdelosvaloresadyacentesconunacantidaddenominadala mnima diferencia significativa. sta se calcula como: ( 1)2PE h nMDS s tn= (39) J. M. JuradoEXCEL para Qumica Analtica 24 Otraposibilidadescompararlasmediasdosadosmedianteeltestdedelagenuina diferencia significativa de Tukey. Si una vez realizados los clculos de ANOVA se han encontradodiferenciassignificativasentrelavarianzadeunfactoryladelerrorpuro, debemos averiguar que nivel de ese factor es el responsable de los errores sistemticos que producen dichas diferencias. Con este fin se realiza el ensayo Tukey-HSD (Honest SignificantDifference)[8],porelquesecomparandosadoslasmediasobtenidasa cadaniveldelfactor.Aquelnivelquepresenteunvalorpromediosignificativamente diferente del resto ser el responsable del sesgo detectado y se elimina para recalcular el ANOVA. Supongamosquequeremoscomparardosnivelespyqdelfactor(mtodoennuestro caso). Para que no haya diferencia significativa entre los valores promedio de estos dos niveles, px y qx ,sedebedemostrarqueambossecorrespondenconlasmedias muestralesdeunamismapoblacin,dedistribucinnormal,demedia yvarianza 2. De este modo, si pxes la media muestral de una poblacin de mediap y qx es la mediamuestraldeunapoblacindemediaq,sedebecumplir,comohiptesisnula, quep =q.Se define el intervalo de confianza de Tukey como: , 21 1( )2rp q p q PEp qqx x sn n | | + | |\ (40) Donde, , rq eselvalortabuladodeladistribucindelrangoestandarizado[9],que dependedelnumeroderepeticiones,r,ydelosgradosdelibertadutilizadosenla desviacin estndar que se usa en el calculo de este intervalo, , as como del nivel de confianza, .Teniendo en cuenta que, la varianza utilizada en la expresin anterior es una estimacin deladelapoblacinydebeconsiderartodaslasmuestras,sesustituyestaporla varianza del error puro. Adems, si en nuestro caso np = nq = n, el intervalo de confianza de Tukey queda: J. M. JuradoEXCEL para Qumica Analtica 25 ,1( )2rp q p q PEqx x sn (41) Como0 = q p , el intervalo de confianzade Tukey debe contener elcero, si no es as, se rechaza la hiptesis nula. , ,1 1( ) 0 ( )2 2r rp q PE p q PEq qx x s x x sn n < < +(42) Enlaprctica,separtedelahiptesisnula,p =q, ysecalculaunvalordeq experimental segn: exp1p qPEx xqsn=(43) Secomparaestevalorexperimentaldeqconelvalortabulado[9].Siqexp>qtabse rechazaralahiptesisnula,conloquelasdosmediaspresentarandiferencias significativasentres.Elnivelquepresentediferenciassignificativasconelresto,se considera como causa del efecto significativo en la varianza total. Una tabla de valoresde la distribucin del rango estandarizado se incluye en el ANEXO 1. 3.4.1. Aplicaciones. Elanlisisdelavarianzaseaplica,comosedijoanteriormente,enlacomparacinde varios mtodos, laboratorios, analistas. etc. Esmuytilparadetectarresultadosanmalosenlosensayosdeintercomparacin empleados para certificar materiales de referencia o desarrollar mtodos de referencia. Tambinseutilizaparacalcularlaprecisinintermediadeunmtodocuandose analizanmuestrasdereferenciaendistintosdas.Esteejemploloexplicaremosms adelante. Otraaplicacintienequeverconlaregresinlineal,puestoqueEXCELrealizaun anlisis de la varianza de los residuales. Esto lo veremos en el apartado correspondiente a la estimacin lineal. Ensayos de recuperacin. J. M. JuradoEXCEL para Qumica Analtica 26 3.4.2. Resolucin con EXCEL. Supongamosquerealizamosmedidasdefluorescenciaamuestrasdequinina almacenadasdecuatroformasdistintas(ejemploadaptadode[7]):A)disoluciones recin preparadas, B) almacenada en oscuridad, C) con luz tenue yD) luz brillante. Los datos los ordenamos como se observa a continuacin: En el men Herramientas>Anlisis de datos seleccionamos Anlisis de varianza de un factor. El formulario de entradas de datos es el siguiente: ComoelrangodeentradaseleccionamosA1:D4,sealandolacasilladertulospara que tome de la primera fila el nombre de los grupos. Hay que cerciorarse que tenemos marcadoquelosdatosseagrupanporcolumnas.Elrangodesalidafuncionacomo anteriormente se ha descrito. El resultado final es el siguiente: La columna de promedio de cuadrados indica el valor de varianza de error puro (dentro de los grupos)y la debidaal cambio en el factor (entre grupos), que en este caso es el cambioencondicionesdealmacenamiento.ComoseobservaelvalordeFcalculado (20.66)esmayorqueel crticoparaunnivelde confianzadel95%y3 y8gradosde J. M. JuradoEXCEL para Qumica Analtica 27 libertad(4.066).Existenentoncesdiferenciassignificativasentrelasmediasobtenidas traslasdistintasformasdealmacenamientodelasmuestras.Lostestdeminima diferenciasignificativaodeTukeydebenrealizarsemanualmente(EXCELno implementa los mismos). 3.4.3. La precisin a partir del anlisis de la varianza. HastaahorasehaaplicadoelANOVAparalacomparacindemltiplesmedias.En estecasosevahaemplearparasepararyestimardistintasfuentesdevariacin. Supongamosquerealizamosunestudiodereproducibilidadaunsolonivelde concentracin.Tendremosdosfuentesdevariacin,ladebidaalerrorpuramente aleatorio,esdecir,elerrordereplicacin,yeldebidoalcambiodecondiciones(da, reactivos,analista,laboratorio...)queimplicaelhechodeestudiarlareproducibilidad. Loidealseraaadirotrofactor,realizandoelestudioendistintosnivelesde concentracin,peroentoncesrealizaramosunANOVAdedosfactores.Esms,al prevalecerelfactordelascondicionesdetrabajosobrelosnivelesdeconcentracin deberamos realizar un ANOVA de dos factores anidados. Consideremosquerealizamosnreplicadosdurantehdias(reproducibilidadentredias, minimalista).Lavarianzaderepetitividadodeerrorpurovendrdadaporla ecuacin 35,mientrasqueladebidaalfactorvendrdadaporlaecuacin36.Puestoqueenla ecuacin36estnincluidaslasmediasdecadagrupo, ix ,seestaraconsiderandoel efectodelarepetitividaddentrodelefectodelfactor.Porello,sedebecalcularuna varianzanetaentregruposquedependaslodelavarianzaentrelasmediasdelos grupos y la media global. La varianza neta entre grupos se calcula como: 2 22 Factor PEBs ssn=(44) La reproducibilidad se calcula finalmente como la suma de la repetitividad (error puro) y la varianza neta debida al factor (neta entre grupos): 2 2 2R PE Bs s s = +(45) Para comparar la tolerancia correspondiente a esta precisin intermedia se puede usar la conocida como Trompeta de Horwitz [11].J. M. JuradoEXCEL para Qumica Analtica 28

Horwitzdedujounaexpresinparapredecirelvaloresperadoparaladesviacin estndarrelativaparalaprecisinintermedia(ointerlaboratorio)apartirdela concentracin de analito, c (en tanto por 1). (1 0.5log )2cHRSD=(46) El valor de RSD obtenido se compara con el predicho por Horwitz (RSDH) mediante el parmetro Horrat [12].RHRSDHorratRSD=(47) Si el valor del parmetro Horrat es igual o menor a 2 se puede decir que el mtodo tiene valores aceptables de precisin intermedia. AdemsdecompararconlosvaloresdeHorwitz,sepuedetambincompararconlos valoresestablecidosporlaAOAC[13](AsociacinOficialdeQumicosAnalticos). Estos valores y los obtenidos por Horwitz se presentan en la siguiente tabla. J. M. JuradoEXCEL para Qumica Analtica 29 Analyte (%)Analyte fractionUnitHorwitz %RSDAOAC PVM %RSD 1001100%21.3 1010110%2.81.8 11021%42.7 0.11030.1%5.73.7 0.01104100 ppm85.3 0.00110510 ppm11.37.3 0.00011061 ppm1611 0.00001107100 ppb22.615 0.00000110810 ppb3221 0.00000011091 ppb45.330 Algunosrequisitosprcticosrelacionadosconlosestudiosinterlaboratoriosonlos siguientes [14]:-Repetitividad: RSDr = 0.5-0.6 * RSDH -Reproducibilidad: RSDR = 0.5-2 * RSDH Para validaciones intralaboratorio [15]: -Repetitividad: RSDr = 0.2-0.3 * RSDH -Reproducibilidad (precisin intermedia): RSDR = 0.2-1 * RSDH 3.4.4. Precisin y veracidad a partir del ANOVA. A partir de un mismo diseo de ANOVA es posible estudiar tanto la precisin (vese el apartado anterior) como la veracidad. Simplemente hay que considerar que cada medida xij tendr un sesgoij ijx T = (48) Siendo T el valor certificado de un CRM (pues el valor verdadero no se conoce). El sesgo se puede entonces calcular como: 1h niji jx T x Thn = = (49) La incertidumbre de este sesgo se puede calcular como [16]: J. M. JuradoEXCEL para Qumica Analtica 30 2 221( )R rns snuh | | |\ =(50) Donde 2Rs eslavarianzadereproducibilidad(puestoqueconsideramosunensayo interlaboratorio), que puede ser sustituida por la varianza de precisin intermedia 2IPsen caso de estar realizando la validacin intralaboratorio. Se calcula a partir de la ecuacin 43. La varianza de repetitividad 2rsno es otra que la varianza de error puro 2PEsobtenida en el ANOVA. Se considera que hay ausencia de sesgo para2( ) u< . 3.4.5. Ensayos de recuperacin. Aldesarrollarunmtodototalmentenuevoenunamatriznomuyestudiadapuede ocurrirquenoexistanmaterialesdereferencianiotrosmtodosvalidadospara comparar el mtodo en desarrollo. Entonces se hace necesario el empleo de ensayos de recuperacin[3].Estosconsistenenaadirunacantidaddeanalitoconocidaauna matriz quesimule a la muestra, analizarla y ver lacantidad de analito que se recupera. Sedebenensayaralmenostresnivelesdeconcentracin,unobajo,otromedioyotro alto. A veces, cuando no es posible preparar una matriz similar a la muestra se realizan los ensayos sobre la propia muestra. Se calcula la recuperacin como: obs nativespikeC CRC=(51) DondeCobsesla concentracinmedidaconnuestromtodo,Cnative eslaconcentracin que tiene la muestra (en el caso de ser una matriz preparada debe ser cero) y Cspike es la cantidadquehemosaadido.Sirealizamosjreplicadosencadaunodelosiniveles podemosversilasrecuperacionessonequivalentesencadaunodelosniveles estudiados. 3.5. Regresin Ya se ha explicado la forma de calcular los coeficientes de regresin, cuando la relacin entre las variables x e y es lineal. Por todos es conocido que si representamos los datos enExcelyseleccionamoslospuntos,pulsandoenelbotnsecundariodelratn,en Agregar lnea de tendencia, como se indica en la figura, se puede obtener la recta de regresin con su ecuacin correspondiente. Los pasos a seguir son los siguientes: J. M. JuradoEXCEL para Qumica Analtica 31 SeseleccionaeltipodeestimacinysepulsaenlapestaaOpciones.Marcar PresentarecuacinenelgrficoyPresentarvalordeRcuadradoenelgrfico. Pulsar en aceptar. J. M. JuradoEXCEL para Qumica Analtica 32 El resultado es el siguiente: Ahora vamos a explicar la herramienta Regresin del men Herramientas>Anlisis de datos. Partimos de los datos: El formulario de la herramienta Regresin es el siguiente: J. M. JuradoEXCEL para Qumica Analtica 33 Loascasillasderangosdeentradaysalidayladertulosyasonconocidaspor nosotros.La casilla Constante igual a cero se utiliza si queremos forzar a la curva a pasarporelcero.Nosotrosnolaforzaremos.Estaherramientaofrecesiempreel intervalodeconfianzadelapendienteylaordenadaenelorigenal95%denivelde confianza,sisedeseaotroniveldeconfianzasepuedeactivarlacasillaNivelde confianza,por ejemplopara el90%.En elcuadroResidualessepuedeespecificarsi se quieren tener los residuales, residuales estandarizados, el grfico de residuales y el de la propia curva ajustada. Los residuos estndares se obtienen como: ,Re ReReRei meanst isds sss=(52) Donde Resst,i es el i-simo residual estandarizado, Resi el i-simo residual, Resmean es la media de los i residuales y Ressd su desviacin estndar. Finalmente se puede obtener la curva de probabilidad normal. Este ltimo presenta los valores de y ordenados de menor a mayor indicando el percentil al que pertenece. Si los puntosparecenajustarseaunalnearecta,puededecirsequepareceindicarquelos datosprovienendeunadistribucinnormal,perotngaseencuentaqueenalgunos casos, aunque los puntos se ajusten a una lnea recta puede que los datos no provengan de una distribucin normal; por ello se recomienda utilizar mtodos objetivos. SeleccionamosB1:B9paraelrangoyyA1:A9paraelx.SeleccionamosRtulos, Residuos,GrficoderesidualesyCurvaderegresinajustada.Elresultadoserel siguiente:J. M. JuradoEXCEL para Qumica Analtica 34 Enlasestadsticasderegresinsetieneelcoeficientedecorrelacinyelerrortpico (sy/x).El coeficiente dedeterminacin R2, que coincide con el cuadrado del coeficiente de correlacin, se obtiene a partir de la suma de cuadrados de los residuales (SCRes)y la suma de cuadrados total (SCT): 2 Re ( )ni iiSC s y y = (53) 2( )niiSCT y y = (54) 2Re1SC sRSCT= (55) Elajustadosecalculaapartirdelasvarianzasdelosresidualesytotal,tambin llamados cuadrados medios o promedio, CMRes y CMT. 2 ( )Re2ni iiy yCM sn= (56) 2( )1niiy yCMTn= (57) 2Re1CM sRCMT = (58) Cuanto ms prximo a 1 sea el coeficiente de correlacin mejor ser el ajuste lineal. No eselcriterioquetomaremos,trataremosestetemacuandohablemosdelinealidady rango lineal. J. M. JuradoEXCEL para Qumica Analtica 35 El anlisis de la varianza aqu realizado se basa en que la suma de cuadrados totales se descomponeendoscomponentes,lasumadecuadradosdelosresidualesylade regresin:2 2 2 ( ) ( ) ( )n n ni i i ii i iy y y y y y = + (59) Estas sumas de cuadrados aparecen en la tercera columna y dividiendo entre los grados delibertaddelasegundaseobtienenlascorrespondientesvarianzas(llamadaspor EXCELpromediodecuadrados).Excelsolo calcula lasvarianzasderegresinylade los residuales (cuarta columna). A partir de ellas calcula un Valor de F (quinta columna) y calcula una probabilidad para este valor (es lo que llama valor crtico de F).22 ( )( 1) ( 2) ( )2niini iiy yn nFy yn = (60) Engeneral,sielvalordeFesmuyelevado,lasumadecuadradosderesidualesser mucho menor que la de regresin, con lo que tambin ser mucho menor que la suma de cuadrados totales. Entonces, segn la expresin 55, r ser prximo a 1.El hecho de que EXCEL trabaje con un valor de probabilidad es similar a comparar con el valor tabulado de F para 1 y n-2 grados de libertad, pero en vez de comparar, calcula directamentelaprobabilidaddequeelFcalculadoseamayorqueeltabulado.Sila probabilidadesmuypequeaespocoprobablequelosdatosllevenaunvalortan elevadodeF,esdecir,espocoprobablequelasumadecuadradostotalesseamucho mayor que la de residuales y r sea prximo a uno. Esto quiere decir que el ajuste lineal no es fruto de la casualidad, porque es poco probable que los datos se organicen de este modo por casualidad. Comoyahemosdicho, nosotrosestamosmsacostumbrados a compararelvalordeF experimental con un valor tabulado de F para un nivel de confianza determinado (95 %, por ejemplo) teniendo en cuenta que los grados de libertad para la varianza de regresin es(n-1-n-2=1)yladelavarianzadelosresidualesn-2.SiFexp>F(0.05,1,n-2)la correlacin lineal es significativa y no puede atribuirse a la casualidad. Los parmetros ajustados de pendiente y ordenada se obtienen en: J. M. JuradoEXCEL para Qumica Analtica 36 Intercepcinserefierea laordenadayX alapendiente.Enlacolumnadeerrortpico aparecen las desviaciones estndar de la ordenada y la pendiente. Se calcula un valor de tcomoelvalordelparmetrodivididodesudesviacinestndar,comparandocon t(0.05, n-2) grados de libertad. Igual que en el caso anterior se tiene la probabilidad de que ste t experimental sea mayor queel terico. Los lmites inferiores y superiores se calculanrestandoysumandoalvalordelparmetroelvalorobtenidoalmultiplicarsu error por t(0.05,n-2). Tambinseobservanlosvaloresdelosresidualesylosgrficosderesidualesydela curva ajustada. Observando los residuales podemos ver si: a) Si el modelo se ajusta bien a los datos. Los residuos se distribuyen hogneamente. b) Si los datos son heterocedsticos, es decir, que la varianza no es constante en todo el rango de x. c) Si el modelo es inadecuado. Se observa cuando los residuales de valores prximos en x son todos del mismo signo, cambiando de signo en otro rango de x. J. M. JuradoEXCEL para Qumica Analtica 37 d) Si existen outliers. 3.5.1. La funcin =ESTIMACION.LINEAL() Estafuncinseutilizadeunaformaespecial,puestoquesetratadeunaformula matricial.Enprimerlugarhayqueseleccionarunrangode10celdastalycomose indica en la figura. En esta figura se ha escrito en las celdas adyacentes a las del rango el parmetro que la formula devolver. La pendiente b y su desviacin estndar sb, la ordenada a y su desviacin estndar sa, el coeficientedecorrelacinalcuadrador2(paraobtenerrrealizarlaraz cuadrada)yla desviacinestndarderegresinsy/xsonlosparmetrosfundamentalesquesehan explicado en la seccin 1.7. El valor de F se corresponde con el anteriormente descrito y dfson los grados de libertad para los residuales. El parmetro aqu llamado ssres es la sumadelosresidualesalcuadrado(Ecuacin7).Encuantoassreg,eslasumade cuadrados de regresin. El siguiente paso es seleccionar la frmula ESTIMACION.LINEAL del men Insertar /Funcin de EXCEL J. M. JuradoEXCEL para Qumica Analtica 38 EnConocido_ysedebeseleccionarlosvaloresdey,enConocido_xlosdex.En Constantesedebeponerun1oVERDADEROparaquecalculelaordenadaenel origen. En Estadistica se pondr un 1 o VERDADERO para que el calculo de ssreg y ssres sea de la forma anteriormente explicada.Envezdepulsaraceptar,sinoCTRL+MAYS+ENTRAR,paraquelafrmulade resultados en todas las celdas de la matriz. J. M. JuradoEXCEL para Qumica Analtica 39 3.5.2. Linealidad: Prueba de la falta de ajuste (lack of fit). Serealiza estapruebaparaversielmodeloseajustabienalosdatos.Comorequisito indispensablehaberrealizadoreplicadosporcadaniveldeconcentracin.Enlneas generales se trata de corregir la varianza de los residuales con la varianza de repeticin purapromediadaparatodoslosnivelesycomprobarsiestavarianzacorregida(la varianzade falta de ajuste 2LOFs ) difiere de la de repeticin pura mediante un test F.Parapoderpromediarlasvarianzasderepeticinencadaniveldeconcentracines necesarioqueestasnodifieranentres.ParaelloserealizaraeltestdeCochranpara deteccin de outliers dispersivos. Supongamos que realizamos r replicados en n niveles de concentracin. Cuando se tiene unaseriederesultadosagrupadosenreplicados,ysesospechaqueunaseriede replicadospuedeconstituirunoutlierdispersivo,esdecir,quepresentaunavarianza sospechosa,porserlamayordelaserie,sepuedeusarlapruebadeCochran[17].De esta forma se decide si dicha varianza puede considerarse o no un outlier. El estadstico C de Cochran se calcula segn la siguiente frmula: 2max21hiisCs== (61) ElvalorobtenidosecomparaconeltabuladoC(h,r, ).Siendo 2maxs lavarianza sospechosa, h el nmero de series de replicados, 2islas varianzas decada una de estas series, r el nmero de replicados y el nivel de significacin. Si el valor calculado es mayorqueelterico,normalmenteparaun95%deniveldeconfianza,seconsidera quelaseriedereplicadossospechosa constituye unoutlierdispersivo.Enestecasono tiene sentido la prueba de la falta de ajuste, puesto que los datos no son homocedsticos y no se debera aplicar la regresin lineal ordinaria, sino la ponderada. En el ANEXO 2 se presentan los valores tabulados del parmetro C. Una vez hecho esto, si no hay outliers dispersivos, se calcula una varianza de error puro como la media de las varianzas a cada nivel (suponiendo h niveles). 22hiiPEssh= (62) J. M. JuradoEXCEL para Qumica Analtica 40 Con r-1 grados de libertad (se han sumado h varianzas de r-1 grados de libertad pero se ha dividido entre h). A partir del ANOVA se tiene la varianza de los residuales: ( )222ni iiRESy ysn= (63) Para obtener la varianza de falta de ajuste se resta la de error puro a la de los residuales. 2 22( 2) ( 1)( 2) ( 1)RES PELOFn s r ssn r = (64) Tras esto se calcula el factor F de falta de ajuste: 22LOFLOFPEsFs=(65) Si(0.05, 1, 1)LOF critF F n r r < la varianzade falta de ajuste no ser estadsticamente mayor que la de error puro. Esto quiere decir que no existe un error debido a la falta de ajustedelmodeloquenopuedaseratribuidoalpropiamentealeatorio,porlotanto,el modelo lineal se ajusta perfectamente a los datos experimentales. 3.5.3. Linealidad e intervalo dinmico: mtodo del factor de respuesta de Huber. ElmtododelfactorderespuestadeHuber[18]seaplicacuandotenemosrectasde calibrado corregidas con el blanco para que la ordenada sea prcticamente cero. As, si la respuesta es prcticamente y=bx, los factores de respuesta R=y/x sern prximos a b. Serepresentay/xfrentealaconcentracindeanalito(ofrenteallogaritmosiel intervalodetrabajoesamplio,porejemplo1-1000mg/L).Calculamoslamedianade losfactoresderespuesta,M,trazandounarectaenestevalorydosrectasmscon valores1.05My0.95M.Lospuntosexperimentalesqueseencuentrenentreesasdos lneas corresponden al intervalo lineal. J. M. JuradoEXCEL para Qumica Analtica 41 3.5.4. Comparacin con un mtodo de referencia. Paracompararunmtodoqueestsiendovalidadoconunodereferenciausandouna recta de regresin se representan los resultados obtenidos por el mtodo a validar frente alosobtenidosporeldereferencia,obteniendolaecuacindelarecta ( ) ( )b ay b s x a s = + . Donde yson los resultados obtenidos con el mtodo a validar y x los obtenidos por el de referencia. Si los dos mtodos llevan a resultados idnticos, es obvio que la pendiente debe ser igual a la unidad y la ordenada igual a cero. Se calculan los parmetros t de Student: 0aaats=(66) 1bbbts=(67) Se comparan con el valor tabulado t(0.05,n-2).Si b=1 y a= 0, ambos mtodos llevan a resultados estadsticamente iguales. Los mtodos son equivalentes. Sib=1ya0,elmtodoacalibrardaunresultadomsaltoomsbajoqueelde referencia,peroenunacantidadfija.esdecir,seproducenerroressistemticos constantes o aditivos. J. M. JuradoEXCEL para Qumica Analtica 42 Sib1ya=0,seproduceunerrorsistemticoproporcionalalaconcentracinde analito en el mtodo a validar.Si b 0 y a 0, existen los dos tipos de errores. 3.5.6. Efecto matriz. El efecto matriz se debe, como su propionombre indica a la matriz de la muestra. Las muestras, salvo en contadasocasiones, debentratarse antes de ser medidas. La medida serealizaconunatcnicadeterminadaylasealobtenidaseinterpolaenlosvalores obtenidos mediante una recta de calibrado. A veces, el hecho de tratar la muestra no es suficiente, pues puede quedar en una matriz que difiere de los estndares utilizados para realizarelcalibradoyesmuyposiblequeesamatrizinterfieraenelanlisis.Sedebe estudiarentoncessiexisteonodichoefecto.Siesas,nopodremosrealizarelel anlisis utilizando un calibrado externo, sino que deberemos usar el mtodo de adicin patrn. Sepuededetectarlapresenciadeefectomatrizcomparandoelcalibradoexterno con el de adicin patrn. Se tratara de obtener la pendiente de calibrado externo y la de adicinpatrnycompararlas.Enprimerlugarrealizamoselcocienteentreambas pendientes y calculamos la desviacin estndar asociada al mismo: CEAPbRb=(68) 2 22 2CE APb bRCE APs sS Rb b| |= +| |\ (69) Donde bCE y bAP son las pendientes de las rectas de calibrado externo y adicin patrn, respectivamente, CEbs y APbs sonsusdesviacionesestndarcorrespondientes.Siambas pendientessonprcticamenteiguales,sucociente,R,nodebesersignificativamente distinto de 1. Calculando la t de Student como: 1calRRtS=(70) El valor calculado se compara con elfactor de cobertura k = 2 para un 95 % de nivel de confianza[10].Sitcalesmayorque2,lasdospendientesnoserancomparablesyel anlisis deber realizarse por el mtodo de adicin patrn.J. M. JuradoEXCEL para Qumica Analtica 43 Bibliografa 1.Thefitnessforpurposeofanalyticalmethods.Alaboratoryguidetomethod validationandrelatedtopics.EURACHEM,LGC,Teddington,UK1998. http://www.eurachem.org/guides/valid.pdf. 2. R. Compa, A. Rios. Garanta de la calidad en los laboratorios analticos. Editorial Sntesis, Madrid, 2002. 3. J. M. Jurado, A. Alczar, F. Pablos, M. J. Martn, A. G. Gonzlez. Talanta, 2004, 63, 297-302 4.J.Inczedy,T.Lengyel,A.M.Ure.CompendiumofAnalyticalNomenclature3rd edition. Blackwell Science, 1998 5. L. Cuadros, A.M. Garc a and J.M. Bosque, Anal. Lett. 1996, 29, 1231 6. L. Huber. LC-GC Int. 1998, 11, 96105 7. J. N. Miller, J. C. Miller. Estadstica y quimiometra para qumica analtica. Prentice Hall, Madrid, 2002. 8.J.A.Rafter,M.L.Abell,J.P.Braselton.Multiplecomparisonmethodsformeans. SIAM Review, 2002, 44, 259-278. 9.H.L.Harter.Tablesofrangeandstudentizedrange.AnnalsofMathematical Statistics, 1960, 31, 1122-1147. 10. A. G. Gonzlez, M. A. Herrador. A practical guide to analytical method validation, includingmeasurementuncertaintyandaccuracyprofiles.TrendsinAnalytical Chemistry, 2007, 26, 227-238. 11.W.Horwitz.EvaluationofAnalyticalMethodsusedforregulationsoffoodsand drugs. Analytical Chemistry, 1982, 54, 67A-76A. 12.R.Wood.Howtovalidateanalyticalmethods.TrendsinAnalyticalChemistry, 1999, 18, 624-632. 13.AOACInternational.MethodValidationProgram(OMA/PVMDepartment), includingAppendixD:Guidanceforcollaborativestudyprocedurestovalidate characteristics of a method of analysis, 2000 J. M. JuradoEXCEL para Qumica Analtica 44 14.I.Taverniers,M.DeLoose,E.vanBockstaele,TrendsinAnalyticalChemistry, 2004, 23, 535. 15.E.Pitchard,Qualityintheanalyticalchemistrylaboratory.ACOLSeries,Wiley, Chichester, West Sussex, UK, 1995. 16. International Organization of Standarization (ISO), ISO/DTS 21748, Guide to te use ofrepeatability,reproducibilityandtruenessestimatesinmeasurementuncertainty estimation, ISO, Geneva, Switzerland, 2003 17.W.G.Cochran.Thedistributionofthelargestofasetofestimatedvariancesasa fraction of their total. Annals of Eugenics, 1941, 11, 47-61. 18.L.Huber.Validationofanalyticalmethods:reviewandstrategy.LC-GC International. 1998, 11, 96-105. J. M. JuradoEXCEL para Qumica Analtica 45 ANEXO 1.Tabla de valores estandarizados para el test de Tukey J. M. JuradoEXCEL para Qumica Analtica 46 ANEXO 2. Parmtro C para el contraste de Cochran. k: conjunto de datos, n: replicados. 95% n.c. J. M. JuradoEXCEL para Qumica Analtica 47