Diapositivas Clase Estadística

150
3 h/ Semanales. 3 Créditos ESTADÍSTICA APLICADA AL ANÁLISIS QUÍMICO Cesar Alberto Arizabaleta Ibarbo Universidad del Valle Sede Yumbo Febrero / Junio (2014)

description

nn

Transcript of Diapositivas Clase Estadística

Page 1: Diapositivas Clase Estadística

3 h/ Semanales. 3 Créditos

ESTADÍSTICA APLICADA AL

ANÁLISIS QUÍMICO

Cesar Alberto Arizabaleta Ibarbo

Universidad del Valle – Sede Yumbo

Febrero / Junio (2014)

Page 2: Diapositivas Clase Estadística

2

ESTADISTICA EN QUIMICA ANALITICA

RESULTADOS CUANTITATIVOS Deben ser válidos

(estimación de errores)

•Precisos

•Exactos

ADQUISICION

DE DATOS

DISEÑO

EXPERIMENTAL ANALISIS

MANIPULACION

DE DATOS

DURANTE

DESPUES ANTES

Page 3: Diapositivas Clase Estadística

3

CALIDAD CONFIABILIDAD

RESULTADO CONFIABLE

RESULTADO VALIDO

VALIDEZ: GRADO AL CUAL UNA

MEDICION (REALIZADA

MEDIANTE UN INSTRUMENTO

Y/O PROCEDIMIENTO

ANALITICO ESPECIFICOS)

PRODUCE EL RESULTADO

ESPERADO

Page 4: Diapositivas Clase Estadística

4

CLASES DE ERRORES

Errores crasos

* Muy graves, abandonar el experimento

Errores aleatorios o indeterminados

* Producen una dispersión de los resultados individuales

a ambos lados de un valor medio

Errores sistemáticos o determinados

* Concordancia o proximidad al valor real, todos los

resultados son erróneos en el mismo sentido

(SESGO)

Page 5: Diapositivas Clase Estadística

5

Page 6: Diapositivas Clase Estadística

6

Page 7: Diapositivas Clase Estadística

7

ERRORES ALEATORIOS

•Se relacionan con la precisión

•NUNCA se pueden eliminar

Reproducibilidad: Concordancia de los valores cuando

las mediciones individuales se realizan

en condiciones no repetitivas

•Ocasiones diferentes

•Soluciones diferentes

•Variabilidad ambiental

•Material de vidrio diferente

Repetibilidad: Concordancia de los valores cuando las

mediciones individuales se realizan en

condiciones repetitivas

Page 8: Diapositivas Clase Estadística

8

ERRORES SISTEMÁTICOS

Se pueden eliminar con controles adecuados de la técnica

y el equipo

EXISTE ERROR SISTEMÁTICO?

Se debe de conocer el valor

verdadero

POCO PROBABLE

Fácil de cometer

errores sistemáticos

Page 9: Diapositivas Clase Estadística

9

CAUSAS DE ERRORES SISTEMÁTICOS

1. Contaminación por el material usado y reactivos

utilizados

2. Lavado incompleto en análisis gravimétrico

3. Error del indicador en análisis volumétrico

4. Descalibración de equipos instrumentales (pH-

metros, termómetros, cronómetros, monocromadores

descalibrados, ect.

Page 10: Diapositivas Clase Estadística

10

Los errores sistemáticos se pueden eliminar o minimizar

usando materiales de referencia y métodos estándar

Se puede evidenciar un error sistemático

analizando el analito por dos métodos no

relacionados

ERRORES SISTEMÁTICOS

SOLO ERRORES ALEATORIOS

Page 11: Diapositivas Clase Estadística

11

ESTADÍSTICA

Herramienta utilizada para discriminar entre las partes

sistemática (determinada) y al azar (indeterminada) de

una señal

error = D + d Total Sistemática Al azar

Objetivo de una

medición

Page 12: Diapositivas Clase Estadística

PARA SEPARAR LA PARTE SISTEMATICA DE UNA SEÑAL

ESPECIFICA, EL ANALISTA DEBERA TENER UN

CONOCIMIENTO PREVIO DE LAS POSIBLES FUENTES DE

ESA PARTE SISTEMATICA

LA ESTADISTICA ES UN COMPLEMENTO QUE LE AYUDA INDIRECTAMENTE EN DICHA SEPARACION

OBJETIVO DE UNA MEDICION:

DETERMINAR LA MAGNITUD DE LA PARTE

SISTEMATICA DE LA SEÑAL

12

Page 13: Diapositivas Clase Estadística

SU PRESENCIA PUEDE SER DETECTADA MEDIANTE

PRUEBAS ESTADISTICAS SENCILLAS. DICHAS PRUEBAS,

SIN EMBARGO, NO PERMITEN IDENTIFICAR EL ORIGEN

DEL ERROR SISTEMATICO

LA MANERA MAS SIMPLE DE DETERMINAR LA PRESENCIA

DE ERROR SISTEMATICO ES CUANTIFICAR EL ANALITO EN

UN MATERIAL DE REFERENCIA (ESTANDAR)*

ERROR SISTEMATICO

13

* MATERIAL DE REFERENCIA:

CONTIENE UNO O MAS ANALITOS EN CONCENTRACION CONOCIDA CON

ALTAS EXACTITUD Y PRECISION

PUEDEN OBTENERSE EN

National Institute of Standards and Technology (NIST)

American Society for Testing and Materials (ASTM)

Page 14: Diapositivas Clase Estadística

Química

Analítica

Análisis

Clásico

Volumetría

Gravimetría

Análisis

Instrum.

Óptica

Electroquímica

Separaciones

RMN

Page 15: Diapositivas Clase Estadística

Química

Analítica

Análisis

Clásico

Estadística

Volumetría

Gravimetría

Análisis

Instrum.

Óptica

Electroquímica

Separaciones

RMN

Page 16: Diapositivas Clase Estadística

¿Cuánto ANALITO hay en la MUESTRA?

Objeto de análisis

-pelo humano

-multivitamínico

-piel de rana

-agua residual

-fósil

-suelo marciano

-salmonella

- …

Page 17: Diapositivas Clase Estadística

¿Cuánto ANALITO hay en la MUESTRA?

Objeto de análisis

-pelo humano

-multivitamínico

-piel de rana

-agua residual

-fósil

-suelo marciano

-salmonella

- …

Substancia que se desea cuantificar

-vitamina B1

-Pb

-TNT

-pesticida organofosforado

-sacarosa

-clorhidrato de cocaína

-colesterol

-…

Page 18: Diapositivas Clase Estadística

¿Cuánto ANALITO hay en la MUESTRA?

Objeto de análisis

-pelo humano

-multivitamínico

-piel de rana

-agua residual

-fósil

-suelo marciano

-salmonella

- …

Substancia que se desea cuantificar

-vitamina B1

-Pb

-TNT

-pesticida organofosforado

-sacarosa

-clorhidrato de cocaína

-colesterol

-… CONCENTRACIÓN

Page 19: Diapositivas Clase Estadística

MÉTODO ANALÍTICO

Muestreo

Almacenamiento Tratamiento

Medida

(propiedad fís.) Cálculo []p

Resultado

Page 20: Diapositivas Clase Estadística

Muestreo

Recolección de la muestra a partir de un LOTE

(todo o unidades)

Debe garantizarse que dicha muestra sea

representativa

Page 21: Diapositivas Clase Estadística

Almacenamiento

Utilización de recipientes y condiciones adecuados

para disponer la muestra recolectada

Debe evitarse que el analito sufra

dilución o concentración

Page 22: Diapositivas Clase Estadística

Tratamiento

Se prepara la muestra para la determinación del (los)

analito (s). Para ello puede requerirse:

*Homogenización

*Medida exacta de VARIAS ALÍCUOTAS (mL, g)

*Disolución (digestión)

*Eliminación de interferencias

*Derivatización

*Preconcentración

Page 23: Diapositivas Clase Estadística

Medida

(propiedad fís.)

Medición de la propiedad física que conserva

proporcionalidad con el analito:

* Volumétrica (mL)

* Gravimétrica (g)

* Óptica (mUA, η)

* Electroquímica (A, V, C, Ώ)

Page 24: Diapositivas Clase Estadística

Cálculo []p

Utilización de soluciones estándar (patrones)

para obtener la concentración del analito en

La muestra tratada. Se utilizan procesos de:

* Estandarización

* Calibración

Page 25: Diapositivas Clase Estadística

Resultado

Teniendo en cuenta la concentración parcial

obtenida y la secuencia del tratamiento, se

calcula la concentración del analito en la muestra

a partir de un DESARROLLO DIMENSIONAL.

Este valor de concentración debe ser reportado

con su respectiva incertidumbre

Page 26: Diapositivas Clase Estadística

26

POBLACION Y MUESTRA

• POBLACIÓN

Colección completa de objetos que comparten una o

más características

Número infinito de resultados que, se puede obtener

con una infinita cantidad de muestra y en una infinita

cantidad de tiempo

• MUESTRA

Un subconjunto de una población

Page 27: Diapositivas Clase Estadística

27

Leyes de la estadística

sólo para poblaciones

Leyes de la estadística

para muestras

La muestra debe ser representativa

de la población

Page 28: Diapositivas Clase Estadística

ESTRICTAMENTE, LAS LEYES DE LA ESTADISTICA SE

APLICAN SOLO A POBLACIONES. CUANDO ESTAS LEYES

SE APLICAN A MUESTRAS DE DATOS DE LABORATORIO,

SE ASUME QUE LA MUESTRA ES REPRESENTATIVA DE LA

POBLACION

LA ESTADISTICA TIENE SUS BASES EN LA TEORIA DE

PROBABILIDADES (UNA TEORIA UTILIZADA PARA

EXPLICAR EVENTOS AL AZAR)

LA ESTADISTICA NO MANEJA “ABSOLUTOS”: SOLO PUEDE

DECIR SI UN EVENTO ES ESTADISTICAMENTE SIGNIFICATIVO O

ESTADISTICAMENTE INSIGNIFICANTE

PUNTOS IMPORTANTES

EN ESTADISTICA

28

Page 29: Diapositivas Clase Estadística

29

MEDIA

POBLACIÓN:

MUESTRA:

n = NÚMERO DE MEDICIONES

xi = i-ÉSIMA MEDICIÓN DE x

n

xn

i

n

i

1

lim

n

x

x

n

i

i 1

Page 30: Diapositivas Clase Estadística

30

Page 31: Diapositivas Clase Estadística

31

DESVIACIÓN ESTÁNDAR

POBLACIÓN:

MUESTRA:

sn-1 en calculadora

n

xn

i

i

n

1

2)(

lim

s

1

)(1

2

n

xx

s

n

i

i

Page 32: Diapositivas Clase Estadística

32

Page 33: Diapositivas Clase Estadística

33

DESVIACIÓN ESTANDAR RELATIVA (RSD)

o

[COEFICIENTE DE VARIACIÓN (CV)]

x

sRSD

100% x

sRSD

VARIANZA

S2

ss

100% x

sRSD

Page 34: Diapositivas Clase Estadística

34

GRADOS DE LIBERTAD Número de valores no restringidos

Ejemplo: • ESCOJA UN TOTAL DE 5 VALORES AL AZAR:

3 5 17 2 10

5 GRADOS DE LIBERTAD

• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:

3 5 17 2 13

4 GRADOS DE LIBERTAD

Para obtener un promedio de 8 después de escojer

los primeros 4 valores, el 13 y solamente el 13

puede ser el 5o valor

Page 35: Diapositivas Clase Estadística

35

GRADOS DE LIBERTAD

• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6:

3 5 17 3.725 11.275

3 GRADOS DE LIBERTAD

Para obtener un promedio de 8 y una desviación estándar de

6, solamente los numeros 3.725 y 11.275 pueden ser el 4oy

el 5o valores, despues de escojer los primeros 3 numeros

EN GENERAL:

GL= n - m

Grados de libertad Número de

datos

Parámetros

estadísticos

calculados

Page 36: Diapositivas Clase Estadística

36

Desviación

estándar

Medida de la dispersión de

una serie de medidas

respecto a un valor medio

Tablas de

frecuencias e

histogramas

Indica la forma de la

distribución alrededor de

un valor medio

Muestra de

gran tamaño

1. La media de la muestra es una

estimación de

2. La desviación estándar de la muestra es

una estimación de s

Page 37: Diapositivas Clase Estadística

37

DISTRIBUCIÓN DE MEDIDAS REPETIDAS

En un laboratorio de control de calidad se

obtuvieron en los últimos 70 análisis datos del nivel

de tensoactivo en un Shampoo (%). Construya un

histograma.

10 17 9 17 18 20 16

7 17 19 13 15 14 13

12 13 15 14 13 10 14

11 15 14 11 15 15 16

9 18 15 12 14 13 14

13 14 16 15 16 15 15

14 15 15 16 13 12 16

10 16 14 13 16 14 15

6 15 13 16 15 16 16

12 14 16 15 16 13 15

Page 38: Diapositivas Clase Estadística

38

TABLA DE FRECUENCIAS

% Ten. Frecuencia

6 1

7 1

9 2

10 3

11 2

12 4

13 10

14 11

15 16

16 13

17 3

18 2

19 1

20 1 0

2

4

6

8

10

12

14

16

6 7 8 9

10

11

12

13

14

15

16

17

18

19

20

% Tensoactivo

Fre

cu

en

cia

HISTOGRAMA

La distribución de las mediciones

es cercanamente simétrica con

respecto a la media

Al aumentar el número de datos la simetría se hace más aparente

Page 39: Diapositivas Clase Estadística

39

LA DISTRIBUCION NORMAL (GAUSSIANA)

ss 2]2exp[ 22 xy

Distribuciones normales con la misma

media pero diferentes valores de la

desviación estándar

Page 40: Diapositivas Clase Estadística

40

PROPIEDADES DE LA DISTRIBUCIÓN

NORMAL

Distribución normal

estandarizada

Z=(Xi-)/s

Page 41: Diapositivas Clase Estadística

41

F(z), función de distribución acumulativa normal

estándar

Page 42: Diapositivas Clase Estadística

42

EJEMPLO

Si las medidas repetidas de una valoración se distribuyen

de forma normal con media de 10.15 mL y desviación

estándar de 0.02 mL, encontrar la proporción de medidas

que caen entre 10.12 y 10.20 mL.

*Para 10.12 z= (10.12 – 10.15)/0.02= -1.5

F(-1.5)= 0.0668

*Para 10.20 z= (10.20 – 10.15)/0.02= 2.5

F(2.5)= 0.9938

Proporción de medidas 0.9938 – 0.0668 = 0.927

Page 43: Diapositivas Clase Estadística

43

EJERCICIOS

1- El valor medio del peso de una marca de jabón

durante el año pasado fue de 0,297 kg, su

desviación estándar fue 0,024 kg. Calcule el

porcentaje de datos que está comprendido

debajo del límite de especificación de 0,274 kg.

2- Con los datos anteriores, calcule el porcentaje

de datos comprendidos arriba de 0,347 kg.

3- Se desea que el 12.1 % del voltaje de línea esté por

debajo de los 115 V, ¿cómo habrá que ajustar el

voltaje medio? La dispersión es de s=1.20 V.

Page 44: Diapositivas Clase Estadística

44

DISTRIBUCIONES LOG-NORMAL

Distribución diferente a la normal al representar la

frecuencia frente a la concentración (u otra característica),

pero su frecuencia representada frente al logaritmo de la

concentración (u otra característica) proporciona una curva

de distribución normal.

Concentración del anticuerpo inmunoglobulina M en suero de individuos machos

Page 45: Diapositivas Clase Estadística

45

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

• La media de una serie de medidas proporciona una

estimación del valor verdadero, , (en ausencia de errores

sistemáticos ).

• Aun sin errores sistemáticos, las medidas individuales

varían por errores aleatorios y es poco probable que su

media corresponda en forma exacta al valor verdadero.

• Es más útil proporcionar un intervalo de valores donde

sea probable que se encuentre el valor verdadero.

El intervalo depende de:

•Precisión de las medidas individuales (s)

•Número de medidas de la muestra

Page 46: Diapositivas Clase Estadística

46

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

0,51 0,51 0,51 0,50 0,51 0,49 0,52 0,53 0,50 0,47

0,51 0,52 0,53 0,48 0,49 0,50 0,52 0,49 0,49 0,50

0,49 0,48 0,46 0,49 0,49 0,48 0,49 0,49 0,51 0,47

0,51 0,51 0,51 0,48 0,50 0,47 0,50 0,51 0,49 0,48

0,51 0,50 0,50 0,53 0,52 0,52 0,50 0,50 0,51 0,51

0,506 0,504 0,502 0,496 0,502 0,492 0,506 0,504 0,500 0,486

Medias de cinco valores con menor

dispersión respecto a todos los 50

datos originales

Su desviación estándar es el error

estándar de la media e.e.m.

e.e.m.= s/n

Page 47: Diapositivas Clase Estadística

47

TEOREMA DEL LIMITE CENTRAL

Aun si la población original no es normalmente

distribuida, la distribución de las medias tiende a ser

más normalmente distribuida a medida que n aumenta

CONFIABILIDAD DE UN RESULTADO ANALÍTICO

Resultado analítico = x ± Intervalo de confianza

INTERVALO DE CONFIANZA: Rango dentro del cual se puede asumir razonablemente que

se encuentra el valor real a determinada probabilidad.

LÍMITES DE CONFIAZA Son los valores extremos de ese rango

Page 48: Diapositivas Clase Estadística

48

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Intervalo donde se encuentra el

95% de las medias muestrales

Page 49: Diapositivas Clase Estadística

49

En la práctica se dispone habitualmente de una muestra,

de media conocida, y se busca un intervalo para , el

valor verdadero

Si la muestra es grande, s se puede sustituir por s

Page 50: Diapositivas Clase Estadística

50

LIMITES DE CONFIANZA

Para muestras grandes:

1.96 (95%)

z =

2.58 (99%)

* Si se conoce s se sustituye por s

Para muestras pequeñas:

t= f(GL, P)

GL: grados de libertad

P: probabilidad de que este

dentro del rango establecido

Page 51: Diapositivas Clase Estadística

51

Ejercicio:

Se determinó la concentración de plomo en la sangre

de 50 niños de una escuela cerca de una carretera con

mucho tráfico. La media fue de 10.1 ng/mL y la

desviación estándar fue de 0.6 ng/mL.

a) Calcular el intervalo de confianza de la

concentración media de plomo en todos los niños de la

escuela a un nivel de confianza del 95 %.

b) ¿Cuál debería ser el tamaño de la muestra para

reducir el rango de confianza a 0.2 ng/mL (es decir,

±0.1 ng/mL)?

Page 52: Diapositivas Clase Estadística

52

Los límites de confianza se pueden utilizar como

una prueba para detectar errores sistemáticos

Ejemplo:

Se utilizó una solución de 0.1 M de ácido para valorar

10 mL de una solución de NaOH de 0.1 M dando los

siguientes volúmenes de ácido:

9.88, 10.187, 10.23, 10.39, 10.25 mL

Calcular los límites de confianza de la media al 95 % y

utilícelos para decir si existe alguna evidencia de error

sistemático.

Page 53: Diapositivas Clase Estadística

53

Límites de confianza de la media geométrica

de una distribución log-normal

Ejemplo:

El diámetro de las gotas en un aerosol presenta un

comportamiento log-normal. Los diámetros de 10 gotas de

un líquido presentan los siguientes valores en micrómetros:

3.43 2.56 1.34 1.13 3.56

2.01 2.23 2.78 1.12 1.65

Calcular el intervalo de confianza de la media geométrica al

95% suponiendo que los diámetros de las gotas se

distribuyen log-normal.

Page 54: Diapositivas Clase Estadística

54

PROPAGACION DEL ERROR ALEATORIO

• Los errores aleatorios se compensan entre sí

• Cada paso de un procedimiento puede tener una

incertidumbre en su medida (error aleatorio)

• Al combinar las diferentes mediciones (sumas,

restas, multiplicaciones, etc.) para calcular una

cantidad final, el error aleatorio se propaga y

genera una desviación estándar final

x= a + b Si, (a ± 1) y (b ± 1) el error

aleatorio de x NO es ± 2

Page 55: Diapositivas Clase Estadística

55

PROPAGACIÓN DEL ERROR ALEATORIO

Suma o resta:

p, q y r son variables

experimentales

sp,sq y sr sus

desviaciones estándar

Ejemplo:

Calcular el peso promedio y su desviación estándar de

los siguientes valores: 1.56, 1.68, 2.36 g, cada uno de

los pesos con una desviación estándar de 0.03.

Page 56: Diapositivas Clase Estadística

56

PROPAGACIÓN DEL ERROR ALEATORIO

Multiplicación o división:

Desviación

estándar relativa

Ejemplo:

La carga eléctrica se calcula a partir de la expresión

Q=I.t, donde I es la corriente en amperios y t el tiempo

en segundos. Calcular la desviación estándar relativa de

la carga si las desviación estándar relativa de la

corriente es 3% y la del tiempo es 1.5%.

Page 57: Diapositivas Clase Estadística

57

PROPAGACIÓN DEL ERROR ALEATORIO

Elevar a una potencia:

Desviación estándar relativa

Ejemplo:

El producto de solubilidad del sulfato de bario es 1.3 x 10-10,

con una desviación estándar de 0.1 x 10-10. Calcular la

desviación estándar de la solubilidad calculada del sulfato de

bario en agua.

Page 58: Diapositivas Clase Estadística

58

PROPAGACIÓN DEL ERROR ALEATORIO

Logaritmo:

Ejemplo:

La ecuación de Nernst describe la relación entre el potencial y la

concentración del analito i expresada como su actividad ai :

Para n = 1, ¿cuál es el error relativo en E para una

incertidumbre en ai de 0.05 ?

E = Eº - (0.0592/n).log ai

Page 59: Diapositivas Clase Estadística

59

PROPAGACIÓN DE ERRORES SISTEMÁTICOS

• El error sistemático tiene lugar en un sentido definido

y conocido.

Suma o resta:

Dx = Dp + Dq + Dr +…….

• Los errores sistemáticos pueden ser tanto positivos

como negativos y estos signos se deben de incluir en

el calculo de Dx

Multiplicación o división:

Dx/x = (Dp/p) + (Dq/q) + (Dr/r) +….

Page 60: Diapositivas Clase Estadística

60

PRUEBAS O CONTRASTES DE SIGNIFICACIÓN

• Un procedimiento sistemático que nos permite decidir si

un conjunto de mediciones repetidas muestra evidencia

de error sistemático

• Prueba si son significativas las diferencias entre dos

resultados (cantidad medida o resultado y la cantidad

conocida o real), o se pueden justificar sólo por

variaciones aleatorias

• El proposito de una prueba de significación es sacar una

conclusión acerca de una población utilizando datos

provenientes de una muestra

• Se comprueba la veracidad de una hipótesis (hipótesis

nula), la cual plantea que un método NO se encuentra

sujeto a errores sistemáticos

Page 61: Diapositivas Clase Estadística

61

PRUEBAS O CONTRASTES DE SIGNIFICACIÓN

• La estadística calcula la probabilidad o posibilidad de

que la diferencia observada entre la media muestral,

. ,y el valor verdadero, , se debe solamente a un

error aleatorio. x

A menor

probabilidad que

( -) ocurra por

azar

Menor probabilidad

que la hipótesis nula

sea verdadera x

Page 62: Diapositivas Clase Estadística

62

PRUEBAS O CONTRASTES DE SIGNIFICACIÓN

Ejemplo:

En un método para determinar plomo en sangre por absorción

atómica se obtuvierón los siguientes valores para una

muestra estándar que contiene 38.9 ppb de plomo:

38.9 37.4 37.1

¿existe alguna evidencia de error sistemático?

la pregunta es si la diferencia entre el resultado y el valor real

es estadísticamente significativa, o si se debe a meras

variaciones fortuitas (al azar)

80.37x 964.0s

Page 63: Diapositivas Clase Estadística

63

Page 64: Diapositivas Clase Estadística

64

SOLUCIÓN DEL EJEMPLO:

PASO 1

Se plantea la hipótesis nula, Ho, de que no hay error

sistemático. Uno no sabe si esta declaración es cierta

o es falsa, pero será asumida cierta hasta que se

pruebe que es falsa

PASO 2

Prueba estadística que condensa la información de la

muestra en un simple número.

s

nxtcalc

98.1

964.0

39.388.37

calct

Page 65: Diapositivas Clase Estadística

65

PASO 3

Comparación con valores críticos tabulados

tcrit = 4.3 (P = 95%, f = 2)

Si tcalc excede el valor crítico, la hipótesis nula se

rechaza

Los valores críticos pueden intepretarse como

valores que son improbables* que sean

excedidos por la prueba estadística (tcalc) si la

hipótesis nula es cierta

* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR

DE 5% (ES DECIR, MENOS QUE 1 EN 20)

Page 66: Diapositivas Clase Estadística

66

PASO 4

Decisión: se retiene la hipótesis nula

No hay evidencia de error sistemático

tcalc < tcrit

1.98 < 4.3

No significa que no hay error sistemático, sino

que no se ha podido probar su existencia

NOTA IMPORTANTISIMA

LA DECISION DE RETENER LA HIPOTESIS NULA NO

SIGNIFICA QUE SE HA DEMOSTRADO QUE ES CIERTA;

SIMPLEMENTE NO SE PUDO DEMOSTRAR QUE SEA

FALSA

Page 67: Diapositivas Clase Estadística

67

LA HIPOTESIS NULA SE USA

EN LAS CORTES CRIMINALES

EL ACUSADO SE ASUME “NO CULPABLE” HASTA QUE

SE DEMUESTRE QUE ES CULPABLE

VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL

LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA QUE LA

HIPOTESIS NULA DEBE CONSERVARSE

CONCLUSION:

• NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE...

• LO QUE SE HA DEMOSTRADO ES QUE EL ACUSADO ES NO

CULPABLE

Page 68: Diapositivas Clase Estadística

68

COMPARACIÓN DE LAS MEDIAS DE DOS

MUESTRAS

Es una forma en la cual los resultados de un muevo

método analítico pueden comprobarse por

comparación de los resultados obtenidos utilizando un

segundo método (de referencia)

*Se debe conocer Método 1 Método 2

s1 s2

n1 n2

1

___

X 2

___

X

Page 69: Diapositivas Clase Estadística

69

COMPARACIÓN DE LAS MEDIAS DE DOS

MUESTRAS (cont.)

CASO I

Si s1 y s2 NO son significativamente diferentes:

Hipótesis nula: Los dos métodos producen el mismo

resultado

21

21

calc

n

1

n

1s

xxt

Prueba estadística

Estimación conjunta de

la desviación estándar

21

2

22

2

112

ff

sfsfs

f1 grados de libertad método 1

f2 grados de libertad método 2

tcalc tiene (n1+n2-2) grados de libertad

Page 70: Diapositivas Clase Estadística

70

COMPARACIÓN DE LAS MEDIAS DE DOS

MUESTRAS (cont.)

Ejemplo:

Se compararon dos métodos para la determinación de boro en

material vegetal

Método espectrofotométrico

(1)

Método fluorimétrico (2)

S1= 0.3 S2= 0.23

n1= 10 n2= 10

28.0X1 26.25X2

¿Estos dos métodos dan resultados cuyas medidas difieren

significativamente a un nivel de confianza del 95 %?

Page 71: Diapositivas Clase Estadística

71

COMPARACIÓN DE LAS MEDIAS DE DOS

MUESTRAS (cont.)

Ejemplo:

Se compararon dos métodos para la determinación de cromo

en muestras de hierba de centeno:

Método (1) Método (2)

S1= 0.28 S2= 0.31

n1= 5 n2= 5

1.48mg/KgX 2.33mg/KgX

• ¿Estos dos métodos dan resultados cuyas medidas difieren

significativamente a un nivel de confianza del 95 %?

• Si la hipótesis nula fuera verdadera ¿la probabilidad de que

la diferencia de las medias se deba al azar será menor de 1

en 100?

Page 72: Diapositivas Clase Estadística

72

COMPARACIÓN DE LAS MEDIAS DE DOS

MUESTRAS (cont.)

CASO II

Si s1 y s2 son significativamente diferentes:

Hipótesis nula: Los dos métodos producen el mismo

resultado

Prueba estadística

2

2

2

1

2

1

21

calc

n

s

n

s

xxt

2

1n

n

s

1n

n

s

n

s

n

s

f

2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

Grados de libertad

Se redondea al entero más cercano

Page 73: Diapositivas Clase Estadística

73

COMPARACIÓN DE LAS MEDIAS DE DOS

MUESTRAS (cont.)

Ejemplo:

La siguiente tabla proporciona la concentración de tiol en sangre de

dos grupos de voluntarios, el primer grupo es “normal” y el segundo

sufre de artritis reumatoide:

Normal Reumatoide

1.84 2.81

1.92 4.06

1.94 3.62

1.92 3.27

1.85 3.27

1.91 3.76

2.07

Concentracion de tiol (mM)

¿Son los resultados de estas dos

muestras significativamente

diferentes a una P=0.005?

Page 74: Diapositivas Clase Estadística

74

Qué prueba t utilizar?

s1 = s2?

SI

NO

21 fff

2

2

2

1

2

1

21

n

s

n

s

xxtcalc

2

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

s

n

n

s

n

s

n

s

f

21

21

11

nns

xxtcalc

21

2

22

2

112

ff

sfsfs

CASO I

CASO II

Page 75: Diapositivas Clase Estadística

75

LA PRUEBA t POR PAREJAS

Circunstancias en las cuales es necesario o deseable

hacer una comparacion de medias por parejas

• Circunstancias en las cuales es necesario o deseable

hacer una comparación de medias por parejas

• Muestras de origenes diferentes y posiblemente con

concentraciones diferentes

• Muestras que se reciben en un período de tiempo largo (se

hace necesario eliminar efectos de condiciones

ambientales variables como temperatura, presión, etc.)

Se asume que cualquier error (sistemático o al azar) es

independiente de la concentración

Page 76: Diapositivas Clase Estadística

76

LA PRUEBA t POR PAREJAS (cont)

Ejemplo:

La siguiente tabla proporciona la concentración de plomo

(mg/ml) por dos métodos diferentes para 4 muestras:

Muestra Método 1 Método 2

1 71 76

2 61 68

3 50 48

4 60 57

• Los dos métodos proporcionan valores para las

concentraciones medias de plomo que difieran

significativamente?

Page 77: Diapositivas Clase Estadística

77

LA PRUEBA t POR PAREJAS (cont)

Solución al ejemplo:

• Se observa la diferencia entre cada par de resultados

dados por los dos métodos

• Hipótesis nula: No existen diferencias significativas

en las concentraciones dadas por los

dos métodos

• Se debe de probar si la media de las diferencias

difiere significativamente de cero

Muestras Diferencias

1 -5

2 -7

3 2

4 3

1.75Xd 4.99sd

Medias de las

diferencias

Desviación

estándar de las

diferencias

Page 78: Diapositivas Clase Estadística

78

LA PRUEBA t POR PAREJAS (cont)

Solución al ejemplo:

d Valor real de las diferencias

d=0

ns

Xn

s

μXt

d

d

d

dd

c a l c

Prueba estadística

Tiene (n-1)

grados de

libertad

0.7044.99

1.75t c a l c

tcrit=3.18 (P=0.05, f=3)

tcalc < tcrit

Se acepta la

hipótesis nula

Page 79: Diapositivas Clase Estadística

79

LA PRUEBA t POR PAREJAS (cont)

Ejemplo:

Se analiza la concentración de paracetamol (% p/p) en

pastillas por dos métodos diferentes. Se analizaron diez

patillas de diez lotes diferentes para ver si diferían los

resultados obtenidos por los dos métodos.

Lote Método UV Método IR

1 84.63 83.15

2 84.38 83.72

3 84.08 83.84

4 84.41 84.20

5 83.82 83.92

6 38.55 84.16

7 83.92 84.02

8 83.69 83.60

9 84.06 84.13

10 84.03 84.24

• Mediante una prueba t por

parejas contrastar si los dos

métodos producen resultados

significativamente diferentes

Page 80: Diapositivas Clase Estadística

80

LAS PRUEBAS DE UNA Y DOS COLAS

DOS COLAS (bilateral)

Diferencia de dos medias

en cualquier dirección, no

se tiene en cuenta el

signo de la diferencia

UNA COLA (unilateral)

Se tiene una idea

preconcebida sobre el

signo de la diferencia

o,μX μX

Se conoce su signo

No se tiene una

idea preconcebida

del signo de la

diferencia

Page 81: Diapositivas Clase Estadística

81

LAS PRUEBAS DE UNA Y DOS COLAS (cont.)

DOS COLAS (bilateral) UNA COLA (unilateral)

+ _

A un n dado y

una determinada

probabilidad, se

determina tcrit

5% 0.05

+

Incremento

o

_

Decremento

Page 82: Diapositivas Clase Estadística

82

UNA COLA (unilateral)

La probabilidad es la mitad de

la probabilidad en una bilateral

0.05 x 2 = 0.10

El tcrit se determina en la columna P = 0.10

Ejemplo:

Se sospecha que una valoración acido-base tiene un error de

indicador significativo y tiende a dar resultados con un error

sistemático positivo (sesgo positivo). Para comprobarlo, se utiliza

una disolución de ácido exactamente 0.1 M para valorar 25.00 mL

de otra disolución de una base, exactamente 0.1 M con los

siguientes resultados (mL):

25.06 25.18 24.87 25.51 25.34 25.412

• Probar la existencia de sesgo positivo en estos resultados.

Page 83: Diapositivas Clase Estadística

83

EL CONTRASTE F PARA LA COMPARACIÓN DE

DESVIACIONES ESTÁNDAR

Las pruebas anteriores (t) comparan medias y detectan

errores sistemáticos

La prueba F compara desviaciones estándar, o sea los

errores aleatorios de dos conjuntos de datos

USOS:

1. Probar si el método A es más preciso que el método B

(prueba de una cola). Se tiene una idea predeterminada

que un método es MÁS preciso que el otro.

2. Probar si los métodos A y B difieren en su precisión

(prueba de dos colas). No se tiene idea preconcebida de

cual es más preciso.

antes de una prueba t

Page 84: Diapositivas Clase Estadística

84

EL CONTRASTE F PARA LA COMPARACIÓN DE

DESVIACIONES ESTÁNDAR (cont.)

• El contraste F considera la razón de las dos varianzas

muestrales:

2

2

2

1

cal

s

sF F siempre debe ser 1

• Se asume que las poblaciones de donde se toman las

muestras son normales

H0 : Las desviaciones estándar de las poblaciones no

difieren significativamente (la relación de varianzas

es próxima a la unidad)

Page 85: Diapositivas Clase Estadística

85

Método (1) Método (2)

S1= 0.28 S2= 0.31

n1= 5 n2= 5

1.48mg/KgX 2.33mg/KgX

EL CONTRASTE F PARA LA COMPARACIÓN DE

DESVIACIONES ESTÁNDAR (cont.)

Ejemplo:

Se compararon dos métodos para la determinación de cromo en

muestras de hierba de centeno:

Las variazas de ambos métodos

son significativamente iguales?

Ejemplo:

Se compara un método propuesto para la determinación de la

demanda de oxígeno (ppm) en aguas con un método estándar.

Método estándar (1): media: 72 s1=3.31 n=8

Método propuesto (2): media: 72 s2=1.51 n=8

¿Es más preciso el método propuesto que el método estándar?

Page 86: Diapositivas Clase Estadística

86

Page 87: Diapositivas Clase Estadística

87

CONTRASTE DE DIXON (Contraste Q)

• Es una prueba con la cual se contrastan estadísticamente

datos anómalos para determinar si se rechazan o no (para

muestras pequeñas, de 3 a 7 datos).

Ho: Todas las medidas provienen de la misma población

(resultado sospechoso - resultado más próximo)

rango de resultados Qcalc=

• Si Qcalc > Qcrit , el resultado sospechoso puede descartarse

Valores críticos de Q (P=0.05), contraste de dos colas

Tamaño de muestra Valor crítico

4 0.831

5 0.717

6 0.621

7 0.570

Page 88: Diapositivas Clase Estadística

88

CONTRASTE DE DIXON (Contraste Q) (cont.)

Ejemplo:

1. Se obtuvieron los siguientes valores para la concentración

de nitrito (ppm) en una muestra de agua de río:

¿Debería rechazarse la última medida sospechosa?

2. A los datos anteriores se adicionaron otras tres nuevas

medidas,

¿Se debería aún mantener el valor 0.380?

0.403 0.410 0.401 0.380

0.403 0.41 0.401 0.380 0.400 0.413 0.411

Page 89: Diapositivas Clase Estadística

89

CONTRASTE DE GRUBBS (Contraste G)

Ho: Todas las medidas provienen de la misma población

• También usado para datos anómalos

Gcalc= valor sospechoso - s x

Ejemplo:

Aplicar el contraste de Grubbs

a los datos del último ejemplo

Page 90: Diapositivas Clase Estadística

90

Ejercicios:

Datos A Datos B

1.84 2.81

1.92 4.06

1.94 3.62

1.92 3.27

1.85 3.27

1.91 3.76

2.07

1. Realizar los contrastes Q y G para el valor

2.07 de los datos A y el valor 2.81 de los

datos B, ¿son datos anómalos?

2. Demostrar que las varianzas de los dos

grupos de datos difieren significativamente.

3. Los siguientes datos proporcionan la recuperación de bromuro

adicionado a muestras con contenido vegetal, medido mediante un

método de cromatografía gas-líquido. La cantidad de bromuro potásico

añadido a cada vegetal fue la misma.

Tomate 777 790 759 790 770 758 764 g/g

Pepino 782 773 778 765 789 797 782 g/g

a) Pruebe si la recuperación en los vegetales tiene varianzas que difieran

significativamente.

b) Pruebe si las tasas de recuperación media difieren significativamente.

Page 91: Diapositivas Clase Estadística

91

CALIBRACION

EN ANALISIS INSTRUMENTAL

CURVA DE CALIBRACION:

GRAFICAS DE SEÑAL ANALITICA vs CANTIDAD DE ANALITO

(USUALMENTE CONCENTRACION)

PROCEDIMIENTO GENERAL:

Se prepara una serie de muestras (n>3) en las cuales se conoce la concentración del analito (muestras estándares)

Se mide en el instrumento la propiedad de interés (señal

analítica) para cada muestra estándar bajo las mismas

condiciones que se utilizaran en las muestras “desconocidas”

Se grafica la curva de calibración, siempre con la respuesta

instrumental sobre el eje vertical (y) y las concentraciones

estándares sobre el horizontal (x)

Page 92: Diapositivas Clase Estadística

92

CURVAS DE CALIBRACION

IMPLEMENTACION

La concentración de la muestra desconocida se

obtiene por interpolación

En general, es esencial que los estándares cubran el

rango completo de concentración requerido por las

muestras

Siempre se incluye un “blanco”

(un “blanco procedimental”)

Page 93: Diapositivas Clase Estadística

93

CURVA DE CALIBRACIÓN

Muestra

desconocida

Puntos de

calibración

Page 94: Diapositivas Clase Estadística

94

CALIBRACIÓN Se asume que:

Los errores aleatorios en el experimento de calibración

ocurren solamente en los valores y

(recordar que la curva de calibración se construye con la

respuesta analítica sobre las y y las concentraciones

estándares sobre las x)

La magnitud del error aleatorio en y es independiente de la

concentración del analito

El error aleatorio en y sigue una distribución normal

Page 95: Diapositivas Clase Estadística

95

PREGUNTAS ESTADISTICAS A RESOLVER EN UNA

CURVA DE CALIBRACIÓN

La curva de calibracion es lineal? si no lo es, cuál es la forma

(ecuación) de la curva?

Teniendo en cuenta que cada uno de los puntos de la gráfica

está sometido a error aleatorio, cuál es la mejor línea recta

(o curva) a través de estos puntos?

Asumiendo que la gráfica es en verdad lineal, cuáles son los

errores aleatorios estimados y los límites de confianza de la

pendiente y el intercepto de la línea recta?

Page 96: Diapositivas Clase Estadística

96

PREGUNTAS ESTADISTICAS A RESOLVER EN UNA

CURVA DE CALIBRACIÓN

Cuando se utiliza la curva de calibración en una muestra

desconocida, cuál es el error aleatorio y los límites de

confianza de la concentración encontrada?

Cuál es el límite de detección del método? Es decir, cuál

es la mínima concentración del analito que se puede

detectar con un nivel predeterminado de confianza?

Mediante la comparación estadística de curvas regulares de

calibración con curvas de adición de estándar, establecer si

se presentan efectos de matriz. (Estudio estadístico de dos

resultados).

Page 97: Diapositivas Clase Estadística

97

Contiene todos los reactivos y solventes utilizados con la

muestra (sin analito adicionado deliberadamente)

Ser sometido a la misma secuencia de procedimientos

analíticos que a la muestra

La señal del blanco está sujeta a las mismas variaciones

(error aleatorio) que los estándares y muestras

Es indispensable en cualquier análisis químico

La señal instrumental proveniente del blanco es a menudo

diferente de cero

PREPARACIÓN BLANCO

Page 98: Diapositivas Clase Estadística

98

COEFICIENTE DE CORRELACIÓN

• Es una medida de la asociación lineal entre dos variables

Dada una serie de parejas de datos:

(x1,y1), (x2,y2), … (xi,yi), … (xn,yn)

El coeficiente de correlacion, r, esta dado por:

yyxx

xy

SS

Sr

Page 99: Diapositivas Clase Estadística

99

COEFICIENTE DE CORRELACIÓN

Donde:

n

1i iixy)y)(yx(xS

2

ixx)x(xS

2

iyy)y(yS

Suma de los cuadrados

de las desviaciones de

cada media

x : La media de todos los valores de x

y : La media de todos los valores de y

(x,y) : El centroíde de todos los puntos

r2*100 : Porcentaje de ajuste de los datos a la línea de regresión

Page 100: Diapositivas Clase Estadística

100

CALCULO DE r

9989.028.418*112

2.216r

6742 x

1.1377.91 y

EJEMPLO. Se examina una serie de soluciones estándar de

fluoresceína en un fluorímetro, con los siguientes resultados

de intensidad de fluorescencia, I.F.(en unidades arbitrarias)

I.F.: 2.1 5.0 9.0 12.6 17.3 21.0 24.7

Conc., pg/mL: 0 2 4 6 8 10 12

Page 101: Diapositivas Clase Estadística

101

ACERCA DE LOS VALORES DE r

• A menudo, una curva que no luce muy lineal produce

valores muy altos de r

• Un valor alto de r podría ser interpretado erroneamente

como una relación lineal

• La curva de calibración debe graficarse siempre

• Es importante reportar r con el número adecuado de cifras

significativas

Page 102: Diapositivas Clase Estadística

102

VALORES DEL COEFICIENTE DE CORRELACIÓN r

-1 < r < +1

CURVAS ANALITICAS: r > 0.99 (Al menos dos nueves)

Page 103: Diapositivas Clase Estadística

103

INTERPRETACIONES ERRONEAS DEL

COEFICIENTE DE CORRELACION r

Esta curva es suave,

como para generar un

valor de r bastante alto

(la calibración siempre

debe graficarse)

Un r igual a cero no

siempre significa que no

hay relación entre x y y

Page 104: Diapositivas Clase Estadística

104

PRUEBA t PARA EVALUAR r

En caso de un valor bajo de r:

• Es significativo de verdad?

Ho: no hay correlación entre x y y

2calc

r1

2nrt

• tcrit Para (n-2) grados de libertad, prueba t de dos colas

• SI tcalc > tcrit, se rechaza Ho

Page 105: Diapositivas Clase Estadística

105

ECUACIÓN DE LA CURVA LINEAL

• Hay una fuerte relación lineal entre la señal analítica (y) y

la concentración (x)

• “La mejor” línea que pasa por los puntos de la curva de

calibración:

y = a + bx

Pendiente

xx

xy

S

Sb

Intercepto

xbya

• La ecuación sólo es válida cuando r es por lo menos

0.99 y hay evidencia visual de linealidad

Page 106: Diapositivas Clase Estadística

106

Ejemplo de línea de regresión:

Se examina una serie de soluciones estándar de fluoresceína

en un fluorímetro, con los siguientes resultados de intensidad

de fluorescencia (I.F.) (unidades arbitrarias)

I. F. : 2.1 5.0 9.0 12.6 17.3 21.0 24.7

CONC. pg/mL: 0 2 4 6 8 10 12

Sxx Syy Sxy

Page 107: Diapositivas Clase Estadística

107

Ejemplo de línea de regresión (cont.):

6x

1.13y

93.1112

2.216

xx

xy

S

Sb

52.16*93.11.13 xbya

9989.0yyxx

xy

SS

Sr

52.193.1 xy

centroíde

Page 108: Diapositivas Clase Estadística

108

Residuos de y en una regresión

Residuo = Valor medido – valor predicho

iy iy ibxa

Page 109: Diapositivas Clase Estadística

109

Desviación estándar de los residuos o desviación

estándar de la regresión

iii yyResiduo ˆ

xxyyiiSbSyySCR 22)ˆ( Suma de

cuadrados

residual xxyy

SbSSCR 2

Desviación

estándar

residual 22

2

n

SbS

n

SCRS xxyy

r

Desviación

estándar de

la regresión

o

La línea de regresión debe tener la mínima SCR

(mínimos cuadrados)

Page 110: Diapositivas Clase Estadística

110

Errores en la pendiente (b) y el intercepto (a) de

la línea de regresión

Desviación

estándar de

la pendiente xx

Rb

S

Ss

• Intervalo de confianza: btsb

Desviación

estándar del

intercepto xx

RaS

x

nSs

2

1

• Intervalo de confianza: atsa

f: (n-2)

f: (n-2)

Page 111: Diapositivas Clase Estadística

111

4672.05

112*93.128.418

2

22

n

SbSS

xxyy

R

04415.0112

4672.0

xx

Rb

S

Ss

1 1.09 3.10 4 4 1 5.0*5 7.29 3.1 b

tsb

318.0112

6

7

14672.0

1 22

xx

RaS

x

nSs

8 1.05 2.13 1 8 3.0*5 7.25 2.1 a

tsa

7n

6x

Del ejemplo anterior:

Page 112: Diapositivas Clase Estadística

112

Cálculo de la concentración de una muestra

desconocida

b

ayx

0

0

bxay

00bxay

yo es el valor experimental de y a partir del cual se determina xo

xx

Rx

Sb

yy

nmb

Ss

1112

0

0

• Intervalo de confianza: 00 xtsx f: (n-2)

• m es el número de lecturas para obtener y0

Page 113: Diapositivas Clase Estadística

113

Del ejemplo anterior:

72.093.1

52.19.20

0

b

ayx

Para un y0=2.9

284.0112

1

93.1

1.139.2

7

1

1

1

93.1

4672.02

0

xS

Intervalo de confianza de x0= 0.72 2.53*0.284

= 0.72 0.73

• Si m fuera 3 0.72 0.53

Para un y0=13.5 (cerca del centroíde) 6.21 0.53

Para un y0=23.0 (lejos del centroíde) 11.13 0.53

Page 114: Diapositivas Clase Estadística

114

Forma general de los límites de confianza en una

recta de regresión

Page 115: Diapositivas Clase Estadística

115

UN EXPERIMENTO DE CALIBRACION

DE MAYOR TAMAÑO

valor de t ancho intervalo

n para (n-2) GdL de conf ianza 95%

3 12,71 14.68(SR/b)

6 2,78 3.00(SR/b)

12 2,23 2.32(SR/b)

24 2,07 2.12(SR/b)

48 2,01 2.03(SR/b)

1,96 1.96(SR/b)

n=3 6

12

24

48

CONCENTRACION

ESTIMADA

SR/b -10 +10

INTERVALO DE CONFIANZA vs TAMAÑO DEL EXPERIMENTO

Page 116: Diapositivas Clase Estadística

116

Determinación del rango lineal en una regresión

Regresión con r

cercano a 1

Puntos desviados

de la regresión

Page 117: Diapositivas Clase Estadística

117

Determinación del rango lineal en una regresión

• El coeficiente de correlación no es un buen parámetro para

establecer rangos lineales en una curva de calibración

(puede interpretarse erróneamente)

• Un método más eficiente es mediante el análisis de los

residuos (yi – ŷi)

• Los residuos deberían estar distribuidos normalmente en

torno al valor cero, si no es cierto esto, entonces se debe

sospechar que la recta de regresión ajustada no es la

correcta

• (yi – ŷi) debe ser cero (teniendo en cuenta errores de

redondeo) y estar distribuido simétricamente en torno a cero

Page 118: Diapositivas Clase Estadística

118

Determinación del rango lineal en una regresión

CONC. INTENS.

g/mL FLUOR.

0 0.1

2 8.0

4 15.7

6 24.2

8 31.5

10 33.0

Ejemplo

Determinar el rango lineal en la siguiente curva

Intercepto = 1.357

Pendiente = 3.479

r = 0.9878

Page 119: Diapositivas Clase Estadística

119

n a b r R E S I D U O S

6 1.357 3.479 0.9878 -1.257 -0.314 0.429 1.971 2.314 -3.143

5 0.100 3.950 0.9998 0.000 0.000 -0.200 0.400 -0.200

4 0.000 4.000 0.9998 0.100 0.000 -0.300 0.200

Ejemplo (cont.)

Page 120: Diapositivas Clase Estadística

120

USO DE REGRESION LINEAL PARA

COMPARAR DOS METODOS ANALITICOS

PARTE DE LA VALIDACION DE UN NUEVO METODO:

IDENTIFICAR ERROR(ES) SISTEMATICO(S)

¿Produce el nuevo método resultados significativamente más

altos o más bajos que un procedimiento bien establecido?

Si cada muestra conduce a un resultado idéntico por

ambos métodos, a = 0 b = 1 r = 1

• Utilice una serie de muestras analizadas por ambos métodos

• Calcular : la pendiente (b), el intercepto (a) y el coeficiente

de correlacion* (r)

Page 121: Diapositivas Clase Estadística

121

REGRESION PARA COMPARAR DOS METODOS

ANALITICOS

Los resultados del método más preciso se presentan en el eje

x (puede utilizarse la prueba F para comparar la precisión de

los dos métodos)

Debe incluirse un número razonable de puntos (n > 10) para

construir la gráfica de comparación (recordar que se pierden

dos grados de libertad al efectuar los cálculos)

Los puntos (parejas de datos de concentración) deben cubrir el rango de interés con un distanciamiento uniforme

Page 122: Diapositivas Clase Estadística

122

REGRESION LINEAL PARA COMPARAR

DOS METODOS ANALITICOS

a - perfecto acuerdo entre

los dos métodos

b - Los dos métodos difieren

en una cantidad fija (error

absoluto)

c - Los métodos difieren en una

cantidad que aumenta con la

concentración (error relativo)

d - Evidencia de errores absoluto

y relativo

Page 123: Diapositivas Clase Estadística

123

REGRESION LINEAL PARA COMPARAR

DOS METODOS ANALITICOS

Ejemplo

Se determinó el nivel de plomo en diez muestras de jugo de frutas

mediante un nuevo método potenciométrico y los resultados se

compararon con aquellos obtenidos mediante absorción atómica con

horno de gráfito. Se obtuvieron los siguientes datos (todos en mg/l):

MUESTRA 1 2 3 4 5 6 7 8 9 10

RESULTADO AAS 35 75 75 80 125 205 205 215 240 350

RESULTADO MET. POT. 35 70 80 80 120 200 220 200 250 330

En la práctica, si los intervalos de confianza para el intercepto y la

pendiente incluyen los valores “ideales” de 0 y 1 respectivamente,

se habrá demostrado, más alla de una duda razonable, que no hay

evidencia de errores fijo y relativo

Page 124: Diapositivas Clase Estadística

124

Ejemplo (cont.)

87.3a 963.0b 9945.0r 56.10RS

64.6as 0357.0bs )8(31.2 ft

34.1587.3 a

083.0963.0 b

(Incluye el cero)

(Incluye el uno)

El intercepto y la pendiente

calculados NO difieren

significativamente de los valores

ideales 0 y 1 respectivamente

Page 125: Diapositivas Clase Estadística

125

Ejemplo comparación de métodos:

Comparar los resultados obtenidos para el análisis de ácido fítico

en 20 muestras por dos métodos analíticos (fluorimétrico, CF y

fotométrico, EF). Las concentraciones en mg/L. Los resultados del

método EF presentan mayor precisión.

Page 126: Diapositivas Clase Estadística

126

LIMITACIONES DE LA LINEA DE REGRESION

“NO PONDERADA”

Una línea de regresión no solo asume que el error aleatorio en los valores del eje x es cero, sino también que el error aleatorio en los valores de y es constante (homocedasticidad)

Todos los puntos de la recta tienen igual ponderación cuando se calculan la pendiente y el intercepto de la línea de regresión

A menudo dichas asunciones no son válidas en la práctica

Con mucha frecuencia es la desviación estándar relativa de

la señal instrumental la que es aproximadamente constante dentro de un rango de concentración

A pesar de estas objeciones, las líneas de regresión no ponderadas

proporcionan información útil en muchos casos

Page 127: Diapositivas Clase Estadística

127

ESTÁ LA PRECISION DEL METODO RELACIONADA

CON LA CONCENTRACION?

Precisión absoluta constante

tetanconss y

Precisión

relativa

constante

tetanconsy

sy

Page 128: Diapositivas Clase Estadística

128

PONDERACION DE ERRORES EN UN

CÁLCULO DE REGRESIÓN

• Los errores en los diferentes puntos de la gráfica se representan

mediante “barras de error” (límites de 1s) que se alargan a

medida que la concentración aumenta

• Se debe dar una mayor ponderación a aquellos puntos donde las

barras de error son más cortas: es más importante que la recta

calculada pase más cerca de estos puntos

Page 129: Diapositivas Clase Estadística

129

LÍNEAS DE REGRESIÓN “PONDERADAS”

Se utilizan cuando el error aleatorio en la respuesta instrumental

es una función (aproximadamente lineal) de la concentración del

analito

Los cálculos involucrados son sólo ligeramente más complicados

que aquellos de la regresión no ponderada

Se requiere información adicional de la precisión de la señal a los

diferentes niveles de concentración o, al menos, una formulación

de suposiciones adicionales acerca de tal precisión (por esta razón

las curvas ponderadas son menos utilizadas)

Las líneas de regresión ponderada se usan exclusivamente en la

calibración de instrumentos (no para comparar dos métodos

analíticos)

Page 130: Diapositivas Clase Estadística

130

LÍNEAS DE REGRESIÓN PONDERADA

Parejas de datos: (x1,y1), (x2,y2), … (xi,yi), … (xn,yn)

Desviaciones estándar (en y) s1 s2 si sn

Ponderaciones w1 w2 wi wn

A cada punto se asigna una ponderación, wi, inversamente

proporcional a la varianza correspondiente, si2

2

1

i

is

w

21

2

in

ii

s

sw

nwi

Page 131: Diapositivas Clase Estadística

131

LÍNEAS DE REGRESIÓN PONDERADA

(ECUACIONES)

• Centro de gravedad ponderado (xw, yw) :

ii

i

ii

w xwnw

xwx

1

ii

i

ii

w ywnw

ywy

1

wxx

wxy

w

S

Sb

wwwxbya

Pendiente

Intercepto

wwiiiwxy

yxnyxwS

22

wiiwxxxnxwS

22

wiiwyyynywS

Page 132: Diapositivas Clase Estadística

132

Ejemplo de regresión ponderada:

Calcular las rectas de regresión ponderadas y no ponderadas para

los siguientes datos de calibración. Calcular también para cada

recta la concentración de la muestras de ensayo con absorbancias

de 0.100 y 0.600

• Regresión no ponderada:

Pendiente: 0.0725

Ordenada: 0.0133

Concentraciones:

* Para 0.100 : 1.20 ppm (1.20 0.65)

* Para 0.600 : 8.09 ppm (8.09 0.63)

Intervalo de confianza

Page 133: Diapositivas Clase Estadística

133

Ejemplo de regresión ponderada (cont.):

• Regresión ponderada:

yw = 0.1558/6 = 0.0260 xw = 1.372/6 = 0.229

aw = 0.0091 bw = 0.0738

Concentraciones:

* Para 0.100 : 1.23 ppm (1.23 ? )

* Para 0.600 : 8.01 ppm (8.01 ? )

Intervalo de confianza

Page 134: Diapositivas Clase Estadística

134

Ejemplo de regresión ponderada (cont.):

• La regresión ponderada produce datos (pendiente, intercepto y

concentraciones de muestras) muy parecidos a los obtenidos a

partir del método de regresión no ponderada

• La estimación de los límites de confianza de las concentraciones

con la regresión ponderada produce resultados mucho más reales

wxx

wwRx

Sb

yy

nwb

SS

w 2

2

0

0

)(110

y0 señal analítica de la muestra

2

2

n

SbSS

wxxwyy

wRdonde,

Concentraciones:

* Para 0.100 : 1.23 ppm (1.23 0.12 )

* Para 0.600 : 8.01 ppm (8.01 0.72 )

Intervalo de confianza

Page 135: Diapositivas Clase Estadística

135

LÍMITES DE CONFIANZA PARA UNA CONCENTRACIÓN

CALCULADA MEDIANTE UNA REGRESIÓN LINEAL

PONDERADA

Mucho más cercano al

origen que el centroide

no ponderado

Page 136: Diapositivas Clase Estadística

136

LIMITE DE DETECCION

LA MINIMA CONCENTRACION DEL ANALITO QUE UNO

PUEDE DETECTAR POR EL METODO CON UN CIERTO

NIVEL DE CONFIANZA

EN OTRAS PALABRAS…

LA CONCENTRACION MINIMA DE ANALITO QUE PRODUCE

UNA SEÑAL QUE ES SIGNIFICATIVAMENTE DIFERENTE DEL

BLANCO

DEFINICION DE LA IUPAC:

LA CONCENTRACION DEL ANALITO QUE PRODUCE UNA SEÑAL

IGUAL A LA DEL BLANCO MAS k VECES LA DESVIACION

ESTANDAR DEL BLANCO

i.e.: LA CONCENTRACION CD PARA LA CUAL

BBD ksyy

Page 137: Diapositivas Clase Estadística

137

COMO SE DETERMINA CD

BBD ksyy DE LA DEFINICION DE LA IUPAC

DE LA ECUACION DE REGRESION DD bCay

DBB bCaksy

ASUMIENDO TAMBIEN QUE

ayB

DB bCks

b

skC B

D

ASUMIENDO QUE

RB Ss

b

SkC R

D

OJO:

CADA PUNTO DE LA CURVA DE CALIBRACION

(INCLUYENDO EL BLANCO) TIENE UNA VARIACION

(NORMALMENTE DISTRIBUIDA) SOBRE EL EJE y QUE

PUEDE ESTIMARSE CON LA DESVIACION ESTANDAR DE

LOS RESIDUOS SR

Page 138: Diapositivas Clase Estadística

138

LIMITE DE DETECCION

DOS PROBLEMAS

I.- UNO NO QUIERE RECLAMAR LA PRESENCIA DEL ANALITO CUANDO EN REALIDAD ESTA AUSENTE

PERO IGUALMENTE…

II.- UNO NO DESEA REPORTAR QUE EL ANALITO ESTA AUSENTE CUANDO EN VERDAD ESTA PRESENTE

DEBE MINIMIZARSE LA POSIBILIDAD DE CADA UNO DE

ESTOS ERRORES UTILIZANDO UNA DEFINICION APROPIADA

DE LA CONCENTRACION LIMITE

Page 139: Diapositivas Clase Estadística

139

“EFECTOS DE MATRIZ”

DISMINUCION O AUMENTO DE LA SEÑAL ANALITICA

DEBIDO A LA PRESENCIA DE OTROS COMPONENTES EN LA

MUESTRA

METODO “REGULAR” DE CALIBRACION:

EL INSTRUMENTO SE CALIBRA CON SOLUCIONES ESTANDAR QUE

CONTIENEN SOLO EL ANALITO .

EL METODO ES ACEPTABLE SOLAMENTE SI ESTA SOLUCION DEL ANALITO

PRODUCE LA MISMA SEÑAL INSTRUMENTAL QUE SOLUCIONES DE LA

MUESTRA QUE CONTENGA LA MISMA CONCENTRACION DEL ANALITO

CUANDO SE UTILIZAN SOLUCIONES “PURAS” DEL ANALITO PARA

ESTABLECER LA GRAFICA DE CALIBRACION, SE ASUME QUE NO HAY

“EFECTOS DE MATRIZ”

CON FRECUENCIA, TAL ASUNCION NO ES ACEPTABLE EN MUCHAS AREAS

DE ANALISIS

Page 140: Diapositivas Clase Estadística

140

EL PROBLEMA DE

“EFECTOS DE MATRIZ”

POSIBLES SOLUCIONES:

• PREPARAR ESTANDARES DE CALIBRACION QUE SEAN

IDENTICOS A LA MUESTRA PROBLEMA EN TODO ASPECTO

EXCEPTO EN LA CONCENTRACION DEL ANALITO (METODO DE

ESTANDAR CON “AJUSTE DE MATRIZ”).

ESTA ESTRATEGIA RARA VEZ RESULTA PRACTICABLE

• PREPARAR ESTANDARES DE CALIBRACION QUE CONTENGAN

LA PROPIA MUESTRA EN UNA PROPORCION FIJA Y

CONOCIDA

(METODO DE “ADICIONES (DE) ESTANDAR”)

Page 141: Diapositivas Clase Estadística

141

METODO DE ADICION DE ESTANDAR

* IMPLEMENTACION *

SE TOMAN VOLUMENES IGUALES DE SOLUCION

PROBLEMA

TODAS SALVO UNA SON “TRATADAS” (“DOPADAS”) POR

SEPARADO MEDIANTE LA ADICION DE CANTIDADES

CONOCIDAS E INCREMENTALES DEL ANALITO

TODAS SE DILUYEN AL MISMO VOLUMEN

SE MIDE LA SEÑAL INSTRUMENTAL PRODUCIDA POR

CADA UNA DE ESTAS SOLUCIONES

COMO DE COSTUMBRE, LA SEÑAL SE PRESENTA EN EL

EJE y, MIENTRAS QUE EN EL EJE x SE PRESENTA LA

CANTIDAD DE ANALITO AÑADIDA

Page 142: Diapositivas Clase Estadística

142

METODO DE ADICION DE ESTANDAR

* CURVA Y CALCULOS *

b

axE

xx

Rx

Sb

y

nb

Ss

E 2

2

1

Page 143: Diapositivas Clase Estadística

143

METODO DE ADICION DE ESTANDAR

* DESVENTAJAS *

REQUIERE CANTIDADES DE MUESTRA MAS

GRANDES QUE EL METODO “REGULAR” DE

CALIBRACION

ESTADISTICAMENTE, SU PRINCIPAL

DESVENTAJA CONSISTE EN SER UN METODO

DE EXTRAPOLACION, POR LO TANTO

MENOS PRECISO QUE LAS TECNICAS DE

INTERPOLACION

Page 144: Diapositivas Clase Estadística

144

CALIBRACION vs ADICION DE ESTANDAR

• UNO NO DEBE “EMBARCARSE” EN EL ESFUERZO EXTRA DE

LAS ADICIONES DE ESTANDAR A MENOS QUE SE TENGA

EVIDENCIA SOLIDA DE LA PRESENCIA DE EFECTOS DE MATRIZ

• LA AUSENCIA DE EFECTOS DE MATRIZ CONLLEVA A

PENDIENTES (SENSIBILIDADES INSTRUMENTALES)

ESTADISTICAMENTE IGUALES POR AMBOS METODOS

• CUALQUIER DIFERENCIA ENTRE LOS DOS METODOS PUEDE

CHEQUEARSE MEDIANTE UNA PRUEBA DE SIGNIFICACION:

Ho: LAS VERDADERAS PENDIENTES DE LAS DOS LINEAS NO

SON DIFERENTES ( )

H1: LAS PENDIENTES VERDADERAS DE LAS DOS LINEAS SON

DIFERENTES

21

21

11

xxxx

R

calc

SSS

bbt

21

2

22

2

11

ff

SfSfS RR

R

211 nf 222 nftcrit PARA (f1+f2) GRADOS DE LIBERTAD

21 NO

21

Page 145: Diapositivas Clase Estadística

145

VALIDACIÓN DE MÉTODOS ANALÍTICOS

Procedimiento por el cual se establece si un método analítico

cumple los requerimientos necesarios para ser considerado

aceptable para determinado propósito. Tales requerimientos

son los siguientes:

• Especificidad – selectividad:

Se refiere a que el método este libre de interferencias, el métodos

debe distinguir entre el analito y otros componentes que puedan

generar un aumento o disminución en la señal analítica

instrumental, generando efectos de matriz.

Se puede determinar la presencia de efectos de matriz mediante

comparación estadística de curvas regulares de calibración y

curvas de adición de estándar

Page 146: Diapositivas Clase Estadística

146

• Precisión del instrumento:

Grado de concordancia entre medidas replicadas (al menos seis)

sobre una sola muestra

100% x

sRSD

• Precisión del método:

Grado de concordancia entre medidas obtenidas en múltiples

muestreos de muestras homogéneas

Repetibilidad: Concordancia entre medidas obtenidas en

condiciones repetitivas: la misma muestra, igual operador, mismas

soluciones, el mismo día, el mismo material de vidrio, etc.

Reproducibilidad: Concordancia entre medidas obtenidas en

condiciones no repetitivas: diferentes muestras, operadores,

soluciones, días, materiales de vidrio, etc.

Parámetro para expresar

la precisión

Page 147: Diapositivas Clase Estadística

147

• Exactitud del método:

Concordancia de los resultados obtenidos por el método respecto

al valor real

Con material certificado: Es una muestra que contiene una

cantidad de analito conocida (valor real). El resultado obtenido

con el método se compara con el valor real mediante un

contraste de significancia.

Con analito estándar adicionado a la muestra problema:

Primero se determina el nivel de analito en la muestra.

Posteriormente se analiza otra muestra a la cual se le ha

adicionado una cantidad conocida de analito. El resultado

obtenido de la muestra dopada debe de contener la cantidad de

analito original en la muestra más la cantidad de analito

estándar adicionado. La exactitud se reporta como porcentaje de

recuperación del analito estándar adicionado. Se realiza un

contraste entre la cantidad recuperada y la cantidad adicionada.

Page 148: Diapositivas Clase Estadística

148

• Límite de detección del método:

Menor concentración de analito que puede ser detectada por el

método. La señal a este nivel debe ser la del blanco más tres

veces la desviación estándar del blanco.

ym=yb + 3sb L.D.=3Sr/b

• Límite de cuantificación del método:

La señal a este nivel debe ser la del blanco más diez veces la

desviación estándar del blanco.

ym=yb + 10sb L.C.=10Sr/b

• Rango:

Intervalo entre la mayor y menor concentración de analito en el

cual el método es válido. Debe estar entre el 70% y 130% de la

concentración esperada.

Page 149: Diapositivas Clase Estadística

149

• Linealidad:

La habilidad de un método para obtener resultados que son

directamente proporcionales a la concentración sobre un rango

específico.

• Robustez:

Es la capacidad de un método para soportar pequeños cambios en

las condiciones operativas. Tales cambios pueden ocurrir en días

diferentes, entre diferentes operadores, entre diferentes

instrumentos, temperaturas ambientales diferentes, pH´s

diferentes , etc. Se debe demostrar que el método produce

resultados comparables, aún con esos pequeños cambios. La

robustez se deriva de un análisis estadístico de los datos

obtenidos.

Page 150: Diapositivas Clase Estadística

150

• Comparación de métodos:

Comparación del método a validar con otro método reconocido

(estándar) para determinar si nuestro método presenta algún tipo

de error sistemático.

Con una muestra representativa:

• Analizar con cada método la muestra (cinco veces)

• Hacer una prueba F con los resultados de ambos métodos

para determinar si la varianza es igual/diferente

• Realizar una prueba t con las medias de ambos métodos

para ver si los datos son estadísticamente equivalentes.

Con varias muestras de diversa concentración mediante

un análisis de regresión