Guía Tto. Datos

download Guía Tto. Datos

If you can't read please download the document

description

bn

Transcript of Guía Tto. Datos

TRATAMIENTO DE DATOS EXPERIMENTALES

1

UNIVERSIDAD NACIONAL DE COLOMBIA - FACULTAD DE MINAS

PRACTICA No. 1 DE MECANICA DEL MEDIO CONTINUO

TRATAMIENTO DE DATOS EXPERIMENTALES

1. FASES DE UN PROGRAMA DE EXPERIMENTACIN

Cualquier programa de experimentacin se puede considerar dividido en varias etapas, no todas sucesivas, que van desde el planteamiento de unas preguntas iniciales hasta la toma de datos y la elaboracin de un informe final. Un esquema simplificado de un programa de experimentacin implica:

A. Planeacin:

Consiste en la formulacin de unas preguntas concretas, y la evaluacin de opciones que puedan servir para encontrar respuesta a ellas.

B. Diseo:

Parte de las consideraciones hechas en la etapa anterior para especificar el grupo de trabajo, la instrumentacin necesaria y los detalles de configuracin del equipo experimental. Define plan de pruebas, variables de entrada y de salida, cronograma, etc.

C. Construccin y calibracin:

Se construyen, adquieren y ensamblan los componentes del equipo de medida y se realizan las calibraciones del mismo.

D. Depuracin de la informacin:

Pone a prueba el equipo de experimentacin e identifica los problemas o inconvenientes de su funcionamiento. Con base en estos anlisis el experimentador tiene una idea ms precisa del comportamiento de sus aparatos y de los factores que pueden influir en la precisin de los resultados experimentales. Incluso puede suceder que los resultados de esta etapa remitan nuevamente a un ajuste del programa experimental o a la reconfiguracin de los aparatos de medida.

E. Ejecucin:

Consiste en la toma, registro y almacenamiento de datos experimentales.

F. Anlisis de datos:

La informacin experimental es depurada, transformada y analizada con el fin de dar respuesta a las preguntas planteadas al comienzo.

G. Reporte de resultados:

En esta etapa se busca hacer una presentacin de los datos y conclusiones del programa de experimentacin. En algunos casos se sugieren nuevos ensayos y perspectivas de anlisis.

2. ERRORES EXPERIMENTALES. EXACTITUD Y PRECISIN

El cuidado con que se disee un programa experimental, la habilidad para llevar a buen trmino el programa de medicin, el nivel tecnolgico de los instrumentos de medida y la experiencia y destreza de quienes miden, determinan la magnitud de los errores asociados con el experimento. El carcter elusivo de la verdadera magnitud se pone de presente en las circunstancias ms sencillas de la vida cotidiana, como ocurre, por ejemplo, en las siguientes circunstancias:

A: Un nio cuenta el dinero que tiene en sus bolsillos porque quiere comprarse un helado.

B: Dos nios cuentan el dinero que tienen entre ambos en sus bolsillos, porque quieren comprar helados.

D: Un nio lleva la cuenta del dinero que da a da va introduciendo en la alcanca, porque quiere saber cundo tendr suficiente para comprarse un baln.

Ahora llamemos P[X] a la probabilidad de que en el evento X se obtenga el valor verdadero de la magnitud cantidad de dinero. Entonces, tal vez estemos de acuerdo en considerar que en estos casos:

)

(

)

(

)

(

C

P

B

P

A

P

>

>

De hecho, los factores asociados con la cantidad de dinero que se desea contar, el nmero de contadores e incluso la posibilidad de confirmar el dato mediante nuevos conteos (observemos que en el caso C el nio no puede proceder a recontar a menos que abra su alcanca), sugieren al sentido comn el anterior ordenamiento de las probabilidades.

Por estas razones, como ocurre en muchos casos de medicin, lo que algunos llaman verdad o verdadero, a otros, principalmente en las reas de las ciencias naturales y las tcnicas, nos parece que es ms cmodo y riguroso denominar aproximacin a la realidad.

Desde este punto de vista, la medicin suele ser definida como la comparacin de una magnitud fsica con lo que llamaremos valores de referencia (no valores verdaderos), y que pueden ser de diferente tipo, por ejemplo:

a) Los patrones de medida (de longitud, peso, masa, carga elctrica, etc.), que se utilizan como unidades de comparacin en operaciones de medicin entre magnitudes de similar naturaleza, pero cuya escogencia es ms o menos arbitraria. Un ejemplo de estos patrones es el metro, el cual se define como 1.650.763,73 longitudes de onda de la radiacin electromagntica emitida por el istopo 86Kr en su transicin entre los estados 2p10 y 5d5.. Por supuesto, esta definicin del metro es poco utilizada y, en definitiva, de poca utilidad en la prctica cotidiana, pues usamos estndares de metro ms baratos, a pesar de que la confiabilidad no sea tan alta como la del patrn internacional.

b) Las llamadas constantes fsicas se conciben, en principio, como si fueran cantidades absolutas, invariantes y universales, en cierto sentido cercanas a lo que podramos llamar magnitudes verdaderas. Entre ellas estn, por ejemplo: la velocidad de la luz en el vaco, la masa en reposo de un electrn, la constante de Boltzmann, entre otras.

c) Los valores de referencia pueden ser establecidos de comn acuerdo, y por conveniencia, entre un grupo de expertos o de instituciones que tienen un inters particular en ello. Surgen as los estndares tcnicos, cuya utilidad consiste en proveer patrones cuantitativos y especficos para ciertos procesos de medicin o produccin. Un ejemplo de estos patrones de medida es el llamado Grado Saybolt, usado en el rea de los hidrocarburos para medir la viscosidad de aceites gruesos, pero cuyo valor es difcil de traducir a unidades de medida de los sistemas de medida ms universales, como son el SI (Sistema internacional), el ingls, cgs o MKS.

d) El valor de referencia puede ser tambin estadstico. Para explicarlo supongamos un experimento de naturaleza aleatoria como, por ejemplo, el lanzamiento repetido de una moneda al aire y el conteo del nmero de caras y de sellos. Si la moneda es la misma y no est cargada, y si los lanzamientos son independientes entre s, esperamos que el nmero de caras sea del mismo orden que el de los sellos, hasta el punto que el valor estadstico de referencia ser el de n/2 caras o sellos -, donde n es el nmero total de lanzamientos.

e) Pero hay casos en los cuales no parece haber un valor de referencia exterior al experimento o, dicho de otro modo, a veces el propio experimento implica sus propios valores de referencia o los supone. Pensemos, por ejemplo, en un resorte lineal que es sometido a una prueba esttica para determinar, mediante un diagrama de fuerza y deformacin, su constante elstica. Sabemos que los puntos experimentales en el diagrama corresponden a una lnea recta y, por tanto, quisiramos estimar la magnitud de la constante del resorte, que es la pendiente de la lnea recta. Es claro que no vamos a buscar en los datos de otros resortes el dato que aqu esperamos hallar. Tendremos, por supuesto, que expresar la constante en trminos de algn tipo de unidades de medida, pero esto no porque debamos recurrir a un valor de referencia externo sino porque necesitamos proyectar el resultado sobre un sistema de unidades cualquiera para darle consistencia.

Ahora bien, si comparamos un valor medido o estimado (Xi) con el valor de referencia correspondiente (VR), es casi seguro que encontraremos una diferencia cuantitativa, la cual denominaremos en lo sucesivo error absoluto (o total) de la medicin (Xi). Esto es:

VR

X

X

i

i

-

=

d

(1)

Se dice que la magnitud Xi mide el grado de exactitud de una medida o de un valor estimado.

Ahora bien, independientemente de si hay o no un valor confiable para VR, el error total se acostumbra a desagregar de la siguiente manera:

)

~

(

)

~

(

VR

X

X

X

X

i

i

-

+

-

=

d

(2)

Donde el valor

X

~

es el valor estimado de VR.

En la expresin anterior cada uno de los parntesis representa una componente del error de naturaleza muy distinta. Se denomina error de sesgo en las medidas a la cantidad:

VR

X

-

=

~

b

(3)

La magnitud del error de sesgo depende principalmente del nivel de resolucin de los instrumentos de medida y del estado de calibracin de los mismos, de los procedimientos experimentales, de la acumulacin de errores por redondeo numrico, y del uso de modelos numricos, fsicos o matemticos para interpretar las seales experimentales o los datos del experimento. En todo caso, y prcticamente por definicin, el error siempre es susceptible de algn control, hasta que el experimentador lo pueda reducir a un valor aceptable segn los objetivos particulares que acompaan la medida.

Por otro lado, la medicin repetida de una misma variable, en condiciones experimentales similares, muestra a menudo diferencias respecto de su valor estimado

X

~

. En tal caso, a cada dato Xi le corresponder un error aleatorio, o de precisin, que se define como:

X

X

i

i

~

-

=

e

(4)

Debido a que i expresa la naturaleza aleatoria de la magnitud que se quiere medir, escapa, por principio, al control experimental.

En suma, el error total Xi, correspondiente a la medicin Xi cuyo valor de referencia es VR, puede escribirse como la suma de los errores de precisi{on y de sesgo, como se muestra en la figura-1:

b

e

d

+

=

-

+

-

=

i

i

i

VR

X

X

X

X

)

~

(

)

~

(

(5)

X

Frecuencia relativa de los datos

X(verdadero) Xi

m

d

i

e

i

b

i

Figura 1. Errores total, de sesgo y de precisin correspondientes al dato Xi

3. DISTRIBUCIN GAUSSIANA PARA LOS DATOS EXPERIMENTALES

Hemos visto cmo, mientras los errores sistemticos hasta cierto punto se pueden controlar, los errores de precisin son irremovibles, pues corresponden a la naturaleza de las magnitudes experimentales que son objeto de una medicin. En consecuencia, el tratamiento que se les da a los errores de precisin est basado por lo general en tcnicas estadsticas.

Las variables aleatorias se describen por medio de funciones de distribucin de probabilidad, entendiendo que la probabilidad mide, entre cero (0) y uno (1), las posibilidades de ocurrencia de un evento aleatorio particular. Las funciones de distribucin de probabilidad son muy variadas y se usan en casos tan dismiles como son la ocurrencia de eventos naturales extremos (sismos, crecientes, tormentas, etc.), el comportamiento de la bolsa de valores, los estudios de falla de un mecanismo cualquiera, el nmero de usuarios que se conecta en un momento determinado a un sistema de comunicacin, entre otros. En cada caso la probabilidad muestra comportamientos especficos que se ajustan a parmetros propios de cada variable. Sin embargo, hablaremos en lo que sigue slo del comportamiento de los errores de precisin en la medida estimacin de datos experimentales, a menudo se desconoce casi todo acerca de la funcin de distribucin de probabilidad propias de la variable de inters (parmetros, tipo de funcin, etc.), por lo cual se acostumbra asumir que sus frecuencias corresponden a distribuciones que tienen un valor, o un intervalo de valores, de mayor ocurrencia, mientras el resto, los valores menos probables, se distribuyen simtricamente a lado y lado de los mximos. Entre este grupo de funciones las ms utilizadas son la de Gauss, o normal, y la distribucin t-Student.

Sea f(x) la funcin de densidad de probabilidad de una variable aleatoria continua X. La probabilidad asociada con un intervalo de valores centrado en el valor mximo, , de la distribucin,

)

,

(

x

x

D

+

D

-

m

m

, se define como

[

]

[

]

D

+

D

-

=

D

=

D

+

D

-

X

X

x

f

X

X

X

X

m

m

m

m

dx

)

(

2

.

Prob

.

Prob

(6)

Por supuesto, si la integral se evala entre - y +, su valor ser uno (1).

En caso de que X sea una variable discreta, la integral se reemplaza por una sumatoria sobre las frecuencias relativas en el intervalo, esto es:

[

]

[

]

D

+

D

-

=

D

=

D

+

D

-

x

x

i

X

relativa

frec

X

X

X

X

m

m

m

m

)

(

.

2

.

Prob

.

Prob

(7)

Donde la frecuencia relativa (Xi) se define como:

s

erimentale

datos

de

Nmero

Xi

dato

el

obtiene

se

que

veces

de

Nmero

X

relativa

frec

i

exp

)

(

.

=

(8)

Consistentes con la definicin de probabilidad, la suma de todas las frecuencias relativas de la variable X dar igualmente uno (1).

Ahora bien, como se dijo arriba, la distribucin gaussiana de probabilidad representa relativamente bien los errores de precisin de buen nmero de variables experimentales, sobre todo si son continuas. En tal caso la funcin de densidad de probabilidad se escribe como:

f

x

e

x

(

)

(

)

=

-

-

1

2

1

2

2

2

s

p

m

s

(9)

Esta funcin se expresa en trminos de dos parmetros, a saber: el valor medio de la poblacin, que corresponde al valor mximo absoluto de f(x) y se define como

m

=

=

lim

N

i

i

N

N

X

1

1

(10)

y la desviacin estndar de la distribucin, que mide el grade de dispersin de la variable X en torno a la media.

s

m

X

N

i

i

N

N

X

=

-

=

lim

(

)

1

2

1

1

2

(11)

Un X grande corresponde a campanas muy suaves y extendidas, un X pequeo a campanas ms aguzadas o concentradas en vecindades del valor .

En la figura 2 se muestra el aspecto general de la distribucin gaussiana de la variable X en funcin de la frecuencia relativa de los datos muestrales, supuestos infinitos. All se ve cmo la abscisa coincide con el punto ms alto de la campana, mientras X determina su grado de achatamiento:

Por definicin, la probabilidad de ocurrencia de un dato Xi en el intervalo

m

m

-

+

D

D

X

X

X

se puede calcular a partir de la frmula:

[

]

[

]

Prob

Prob

dx

(

)

m

m

s

p

m

s

m

m

-

+

=

=

-

-

-

+

D

D

D

D

D

X

X

X

X

e

X

X

X

X

1

2

1

2

2

2

(12)

X

Frecuencia relativa

m-s

x

m m+s

x

(

)

f

x

e

x

x

x

(

)

=

-

-

1

2

1

2

2

2

s

p

m

s

Figura 2. Distribucin Gaussiana con media y desviacin estndar de la muestra x.

Desafortunadamente esta integral - que depende de los parmetros y X- no se puede evaluar en forma exacta, por lo cual en los libros se prefiere presentar tablas de probabilidad para la distribucin gaussiana normalizada, definida en trminos de la variable:

t

m

s

=

-

X

X

(13)

de manera que, para un

D

X

X

s

determinado, se tiene:

[

]

Prob

d

m

m

p

t

t

s

s

-

+

=

-

-

D

D

D

D

X

X

X

e

X

X

X

X

1

2

2

2

(14)

Tambin se define el intervalo de confianza C% de una variable X, como el intervalo

m

t

m

t

-

+

X

i

, tal que:

[

]

Prob

%

m

t

m

t

-

+

=

X

C

i

(15)

de modo que, por ejemplo, el intervalo de confianza del 95% de la distribucin gaussiana de la variable definida anteriormente ser:

-

-

1

96

1

96

.

.

X

X

m

s

(16)

puesto que:

Prob

.

.

%

-

-

=

1

96

1

96

95

X

X

m

s

(17)

EJEMPLO 1.

Una distribucin gaussiana tiene media

m

=

5

00

.

y desviacin estndar

s

X

=

1

00

.

. Se desea conocer la probabilidad de ocurrencia de un valor particular en los intervalos:

a

X

b

X

c

X

)

.

.

)

.

.

)

.

4

50

5

50

4

50

5

75

6

50