4- Nota Sobre t de Student 021220 Final

7
Nota sobre t de Student / CENAM / Diciembre 2002 1/7 USO DE LA DISTRIBUCIÓN t EN LA ESTIMACIÓN DE LA INCERTIDUMBRE DE LA MEDICIÓN NOTA Ismael Castelazo Sinencio El Marqués, Qro., México, diciembre de 2002

description

Nota Sobre t de Student - CENTRO NACIONAL DE METROLOGÍA "CENAM"

Transcript of 4- Nota Sobre t de Student 021220 Final

Nota sobre t de Student / CENAM / Diciembre 2002 1/7 USO DE LA DISTRIBUCIN tEN LA ESTIMACIN DE LA INCERTIDUMBRE DE LA MEDICIN NOTA Ismael Castelazo Sinencio El Marqus, Qro., Mxico, diciembre de 2002 Nota sobre t de Student / CENAM / Diciembre 2002 2/7 ESTE DOCUMENTO SE HA ELABORADO CON RECURSOS DEL GOBIERNO MEXICANO. SLO SE PERMITE SU REPRODUCCIN SIN FINES DE LUCRO Y HACIENDO REFERENCIA A LA FUENTE:Castelazo, I.,Uso de la distribucin t en la estimacin de la incertidumbre de la medicin. Notas. Centro Nacional de Metrologa, Mxico, diciembre 2002. Disponible en Nota sobre t de Student / CENAM / Diciembre 2002 3/7 USO DE LA DISTRIBUCIN tEN LA ESTIMACIN DE LA INCERTIDUMBRE DE LA MEDICIN Ismael Castelazo Diciembre 18, 2002 Resumen: Se aclara el uso de la distribucin t en la expresin de la incertidumbre de las mediciones. 1. Intervalos de confianza De acuerdo a su definicin, la incertidumbre es un parmetro que caracteriza la dispersin delosvaloresrazonablementeatribuidosalmensurando,porloqueseexpresacomoun intervalodevaloresconunniveldeconfianzadado.Enestadsticaestosintervalosson llamados intervalos de confianza. Siconocemoslafuncindedensidaddeprobabilidadf(x)deunavariablealeatoriax, podemosexpresarlaprobabilidadpdequestatomeunvalordentrodeciertointervalo comoelreaquecubrelafuncinf(x)enesteintervalo,comosemuestraenlafigura1. Esta probabilidad p es llamada el nivel de confianza. Figura 1. rea bajo una funcin de densidad de probabilidad Paraelcasocomndevariablescondistribucinnormal,elreabajoestacurvapuede obtenerseapartirdelosvalorestabuladosparaunavariableconmediaceroydesviacin estndar igual a uno. La relacin de estos valores con los que corresponden a variables con media y desviacin estndar diferentes se explica a continuacin. Seaxunavariablealeatoriacondistribucinnormal,mediaxydesviacinestndarx. Definamos una variable auxiliar f(x) x - x p x p[ ] ( )= =ppxxp pdx x f x x x p Pr rea = Nota sobre t de Student / CENAM / Diciembre 2002 4/7 xxxz =(1) la cual tiene media cero y desviacin estndar uno. La probabilidad de que z tome valores enun cierto intervalo[ ] k z k es [ ] k z k p = Pr . Sustituyendo (1), obtenemos = kxk pxx Prla cual es equivalente a[ ]x x x xk x k p + = PrEnotraspalabras,laprobabilidad,p,dequexseencuentreenelintervalo x xk es igual a la probabilidad de que z se encuentre en el intervalo[ ] k z k . De estamanera podemos seleccionar k a partir de valores tabulados, de tal manera que z se encuentre dentro delintervalo[ ] k z k conunaprobabilidadpdeseada.Estemismovalordeknos asegurar que x se encontrar en el intervalo x xk con el mismo nivel de confianza p. 2. Conceptos estadsticos del resultado de un proceso de medicin Sea Y un mensurando, estimado por una funcin ( )Nx x x f y , , ,2 1L =ysuponiendoquelasvariablesdeentrada,xi,varanaleatoriaeindependientemente,la mejormanera deobtener una estimacin de Y es atravsdeuna serie de mediciones bajo lasmismascondicionesdemedicin.Enotraspalabras,sipodemosobtenernvaloresde cadaunadelasNentradas,xik,k=1,2,...,n,esposibleestimarYatravsdelamedia aritmtica de y: ( ) = == = nkNk k k knkkx x x fnyny Y12 11, , ,1 1L La incertidumbre al cuadrado de esta medicin estar dada por [1]: ( ) ( )==Nii i cx u c y u12 2 2 donde i ix f c = /La incertidumbre de medicin puede entenderse como una aproximacin de la varianza de la media de y. En el caso de mediciones donde nicamente existen contribuciones de tipo A yelmodeloeslineal,laincertidumbreylavarianzaestadsticadelamediadeyson idnticas. Nota sobre t de Student / CENAM / Diciembre 2002 5/7 Consideremos que existen n valores de y, que son muestras de una variable con distribucin normal ycuyas media y varianza pueden estimarse como == nkk yyny11( ) ( )== nkk k yy yny s12 2 211La estimacin de la varianza de esta media es ( )( )ny sy sk22= 3. Uso de la variable t En el caso de un proceso de medicin, es deseable conocer la probabilidad de que el valor verdadero del mensurando est dentro de un cierto intervalo cku y . Si suponemos que el mensurandoestdistribuidonormalmente,seranaturalemplearelmtododescritoenla seccin1paraestimarelfactordecoberturak.Sinembargo,estemtodosebasaenel hecho de que la transformacin xxxz = resultaenotravariablenormalpuesxyxsonconstantesconocidasenforma determinstica. Tpicamente, durante un proceso de medicin no seconoce exactamente x, y se emplea su aproximacin( ) y s. Es conveniente entonces escribir la variable ( ) y syty =(2) la cual se conoce como la variable t de Student, con = n-1 grados de libertad.Recordemos queyrepresenta el resultado de la medicin y se asume que su distribucin es normal,centradaenyycondesviacinestndarestimadapor( ) y s .Entonces,la distribucindelavariabletseaproximaaunadistribucinnormal,conmediaceroy varianza uno en tanto( ) y smejor se aproxime a la desviacin estndar y dey. Estoes,si( ) y s sehaobtenidodepocosdatos,elconocimientoquesetienedeellaes pobre,el nmero de grados de libertad es pequeo y la distribucin que sigue la variable t se aleja de la normal. De hecho, la distribucin exacta de t fue obtenida por W. S. Gosset, quien escriba con el seudnimo de Student, encontrando la siguiente expresin [2]: ( )( ) [ ]( )( ) 2 / 1212 /2 / 1+ ++ =nntn nnt f(3) Nota sobre t de Student / CENAM / Diciembre 2002 6/7 cuya media y variancia son: [ ] 0 = =tt E para n > 1 ( ) [ ]22 2= = nnt Et t para n > 2 Se puede demostrar que esta distribucin tiende a una normal conforme aumenta el nmero degradosdelibertad=n-1,donden,ennuestrocasodeinters,eselnmerode mediciones. Debe notarse que esta condicin, en un proceso estacionario, es la misma que mejora la estimacin de la variancia dey por medio de( ) y s .Aligualqueparaladistribucinnormal,existenvalorestabuladosdelaprobabilidad,p (rea bajo la curva f(t)), de que t se encuentre alrededor de un cierto intervalo:( ) ( ) [ ] p t t tp p= Pr (4) Los valores de t para coberturas, p, entre 68,27% y 99,73% del rea bajo la funcin (3), se encuentran tabuladosen lareferencia[1]para valoresdedesde1 hasta 100,adems del valor para = . Laecuacin (2) sepuederescribir, empleando la incertidumbre estndarcombinadacomo estimador de( ) y s1, como ( ) y uY ytc=y, sustituyendo en (4), obtenemos ( ) ( ) ( ) ( ) [ ] p t y u Y y tp c p= / Prla cual es equivalente a( ) ( ) ( ) ( ) [ ] p y u t y Y y u t yc p c p= + PrEnotraspalabras,laprobabilidaddequettomevaloresentretpytp,esigualalade encontrarelmensurandoYentre( ) ( ) y u t yc p y( ) ( ) y u t yc p + .Sinembargo,podemos encontraresaprobabilidadapartirdelatablanormalizadadereasbajolacurva(3), independientemente de los parmetros de y.Estasolucinsuponequelasvariablesyy,consecuentemente,y ,tienenunadistribucin normal. En metrologa, esta restriccin en ocasiones no se cumple por lo quees necesario tomar en cuenta que la presencia de distribuciones diferentes disminuye la confianza en las aproximaciones que se obtienen con la distribucin t. 1 Esta estimacin es exacta slo para las condiciones ideales descritas en la seccin 2 Nota sobre t de Student / CENAM / Diciembre 2002 7/7 Conclusiones 1.Se usa la distribucin t cuando se puede suponer que la distribucin subyacente es normal. 2.Se usa la distribucin t porque no se conoce a ciencia cierta la desviacin estndar de la distribucin normal. 3.Ladistribucintseaproximaalanormalcuandoelnmerodegradosdelibertad tiende a infinito. Agradecimiento ElautoragradeceaRubnLazosMartnezporsurevisinyvaliososcomentariosaeste documento. Referencias [1]Guide for the expression of uncertainty in measurement, ISO, 1995. [2]Bendat,J.S.andPiersol,A.G.,RandomData:AnalysisandMeasurement Procedures, Wiley-Interscience, 1971. Autor: Ismael Castelazo SinencioDirector del rea de Servicios Tecnolgicos CENAM [email protected]. 52 (442) 2 11 0500 ext. 3144; Fax 52 (442) 211 0594