Teorema+del+Límite+Central-2010-6 (1)

20
Teorema del Límite Central El teorema del límite central es de suma importancia en diversas aplicaciones de la probabilidad. Si bien el hacer un estudio detallado de la teoría detrás del concepto de límite central está fuera del alcance de los objetivos de este curso, si abordaremos algunos detalles que pueden ayudar al lector a obtener una mejor comprensión de los conceptos relacionados con este teorema y las aplicaciones que se derivan del mismo. Para hacer que la presentación sea más apegada a la realidad conceptual no se dará el concepto como una receta y se tratará de que el lector vaya llegando en forma gradual a los conceptos que se buscan. Desigualdades de Markov y Chebyshev Si X es una variable aleatoria discreta con rango R X entonces es sencillo deducir la siguiente secuencia de desigualdades: E(X)= xP[X = x] = xP[X = x] + xP[X = x] xP[X = x] tP[X = x] = tP[X t] Este análisis, que se puede hacer en forma equivalente para distribuciones continuas da lugar al siguiente teorema conocido como la desigualdad de Markov [2 ].

description

estadistica ejemplos y ejercicios

Transcript of Teorema+del+Límite+Central-2010-6 (1)

Teorema del Lmite CentralEl teorema del lmite central es de suma importancia en diversas aplicaciones de la probabilidad. Si bien el hacer un estudio detallado de la teora detrs del concepto de lmite central est fuera del alcance de los objetivos de este curso, si abordaremos algunos detalles que pueden ayudar al lector a obtener una mejor comprensin de los conceptos relacionados con este teorema y las aplicaciones que se derivan del mismo. Para hacer que la presentacin sea ms apegada a la realidad conceptual no se dar el concepto como una receta y se tratar de que el lector vaya llegando en forma gradual a los conceptos que se buscan.Desigualdades de Markov y ChebyshevSiXes una variable aleatoria discreta con rangoRXentonces es sencillo deducir la siguiente secuencia de desigualdades:E(X)=xP[X = x]

=xP[X = x] +xP[X = x]

xP[X = x]

tP[X = x]

=tP[Xt]

Este anlisis, que se puede hacer en forma equivalente para distribuciones continuas da lugar al siguiente teorema conocido como la desigualdad de Markov [2].

P[Xt](6.1)

Esta desigualdad permite hacer aproximaciones vagas acerca del comportamiento de variables aleatorias tomando en cuenta nicamente la esperanza. Veamos el siguiente ejemplo.Ejemplo 30En una caja hay 10 bolillas rojas y 6 negras. Se extraen con remplazo 8 bolillas y se registra el nmero de bolillas rojas extradas.Xsigue una distribucin binomialb(x;8, 10/16) y usando la herramienta para binomiales, es simple verificar por ejemplo queP[X6] = 1 - P[X5] = 0.3697.Utilizando la desigualdad de Markov se obtiene queP[X6]5/6 = 0, 8333.Comparando estos dos valores nos damos cuenta que la cota que se obtiene por la desigualdad de Markov no necesariamente es buena.Es importante notar que si en la desigualdad (6.1) utilizamost=nobtenemosP[Xn]Es decir la probabilidad de que los valores de una variable aleatoria estn a ms denveces la media es menor a 1/n.Si adems de la media o esperanza se conoce la varianza entonces existe la posibilidad de hacer acotaciones con un poco ms de precisin. Supongamos queXes una variable aleatoria con esperanzay varianzaSi consideramos la variable aleatoria(X-)2, aplicando la desigualdad de Markov a esta variable, cuya esperanza es precisamente(3.9), se obtieneP[(X-)2t2]Dado que(X-)2t2es equivalente a|X-|tse obtiene el teorema conocido como la desigualdad deChebyshev.P[|X-)|t](6.2)

La desigualdad de Chebyshev permite acotar la probabilidad de que los valores de la distribucin queden alrededor de la media. Estas aproximaciones no necesariamente son buenas, no obstante mejorar los resultados que se pueden obtener con esta desigualdad implicara restringir mucho las hiptesis iniciales, como se ver en un ejemplo posterior.Ejemplo 31Una persona puede digitar un texto en un tiempo que sigue una distribucin con media 50 minutos y desviacin 10 minutos. Para estimar una cota para la probabilidad de que esta persona tarde entre 30 y 50 minutos se puede recurrir a la desigualdad de Chebyshev y se obtieneP[30T70] = 1 - P[|X- 50|20]1 -=An cuando este tipo de estimaciones pueden resultar innecesarias cuando se dispone de la distribucin de probabilidad el ejemplo siguiente sirve para comparar los resultados que se obtienen usando la de la desigualdad (6.2).Ejemplo 32El tiempo que tarda un computador en resolver un problema sigue una distribucin exponencial con media 2 minutos. Para estimar la probabilidad que el tiempo de solucin de un problema al azar est entre 0 y 6 minutos si utilizamos la desigualdad de Chebyshev obtenemosP[0T6] = 1 - P[|X- 2|4]1 -= .75Es decir con la desigualdad de Chebyshev obtenemos que la probabilidad de que el tiempo est entre 0 y 6 minutos es superior a 0.75.Si usamos la distribucin en forma directa obtenemos que:P[0T6] =dx= 1 -e-3= 0.95Lo que nos indica que las cotas que se obtienen de la desigualdad de Chebyshev pueden no ser muy buenas, no obstante como veremos no es tan fcil mejorar las cotas que se obtienen con esta desigualdad sin imponer restricciones adicionales.El siguiente ejemplo, [2], es ilustrativo en ese sentido.Ejemplo 33SeaXuna variable aleatoria discreta cuya distribucin de probabilidad se da en la siguiente tabla:x1= - 2x2= 0x3= 2

P[X=x1] = 1/8P[X=x2] = 3/4P[X=x3] = 1/8

Es muy sencillo verificar queE[X] = 0 y queVAR[X] = 1Si aplicamos la desigualdad de Chebyshev obtenemos queP[|X-|2]que en este coincide con el valor puesP[|X-|2] = P[X= 2] + P[X= - 2] =+=Este ejemplo indica que an cuando las cotas obtenidas de la desigualdad (6.2) no siempre son buenas a veces son exactas.Leyes de los Grandes NmerosPara poner en contexto las implicaciones de este teorema es importante revisar las siguientes observaciones.Dado un experimento con espacio muestral, para un eventose ha indicado que si se hacennrepeticiones del experimento y se nota que en esasnrepeticiones del experimento ocurren(n) veces el evento, intuitivamente se define la probabilidad del evento porP[] =.Sin embargo, como ya hemos apuntado antes esta definicin deja abiertas una serie de preguntas. Por ejemplo si aceptamos definir la probabilidad como el valor lmite de estos cocientes entonces la definicin se complica. Primero que todo, qu garantiza que ese lmite existe, segundo esta definicin no es operacional en el sentido de que no es posible repetir infinitamente tal experimento. Estudiaremos laley de los grandes nmerosque nos ayudar a precisar un poco mejor el sentido deP[] =.(6.3)

Simplificando un poco el problema, cada una de las repeticiones del experimento que se realicen en el contexto citado puede verse como un ensayo de Bernoulli donde el xito coincide con la ocurrencia de. As el nmero de xitosXen losnensayos del experimento es una variable aleatoria binomial en la cual la probabilidad de xito es un valor desconocidop. Para esta variable sabemos que la media esnpy la varianza esnp(1 -p) (teorema15).Si consideramos la variable aleatoriaY=X/nes muy sencillo demostrar que la esperanza deYesnp/n=py que la varianza es(np(1 -p))/n2=p(1 -p)/n.Aplicando la desigualdad de Chebyshev aYcont=obtenemos:P-p.(6.4)

Es decir el lmite (6.3) existe o dicho en palabras algo ms simples dada cualquier precisinse puede encontrar un valornde manera que el cociente xitos entre el total de ensayos est tan cerca del valorpdesconocido como queramos.En cierta forma esta ltima desigualdad da legitimidad al proceso estadstico que se ha citado en ladefinicin(10), pues garantiza que el proceso descrito en esta definicin en realidad converge al valor de la probabilidad del evento.Por supuesto que no resuelve en forma simple el problema operacional de saber cul debe ser el nmero de repeticiones del experimento necesarias para obtener aproximaciones precisas de la probabilidad buscada. Se puede utilizar la desigualdad de Chebyshev para obtener aproximaciones del valor denpero el teorema del lmite central, que abordaremos en la seccin siguiente ser de mayor utilidad en ese sentido.Las conclusiones que se han obtenido hasta ahora se resumen en el siguiente teorema conocido como una forma dbil de laley de los grandes nmeros[2].

P- P[]= 0.(6.5)

Paralela a la la forma dbil de la ley de los grandes nmeros existe una generalizacin que se llama laLey de los grandes Nmeroscuya justificacin est fuera de los objetivos de este curso [6] y se enuncia en el siguiente teorema:

P-]= 0.(6.6)

Dicho en otras palabras la probabilidad de que el promedioSn/ndifiera de la esperanza menos que uncualquiera, tiende a uno.El Teorema del Lmite CentralEl ltimo teorema de la seccin previa es generalizado por otro teorema cuya importancia en aplicaciones de la probabilidad y estadstica es mucho mayor. El teorema del lmite central se enuncia seguidamente:

Pxy=(y) -(x).(6.7)

Donde(z)es la distribucin normal estndar.La importancia de este teorema es enorme, en especial porque no tiene ninguna condicin especial sobre el tipo de distribucin al que se aplica. Puede ser continua o discreta, no importa como sean, en promedio la suma de estas variables se distribuyen como una normal con mediany varianzan. Este teorema tambin es vlido para la variable aleatoria=Sn/npara la que, sinse hace grande, distribuye como una normal de mediay varianza/n.Para explorar mejor el valor de este teorema se presesenta la siguiente aplicacin que permite partir de una distribucin de datos cualquiera y analizar la distribucin de probabilidad de los posibles promedios de muestras sobre la distribucin original.

Aproximacin Normal BinomialEl teorema del lmite central tiene una implicacin adicional que tambin resulta sorprendente. SiSnsigue una distribucin binomial de parmetrosnypentonces sixyyson enteros no negativos tales quex 4000]=1 -

=1 -(- 1.05409)

=1 - 0.14592 = 0.85408.

Ejemplo 39El rendimiento de cierto cilindro de gas est normalmente distribuido con una media de 6 horas y una desviacin estndar de 0.5 horas. Este gas se vende en paquetes de 5 cilindros y en cada paquete se utilizan los cinco cilindros en forma secuencial, es decir se empieza uno solamente si se ha terminado el anterior.Se desea determinar el tiempo mximo de duracin de cada paquete de manera que ste sea excedido slo por el 3% de los paquetes.SolucinComo el tiempo de duracin de cada cilindro es normal la distribucin del tiempoTP=T1+ ... +T5de cada paquete tambin es normal con media 30 y desviacin estndar0.5, lo que se solicita es un valorctal que.P[TP