La ley de los grandes números

Post on 24-Feb-2016

56 views 0 download

description

La ley de los grandes números. " El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente lo que pasó fue que entre las siete y las nueve de aquella tarde el puente de Triborough - PowerPoint PPT Presentation

Transcript of La ley de los grandes números

1

La ley de los grandes números

"El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente lo que pasó fue que entre las siete y las nueve de aquella tarde el puente de Triborough tuvo la concentración de tráfico saliente más elevada de su historia".

Comienzo del relato corto "La Ley" de Robert M. Coates

2

Suma de variables aleatorias discretas

Supongamos que X e Y son dos variables aleatorias discretas e independientes con funciones de distribución p1(x) y p2(y) respectivamente. Sea Z = X + Y, ¿cómo será la función de distribución de Z, p3(z)?

Puesto que el evento Z = z es la unión del par de eventos disjuntos: (X = k) e (Y = z - k), tendremos:

k

kzYPkXPzZP )()()( 213

Decimos que p3(x) es la convolución de p1(x) y p2(x):

p3(x) = p1(x) * p2(x)

3

k

kjpkpjp )()()( 213

Convolución

La convolución es una operación conmutativa y asociativa.

Visto lo visto, es "fácil" demostrar por inducción cómo será la suma de n variables aleatorias independientes:

nn XXXS ...21

nnn XSS 1

teniendo en cuenta que:

4

Veamos un ejemplo: Supongamos que lanzamos un dado dos veces. Sea el resultado del primer lanzamiento la variable aleatoria X1 y del segundo, la variable aleatoria X2 , ambas con la misma distribución de probabilidad que llamaremos m(x). Calculemos la función de distribución de probabilidad para S2 = X1 + X2.

k

ksXmkXmsSP )()()( 212

(....)

5

Si quisiéramos calcular S3 = X1 + X2 + X3 , tendríamos:

(...)

Este es el resultado gráfico para la suma S10 de 10 dados.

6

Y estos son los resultados gráficos para las sumas S20 y S30 de 20 y 30 dados, respectivamente.

Observemos que, a medida que aumenta el número de dados, tenemos una curva que se aproxima más y más a una campana de Gauss, a una normal.

Veremos por qué más adelante, cuando hablemos del teorema central del límite.

7

Suma de variables aleatorias continuas

Si X e Y son dos variables aleatorias continuas e independientes con funciones densidad de probabilidad f(x) y g(x) respectivamente, la variable aleatoria Z = X + Y, tendrá como densidad de probabilidad la convolución de f y g:

dxxfxzg

dyygyzfzgf

)()(

)()())((

8

Suma de dos variables aleatorias uniformesindependientes

Dos distribuciones uniformes U(0,1).

Obtenemos la densidad de probabilidad de la suma de las dos variables por convolución de sus densidades.

9

1

0)()( dyyzfzf XZ

Observa que, como X e Y varían entre 0 y 1, su suma Z variará entre 0 y 2.

10

Convolución de dos densidades de probabilidad uniformes U(0,1).

11

Suma de dos variables aleatorias exponenciales independientes

Dos densidades de probabilidadexponenciales Exp(λ).

Obtenemos la densidad de probabilidad de la suma de las dos variables por convolución de sus densidades.

12

Convolución de dos densidades de probabilidad exponenciales Exp(λ).

13

Suma de dos variables aleatorias normales independientes

Dos densidades de probabilidad normalestipificadas N(0,1).

14

Obtenemos la densidad de probabilidad de la suma de las dos variables por convolución de sus densidades.

Normalización de N(0, √2)

El resultado es una normal de media 0 y varianza 2, N(0,2)

15

Suma de n variables aleatorias independientes

nn XXXS ...21

nnn XSS 1

Teniendo en cuenta que:

)()(212xffxf XXS

Y que:

Tendremos para n variables aleatorias independientes:

)(...)(21

xfffxfnn XXXS

Recuerda que la convolución es una operación conmutativa y asociativa.

16

Suma de n uniformes

17

Suma de n normales

18

Suma de n exponenciales

19

Teorema central del límiteEn condiciones muy generales la suma de n

variables aleatorias , independientes e idénticamente distribuidas con media μ y varianza distinta de cero σ2, tiende a la distribución normal

a medida que n tiende a infinito.

nn XXXS ...21

Otra manera de enunciarlo: bajo las mismas condiciones, si n es suficientemente grande

se distribuye como una normal N(μ, σ2/n)

20

22)( xP

Desigualdad de Chebyshev (1821-1894)

Una varianza pequeña indica que las desviaciones grandes alrededor de la media son improbables. La desigualdad de Chebyshev hace precisa esta impresión:

21)( kkxP

O bien, haciendo: kPafnuti Lvovic Cebicev (1821-1894)

21

Demostración:

dxxfxdxxfx

x)()( 222

xx

dxxfdxxf )()( 22

xP

xP22

Para el caso discreto la demostración es semejante.

23

1lim

:eequivalent formadeo

0lim

nSP

nSP

n

n

n

n

Ley de los grandes números (en forma débil)

Sean X1, X2, ..., Xn variables aleatorias independientes, con la misma distribución (misma media μ y varianza σ2). Entonces, para Sn = X1 + X2 + ... + Xn y cualquier real > 0:

«La frase "ley de los grandes números" es también usada ocasionalmente para referirse al principio de que la probabilidad de que cualquier evento posible (incluso uno improbable) ocurra al menos una vez en una serie, incrementa con el número de eventos en la serie. Por ejemplo, la probabilidad de que un individuo gane la lotería es bastante baja; sin embargo, la probabilidad de que alguien gane la lotería es bastante alta, suponiendo que suficientes personas comprasen boletos de lotería». Wikipedia

24

Demostración:

1lim

:eequivalent forma de o

0lim

;

2

2

2

2

2

nSP

nSP

nnSP

nn

nSE

nnn

nSVar

n

n

n

n

n

nn

Usando la desigualdad de Chebyshev y fijado un épsilón:

25

Observa que Sn/n es un promedio y por eso a la ley de los grandes números suele conocerse también como ley de los promedios.

Hemos visto su "forma débil". En su "forma fuerte" nos dice que si repetimos el lanzamiento de una moneda, la proporción de caras se aproxima más y más a 1/2 a medida que aumentamos el número de lanzamientos.

Si Sn es el número de caras en n lanzamientos, la ley fuerte de los grandes números dice que cuando n tiende a infinito:

121

nSP n

26

En las gráficas se ha marcado con puntos las probabilidades comprendidas entre 0.45 y 0.55.

Vemos como a medida que n crece la distribución se concentra más y más alrededor de 0.5 y el porcentaje de área correspondiente al intervalo (0.45, 0.55) se hace más y más grande.

Distribuciones para el número de caras en n lanzamientos de una moneda.La ley de los grandes números predice que el porcentaje de caras para n grande estará próximo a 1/2.

27

Supongamos que tomamos al azar n números del intervalo [0,1] con una distribución uniforme. Si la variable aleatoria Xi describe la elección i-ésima, tenemos:

nnnSVar

nSE

XVarXE

nn

ii

121;

21

121;

21

2

2

De modo que, para cualquier > 0, tendremos:

22

2

121

nn

SP n

Es decir, si escogemos al azar n números del intervalo [0,1], las probabilidades son mejores que 1 - 1/(12n2) de que la diferencia |Sn/n - 1/2| sea menor que .

28

Gráficos semejantes al caso del lanzamiento de n monedas anterior, pero ahora con la suma de n valores independientes tomados de una U(0,1). Rigen los mismos comentarios.

29

Una aplicación al Método de Monte Carlo

Sea g(x) una función continua definida en el intervalo [0,1] y con imagen en [0,1].Vimos cómo estimar el área bajo la función, su integral, generando pares de números (x,y) al azar.

Existe una forma más eficiente de calcular la integral basándose en la ley de los grandes números.

30

Escojamos una gran cantidad de números Xn al azar del intervalo [0,1] con densidad uniforme. Definamos Yn = g (Xn). El valor esperado de Yn es una estimación del área.

1)()(

)()()()(1

0

222

1

0

1

0

dxxgYE

dxxgdxxfxgYE

n

n

Como el dominio y la imagen de g(x) son el intervalo [0,1], la media μ estará en [0,1] también y |g(x)- μ| ≤ 1.

22

221 1...

nnnYYYP n

Que podemos leer como: la diferencia entre el área estimada y la real, el error que cometemos, es mayor que épsilon con probabilidad 1/n2.

31