Teorema Central del Límite. -...
Transcript of Teorema Central del Límite. -...
Teorema Central del Límite.
Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso 2014-2015.
F. San Segundo.
Motivación de las variables aleatorias continuas.
En las variables aleatorias discretas hemos usado una tabla de densidad para ver como se
reparte la probabilidad entre los distintos valores de la variable. Pero, como hemos visto en el
caso de la binomial, a medida que el número de valores aumenta y las diferencias entre ellos
empiezan a resultar irrelevantes, cobra cada vez más sentido la idea de reemplazar los
recángulos de la tabla por el área bajo la grá�ca de una curva que describa la distribucion de
probabilidad.
2/14
Variables aleatorias continuas: la función de densidad.
Para que esa idea funcione necesitamos una función con estas propiedades:
Dada una función con esas propiedades, para calcular la probailidad de que la
variable aleatoria de�nida por tome un valor en el intervalo usamos
la integral:
Y decimos que es la función de densidad de la variable aleatoria
f
No negativa: para todo ; es decir, no toma valores negativos.
Probabilidad total igual a : el área total bajo la grá�ca de es 1:
· f(x) ≥ 0 x f
· 1 f
f(x)dx = 1∫ ∞
−∞
fX f (a, b)
P(a ≤ X ≤ b) = f(x)dx∫ b
a
f X
3/14
Interpretación de la función de densidad.
La función de densidad indica cómo se reparte la probabilidad total entre distintas zonas de
valores de la variable en el eje . Cuanto más alta sea la función de densidad en un intervalo,
mayor probabilidad hay de que tome un valor de ese intervalo.
XX
4/14
Ejemplo 1: un caso típico.
Dada la función , empezamos por ver su grá�ca (atención a las escalas de
los ejes):
GeoGebra es muy útil para explorar la grá�ca de una función, porque permite hacer zoom y
desplazarse de forma muy sencilla.
f(x) =2√
π(1 + )x4
f = function(x){sqrt(2) / (pi * (x^4 + 1))}
curve(f, from = -10, to = 10, col="red", lwd=3)
abline(h=0, lwd=3);abline(v=0, lwd=3) #ejes
5/14
Ejemplo 1: comprobación de la condición de integral total 1.
Vamos a empezar por usar varios programas para comprobar que se cumplen las condiciones
para usarla como función de densidad.
Pero no hay una forma fácil de hacer cálculos simbólicos.
en GeoGebra usaríamos: Integral[sqrt(2)/(pi * (x^4 + 1)), -∞, ∞] Usa la Vista
CAS para un resultado simbólico, o la Línea de entrada para un resultado numérico.
En Wolfram Alpha sería integrate sqrt(2)/(pi * (x^4 + 1)) from -oo to oo.
Este programa devuelve ambos valores, simbólico y numérico.
En R el cálculo numérico es:
·
·
·
integrate(f, -Inf, Inf)
## 1 with absolute error < 1.4e-05
6/14
Ejemplo 1: cálculo de la probabilidad de un intervalo.
Una vez que sabemos que es una función de densidad, podemos empezar a usarla para
calcular probabilidades. Por ejemplo, la probabilidad se corresponde con el
área bajo la curva entre y . Grá�camente (las escalas no son iguales):
Y se obtiene , como
puedes comprobar con cualquiera de los programas que hemos usado. En GeoGebra:
Integral[sqrt(2)/(pi * (x^4 + 1)), 0, 1]
P (0 < X < 1)x = 0 x = 1
P(0 < X < 1) = f(x)dx = ≈ 0.39027∫ 1
0
π + 2 ( )coth−1 2√4π
7/14
Ejemplo 2: función de densidad con soporte en un intervalo acotado.
Nos referimos a los casos en los que la función de densidad es igual a 0 fuera de un intervalo
acotado. Por ejemplo:
La grá�ca de la función es:
En el Tutorial05 hay detalles de cómo dibujar estas grá�cas.
f(x) = { 6 ⋅ (5x − 6 − )x2
0
si 2 < x < 3,
en cualquier otro caso.
8/14
Ejemplo 2: condición de integral total 1 y probabilidad de intervalos.
Puedes empezar comprobando que con esa de�nición
En GeoGebra usaríamos
Y para calcular, por ejemplo, la probabilidad usaríamos:
Se obtiene, aproximadamente, 0.792. Para intervalos no completamente contenidos en :
y estamos en el caso anterior.
f(x)dx = 6 ⋅ (5x − 6 − )dx = 1∫ ∞
−∞∫ 3
2x2
Integral[6 * (5 * x - 6 -x^2), 2, 3]
P (2.2 < X < 2.8)
Integral[6 * (5 * x - 6 -x^2), 2.2, 2.8]
(2, 3)
P (2.5 < X < 4) = f(x)dx = f(x)dx + f(x)dx = f(x)dx + 0 = f∫ 4
2.5∫ 3
2.5∫ 3
2.5∫ 3
2.5∫ 3
2.5
9/14
Función de distribución de una variable aleatoria continua.
La función de distribución de la variable aleatoria continua se de�ne mediante:
Esta ecuación muestra que (la f. de densidad es la derivada de la función de
distribución). En general es una función creciente sigmoidea (con forma de S), de aspecto
parecido a esta grá�ca:
F X
F(k) = P(X ≤ k) = f(x)dx.∫ k
−∞
(x) = f(x)F ′
F
10/14
Media y varianza de una variable aleatoria continua.
Las fórmulas que hemos visto en el caso discreto se pueden extender por analogía al caso
continuo, cambiando:
Así se obtienen estas dos expresiones:
Si es una variable aleatoria continua con función de densidad , entonces
la media de es el valor
mientras que la varianza de es:
sumas por integrales,
el valor de P(X = x) por
·
· f(x)dx
X f(x)X
μ = x ⋅ f(x)dx∫ ∞
−∞
X
= (x − μ ⋅ f(x)dx.σ2 ∫ ∞
−∞)2
11/14
Ejemplos.
Para calcular la media de la variable del Ejemplo 1 que hemos visto antes podemos usar
GeoGebra, con el comando
y se obtiene , como nos debería haber hecho ver la intuición. La varianza no es tan
evidente, pero la calculamos con:
y se obtiene . Para hallar la media de la del Ejemplo 2 sería:
y se obtiene . La varianza se calcula con:
y se obtiene .
μ X
Integral[x * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞]
μ = 0
Integral[(x - 0)^2 * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞]
= 1σ2 μ X
Integral[x * 6 * (5 * x - 6 -x^2), 2, 3]
μ = 52
Integral[(x -5/2)^2 * 6 * (5 * x - 6 -x^2), 2, 3]
120
12/14
Distribución uniforme.
La distribución uniforme es un tipo muy sencillo de variable aleatoria continua, diseñada para
que la probabilidad total se reparta de manera uniforme por un intervalo , de manera
que todos los subintervalos de sean igual de probables.
Para conseguir esto su función de densidad tiene que ser constante en el intervalo e
igual a fuera de ese intervalo. Como la probabilidad total tiene que ser se obtiene:
La media de la distribución uniforme en es, como cabría esperar,
Dejamos como ejercicio el cálculo de su varianza.
La variable uniforme corresponde a la idea intuitiva (pero incorrecta) de que "todos los puntos
del intervalo son igual de probables".
(a, b)(a, b)
(a, b)0 1
f(x) =⎧⎩⎨⎪⎪
1b − a
0
si a < x < b
en otro caso.
(a, b)
μ = .a + b
2
(a, b)
13/14
La aparente paradoja de las variables continuas.
¿Por qué hemos dicho que esa idea es incorrecta?
Porque si es una variable aleatoria cualquiera (no hace falta que sea uniforme) la
probabilidad de un punto cualquiera tiene que ser necesariamente :
Para ver porque es esto, imagínate que la probabilidad de un punto fuera extremadamente
pequeña, del orden de millonésimas. Aún en ese caso, cualquier intervalo contiene
in�nitos puntos. Así que al sumar el valor de la probabilidad de esos puntos por separado se
obtendría siempre un valor mayor que .
En las variables aleatorias continuas, conviene insistir en esto, son los intervalos los que
tienen probabilidad no nula, no los puntos. En la práctica, este carácter de las variables
continuas las hace mucho más adecuadas para describir los problemas del mundo real en los
que hay imprecisiones; en general, lo más a lo que podemos aspirar es a decir que el valor de
una cierta variable está contenido en un intervalo.
Xx0 0
P (X = ) = 0.x0
(a, b)
1
14/14