Simulación en R
-
Upload
cesar-gomez -
Category
Documents
-
view
264 -
download
0
description
Transcript of Simulación en R
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática
Escuela de Matemática
Proyecto # 2 de Estadística II: Simulaciones en R
Docente: Msc. Rolando Lemus
Integrantes:
Gómez Juárez, César Omar GJ12001
Sola Gutiérrez, Vitelio Alexander SG12031
CASO 1Considere la población de lanzamientos de un dado que se genera la lanzar un número infinitamente grande de veces. Graficar la distribución de probabilidad de esta población.
> table(t)
t
1 2 3 4 5 6
1619 1655 1706 1627 1668 1725
> table(t)/sum(table(t))
t
1 2 3 4 5 6
0.1619 0.1655 0.1706 0.1627 0.1668 0.1725
1 2 3 4 5 6
0.00
0.05
0.10
0.15
Obtenga una muestra de n=5 observaciones de esta población, simulando el lanzamiento de un dado 5 veces y registre las 5 observaciones. En seguida, calcule la suma y la media de las 5 observaciones.
> s<-sample(1:6,5,rep=T);s
[1] 5 1 6 1 1
> mean(s)
[1] 2.8
> sum(s)
[1] 14
Para propósitos experimentales, repita el procedimiento de muestreo 100 veces. Luego, construya el histograma de frecuencias de la suma y media para las 100 muestras y observe la distribución resultante y coméntela.
Histogram of sumatorias
sumatorias
Frequency
10 15 20 25
05
10
15
20
Se observa que en los extremos del histograma se acumula poca frecuencia; mientras que en el centro se acumula una frecuencia mayor, podríamos decir que existe una aproximación a la curva normal, aunque no es muy notable ya que las muestras que se han tomado constan, únicamente de 5 observaciones.
Histogram of medias
medias
Frequency
1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
05
10
15
20
25
30
¿Qué sucede si repite el experimento que se describió con una muestra de mayor tamaño, digamos n=10?
Se observa, con respecto al gráfico anterior una mejor aproximación a la curva normal, es decir puesto que cada muestra que se ha tomado consta de 10 observaciones, la distribución tienen una aproximación más cercana a la normal.
En este experimento se ilustra la idea básica contenida en el teorema del límite central (TLC). Enúncielo para el caso de la suma y la media respectivamente.
Histogram of medias
medias
Frequency
2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
05
10
15
20
25
30
Histogram of sumatorias
sumatorias
Frequency
20 25 30 35 40 45 50 55
05
10
15
20
25
30
CASO 2Suponga que cada Xi está distribuida uniformemente sobre [0,1]. Encuentre la media y desviación estándar correspondientes.
Luego defina Z según el TLC. Para n = 50, genere 500 simulaciones de S50 en el computador y grafique el histograma de área total 1 y ajuste la función de densidad normal sobre él.
z=Sn−nμ
σ √n=
s50−50μ
σ √5050 distribuciones uniformes
500 simulaciones de S50
> mean(X)
[1] 0.4981792
> sd(X)
[1] 0.2868496
> medianorm<-(mean(X)*50);medianorm
[1] 24.90896
> varianzanorm<-(sd(X)*sqrt(50));varianzanorm
[1] 2.028333
Histogram of S50
S50
Density
20 22 24 26 28 30 32
0.00
0.05
0.10
0.15
0.20
CASO 3Sean T1 , … , Tn variables aleatorias independientes idénticamente distribuidas exponencialmente con parámetro . Entonces Sn = T1 + …+ Tn tiene distribución gamma. Luego el TLC reclama que Sn , una vez estandarizado, tiene una densidad que es aproximadamente N(0,1) para n grande. Para valores diferentes de n (2, 4, 8, 16, 32), fijo muestre la densidad de Z con la densidad de N(0,1) superpuesta, cuando el experimento se repite en cada caso.Sugerencia: utilice el software R para las muestras, cálculos y gráficos del experimento.
Histogram of u
u
Density
0 1 2 3 4 5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Para n=4
Histogram of S4
S4
Density
0 2 4 6
0.0
0.1
0.2
0.3
0.4
Para n=8
Histogram of S8
S8
Density
0 2 4 6 8 10 12
0.00
0.05
0.10
0.15
0.20
0.25
Para n=16
Histogram of S16
S16
Density
5 10 15
0.00
0.05
0.10
0.15
0.20
Para n=32
Histogram of S32
S32
Density
10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
CASO 4Presentar n ensayos de Bernoulli con probabilidad p de éxito. La fracción de las veces que resulta éxito es
X=1n
( X 1+…+Xn )=Sn
n
Donde Xi es 1 ó 0 con probabilidad p, q respectivamente. Puesto que μ=E ( X i )=p .
P(|X−p|≥ ε )❑→
0
Cuando n →∞ para cada ε>0 fijado.
a) Probar que la ley de los grandes números lleva a la interpretación frecuencial de probabilidad.
La varianza de la variable aleatoria binomial X ~ Bin(n,p) está dada por V(X)=np(1-p). Usando la desigualdad de Chebyshev,
P {|X−np|<nε }=1−P {|X−np|≥ nε }≥1− 1(nε )2
V ( X ) ≥1−p(1−p)
n ε2
Como p(1−p)≤14
, entonces
P {|Xn
−p|<ε}≥1− 1
4nε2
Así si n→∞ entonces1− 1
4nε2→1 , paraunϵ>0 fijo , así pues P {|X
n−p|<ε}=1, y por complemento:
P {|Xn
−p|>ε}=0
b) Simule el lanzamiento de una moneda 50 veces, y observar el número de caras que aparecen. Fije un valor ε>0, verifique la ley de los grandes número para la fracción de veces que aparece éxito; vaya incrementando el tamaño de la muestra.
> moneda <- c("C", "+"); moneda
[1] "C" "+"
> lanzamientos <- sample(moneda, 50, replace=TRUE); lanzamientos
[1] "C" "+" "C" "C" "+" "C" "C" "C" "+" "C" "+" "C" "C" "C"
[15] "C" "+" "C" "C" "+" "+" "C" "+" "C" "C" "C" "C" "+" "C"
[29] "+" "+" "C" "C" "+" "C" "C" "C" "C" "+" "C" "+" "+" "+"
[43] "+" "C" "C" "+" "C" "C" "C" "C"
> table(lanzamientos)
lanzamientos
+ C
18 32
> epsilon<-0.025;epsilon
[1] 1e-10
> x<-rbinom(50,1,prob=26/50);x
[1] 1 0 1 1 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 0 1 1 1 1 0 0 0 1 0
[30] 0 0 1 0 1 1 0 1 0 0 0 0 1 1 1 1 0 0 1 1 1
> m<-mean(x);m
[1] 0.48
> p<-26/50
> abs(p-m)
[1] 0.04
Incremento la muestra n=100
zamientos <- sample(moneda,100, replace=TRUE); lanzamientos
[1] "+" "+" "C" "C" "C" "C" "+" "+" "C" "+" "C" "C" "+" "C" "+" "C" "C" "+"
[19] "+" "C" "C" "C" "C" "+" "C" "C" "C" "+" "+" "C" "C" "C" "C" "C" "+" "+"
[37] "+" "C" "+" "C" "+" "C" "+" "+" "+" "C" "+" "+" "C" "C" "C" "C" "C" "C"
[55] "+" "C" "C" "+" "+" "+" "C" "C" "+" "C" "C" "+" "C" "C" "C" "C" "C" "C"
[73] "C" "+" "C" "+" "+" "+" "C" "C" "C" "C" "C" "+" "+" "+" "C" "+" "+" "C"
[91] "+" "+" "C" "+" "+" "+" "C" "+" "C" "C"
> table(lanzamientos)
lanzamientos
+ C
43 57
> p<-48/100
> x<-rbinom(100,1,prob=48/100);x
[1] 0 0 1 1 1 0 1 0 0 1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 1 1 1 1 1 1 0 0 1
[38] 1 0 0 1 0 1 0 0 1 1 0 0 1 0 1 0 1 1 0 0 0 1 0 0 0 1 0 0 1 1 1 0 0 0 0 0 1
[75] 1 1 1 0 1 0 0 1 0 1 0 1 0 0 1 1 1 0 1 1 0 1 1 1 1 1
> m<-mean(x);m
[1] 0.52
> abs(p-m)
[1] 0.04
Incrementando la muestra a n=1000
> table(lanzamientos)
lanzamientos
+ C
496 504
> m<-mean(x);m
[1] 0.536
> abs(p-m)
[1] 0.021