Algoritmo Cuantil

Universidad del Bio BioFacultad de Ciencias

Magister Mencin EstadsticaInformtica I

Programacin del comando cuantile (Quantile)

Alumno: Ivn Aliaga Casceres.Prof.: Sergio Contreras

Abril de 2015

Resumen

Se presenta la programacin del comando quantile en el programa R, para tal fin se realiza un anlisis delpaper Samples Quantiles in Statistical Packages del autor Rob J. Hyndman y Yanan Fan.

1. Introduccin

Primeramente la distribucin de los cuantiles se definen como:

Q(p) = F1(p) = in f {x : F(x) p} , 0 < p < 1Donde F(x) es la funcin de distribucin. Los cuantiles proporcionan un estimador no paramtrico para las

partes de una poblacin basada en una muestra de observaciones independientes {X1, . . . ,Xn}de la distribucinF. Sea

{X(1), . . . ,X(n)

}los estadsticos de orden de {X1, . . . ,Xn} y sea Qi(p) la definicin de cuantil i esima o el

mtodo de estimacin i esimo estimado i=1,. . .,9.Una dificultad en la comparacin de la definicin de cuantil es que hay un nmero notable de maneras en

el clculo equivalentes en la definicin entre ellos. Sin embargo, los cuantiles que se utilizan en los paquetesestadsticos se basan en el clculo de uno o dos estadsticos de orden, y se pueden escribir como.

Qi(p) = (1 )X(j) + X(j+1) (1)Donde

jmn p < jm+ 1

n

El valor de esta en funcin de j=bpn+mc1 y g=pn+m j.Se observa los siguientes 9 metodos algortmicos que se basan a partir de 1.

2. Algoritmos

2.1. Definicin 1

Esta primera definicin es la inversa de la distribucin empirica que se obtiene haciendo m=0.

=

{1 g > 00 g = 0

1buc denota el valor entero ms grande no mayor al valor u; dxe denota el valor entero mas pequeo no menor al valor x.

1

Para esta definicin2

Freq(Xk Q1(p)

)=dpne

y

Freq(Xk = Q1(1 p)

)=bpn+ 1c

2.2. Definicin 2

La definicin 2 es similar a la definicin 1 excepto que se usa un promedio cuando g=0 dado que m = 0.

=

{12 g = 01 g > 0

y

Freq(Xk Q2(p)

)= Freq(Xk Q2(1 p)) = dpne

2.3. Definicin 3

En esta definicin Q3(p) se define como estadistico de orden X(k) donde k es el valor entero ms cercanoa np.Asi tenemos que m= 12 y cuando g > 0, asi.

=

{0 g=0 y j es par1 E.O.C.

bajo esta definicin:

Freq(Xk Q3(p))={bpnc g = 0, y bpnc parbpn+ 12c E.O.C.

y

Freq(Xk Q3(1 p))={bpn+ 12c g = 0 y b(1 p)nc parbpn+ 1c E.O.C.

2.4. Definicin 4

Parzen (1979) sugiere el clculo por interpolacin en el paso de la definicin 1, esto equivale a realizar pk= kn .

2.5. Deinicin 5

Una definicin muy antigua definido por Hazen, esta basado en pk=(k 1/2)/n., este es un valor que tiene sedefine en la primera definicon .

Ahora se L una medida de estimacin de localidad3 hay dos clases definiciones de cuantiles, la primera aplicapk=LF(X(k)) y la seguna a pk = F(L(X(k))), si F tiene distribucin uniforme, dos aplicaciones son equivalentes, siL denota la mediana y F es estrictamente monotona las dos aplicaciones son equivalentes porque la mediana esinvariante ante transformaciones monotonas.

Siguiendo la primera aplicacin, cuando F(Xk) tiene la forma de distribucin de F(X(k)) de una distribucionestadstico k-ordenado de una distribucion uniforme, llamado distribucin beta (k, n k + 1), dado que estadistribucin es libre el resultado no depende de la distribucin F , de esta forma se tiene que:

Q(pk)=Q(F(LX(k))) = LX(k) = Qi(pk)

2Freq (Xk x)Denota el nmero de observaciones menores o iguales a x.3Media, mediana o la moda.

2

2.6. Definicion 6

Weibull (1939) y Gumbel (1939) proponen pk= kn+1 . En este caso pk=E F(X(k)) y los vertices se dividen en unamuestra del espacio en n+ 1 regiones cada uno con probabilidad 1/(n+ 1), en particular.

Pr(X < X(1)) = Pr(X > X(n)) = 1/(n+ 1)

2.7. Definicin 7

Gumbel (1939) tambien considera la posicin modal pk=moda(F(X(k))) = (k 1)/(n 1) una propiedad in-teresante es que los vertices de Q7(p) divide el rango en n 1 intervalos y exctamente 100p% de los intervalosque estan a la izquierda de Q7(p) y 100(1 p)% que estan a la derecha de Q7(p).

2.8. Definicion 8

La posicin de la mediana es dificil de obtener por lo que se obtiene aproximando con la formula:

pk=(k 1/3)/(n+ 1/3)

2.9. Definicin 9

Blom (1958) muestra que pk = (k 3/8)/(n+ 1/4) para la arproximacin a F(EXk) para la distribucin nor-mal. Sin embargo Q9(pk) es insesgado y estima a Q(pk) cuando F tiene una distribucin normal puesto que estadefinicin es usada para obtener el QQ-plot de una muestra general de la definicin de cuantil.

3. Implementacin en R

Los algoritmos anteriormente citados se implementan en R y su codigo fuente es la siguiente:

> x quantile_ivan

+ nppm

+ if(any(indice

+ return(q)

+ } else{

+ if(tipo==9){

+ a0

> quantile_ivan(a,tipo=2,probabilidad=probabilidad)

# 0% 25% 50% 75% 100%

# 1.0 59.0 121.5 185.0 249.0

> # definicin 3

> probabilidad quantile(a, probs=probabilidad,type=3)

# 50% 75% 90%

# 121 185 224


# 50% 75% 90%

# 121 185 224

> # definicin 4


# 0% 25% 50% 75% 100%

# 1 59 121 184 249


# 0% 25% 50% 75% 100%

# 1 59 121 184 249

> # definicin 5


# 0% 25% 50% 75% 100%

# 1.0 59.0 121.5 185.0 249.0


# 0% 25% 50% 75% 100%

# 1.0 59.0 121.5 185.0 249.0

> # definicin 6


# 0% 25% 50% 75% 100%

# 1.00 59.00 121.50 185.25 249.00


# 0% 25% 50% 75% 100%

# 1.00 59.00 121.50 185.25 249.00

> # definicin 7


# 0% 20% 40% 60% 80% 100%

# 1.0 44.8 90.8 156.4 199.0 249.0


7

# 0% 20% 40% 60% 80% 100%

# 1.0 44.8 90.8 156.4 199.0 249.0

> # definicin 8


# 0% 25% 50% 75% 100%

# 1.0000 59.0000 121.5000 185.0833 249.0000


# 0% 25% 50% 75% 100%

# 1.0000 59.0000 121.5000 185.0833 249.0000

> # definicin 9


# 0% 25% 50% 75% 100%

# 1.0000 59.0000 121.5000 185.0625 249.0000


# 0% 25% 50% 75% 100%

# 1.0000 59.0000 121.5000 185.0625 249.0000

8

Algoritmo Cuantil

Documents

Transcript of Algoritmo Cuantil