Algoritmo Cuantil

8
Universidad del Bio Bio Facultad de Ciencias Magister Mención Estadística Informática I Programación del comando cuantile (Quantile) Alumno: Iván Aliaga Casceres. Prof.: Sergio Contreras Abril de 2015 Resumen Se presenta la programación del comando «quantile» en el programa R, para tal fin se realiza un análisis del paper «Samples Quantiles in Statistical Packages» del autor Rob J. Hyndman y Yanan Fan. 1. Introducción Primeramente la distribución de los cuantiles se definen como: Q( p)= F -1 ( p)= inf {x : F( x) p} , 0 < p < 1 Donde F( x) es la función de distribución. Los cuantiles proporcionan un estimador no paramétrico para las partes de una población basada en una muestra de observaciones independientes {X 1 ,..., X n }de la distribución F. Sea n X (1) ,..., X (n) o los estadísticos de orden de {X 1 ,..., X n } y sea ˆ Q i ( p) la definición de cuantil i - ´ esima o el método de estimación i - ´ esimo estimado i=1,. . .,9. Una dificultad en la comparación de la definición de cuantil es que hay un número notable de maneras en el cálculo equivalentes en la definición entre ellos. Sin embargo, los cuantiles que se utilizan en los paquetes estadísticos se basan en el cálculo de uno o dos estadísticos de orden, y se pueden escribir como. ˆ Q i ( p)=(1 - γ) X ( j) + γ X ( j+1) (1) Donde j - m n p < j - m + 1 n El valor de γ esta en función de j=b pn + mc 1 y g= pn + m - j. Se observa los siguientes 9 metodos algorítmicos que se basan a partir de 1. 2. Algoritmos 2.1. Definición 1 Esta primera definición es la inversa de la distribución empirica que se obtiene haciendo m=0. γ = ( 1 g > 0 0 g = 0 1 buc denota el valor entero más grande no mayor al valor u; dxe denota el valor entero mas pequeño no menor al valor x. 1

description

Documento que descrive el algoritmo de cuantil - cuantil

Transcript of Algoritmo Cuantil

  • Universidad del Bio BioFacultad de Ciencias

    Magister Mencin EstadsticaInformtica I

    Programacin del comando cuantile (Quantile)

    Alumno: Ivn Aliaga Casceres.Prof.: Sergio Contreras

    Abril de 2015

    Resumen

    Se presenta la programacin del comando quantile en el programa R, para tal fin se realiza un anlisis delpaper Samples Quantiles in Statistical Packages del autor Rob J. Hyndman y Yanan Fan.

    1. Introduccin

    Primeramente la distribucin de los cuantiles se definen como:

    Q(p) = F1(p) = in f {x : F(x) p} , 0 < p < 1Donde F(x) es la funcin de distribucin. Los cuantiles proporcionan un estimador no paramtrico para las

    partes de una poblacin basada en una muestra de observaciones independientes {X1, . . . ,Xn}de la distribucinF. Sea

    {X(1), . . . ,X(n)

    }los estadsticos de orden de {X1, . . . ,Xn} y sea Qi(p) la definicin de cuantil i esima o el

    mtodo de estimacin i esimo estimado i=1,. . .,9.Una dificultad en la comparacin de la definicin de cuantil es que hay un nmero notable de maneras en

    el clculo equivalentes en la definicin entre ellos. Sin embargo, los cuantiles que se utilizan en los paquetesestadsticos se basan en el clculo de uno o dos estadsticos de orden, y se pueden escribir como.

    Qi(p) = (1 )X(j) + X(j+1) (1)Donde

    jmn p < jm+ 1

    n

    El valor de esta en funcin de j=bpn+mc1 y g=pn+m j.Se observa los siguientes 9 metodos algortmicos que se basan a partir de 1.

    2. Algoritmos

    2.1. Definicin 1

    Esta primera definicin es la inversa de la distribucin empirica que se obtiene haciendo m=0.

    =

    {1 g > 00 g = 0

    1buc denota el valor entero ms grande no mayor al valor u; dxe denota el valor entero mas pequeo no menor al valor x.

    1

  • Para esta definicin2

    Freq(Xk Q1(p)

    )=dpne

    y

    Freq(Xk = Q1(1 p)

    )=bpn+ 1c

    2.2. Definicin 2

    La definicin 2 es similar a la definicin 1 excepto que se usa un promedio cuando g=0 dado que m = 0.

    =

    {12 g = 01 g > 0

    y

    Freq(Xk Q2(p)

    )= Freq(Xk Q2(1 p)) = dpne

    2.3. Definicin 3

    En esta definicin Q3(p) se define como estadistico de orden X(k) donde k es el valor entero ms cercanoa np.Asi tenemos que m= 12 y cuando g > 0, asi.

    =

    {0 g=0 y j es par1 E.O.C.

    bajo esta definicin:

    Freq(Xk Q3(p))={bpnc g = 0, y bpnc parbpn+ 12c E.O.C.

    y

    Freq(Xk Q3(1 p))={bpn+ 12c g = 0 y b(1 p)nc parbpn+ 1c E.O.C.

    2.4. Definicin 4

    Parzen (1979) sugiere el clculo por interpolacin en el paso de la definicin 1, esto equivale a realizar pk= kn .

    2.5. Deinicin 5

    Una definicin muy antigua definido por Hazen, esta basado en pk=(k 1/2)/n., este es un valor que tiene sedefine en la primera definicon .

    Ahora se L una medida de estimacin de localidad3 hay dos clases definiciones de cuantiles, la primera aplicapk=LF(X(k)) y la seguna a pk = F(L(X(k))), si F tiene distribucin uniforme, dos aplicaciones son equivalentes, siL denota la mediana y F es estrictamente monotona las dos aplicaciones son equivalentes porque la mediana esinvariante ante transformaciones monotonas.

    Siguiendo la primera aplicacin, cuando F(Xk) tiene la forma de distribucin de F(X(k)) de una distribucionestadstico k-ordenado de una distribucion uniforme, llamado distribucin beta (k, n k + 1), dado que estadistribucin es libre el resultado no depende de la distribucin F , de esta forma se tiene que:

    Q(pk)=Q(F(LX(k))) = LX(k) = Qi(pk)

    2Freq (Xk x)Denota el nmero de observaciones menores o iguales a x.3Media, mediana o la moda.

    2

  • 2.6. Definicion 6

    Weibull (1939) y Gumbel (1939) proponen pk= kn+1 . En este caso pk=E F(X(k)) y los vertices se dividen en unamuestra del espacio en n+ 1 regiones cada uno con probabilidad 1/(n+ 1), en particular.

    Pr(X < X(1)) = Pr(X > X(n)) = 1/(n+ 1)

    2.7. Definicin 7

    Gumbel (1939) tambien considera la posicin modal pk=moda(F(X(k))) = (k 1)/(n 1) una propiedad in-teresante es que los vertices de Q7(p) divide el rango en n 1 intervalos y exctamente 100p% de los intervalosque estan a la izquierda de Q7(p) y 100(1 p)% que estan a la derecha de Q7(p).

    2.8. Definicion 8

    La posicin de la mediana es dificil de obtener por lo que se obtiene aproximando con la formula:

    pk=(k 1/3)/(n+ 1/3)

    2.9. Definicin 9

    Blom (1958) muestra que pk = (k 3/8)/(n+ 1/4) para la arproximacin a F(EXk) para la distribucin nor-mal. Sin embargo Q9(pk) es insesgado y estima a Q(pk) cuando F tiene una distribucin normal puesto que estadefinicin es usada para obtener el QQ-plot de una muestra general de la definicin de cuantil.

    3. Implementacin en R

    Los algoritmos anteriormente citados se implementan en R y su codigo fuente es la siguiente:

    > x quantile_ivan

  • + nppm
  • + if(any(indice
  • + return(q)

    + } else{

    + if(tipo==9){

    + a0

  • > quantile_ivan(a,tipo=2,probabilidad=probabilidad)

    # 0% 25% 50% 75% 100%

    # 1.0 59.0 121.5 185.0 249.0

    > # definicin 3

    > probabilidad quantile(a, probs=probabilidad,type=3)

    # 50% 75% 90%

    # 121 185 224

    > quantile_ivan(a,tipo=3,probabilidad=probabilidad)

    # 50% 75% 90%

    # 121 185 224

    > # definicin 4

    > probabilidad quantile(a, probs=probabilidad,type=4)

    # 0% 25% 50% 75% 100%

    # 1 59 121 184 249

    > quantile_ivan(a,tipo=4,probabilidad=probabilidad)

    # 0% 25% 50% 75% 100%

    # 1 59 121 184 249

    > # definicin 5

    > probabilidad quantile(a, probs=probabilidad,type=5)

    # 0% 25% 50% 75% 100%

    # 1.0 59.0 121.5 185.0 249.0

    > quantile_ivan(a,tipo=5,probabilidad=probabilidad)

    # 0% 25% 50% 75% 100%

    # 1.0 59.0 121.5 185.0 249.0

    > # definicin 6

    > probabilidad quantile(a, probs=probabilidad,type=6)

    # 0% 25% 50% 75% 100%

    # 1.00 59.00 121.50 185.25 249.00

    > quantile_ivan(a,tipo=6,probabilidad=probabilidad)

    # 0% 25% 50% 75% 100%

    # 1.00 59.00 121.50 185.25 249.00

    > # definicin 7

    > probabilidad quantile(a, probs=probabilidad,type=7)

    # 0% 20% 40% 60% 80% 100%

    # 1.0 44.8 90.8 156.4 199.0 249.0

    > quantile_ivan(a,tipo=7,probabilidad=probabilidad)

    7

  • # 0% 20% 40% 60% 80% 100%

    # 1.0 44.8 90.8 156.4 199.0 249.0

    > # definicin 8

    > probabilidad quantile(a, probs=probabilidad,type=8)

    # 0% 25% 50% 75% 100%

    # 1.0000 59.0000 121.5000 185.0833 249.0000

    > quantile_ivan(a,tipo=8,probabilidad=probabilidad)

    # 0% 25% 50% 75% 100%

    # 1.0000 59.0000 121.5000 185.0833 249.0000

    > # definicin 9

    > probabilidad quantile(a, probs=probabilidad,type=9)

    # 0% 25% 50% 75% 100%

    # 1.0000 59.0000 121.5000 185.0625 249.0000

    > quantile_ivan(a,tipo=9,probabilidad=probabilidad)

    # 0% 25% 50% 75% 100%

    # 1.0000 59.0000 121.5000 185.0625 249.0000

    8