Jose Villasenor Alva Sept 2011

download Jose Villasenor Alva Sept 2011

If you can't read please download the document

  • date post

    12-Dec-2015
  • Category

    Documents

  • view

    5
  • download

    1

Embed Size (px)

description

a

Transcript of Jose Villasenor Alva Sept 2011

  • Pruebas de bondad de ajuste para distribucionescon parmetro de forma

    Jos A. Villaseor Alva

    Colegio de Postgraduados, Mxico

    ITESM, Monterrey, N.L.2 de septiembre de 2011

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 1/29

  • Introduccin

    Una parte importante de la inferencia estadstica es obtener informacinacerca de la poblacin de la cual una muestra aleatoria (m.a.) ha sidoextrada.

    Por ejemplo, mucha metodologa estadstica est basada en el supuesto deque la poblacin es normal; sin embargo, este supuesto debe de serverificado antes de continuar con otros aspectos relacionados con lainferencia estadstica.

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 2/29

  • Introduccin (cont.)El problema clsico de bondad de ajuste se presenta cuando suponemos quela hiptesis nula est completamente especificada. As, con base en una m.a.X1,X2, ...,Xn de F (x) se desea probar la hiptesis nula:

    H0 : F (x) = F0(x), para toda x (1)

    contra la hiptesis alternativa

    H1 : F (x) 6= F0(x), para alguna x , (2)donde F0 est completamente especificada (no hay parmetrosdesconocidos).

    En este caso se dice que H0 es una hiptesis simple.

    Algunas pruebas clsicas de bondad de ajuste para este problema son:la prueba de Chi-cuadrada propuesta por Karl Pearson (1900), que hasido reconocida como uno de los avances cientficos ms importantesdel siglo XX.la prueba de Kolmogorov-Smirnov (Kolmogorov, 1933).la prueba de Anderson-Darling (1952).

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 3/29

  • Introduccin (cont.)El problema en que estamos interesados es cuando la hiptesis nula escompuesta, esto es,

    H0 : F (x) = F (x ; ) (3)

    donde es un vector de parmetros desconocidos, que puede tomar dos oms valores distintos.

    Por ejemplo, cuando F (x ; ) es la distribucin normal con parmetrosdesconocidos.

    Una prueba clsica en esta situacin es la prueba A2 de Anderson-Darling(1952) en donde la media y la varianza son estimadas por mximaverosimilitud.

    A2 es invariante bajo transformaciones de escala y localidad.

    Esto implica que la distribucin bajo H0 de A2 para probar normalidad nodepende de los parmetros de escala y localidad. As, la distribucin nulapuede ser obtenida por simulacin para cualquier tamao de muestra n, dedonde se obtiene la constante crtica que define la prueba.

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 4/29

  • Algunos conceptos relevantes

    Una prueba de hiptesis basada en una estadstica de pruebaT es unaparticin del conjunto de los valores posibles de T en dos regiones, la reginde rechazo y la regin de aceptacin (no rechazo).

    La distribucin de T bajo H0 es llamada la distribucin nula de T .

    Al usar una prueba se tiene:

    Error de tipo I: rechazar H0 cuando es verdadera.

    Error de tipo II: aceptar (no rechazar) H0 cuando es falsa.

    Tamao de una prueba: una prueba es de tamao si = supH0 P(Error de tipo I).

    Potencia de una prueba: es 1 P(Error de tipo II) que es igual a laprobabilidad de rechazar H0 cuando H0 es falsa.

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 5/29

  • Prueba de Shapiro-Wilk

    Sean x(1) < x(2) < ... < x(n) las estadsticas de orden de una m.a. de tamaon de una funcin de distribucin F .

    Sea (.) la funcin de distribucin normal estndar. Para probar la hiptesisde normalidad univariada:

    H0 : F (x) = (x

    ), donde < y > 0 son desconocidos,

    Shapiro y Wilk (1965) proponen la estadstica de prueba

    W =

    [n

    i=1aix(i)

    ]2n

    i=1(xi x)2

    (4)

    donde x =1n

    ni=1

    xi y

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 6/29

  • Prueba de Shapiro-Wilk (cont.)

    ai es el isimo elemento del vector

    a = (a1, ...,an) =

    mV1

    (mV1V1m)1/2

    con m = E [Z] y V = cov (Z) donde Z denota al vector de estadsticas deorden de una m.a. normal estndar de tamao n.

    La prueba de Shapiro-Wilk rechaza la hiptesis de normalidad con un tamaode prueba si W < k, donde k es tal que la prueba es de tamao .

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 7/29

  • Prueba de Shapiro-Wilk (cont.)

    La estadstica W resulta ser una razn de dos estimadores de la varianza yse puede verificar que es invariante bajo transformaciones de escala ylocalidad. Por lo tanto, para dada, k es tal que

    = P(W < k|H0 es verdadera). (5)

    Es decir, k es el percentil 100% de la distribucin nula de W .

    Es importante notar que en general, cuando el vector de parmetros esestimado, la distribucin nula de la estadstica de prueba depende de , deltipo de estimador de y de la forma de F .

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 8/29

  • Pruebas para distribuciones con parmetro de forma

    Aqu estamos interesados en probar H0 en (3) cuando el vector deparmetros incluye un parmetro de forma.

    En esta situacin, la distribucin nula de la estadstica de prueba de cada unade las pruebas clsicas de bondad de ajuste depende del parmetro deforma, de su estimador y de la F misma.

    Ejemplos: Las distribucionesWeibull, lognormal, Pareto clsicaGamma,Pareto generalizada,Normal asimtrica,Alfa-estables,con cola de variacin regular.

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 9/29

  • 1. La distribucin Weibull

    Sea X una v.a. exponencial(). Para > 0, la v.a. Y = X 1/ tiene distribucinWeibull(, ) con funcin de distribucin

    F (y ;, ) = 1 ey , y > 0,

    donde es el parmetro de forma.

    Se desea probar H0 : F (y) = F (y ;, ) con base en una m.a. Y1,Y2, ...,Yn deF (y).

    Para esto note que Z = logY tiene distribucin Gumbel con parmetro delocalidad (log)/ y parmetro de escala 1/.

    Debido a que la distribucin Gumbel es de localidad y escala, la prueba deAnderson-Darling puede ser utilizada para probar H0 con base en los datostransformados y estimando los parmetros por mxima verosimilitud.Stephens (1977) obtuvo los valores crticos para la distribucin Gumbel.

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 10/29

  • 2. La distribucin Pareto clsica

    Se dice que la v.a. X tiene distribucin Pareto clsica con parmetro de forma si tiene funcin de distribucin

    F (x ; ) = 1 1/x , x > 1, > 0. (6)

    Se desea probar H0 : F (x) = F (x ; ) con base en una m.a. X1,X2, ...,Xn deF (x).

    Para esto note que Y = logX tiene distribucin Exponencial con parmetrode escala .

    Por lo tanto, para probar H0 se puede emplear por ejemplo la prueba deexponencialidad de Cox y Oakes (1984) con base en los datos transformados.

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 11/29

  • 3. Distribucin Pareto generalizada

    Se dice que la v.a. X tiene distribucin Pareto Generalizada (PG) si sufuncin de distribucin est dada por

    F (x ;, ) = 1(

    1 +

    x)1/

    , (7)

    donde > 0, y R tal que x > 0 para 0 y 0 < x < / cuando < 0.

    Cuando 0+, F (x ;, ) 1 exp (x/) , la cual es la distribucinExponencial().

    Cuando = 1, F (x ;, ) = x/, la cual es la distribucin Uniforme(0, ).La familia PG contiene distribuciones de cola pesada, la familia dedistribuciones exponencial, as como una subclase de distribuciones Beta yotras de soporte acotado.

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 12/29

  • Distribucin Pareto generalizada (cont.)

    Debido a su riqueza, la familia de distribuciones PG ha sido usada paramodelar probabilidades en diferentes campos como Finanzas, Ecologa eHidrologa entre otras (ver Reiss y Thomas, 2007).

    Por lo tanto, se requiere contar con una prueba de bondad de ajuste para

    H0 : F es una distribucin PG(, ), , desconocidos. (8)

    con base en una m.a. X1, ...,Xn de F .

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 13/29

  • Estimador de Hill: caso 0La distribucin Pareto con parmetro de forma se define comoF (x ; ) = 1 x1/ , x > 1. Entonces

    lmx

    F (x ; )F (x ;, )

    = lmx

    x1/(1 + x

    )1/ = ()1/

    . (9)

    donde F (x) = 1 F (x). Es decir, la distribucin PG(, ) es equivalente en lacola a la distribucin Pareto().

    Por lo tanto, el estimador de Hill (1975) para es

    N = Wnk+1 1k

    kj=1

    Wnj+1

    , (10)donde

    Wj = logY(j), j = n k + 1,n k + 2, ...,n. (11)y Y(1) < Y(2) < ... < Y(n) son las estadsticas de orden correspondientes auna m.a. Y1,Y2, ...,Yn de la distribucin PG(, ) .

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 14/29

  • Mtodo combinado: caso < 0

    Sea U =(F (X )

    ), esto es, U = 1 + X . Note que U tiene distribucin

    Beta(1/,1).Proponemos el siguiente procedimiento en dos etapas para estimar elparmetro .

    Conferencia Bimestral de la AME Pruebas para distribuciones con parmetro de forma 15/29

  • Mtodo combinado: caso < 0 (cont.)Etapa 1: Mtodo de Momentos

    Sean X1,X2, ...,Xn una m.a. de tamao n de la distribucin PG(, ).El momento muestral de primer orden de U es

    m =1n

    ni=1

    (1 +

    Xi)

    = 1 +

    X (12)

    donde X =n

    i=1 Xi/n.

    Por otro lado, el valor esperado de U es E{U} = 1/(1 ).Entonces, por el mtodo de momentos,

    11 = 1 +

    X . (13)

    Resolviendo para , = 1

    X. (14)

    Conferencia Bimestral de la AME Prue