Download - Jose Villasenor Alva Sept 2011

Transcript
Page 1: Jose Villasenor Alva Sept 2011

Pruebas de bondad de ajuste para distribucionescon parámetro de forma

José A. Villaseñor Alva

Colegio de Postgraduados, México

ITESM, Monterrey, N.L.2 de septiembre de 2011

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 1/29

Page 2: Jose Villasenor Alva Sept 2011

Introducción

Una parte importante de la inferencia estadística es obtener informaciónacerca de la población de la cual una muestra aleatoria (m.a.) ha sidoextraída.

Por ejemplo, mucha metodología estadística está basada en el supuesto deque la población es normal; sin embargo, este supuesto debe de serverificado antes de continuar con otros aspectos relacionados con lainferencia estadística.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 2/29

Page 3: Jose Villasenor Alva Sept 2011

Introducción (cont.)El problema clásico de bondad de ajuste se presenta cuando suponemos quela hipótesis nula está completamente especificada. Así, con base en una m.a.X1,X2, ...,Xn de F (x) se desea probar la hipótesis nula:

H0 : F (x) = F0(x), para toda x (1)

contra la hipótesis alternativa

H1 : F (x) 6= F0(x), para alguna x , (2)

donde F0 está completamente especificada (no hay parámetrosdesconocidos).

En este caso se dice que H0 es una hipótesis simple.

Algunas pruebas clásicas de bondad de ajuste para este problema son:la prueba de Chi-cuadrada propuesta por Karl Pearson (1900), que hasido reconocida como uno de los avances científicos más importantesdel siglo XX.la prueba de Kolmogorov-Smirnov (Kolmogorov, 1933).la prueba de Anderson-Darling (1952).

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 3/29

Page 4: Jose Villasenor Alva Sept 2011

Introducción (cont.)El problema en que estamos interesados es cuando la hipótesis nula escompuesta, esto es,

H0 : F (x) = F (x ; θ) (3)

donde θ es un vector de parámetros desconocidos, que puede tomar dos omás valores distintos.

Por ejemplo, cuando F (x ; θ) es la distribución normal con parámetrosdesconocidos.

Una prueba clásica en esta situación es la prueba A2 de Anderson-Darling(1952) en donde la media y la varianza son estimadas por máximaverosimilitud.

A2 es invariante bajo transformaciones de escala y localidad.

Esto implica que la distribución bajo H0 de A2 para probar normalidad nodepende de los parámetros de escala y localidad. Así, la distribución nulapuede ser obtenida por simulación para cualquier tamaño de muestra n, dedonde se obtiene la constante crítica que define la prueba.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 4/29

Page 5: Jose Villasenor Alva Sept 2011

Algunos conceptos relevantes

Una prueba de hipótesis basada en una estadística de pruebaT es unapartición del conjunto de los valores posibles de T en dos regiones, la regiónde rechazo y la región de aceptación (no rechazo).

La distribución de T bajo H0 es llamada la distribución nula de T .

Al usar una prueba se tiene:

Error de tipo I: rechazar H0 cuando es verdadera.

Error de tipo II: aceptar (no rechazar) H0 cuando es falsa.

Tamaño de una prueba: una prueba es de tamaño α siα = supH0

P(Error de tipo I).

Potencia de una prueba: es 1− P(Error de tipo II) que es igual a laprobabilidad de rechazar H0 cuando H0 es falsa.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 5/29

Page 6: Jose Villasenor Alva Sept 2011

Prueba de Shapiro-Wilk

Sean x(1) < x(2) < ... < x(n) las estadísticas de orden de una m.a. de tamañon de una función de distribución F .

Sea Φ(.) la función de distribución normal estándar. Para probar la hipótesisde normalidad univariada:

H0 : F (x) = Φ

(x − µσ

), donde µ ∈ < y σ > 0 son desconocidos,

Shapiro y Wilk (1965) proponen la estadística de prueba

W =

[n∑

i=1aix(i)

]2

n∑i=1

(xi − x)2(4)

donde x =1n

n∑i=1

xi y

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 6/29

Page 7: Jose Villasenor Alva Sept 2011

Prueba de Shapiro-Wilk (cont.)

ai es el i−ésimo elemento del vector

a = (a1, ...,an)′ =m′V−1

(m′V−1V−1m)1/2

con m′ = E [Z] y V = cov (Z) donde Z denota al vector de estadísticas deorden de una m.a. normal estándar de tamaño n.

La prueba de Shapiro-Wilk rechaza la hipótesis de normalidad con un tamañode prueba α si W < kα, donde kα es tal que la prueba es de tamaño α.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 7/29

Page 8: Jose Villasenor Alva Sept 2011

Prueba de Shapiro-Wilk (cont.)

La estadística W resulta ser una razón de dos estimadores de la varianza yse puede verificar que es invariante bajo transformaciones de escala ylocalidad. Por lo tanto, para α dada, kα es tal que

α = P(W < kα|H0 es verdadera). (5)

Es decir, kα es el percentil 100α% de la distribución nula de W .

Es importante notar que en general, cuando el vector de parámetros θ esestimado, la distribución nula de la estadística de prueba depende de θ, deltipo de estimador de θ y de la forma de F .

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 8/29

Page 9: Jose Villasenor Alva Sept 2011

Pruebas para distribuciones con parámetro de forma

Aquí estamos interesados en probar H0 en (3) cuando el vector deparámetros θ incluye un parámetro de forma.

En esta situación, la distribución nula de la estadística de prueba de cada unade las pruebas clásicas de bondad de ajuste depende del parámetro deforma, de su estimador y de la F misma.

Ejemplos: Las distribucionesWeibull, lognormal, Pareto clásicaGamma,Pareto generalizada,Normal asimétrica,Alfa-estables,con cola de variación regular.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 9/29

Page 10: Jose Villasenor Alva Sept 2011

1. La distribución Weibull

Sea X una v.a. exponencial(λ). Para γ > 0, la v.a. Y = X 1/γ tiene distribuciónWeibull(γ, λ) con función de distribución

F (y ;λ, γ) = 1− e−λyγ

, y > 0,

donde γ es el parámetro de forma.

Se desea probar H0 : F (y) = F (y ;λ, γ) con base en una m.a. Y1,Y2, ...,Yn deF (y).

Para esto note que Z = − log Y tiene distribución Gumbel con parámetro delocalidad (logλ)/γ y parámetro de escala 1/γ.

Debido a que la distribución Gumbel es de localidad y escala, la prueba deAnderson-Darling puede ser utilizada para probar H0 con base en los datostransformados y estimando los parámetros por máxima verosimilitud.Stephens (1977) obtuvo los valores críticos para la distribución Gumbel.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 10/29

Page 11: Jose Villasenor Alva Sept 2011

2. La distribución Pareto clásica

Se dice que la v.a. X tiene distribución Pareto clásica con parámetro de formaγ si tiene función de distribución

F (x ; γ) = 1− 1/xγ , x > 1, γ > 0. (6)

Se desea probar H0 : F (x) = F (x ; γ) con base en una m.a. X1,X2, ...,Xn deF (x).

Para esto note que Y = log X tiene distribución Exponencial con parámetrode escala γ.

Por lo tanto, para probar H0 se puede emplear por ejemplo la prueba deexponencialidad de Cox y Oakes (1984) con base en los datos transformados.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 11/29

Page 12: Jose Villasenor Alva Sept 2011

3. Distribución Pareto generalizada

Se dice que la v.a. X tiene distribución Pareto Generalizada (PG) si sufunción de distribución está dada por

F (x ;σ, γ) = 1−(

1 +γ

σx)−1/γ

, (7)

donde σ > 0, y γ ∈ R tal que x > 0 para γ ≥ 0 y 0 < x < −σ/γ cuando γ < 0.

Cuando γ → 0+, F (x ;σ, γ)→ 1− exp (−x/σ) , la cual es la distribuciónExponencial(σ).

Cuando γ = −1, F (x ;σ, γ) = x/σ, la cual es la distribución Uniforme(0, σ).

La familia PG contiene distribuciones de cola pesada, la familia dedistribuciones exponencial, así como una subclase de distribuciones Beta yotras de soporte acotado.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 12/29

Page 13: Jose Villasenor Alva Sept 2011

Distribución Pareto generalizada (cont.)

Debido a su riqueza, la familia de distribuciones PG ha sido usada paramodelar probabilidades en diferentes campos como Finanzas, Ecología eHidrología entre otras (ver Reiss y Thomas, 2007).

Por lo tanto, se requiere contar con una prueba de bondad de ajuste para

H0 : F es una distribución PG(σ, γ), σ, γ desconocidos. (8)

con base en una m.a. X1, ...,Xn de F .

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 13/29

Page 14: Jose Villasenor Alva Sept 2011

Estimador de Hill: caso γ ≥ 0

La distribución Pareto con parámetro de forma γ se define comoF (x ; γ) = 1− x−1/γ , x > 1. Entonces

l«ımx→∞

F (x ; γ)

F (x ;σ, γ)= l«ım

x→∞

x−1/γ(1 + γ

σx)−1/γ =

γ

)1/γ

. (9)

donde F (x) = 1− F (x). Es decir, la distribución PG(σ, γ) es equivalente en lacola a la distribución Pareto(γ).

Por lo tanto, el estimador de Hill (1975) para γ es

γ̂N = −

Wn−k+1 −1k

k∑j=1

Wn−j+1

, (10)

dondeWj = log Y(j), j = n − k + 1,n − k + 2, ...,n. (11)

y Y(1) < Y(2) < ... < Y(n) son las estadísticas de orden correspondientes auna m.a. Y1,Y2, ...,Yn de la distribución PG(σ, γ) .

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 14/29

Page 15: Jose Villasenor Alva Sept 2011

Método combinado: caso γ < 0

Sea U =(F̄ (X )

)−γ, esto es, U = 1 + γ

σX . Note que U tiene distribuciónBeta(−1/γ,1).

Proponemos el siguiente procedimiento en dos etapas para estimar elparámetro γ.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 15/29

Page 16: Jose Villasenor Alva Sept 2011

Método combinado: caso γ < 0 (cont.)Etapa 1: Método de Momentos

Sean X1,X2, ...,Xn una m.a. de tamaño n de la distribución PG(σ, γ).El momento muestral de primer orden de U es

m =1n

n∑i=1

(1 +

γ

σXi

)= 1 +

γ

σX̄ (12)

donde X̄ =∑n

i=1 Xi/n.

Por otro lado, el valor esperado de U es E{U} = 1/(1− γ).

Entonces, por el método de momentos,

11− γ

= 1 +γ

σX̄ . (13)

Resolviendo para γ,γ = 1− σ

X̄. (14)

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 16/29

Page 17: Jose Villasenor Alva Sept 2011

Método combinado: caso γ < 0 (cont.)

Etapa 2: Máxima Verosimilitud

De la definición de la distribución PG(σ, γ), se tiene que 0 < x <σ

−γ, cuando

γ < 0.Entonces, el EMV de

σ

−γes X(n) = m«ax {X1,X2, ...,Xn}.

Un estimador σ̂ de σ es:σ̂ = −γX(n). (15)

Por lo tanto, sustituyendo σ̂ arriba por σ se tiene:

γ̃ =X̄

X̄ − X(n). (16)

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 17/29

Page 18: Jose Villasenor Alva Sept 2011

Prueba de bondad de ajuste para la distribuciónPareto generalizada

Con base en el parámetro de forma γ, se definen dos subclases dedistribuciones PG:

A+ = {todas las distribuciones PG con parámetro de forma γ ≥ 0}

y

A− = {todas las distribuciones PG con parámetro de forma γ < 0} .

La hipótesis H0 en (8) es equivalente a H0 : F ∈ A+ ∪ A−.

Se presenta una prueba de intersección-unión para H0 (Casella y Berger,1990), la cual considera una prueba para H+

0 : F ∈ A+ y una prueba paraH−0 : F ∈ A−.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 18/29

Page 19: Jose Villasenor Alva Sept 2011

Prueba para H+0 (γ ≥ 0)

Sea F (x) = 1− F (x). La definición de la distribución PG dada en (7) esequivalente a {

F (x ;σ, γ)}−γ

= 1 +γ

σx , σ > 0, γ ∈ <. (17)

Además, sumando −1 y tomando logaritmos en ambos lados de (17), se tiene

log((F (x ;σ, γ)

)−γ − 1) = log(γσ

)+ log(x), σ > 0, γ ∈ <. (18)

Por (17), bajo H0 se tiene una relación lineal entre Y =(F (X ;σ, γ)

)−γy X .

Además, por (18), existe una relación lineal entre las v.a.Y ∗ = log

((F (X ;σ, γ)

)−γ − 1)

y X ∗ = log(X ).

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 19/29

Page 20: Jose Villasenor Alva Sept 2011

Prueba para H+0 (γ ≥ 0) (cont.)

Sea Yi =(F n(Xi )

)−γ̂, i = 1,2, ...,n, donde Fn es la función de distribución

empírica de la m.a. y γ̂ = γ̂k es el estimador dado de Hill.

El coeficiente de correlación muestral de Xi y Yi , denotado como R1, es unestimador de la correlación lineal entre Y y X cuando 0 ≤ γ̂ < 0.5, donde

R1 =

∑nj=1

(Xj−

__X) (

Yj−__Y)

n√

S2X S2

Y

, (19)

donde__X , S2

X y__Y , S2

Y son la media y varianza muestrales de X1, ...,Xn yY1, ...,Yn.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 20/29

Page 21: Jose Villasenor Alva Sept 2011

Prueba para H+0 (γ ≥ 0) (cont.)

Sea X ∗i = log(Xi ) y Y ∗i = log((

F n(Xi ))−γ̂ − 1

), i = 1,2, ...,n. El coeficiente

de correlación muestral de Y ∗i y X ∗i , i = 1,2, ...,n, denotado como R2, es unestimador de la correlación lineal de Y ∗ y X ∗ cuando γ̂ ≥ 0.5.

Para probar H+0 , se propone la estadística de prueba:

R+ =

{R1, if 0 ≤ γ̂ < 0.5,R2, if γ̂ ≥ 0.5.

Bajo H0 se espera que el valor de R+ esté cerca de 1, entonces la pruebarechaza H+

0 si R+ < c+α donde c+

α es el cuantil del 100α% de la distribuciónde R+ bajo H+

0 .

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 21/29

Page 22: Jose Villasenor Alva Sept 2011

Prueba para H+0 (γ ≥ 0) (cont.)

Como la distibución nula de R+ depende de γ, usamos bootstrap paramétricopara aproximar el valor crítico c+

α como sigue.1 Calcular γ̂ con base en la m.a. y generar B muestras bootstrap de la

distribución PG(σ, γ) = (1, γ̂).2 Calcular el valor de R+ para cada muestra bootstrap.3 Sean R+

(j) los valores ordenados R+j , j = 1, ...,B.

4 c+α = R+

(αB).

Note que usamos σ = 1 ya que R+ es una estadística escala-invariante.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 22/29

Page 23: Jose Villasenor Alva Sept 2011

Prueba para H−0 (γ < 0)

Con base en la relación{F (x ;σ, γ)

}−γ= 1 +

γ

σx , σ > 0, γ ∈ <, (20)

una estadística de prueba para H−0 es el coeficiente de correlación muestral

de Xi y Zi =(F n(Xi )

)−γ̃, i = 1,2, ...,n, donde γ̃ es el estimador combinado.

Sea |R−| el valor absoluto del coeficiente de correlación muestral de Xi y Zi ,i = 1, ...,n.

Por lo tanto, se rechaza H−0 si |R−| < c−α donde c−α es el cuantil del 100α%de la distribución de |R−| bajo H−0 .

Para obtener c−α usamos bootstrap paramétrico.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 23/29

Page 24: Jose Villasenor Alva Sept 2011

Prueba de Intersección-Unión

Una prueba para la hipótesis

H0 : F es una distribución PG (21)

rechaza cuando ambas pruebas R+ y |R−| rechazan.

Para que la prueba sea de nivel α se requiere que cada una de las pruebasR+ y |R−| sea de tamaño α.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 24/29

Page 25: Jose Villasenor Alva Sept 2011

Tamaño estimado de la prueba, n = 50

γα -10 -5 -2 -1 0 1 2 5 10.05 .01 .01 .01 .01 .04 .04 .02 .02 .03.10 .03 .02 .02 .03 .09 .09 .05 .04 .08

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 25/29

Page 26: Jose Villasenor Alva Sept 2011

Potencia estimada de la prueba (α = 0.05)

Alternativa n = 50 n = 100Beta(1,2) .02 .03Beta(2,1) .11 .31Beta(5,5) .67 .97Weibull(2,1) .21 .54Weibull(3,1) .52 .90Gama(5,1) .40 .84Gama(8,1) .64 .94Gen-Gama(2,1/3) .87 1Gen-Gama(2,1/2) .61 .93Gen-Gama(1,1/2) .21 .54Abs(norm(2,2)) .04 .11Abs(norm(2,1)) .35 .76Abs(norm(3,1)) .70 .97Chisq(6) .15 .55Abs(Gumbel(5,2)) .41 .88Abs(Gumbel(5,5)) .85 .99

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 26/29

Page 27: Jose Villasenor Alva Sept 2011

Aplicación

Osterman (1993) (Reiss y Thomas, 2001) estudió un conjunto de datos quecontiene 135 registros en horas por semana de televidentes. La Tabla 1presenta los registros que exceden las 20 horas.

Tabla: Horas de TV / semana

20.00 20.00 20.00 20.50 20.50 22.00 22.00 22.00 23.00 23.00 23.00 23.9024.00 24.75 25.00 25.00 26.00 26.00 27.00 27.00 27.50 27.50 28.00 28.0028.50 29.00 29.50 30.00 31.50 33.00 37.00 40.00 45.00 49.00 63.00

Al aplicar la prueba propuesta, no se rechaza la hipótesis nula de ladistribución PG a un nivel de significancia del 10 % ya que R+ no rechazaH+

0 . Por lo tanto, los datos no presentan evidencia contra la hipótesis nulacuando γ ≥ 0. La estimación de γ es γ̆ = 0.5839.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 27/29

Page 28: Jose Villasenor Alva Sept 2011

Referencias

Anderson, T.W. y Darling, D.A. (1952). Asymptotic theory of certain”goodness of fit” criteria based on stochastic processes. Ann. Math.Statist., 23, 193-212.

Casella, G. y Berger, J. (1990). Statistical Inference. Brooks/Cole, USA.

Cox D. y Oakes D. (1984). Analysis of Survival Data. Chapman and Hall.USA.

Kolmogorov, A.N. (1933). Sulla determinasione empirica di una legge didistribuzione. Giornale dell Istituto Italiano degli Attuari, 4, 83-91.

Reiss, R.D. y Thomas, M. (2007). Statistical Analysis of ExtremeValues with Applications to Insurance, Finance, Hydrology and OtherFields. 3a Ed. Birkhäuser.

Stephens, M.A. (1977). Goodness of Fit for the Extreme ValueDistribution, Biometrika, 64, 583-588.

Shapiro, S.S. y Wilk, M. B. (1965). An analysis of variance test fornormality: complete samples. Biometrika, 52, No. 3/4, 591-611.

Wand M. 2010. SemiPar: Semiparametic Regression. R package version1.0-3. http://CRAN.R-project.org/package=SemiPar.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 28/29

Page 29: Jose Villasenor Alva Sept 2011

Referencias

Villaseñor, J.A. y González, E. 2009. A bootstrap goodness of fit test forthe generalized Pareto distribution. Comp. Stat. and Data Analysis, 53,3835-3841.

Villaseñor, J.A. y Pérez, P. 2010. On testing the skew normal hypothesis.J. of Statistical Planning and Inference, 140, 3148-3159.

Conferencia Bimestral de la AME Pruebas para distribuciones con parámetro de forma 29/29