Introduccion a la metodologia bootstrap.ppt

28
Departament d’estadísticoa Grup d’estadísticoa Computacional Introducción a la metodología bootstrap Jordi Ocaña Departament d’estadísticoa Secció Departamental de Biologia Universitat de Barcelona

Transcript of Introduccion a la metodologia bootstrap.ppt

  • Puntos a tratarElementos de un problema de inferencia estadsticoaDeterminacin de la distribucin muestral (o de alguna de sus caractersticas)Principio plug-in y bootstrapPrincipio de Montecarlo y bootstrapNecesaria correspondencia entre mundo real y mundo bootstrapEjemplos

  • Elementos de un problema de inferencia estadstica

  • Elementos de un problema de I.E. Ejemplo introductorioMedimos la presin sanguinea sistlica de una muestra aleatoria de individuos de una poblacin

  • Distribucin exacta de la media muestralLlamemos G a la distribucin del estadstico , G = G(F(;m,s2),...)Bajo fuerte suposicin sobre la forma de F (normalidad), forma de G conocida de manera exacta: N(m,s2/n), para todo nDependiente de parmetros desconocidos: m,s2. En la prctica, aproximacin

  • Distribucin muestral exacta del estadstico tLlamemos H a la distribucin del estadstico t(X), H = H(F(;m,s2),...)Bajo fuerte suposicin sobre la forma de F (normalidad), conocida de forma exacta: t de Student con n - 1 g.d.llGracias al carcter pivotal de t(x), no depende de parmetros desconocidosPero que pasa bajo otras formas de F?

  • Distribucin muestral bajo condicions ms generalesSegn el Teorema Central del Lmite, si n grandeIgualmente, segn el T. C. L., es razonable la aproximacinn t N(0,1)Casos ms generales ms problemticos:

  • Esquema general de estas aproximacionesDeterminacin previa de la forma de la distribucin muestral, G(q,,...)=G(F(;q,),...)Ajuste de los parmetros de la distribucin muestral, G( , ,...)

  • Principio plug-in y bootstrap (en sentido amplio)Fijmonos en el paso G = G(F(;m,s2),...)Principio plug-inMetodologia bootstrap inferencia basada en el Principio plug-in

  • Ejemplo: aplicacin automtica del Principio plug-inA menudo es la distribucin emprica, Fn, discreta, que assigna probabilidad 1/n a cada valor muestral y 0 a cualquier otro Si interessa caracterstica concreta como Segn Principio plug-in:

  • Detalles del clculo anteriorConveniencia de notacin X* en lugar de X: no es la misma v.a

  • Dificultades en la aplicacin del Principio plug-inNo tan (o a veces nada) clara su aplicacin en situaciones ms complejas:otras caractersticas de la distribucin muestral, incluso para estadsticos sencillos como la media muestral (p.e. un cuantil, ...)otros estadsticos que no sean medias ni funciones senzilles de mediasdeterminacin de la distribucin muestral completa

  • El mtodo de Montecarlo

  • Bootstrap y Montecarlo

  • Qu estimamos a partir del Montecarlo bootstrap?

  • Validez de la aproximacin bootstrapResultado general (pero no muy til):Segn Leyes de los grandes nmeros, Fn(x) tiende (en diversos sentidos) hacia F(x). Extensible a funciones suficientemente suavesValidez: resultado sobre funcionales, funciones globales de Fn (u otras estimaciones) y de F: teoremas lmite sobre distancias entre distribucionesMs inters prctico: comparacin entre aproximacin bootstrap y otras, para n finito

  • Caractersticas generales de los ejemplos Modelo probabilstico subyacente conocidoNormal m = 15, s = 3, o bienExponencial a = 1/m = 1/15( distribucin muestral conocida)Anlisis de nica muestra (pequea, n = 10), generada segn uno u otro modelo.caso normal: 15.54, 21.06, 16.52, 13.62, 16.14, 10.98, 13.53, 16.02, 16.79, 15.90caso exponencial: 8.51, 8.71, 69.19, 10.05, 23.64, 8.67, 1.51, 20.36, 1.23, 5.27

  • Caractersticas generales de los ejemplosestadsticos: media muestral y taproximaciones: normal, bootstrap no paramtrico y bootstrap paramtricoaproximaciones bootstrap: estima kernel a partir de B = 1000 valores del estadstico (media o t, segn el caso)Cada uno de estos valores calculado sobre una remuestra de tamao n = 10

  • Media muestral, caso normal: n = 10, m = 15, s = 3

  • Media muestral, caso normal: Verdadera densidad, aprox normal, bootstrap no paramtrico y paramtrico

  • Media muestral, caso exponencial: a = 1/m = 1/15

  • Media muestral, exponencial: verdadera densidad, aprox normal, bootstrap no paramtrico y paramtrico

  • Estadstico t, caso normal: n = 10, m = 15, s = 3

  • Detalle y justificacin del proceso de remuestreo

  • Estadstico t, normal: verdadera densidad, aprox normal, bootstrap no paramtrico y paramtrico

  • Estadstico t, exponencial: n = 10, a = 1/m = 1/15

  • Estadstico t, exponencial: verdadera dens, aprox normal, boot no paramtrico y paramtrico

  • Caso exponencial, t, n = 40