Bondad de Ajuste

download Bondad de Ajuste

of 21

description

Estadistica

Transcript of Bondad de Ajuste

  • BONDAD DE AJUSTEIntegrantes: Fresia Lpez Jenny Reyes Natalia Ramos

  • TEMASLA PRUEBA DE BONDAD DE AJUSTE- EJEMPLOS

    PRUEBA CHICUADRADO PARA LA BONDAD DE AJUSTE- EJEMPLOS

  • LA PRUEBA DE BONDAD DE AJUSTE

    Es considerada como una prueba no paramtrica que mide la discrepancia entre una distribucin observada y otra terica, indicando en qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar.

    La frmula que da el estadstico es la siguiente:

    Donde: Oi = Valor observado en la i-simo dato. Ei = Valor esperado en la i-simo dato. K =Categoras o celdas.m = Parmetros estimados sobre la base de los datos de la muestra

  • Los grados de libertad vienen dados por: gl= K-m-1. Criterio de decisin es el siguiente: - Se rechaza H0 cuando . En caso contrario se acepta.- Cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn ambas distribuciones.

  • EJEMPLOS:

    1- Si un ingeniero de control de calidad toma una muestra de 10 neumticos que salen de una lnea de ensamblaje y l desea verificar sobre la base de los datos que siguen, los nmeros de llantas con defectos observadas en 200 das, si es cierto que el 5% de todos los neumticos tienen defecto; es decir, si el muestrea una poblacin binomial con n = 10 y p = 0.05

    Nmero de unidades con defecto.Nmero de muestras.01381532 o ms9

  • Establecer la hiptesis Ho: La poblacin es binomialHa: La poblacin no es binomial

    Establecer la estadstica de prueba

    Definir el nivel de significancia y la zona de rechazo

    - Donde: Oi = Valor observado en la i-simo dato. Ei = Valor esperado en la i-simo dato. K = Categoras o celdas. m = Parmetros5.99g,l = k- m 1 = (3 0- 1) =2

  • Nivel de significancia = 0.05Zona de rechazo = { 5.9m = 0 porque no se necesito estimar ningn parmetro.

    Calculamos el estadstico de prueba

    Para poder calcular las frecuencias esperadas tenemos que calcular las probabilidades utilizaremos la formula de la binomial.

    - Donde: n = 10 p = 0.05

    y la probabilidad de 2 ms = 1.0 -0.599 -0 .315 = 0.086

    =0.599= 0.315

  • Ahora ya podemos encontrar las frecuencias esperadas:200 (0.599) = 119.8 200(0.315) = 63 200 (0.086) = 17.2

    Al aplicar la siguiente frmula se tiene:

    = 8.26Como 8.26 es mayor que 5.99, se rechaza la hiptesis nula con un nivel de significancia de 0.05. Conclusin :- Se concluye que el porcentaje verdadero de neumticos con defecto no es el 5%.

    Nmero de unidades con defectoNmero de muestrasObservadasValorEsperado0138119,8153632 ms917,2Total200200

  • Si el nmero de errores que comete una secretaria al transcribir un documento es una variable aleatoria que tiene una distribucin de Poisson. Se reviso 440 transcripciones hechas por ella y arrojo los siguientes resultados:

    Variable = nmero de errores.

    Probar si los datos de los errores se ajustan a una distribucin de Poisson. Use = 0.05.

    Nmero de erroresFrecuencia018153210331074825466187108291

  • Establecer las hiptesis:H0: La poblacin se comporta como una distribucin de Poisson.Ha: La poblacin no se comporta como una distribucin de Poisson.

    El estadstico de prueba que usaremos es:

    Nivel de significacin = 0,05gl. = 9-1-1=7

    Regin de rechazo =

  • Para poder calcular las frecuencias esperadas tenemos que calcular las probabilidades utilizaremos la formula de la distribucin de Poisson:

    Como no se conoce la media de la distribucin de Poisson la estimamos con la media de los datos, que es 3,04 luego, = 3,04

    ErroresFrecuenciaobservadaProb. Frecuencia esperada0180,047821,0321530,145463,97621030,221097,24031070,223998,5164820,170274,8885460,103445,4966180,052423,0567 mas130,035915,796Total4401440

  • Aplicamos los datos al estadstico de prueba

    Como 5,7566 es menor 14,076 no se rechaza la hiptesis nula.

    Conclusin: - La poblacin se comporta como una distribucin de Poisson con media 3,04

  • El Departamento de Psicologa, basndose en informaciones anteriores, al final del semestre antepasado, el 80% de los alumnos aprobaron todas las materias inscritas, un 10% aprob la mitad, un 6% reprob todas las materias y un 4% se retiro. Al final del semestre pasado el departamento selecciono a 400 alumnos, resultado 287 aprobaron todas las asignaturas, 49 aprobaron la mitad, 30 reprobaron todas las asignaturas y 34 se retiraron. Podemos concluir, a raz de los resultados, que la informacin del semestre antepasado se ha vuelto a repetir el semestre pasado?

    Hiptesis nula: de que los porcentajes del semestre pasado son los mismos que en el semestre antepasado.

    AtributosDatos observadosProbabilidadDatos esperadosAprob todo2870,80320Aprob la mitad490,1040Reprob todo300,0624Se retir340,0416Total4001400

  • 2 = 27,178

    Como tenemos 4 categoras y ningn parmetro estimado los grados de libertad sern: 4-0-1= 3

    Como 27,178 es mayor que 12,84 se rechaza la hiptesis nula.

    Conclusin: - Los porcentajes no se repitieron el semestre pasado

    TEMAS

  • PRUEBA CHI-CUADRADO PARA LA BONDAD DE AJUSTEEsta prueba es aplicable para variables aleatorias discretas o continuas

    Sea una muestra aleatoria de tamao n tomada de una poblacin con una distribucin especificada f0(x) que es de inters verificar.

    Suponer que las observaciones de la muestra estn agrupadas en k clases, siendo ni la cantidad de observaciones en cada clase i = 1, 2, ..., k

    Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i.

  • Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que segn el modelo especificado deberan estar incluidos en la clase i:ei = pi n,i = 1, 2, ..., nTenemos entonces dos valores de frecuencia para cada clase i ni:frecuencia observada (corresponde a los datos de la muestra)ei:frecuencia esperada (corresponde al modelo propuesto)La teora estadstica demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste:Definicin:Estadstico para la prueba de bondad de ajuste Ji-cuadrado2 = , distribucin Ji-cuadrado con =k1 grados de libertad Es una condicin necesaria para aplicar esta prueba que i(ei5) .

  • Dado un nivel de significancia se define un valor crtico para el rechazo de la hiptesis propuesta Ho: f(x) = f0(x).

    Si el las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas con el modelo propuesto, entonces el valor de estadstico de prueba 2 ser cercano a cero, pero si estas diferencias son significativas, entonces el valor del estadstico 2 estar en la regin de rechazo de Ho: 2 >

    Regin de rechazo de Ho

  • EJEMPLOS:1- Se ha tomado una muestra aleatoria de 40 bateras y se ha registrado su duracin en aos. Estos resultados se los ha agrupado en 7 clases en el siguiente cuadro:

    iClase (duracin)Frecuencia observada (ni)11.45 - 1.95221.95 - 2.45132.45 - 2.95442.95 - 3.451553.45 - 3.951063-95 - 4.45574.45 - 4.953

  • Solucin:

    Sea X: duracin en aos (variable aleatoria continua)Ho:f(x) = N(3.5, 0.7) (distribucin normal, =3.5, =0.7) Ha: H0 = 0.05

    Clculo de la probabilidad correspondiente a cada intervalop1 = P(X1.95) = P(Z(1.95 3.5)/0.7) = 0.0136 p2 = P(1.95X2.45) = P((1.95 3.5)/0.7 Z (2.45 3.5)/0.7) = 0.0532 p3 = P(2.45X2.95) = P((2.45 3.5)/0.7 Z (2.95 3.5)/0.7) = 0.135... (etc)Clculo de las frecuencias esperadase1 = p1 n = 0.0136 (40) 0.5e2 = p2 n = 0.0532 (40) 2.1e3 = p3 n = 0.135 (40) 5.4... (etc)

  • Resumen de resultados:

    Es necesario que se cumpla la condicin i(ei5) por lo que se deben agrupar clases adyacentes. Como resultado se tienen cuatro clases k=4

    Ahora se puede definir la regin de rechazo de Ho = 0.05, = k 1 = 3, = 7.815Rechazar Ho si 2 > 7.815

    Tabla 2

    Duracin (aos)Frecuencia observada (ni)Frecuencia esperada (ei)1.45 - 2.9578.52.95 - 3.451510.33.45 - 3.951010.73.95 - 4.95810.5

  • Clculo del estadstico de prueba 2 = = = 3.05

    DecisinComo 3.05 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la poblacin.

    TEMAS

    ******************Clculo de las frecuencias esperadase1 = p1 n = 0.0136 ***