Prueba bondad de_ajuste

9
La prueba de bondad de ajuste Es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica, indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar. La fórmula que da el estadístico es la siguiente: O i = Valor observado en la i-ésimo dato. E i = Valor esperado en la i-ésimo dato. K = Categorías o celdas. m = Parámetros estimados sobre la base de los datos de la muestra Los grados de libertad vienen dados por : gl= K-m-1. Criterio de decisión es el siguiente: Se rechaza H 0 cuando . En caso contrario se acepta. Donde t representa el valor proporcionado por las tablas, según el nivel de significación elegido. Cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas distribuciones. Ejemplo: Si un ingeniero de control de calidad toma una muestra de 10 neumáticos que salen de una línea de ensamblaje y él desea verificar k i e e o i i i f f f 1 2 2

Transcript of Prueba bondad de_ajuste

Page 1: Prueba bondad de_ajuste

La prueba de bondad de ajuste Es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica, indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar.

La fórmula que da el estadístico es la siguiente:

Oi = Valor observado en la i-ésimo dato. Ei = Valor esperado en la i-ésimo dato. K = Categorías o celdas. m = Parámetros estimados sobre la base de los datos de la muestra

Los grados de libertad vienen dados por : gl= K-m-1.

Criterio de decisión es el siguiente:

Se rechaza H0 cuando . En caso contrario se acepta.

Donde t representa el valor proporcionado por las tablas, según el nivel de significación elegido.

Cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas distribuciones.

Ejemplo:

Si un ingeniero de control de calidad toma una muestra de 10 neumáticos que salen de una línea de ensamblaje y él desea verificar sobre la base de los datos que siguen, los números de llantas con defectos observadas en 200 días, si es cierto que el 5% de todos los neumáticos tienen defecto; es decir, si el muestrea una población binomial con n = 10 y p = 0.05  

k

i e

eo

i

ii

fff

1

22

Page 2: Prueba bondad de_ajuste

Establecer la hipótesis  

Ho: La población es binomialHa: La población no es binomial

 Establecer la estadística de prueba  

   Oi = Valor observado en la i-ésimo dato. Ei = Valor esperado en la i-ésimo dato. K = Categorías o celdas. m = Parámetros 

1. 3.      Definir el nivel de significancia y la zona de rechazo

g,l = k- m – 1 = (3 – 0- 1) =2 5.99  Nivel de significancia = 0.05

Zona de rechazo = { 22 / 5.99)

m = 0 porque no se necesito estimar ningún parámetro Calculamos el estadístico de prueba

 

Número de unidades con defecto Número de muestras0 1381 532 ó más 9

k

i e

eo

i

ii

fff

1

22

k

i e

eo

i

ii

fff

1

22

Page 3: Prueba bondad de_ajuste

Para poder calcular las frecuencias esperadas tenemos que calcular las probabilidades utilizaremos la formula de la binomial

 donde n = 10 p = 0.05  

0100100 )05.01(05.0)0( f = 0.599

  110110

1 )05.01(05.0)1( f = 0 .315 y la probabilidad de 2 ó más = 1.0 -0.599 -0 .315 = 0.086 Ahora ya podemos encontrar las frecuencias esperadas:200 (0.599) = 119.8 200(0.315) = 63 200 (0.086) = 17.2

  

Al aplicar la formula se tiene: 

2.17)2.179(

63)0.6353(

8.119)8.119138( 222

2

= 8.26   

Como 8.26 es mayor que 5.99, se rechaza la hipótesis nula con un nivel de significancia de 0.05.  

Conclusión Se concluye que el porcentaje verdadero de neumáticos con defecto no es el 5%.

Número de unidades con defecto Número de muestrasObservadas

ValorEsperado

0 138 119,81 53 632 ó más 9 17,2Total 200 200

Page 4: Prueba bondad de_ajuste

Ejemplo. Si el número de errores que comete una secretaria al transcribir un documento es una variable aleatoria que tiene una distribución de Poisson. Se reviso 440 transcripciones hechas por ella y arrojo los siguientes resultados:

                Variable = números de errores

Número de errores Frecuencia

0 18

1 53

2 103

3 107

4 82

5 46

6 18

7 10

8 2

9 1

    Probar si los datos de los errores se ajustan a una distribución de Poisson. Use = 0.05.

H0: La población se comporta como una distribución de PoissonHa: La población no se comporta como una distribución de Poisson.

El estadístico de prueba que usaremos es:

Nivel de significación = 0,05

gl. = 9-1-1=7

Page 5: Prueba bondad de_ajuste

Región de rechazo =

Para poder calcular las frecuencias esperadas tenemos que calcular las probabilidades utilizaremos la formula de la distribución de Poisson:

Como no se conoce la media de la distribución de Poisson la estimamos con la media de los datos, que es 3,04 luego, = 3,04

errores Frecuenciaobservada

Prob. Frecuencia esperada

0 18 0,0478 21,0321 53 0,1454 63,9762 103 0,2210 97,2403 107 0,2239 98,5164 82 0,1702 74,8885 46 0,1034 45,4966 18 0,0524 23,0567 ó mas 13 0,0359 15,796Total 440 1 440

Aplicamos los datos al estadístico de prueba

Como 6,7566 es menor 14,076 no se rechaza la hipótesis nula.

Conclusión: La población se comporta como una distribución de Poisson con media 3,04

Ejemplo 3.

El Departamento de Psicología, basándose en informaciones anteriores, al final del semestre antepasado, el 80% de los alumnos aprobaron todas las materias inscritas, un 10% aprobó la mitad, un 6% reprobó todas las materias y un 4% se retiro. Al final del semestre pasado el departamento selecciono a 400 alumnos, resultado 287 aprobaron todas las asignaturas, 49 aprobaron la mitad, 30 reprobaron todas las asignaturas y 34 se retiraron.¿Podemos concluir, a raíz de los resultados, que la información del semestre antepasado se ha vuelto a repetir el semestre pasado?

Page 6: Prueba bondad de_ajuste

Hipótesis nula: de que los porcentajes del semestre pasado son los mismos que en el semestre antepasado.

Atributos Datos observados Probabilidad Datos esperados

Aprobó todo 287 0,80 320

Aprobó la mitad 49 0,10 40

Reprobó todo 30 0,06 24

Se retiró 34 0,04 16

Total 400 1 400

2 = 27,178

Como tenemos 4 categorías y ningún parámetro estimado los grados de libertad serán: 4-0-1= 3

Como 27,178 es mayor que 12,84 se rechaza la hipótesis nula.

Conclusión: Los porcentajes no se repitieron el semestre pasado

Problema 4.-

Problema 5.-

Page 7: Prueba bondad de_ajuste