Download - Distribucion Chi Cuadrado

Transcript

Distribución

Chi-cuadrada

CCORIMANYA C. José CarlosHUAMAN A. Augusto Rolando

RESEÑA HISTÓRICA El famoso artículo de Karl Pearson

sobre la distribución Chi-cuadrada apareció en la primavera de 1900, lo que se puede considerar un inicio auspicioso a un magnífico siglo para el campo de la estadística-B. Efron, The Statistical Century

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

INTRODUCCIÓN Con la práctica podemos realizar suposiciones

sobre el valor de algún parámetro estadístico. Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la suposición.

Estos supuestos se denominan Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se llama prueba de hipótesis o de significación. Una prueba de hipótesis es una herramienta de análisis de datos muy importante para la toma de decisiones, que puede en general formar parte de un experimento comparativo más completo entre un supuesto y la realidad.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

DISTRIBUCIÓN CHI-CUADRADO Función de densidad

Con parámetro: grados de libertad

Función de Distribución Acumulada

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

DISTRIBUCIÓN CHI-CUADRADO Teoremas Básicos

• Media • Moda• Varianza• Coeficiente de Simetría• Función Generadora de Momentos para

• Función Característica Teoremas fundamentales

• Teorema 1

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

DISTRIBUCIÓN CHI-CUADRADO

• Teorema 2

• Teorema 3

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

DISTRIBUCIÓN CHI-CUADRADO Grafica

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

APLICACIONES PRINCIPALES 1. Probar la supuesta independencia de dos

variables cualitativas de una población,

2. Hacer inferencias sobre más de dos proporciones de una población.

3. Hacer inferencias sobre la varianza de la población.

4. Realizar pruebas de bondad de ajuste para evaluar la credibilidad de que los datos muestrales, vienen de una población cuyos elementos se ajustan a un tipo específico de distribución de probabilidad.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE INDEPENDENCIA La prueba de independencia Chi-

cuadrado, nos permite determinar si existe una relación entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE INDEPENDENCIA Procedimiento para elaborar una prueba de independencia. 1. Obtener la frecuencia observada (F.O), proveniente de una

encuesta, estudio o experimento. 2. Resumir los datos obtenidos, es decir, la frecuencia observada,

en un cuadro de contingencia. 3. Calcular la frecuencia esperada (F.E), y se calcula con la

siguiente formula: 4. Determinar el nivel de significancia (α), y los grados de libertad,

con la siguiente formula: 5. Plantear las hipótesis.

H0: independencia H1: dependencia

6. Construir las áreas de aceptación y rechazo. 7. Calcular ji-Cuadrada

8. Tomar una decisión y emitir una conclusión en términos del problema.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE INDEPENDENCIA Una agencia de publicidad desea saber si el género de los consumidores es independiente de sus preferencias de cuatro marcas de café. La respuesta determinará si se deben diseñar diferentes anuncios dirigidos a los hombres y otros diferentes para las mujeres. Realice la prueba con un nivel de significancía del 5%.

1. Los resultados obtenidos de la encuesta realizada a 139 personas fue:

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE INDEPENDENCIA 2. Elaboración de la tabla de contingencia.

3. Calcular la Frecuencia Esperada.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

4. Calcular los grados de libertad

5. Plantear las hipótesis. H0: La marca de café que se consume es

independiente del sexo de una persona. H1: La marca de café que se consume depende del

sexo de una persona. 6. Construcción de las áreas de aceptación y rechazo.

PRUEBAS DE INDEPENDENCIA

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE INDEPENDENCIA 7. Calculando ji-cuadrada.

8. Tomar una decisión y concluir.

* Aceptar Ho: Con un nivel de confianza del 5% se encontró que la marca de café es independiente del sexo de la persona. Por lo que se recomienda elaborar un sólo tipo de anuncio.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE BONDAD Y AJUSTE La prueba de ji cuadrada también se puede

utilizar para decidir si una distribución de probabilidad, como la binomial, la de poisson o la normal, es la distribución apropiada.

De esta manera, estamos en condiciones de determinar la bondad y ajuste de una distribución teórica; en otras palabras, podemos precisar hasta que punto encaja en la distribución de los datos que hemos observado. Así pues podemos determinar si debemos creer que los datos observados constituyen una muestra extraída de la supuesta distribución teórica.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE BONDAD Y AJUSTE Procedimiento para elaborar una prueba de bondad y ajuste. 1. Obtener la frecuencia observada (F.O), proveniente de una

encuesta, estudio ó experimento. 2. Determinar la frecuencia esperada (F.E), 3. Establecer el nivel de significancia 4. Determinar los grados de libertad. De la siguiente manera:

gl=K-1 5. Plantear las hipótesis

H0: lo que se sostiene el supuesto valor del parámetro. H1: lo que contradice al supuesto valor del parámetro.

6. Construir las áreas de aceptación y rechazo. 7. Calcular jí-cuadrada

8. Tomar una decisión y emitir una conclusión, en términos del problema.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE BONDAD Y AJUSTE Se cree que la duración del sueño profundo de las personas se puede aproximar mediante una distribución normal con media μ= 3.5 hrs. y desviación estándar σ= 0.7 hrs. Probar la veracidad de esta idea con los siguientes datos tomados de una muestra de pacientes. Utilizar una significancia de 0.05.

Total de datos 40.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE BONDAD Y AJUSTE Primero visualizamos los datos en un histograma.

Aparentemente los datos siguen una distribución normal.Prueba de hipótesis:H0; Los datos provienen de una distribución normal.H1; Los datos no provienen de una distribución normal.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE BONDAD Y AJUSTE En este ejemplo en particular se cuenta con la media y desviación estándar de la población, por lo que no se tienen que estimar. En caso de que no se tuvieran, se estimarían a partir de los datos agrupados, tomando en cuenta que para los grados de libertad el valor de m sería 2, ya que se estimarían la media y la desviación estándar. Se procederá a calcular los valores de z para encontrar las probabilidades usando los límites inferiores de los intervalos de clase:

La razón por la cual se comienza con el límite de 1.95 y se termina con el límite de 4.45, es porque la suma de todas las probabilidades debe ser 1, bajo la curva normal. A continuación se muestra la curva normal con sus respectivas probabilidades, según los limites reales.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE BONDAD Y AJUSTE

Con estas probabilidades se calcularán los valores esperados, multiplicando cada probabilidad por 40 (el total).

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

PRUEBAS DE BONDAD Y AJUSTE Grados de libertad: k-1-m = 4-1-0 = 3

Regla de decisión:Si χ2≤7.815 no se rechaza Ho.Si χ2>7.815 se rechaza Ho.

Justificación y decisión:Como 3.06 no es mayor de 7.815, no se rechaza H0 y se concluye conα= 0.05 que el ajuste de los datos a una distribución normal es bueno.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

EN PRUEBAS DE DESVIACIÓN ESTÁNDAR.La compañía de baterías Duramás ha desarrollado una nueva batería para celulares. En promedio, la batería dura 60 minutos por carga. La desviación estándar es de 4 minutos. Supongamos que el departamento de manufactura corre una prueba de control de calidad. Ellos seleccionan 7 baterías al azar. La desviación estándar de las baterías seleccionadas es de 6 minutos. ¿Qué valor de la estadística chi-cuadrada tenemos para esta prueba?

SoluciónBueno, empezamos con lo que sabemos:•La desviación estándar de la población es de 4 minutos. •La desviación estándar de la muestra es de 6 minutos. •El número de observaciones muestreadas es 7.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

EN PRUEBAS DE DESVIACIÓN ESTÁNDAR.Para calcular la estadística chi-cuadrada, usamos los valores en la ecuación para .

donde es la estadística chi-cuadrada, n el tamaño de la muestra, s la desviación estándar de la muestra, y σ la desviación estándar de la población.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

EN PRUEBAS DE DESVIACIÓN ESTÁNDAR.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

APLICACIÓN EN R Ejemplo de una prueba de frecuencia Candidatos postulan para la Presidencia de la Republica. Según los sondeos se tiene la siguientedistribución:Candidatos A= 34 %, B = 28%, C=14% D=8% Otros 16%

Las categorías son (A, B, C, D y Otros)

Nivel de riesgo: 0.10Se hizo el estudio de una muestra en donde arrojo los siguientes resultados:Total de encuestados: 120Preferencias a los candidatos:A = 45, B=30, C=18, D=6 y otros = 2

Hp: La preferencia a los candidatos se mantiene.Ha: Hay cambios en la preferencia.

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

Desarrollo en rstudio# Valores teóricosy<-c(A=34 , B=28, C=14, D=8, Otros= 16)# Valores de la muestrax<- c(A = 45, B=30, C=18, D=6, otros = 21)# Prueba estadisticachi.calculado <- chisq.test(x, p=y/sum(y) )# Valor critico para 0.10 y 4 gl.qchisq(1- 0.10 , 4)

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

UNIVERSIDA

D

NACIONAL DE

INGENIERÍA

FIECCS 2013-II …. GRACIAS!!!