Distribucion Chi Cuadrado

Click here to load reader

  • date post

    12-Jul-2016
  • Category

    Documents

  • view

    190
  • download

    2

Embed Size (px)

description

estadistica

Transcript of Distribucion Chi Cuadrado

Distribucin Chi -cuadrada

Distribucin Chi-cuadrada CCORIMANYA C. Jos CarlosHUAMAN A. Augusto Rolando

Resea histrica El famoso artculo de Karl Pearson sobre la distribucin Chi-cuadrada apareci en la primavera de 1900, lo que se puede considerar un inicio auspicioso a un magnfico siglo para el campo de la estadstica-B. Efron, The Statistical Century

Universidad nacional de ingeniera

introduccinCon la prctica podemos realizar suposiciones sobre el valor de algn parmetro estadstico. Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisin entre aceptar o rechazar la suposicin. Estos supuestos se denominan Hiptesis y el procedimiento para decidir si se aceptan o se rechazan se llama prueba de hiptesis o de significacin. Una prueba de hiptesis es una herramienta de anlisis de datos muy importante para la toma de decisiones, que puede en general formar parte de un experimento comparativo ms completo entre un supuesto y la realidad. Universidad nacional de ingeniera

Distribucin chi-cuadrado

Funcin de densidad

Con parmetro: grados de libertad

Funcin de Distribucin Acumulada

Universidad nacional de ingeniera

Distribucin chi-cuadradoTeoremas BsicosMedia ModaVarianzaCoeficiente de SimetraFuncin Generadora de Momentos paraFuncin CaractersticaTeoremas fundamentalesTeorema 1

Universidad nacional de ingeniera

Distribucin chi-cuadradoTeorema 2

Teorema 3

Universidad nacional de ingeniera

Distribucin chi-cuadradoGrafica

Universidad nacional de ingeniera

Aplicaciones principales1. Probar la supuesta independencia de dos variables cualitativas de una poblacin,

2. Hacer inferencias sobre ms de dos proporciones de una poblacin.

3. Hacer inferencias sobre la varianza de la poblacin.

4. Realizar pruebas de bondad de ajuste para evaluar la credibilidad de que los datos muestrales, vienen de una poblacin cuyos elementos se ajustan a un tipo especfico de distribucin de probabilidad.

Universidad nacional de ingeniera

Pruebas de independencia La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relacin entre dos variables categricas. Es necesario resaltar que esta prueba nos indica si existe o no una relacin entre las variables, pero no indica el grado o el tipo de relacin; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia. Universidad nacional de ingeniera

Pruebas de independencia Procedimiento para elaborar una prueba de independencia. 1. Obtener la frecuencia observada (F.O), proveniente de una encuesta, estudio o experimento. 2. Resumir los datos obtenidos, es decir, la frecuencia observada, en un cuadro de contingencia. 3. Calcular la frecuencia esperada (F.E), y se calcula con la siguiente formula: 4. Determinar el nivel de significancia (), y los grados de libertad, con la siguiente formula: 5. Plantear las hiptesis. H0: independencia H1: dependencia 6. Construir las reas de aceptacin y rechazo. 7. Calcular ji-Cuadrada

8. Tomar una decisin y emitir una conclusin en trminos del problema.

Universidad nacional de ingeniera

Pruebas de independencia Una agencia de publicidad desea saber si el gnero de los consumidores es independiente de sus preferencias de cuatro marcas de caf. La respuesta determinar si se deben disear diferentes anuncios dirigidos a los hombres y otros diferentes para las mujeres. Realice la prueba con un nivel de significanca del 5%.

1. Los resultados obtenidos de la encuesta realizada a 139 personas fue:

Universidad nacional de ingeniera

Pruebas de independencia 2. Elaboracin de la tabla de contingencia.

3. Calcular la Frecuencia Esperada.

Universidad nacional de ingeniera

4. Calcular los grados de libertad

5. Plantear las hiptesis. H0: La marca de caf que se consume es independiente del sexo de una persona. H1: La marca de caf que se consume depende del sexo de una persona. 6. Construccin de las reas de aceptacin y rechazo.

Pruebas de independencia Universidad nacional de ingeniera

Pruebas de independencia 7. Calculando ji-cuadrada.

8. Tomar una decisin y concluir.

* Aceptar Ho: Con un nivel de confianza del 5% se encontr que la marca de caf es independiente del sexo de la persona. Por lo que se recomienda elaborar un slo tipo de anuncio. Universidad nacional de ingeniera

PRUEBAS DE BONDAD Y AJUSTE La prueba de ji cuadrada tambin se puede utilizar para decidir si una distribucin de probabilidad, como la binomial, la de poisson o la normal, es la distribucin apropiada. De esta manera, estamos en condiciones de determinar la bondad y ajuste de una distribucin terica; en otras palabras, podemos precisar hasta que punto encaja en la distribucin de los datos que hemos observado. As pues podemos determinar si debemos creer que los datos observados constituyen una muestra extrada de la supuesta distribucin terica. Universidad nacional de ingeniera

PRUEBAS DE BONDAD Y AJUSTE Procedimiento para elaborar una prueba de bondad y ajuste. 1. Obtener la frecuencia observada (F.O), proveniente de una encuesta, estudio experimento. 2. Determinar la frecuencia esperada (F.E), 3. Establecer el nivel de significancia 4. Determinar los grados de libertad. De la siguiente manera: gl=K-1 5. Plantear las hiptesis H0: lo que se sostiene el supuesto valor del parmetro. H1: lo que contradice al supuesto valor del parmetro. 6. Construir las reas de aceptacin y rechazo.7. Calcular j-cuadrada

8. Tomar una decisin y emitir una conclusin, en trminos del problema.

Universidad nacional de ingeniera

PRUEBAS DE BONDAD Y AJUSTE Se cree que la duracin del sueo profundo de las personas se puede aproximar mediante una distribucin normal con media = 3.5 hrs. y desviacin estndar = 0.7 hrs. Probar la veracidad de esta idea con los siguientes datos tomados de una muestra de pacientes. Utilizar una significancia de 0.05.

Total de datos 40.

Universidad nacional de ingeniera

PRUEBAS DE BONDAD Y AJUSTE Primero visualizamos los datos en un histograma.

Aparentemente los datos siguen una distribucin normal.Prueba de hiptesis:H0; Los datos provienen de una distribucin normal.H1; Los datos no provienen de una distribucin normal.

Universidad nacional de ingeniera

PRUEBAS DE BONDAD Y AJUSTE En este ejemplo en particular se cuenta con la media y desviacin estndar de la poblacin, por lo que no se tienen que estimar. En caso de que no se tuvieran, se estimaran a partir de los datos agrupados, tomando en cuenta que para los grados de libertad el valor de m sera 2, ya que se estimaran la media y la desviacin estndar. Se proceder a calcular los valores de z para encontrar las probabilidades usando los lmites inferiores de los intervalos de clase:

La razn por la cual se comienza con el lmite de 1.95 y se termina con el lmite de 4.45, es porque la suma de todas las probabilidades debe ser 1, bajo la curva normal. A continuacin se muestra la curva normal con sus respectivas probabilidades, segn los limites reales.

Universidad nacional de ingeniera

PRUEBAS DE BONDAD Y AJUSTE Con estas probabilidades se calcularn los valores esperados, multiplicando cada probabilidad por 40 (el total).

Universidad nacional de ingeniera

PRUEBAS DE BONDAD Y AJUSTE Grados de libertad: k-1-m = 4-1-0 = 3

Regla de decisin:Si 27.815 no se rechaza Ho.Si 2>7.815 se rechaza Ho.

Justificacin y decisin:Como 3.06 no es mayor de 7.815, no se rechaza H0 y se concluye con= 0.05 que el ajuste de los datos a una distribucin normal es bueno.

Universidad nacional de ingeniera

en pruebas de desviacin estndar.La compaa de bateras Durams ha desarrollado una nueva batera para celulares. En promedio, la batera dura 60 minutos por carga. La desviacin estndar es de 4 minutos. Supongamos que el departamento de manufactura corre una prueba de control de calidad. Ellos seleccionan 7 bateras al azar. La desviacin estndar de las bateras seleccionadas es de 6 minutos. Qu valor de la estadstica chi-cuadrada tenemos para esta prueba?

SolucinBueno, empezamos con lo que sabemos:La desviacin estndar de la poblacin es de 4 minutos. La desviacin estndar de la muestra es de 6 minutos. El nmero de observaciones muestreadas es 7.

Universidad nacional de ingeniera

en pruebas de desviacin estndar.Para calcular la estadstica chi-cuadrada, usamos los valores en la ecuacin para .

donde es la estadstica chi-cuadrada, n el tamao de la muestra, s la desviacin estndar de la muestra, y la desviacin estndar de la poblacin.

Universidad nacional de ingeniera

en pruebas de desviacin estndar. Universidad nacional de ingeniera

Aplicacin en rEjemplo de una prueba de frecuencia Candidatos postulan para la Presidencia de la Republica. Segn los sondeos se tiene la siguientedistribucin:Candidatos A= 34 %, B = 28%, C=14% D=8% Otros 16%

Las categoras son (A, B, C, D y Otros)

Nivel de riesgo: 0.10Se hizo el estudio de una muestra en donde arrojo los siguientes resultados:Total de encuestados: 120Preferencias a los candidatos:A = 45, B=30, C=18, D=6 y otros = 2

Hp: La preferencia a los candidatos se mantiene.Ha: Hay cambios en la preferencia.

Universidad nacional de ingeniera

Desarrollo en rstudio# Valores tericosy