Download - prueba Ji Cuadrado

Transcript
Page 1: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 1/47

SEMANA 11

Page 2: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 2/47

Pruebas de Ji Cuadrada 

Page 3: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 3/47

Objetivos 

Al término de este capítulo podrá usted:

• Explicar la diferencia entre la prueba de independencia y

la prueba de bondad de ajuste.

• Calcular las frecuencias esperadas y el estadístico Ji

Cuadrada.

• Aplicar tablas de contingencia a un problema de toma de

decisiones.• Aplicar la prueba de bondad de ajuste a un problema de

toma de decisiones.

Page 4: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 4/47

Introducción 

En los capítulos anteriores, se construyeron pruebas de

hipótesis sobre medias o proporciones de una población para una o dos muestras. Se supuso para estas pruebas

que la población que se muestrea sigue una distribución

normal. Las pruebas manejaron datos de escalas de

intervalo, como alturas, edades e ingresos.

Page 5: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 5/47

Existen algunas situaciones en las que los datos no se

miden en escalas de intervalos o de razón, sino son

nominales u ordinales. En estos casos, no se puedenhacer suposiciones sobre la forma de la población. Este

capítulo introducirá las pruebas de Ji Cuadrada que

cubren algunas de estas situaciones.

Page 6: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 6/47

 

La prueba con tablas de contingencia   está diseñada para

determinar si dos variables categóricas están relacionadas. En

ocasiones se la denomina prueba de independencia , ya que lahipótesis nula que se prueba establece que dos variables

categóricas son independientes.  Esta prueba es bastante útil

 porque con frecuencia el analista está interesado en averiguar si

una variable categórica se relaciona con otra.

Pruebas con Tablas de Contingencia

Page 7: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 7/47

La prueba con tablas de contingencia  

determina si dos variables categóricas se

relacionan entre sí.

Page 8: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 8/47

Los datos necesarios para la prueba con tablas decontingencia consisten en medidas muestrales sobre

dos variables categóricas (con escala nominal u

ordinal). Estos datos se arreglan en una tabla, que

 permite al analista ver una exposición de los datos

recogidos. Algunas veces se hace referencia a este

tipo de tabla como una tabla de clasificación

cruzada o simplemente tabla cruzada .

Page 9: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 9/47

H 1 : las variables en las filas y las columnas son dependientes

Las hipótesis nula y alternativa entre las que el analista debe

elegir después de examinar los datos de la muestra son:

H 0 :  las variables en las filas y las columnas son

independientes

Page 10: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 10/47

La prueba con tablas de contingencia se usa

frecuentemente para analizar aspectos

importantes de los datos investigados. En

general, las encuestas contienen preguntasdiseñadas para medir cierto tipo de

características demográficas de la muestra (por

ejemplo, categoría de edad, sexo, nivel de

ingreso, estado civil y nivel educativo).

Page 11: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 11/47

Otro tipo de pregunta que muchas veces se

encuentra en un instrumento de investigaciónresalta las actitudes y opiniones de los

encuestados.

Page 12: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 12/47

Muchas pruebas con tablas de contingencia

comparan una variable demográfica con una variable

de actitud. Por ejemplo, la variable hombre/mujer

 puede ponerse en una tabla cruzada con la jerarquización de los precios en algunas tiendas, o

 bien, las categorías de edades se pueden tabular con

la respuesta a una afirmación sobre un candidato

 presidencial.

Page 13: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 13/47

El propósito de tales pruebas es determinar si

distintos tipos poblaciones, definidos por las preguntas demográficas, tienen diferentes actitudes

respecto a los temas investigados.

Page 14: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 14/47

Ejemplo  

Un artículo publicado en una revista especializada acerca de

encuestas afirmó: “En temas sensibles, las personas tienden a

dar respuestas aceptables  en lugar de respuestas honestas; susrespuestas pueden depender   del género o la raza del

entrevistador”.

Page 15: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 15/47

Para sustentar dicha aseveración una empresa

encuestadora proporcionó los datos de una encuesta

en la cual se preguntó a hombres si estaban de

acuerdo con esta afirmación: “El aborto es un asunto privado que la mujer debe decidir, sin intervención

gubernamental”. Analizaremos el efecto del género

sólo en hombres que se encuestaron y la tabla que se

muestra a continuación se basa en tales datos:

Page 16: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 16/47

Género del entrevistador 

Hombre  Mujer   Total 

Hombres que están de acuerdo  560  308  868 

Hombres que están en desacuerdo  240  92  332 

Total 

800 

400 

1200 

Page 17: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 17/47

Suponga que la encuesta se diseñó de manera que los

entrevistadores hombres recibieron instrucciones

 para obtener 800 respuestas de sujetos hombres; en

tanto que las entrevistadoras mujeres recibieron

instrucciones para obtener 400 respuestas de sujetos

hombres. Utilice un nivel de significancia de 0.05 y

 prueba la aseveración de que las proporciones de las

respuestas de acuerdo/desacuerdo son las mismas

 para los sujetos que entrevistaron hombres y lossujetos que entrevistaron mujeres.

Page 18: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 18/47

Solución  

H1: Las proporciones son diferentes.

Puesto que tenemos dos poblaciones separadas (sujetos queentrevistaron hombres y sujetos que entrevistaron mujeres),

 probamos la homogeneidad con estas hipótesis:

H0: Las proporciones de las respuestas acuerdo/desacuerdo soniguales para los sujetos que entrevistaron hombres y los sujetos

que entrevistaron mujeres.

Page 19: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 19/47

  Hombres Mujeres Total

1 560 308 868*578,67 289,33

0,602 1,204

2 240 92 332

221,33 110,67

1,574 3,149

Total 800 400 1200

Chi-Sq = 6,529. DF = 1. P-Value = 0,011

Page 20: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 20/47

Valor crítico: = 3.84146 

Por tanto rechazamos la hipótesis nula de proporciones

iguales (homogéneas); puesto que el estadístico de prueba

(6.5239) es mayor que el punto crítico (3.84146). Hay

suficiente evidencia para sustentar el rechazo de laaseveración de que las proporciones son las mismas. Parece

que la respuesta y el género del entrevistador son

dependientes . Aunque tal análisis estadístico no puede

utilizarse para justificar ninguna afirmación acerca de la

causalidad, quizá a los hombres los influyó el género delentrevistador.

Page 21: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 21/47

Cálculo de las frecuencias esperadas

Para calcular las frecuencias esperadas para una celda en particular, se multiplica el total

de la fila por el total de la columna y luego se divide este producto entre el tamaño total

de la muestra. Por ejemplo, para la celda con *:

Page 22: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 22/47

Una regla muy común que se usa

ampliamente para esta prueba establece que

cada frecuencia esperada en una tabla decontingencia debe ser 5 o más para que la

exactitud de la prueba sea buena.

Page 23: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 23/47

Ahora se necesita un estadístico de prueba que

compare las frecuencias observadas con las

esperadas para cada celda de la tabla. Si lasfrecuencias observadas son bastante cercanas a las

frecuencias esperadas, el estadístico debe indicar que

no se rechaza la hipótesis nula de independencia.

Page 24: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 24/47

Esta es la conclusión apropiada, ya que las

frecuencias esperadas se calculan bajo la suposición

de que las dos variables categóricas sonindependientes. Si las frecuencias esperadas y las

observadas son diferentes, el estadístico de prueba

conducirá al rechazo de la hipótesis nula.

Page 25: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 25/47

Si la hipótesis nula es cierta, la distribución de

este valor calculado se aproxima a la distribución ji cuadrada. De hecho, la ji cuadrada es una

familia de distribuciones de probabilidad.

Estadístico Ji Cuadrada

Page 26: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 26/47

 

Igual que en el caso de la distribución t , la

distribución de probabilidad ji cuadrada se

caracteriza por un solo parámetro, los grados delibertad. La distribución tiene sesgo positivo, pero

conforme los grados de libertad crecen, se acerca

a la forma de la distribución normal. Se calcula

mediante la siguiente fórmula:

Page 27: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 27/47

 

donde:

f 0  = frecuencia observada

f e  = frecuencia esperada

Page 28: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 28/47

Observe que la comparación entre las

frecuencias esperadas y observadas para cada

celda se hace en el numerador. Si existe una

diferencia grande de una celda a otra, se obtieneun estadístico grande; las diferencias pequeñas

 producen un estadístico pequeño. Entonces la

 prueba de hipótesis con tablas de contingencia es

una prueba de una cola hacia la derecha.

Page 29: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 29/47

Los grados de libertad, se obtiene utilizando la siguiente

fórmula:

gl = (r  –  1) (c  –  1)  

donde:

r  = número de filas

c  = número de columnas

Cálculo de los grados de libertad

Page 30: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 30/47

 

La tabla de contingencia mide el “ajuste”   de las

frecuencias observadas a aquellas frecuencias

esperadas bajo la suposición de que la hipótesis

nula es cierta.

Prueba de Bondad de Ajuste

Page 31: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 31/47

 

Una aplicación más general de este procedimiento

es la prueba de bondad de ajuste , que determina si

las frecuencias observadas para alguna variablecategórica pudieron haber sido obtenidas de una

distribución poblacional hipotética.

Page 32: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 32/47

H 1 :   la muestra no procede de la población

especificada

Las hipótesis nula y alternativa entre las que debe

elegir el analista después de examinar los datosmuestrales son:

H 0 :  la muestra procede de la población especificada

Page 33: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 33/47

La prueba de bondad de ajuste  determina

la probabilidad de que las frecuencias

observadas para una variable categórica pudieran haberse obtenido de una

 población hipotética.

Page 34: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 34/47

Al usar la tabla de ji cuadrada para encontrar el

valor crítico, deben determinarse los grados de

libertad. Para la prueba de bondad de ajuste, este

número se calcula mediante la siguiente ecuación:

gl = k  –  1  –  c  

Page 35: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 35/47

donde:

k = número de categorías

c   = número de parámetros poblacionales

desconocidos estimados por estadísticosmuestrales.

Page 36: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 36/47

Observe que siempre se pierde un grado de libertad

debido a que las frecuencias esperadas deben sumar

el número total de frecuencias observadas. Otros

grados de libertad se pierden siempre que se usan

estadísticos muestrales para estimar parámetros.

Page 37: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 37/47

El estadístico de prueba usado para comparar los tamaños

relativos de las frecuencias esperadas y observadas tiene una

distribución aproximada a la ji cuadrada. La distribución de

este estadístico de prueba es en realidad discreta, pero puedeaproximarse usando una distribución ji cuadrada continua

cuando el tamaño de la muestra n  es grande. La distribución

discreta del estadístico de prueba X 2  se aproxima usando una

distribución ji cuadrada continua.

Regla del Cinco

Page 38: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 38/47

 

Para asegurar que n   es suficientemente grande, la

regla conservadora es requerir que la frecuencia

esperada para cada celda sea al menos 5. Si la

frecuencia esperada de una celda es menor que 5, las

celdas deben combinarse de manera que resulten

categorías con mayores frecuencias esperadas.

Page 39: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 39/47

Ejemplo

A un nivel de significancia de 0.01, ¿es razonable suponer que la demanda horaria de un

servicio de cierto tipo en un gran banco está adecuadamente descrito por una

distribución de Poisson con   = 1, si en una muestra aleatoria de 1,000 horas hubo 355,

362, 190, 65, 22 y 6 horas con 0, 1, 2, 3, 4 y al menos 5 de estas demandas,

respectivamente?

Page 40: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 40/47

Mediante la tabla de distribución de Poisson, anotamos las

 probabilidades correspondientes a cada clase y luegocalculamos las frecuencias esperadas:

Solución  

Page 41: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 41/47

Demanda  f o (horas)  Probabilidad de

Poisson 

f e 

0  355  0.3679  0.3679*1000 = 367.9 

362 

0.3679 

0.3679*1000 = 367.9 

190 

0.1839 

0.1839*1000 = 183.9 

65 

0.0613 

0.0613*1000 = 61.3 

4  22  0.0153 

0.0153*1000 = 15.3 

5 a más  6  1 - 0.9963 = 0.0037  0.0037*1000 = 3.7 

n  = 1000

Page 42: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 42/47

Combinamos las dos últimas clases que están en la

tabla de modo que todas las frecuencias esperadas

sean mayores a 5, entonces reorganizando obtenemos

las siguientes categorías:

Page 43: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 43/47

Categoría 

f o (horas) 

f e 

355 

367.9 

362 

367.9 

2  190  183.9 

3  65  61.3 

4 a más  28  19.0 

Page 44: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 44/47

 Grados de libertad: 5-1= 4

Planteamos las hipótesis:

H0: La población sigue una distribución de Poisson.

H1: La población no sigue una distribución de

Poisson.

El valor crítico de la prueba de ji cuadrada es:

Page 45: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 45/47

2=13.277 

Page 46: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 46/47

Regla de rechazo: rechazar H0 si  X 2

 > 13.277

Page 47: prueba Ji Cuadrado

7/21/2019 prueba Ji Cuadrado

http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 47/47

Entonces mediante la formula calculamos el valor de X 2

:

2.519

1928

3.61

3.6165

9.183

9.183190

9.367

9.367362

9.367

9.36735522222

2

2

2

 X 

 f 

 f  f  X 

e

eo

 

Por tanto no se puede rechazar H0, es decir los datos de la población siguen una

distribución de Poisson..