Distribución Chi cuadrado

27
Tema: Estadísticos no paramétricos Ji- Cuadrada Seminario de Estadística Aplicada a la Investigación Educacional

description

Como se debe de trabajar con el chi cuadrado parea estudios estadisticos

Transcript of Distribución Chi cuadrado

Page 1: Distribución Chi cuadrado

Tema: Estadísticos no paramétricos Ji-Cuadrada

Seminario de Estadística Aplicada a la Investigación Educacional

Page 2: Distribución Chi cuadrado

¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA NO PARAMÉTRICA?

Para realizar análisis no paramétricos, debe partirse de las siguientes consideraciones:

•La mayoría de estos análisis no requieren de supuestos acerca de la forma de la distribución poblacional. Aceptan distribuciones no normales.

•Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razón, pueden analizar datos nominales u ordinales.

•Si se quieren aplicar análisis no paramétrica a datos por intervalos o razón, éstos deben ser resumidos a categorías discretas (a unas cuantas). Las variables deben ser categorías.

Page 3: Distribución Chi cuadrado

¿CUÁLES SON LOS MÉTODOS O PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS?

1. La Chi-cuadrada o Ji-Cuadrada o X2.

2. Los coeficientes de correlación e independencia para tabulaciones cruzadas.

1. Los coeficientes de correlación por rangosordenados de Spearman y Kendall.

1. Prueba de U de Mann Whitney

2. Pruebas W de Wilcoxon

Las Pruebas no paramétricas más utilizadas son:

Page 4: Distribución Chi cuadrado

Distribución Ji-Cuadrada o Chi-cuadrada o X2?.

Es una prueba útil para variables categóricas y estadística, es aplicable cuando la variable nominal está compuesto por dos o más categorías. Tiene dos aplicaciones:

1. La prueba de bondad de ajuste Chi-cuadrada.

2. La prueba Chi-cuadrada de asociación.

Ambas pruebas se utilizan para determinar si las frecuencias observadas (O) en las categorías difieren significativamente de las frecuencias esperadas (E).

Page 5: Distribución Chi cuadrado

Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas.

Símbolo: X2

Hipótesis a probar:

Correlaciones

Variables involucradas:

Dos variables (la prueba Chi-cuadrada no considera relaciones causales).

Nivel de medición de las variables

Nominal u ordinal (o intervalos o razón reducidas a ordinales)

Procedimiento La Chi-cuadrada se calcula por medio de una tabla de contingencia o tabulación cruzada, que es una tabla de dos dimensiones y cada dimensión contiene una variable. A su vez, cada variable se subdivide en dos o más categorías.

Page 6: Distribución Chi cuadrado

Total de Fila x Total de ColumnaF. Esperada=

Total General

CARACTERÍSTICAS1. La Distribución X2 se lee con grados de libertad G.L = (Nº de

filas - 1)(Nº de columnas - 1).2. No tiene valores negativos. El valor mínimo es 0.3. Todas las curvas son asimétricas4. Cuando aumentan los grados de libertad las curvas son

menos elevadas y más extendidas a la derecha.5. Se utiliza para variables medidas en escala nominal u

ordinal.6. Las fórmulas son:

Page 7: Distribución Chi cuadrado

Ejemplo 1. Variable, categoría y tabla de contingencia 2x2: Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (“A” y “B”). La tabla de contingencia o tabulación cruzada es:

CANDIDATO

“A” “B”

MasculinoSEXO

Femenino

20 30

40 25

Page 8: Distribución Chi cuadrado

Variable

Categoría

CANDIDATO

“A” “B”

MasculinoSEXO

Femenino

20 30

40 25

Page 9: Distribución Chi cuadrado

Ejemplo 2. Estudio de Tabla de contingencia 3x2:

Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal.Variables:APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.

NIVEL DE EDUCACIÓN

Primaria Secundaria

APRENDIZAJEConceptual

Procedimental

Actitudinal

180 100

190 280

170 120

TABLA DE CONTINGENCIA

Page 10: Distribución Chi cuadrado

Tabla de frecuencias observadas (O):

NIVEL DE EDUCACIÓN TOTAL

Primaria Secundaria

APRENDIZAJEConceptual

Procedimental

Actitudinal

180 100 280

190 280 470

170 120 290

  TOTAL 540 500 1040

La Chi-cuadrada es una comparación entre las tablas de frecuencias observadas y la denominada tabla de frecuencias esperadas (la tabla que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas).

Page 11: Distribución Chi cuadrado

La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas:N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N.

NIVEL DE EDUCACIÓN

Marginal de filas

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

(280)(540)/1040

(280)(500)/1040

280

(470)(540)/1040

(470)( 500)/1040

470

(290)(540)/1040

(290)(500)/1040

290

marginal de columnas 540 500 1040

Tabla de frecuencias esperadas (E):

Page 12: Distribución Chi cuadrado

Frecuencia observada:

NIVEL DE EDUCACIÓN TOTAL

Primaria Secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

145,4 134,6 280

244,0 226,0 470

150,6 139,4 290

 TOTAL 540 500 1040

NIVEL DE EDUCACIÓN TOTAL

Primaria secundaria

APRENDIZAJE

Conceptual

Procedimental

Actitudinal

180 100 280

190 280 470

170 120 290

TOTAL 540 500 1040

Frecuencia esperada:

Donde:O: frecuencia observada en cada celdaE: frecuencia esperada

en cada celda

Page 13: Distribución Chi cuadrado

E

EOX

2

2

Celda O E O-E (O-E)2 (O-E)2 / E

Conceptual/Primaria 180 145,4 34,6 1197,16 8,23

Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11

Actitudinal / Primaria 170 150,6 19,4 376,36 2,50

Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69

Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80

Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70

X2 = 47,33

Para saber si el valor de X2 es o no significativo, debemos calcular los grados de libertad.

G.L. = (Nº de filas - 1)(Nº de columnas - 1).

Page 14: Distribución Chi cuadrado

Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2; entonces G.L. = (3-1)(2-1) = 2.

Luego, acudimos a la “tabla de distribución de Chi-cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó = 0,01).

Si el valor obtenido de X2 es igual o superior al valor de la “tabla”, decimos que las variables están relacionadas o no son independientes.

Aplicación:Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla es 5,9915 (ver tabla).

X2Obtenido

= 47,33X2

Crítico = 5,9915

Page 15: Distribución Chi cuadrado
Page 16: Distribución Chi cuadrado

Prueba de hipótesis:

H0: No existe relación entre el aprendizaje y los niveles de educación.

H1: Existe relación entre el aprendizaje y niveles de educación.

X2obtenido X2

crítico entonces variables no son

independientes; es decir existe una relación entre Aprendizaje y los niveles educativos

X2obtenido X2

crítico entonces se rechaza la hipótesis

nula (H0), y por lo tanto se acepta la hipótesis alterna (H1).

Page 17: Distribución Chi cuadrado

Establezca la Ho a ser probada; por ejemplo,Ho: 1 = 2 = 0,5

Especifique el nivel de significancia α, por ejemplo: α = 0.5

Haga una tabla de frecuencias obtenidasDeduzca las frecuencias esperadas a partir de Ho:Calcule el grado de libertad: Producto de (categorías - 1)Calcule el valor de X2 a partir de las frecuencias obtenidas y frecuencias esperadas.Mediante la tabla de X2 obtenga el valor teórico.Compara dichos valores.

Establezca la conclusión con respecto a Ho:Retenga Ho si valor de tabla > Valor calculado.Retenga Ho si valor de tabla < Valor calculado.

Paso Nº 1

Paso Nº 2

Paso Nº 3

Paso Nº 4

Page 18: Distribución Chi cuadrado

Un politólogo cree que, durante los últimos años, la composición étnica de la ciudad donde vive ha cambiado. Las cifras más actuales (reunidas hace unos cuántos años) muestran que los habitantes de dicha ciudad presentan la siguiente composición étnica: 53% noruegos, 32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar esta idea, este científico social obtiene una muestra aleatoria de 750 habitantes, con los resultados que se presentan en la siguiente tabla:

Países Noruegos Suecos Irlandeses Alemanes Italianos

frecuencia 399 193 63 82 13

a). ¿Cuál es la hipótesis nula?

b). ¿Cuál es la hipótesis alterna?

c). ¿Cuál es la conclusión?. Utilice = 0,05.

Ejercicio:

Page 19: Distribución Chi cuadrado

Una universidad está pensando en implantar uno de los tres sistemas de calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado; (2) todas las calificaciones están en el sistema 4.0 y (3) 90% de las calificaciones están en el sistema 4.0 y 10% son a probados-reprobado. Se realiza una encuesta para determinar si existe una relación entre el área de interés de cada alumno y su presencia para algún sistema de calificación. Se elige una muestra aleatoria de 200 estudiantes del área ingeniería, 200 de ciencias, y 100 de bellas artes. Se pregunta a cada alumno cuál de los tres calificaciones prefieren. Los resultados aparecen en la siguiente tabla:

Sistema de calificación

Aprobado-reprobado 4,0 4,0 y aprobado-reprobado

Bellas artes 26 55 19

Ciencias 24 118 58

Ingeniería 20 112 68

a). ¿Cuál es la hipótesis nula?

b). ¿Cuál es la hipótesis alterna?

c). ¿Cuál es la conclusión?. Utilice = 0,05.

Ejercicio:

Page 20: Distribución Chi cuadrado

Debido a la inflación galopante, el gobierno está considerando la imposición de un control de precios y salarios. Un economista del gobierno, interesado en determinar si existe una relación entre el empleo y la actitud hacia este control, reúne los siguientes datos. Los datos muestran, para cada tipo de empleo, el número de individuos en la muestra que están a favor o contra de los controles.

a). ¿Cuál es la hipótesis nula?

b). ¿Cuál es la hipótesis alterna?

c). ¿Cuál es la conclusión?. Utilice = 0,05.

Ejercicio:

Actitud hacia el control de precios y salarios

A favor En contra

Obreros 90 60

Empresarios 100 150

Profesionales 110 90

Page 21: Distribución Chi cuadrado

ENCUESTA

Se quiere estudiar la relación que existe entre el Sexo, Grado académico y el Ingreso familiar de los docentes de la Institución Educativa de la UGEL Nº 6.

Por favor responda cada ítem de la presente encuesta:

Sexo:( ) Femenino ( ) Masculino

Grado académico:( ) Bachiller ( ) Magíster( ) Doctor ( ) Otros

Ingreso familiar:( ) Menos o iguales de S/. 550( ) Mayor que S/. 550 y menor que S/. 800( ) Mayor que S/. 800 y menor que S/.1200.( ) Mayor que S/. 1200.

Page 22: Distribución Chi cuadrado

DEFINIR LA VARIABLES EN SPSS

Page 23: Distribución Chi cuadrado

Datos resultados de la encuesta

Page 24: Distribución Chi cuadrado

INGRESO DE DATOS

Page 25: Distribución Chi cuadrado

Cálculo de X2

Page 26: Distribución Chi cuadrado

Pruebas de chi-cuadrado de Pearson

3,600

3

,308

Chi-cuadrado

gl

Sig.

GradoSexo

Tabla de contingencia

2 3

2 0

2 1

2 0

Bachiller

Magister

Doctor

Otros

Grado

Femenino Masculino

Sexo

Page 27: Distribución Chi cuadrado

Cálculo Manual de Ji-Cuadrada