CLASE Nº 6 - ESTADISTICA - Distribución Chi cuadrado

download CLASE Nº 6 - ESTADISTICA - Distribución Chi cuadrado

of 27

Transcript of CLASE Nº 6 - ESTADISTICA - Distribución Chi cuadrado

UNIVERSIDAD NACIONAL DE EDUCACIN ENRIQUE GUZMN Y VALLEAlma Mter del Magisterio Nacional

ESCUELA DE POSTGRADO SECCIN DE DOCTORADO

Curso: Seminario de Estadstica Aplicada a la Investigacin EducacionalTema: Estadsticos no paramtricos Ji-Cuadrada

Dr. Florencio Flores Ccanto

CULES SON LAS SUPOSICIONES DE LA ESTADSTICA NO PARAMTRICA? Para realizar anlisis no paramtricos, debe partirse de las siguientes consideraciones: La mayora de estos anlisis no requieren de supuestos acerca de la forma de la distribucin poblacional. Aceptan distribuciones no normales. Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razn, pueden analizar datos nominales u ordinales. Si se quieren aplicar anlisis no paramtrica a datos por intervalos o razn, stos deben ser resumidos a categoras discretas (a unas cuantas). Las variables deben ser categoras.

CULES SON LOS MTODOS O PRUEBAS PARAMTRICAS MS UTILIZADAS?

ESTADSTICAS

NO

Las Pruebas no paramtricas ms utilizadas son:

1. La Chi-cuadrada o Ji-Cuadrada o X2. 2. Los coeficientes de correlacin e independencia para tabulaciones cruzadas. 1. Los coeficientes de correlacin por rangos ordenados de Spearman y Kendall. 1. Prueba de U de Mann Whitney 2. Pruebas W de Wilcoxon

Distribucin Ji-Cuadrada o Chi-cuadrada o X2?.Es una prueba til para variables categricas y estadstica, es aplicable cuando la variable nominal est compuesto por dos o ms categoras. Tiene dos aplicaciones: 1. La prueba de bondad de ajuste Chi-cuadrada. 2. La prueba Chi-cuadrada de asociacin. Ambas pruebas se utilizan para determinar si las frecuencias observadas (O) en las categoras difieren significativamente de las frecuencias esperadas (E).

Es una prueba estadstica para evaluar hiptesis acerca de la relacin entre dos variables categricas.Smbolo: Hiptesis a probar: Variables involucradas: Nivel de medicin de las variables Procedimiento X2 Correlaciones Dos variables (la prueba Chi-cuadrada no considera relaciones causales). Nominal u ordinal (o intervalos o razn reducidas a ordinales) La Chi-cuadrada se calcula por medio de una tabla de contingencia o tabulacin cruzada, que es una tabla de dos dimensiones y cada dimensin contiene una variable. A su vez, cada variable se subdivide en dos o ms categoras.

CARACTERSTICAS 1. La Distribucin X2 se lee con grados de libertad G.L = (N de filas - 1)(N de columnas - 1). 2. No tiene valores negativos. El valor mnimo es 0. 3. Todas las curvas son asimtricas 4. Cuando aumentan los grados de libertad las curvas son menos elevadas y ms extendidas a la derecha. 5. Se utiliza para variables medidas en escala nominal u ordinal. 6. Las frmulas son:

Total de Fila x Total de Columna F. Esperada= Total General

Ejemplo 1. Variable, categora y tabla de contingencia 2x2: Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (A y B). La tabla de contingencia o tabulacin cruzada es: CANDIDATO A Masculino SEXO Femenino 40 25 20 B 30

Variable Categora

CANDIDATO A Masculino SEXO Femenino 40 25 20 B 30

Ejemplo 2. Estudio de Tabla de contingencia 3x2:

Se estudia a 1040 estudiantes de los niveles de educacin primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemtica, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal. Variables:APRENDIZAJE categoras: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIN categoras: Primaria, Secundaria.TABLA DE CONTINGENCIA

NIVEL DE EDUCACIN Primaria Conceptual APRENDIZAJE Procedimental Actitudinal 180 190 170 Secundaria 100 280 120

Tabla de frecuencias observadas (O):NIVEL DE EDUCACIN Primaria APRENDIZAJE Conceptual Procedimental Actitudinal TOTAL 180 190 170 540 Secundaria 100 280 120 500 280 470 290 1040 TOTAL

La Chi-cuadrada es una comparacin entre las tablas de frecuencias observadas y la denominada tabla de frecuencias esperadas (la tabla que esperaramos encontrar si las variables fueran estadsticamente independientes o no estuvieran relacionadas).

Tabla de frecuencias esperadas (E): La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente frmula aplicada a la tabla de frecuencias observadas: N = es el nmero total de frecuencias observadas. E = (marginal del regln)(marginal de columna) / N.NIVEL DE EDUCACIN PrimariaConceptual (280)(540)/1040 APRENDIZAJE Procedimental (470)(540)/1040 Actitudinal (290)(540)/1040marginal de columnas

Secundaria (280)(500)/1040 (470)( 500)/1040 (290)(500)/1040 500

Marginal de filas

280 470 290 1040

540

Frecuencia observada:NIVEL DE EDUCACIN Primaria APRENDI ZAJE Conceptual Procedimental Actitudinal TOTAL 180 190 170 540 secundaria 100 280 120 500 280 470 290 1040 TOTALDonde: O: frecuencia observada en cada celda E: frecuencia esperada en cada celda

Frecuencia esperada:NIVEL DE EDUCACIN Primaria Conceptual APRENDIZ AJE Procedimental Actitudinal TOTAL 145,4 244,0 150,6 540 Secundaria 134,6 226,0 139,4 500 280 470 290 1040 TOTAL

X2 !Celda Conceptual/Primaria Procedimental/ Primaria Actitudinal / Primaria Conceptual / Secundaria Procedimental /Secundaria Actitudinal / Secundaria O 180 190 170 100 280 120

O E 2 EE 145,4 244,4 150,6 134,6 226,0 139,4 O-E 34,6 -54,4 19,4 -34,6 54,0 -19,4 (O-E)2 1197,16 2959,36 376,36 1197,16 2916,00 376,36 X2 = (O-E)2 / E 8,23 12,11 2,50 8,69 12,80 2,70 47,33

Para saber si el valor de X2 es o no significativo, debemos calcular los grados de libertad. G.L. = (N de filas - 1)(N de columnas - 1).

Para el ejemplo: N de filas = 3 y G.L. = (3-1)(2-1) = 2.

N de columnas

= 2; entonces

Luego, acudimos a la tabla de distribucin de Chicuadrado, eligiendo nuestro nivel de confianza (E = 0,05 E = 0,01). Si el valor obtenido de X2 es igual o superior al valor de la tabla, decimos que las variables estn relacionadas o no son independientes. Aplicacin: Para el nivel de confianza de E=0,05 y g.l. = 2, el X2 de tabla es 5,9915 (ver tabla). X2Obtenido = 47,33 X2Crtico = 5,9915

Prueba de hiptesis: H 0: H 1: No existe relacin entre el aprendizaje y los niveles de educacin. Existe relacin entre el aprendizaje y niveles de educacin.

X2obtenido

entonces variables no son independientes; es decir existe una relacin entre Aprendizaje y los niveles educativos

u

X2crtico

X2obtenido

entonces se rechaza la hiptesis nula (H0), y por lo tanto se acepta la hiptesis alterna (H1).

u

X2crtico

Paso N 1

Establezca la Ho a ser probada; por ejemplo, Ho: Q1 = Q2 = 0,5 Especifique el nivel de significancia , por ejemplo: = 0.5

Paso N 2

Paso N 3

Haga una tabla de frecuencias obtenidas Deduzca las frecuencias esperadas a partir de Ho: Calcule el grado de libertad: Producto de (categoras - 1) Calcule el valor de X2 a partir de las frecuencias obtenidas y frecuencias esperadas. Mediante la tabla de X2 obtenga el valor terico. Compara dichos valores.

Paso N 4

Establezca la conclusin con respecto a Ho: Retenga Ho si valor de tabla > Valor calculado. Retenga Ho si valor de tabla < Valor calculado.

Ejercicio:

Un politlogo cree que, durante los ltimos aos, la composicin tnica de la ciudad donde vive ha cambiado. Las cifras ms actuales (reunidas hace unos cuntos aos) muestran que los habitantes de dicha ciudad presentan la siguiente composicin tnica: 53% noruegos, 32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar esta idea, este cientfico social obtiene una muestra aleatoria de 750 habitantes, con los resultados que se presentan en la siguiente tabla: Pases frecuencia Noruegos 399 Suecos 193 Irlandeses Alemanes 63 82 Italianos 13

a). Cul es la hiptesis nula? b). Cul es la hiptesis alterna? c). Cul es la conclusin?. Utilice E = 0,05.

Ejercicio: Una universidad est pensando en implantar uno de los tres sistemas de calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado; (2) todas las calificaciones estn en el sistema 4.0 y (3) 90% de las calificaciones estn en el sistema 4.0 y 10% son a probados-reprobado. Se realiza una encuesta para determinar si existe una relacin entre el rea de inters de cada alumno y su presencia para algn sistema de calificacin. Se elige una muestra aleatoria de 200 estudiantes del rea ingeniera, 200 de ciencias, y 100 de bellas artes. Se pregunta a cada alumno cul de los tres calificaciones prefieren. Los resultados aparecen en la siguiente tabla:Sistema de calificacinAprobado-reprobado 4,0 4,0 y aprobado-reprobado

Bellas artes Ciencias Ingeniera

26 24 20

55 118 112

19 58 68

a). Cul es la hiptesis nula? b). Cul es la hiptesis alterna? c). Cul es la conclusin?. Utilice E = 0,05.

Ejercicio: Debido a la inflacin galopante, el gobierno est considerando la imposicin de un control de precios y salarios. Un economista del gobierno, interesado en determinar si existe una relacin entre el empleo y la actitud hacia este control, rene los siguientes datos. Los datos muestran, para cada tipo de empleo, el nmero de individuos en la muestra que estn a favor o contra de los controles. Actitud hacia el control de precios y salarios A favor En contra Obreros Empresarios Profesionales 90 100 110 60 150 90

a). Cul es la hiptesis nula? b). Cul es la hiptesis alterna? c). Cul es la conclusin?. Utilice E = 0,05.

ENCUESTASe quiere estudiar la relacin que existe entre el Sexo, Grado acadmico y el Ingreso familiar de los docentes de la Institucin Educativa de la UGEL N 6. Por favor responda cada tem de la presente encuesta: Sexo: ( ) Femenino Grado acadmico: ( ) Bachiller ( ) Doctor ( ) Masculino ( ) Magster ( ) Otros

Ingreso familiar: ( ) Menos o iguales de S/. 550 ( ) Mayor que S/. 550 y menor que S/. 800 ( ) Mayor que S/. 800 y menor que S/.1200. ( ) Mayor que S/. 1200.

DEFINIR LA VARIABLES EN SPSS

Datos resultados de la encuesta

INGRESO DE DATOS

Clculo de X2

803, 3 006,3 oxeS

.giS lg odardauc-ihC

odarG

nosraeP ed odardauc-ihc ed sabeurP

0 1 0 3 onilucsaM

2 2 2 2 oninemeF

sortO rotcoD retsigaM rellihcaB

odarG

oxeS

Tabla de contingencia

Clculo Manual de Ji-Cuadrada