Download - Semana 04-Prueba Chicuadrado

Transcript
  • Lic. Segundo A. Garca Flores

    ESTADSTICA PARA NEGOCIOS II

    Mdulo: II Unidad: II Semana: 04

  • TTULO DEL TEMA

    PRUEBA NO PARAMTRICAS

  • ORIENTACIONES

    Lea las previamente las orientaciones

    generales del curso.

    Revise los temas afines a este en la

    Biblioteca Virtual de la UAP

    Participe de los foros

  • Chi cuadrado

    Caracterstica de la chi cuadrado

    Hiptesis

    CONTENIDOS TEMTICOS

  • DESARROLLO DE CONTENIDOS - SUBTTULOS

    DEL TEMA

  • Test de hiptesis

    Paramtricos: hiptesis sobre los

    parmetros que definen la poblacin

    (por ej., pobl. Normales, y tests sobre

    la media o la desv. tpica).

    No paramtricos: no se refieren a

    parmetros de la poblacin; se

    aplican tpicamente cuando no

    conocemos la distribucin de la

    poblacin, o cuando su distribucin

    es no normal.

  • 7 Para realizar anlisis no paramtricos, debe partirse de las siguientes

    consideraciones:

    La mayora de estos anlisis no requieren de supuestos acerca de la

    forma de la distribucin poblacional. Aceptan distribuciones no

    normales.

    Las variables no necesariamente deben estar medidas en un nivel por

    intervalo o de razn, pueden analizar datos nominales u ordinales.

    Si se quieren aplicar anlisis no paramtrica a datos por intervalos o

    razn, stos deben ser resumidos a categoras discretas (a unas

    cuantas). Las variables deben ser categoras.

    CULES SON LAS SUPOSICIONES DE LA

    ESTADSTICA NO PARAMTRICA?

  • 81) La Chi-cuadrada o Ji-Cuadrada o X2.

    2) Los coeficientes de correlacin e independencia

    para tabulaciones cruzadas.

    3) Los coeficientes de correlacin por rangos

    ordenados de Spearman y Kendall.

    4) Prueba de U de Mann Whitney

    5) Pruebas W de Wilcoxon

    CULES SON LOS MTODOS O PRUEBAS

    ESTADSTICAS NO PARAMTRICAS MS UTILIZADAS?

    Las Pruebas no paramtricas ms utilizadas son:

  • Distribucin Ji-Cuadrada o Chi-cuadrada o X2

  • 10

    Es una prueba til para variables categricas y

    estadstica, es aplicable cuando la variable nominal est

    compuesto por dos o ms categoras. Tiene dos

    aplicaciones:

    1. La prueba de bondad de ajuste Chi-cuadrada.

    2. La prueba Chi-cuadrada de asociacin.

    3. Prueba de homogeneidad

    Distribucin Ji-Cuadrada o Chi-cuadrada o X2

  • 11

    Distribucin Ji-Cuadrada o Chi-cuadrada o X2

  • Es una prueba estadstica para evaluar hiptesis acerca de la relacin

    entre dos variables categricas.

    Smbolo: X2

    Hiptesis a probar: Correlaciones

    Variables

    involucradas:

    Dos variables (la prueba Chi-cuadrada no

    considera relaciones causales).

    Nivel de medicin de

    las variables

    Nominal u ordinal (o intervalos o razn reducidas

    a ordinales)

    Procedimiento La Chi-cuadrada se calcula por medio de una

    tabla de contingencia o tabulacin cruzada, que

    es una tabla de dos dimensiones y cada

    dimensin contiene una variable. A su vez, cada

    variable se subdivide en dos o ms categoras.

    Distribucin Ji-Cuadrada o Chi-cuadrada o X2

  • 13

    Total de Fila x Total de ColumnaF. Esperada=

    Total General

    CARACTERSTICAS

    1. La Distribucin X2 se lee con grados de libertad G.L = (Nde filas - 1)(N de columnas - 1).

    2. No tiene valores negativos. El valor mnimo es 0.

    3. Todas las curvas son asimtricas

    4. Cuando aumentan los grados de libertad las curvas sonmenos elevadas y ms extendidas a la derecha.

    5. Se utiliza para variables medidas en escala nominal uordinal.

    6. Las frmulas son:

  • 14

    Ejemplo 1. Variable, categora y tabla de contingencia 2x2:

    Sean las variables SEXO (Masculino y Femenino) y

    CANDIDATO (A y B). La tabla de contingencia o tabulacincruzada es:

    CANDIDATO

    A B

    Masculino

    SEXO

    Femenino

    20 30

    40 25

  • 15

    Ejemplo 2. Estudio de Tabla de contingencia 3x2:

    Se estudia a 1040 estudiantes de los niveles de educacin

    primaria y secundaria y a los cuales se aplica un instrumento

    que mide el aprendizaje de la matemtica, en las dimensiones

    de aprendizaje conceptual, procedimental y actitudinal.

    Variables:APRENDIZAJE categoras: Conceptual, Procedimental, Actitudinal.

    NIVEL DE EDUCACIN categoras: Primaria, Secundaria.

    NIVEL DE EDUCACIN

    Primaria Secundaria

    APRENDIZAJE

    Conceptual

    Procedimental

    Actitudinal

    180 100

    190 280

    170 120

    Tabla de contingencia

  • 16

    Tabla de frecuencias observadas (O):

    NIVEL DE EDUCACIN TOTAL

    Primaria Secundaria

    APRENDIZAJE

    Conceptual

    Procedimental

    Actitudinal

    180 100 280

    190 280 470

    170 120 290

    TOTAL 540 500 1040

    La Chi-cuadrada es una comparacin entre las tablas de

    frecuencias observadas y la denominada tabla de frecuencias

    esperadas (la tabla que esperaramos encontrar si las variables

    fueran estadsticamente independientes o no estuvieran

    relacionadas).

  • 17

    La frecuencia esperada de cada celda, casilla o recuadro, se

    calcula mediante la siguiente frmula aplicada a la tabla de

    frecuencias observadas:

    N = nmero total de frecuencias observadas.

    E = (marginal del regln)*(marginal de columna) / N.

    NIVEL DE EDUCACINMarginal

    de filasPrimaria Secundaria

    APRENDIZAJE

    Conceptual

    Procedimental

    Actitudinal

    (280)*(540)/1040 (280)*(500)/1040 280

    (470)*(540)/1040 (470)*( 500)/1040 470

    (290)*(540)/1040 (290)*(500)/1040 290

    marginal de columnas540 500 1040

    Tabla de frecuencias esperadas (E):

  • 18

    NIVEL DE EDUCACIN TOTAL

    Primaria Secundaria

    O E O E

    APRENDIZAJE

    Conceptual

    Procedimental

    Actitudinal

    180 145,4 100 134,6 280

    190 244,0 280 226,0 470

    170 150,6 120 139,4 290

    TOTAL 540 500 1040

    Frecuencias observada y esperada en una sola tabla:

    Donde:

    O: frecuencia observada en cada celda

    E: frecuencia esperada en cada celda

  • 19

    Celda O E O - E (O - E)2 (O - E)2 / E

    Conceptual/Primaria 180 145,4 34,6 1197,16 8,23

    Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11

    Actitudinal / Primaria 170 150,6 19,4 376,36 2,50

    Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69

    Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80

    Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70

    X2 = 47,33

    Para saber si el valor de X2 es o no significativo, debemos

    calcular los grados de libertad.

    G.L. = (N de filas - 1)(N de columnas - 1).

    E

    EOX

    2

    2

  • 20

    Para el ejemplo: N de filas = 3 y N de columnas = 2;entonces G.L. = (3-1)*(2-1) = 2.

    Luego, acudimos a la tabla de distribucin de Chi-cuadrado,

    eligiendo nuestro nivel de significancia ( = 0,05 = 0,01).

    Si el valor obtenido de X2 es igual o superior al valor de la

    tabla, decimos que las variables estn relacionadas o noson independientes.

    Aplicacin:

    Para el nivel de significancia de =0,05 y g.l. = 2, el X2 de

    tabla es 5,9915 (ver tabla).

    X2Obtenido = 47,33

    X2Crtico = 5,9915

  • 21

  • 22

    Prueba de hiptesis:

    H0: No existe relacin entre el aprendizaje y los niveles

    de educacin.

    H1: Existe relacin entre el aprendizaje y niveles de

    educacin.

    X2obtenido X2crtico entonces variables no son

    independientes; es decir existe una relacin entre

    Aprendizaje y los niveles educativos

    X2obtenido X2crtico entonces se rechaza la

    hiptesis nula (H0), y por lo tanto se acepta la hiptesis

    alterna (H1).

  • 23

    Establezca la Ho a ser probada;

    por ejemplo, Ho: 1 = 2 = 0,5

    Especifique el nivel de significancia , por ejemplo:

    = 0.5

    Haga una tabla de frecuencias obtenidas

    Deduzca las frecuencias esperadas a partir de Ho:

    Calcule el grado de libertad: Producto de (categoras - 1)

    Calcule el valor de X2 a partir de las frecuencias obtenidas y

    frecuencias esperadas.

    Mediante la tabla de X2 obtenga el valor terico.

    Compara dichos valores.

    Establezca la conclusin con respecto a Ho:

    Retenga Ho si valor de tabla > Valor calculado.

    Retenga Ho si valor de tabla < Valor calculado.

    Paso N 1

    Paso N 2

    Paso N 3

    Paso N 4

  • 24

    1. Un politlogo cree que, durante los ltimos aos, la composicin tnicade la ciudad donde vive ha cambiado. Las cifras ms actuales (reunidas

    hace unos cuntos aos) muestran que los habitantes de dicha ciudad

    presentan la siguiente composicin tnica: 53% noruegos, 32% suecos, 8%

    irlandeses, 5% alemanes y 2% italianos. Para verificar esta idea, este

    cientfico social obtiene una muestra aleatoria de 750 habitantes, con los

    resultados que se presentan en la siguiente tabla:

    Pases Noruegos Suecos Irlandeses Alemanes Italianos

    frecuencia 399 193 63 82 13

    a). Cul es la hiptesis nula?

    b). Cul es la hiptesis alterna?

    c). Cul es la conclusin?. Utilice = 0,05.

    Ejercicios propuestos:

  • 25

    2. Una universidad est pensando en implantar uno de los tres sistemas decalificaciones siguientes: (1) todas las calificaciones son aprobados-

    reprobado; (2) todas las calificaciones estn en el sistema 4.0 y (3) 90% de

    las calificaciones estn en el sistema 4.0 y 10% son a probados-reprobado.

    Se realiza una encuesta para determinar si existe una relacin entre el rea

    de inters de cada alumno y su presencia para algn sistema de

    calificacin. Se elige una muestra aleatoria de 200 estudiantes del rea

    ingeniera, 200 de ciencias, y 100 de bellas artes. Se pregunta a cada

    alumno cul de los tres calificaciones prefieren. Los resultados aparecen en

    la siguiente tabla:

    Sistema de calificacin

    Aprobado-reprobado 4,0 4,0 y aprobado-reprobado

    Bellas artes 26 55 19

    Ciencias 24 118 58

    Ingeniera 20 112 68

    a). Cul es la

    hiptesis nula?

    b). Cul es la

    hiptesis alterna?

    c). Cul es la

    conclusin?. Utilice

    = 0,05.

  • 26

    3. Debido a la inflacin galopante, el gobierno est considerando laimposicin de un control de precios y salarios. Un economista del gobierno,

    interesado en determinar si existe una relacin entre el empleo y la actitud

    hacia este control, rene los siguientes datos. Los datos muestran, para cada

    tipo de empleo, el nmero de individuos en la muestra que estn a favor o

    contra de los controles.

    a). Cul es la hiptesis nula?

    b). Cul es la hiptesis alterna?

    c). Cul es la conclusin?. Utilice = 0,05.

    Actitud hacia el control de precios y salarios

    A favor En contra

    Obreros 90 60

    Empresarios 100 150

    Profesionales 110 90

  • CHI CUADRADO

    Cundo usar esta distribucin?

    Esta es una distribucin de muestreo asociada a la

    probabilidad de la varianza (2). Por medio de ella se

    determina la probabilidad de ocurrencia de un valor

    especfico de varianza con v=n-1 grados de libertad en

    una muestra de tamao n.

    Varianza

    f(x)

  • CHI CUADRADO

    Frmulas

    tabuladaEst

    dxxfxF

    exv

    xf

    densidadFuncin

    xv

    v

    )()(

    **

    2*2

    1)( 2

    12

    2

    Forma de la curva de esta distribucin segn v

  • CHI CUADRADO

    Cmo usar las tablas?

    La tabla da valores de probabilidad acumulados de derecha

    a izquierda. Para extraer valores de probabilidad de esta

    tabla se sigue el siguiente procedimiento:

    Estimar el valor de la verdadera desviacin estndar.

    Determinar los grados de libertad (v) tal que v=n-1.

    Calcular el valor de 2=v*(s2/2)

  • CHI CUADRADO

    Cmo usar las tablas?

    Localizar en tablas el valor de la probabilidad

    asociada a los valores de 2 y de v. En algunos

    casos, puede ser necesario interpolar para encontrar

    el valor exacto buscado, de lo contrario, se escoge el

    que ms se aproxime. Por ejemplo, si 2 es igual 0.48

    con 4 grados de libertad, el valor de la probabilidad

    mayor a el es 0.975, pues se localiza en la direccin

    vertical en la parte superior, tal y como se muestra a

    continuacin.

  • CHI CUADRADO

    Cmo usar las tablas?

  • CHI CUADRADO

    EJEMPLO

    Una mquina llenadora ha ejecutado su operacin con

    una varianza de 0.83 grms2. Si se toma una muestra de

    15 unidades, cul es la probabilidad de tener una

    varianza:

    a. superior a 1.249 grms2?

    b. inferior a 0.3896 grms2?

  • CHI CUADRADO

    SOLUCIN

    a. La probabilidad de tener una varianza superior a

    1.249 grms2 es 0.1.

    1.0067.2183.0

    249.1*14)249.1( 222

    PPP

  • CHI CUADRADOSOLUCIN

    a. La probabilidad de tener una

    varianza superior a 1.249 grms2

    es 0.1.

    En Excel se pulsa en el men:

    INSERTAR, FUNCIN,

    ESTADSTICAS, DISTR.CHI

    P(2>1.249) se introduce el

    valor de 2 que es 21.067 y el

    nmero de grados de libertad

    que es 14. Excel retorna el

    valor de la probabilidad que es

    0.099.

  • CHI CUADRADO

    SOLUCIN

    b. La probabilidad de tener una varianza inferior a

    0.3896 grms2 es 0.05.

    05.095.0157.683.0

    3896.0*14)3896.0( 222

    PPP

  • CHI CUADRADO

  • GRACIAS

    Cortesia: DR. JORGE ACUA A.