Cap 4

download Cap 4

of 44

Transcript of Cap 4

  • 1 6 9

    Captulo IVPruebas de hiptesis para

    medidas de asociacin

    [11]

    En muchas situaciones es de inters estudiar la relacin entre doso ms variables definidas en una poblacin, basados en los resul-tados encontrados en la muestra. Por ejemplo, podemos estar in-teresados en estudiar la relacin entre el sexo y el lugar de proce-dencia de los participantes, entre el sexo y el rendimiento acad-mico en el curso de lgebra, entre la edad y el tiempo de serviciode los participantes en el programa de capacitacin. En todos loscasos nos basamos en valores que encontramos en la muestra y nospreguntamos si dichos valores son estadsticamente significativos.

    Para abordar el problema planteado, en cada tipo de si-tuacin, primero presentaremos la metodologa para calcu-lar el coeficiente de correlacin en la muestra y luego la metodo-loga correspondiente a pruebas de hiptesis para el parmetropoblacional.

    El estudio de la relacin entre dos variables cuantitativas serealizar en el siguiente captulo, juntamente con el tpico deanlisis regresin.

    Prueba de hiptesis para el coeficiente decorrelacin PHI

    Cuando se desea estudiar la asociacin entre dos variables denaturaleza cualitativas dicotmicas, se recomienda obtener el co-

  • 1 7 0

    eficiente de correlacin phi. Por ejemplo, se desea estudiar la aso-ciacin entre las variables estado civil y desercin de los estudian-tes de maestra; entre el sexo de los estudiantes y su opinin respec-to a la reeleccin del Decano.

    Coeficiente de correlacin phi en la muestra

    Se definen:

    X: variable dicotmica con valores 0 y 1,Y: variable dicotmica con valores 0 y 1,px : proporcin de puntuaciones 1 en la variable X,qx : proporcin de puntuaciones 0 en la variable X,py : proporcin de puntuaciones 1 en la variable Y,qy : proporcin de puntuaciones 0 en la variable Y,pxy : proporcin de puntuaciones 1 tanto en la variable X como

    en la variable Y,luego, el coeficiente de correlacin phi, , se calcula de la

    siguiente manera: (4.1) .

    qpqpppp

    yyxx

    yxxy

    =

    Cuando los datos estn tabulados en una tabla de contin-gencia (tabla que muestra la ocurrencia conjunta de pares de pun-tuaciones en dos variables), puede calcularse mediante la si-

    Valores de la Valores de la Totalvariable Y variable X

    0 1

    1 A B a + b0 C D c + d

    Total a + c b + d

    guiente metodologa:

    .))()()(( dcbadbca

    adbc++++

    =

  • 1 7 1

    Este coeficiente tomar el valor 1 solamente cuando (a+b) y(c+d) son iguales (consecuentemente a=d) en una tabla de contin-gencia de dos por dos; es decir, cuando la proporcin de "unos" esla misma en X y en Y". entonces Y no puede predecirse perfectamen-te a partir de X, por lo que algunos estadsticos consideran estehecho como una desventaja del coeficiente phi.

    Prueba de hiptesis para el coeficiente poblacional phi

    Paso 1: La hiptesis nula indica que no existe asociacin entrelas dos variables en la poblacin y la hiptesis alternativa niegaesta afirmacin. Denotemos con phi la asociacin o el coeficien-te de correlacin phi en la poblacin, entonces, las hiptesis son:

    0:0 =phiH 0:1 phiH

    Paso 2: Bajo la hiptesis nula, para un tamao de muestra ma-yor que 20, la estadstica de prueba nz = tiene distribucinaproximadamente normal con media 0 y varianza 1. Con el va-lor del coeficiente obtenido en la muestra y bajo la hiptesis nulase calcula el valor de la estadstica de prueba, cz .

    Paso 3: Para = 0.05, ( ) 975.0=< tericozZP , en la tabla de ladistribucin normal se encuentra el valor de 96.1=tericoz . La re-gin de rechazo es el intervalo (-, -1.96) U(1.96, ).

    Paso 4: Si el valor de la estadstica de prueba,, cae en el intervaloindicado, se rechaza la hiptesis nula.

    Ejemplo 4.1

    Se ha observado que los estudiantes que inician sus estudios demaestra presentan mucha dificultad en el primer semestre porlo que algunos de ellos abandonan sus estudios. A continuacin

  • 1 7 2

    se presentan los resultados de un seguimiento realizado a 15 estu-diantes de la maestra en Poltica Social que se matricularon en elsemestre 2004-II y que abandonaron el curso de Herramientas deAnlisis Cuantitativo. Encontraremos el coeficiente de correla-cin phi y haremos la prueba de hiptesis correspondiente.

    X: estado civil 1: no casado 0: casadoY: permanencia 0: abandona el curso

    1: permanece en el curso hasta el final

    Estudiante Estado civil( ix ) Permanencia( iy )

    1 0 02 1 13 0 14 0 05 1 16 1 07 0 08 1 19 0 010 0 111 0 012 1 113 0 014 0 015 0 0

    Solucin

    La informacin anterior se resume en el siguiente cuadro:Valores de la Valores de la variable Xvariable Y

    0 (casado) 1 Total

    1 (permanece) 2 4 60 (abandona) 8 1 9

    Total 10 5 15

  • 1 7 3

    y se calculan las respectivas proporciones:

    3333.0155

    ==px 6667.01510

    ==qx 4.0156

    ==py

    6.0159

    ==qy 2667.0154

    ==pxyque se reemplazan en la frmula:

    ( )( )( )( ) .578.06.04.06667.03333.0)4.0)(3333.0(2667.0

    =

    =

    El coeficiente de correlacin phi en la muestra entre estadocivil y desercin vale 0.578. Es estadsticamente significativo elvalor encontrado?. A continuacin responderemos la preguntaplanteada usando la metodologa de pruebas de hiptesis.

    Paso 1: La hiptesis nula es que no existe asociacin entre esta-do civil y desercin en los estudios y la hiptesis alternativa nie-ga ese enunciado. Si phi es la asociacin entre estado civil y de-sercin, las hiptesis son:

    0:0 =phiH 0:1 phiH

    Paso 2: El valor de la estadstica de prueba es:

    nzc = = =)578.0(15 2.24

    Paso 3: Para = 0.05, ( ) 95.0=< tericozZP , por lo que la reginde rechazo es el intervalo (- , -1.96) (1.96, ).

    Paso 4: Como el valor de cz = 2.24, cae en el intervalo indicado,se rechaza la hiptesis nula. Luego, con nivel de significacin 0.05,existe evidencia para rechazar la hiptesis nula.

    Cabe indicar, que por razones estrictamente acadmicas, enel ejemplo se ha considerado un tamao de muestra menor que

  • 1 7 4

    el exigido.A continuacin se hace la ilustracin con el auxilio del SPSS y

    la regla de decisin se basa en el concepto valuep _ que ya fueexplicado en el captulo anterior.

    Ejemplo 4.2

    Se ha observado que los estudiantes que inician sus estudios deMaestra presentan mucha dificultad en el primer semestre porlo que algunos de ellos abandonan sus estudios. A continuacinse presentan los resultados de un seguimiento realizado a 41 es-tudiantes de las maestras en derecho y educacin, que se matri-cularon en el semestre 2004-II y que abandonaron el curso deHerramientas de Anlisis Cuantitativo. Encontraremos el coefi-ciente de correlacin phi y luego la correspondiente prueba dehiptesis para el parmetro poblacional. Los datos se encuentranen la base de DATOS4-phi.

    Solucin

    A continuacin se describe el procedimiento de pruebas de hipte-sis y en el paso 2 se incluyen comandos del SPSS que permiten en-contrar el valor del coeficiente de correlacin phi en la muestra.

    Paso 1: En la hiptesis nula se plantea que no existe asociacinentre estado civil y desercin de los estudiantes y la hiptesis al-ternativa niega tal enunciado. Si phi es la asociacin entre esta-do civil y desercin, las hiptesis son:

    0:0 =phiH 0:1 phiH

    Paso 2: El valor de la estadstica de prueba se obtiene usando lossiguientes comandos del SPSS:

    Abrir la base de DATOS4-phi.ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS/para ROWescoger la variable DESERCIN y para COLUMNS la variable ES-

  • 1 7 5

    de donde el valor del coeficiente phi en la muestra es 119.0= .

    nzc = = = )119.0(41 -0.76.

    Paso 3: Para = 0.05 ( ) 975.0=< tericozZP , por lo que la reginde rechazo es el intervalo (- , -1.96) el intervalo (1.96, ).

    Asimismo, con el criterio del valuep _ la decisin es la si-guiente: Si valuep _ < se rechaza la hiptesis nula.

    Paso 4: Como el valor de cz = -0.76 no cae en el intervalo indica-do, no se rechaza la hiptesis nula. Luego, con nivel de significa-cin 0.05, no existe evidencia para rechazar la hiptesis nula deque las variables desercin y estado civil no estn asociadas.

    Se llega a la misma decisin si se compara valuep _ con elvalor de , pues valuep _ = 0.446 > 0.05, por lo que no existeevidencia para rechazar la hiptesis nula.

    TADO CIVIL/ STATISTICS/ seleccionar PHI/CONTINUE/ OK.El output del SPSS es el siguiente:

    ESTADO CIVILTotal

    0 1

    DESERCIN 0 9 7 16

    1 17 8 25

    Total 26 15 41

    Symmetric Measures

    Value Approx. Sig.

    Nominal by Nominal Phi -.119 .446N of Valid Cases 41

  • 1 7 6

    Prueba de hiptesis para el coeficiente decorrelacin biseral-puntual

    El coeficiente de correlacin biseral-puntual se usa cuando unavariable es de naturaleza cualitativa dicotmica y la segunda esinterval o de razn. Por ejemplo, podemos estar interesados ensaber si existe alguna asociacin entre sexo (Y) y altura de losestudiantes (X).

    Coeficiente de correlacin biseral-puntual en la muestra

    Y es una variable dicotmica (1 y 0),X es una variable continua

    1X es la media de las puntuaciones de la variable para los quela variable tiene puntaje "1",

    0X es la media de las puntuaciones de la variable para los quela variable tiene puntaje "0",

    Sx es la desviacin estndar de los valores de la variable X,n1: nmero de unos en la variable Y,n0: nmero de ceros en la variable Y,

    luego, el coeficiente de correlacin biseral se calcula con:

    )1(

    1001

    =

    nnnn

    SXXr

    xbP (4.2)

    Prueba de hiptesis para el coeficiente de correlacin

    Paso 1: En la hiptesis nula se postula que no existe asociacinentre las dos variables en la poblacin y la hiptesis alternativaniega en afirmacin. Si denotamos con bp el coeficiente de co-rrelacin biseral-puntual en la poblacin, entonces, las hiptesisson:

  • 1 7 7

    0:0 =bpH 0:1 bpH

    Paso 2: Bajo la hiptesis nula, la estadstica de prueba

    21 2

    =

    nr

    rt

    bp

    bp

    tiene distribucin t-Student con ( 2n ) grados de libertad.

    Con el valor del coeficiente de correlacin obtenido en lamuestra y bajo la hiptesis nula se calcula el valor del estadsticode prueba, ct .

    Paso 3: Para = 0.05 ( ) 975.0)2( =

  • 1 7 8

    X1: con las estaturas de los adolescentes del sexo masculino. Esdecir:Y se realizan los clculos auxiliares, para luego obtener el co-

    eficiente de correlacin biseral-puntual:

    75.668

    62636664726573691

    =

    +++++++=x

    14.617

    606361606255670

    =

    ++++++=x

    749.4 7 8 x01 === snn

    61.0)14

    )8)(7(749.4

    14.6175.66

    (15=

    =rbP

    Es estadsticamente significativo el valor del coeficiente decorrelacin biseral puntual encontrado en la muestra?. Para res-ponder la pregunta planteada, procederemos a usar la metodo-loga de pruebas de hiptesis.

    Adolescente Sexo (Y) Estatura (X) X0 X1

    1 1 69 - 69 2 0 67 67 - 3 1 73 - 73 4 1 65 - 65 5 0 55 55 - 6 1 72 - 72 7 0 62 62 - 8 0 60 60 - 9 1 64 - 64 10 1 66 - 66 11 1 63 - 63 12 0 61 61 - 13 1 62 - 62 14 0 63 63 - 15 0 60 60 -

  • 1 7 9

    Paso 1: Se postula como hiptesis nula que no existe asociacinentre sexo y estatura en la poblacin y la hiptesis alternativaniega esa afirmacin. Si se denota con bp el coeficiente de correla-cin biseral-puntual en la poblacin, entonces, las hiptesis son:

    0:0 =bpH 0:1 bpH

    Paso 2: El valor de la estadstica de prueba es:

    21 2

    =

    nr

    rt

    bp

    bpc = 77.2

    13)61.0(1

    61.02

    =

    Paso 3: Para = 0.05 ( ) 975.0)13( =< tericottP , en la tabla t-Stu-dent se encuentra el valor de 16.2=tericot . Luego, la regin derechazo es el intervalo (2.16, ).

    Paso 4: Como el valor de ct = 2.77 cae en el intervalo indicado,se rechaza la hiptesis nula.

    Ejemplo 4.4

    Si se quiere resolver el ejemplo anterior usando comandos delSPSS no se puede encontrar directamente el coeficiente, pues elSPSS slo nos proporciona los clculos auxiliares que luego sereemplaza en la frmula (4.2) y se sigue la trayectoria descritapara realizar la prueba de hiptesis. En el SPSS se siguen los si-guientes pasos:

    Crear (o abrir) el archivo, en este caso vamos a ilustrar con labase de DATOS9-puntual, con las dos variables X e Y.

    Crear la variable ficticia X0 donde se guarda las estaturas del sexofemenino. Se usa el comando recode.

    Crear la variable ficticia X1 donde se guarda las estaturas del sexomasculino. Se usa el comando recode.

  • 1 8 0

    El output del SPSS es el siguiente.

    Valores en negrita se reemplazan en la frmula (4.2) y se en-cuentra que el valor del coeficiente es 0.61, como ya se vio en elejemplo 4.3.

    Prueba de hiptesis para el coeficiente decorrelacin tetracorico

    Este tipo de coeficiente es recomendable en situaciones dondedos variables cuantitativas de naturaleza subyacente normal, hansido dicotomizadas. As por ejemplo, el autor de una preguntaque mide la capacidad de razonamiento matemtico de los estu-diantes de quinto ao de secundaria considera que es un rasgonormalmente distribuido; pero el tem slo permitir identificaral grupo que responda correctamente, al que se le asigna pun-tuacin 1 y al grupo que responda incorrectamente, al que se leasigna un 0.

    Por otro lado, suponga que las estaturas de 1000 estudiantesse distribuyen normalmente, pero el entrenador asigna puntaje 1a los que tienen estatura de 1.50 mts o superior y le asigna punta-je 0 a los que tienen estatura inferior a 1.50 mts.

    Vamos a estudiar la asociacin para situaciones similares

    Calcular la media aritmtica de X0, X1 y calcular la desviacin es-tndar de X.Para detalles remitirse al libro: ESTADSTICA DESCRIPTIVA

    (Gmez y colaboradores, 2005).

    N Mean Std. Deviation

    estatura de losestudiantes 15 64.13 4.749Xo 7 61.1429 3.62531x1 8 66.7500 4.13176

  • 1 8 1

    como la descrita.

    Coeficiente de correlacin en la muestra

    Sean:

    X: variable con distribucin normal que ha sido dicotomizada X = 1 estatura 1.50 mts

    0 estatuta < 1.50 mts

    Y: variable con distribucin normal que ha sido dicotomizadaY = 1 respuesta correcta 0 respuesta incorrecta,

    para las que se encuentra la siguiente tabla bidimensional:

    Se calcula el cociente dacb

    y luego ubicar el valor en la Tabla

    E del Apndice, donde se encuentran funciones del cociente

    obtenido:

    Si la proporcin dacb

    es mayor que 1, de la Tabla E se obtiene

    directamente el valor del coeficiente tetracrico, en la co-

    lumna rt , (4.3) Si la proporcin

    dacb

    es menor que 1, en la Tabla E se lee la

    columna (ad)/(bc) y el valor rt del coeficiente tetracricoser negativo.

    Prueba de hiptesis para el coeficiente

    ITEM Y ITEM X

    0 1

    1 a b0 c d

  • 1 8 2

    Paso 1: La hiptesis nula indica que no existe asociacin entre lasdos variables en la poblacin y la hiptesis alternativa niega esaafirmacin. Si denotemos con tr el coeficiente de correlacin tetra-crico en la poblacin, entonces, las hiptesis son:

    0:0 =trH 0:1 trH

    Paso 2: Bajo la hiptesis nula, y para tamaos de muestra mayo-res que 20, la distribucin del coeficiente rt es aproximadamen-

    te normal con medio cero y desviacin estndar yx

    yyxx

    uunqpqp 1 ,

    donde:

    xp es la proporcin de puntuaciones "1" en la variable X dicoto-mizada,

    yp es la proporcin de puntuaciones "0" en la variable dicoto-mizada Y,

    xu es la ordenada de la curva normal unitaria correspondientea la puntuacin z en el cual se halla la proporcin xp delrea (ver la tabla A) y

    yu es la ordenada de la curva normal unitaria correspondientea la puntuacin z en el cual se halla la proporcin yp delrea (ver la tabla A). As, para un tamao de muestra mode-rado o muy grande:

    yx

    yyxx

    t

    uunqpqp

    rz1

    = puede compararse con la distribucin

    normal unitaria para contrastar que el coeficiente t de la po-blacin vale cero.

    Con los resultados obtenidos en la muestra se calcula el va-lor de la estadstica de prueba: cz .

    Paso 3: Para = 0.05 ( ) 975.0)2( =

  • 1 8 3

    crico, primero se obtiene la tabla de doble entrada.

    En la tabla anterior se identifica a=4, b=19, c=21 y d=6 y se

    encuentra el valor de dacb

    = 16.625. Con dicho valor se va a la Tabla

    E.El valor de

    dacb

    es mayor que 1, y al usar la Tabla E para la

    proporcin anterior, el valor aproximado del coeficiente de co-rrelacin tetracrico es 0.81.

    .81.0625.16 =====>= rtadbc

    Es estadsticamente significativo el valor encontrado?.Responderemos la pregunta con la metodologa de pruebas

    Luego, la regin de rechazo es el intervalo ( tericot , ).

    Paso 4: Si el valor del estadstico de prueba, ct , cae en el intervaloindicado se rechaza la hiptesis nula.

    Ejemplo 4.5

    A un grupo de 50 estudiantes se les evala con dos tems de apti-tud matemtica y se asigna 1 a la respuesta correcta y 0 a la res-puesta incorrecta. Si se denota con X la primera pregunta y con Yla segunda pregunta, los resultados se presentan en la siguientetabla bidimensional.

    Para encontrar el valor del coeficiente de correlacin tetra-

    ITEM2(Y) ITEM1(X) Total

    0 1

    1 4 19 230 21 6 27

    Total 25 25 50

  • 1 8 4

    de hiptesis.

    Paso 1: Se postula en la hiptesis nula que no existe asociacinentre las respuestas a las preguntas X e Y. La hiptesis alternati-va niega dicha afirmacin.

    0:0 =trH 0:1 trH

    Paso 2: Con los datos de la muestra procedemos a realizar losclculos de:

    xp 5.05025

    == yp 46.05023

    ==

    En la Tabla A del anexo se observa que la ordenada de lacurva normal unitaria que corresponde a xp = 0.5 de rea, es

    xu =0.3989 y la ordenada de la curva correspondiente al puntoen el cual se obtiene yp = 0,46, es xu = 0,3970.

    Finalmente obtenemos el valor de la estadstica de prueba:

    )397.0)(3989.0(1

    50)54.0)(46.0)(5.0)(5.0(

    812.0=cz =3.64

    Paso 3: Para = 0.05 ( ) 975.0=< tericozzP , en la tabla normalse encuentra el valor de tericoz = 1.96.

    Luego, la regin de rechazo es el intervalo (1.96, ).

    Paso 4: Como el valor de cz = 3.64 cae en el intervalo indicado,se rechaza la hiptesis nula y concluimos que el coeficiente decorrelacin tetracrico de la poblacin no es nulo, cuando el ni-vel de significacin es 0.05.

    Ejemplo 4.6

    Suponga que para una determinada tabla de contingencia 2x2,

  • 1 8 5

    a=62, b=20, c=10, d=24 y se desea obtener el valor del coeficientede correlacin tetracrico.

    Como dacb

    = 0.1344, para encontrar el valor del coeficiente

    se consulta la Tabla A, bajo los valores de la columna 44.7=bcad

    .

    Se encuentra que el valor del coeficiente de correlacin tetrac-

    rico es negativo, rt = -0.67.Debe prevenirse al lector sobre la posibilidad de cometer se-

    rios errores. No debe emplearse el mtodo si ndb

    nba ++ o

    se apartan considerablemente de 0.5. Si ndb

    nba ++ o son ma-

    yores que 0.7 o menores que 0.3, tampoco debera utilizarse latabla A, y en su lugar, debera emplearse las tablas de Jenkins(1955).

    Cuando las distribuciones subyacentes son normales, sola-mente esta propiedad confiere superioridad al coeficiente rt so-bre el coeficiente PHI como medida de asociacin.

    Ejemplo 4.7

    Si deseamos encontrar el coeficiente de correlacin tatracricopara las variables de la base de DATOS6-tetracrico, se observaque son 99 estudiantes, donde las notas del curso de estadstica ydel curso de metodologa de investigacin han sido dicotomiza-das, pues los profesores calificaron con aprobado o desaproba-do. Obtendremos el coeficiente de correlacin tetracrico.

    Y: notas en el curso de estadstica- dicotimizada,0 desaprob con notas inferiores a 111 aprob con notas de 11 o ms

    X: notas en el curso de metodologa de investigacin-dico-tomizada,0 desaprob con notas inferiores a 11

  • 1 8 6

    1 aprob con notas de 11 o ms.

    Solucin

    Activar el SPSS. Abrir la base de DATOS6-tetracrico y ejecutarlos siguientes comandos:

    ANALYZE/DESCRIPTIVE STATISTICS/CROSSTABS/paraROW escoger NOTAS DE ESTADSTICA y para COLUMNS es-coger NOTAS DE METODOLOGA/ en FORMAT activar DES-CENDENT/CONTINUE/OK.

    El outptup del SPSS muestra el siguiente cuadro:

    notas de estadstica * notas de metodologa de la investi-

    gacin Crosstabulation

    a partir del que se calcula el valor de dacb

    = 6.18. En la Tabla E,

    al valor 6.18 de dacb

    le corresponde el valor rt = 0.62 para el coefi-ciente tetracrico.

    Ahora se plantea la siguiente pregunta: Es significativamen-

    Count

    notas de metodologade la investigacin

    Totaldesaprob Aprob

    notas de aprob a=11 b=36 47estadstica desaprob c=34 d=18 52

    Total 45 54 99

  • 1 8 7

    te diferente de cero el coeficiente de correlacin tetracrico en lapoblacin?. Se deja como ejercicio para el estudiante.

    Prueba de hiptesis para el coeficiente decorrelacin biseral

    Se usa en situaciones donde se tiene dos variables con distri-buciones normales subyacentes, una de las cuales ha sido di-cotomizada.

    Una de las situaciones donde se puede obtener el coeficientede correlacin biseral es la siguiente. Un profesor desea relacio-nar el tiempo que los estudiantes emplean en resolver un proble-ma (X) y la habilidad que tiene para resolver el problema (Y).

    El profesor anota el tiempo (X) que cada estudiante demoraen resolver el problema, pero la variable Y no la calific con unanota en la escala vigecimal o cualquier otra, slo anot que apro-b (1) si lleg a la solucin correcta y anot no aprob (0) si nolleg a la solucin correcta.

    Coeficiente de correlacin biseral en la muestra

    Sean las variables continuas Y dicotomizada (1 y 0) y X tambindicotomizada (0 y 1).

    Calcular:

    0X : la media de las puntuaciones de la variable X para los queen Y tienen puntaje "0",

    1X : la media de las puntuaciones de la variable X para los queen Y tienen puntaje "1",

    XS : desviacin estndar de la variable X,n1: nmero de unos en Y,n0: nmero de ceros en Y.

    Usar la TABLA A, para obtener:u : ordenada (es decir la altura) de la unidad de la distribucin

  • 1 8 8

    normal, en el punto a partir del cual se obtiene el porcentaje

    100(nn1 ) del rea bajo la curva normal, donde nnn =+ 01 .

    Luego el coeficiente de correlacin biseral muestral es igual a:

    .

    2

    0101

    =

    nnu nnn

    SXXrx

    b (4.4)

    Este coeficiente puede ser menor que -1 y mayor que +1.Estos valores extremos indican que no era cierto que laspuntuaciones X, categorizadas, tienen distribucin normal sub-yacente o tambin puede indicar fluctuaciones de muestreo cuan-do n es pequeo y produce una distribucin de X marcadamenteplaticrtica.

    Prueba de hiptesis para el coeficiente

    Paso 1: La hiptesis nula indica que no existe asociacin entrelas dos variables en la poblacin y la hiptesis alternativa niegadicha afirmacin. Si denotamos con b el coeficiente de correla-cin biseral en la poblacin, entonces, las hiptesis son:

    0:0 =bH 0:1 bH

    Paso 2: Bajo la hiptesis nula, y para tamaos de muestra mayo-res que 20, la distribucin del coeficiente rb es aproximadamen-te normal con medio cero y desviacin estndar

    nunnn

    1 01 . La

    estadstica:

    nunnnrz b

    101= puede compararse con la distribucin normal uni-

    taria para contrastar que el coeficiente b poblacional vale cero.

  • 1 8 9

    Con los resultados obtenidos en la muestra se calcula el valorde la estadstica de prueba: cz .

    Paso 3: Para = 0.05 ( ) 975.0} =< tericozzP , en la tabla normal seencuentra el valor de tericoz .

    Luego, la regin de rechazo es el intervalo ( tericoz , ).

    Paso 4: Si el valor de la estadstica de prueba, cz , cae en el inter-valo indicado, se rechaza la hiptesis nula.

    Ejemplo 4.8

    Los datos que se presentan en el siguiente cuadro correspondien-tes al tiempo que los alumnos invierten en resolver una pregun-

    Alumno Tiempo (X) Nota en la prueba (Y)

    1 16 12 12 03 11 04 7 15 15 16 14 17 10 08 11 09 15 110 9 011 13 112 7 013 13 114 11 115 10 016 11 117 10 118 11 1

    ta de matemticas (X) y la habilidad que tienen para llegar a lasolucin (Y).

    Sean:

    X: tiempo que demor en resolver la pregunta, en minutos,Y = 1 solucin correcta Y= 0 solucin incorrecta.

  • 1 9 0

    Se crean las variables ficticias X0 y X1 con las notas de losque resolvieron de manera incorrecta y correcta respectivamen-te. Luego se calculan las medias aritmticas y la desviacin estn-dar del tiempo que demoran en resolver la pregunta, sin discrimi-nar si llegaron o no a la solucin correcta. As:

    n1 = 11 n0 = 7 n= 18 x1 = 12.36 x0 = 10

    Para encontrar el valor de la ordenada de la distribucin nor-mal, se usa la Tabla A del anexo, para lo que se plantea la si-guiente relacin:

    3836.061.01811)( =====>==< uzZP , y luego se encuentra el

    coeficiente

    .60.018 )18 ( 3836.0

    )7(1155.2

    0.1036.12

    182=

    =rb

    Es significativamente diferente de cero el coeficiente en-contrado?. Responderemos con la metodologa de pruebas dehiptesis.

    Paso 1: Enla hiptesis se postula que el coeficiente de correla-cin biseral en la poblacin,, vale cero y la hiptesis alternativaniega ese enunciado:

    0:0 =bH 0:1 bH

    Paso 2: Con la informacin obtenida en la muestra:

    111=n , 70=n , 3836.0=u , 60.0=br ,

    nunnn

    1 01 = )18)(3836.0(

    1 18

    )7(11= 0.2995, el valor que toma la

    estadstica de prueba es:

  • 1 9 1

    nunnnrz bc 101

    = =

    )18)(3836.0(1

    18)7)(11(

    6.02995.0

    6.0= = 2.0.

    Paso 3: Para = 0.05 ( ) 975.0} =< tericozzP , en la tabla normal seencuentra el valor de tericoz . Luego, la regin de rechazo es el inter-valo (1.96, ).

    Paso 4: Como cz = 2.0 cae en el intervalo indicado, la decisin esrechazar la hiptesis nula con nivel de significacin 0.05.

    Ejemplo 4.9

    Los datos que se presentan en la base de DATOS7-biseral corres-ponden a una muestra de 99 alumnos de quinto ao de secunda-ria, donde el profesor desea saber si estn asociadas las varia-bles: el tiempo que un estudiante demora en resolver una pre-gunta y la habilidad que tiene para resolver el problema. Se de-nota con:

    X: el tiempo en minutos que los alumnos gastan en resolver unapregunta de matemticas,

    Y: la habilidad del alumno para llegar a la solucin. A la solu-cin correcta el profesor le asign 1 y a la solucin incorrec-ta le asign = 0.Vamos a estudiar la asociacin entre dichas variables.

    Solucin

    Previamente, en la base de datos se crea: la variable X0 donde seguarda los tiempos que demoran en resolver la pregunta, losalumnos que no llegaron a la solucin correcta y la variable X1donde se guarda los tiempos que demoran en resolver la pregun-ta, los alumnos que llegaron a la solucin correcta.

    Con el auxilio del SPSS los clculos auxiliares para encon-

  • 1 9 2

    ger las variables TIEMPO PARA RESOLVER, X0 y X1/OPTIONS/activar MEAN Y STD DEVIATION/ CONTINUE/ OK.

    La salidad del SPSS es la siguiente:

    donde:

    n1 = 47 n0 = 52 x1 = 64.13 x0 = 63.01

    4747.099471

    ==

    nn . En la TABLA A se encuentra el valor de u , por-

    que: 4747.09947)( ==< zZP , entonces 9823.0=u .

    Luego, el valor del coeficiente de correlacin biseral en lamuestra es:

    =

    nnu nnn

    sxxr

    xb 2

    0101

    =

    9999)99(3982.0)52(47

    168.1001.6313.64

    2 = 0.07.

    Por razones estrictamente acadmicas continuamos con laprueba de hiptesis, a pesar que sabemos que el valor de la esta-dstica de prueba va a ser muy pequeo.

    Paso 1: El coeficiente de correlacin biseral poblacional entre el

    trar el valor del coeficiente de correlacin biseral muestral. Luegoharemos la prueba de hiptesis correspondiente.

    Abrir la base de DATOS7-biseral y ejecultar los comandos:ANALYZE/DESCRIPTIVE STATISTICS/ DESCRIPTIVES/ esco-

    tiempo pararesolver xo X1

    N Valid 99 52 47Mean 63.54 63.0113 64.1310Std. Deviation 10.168 10.58776 9.76176

  • 1 9 3

    tiempo empleado y la habilidad para resolver el problema es cero,frente a la hiptesis que niega esa afirmacin: .

    0:0 =bH 0:1 bH Paso 2: Con la informacin obtenida en la muestra obtenemos elvalor de la estadstica de prueba, es decir, para:

    n1 = 47 n0 = 52 x1 = 64.13 x0 = 63.01 3982.0=u 07.0=br

    nunnn

    1 01 = )99)(3982.0(

    1 99

    )52(47= 0.126, el valor que toma

    la estadstica de prueba es:

    nunnnrz bc 101

    = 126.007.0

    = = 0.55.

    Paso 3: Para = 0.05 ( ) 975.0} =< tericozzP , el valor de tericoz es 1.96.Luego, la regin de rechazo es el intervalo (1.96, ).

    Paso 4: Como cz = 0.55 no cae en el intervalo indicado, la deci-sin es no rechazar la hiptesis nula con nivel de significacin0.05.

    Prueba de hipstesis para el coeficiente decorrelacin de spearman

    El coeficiente de correlacin producto-momento calculado a par-tir de dos series de n posiciones o rangos consecutivos indepen-dientes, que van de 1 hasta n se conoce con el nombre de coefi-ciente de correlacin por rangos ordenados de Spearman. En estecaso ambas variables X e Y medidas en la escala ordinales.

    Si los datos directos son cuantitativos, estos pueden conver-tirse en rangos o posiciones.

    Por ejemplo, la "posicin u orden de mrito en el saln declase" es un ejemplo de conversin de puntuaciones ordenadas

  • 1 9 4

    en rangos. Es decir, en un grupo de 50 estudiantes se le asigna laposicin 1 al que alcanz el ms alto puntaje, posicin 2 al si-guiente,..., y posicin 50 al puntaje mas bajo. Los juicios sobre laexcelencia de una declaracin tambin constituyen un ejemplode agrupamiento de posiciones o rangos segn los datos origina-les. 10 estudiantes recitan una poesa y un juez asigna un "1" a lamejor declamacin, un "2" a la segunda,..., y 10 a la peor decla-macin.

    Independientemente de cmo se originaron las puntuacio-nes 1, 2, 3,.............,( 1n ), n; pueden correlacionarse dos series derangos para los mismos individuos.

    Coeficiente de correlacin de SPEARMAN en la muestra

    Sean:

    xx n,....,1 : rangos asignados a la variable X,yy n,....,1 : rangos asignados a la variable Y

    n: tamao de muestra o nmero de indivduosyx ii : diferencia entre el rango asignado a la variable X y el

    rango asignado a la variable Y de la i-sima persona.

    Si existen dos o ms valores iguales (valores empatados) losrangos de cada uno de stos son iguales al promedio de los ran-gos que les correspondera en el caso de que fueran diferentes.As por ejemplo si las edades de los participantes en un progra-ma de capacitacin docente son las siguientes: 40 41 42 43 43 4446, los rangos asignados son: 1, 2, 3, 4.5, 4.5, 6 y 7.

    Luego, el coeficiente de correlacin de Spearman se definede la siguiente manera:

    ( )( ) 1

    61 2

    2

    =

    n

    yxr nii

    S (4.5)

    11 rS

  • 1 9 5

    su valor no puede ser menor que -1 ni mayor que 1, alcanzasu mximo valor (+1) cuando los individuos ocupan los mismosrangos o posiciones en X e Y.

    Este coeficiente es muy til cuando los datos originales sonrangos o posiciones y cuando se emiten juicios para clasificar indi-viduos o cosas, pero se recomienda que el tamao de muestra seasuperior a 10.

    Pruebas de hiptesis para el coeficiente

    Paso 1: En la hiptesis se postula que no existe asociacin entrelas dos variables en la poblacin y la hiptesis alternativa niegaesa afirmacin. Denotemos con s la asociacin o el coeficientede correlacin de Spearman en la poblacin, entonces, las hip-tesis son:

    0:0 =sH 0:0 sH

    Paso 2: Bajo la hiptesis nula, la estadstica de prueba

    21 2

    =

    nr

    rts

    s

    tiene distribucin t-Student con (n-2) grados de libertad.

    Con el valor obtenido en la muestra y bajo la hiptesis nulase calcula el valor del estadstico de prueba, ct .

    Paso 3: Para = 0.05, ( ) 025.0)2( => tericon ttP o ( ) 975.0)2( =

  • 1 9 6

    Los siguientes datos corresponden a una muestra aleatoria de 12estudiantes para quienes un juez asign posiciones o rangos enbase a la hostilidad que manifiestan los estudiantes a su profesorde metodologa de la investigacin y a sus compaeros de clase,es decir, dos series de rangos. Se desea encontrar el coeficiente decorrelacin de Spearman.

    Sea X: la hostilidad manifestada por el estudiante a su pro-fesor de matemticas donde:

    1: es el puntaje asignado al que manifiesta mayor hostilidad alprofesor,

    12: es el puntaje asignado al que manifiesta menor hostilidad alprofesor,

    Y: la hostilidad manifestada por el estudiante hacia sus otroscompaeros donde:

    1: es el puntaje asignado al que manifiesta mayor hostilidadhacia sus compaeros

    12: es el puntaje asignado al que manifiesta menor hostilidadhacia sus compaeros.

    Estudiante Hostilidad Hostilidad a yx ii ( )yx ii 2al profesor los compaeros

    xi yi1 2 6 - 4 162 8 5 3 93 12 10 2 44 3 7 - 4 165 1 3 - 2 46 6 4 2 47 7 9 - 2 48 10 8 2 49 4 1 2 410 9 11 2 411 11 12 - 1 112 5 2 3 9

    TOTAL 84

    .84)( 2 =yx ii

  • 1 9 7

    En el siguiente cuadro se presentan los datos y las corres-pondientes cuentas,

    Luego, el valor del coeficiente de correlacin de Spearman es

    706.0143421

    )1144(12)84(61 ==

    =rS

    La relacin encontrada entre la hostilidad manifiesta a loscompaeros y la hostilidad manifiesta al profesor, es estadstica-mente significativa?. Responderemos con la metodologa de prue-bas de hiptesis.

    Paso 1: En la hiptesis nula se postula que no existe asociacinentre las variables hostilidad a los compaeros y hostilidad alprofesor y la hiptesis alternativa esa dicha afirmacin, es decir:

    0:0 =sH 0:0 sH

    Paso 2: El valor de la estadstica de prueba es:

    21 2

    =

    nr

    rts

    sc =

    212706.01

    706.02

    = 3.15.

    Paso 3: Para = 0.05 ( ) 975.0)2( =

  • 1 9 8

    Ejemplo 4.11

    En la entrevista personal para ingresar a la carrera docente enuna universidad, participaron 40 postulantes quienes fueron ca-lificados por dos miembros del jurado. En la base de DATOS7-jura-do se dispone de la siguiente informacin:

    P: postulantesX1: puntaje asignado a cada postulante por el miembro 1 del ju-

    rado,X2: puntaje asignado a cada postulante por el miembro 2 del ju-

    rado,X: rango que corresponde a las calificaciones del jurado 1,Y: rango que corresponde a las calificaciones del jurado 2,

    y se desea encontrar el coeficiente de correlacin de Spearman.

    Solucin

    Paso1: En la hiptesis nula se postula que los puntajes asigna-dos por los dos jurados no estn relacionados y la hiptesis alter-nativa niega esa afirmacin.

    0:0 =sH 0:0 sH

    Paso 2: Obtendremos el valor de la estadstica de prueba me-diante el soporte del SPSS.

    Abrir la base de DATOS7-jurado, donde la informacin estpreparada de acuerdo a las exigencias de la frmula del coefi-ciente de correlacin de Spearman y ejecutar los siguientes co-mandos:

    Rango a las Rango a lasnotas del notas deljurado 1 jurado 2

    Spearman's rho Rango a las Correlation Coefficient 1.000 .332notas del Sig. (2-tailed)jurado 1 .036Rango a las Correlation Coefficient .332 1.000notas del Sig. (2-tailed) .036jurado 2

  • 1 9 9

    ANALYZE/CORRELATE/BIVARIATE/ seleccionar las varia-bles X e Y/ activar SPEARMAN/ OK.

    El output del SPSS nos muestra lo siguiente:

    Con el valor del coeficiente de correlacin de Spearman de lamuestra 332.0=sr , obtenemos el valor de la estadstica de prueba:

    21 2

    =

    nr

    rts

    sc =

    240332.01

    332.02

    = 2.17

    Paso 3: En la tabla t-Student para el nivel de significacin 0.05 y38 grados de libertad se encuentra el valor terico: 02.2=tericot .

    Paso 4: Como el valor de 217=ct es mayor que el valor terico,entonces se rechaza la hiptesis nula. Obsrvese la importanciadel tamao de muestra.

    Tambin si usamos el criterio del valuep _ se llega a la mis-ma decisin, pues sabemos que si

  • 2 0 0

    y los valores dentro de la tabla o celdas son las frecuencias absolu-tas conjuntas.

    donde:

    f ij , es el nmero de elementos con las modalidades Ai y Bj, de-nominadas frecuencias absolutas conjuntas,

    f i. , es el nmero de elementos con la modalidad Ai denomina-da i-sima frecuencia marginal,

    f j. , es el nmero de elementos con la modalidad Bj denominadaj-sima frecuencia marginal,

    Eligiendo X como variable fila e Y como variable columna,se cumplen las siguientes propiedades:

    ff jk

    iij .

    1

    ==

    , ff ir

    jij .

    1

    ==

    . 1

    .1

    .11

    nr

    jj

    k

    ii

    r

    jij

    k

    ifff ===

    ====

    Al dividir las frecuencias absolutas conjuntas entre el n-mero total de observaciones se obtienen las frecuencias relativasconjuntas hij correspondiente a las modalidades Ai y Bj, y las co-rrespondientes frecuencias relativas marginales; hi. y h j. , las que

    Tabla de frecuencias conjuntas absolutas

    X Y

    B1 B2 . Bj Br Total

    A1 f11 f12 . f1j . f1r f1.A2 f21 f22 . f2j . f2r f2... . .. . . . Ai fi1 fi2 . fij . fir fi.. . . . . . . Ak fk1 fk2 . fki . fkr fk.

    Total f.1 f.2 . f.j f.r n

  • 2 0 1

    se presentan en la siguiente tabla de frecuencias relativas bidimen-sionales.

    donde:

    nf

    h ijij =

    Asimismo, al dividir las frecuencias absolutas marginalesentre el nmero total de observaciones se obtienen las frecuen-cias relativas marginales:

    nf

    hnf

    h jjii .... == .

    Ejemplo 4.12

    Se toma una pequea muestra de docentes que participan en unprograma de capacitacin, para quienes registramos los valoresde las variables sexo y estado civil. Se tabular la informacin en

    Tabla de frecuencias relativas conjuntas

    X Y

    B1 B2 . Bj Br Total

    A1 h11 h12 . h1j . h1r h1.A2 h21 h22 . h2j . h2r h2... . .. . . . Ai hi1 hi2 . hij . hir hi.. . . . . . . Ak hk1 hk2 . hki . hkr hk.

    Total h.1 h.2 . h.j h.r n

  • 2 0 2

    una tabla de doble entrada donde la variable sexo est representa-da en las filas y el estado civil en las columnas.

    Solucin

    Slo con fines didcticos no hacemos uso del SPSS y contamos elnmero de veces que se repite la categora Ai de la variable sexoy el nmero de veces que se repite la categora Bj de la variableestado civil. As, para A1= femenino, A2 = masculino, B1= soltero,B2 = casado se tiene: f22 = 2, es decir, son 2 los estudiantes del sexomasculino y casados; f12 = 6, es decir, son 6 estudiantes del sexo

    Sexo Civil Sexo Civil Sexo civil sexo civil

    Femenino Soltero Femenino Soltero Femenino soltero femenino soltero

    Femenino soltero Masculino Soltero Masculino casado masculino casado

    Masculino soltero Masculino soltero femenino casado femenino casado

    Femenino casado Femenino casado Masculino soltero masculino soltero

    Masculino soltero Femenino soltero femenino casado masculino soltero

    Masculino soltero Femenino soltero femenino casado masculino soltero

    Cuadro N 4.1 Distribucin de los docentes segn sexo y estado civil,participantes en el Programa de Capacitacin de la FCM-UNMSM

    Lima - 2004

    SEXO ESTADO CIVIL Total

    Soltero Casado

    Femenino 7 6 13Masculino 9 2 11

    Total 16 8 24

    femenino y casados. En el siguiente cuadro se presentan las fre-cuencias conjuntas.

  • 2 0 3

    Son 7 docentes solteras y 6 casadas del sexo femenino. Losestudiantes del sexo masculino 9 son solteros y 2 casados.

    En tablas de doble entrada para dos variables cualitativas secalcula el coeficiente de contingencia que mide la relacin entre lasdos variables. Como se ver, ste ndice est en funcin de la esta-dstica ji-cuadrado, 2 , ampliamente usada por los investigadoresde las ciencias sociales, pero que su interpretacin a veces revistedificultades porque no existe un valor de comparacin y puedetomar cualquier valor positivo. El valor del coeficiente de contin-gencia oscila entre 0 y 1.

    Coeficiente de contingencia en la muestra

    Para la presentacin general de una tabla de contingencia parados variables cualitativas se tiene:

    n: tamao de la muestra,f ij : frecuencia absoluta conjunta que corresponde al i-simo nivel

    de la variable fila y al j-simo nivel de la variable columna,

    eij : la frecuencia esperada conjunta que corresponde al i-simonivel de la variable fila y al j-simo nivel de la variable co-lumna, que se calcula con la siguiente frmula:

    nff

    e jiij ..

    = y el valor de la estadstica ji-cuadrado es:

    ( ) = =

    =

    r

    j

    k

    i ijeef ijij

    1 1

    2

    2 .

    Finalmente se define el coeficiente de contingencia como:

  • 2 0 4

    nC

    +=

    2

    2

    cuyos valores oscilan entre 0 y 1.

    Pruebas de hiptesis para el parmetro poblacional

    Paso 1: Se plantea independencia entre la variable fila y la va-riable columna de la tabla de contingencia. En el ejemplo, el sexoy el estado civil de los participantes son independientes. Simbo-lizaremos con:

    0H : Las variables fila y columna son independientes.1H : Las variables fila y columna no son independientes.

    Paso 2: Bajo la hiptesis nula, el estadstico de prueba

    ( ) = =

    =

    r

    j

    k

    i ijeef ijij

    1 1

    2

    2 tiene distribucin chi-cuadrado con (k-1)(r-1) grados de libertad, donde k: es el nmero de niveles de lavariable fila y r es el nmero de niveles de la variable columna.

    Con los datos de la muestra y bajo la hiptesis nula se calcu-la el valor de la estadstica de prueba, 2c .

    Paso 3: Con un nivel de significacin , se compara el valor cal-culado en el paso 2, con el percentil ( ) %1001 de la distribu-cin chi-cuadrado con (k-1)(r-1) grados de libertad, percentil quese denota por .2 )1)(1()1( rkx En la Tabla C del Apndice se expo-nen algunos percentiles de las distribuciones chi-cuadrado.

    Paso 4: Si el valor de la estadstica de prueba, es mayor que2

    )1)(1()1( rkx , se rechaza la hiptesis nula.

  • 2 0 5

    Ejemplo 4.13

    Para la siguiente tabla de contingencia vamos a encontrar el co-eficiente de contingencia entre el sexo y escuela acadmico pro-fesional de los estudiantes.

    Solucin

    a) Se identifican las frecuencias observadas: f11 = 21 f12 = 33 f13= 47 f21 = 37 f22 = 35 f23 = 27. f 1. = 101, f 2. = 99, f . 1 = 58, f . 2 =68, f . 3 = 74.

    b) Se encuentran las frecuencias esperadas con las siguientesfrmulas:

    29.29200

    )58(1011..111

    ===

    neff

    34.34200

    )68(1012..112 === ne

    ff

    37.37200

    )74(1013..113 === ne

    ff

    Cuadro 4.2 Distribucin de los estudiantes de la Facultad deCiencias Matemticas segn sexo y escuelas profesionales.

    Censo universitario- UNMSM. Lima - 2002

    ESCUELAS ACADMICOPROFESIONALES

    SEXO TotalMatemticas Estadstica Investigacin

    Operativa

    FEMENINO 21 33 47 101MASCULINO 37 35 27 99

    Total 58 68 74 200

  • 2 0 6

    71.28200

    )58(991..221 === ne

    ff

    66.33200

    )68(992..222 === ne

    ff

    63.36200

    )74(993..223 === ne

    ff

    c) Se calcula el valor de la estadstica ji-cuadrado:

    ( )

    = =

    =

    3

    1

    2

    1

    2

    2

    j i ijeef ijij ( )29.29

    29.2921 2= + ( )

    34.3434.3433 2 +

    ( )37.37

    37.3747 2+

    ( )71.28

    71.2837 2+

    ( )66.33

    66.3335 2+

    ( )63.36

    63.3627 2

    =9.859.

    d) Finalmente, el valor del coeficiente de contingencia es:

    217.0047.0859.209

    859.9===C .

    Para = 0.05, es estadsticamente significativo el valor en-contrado?.

    Pasamos a aplicar la metodologa de pruebas de hiptesis.

    Prueba de hiptesis para independencia en tablas decontingencia

    Paso 1: Se plantean las hiptesis nula y alternativa:

    0H : El sexo y la escuela acadmico profesional son inde-pendientes.

    1H : El sexo y la escuela acadmico profesional no sonindependientes.

    Paso 2: Bajo la hiptesis nula, el valor de la estadstica deprueba es:

  • 2 0 7

    ( ) = =

    =

    r

    j

    k

    i ijeef ijij

    1 1

    2

    2

    Paso 3: Con un nivel de significacin = 0.05, el percentil 95 de ladistribucin chi-cuadrado con (k-1)(r-1)=(2-1)(3-1)=2 grado de li-bertad, es igual a: 2 )1)(1()1( rkx =

    2)2()95.0( x = 5.99. La regin de rechazo

    es el intervalo (5.99, ).

    Paso 4: El valor de la estadstica de prueba es 9.859 y es mayor que2

    )2()95.0( x = 5.99, por lo que se rechaza la hiptesis nula de indepen-dencia, con un nivel de significacin 0.05.

    Observe la importancia del tamao de la muestra.

    Ejemplo 4.14

    Los datos que dieron origen a la tabla de contingencia usada enel ejemplo 4.13 se encuentran en la base de DATOS8-chi-cuadra-do. Resolveremos el ejemplo anterior usando comandos del SPSS.

    Solucin

    sexo de los estudiantes- FACULTAD DE MATEMTICAS* escuelas acadmico profesionales- FACULTAD DEMATEMTICAS Crosstabulation

    Count

    escuelas acadmico profesionales-FACULTAD DE MATEMTICAS

    matematicas estadstica investigacin Totaloperativa

    sexo de los FEMENINO 21 33 47 101estudiantes-FACULTAD DE MASCULINO 37 35 27 99MATEMTICAS

    Total 58 68 74 200

  • 2 0 8

    Abrir la base de DATOS8-chi-cuadrado y ejecutar los comandos:ANALYZE/DESCRIPTIVE STATISTICS/STATISTIC / elegir enROW la variable SEXO y como COLUMNS la variable ESCUELAACADMICO PROFESIONAL/ STATISTICS/ activar CHI-CUADRADO CONTINGENCY/ PEARSON/ CONTINUE/ OK.El output del SP=SS es el siguiente:

    Se observa que el valor del coeficiente de contingencia es 0.217y el valor de la estadstica de prueba es 9.859, valores que coincidencon los obtenidos en el paso anterior.

    Para la prueba de hiptesis procedemos de la siguientemanera:

    Paso 1: Se plantean las hiptesis nula y alternativa:

    0H : El sexo y la escuela acadmico profesional son inde-pendientes.

    1H : El sexo y la escuela acadmico profesional no sonindependientes.

    Paso 2: Bajo la hiptesis nula, el valor de la estadstica de prue-ba es: 859.92 =c .

    Value df Asymp.Sig. (2-sided)

    PearsonChi-Square 9.859 2 .007

    Value Approx. Sig.

    Nominal by Contingency .217 .007Nominal Coefficient

  • 2 0 9

    Paso 3: Con un nivel de significacin = 0.05, si valuep _ < se rechaza la hiptesis nula.

    Paso 4: Como valuep _ = 0.007 < 0.05, la decisin es recha-zar la hiptesis nula de independencia entre sexo y la elec-cin de la Escuela Acadmico Profesional, para el nivel de sig-nificacin 0.05

    Ejercicios

    Seleccione la base de DATOS10-maestra y:a) Construya las tablas de doble entrada con las frecuencias

    absolutas y relativas para las variables condicin laboral delos estudiantes y el mtodo con el que estudiaron el curso deestadstica.

    b) Interprete algunas frecuencias absolutas y relativas con-juntas.

    c) Encuentre el coeficiente de contingencia e interpretar suvalor.

    d) Con = 0.10, es estadsticamente significativa la asocia-cin encontrada entre la condicin laboral de los estudian-tes y el mtodo con el que estudiaron?. Resuelva detallada-mente considerando todos los pasos desde el planteamientode las hiptesis hasta la decisin.

    Seleccione la base de DATOS8-chi-cuadrado y:a) Construya las tablas de doble entrada con las frecuencias

    absolutas y relativas para las variables expectativas respec-to a su futuro y escuela profesional.

    b) Interprete algunas frecuencias absolutas y relativas con-juntas.

    c) Encontrar el coeficiente de contingencia.d) Con = 0.10, es estadsticamente significativa la asocia-

    cin encontrada entre las expectativas respecto a su futuroy la escuela profesional escogida?. Resuelva detalladamenteconsiderando todos los pasos desde el planteamiento de las

  • 2 1 0

    hiptesis hasta la decisin.

    Seleccione la base de DATOS8-chi-cuadrado y:a) Construya las tablas de doble entrada con las frecuencias

    absolutas y relativas para el medio de transporte que usanpara dirigirse a la universidad y el sexo de los estudiantes.

    b) Interprete algunas frecuencias absolutas y relativas con-juntas.

    c) Encuentre el coeficiente de contingencia e interpretar su valor.d) Con = 0.10, es estadsticamente significativa la asociacin

    encontrada entre el medio de transporte utilizado para dirigir-se a la universidad y el sexo de los estudiantes?. Resuelva deta-lladamente considerando todos los pasos desde el planteamien-to de las hiptesis hasta la decisin.

    Para el ejercicio 4.1 encuentre el coeficiente de asociacin phientre la variable fila condicin laboral y la variable columnamtodo con el que estudiaron el curso de estadstica. Interprete.Al nivel de significacin = 0.10, es estadsticamente significati-vo el valor encontrado?.

    En la base de DATOS10-maestra seleccione las variables mto-do de enseanza y notas en el curso de estadstica.a) Defina una nueva variable ficticia X0 y guarde en ella las

    notas de estadstica para los que estudiaron con el mtodotradicional.

    b) Defina una nueva variable ficticia X1 y guarde en ella lasnotas de estadstica para los que estudiaron con el mtodono tradicional.

    c) Encuentre la media aritmtica de las dos variables ante-riores.

    d) Encuentre la desviacin estndar de las notas de estadstica.e) Encuentre el coeficiente de correlacin biseral-puntual e in-

    terprete su valor.f) Es estadsticamente significativo el valor encontrado, cuan-

    do = 0.10?.

  • 2 1 1

    De una poblacin de nios de 10 aos se seleccion una muestrade 100 nios, 50 de los cuales tenan algn conocimiento de in-gls y los otros 50 nios no tenan ningn conocimiento de in-gls. Se les aplic las pruebas de retencin de dgitos y de voca-bulario, con los siguientes resultados:

    a) Calcular e interprete el coeficiente phi entre el idioma y laretencin de dgitos.

    b) Es estadsticamente significativo el valor encontrado?. Use = 0.10.

    c) Calcule e interprete el coeficiente phi entre el idioma y laretencin de vocabulario.

    d) Es estadsticamente significativo el valor encontrado?. Use = 0.10.

    De una muestra de 150 estudiantes se escogi datos dicoto-

    RETENCIN DE DGITOSINGLS

    NO(0) SI(1)

    CONOCEN (1) 25 25 50NO CONOCEN (0) 39 21 50

    64 56 100

    RETENCIN DE VOCABULARIOINGLS

    NO(0) SI(1) TOTAL

    CONOCEN (1) 22 28 50NO CONOCEN (0) 39 11 50

    TOTAL 61 39 100

  • 2 1 2

    mizados en ejecucin de lectura X y en lateralidad Y (consisten-cia con el cual se emplea "un solo" lado del cuerpo ojo-mano-pie). Los datos se dieron en forma de juicios de ejecucin, malalectura (0), buena lectura (1) y consistencia en el uso de un sololado del cuerpo, alta (19 o baja (0). Los resultados fueron lossiguientes:

    Suponga que las dos variables subyacentes a ambas dicotmicasson continuas.a) Calcule el coeficiente de correlacin tetracrico entre ejecu-

    cin de lectura y lateralidad.a) Es estadsticamente significativo el coeficiente encontrado?.

    Use = 0.10.b) Encuentre el coeficiente de correlacin biseral entre la nota

    de ingreso y el rendimiento

    Use la base de DATOS10-maestra:b) Dicotomice la variable nota de ingreso a la maestra. prome-

    dio al semestre 99-II.c) Es estadsticamente significativo el coeficiente encontrado?.

    Use = 0.10.

    Resuelva los ejercicios propuestos en el desarrollo del captulo.

    EJECUCIN EN LECTURALATERAL

    MALA(0) BUENA(1) TOTAL

    ALTA(1) 18 42 60BAJA(0) 28 62 90

    TOTAL 46 104 150