19 Sesión 19.pdf

download 19 Sesión 19.pdf

of 10

Transcript of 19 Sesión 19.pdf

  • 8/19/2019 19 Sesión 19.pdf

    1/24

     

    ESTADÍSTICAS ISesión 19

    11 de noviembre de 2015

    Prof. Gabriel [email protected]

    Escuela de Sociología

  • 8/19/2019 19 Sesión 19.pdf

    2/24

     

     ANÁLISIS BIVARIADOCorrelación Lineal

  • 8/19/2019 19 Sesión 19.pdf

    3/24

    Relación entre dos variables cuantitativas

    • Cuando los datos bivariados corresponden a dos variablescuantitativas, habitualmente se expresan como paresordenados (x, y).

    • Se dice que estos datos están ordenados porque siempre seescribe primero el valor “x” (variable independiente).

    • Están pareados ya que para cada valor de “x” existe un

    valor de “y” que proviene de la misma fuente.

  • 8/19/2019 19 Sesión 19.pdf

    4/24

    Relación entre dos variables cuantitativas

    • Cuando estamos en presencia de una relación bivariada dedatos cuantitativos se puede realizar un diagrama dedispersión, que:

    a) Corresponde al gráfico de todos los pares ordenados de

    datos de dos variables que están en un sistema de ejescoordenados.

    b) La variable “x”, se grafica en el eje horizontal; la variable “y” se grafica en el eje vertical.

  • 8/19/2019 19 Sesión 19.pdf

    5/24

    Ejemplo 1: Puntajes de satisfacción en el trabajo (y)y salario diario (x)

  • 8/19/2019 19 Sesión 19.pdf

    6/24

    Ejemplo 2: Años de edad(x) e Ingreso (y)

    18000

    518000

    1018000

    1518000

    2018000

    2518000

    3018000

    3518000

    15 25 35 45 55 65 75 85

  • 8/19/2019 19 Sesión 19.pdf

    7/24

    Diagrama de dispersión

    • El diagrama de dispersión muestra la posibilidad de laexistencia de correlación entre dos variables cuantitativas.

    Ejemplo: Un psicólogoexperimental afirma que, enun experimento controlado,cuánta más edad (x) tengaun niño tanto menor será sunúmero de respuestasirrelevantes (y). Lossiguientes datos fueronrecopilados para comprobarsu aseveración.

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    1 2 3 4 5 6 7 8 9 10 11 12 13

    Edad

    Res

    puestasIrrelevantes

  • 8/19/2019 19 Sesión 19.pdf

    8/24

    Correlación Lineal

    • En los gráficos anteriores es posible identificar relación entrevariables cuantitativas.

    • Debido a que los puntos correspondientes a cada par

    ordenado se agrupan alrededor de una línea diagonal recta,se puede hablar de una relación lineal entre estas variables.

    • Esta relación se denomina “Correlación Lineal” y se mide através del “Coeficiente de Correlación Lineal”. 

    • El Coeficiente de Correlación Lineal mide el grado deintensidad de esta posible relación entre dos variablescuantitativas.

  • 8/19/2019 19 Sesión 19.pdf

    9/24

    Correlaciones

    • De todas formas, pese a que nos enfocaremos en ella, laCorrelación Lineal no es la única forma de relación quepuede existir entre dos variables cuantitativas.

    • En efecto, existen diagramas de dispersión que muestranpatrones de relaciones entre variables que no se pueden

    identificar con una línea recta, en este caso, aún habiendocorrelación ésta no es lineal. Por ejemplo, una relaciónexponencial. 

    • No obstante, si ha medida que crece o aumenta “x” no hayun cambio definido en los valores de “y”, se dice que no haycorrelación o que no existe relación entre “x” e “y”. 

  • 8/19/2019 19 Sesión 19.pdf

    10/24

    Correlaciones

    Relación Lineal Relación Exponencial

    Sin relación

  • 8/19/2019 19 Sesión 19.pdf

    11/24

    Coeficiente de Correlación Lineal

    • El Coeficiente de Correlación Lineal se puede calcular con lasiguiente fórmula:

    • El coeficiente que mide la correlación lineal entre dosvariables cuantitativas se denomina “Pearson”. 

    • Se denomina a la correlación poblacional y r a la correlación

    muestral.

     y x s sn

     y y x xr 

    )1(

    ))((

  • 8/19/2019 19 Sesión 19.pdf

    12/24

    Coeficiente de Correlación Lineal

    2

    2

    )(:

    )(:

    ))((:

    :

    :

     y y E 

     x x D

     y y x xC 

     y y B

     x x A

    8983,24,85

    42

    1

    )(   2

     

    n

     x x

     s x

     y x s sn

     y y x xr 

    )1(

    ))((

    -0,95816,2*898,2*5

    30

    1602,2666667,45

    33333,23

    1

    )(   2

     

    n

     y y s

     y

      x y A  B  C  D  E 1 3 8 -4 3,33 -13,33 16 11,112 5 5 -2 0,33 -0,67 4 0,113 6 6 -1 1,33 -1,33 1 1,784 8 4 1 -0,67 -0,67 1 0,44

    5 9 3 2 -1,67 -3,33 4 2,786 11 2 4 -2,67 -10,67 16 7,11Total 42 28 -30 42 23,33

  • 8/19/2019 19 Sesión 19.pdf

    13/24

    Fórmula Alternativa

     

     

     

     

     

     

     

     

       

     

    n

     y y

    n

     x x

    n

     y x y x

    i

    i

    i

    i

    ii

    ii

    2

    2

    2

    2

    )(*)(   ySC  xSC 

     xySC r  

  • 8/19/2019 19 Sesión 19.pdf

    14/24

    Ejemplo 3: Notas

    •  A continuación se presentan las notas para una muestra de 10alumnos para dos materias: Matemáticas y Lenguaje.

      

      

      

      

    10

    348138510

    3249381

    10

    59*57376

    09,2070

    7,39

    9,36*1,56

    7,39r 

    0,8725611945,4982417

    7,39r 

    Leng. Matem. (x*y) x2 y2

    1 2 2 4 4 4

    2 2 4 8 4 163 5 5 25 25 25

    4 6 5 30 36 25

    5 5 6 30 25 36

    6 7 6 42 49 367 5 7 35 25 49

    8 8 7 56 64 49

    9 7 8 56 49 64

    10 10 9 90 100 81

    Total 57 59 376 381 385

  • 8/19/2019 19 Sesión 19.pdf

    15/24

    Interpretación del Coeficiente de Pearson

    • El Coeficiente de Pearson toma valores entre -1 y 1 

    a) Si "r" > 0, la correlación lineal es positiva (si sube el valor unavariable sube el de la otra). La correlación es tanto mas fuertecuanto mas se aproxime a 1.

    b) Si "r" < 0, la correlación lineal es negativa (si sube el valor deuna variable disminuye el de la otra). La correlación negativa estanto mas fuerte cuanto mas se aproxime a -1.

    c) Si "r" = 0, no existe correlación lineal entre las variables. Aunquepodría existir otro tipo de correlación (parabólica, exponencial, etc.)

    Resumen:

    • Variables son independientes  = 0.• Variables perfectamente relacionadas linealmente  =1

    •  A mayor valor de r mayor relación entre las variables.

  • 8/19/2019 19 Sesión 19.pdf

    16/24

    Interpretación del Coeficiente de Pearson

    • Sobre el Coeficiente de Pearson también debemos interpretar suintensidad. Como sabemos, cuanto más se acerquen los valores 1más fuerte será la correlación entre las variables. 

    • Sin considerar el signo (dirección) de “r”, se recomiendan lossiguientes criterios:

    - Si “r " = 0  no hay correlación lineal entre las variables 

    - Si 0 < "r" < 0,1  la correlación lineal entre las variables es muy débil

    - Si 0,1 < "r" < 0,3  la correlación lineal entre las variables es débil

    - Si 0,3 < "r" < 0,5  la correlación lineal entre las variables es

    moderada- Si 0,5 < "r" < 0,7  la correlación lineal entre las variables es fuerte

    - Si 0,7 < "r" < 1  la correlación lineal entre las variables es muyfuerte

    - Si “r" = 1  hay correlación lineal perfecta entre las variables (sóloocurre al relacionar la variable con sí misma). 

  • 8/19/2019 19 Sesión 19.pdf

    17/24

    Entonces… 

    • El coeficiente de correlación lineal mide el grado de intensidad deesta posible relación entre las variables cuantitativas.

    • Este coeficiente se aplica cuando la relación que puede existir

    entre las variables es lineal.

    • Si representáramos en un gráfico los pares de valores de las dosvariables (dispersión), la nube de puntos se aproximaría a unarecta.

    • Si se concluye que hay una correlación lineal significativa entre las

    dos variables (x e y), se puede obtener una ecuación lineal que

    exprese “la variable y” en términos de “x”… Anális is de Regresión

    Lineal.

  • 8/19/2019 19 Sesión 19.pdf

    18/24

     

    SPSSCorrelación Lineal

  • 8/19/2019 19 Sesión 19.pdf

    19/24

    PROCEDIMIENTO SPSS (i)

    1) Seleccionar lasvariables (dos variablescuantitativas dondeteóricamente exista una

    relación de dependencia)

    2) Ir a ANALIZAR /

    CORRELACIONESBIVARIADA

  • 8/19/2019 19 Sesión 19.pdf

    20/24

    PROCEDIMIENTO SPSS (ii)

    3) Seleccionar las dosvariables cuantitativas:en este caso EDAD yEvaluación de Twitter

    (1 a 7)

    4) El coeficiente decorrelación lineal de

    Pearson está marcadopor defecto

  • 8/19/2019 19 Sesión 19.pdf

    21/24

    Resultados

    • Dirección: la correlación lineal entre la variable edad y la evaluación

    que se ponen las personas a la labor informativa de Twitter esnegativa (signo negativo). Es decir, a medida que se incrementa laedad de las personas (x), la evaluación disminuye.

    • Intensidad: de acuerdo al valor del coeficiente de Pearson (-0,248)podemos afirmar que la correlación lineal entre las variables es débil.

  • 8/19/2019 19 Sesión 19.pdf

    22/24

    Ejemplo 1: Datos de Países del Banco Mundial

    • Dirección: la correlación lineal entre la variable Tasa de incidencia en lapobreza y la Esperanza de vida al nacer es negativa (signo negativo). Esdecir, a medida que se incrementa la tasa de incidencia en la pobreza delos países (x), la esperanza de vida de los mismos disminuye.

    • Intensidad: de acuerdo al valor del coeficiente de Pearson (-0,579) podemos

    afirmar que la correlación lineal entre las variables es fuerte.

    Tasa de

    incidencia de

    la pobreza,

    sobre la

    base de la

    línea de

    pobreza

    nacional (%

    de la

    población)

    Esperanza

    de vida al

    nacer, total

    (años)

    Correlación de Pearson 1 -,579**

    Sig. (bilateral) ,000

    N101 100

    Correlación de Pearson -,579** 1

    Sig. (bilateral) ,000

    N 100 202

    Correlaciones

    Tasa de incidencia de la pobreza,sobre la base de la línea de

    pobreza nacional (% de la

    población)

    Esperanza de vida al nacer, total

    (años)

    **. La correlación es significativa en el nivel 0,01 (bilateral).

  • 8/19/2019 19 Sesión 19.pdf

    23/24

    Ejemplo 2: Datos de Países del Banco Mundial

    • Dirección: la correlación lineal entre la variable Mejora en las instalacionessanitarias y la Esperanza de vida al nacer es positiva (signo positivo). Esdecir, a medida que se incrementa la mejora de las instalacionessanitarias de los países (x), la esperanza de vida de los mismos también

    aumenta.

    • Intensidad: de acuerdo al valor del coeficiente de Pearson (0,793) podemosafirmar que la correlación lineal entre las variables es muy fuerte.

    Esperanza

    de vida al

    nacer, total

    (años)

    Mejora de las

    instalaciones

    sanitarias,

    sector

    urbano (% de

    la población

    con acceso)

    Correlación de Pearson 1 ,793**

    Sig. (bilateral) ,000

    N 202 173

    Correlación de Pearson ,793** 1

    Sig. (bilateral) ,000

    N 173 176

    Correlaciones

    Esperanza de vida al nacer, total(años)

    Mejora de las instalaciones

    sanitarias , sector urbano (% de la

    población con acceso)

    **. La correlación es significativa en el nivel 0,01 (bilateral).

  • 8/19/2019 19 Sesión 19.pdf

    24/24

    BIBLIOGRAFÍA• Johnson, R. & Kuby, P. (2008). Es tadística Elemen tal : lo esencial 

    México: Cengage Learning.

    • Pagano, R. (1999). Estadístic a en las cienc ias delcompor tamiento . México: Thomson.

    • Pérez López, C. (2005). Técn ic as es tadíst ic as con SPSS 12:aplic aciones al análisis de dato s . Capítulo N°6.

    • Ritchey, F. (2008). Estadístic a para las Cienc ias Soc iales . México:McGrawll Hill.

    • Ross, S. (2007). Intr oducc ión a la Estadístic a . España: Reverté.

    • Weiss, N. A. (2011). Elementary Statistics. Capítulo N°4