19 Sesión 19.pdf
-
Upload
juanquiroz4412 -
Category
Documents
-
view
222 -
download
0
Transcript of 19 Sesión 19.pdf
-
8/19/2019 19 Sesión 19.pdf
1/24
ESTADÍSTICAS ISesión 19
11 de noviembre de 2015
Prof. Gabriel [email protected]
Escuela de Sociología
-
8/19/2019 19 Sesión 19.pdf
2/24
ANÁLISIS BIVARIADOCorrelación Lineal
-
8/19/2019 19 Sesión 19.pdf
3/24
Relación entre dos variables cuantitativas
• Cuando los datos bivariados corresponden a dos variablescuantitativas, habitualmente se expresan como paresordenados (x, y).
• Se dice que estos datos están ordenados porque siempre seescribe primero el valor “x” (variable independiente).
• Están pareados ya que para cada valor de “x” existe un
valor de “y” que proviene de la misma fuente.
-
8/19/2019 19 Sesión 19.pdf
4/24
Relación entre dos variables cuantitativas
• Cuando estamos en presencia de una relación bivariada dedatos cuantitativos se puede realizar un diagrama dedispersión, que:
a) Corresponde al gráfico de todos los pares ordenados de
datos de dos variables que están en un sistema de ejescoordenados.
b) La variable “x”, se grafica en el eje horizontal; la variable “y” se grafica en el eje vertical.
-
8/19/2019 19 Sesión 19.pdf
5/24
Ejemplo 1: Puntajes de satisfacción en el trabajo (y)y salario diario (x)
-
8/19/2019 19 Sesión 19.pdf
6/24
Ejemplo 2: Años de edad(x) e Ingreso (y)
18000
518000
1018000
1518000
2018000
2518000
3018000
3518000
15 25 35 45 55 65 75 85
-
8/19/2019 19 Sesión 19.pdf
7/24
Diagrama de dispersión
• El diagrama de dispersión muestra la posibilidad de laexistencia de correlación entre dos variables cuantitativas.
Ejemplo: Un psicólogoexperimental afirma que, enun experimento controlado,cuánta más edad (x) tengaun niño tanto menor será sunúmero de respuestasirrelevantes (y). Lossiguientes datos fueronrecopilados para comprobarsu aseveración.
4
5
6
7
8
9
10
11
12
13
14
1 2 3 4 5 6 7 8 9 10 11 12 13
Edad
Res
puestasIrrelevantes
-
8/19/2019 19 Sesión 19.pdf
8/24
Correlación Lineal
• En los gráficos anteriores es posible identificar relación entrevariables cuantitativas.
• Debido a que los puntos correspondientes a cada par
ordenado se agrupan alrededor de una línea diagonal recta,se puede hablar de una relación lineal entre estas variables.
• Esta relación se denomina “Correlación Lineal” y se mide através del “Coeficiente de Correlación Lineal”.
• El Coeficiente de Correlación Lineal mide el grado deintensidad de esta posible relación entre dos variablescuantitativas.
-
8/19/2019 19 Sesión 19.pdf
9/24
Correlaciones
• De todas formas, pese a que nos enfocaremos en ella, laCorrelación Lineal no es la única forma de relación quepuede existir entre dos variables cuantitativas.
• En efecto, existen diagramas de dispersión que muestranpatrones de relaciones entre variables que no se pueden
identificar con una línea recta, en este caso, aún habiendocorrelación ésta no es lineal. Por ejemplo, una relaciónexponencial.
• No obstante, si ha medida que crece o aumenta “x” no hayun cambio definido en los valores de “y”, se dice que no haycorrelación o que no existe relación entre “x” e “y”.
-
8/19/2019 19 Sesión 19.pdf
10/24
Correlaciones
Relación Lineal Relación Exponencial
Sin relación
-
8/19/2019 19 Sesión 19.pdf
11/24
Coeficiente de Correlación Lineal
• El Coeficiente de Correlación Lineal se puede calcular con lasiguiente fórmula:
• El coeficiente que mide la correlación lineal entre dosvariables cuantitativas se denomina “Pearson”.
• Se denomina a la correlación poblacional y r a la correlación
muestral.
y x s sn
y y x xr
)1(
))((
-
8/19/2019 19 Sesión 19.pdf
12/24
Coeficiente de Correlación Lineal
2
2
)(:
)(:
))((:
:
:
y y E
x x D
y y x xC
y y B
x x A
8983,24,85
42
1
)( 2
n
x x
s x
y x s sn
y y x xr
)1(
))((
-0,95816,2*898,2*5
30
r
1602,2666667,45
33333,23
1
)( 2
n
y y s
y
x y A B C D E 1 3 8 -4 3,33 -13,33 16 11,112 5 5 -2 0,33 -0,67 4 0,113 6 6 -1 1,33 -1,33 1 1,784 8 4 1 -0,67 -0,67 1 0,44
5 9 3 2 -1,67 -3,33 4 2,786 11 2 4 -2,67 -10,67 16 7,11Total 42 28 -30 42 23,33
-
8/19/2019 19 Sesión 19.pdf
13/24
Fórmula Alternativa
n
y y
n
x x
n
y x y x
r
i
i
i
i
ii
ii
2
2
2
2
)(*)( ySC xSC
xySC r
-
8/19/2019 19 Sesión 19.pdf
14/24
Ejemplo 3: Notas
• A continuación se presentan las notas para una muestra de 10alumnos para dos materias: Matemáticas y Lenguaje.
10
348138510
3249381
10
59*57376
r
09,2070
7,39
9,36*1,56
7,39r
0,8725611945,4982417
7,39r
Leng. Matem. (x*y) x2 y2
1 2 2 4 4 4
2 2 4 8 4 163 5 5 25 25 25
4 6 5 30 36 25
5 5 6 30 25 36
6 7 6 42 49 367 5 7 35 25 49
8 8 7 56 64 49
9 7 8 56 49 64
10 10 9 90 100 81
Total 57 59 376 381 385
-
8/19/2019 19 Sesión 19.pdf
15/24
Interpretación del Coeficiente de Pearson
• El Coeficiente de Pearson toma valores entre -1 y 1
a) Si "r" > 0, la correlación lineal es positiva (si sube el valor unavariable sube el de la otra). La correlación es tanto mas fuertecuanto mas se aproxime a 1.
b) Si "r" < 0, la correlación lineal es negativa (si sube el valor deuna variable disminuye el de la otra). La correlación negativa estanto mas fuerte cuanto mas se aproxime a -1.
c) Si "r" = 0, no existe correlación lineal entre las variables. Aunquepodría existir otro tipo de correlación (parabólica, exponencial, etc.)
Resumen:
• Variables son independientes = 0.• Variables perfectamente relacionadas linealmente =1
• A mayor valor de r mayor relación entre las variables.
-
8/19/2019 19 Sesión 19.pdf
16/24
Interpretación del Coeficiente de Pearson
• Sobre el Coeficiente de Pearson también debemos interpretar suintensidad. Como sabemos, cuanto más se acerquen los valores 1más fuerte será la correlación entre las variables.
• Sin considerar el signo (dirección) de “r”, se recomiendan lossiguientes criterios:
- Si “r " = 0 no hay correlación lineal entre las variables
- Si 0 < "r" < 0,1 la correlación lineal entre las variables es muy débil
- Si 0,1 < "r" < 0,3 la correlación lineal entre las variables es débil
- Si 0,3 < "r" < 0,5 la correlación lineal entre las variables es
moderada- Si 0,5 < "r" < 0,7 la correlación lineal entre las variables es fuerte
- Si 0,7 < "r" < 1 la correlación lineal entre las variables es muyfuerte
- Si “r" = 1 hay correlación lineal perfecta entre las variables (sóloocurre al relacionar la variable con sí misma).
-
8/19/2019 19 Sesión 19.pdf
17/24
Entonces…
• El coeficiente de correlación lineal mide el grado de intensidad deesta posible relación entre las variables cuantitativas.
• Este coeficiente se aplica cuando la relación que puede existir
entre las variables es lineal.
• Si representáramos en un gráfico los pares de valores de las dosvariables (dispersión), la nube de puntos se aproximaría a unarecta.
• Si se concluye que hay una correlación lineal significativa entre las
dos variables (x e y), se puede obtener una ecuación lineal que
exprese “la variable y” en términos de “x”… Anális is de Regresión
Lineal.
-
8/19/2019 19 Sesión 19.pdf
18/24
SPSSCorrelación Lineal
-
8/19/2019 19 Sesión 19.pdf
19/24
PROCEDIMIENTO SPSS (i)
1) Seleccionar lasvariables (dos variablescuantitativas dondeteóricamente exista una
relación de dependencia)
2) Ir a ANALIZAR /
CORRELACIONESBIVARIADA
-
8/19/2019 19 Sesión 19.pdf
20/24
PROCEDIMIENTO SPSS (ii)
3) Seleccionar las dosvariables cuantitativas:en este caso EDAD yEvaluación de Twitter
(1 a 7)
4) El coeficiente decorrelación lineal de
Pearson está marcadopor defecto
-
8/19/2019 19 Sesión 19.pdf
21/24
Resultados
• Dirección: la correlación lineal entre la variable edad y la evaluación
que se ponen las personas a la labor informativa de Twitter esnegativa (signo negativo). Es decir, a medida que se incrementa laedad de las personas (x), la evaluación disminuye.
• Intensidad: de acuerdo al valor del coeficiente de Pearson (-0,248)podemos afirmar que la correlación lineal entre las variables es débil.
-
8/19/2019 19 Sesión 19.pdf
22/24
Ejemplo 1: Datos de Países del Banco Mundial
• Dirección: la correlación lineal entre la variable Tasa de incidencia en lapobreza y la Esperanza de vida al nacer es negativa (signo negativo). Esdecir, a medida que se incrementa la tasa de incidencia en la pobreza delos países (x), la esperanza de vida de los mismos disminuye.
• Intensidad: de acuerdo al valor del coeficiente de Pearson (-0,579) podemos
afirmar que la correlación lineal entre las variables es fuerte.
Tasa de
incidencia de
la pobreza,
sobre la
base de la
línea de
pobreza
nacional (%
de la
población)
Esperanza
de vida al
nacer, total
(años)
Correlación de Pearson 1 -,579**
Sig. (bilateral) ,000
N101 100
Correlación de Pearson -,579** 1
Sig. (bilateral) ,000
N 100 202
Correlaciones
Tasa de incidencia de la pobreza,sobre la base de la línea de
pobreza nacional (% de la
población)
Esperanza de vida al nacer, total
(años)
**. La correlación es significativa en el nivel 0,01 (bilateral).
-
8/19/2019 19 Sesión 19.pdf
23/24
Ejemplo 2: Datos de Países del Banco Mundial
• Dirección: la correlación lineal entre la variable Mejora en las instalacionessanitarias y la Esperanza de vida al nacer es positiva (signo positivo). Esdecir, a medida que se incrementa la mejora de las instalacionessanitarias de los países (x), la esperanza de vida de los mismos también
aumenta.
• Intensidad: de acuerdo al valor del coeficiente de Pearson (0,793) podemosafirmar que la correlación lineal entre las variables es muy fuerte.
Esperanza
de vida al
nacer, total
(años)
Mejora de las
instalaciones
sanitarias,
sector
urbano (% de
la población
con acceso)
Correlación de Pearson 1 ,793**
Sig. (bilateral) ,000
N 202 173
Correlación de Pearson ,793** 1
Sig. (bilateral) ,000
N 173 176
Correlaciones
Esperanza de vida al nacer, total(años)
Mejora de las instalaciones
sanitarias , sector urbano (% de la
población con acceso)
**. La correlación es significativa en el nivel 0,01 (bilateral).
-
8/19/2019 19 Sesión 19.pdf
24/24
BIBLIOGRAFÍA• Johnson, R. & Kuby, P. (2008). Es tadística Elemen tal : lo esencial
México: Cengage Learning.
• Pagano, R. (1999). Estadístic a en las cienc ias delcompor tamiento . México: Thomson.
• Pérez López, C. (2005). Técn ic as es tadíst ic as con SPSS 12:aplic aciones al análisis de dato s . Capítulo N°6.
• Ritchey, F. (2008). Estadístic a para las Cienc ias Soc iales . México:McGrawll Hill.
• Ross, S. (2007). Intr oducc ión a la Estadístic a . España: Reverté.
• Weiss, N. A. (2011). Elementary Statistics. Capítulo N°4