Ejercicio seminario 9

5
EJERCICIO SEMINARIO 9 1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación? 2. Averigua, usando SPSS y también sin usar SPSS, si existe correlación entre la FC y la edad en la población de donde proviene la muestra, para un nivel de significación de 0,01, razonando paso a paso la decisión tomada. FC 96 65 100 90 72 95 61 82 Edad 47 58 35 72 69 52 24 80 1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación? FC 61 100 96 95 65 72 90 82 Edad 24 35 47 52 58 69 72 80 La correlación lineal se da cuando se modifica una variable, en este caso la edad, y se consecuentemente también se modifican los valores de la otra, FC. Aparentemente, observando los datos de la tabla ya ordenados podemos decir que no existe correlación entre las variables FC y edad. No obstante, también realizamos un gráfico con el programa SPSS para observar la distribución de los datos en un diagrama de dispersión, en el que a simple vista tampoco existe una distribución lineal de los datos, es decir, la nube de puntos no se distribuye alrededor de una recta imaginaria.

Transcript of Ejercicio seminario 9

Page 1: Ejercicio seminario 9

EJERCICIO SEMINARIO 9

1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por

qué. Y si existe, ¿Cómo es la correlación?

2. Averigua, usando SPSS y también sin usar SPSS, si existe correlación entre la FC y la

edad en la población de donde proviene la muestra, para un nivel de significación de 0,01,

razonando paso a paso la decisión tomada.

FC 96 65 100 90 72 95 61 82Edad 47 58 35 72 69 52 24 80

1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por

qué. Y si existe, ¿Cómo es la correlación?

FC 61 100 96 95 65 72 90 82

Edad 24 35 47 52 58 69 72 80

La correlación lineal se da cuando se modifica una variable, en este caso la edad, y se

consecuentemente también se modifican los valores de la otra, FC.

Aparentemente, observando los datos de la tabla ya ordenados podemos decir que no existe

correlación entre las variables FC y edad. No obstante, también realizamos un gráfico con el

programa SPSS para observar la distribución de los datos en un diagrama de dispersión, en el

que a simple vista tampoco existe una distribución lineal de los datos, es decir, la nube de

puntos no se distribuye alrededor de una recta imaginaria.

No obstante, esta información no la hemos obtenido de forma científica, y para asegurarnos de

que no es errónea debemos hallar los coeficientes de correlación entre las variables. Luego, en

primer lugar debemos elegir la prueba que realizaremos: cuando los datos cumplen

normalidad, utilizamos Pearson o si no, asumismo Spearman.

Page 2: Ejercicio seminario 9

Pruebas de normalidad

,188 8 ,200* ,908 8 ,342,149 8 ,200* ,971 8 ,906

Frecuencia_cardiadaEdad

Estadístico gl Sig. Estadístico gl Sig.Kolmogorov-Smirnova Shapiro-Wilk

Este es un límite inferior de la significación verdadera.*.

Corrección de la significación de Lillieforsa.

Para comprobar si las variables se distribuyen normalmente, utilizamos el test de

Shapiro Wilks, puesto que el tamaño de la muestra (n=8) es menor que 50. (De no ser

así, utilizaríamos Kolmogorov). Planteamos las hipótesis:

H0: la FC y la edad se distribuyen normalmente.

H1: la FC y la edad no se distribuyen normalmente.

Observando la tabla que hemos obtenido mediante SPSS podemos extraer que el P

valor de Shapiro Wilk es 0,342.

Este valor es mayor que el nivel de significancia que hemos asumido (∝=0,01) por

lo que son normales.

Realizado el test de normalidad, y comprobado que las variables FC y edad se distribuyen

normalmente, podemos asumir Pearson. Para ello, tenemos que elaborar la siguiente tabla

donde: Y=frecuencia cardiaca, X=edad

Xi Yi Xi2 Yi2 Xi Yi

24 61 576 3271 1464

35 100 1225 10000 3500

47 96 2209 9216 4512

52 95 2704 9025 4940

58 65 3364 4225 3770

69 72 4761 5184 4968

72 90 5184 8100 6480

80 82 6400 6724 6560

437 661 26423 56195 36194

Por último, aplicamos la siguiente fórmula:

r= [n∑ XY - ∑X∑Y] / √ [(n∑X² - (∑X)²) (n∑Y² - (∑Y²)]

r= [(8 · 36194) – (437 · 661)] / √ [((8 · 26423²) - (437)²)· ((8 · 56559²) · (661)²)] = [695] / √

[20415 · 12639] = 0.043

Page 3: Ejercicio seminario 9

Como el valor que hemos obtenido de r es distinto a 0, afirmamos que existe correlación entre

ambas variables aunque esta es muy débil, no obstantes, asumimos un margen de error del

0,001.

2. Averigua, sin usar SPSS, si existe correlación entre FC y edad en la población de donde

proviene la muestra, para un nivel significación de 0.01, razonando paso a paso la decisión

tomada.

En primer lugar, es conveniente establecer las hipótesis:

Ho: no existe relación entre las variables.

H1: existe correlación entre las variables.

Como ya hemos comprobado anteriormente, las variables FC y edad se distribuyen

normalmente y su coeficiente de correlación según Pearson es de 0,043.

Después utilizamos el estadístico T-Student con grados de libertad n-2, es decir, GL=6:

Tn-2=r [√ l (n−2)]

(l−r2)= 0'024· √6/0'999 = 0'058

Calcular el Punto crítico con los grados de liberta y alfa pero para ello hay que saber si es de

una cola (porque r=0 solo una posibilidad, es decir, una cola) o de dos colas (cuando la H1 es r

distinto de 0 porque >0 o <0 hay dos posibilidades, es decir, de dos colas). En este caso vamos a

la tabla de dos colas y observamos que:

Page 4: Ejercicio seminario 9

El punto crítico obtenido con alfa=0,01 es 3,14 que es mayor que el valor Tn-2=0,058, por lo que aceptamos la hipótesis nula que dice que no existe correlación entra las variables X e Y en la población de la que provienen las muestras, aceptándolo con un alto grado de confianza del 0,99.