seminario9

5
EJERCICIO SEMINARIO 9 En una muestra de 8 personas medimos la frecuencia cardiaca (FC) y la edad. 1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación? Para conocer si existe relación entre ambas variables tenemos que calcular el coeficiente de correlación de Pearson. Se deben cumplir dos condiciones: Que ambas variables sean cuantitativas. Que ambas sigan una distribución normal. Para ello, utilizamos la prueba de Kolmogorov - Smirnov (muestra mayor de 50) o Shapiro - Wilks (muestra menor de 50). Observamos el valor de sig. en la tabla de modo que tiene que ser mayor que sigan una distribución normal. Seguimos los siguientes pasos: 1º. Realizamos la prueba de normalidad (Shapiro en este caso). Dado que el ejercicio nos aporta la información en la siguiente tabla, observamos el valor de sig. (P valor): Establecemos las siguientes hipótesis: H0: las medidas se distribuyen normalmente. H1: las medidas no se distribuyen normalmente. Si P valor es menor o igual a (0,05) -> rechazamos la hipótesis nula. En este caso, al ser mayor, la aceptamos.

Transcript of seminario9

Page 1: seminario9

EJERCICIO SEMINARIO 9

En una muestra de 8 personas medimos la frecuencia cardiaca (FC) y la edad.

1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación?

Para conocer si existe relación entre ambas variables tenemos que calcular el coeficiente de correlación de Pearson. Se deben cumplir dos condiciones:

Que ambas variables sean cuantitativas. Que ambas sigan una distribución normal. Para ello, utilizamos la prueba de

Kolmogorov - Smirnov (muestra mayor de 50) o Shapiro - Wilks (muestra menor de 50). Observamos el valor de sig. en la tabla de modo que tiene que ser mayor que sigan una distribución normal.

Seguimos los siguientes pasos:

1º. Realizamos la prueba de normalidad (Shapiro en este caso). Dado que el ejercicio nos aporta la información en la siguiente tabla, observamos el valor de sig. (P valor):

Establecemos las siguientes hipótesis:

H0: las medidas se distribuyen normalmente. H1: las medidas no se distribuyen normalmente.

Si P valor es menor o igual a (0,05) -> rechazamos la hipótesis nula. En este caso, al ser mayor, la aceptamos.

2º. Representamos los datos en un plano cartesiano para observar la nube de puntos:

Page 2: seminario9

Al parecer, a simple vista, las variables de la muestra que hemos tomado no tienen correlación. Aún así, vamos a comprobarlo.

3º. Ordenamos los valores de menor a mayor y organizamos la siguiente tabla:

Siendo x= edad e y=FC:

Nº Edad FC

1 24 61

2 35 100

3 47 96

4 52 95

5 58 65

6 69 72

7 72 92

8 80 82

Page 3: seminario9

Xi Yi Xi2 Yi2 XiYi

24 61 576 3721 1464

35 100 1225 10000 3500

47 96 2209 9216 4512

52 95 2704 9025 4940

58 65 3364 4225 3770

69 72 4761 5184 4968

72 90 5184 8100 6480

80 82 6400 6724 6560

4º. Calculamos el coeficiente de correlación de Pearson:

r= [8 · 36194 – 437 · 661] / √[8 · 264232 – (437)2) · (8 · 565592 – (661)2)] ->

r= [695] / √[20415 · 12639] ->

r= 0.043

5º. Interpretamos los datos:

Ya que el resultado que obtenemos es distinto de 0, sí existe correlación entre las variables de la muestra que hemos tomado pero de nivel muy bajo (se encuentra entre 0 – 0,2)

2. Averigua, para un nivel significación de 0.01, si existe correlación entre FC y edad en la población de donde proviene la muestra, razonando paso a paso la decisión tomada.

Tenemos que ver si el coeficiente de correlación hallado es significativo para ello hacemos un contraste de hipótesis bilateral (de dos colas).

1º. Establecer hipótesis:

H0 (p=0): el coeficiente de correlación obtenido procede de una población cuya correlación es cero (no existe correlación entre variables)

H1 (p ≠ 0): el coeficiente de correlación obtenido procede de una población cuya correlación sí existe entre variables.

2º. Calcular el estadístico t que sigue una distribución de n-2 grados de libertad:

r= [nXY - XY] / √[(nX2 - (X)2) (nY2 – (Y)2)]

Page 4: seminario9

0.043√6/0.998=0.043√6.012=0.043×2.45=0.105

3º. Comparación con el punto crítico establecido en la tabla t student para ver si es estadísticamente significativo:

Al ser la tabla de dos colas, no tenemos que dividir el resultado entre 2. Cogemos el valor con α=0,01 como nos indica el ejercicio y n-2 grados de libertad.

4º. Interpretación:

Si t>el valor obtenido en la tabla: se rechaza la hipótesis nula. Si t<el valor obtenido en la tabla: se acepta la hipótesis nula.

De este modo, 0,105 es menor que 3,1427 (nivel de confianza del 99%), por lo que se encuentra en la región de no rechazo -> se acepta la hipótesis nula -> esto significa que en la población la correlación es cero y NO existe relación entre las variables EDAD y FC.

tn-2=rxy√[(n-2)/1-rxy2