Seminario 8 estadistica

13
R Commander: relación entre variables. TAREA DEL SEMINARIO VIII. REALIZADO POR ISMAEL RODRIGUEZ GODINO

Transcript of Seminario 8 estadistica

Page 1: Seminario 8 estadistica

R Commander: relación entre

variables.TAREA DEL SEMINARIO VIII.

REALIZADO POR ISMAEL RODRIGUEZ GODINO

Page 2: Seminario 8 estadistica

INTRODUCCIÓN.

Como ya pudimos ver en el seminario anterior, R Commander es capaz de realizar ciertas operaciones que permiten conocer la asociación entre variables. En esta ocasión, vamos un paso más lejos, vamos a realizar el siguiente ejercicio sobre relación y fuerza de la relación entre variables.

La actividad a realizar es:

Determinar si existe relación y como de fuerte es entre las variables altura y peso del archivo “activossalud.Rdata.

La actividad vamos a realizarla a través de gráficas y pruebas estadísticas, tales como el coeficiente de correlación de Pearson y el Rho de Spearman.

Page 3: Seminario 8 estadistica

Relación y fuerza de relación entre

variables.1ª TAREA DEL SEMINARIO VIII.

Page 4: Seminario 8 estadistica

1. Antes que nada primero debemos abrir R Commander. Una vez dentro, lo primero de todo es especificar el directorio de trabajo.

Para ello, pulsamos sobre “Fichero” y luego sobre “Cambiar directorio de trabajo”.

En nuestro caso, he elegido la carpeta “ESTADISTICA SEMINARIO 8”.

Page 5: Seminario 8 estadistica

2. Una vez identificado el directorio de trabajo, vamos a cargar el archivo con nuestro conjunto de variables. Para ello, pulsamos sobre “datos” y posteriormente sobre “Cargar conjunto de datos”.

Nos aparecerá esta ventana, elegimos el archivo “activossalud.Rdata”.

Page 6: Seminario 8 estadistica

3. Nuestro objetivo es observar si las variables “Peso” y “Altura” presentan relación entre ellas. Para saber si utilizaremos el test paramétrico o el no paramétrico deberemos testar la normalidad de las variables.

Primero, vamos a comprobar la normalidad de la variable “Peso”. Para ello, pulsamos en “Gráficas” y luego sobre “gráfica de comparación de cuartiles”.

Elegimos la variable “Peso” y en opciones elegimos distribución normal y pulsamos aceptar.

Page 7: Seminario 8 estadistica

Una vez realizado lo anterior, nos aparecerá la gráfica de comparación de cuartiles de la variable “Peso”.

Como podemos observar, muchas puntuaciones de la variables “peso” se salen de los intervalos de confianza (lineas discontinuas de la gráfica), por tanto, podemos considerar que esta variable no lleva una distribución normal.

Page 8: Seminario 8 estadistica

Ahora, vamos a comprobar la normalidad de la variable “altura”. Para ello, pulsamos en “Gráficas” y luego sobre “gráfica de comparación de cuartiles”.

Elegimos la variable “Altura” y en opciones elegimos distribución normal y pulsamos aceptar.

Page 9: Seminario 8 estadistica

Una vez realizado lo anterior, nos aparecerá la gráfica de comparación de cuartiles de la variable “Altura”.

Como podemos observar, muchas puntuaciones de la variables “altura” se salen de los intervalos de confianza (líneas discontinuas de la gráfica), por tanto, podemos considerar que esta variable no lleva una distribución normal.

Page 10: Seminario 8 estadistica

Como ninguna de las dos variables presenta una distribución normal, debemos utilizar un test no paramétrico: en nuestro caso el Rho de Spearman.4. Una vez conocido la prueba a utilizar debemos estudiar: tipo de relación y fuerza de relación. A) QUE TIPO DE RELACIÓN (REGRESIÓN) HAY ENTRE ELLAS: Para ello, pulsamos

sobre “gráficas” y luego sobre “Diagramas de dispersión”.

Una vez hecho lo anterior, elegimos ambas variables y en opciones elegimos la “Línea de mínimos cuadrados”.

Page 11: Seminario 8 estadistica

Realizado lo anterior, obtendremos la gráfica de relación entre las variables “peso” y “altura”.

Como podemos observar al principio parece haber cierta relación (muchas puntuaciones se acercan a la línea de mínimos cuadrados), pero a medida que aumentan los valores no existe relación entre el peso y la altura (puntuaciones muy alejadas de la línea de mínimos cuadrados).POR TANTO, NO EXISTE RELACIÓN ENTRE LAS VARIABLES.

Page 12: Seminario 8 estadistica

B) COMO DE FUERTE ES DICHA RELACIÓN EN CASO DE QUE LA HUBIERA (CORRELACIÓN).

Primero, pulsamos sobre “Estadisticos”, luego “resúmenes” y posteriormente sobre “Matriz de correlaciones”.

Una vez realizado lo anterior, nos aparecerá la siguiente ventana, donde deberemos elegir ambas variables. Además, deberemos elegir el “coeficiente de Spearman” porque son dos variables cuantitativas cuya distribucion no sigue la normalidad.

Page 13: Seminario 8 estadistica

Realizados los pasos previos, nos aparecerá en la tabla de salida de R commander, los resultados sobre el coeficiente de Spearman de ambas variables:

Conclusión: El coeficiente de Spearman varia entre 0 y 1, siendo 1 máxima fuerza de correlación y 0 ninguna relación. Como podemos observar el coeficiente de Spearman entre la variable “Peso” y la variable “Altura” es 0,62224114, por lo que presentaria una fuerza de correlación positiva débil. Para que se considere que las variables están relacionadas debe tener un valo mayor a 0,8, como no es mayor, indica que no están relacionadas.