Seminario 6

16
SEMINARIO 6: CRISTINA ROMERO FERNÁNDEZ

Transcript of Seminario 6

Page 1: Seminario 6

SEMINARIO 6:

CRISTINA ROMERO FERNÁNDEZ

Page 2: Seminario 6
Page 3: Seminario 6

Cargamos conjunto de datos, “activossalud.RData”:

Page 4: Seminario 6

Obtener la distribución de frecuencias a partir de las dos variables cualitativas elegidas:

Page 5: Seminario 6

Variable «dulces»:

Variable «fruta»:

Page 6: Seminario 6

Atendiendo a los datos obtenidos en la distribución de frecuencias, se observa que solo un 6,9 % come dulces a diario y un 32,07 % consume fruta a diario. Por lo que, la población lleva una dieta pobre en dulces y comen más fruta con esta comparación, lo cual es bueno para la salud.

Aunque, se observa que una o dos veces en semana comen dulces el 30 % en comparación con el 23,10% de fruta, siendo la diferencia no es muy significativa. Pero, menos de una vez por semana consumen fruta un 11,03%, en relación con el consumo de dulces que es 31,72%.

Por lo que, el consumo de fruta es mayor que el de dulces.

Page 7: Seminario 6
Page 8: Seminario 6

Elección de las dos variables numéricas:

Page 9: Seminario 6

Variable «peso»:

Variable «horaprácticadeportiva»:

Page 10: Seminario 6

En cuanto a la variable peso, podemos observar que la media es 62,75, y la mediana 60, que corresponde al cuartil 2. Por lo que, sería una distribución más o menos simétrica al ser muy similares la media y mediana.

Por otra parte, se observa que la desviación típica es de 12,65 , siendo un poco grande, y por lo tanto los datos estarán más dispersos con respecto a la media.

Hay que decir que faltan 16 datos, pero no será de gran importancia, ya que «n» es grande.

En cuanto a la variable horas de práctica deportiva, la media es 2,48 y la mediana que corresponde con el 50%, es decir con el cuartil 2, es de 2. Por lo que, no hay mucha diferencia entre la media y mediana, siendo una distribución simétrica.

Observando la desviación típica, esta es pequeña, lo que indica que los datos están centrados en la media.

También, hay que decir que el 75% de la población practica 4 horas de deporte, tratándose de una población activa.

Page 11: Seminario 6
Page 12: Seminario 6

Selección de gráficos:

Page 13: Seminario 6

Como mis variables cualitativas elegidas tienen múltiples categorías y los diagramas de sectores no son útiles. Por ello, he elegido la variable «sexo». Se observa que en la muestra, la mayoría son mujeres.

Page 14: Seminario 6

He elegido la variable cualitativa consumo de dulces para representarla en el diagrama de barras. Aquí, podemos observar que la mayoría consumen una o dos veces dulces a la semana, pero diariamente se hace con menor frecuencia.

Page 15: Seminario 6

La variable cuantitativa elegida para representarla en el histograma ha sido «peso». Se puede observar que la puntuación mayor corresponde a la media que es 60. Además, podemos ver que sigue una distribución más o menos simétrica, como dijimos anteriormente al explicar esta variable, ya que coincidía con la mediana.

Page 16: Seminario 6

Para la representación en diagrama de caja, la variable cuantitativa elegida es «hora de práctica deportiva». Se puede observar que el valor máximo es 10 horas y el mínimo 0 horas, que corresponde al cuartil 1(25%). Además, la línea que corta la caja es la mediana y corresponde al valor 2 aproximadamente, representando al 50 % de la población (cuartil 2). Y, el 75% de la población dedica 4 horas a hacer deporte (cuartil 3). Esto, es una representación de lo anteriormente explicado.