Seminario 6

13
SEMINARIO 6 Pilar Gordillo González

Transcript of Seminario 6

Page 1: Seminario 6

SEMINARIO 6

Pilar Gordillo González

Page 2: Seminario 6

EJERCICIO 1– Abrimos el programa R y R commander.– El primer ejercicio es: Selecciona dos variables

cualitativas-factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.

– En primer lugar, necesitamos cargar el archivo necesario para poder hacer el ejercicio. Para ello seleccionamos en Datos < cargar conjunto de datos < activossalud

Page 3: Seminario 6

– Tenemos que crear dos variables cualitativas. En nuestro caso las variables escogidas son dulces y fruta. Para ello cliqueamos en Estadísticos < Distribución de frecuencias < dulces. Realizamos lo mismo para fruta, seleccionando al final fruta.

Page 4: Seminario 6

DULCES – Según esta variable cualitativa dulces,

podemos decir:– De 291 personas, 20 personas comen

dulces a diario suponiendo un 6,90%.– Un 14,48% (42 personas) no come

dulces nunca.– Un 31,72% (92 personas) consume

dulces menos de una vez semana.– Y un 30% (87 personas) come dulces 1

o 2 veces a la semana.

Page 5: Seminario 6

FRUTALa segunda variable es fruta:

– De 291 personas, 93 personas toman fruta a diario, correspondiendo un 32,07%.

– Por otro lado, 32 personas no toman nunca o casi nunca fruta, siendo un 11,03%.

– Un 23,10% (67 personas) toma fruta una o dos veces a la semana.

– Y un 22,76% (66 personas) toma fruta tres o más veces a la semana pero no a diario.

Page 6: Seminario 6

EJERCICIO 2– El segundo ejercicio es: Selecciona dos variables

numéricas del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas.

– Para elegir las variables cuantitativas, en nuestro caso son horapracticadeportiva y medicalizacion seleccionamos en Resúmenes < Resúmenes numéricos < horapracticadeportiva / medicalizacion.

Page 7: Seminario 6

HORA PRÁCTICA DEPORTIVA

– Observamos que la media de la variable seleccionada es 2,48 y su desviación típica es de 3,14.

– La mediana es 2, ya que es Q2 (50%). El cuartil Q4 (75%) es 4.

– Al tener la media y la mediana muy parecida la variable es simétrica.

– Tan solo tenemos un dato no disponible.

Page 8: Seminario 6

MEDICALIZACIÓN– La media de la variable es 9,91 y la desviación

típica es 1,28.– La mediana es 10 ya que corresponde con el

Q2 (50%).– Hay 40 datos no disponibles. – Q1 (25%) es 9 y Q4 (75%) es 11.

Page 9: Seminario 6

Ejercicio 3– El tercer ejercicio es: Debes realizar al menos un

gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos.

– Los tipos de gráficos son:– Gráficos de sectores – Gráficos de barras– Histogramas– Diagrama de cajas

Variables cualitativas

variables cuantitativas

Page 10: Seminario 6

GRÁFICA DE SECTORES: VARIABLE REFRESCOS

- Para realizar una gráfica de sectores con variable refrescos, cliquemos en Gráficas < Gráfica de sectores< refrescos. En nuestra gráfica se deduce que hay el mismo némero de personas que consumen menos de una vez a la semana refrescos o nunca. Y el menor número de personas que consumen refrescos son las que lo hacen a diario.

Page 11: Seminario 6

GRÁFICA DE BARRAS: VARIABLE DULCES

- Para realizar una gráfica de barras con variable dulces, seleccionamos en Gráficas < Gráfica de barras < dulces. En nuestra gráfica podemos observa que más de 80 personas consumen dulces menos de una vez a la semana, seguido por detrás de 1 o 2 veces a la semana. Y un 20 no toman dulces a diario.

Page 12: Seminario 6

HISTOGRAMA: VARIABLE ALTURA

- Para realizar un histograma con variable altura, seleccionamos en Gráficas < Histograma < altura. En nuestro histograma podemos observar que entre 60 y 70 personas miden entre 1,55 y 1,7 metros. Y 1,95-2,00 metros miden muy pocas personas.

Page 13: Seminario 6

DIAGRAMA DE CAJA: ALTURA- Para realizar un diagrama de caja con variable peso, cliqueamos en Gráficas < Diagrama de caja < peso. Además podemos seleccionar opciones y elegir la opción con el ratón. De tal forma que los datos solo nos aparecerán cuando cliqueemos sobre el diagrama. En nuestro caso entre 1,6 y 1,72 metros se encuentra el 50% de la muestra. Hay tres outliers (valores que se salen del máximo), el mayor es el de 2 metros. Finalmente la mediana es aproximadamente 1,65.