Seminario 6

17
SEMINARIO 6 ·Análisis exploratorio de datos ·Tablas de frecuencias, resúmenes numéricos y gráficos. Ana Guerrero Pizarro

Transcript of Seminario 6

SEMINARIO 6

·Análisis exploratorio de datos·Tablas de frecuencias, resúmenes numéricos y gráficos.

Ana Guerrero Pizarro

EJERCICIO 1

1. En primer lugar, cargaremos la base de datos “activosensalud”

2. Para poder seleccionar las dos variables cualitativas tal y como se nos pide en el ejercicio, tenemos que seguir los siguientes pasos

3. Realizamos el proceso dos veces, una para la variable “pildoradeldiadespues” y otra vez para la variable “protecciónpreservativo”

4. Con las tablas de cada frecuencia, podemos realizar una comparación ya que disponemos tanto de las frecuencias absolutas como de los porcentajes

5. COMPARACIÓN DE FRECUENCIAS

· En cuanto a la frecuencia “proteccionpreservativo”, han contestado 255 de 291 personas, y en “pildoradiadespues” 193 de 291.

· El 61,57% utiliza preservativo siempre, y el 31,37% afirma haberlo utilizado alguna vez.

· En cuanto al uso de la píldora del día después el 69,43% dice no haberla utilizado nunca, y tal sólo el 27,98% alguna vez.

· Podemos concluir que es más utilizado el preservativo como método anticonceptivo que la píldora del día después debido al alto porcentaje de personas que dicen no haberla utilizado nunca.

EJERCICIO 2

1. En primer lugar, tenemos que abrir dos variables cuantitativas, para abrir la primera que será “altura” seguimos los siguientes pasos

2. Nos tenemos que asegurar de seleccionar “Media”, “Desviación típica” y “Rango intercuartílico” ya que será lo que utilizaremos, para ello, pincharemos en Estadísticos.

3. En R Comander, obtendremos los siguientes datos:

A partir de los siguientes datos podemos deducir que la altura media (mean) de los alumnos de primer año de enfermería es de 1.667 metros. La desviación típica (sd) es de 0.08078101, lo cuál nos indica que los valores no están muy dispersos, es decir no hay una gran variabilidad entre unos y otros. Con respecto a los cuartiles, podemos deducir que la altura mínima es de 1,46m. El 25% o menos de los estudiantes, miden 1,6 m y el 50% de los mismos, o menos miden 1.655 metros. El 75% o menos de los estudiantes miden 1.72m. El valor máximo es de 2m lo que nos indica que menos del 100% de los estudiantes mide menos de dos metros. Finalmente podemos observar que, hay un alumno que no ha contestado a la pregunta sobre su altura(NA).

4. Ahora haremos el mismo análisis con la variable “peso”

Deducimos que el peso medio (mean) de los alumnos de primer año de enfermería es de 62,76 kg. La desviación típica(sd) es de 12,65981 indicador de una gran dispersión entre los datos obtenidos por lo que hay una gran variabilidad. En cuanto a los cuartiles vemos que el peso mínimo es de 38kg. El 25% de los estudiantes, o menos pesan 54kg y el 50% o menos pesan 60kg. El 75% o menos pesa 68kg. Por último observamos que menos del 100% de los estudiantes pesan 130kg. Se puede ver que 16 estudiantes no han contestado a la pregunta sobre su peso(NA=16)

EJERCICIO 3

1. Gráfico de sectores de la variable trabajo

Este tipo de gráficos es muy útil para variables cualitativas, es preferible que no se representen un gran número de las mismas ya que puede resultar confuso

En cuanto a la frecuencia trabajo, observamos que un gran número de los encuestados no trabajan si miramos la porción rosa, los cuáles son la mayoría, por el contrario la porción azul representa los alumnos que si desempeñan algún trabajo

2. Gráfico de barras de la variable dulces

Los gráficos de barras también se utilizan para variables cualitativas, tienen una mayor importancia visual por lo que se pueden utilizar múltiples categorías. En este caso he escogido la frecuencia con la que los alumnos comen dulces. Se observa que el dato más relevante es que más del 80% de los estudiantes comen dulces 1 o 2 veces a la semana.

3. Histograma de frecuencias

Se utiliza en variables cuantitativas.He utilizado la frecuencia “peso”, observando así que el peso medio de los alumnos se encuentra entre 50 y 60 kg con una frecuencia superior al 100%

4. Gráfica de caja

Se utiliza para variables cuantitativas.Se puede analizar que el 25% de los estudiantes tienen una puntuación en torno a 7, siento este el valor medio de comunicación familiar. El 75% de los valores se encuentran entre 7 y 9. El 100% de los valores se encuentran entre 13 o menos. Observamos 3 valores atípicos: 103,72 y 281.