Seminario 6

21
SEMINARIO 6 María López Pérez

Transcript of Seminario 6

Page 1: Seminario 6

SEMINARIO 6María López Pérez

Page 2: Seminario 6

Enunciado ejercicio 1:

O Selecciona dos variables cualitativas-factor del fichero

“activossalud.RData”, descríbelas en tablas de

frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.

Page 3: Seminario 6

Elección de las variables:

O Las variables que hemos elegido y vamos a analizar son: “estudiospadres” y

“estudiosmadres”. Para ello vamos a realizar una distribución de frecuncia con los

siguientes pasos:

Page 4: Seminario 6

Datos obtenidos

Page 5: Seminario 6

Interpretación datos:O Casi la mitad de las madres (47,2%)

cuentan con estudios primarios o ningún estudio.

O 28,67% de las madres han alcanzado los estudios de bachillerato.

O El 24,13% de estas cuentan con una carrera universitaria.

Page 6: Seminario 6

Interpretación datos:Respecto a la educación de los padres podemos decir:O El 38,16% de estos no cuentan con

ninguna cualificación académica o solo con estudios primarios.

O El 32,86% de los padres han cursado hasta bachillerato.

O El 28,98% han logrado conseguir un título universitario.

Page 7: Seminario 6

Interpretación datosComparando estos datos podemos realizar una serie de deducciones:

O Podemos decir que hay más madres que padres que no tienen estudios o solo estudios primarios. Con esto podríamos pensar que las mujeres tienen una menor formación académica debido a que era la encargada del cuidado de la casa y ayuda a su madre.

O Acorde con estos datos también comprobamos que los padres tienen una mayor formación siendo el porcentaje más alto tanto en bachillerato como en las carreras universitarias.

O Teniendo en cuenta la edad de los padres, que han crecido en una época donde no era fácil estudiar, podríamos realizar otro análisis para ver si este relativamente alto número de padres con título universitario está influenciado porque los encuestados también son estudiantes de este mismo nivel académico.

Page 8: Seminario 6

Enunciado ejercicio 2:

O Selecciona dos variables numéricas del fichero

“activossalud.RData”, y mediante resúmenes numéricos

describe e interpreta la distribución de las mismas.

Page 9: Seminario 6

Elección de las variables:

O Para este ejercicios las variables a estudiar debían de ser cuantitativas y por ello hemos elegido “peso” y “altura”. Para conseguir los resumenes numéricos hemos seguido los siguientes pasos:

Page 10: Seminario 6

Datos obtenidos:

Page 11: Seminario 6

Interpretación datos:O La media de la altura es de 1,66 metros, dato muy cercano a la mediana, o

segundo cuartil (valor que recoge el 50% de los datos).

O La desviación típica para esta variable es pequeña, 0,08, y con ello podemos decir que los datos se encuentran concentrados, cercano al valor de la media.

O El valor mínimo el 1,46 mientras que el máximo 2 metros.

O El primer cuartil, el valor que recoge el 50% de los datos, coincide con 1,6 metros.

O El tercer cuartil, el valor que recoge el 75% de los datos, lo encontramos en 1,72 metros.

O 290 personas han proporcionado su altura mientras que solo uno no lo ha hecho.

Page 12: Seminario 6

Interpretación datos:O La media del peso es de 62,75 Kg, dato relativamente cercano a la mediana

que es de 60 Kg.

O La desviación típica para esta variable es de 12,66, un valor elevado por lo que podemos decir que los datos de esta variable se encuentran dispersos.

O El valor mínimo el 38 mientras que el máximo 130 Kg.

O El primer cuartil, el valor que recoge el 50% de los datos, coincide con 54 Kg.

O El tercer cuartil, el valor que recoge el 75% de los datos, lo encontramos en 68 Kg.

O 275 personas han proporcionado el dato de su peso frente a 16 que no lo ha hecho.

Page 13: Seminario 6

Enunciado ejercicio 3:

O Debes realizar al menos un gráfico de cada tipo con

variables adecuadamente seleccionadas del fichero

“activossalud.RData”, describe e interpreta la distribución los

mismos.

Page 14: Seminario 6

Gráfico de sectoresO Este tipo de gráficas se

utiliza para variables cualitativas, mejor si son dicotómicas o con pocas

categorías, como es nuestro caso con la variable

“estudiosmadre”

Page 15: Seminario 6

Gráfico de sectores

Aquí tenemos un gráfico en el que se ve

claramente los niveles de estudios siendo ninguno o primario (rosa) casi la mitad y bachiller (verde)

poco mayor que universitarios (azul).

Page 16: Seminario 6

Gráfico de barrasO Se utiliza para variables

cualitativas cuando tienen más de dos

categorías.

Page 17: Seminario 6

Gráfico de barrasEn este gráfico

se pueden observar la

frecuencia de tener parejas

sexuales entre los que han

tenido 3 o más, 2, 1 o ninuguna.

Page 18: Seminario 6

Histograma de frecuencia

O Este tipo de gráfico es utilizado para variables numéricas.

Page 19: Seminario 6

Histograma de frecuencia

En este tipo de gráfico se ven todas las categorías de una variable

unidas.

Page 20: Seminario 6

Diagrama de cajaSe utiliza para variables numéricas, en nuestro

ejemplo la altura.

Page 21: Seminario 6

Diagrama de cajaEste tipo de gráfica nos da mucha información,

nos muestra todo el recorrido de la variable, los cuartiles, el recorrido

intercuartílico, la mediana, los valores atípicos… y todo a un

golpe de vista.