Conceptos estadísticos básicos - UC3Mhalweb.uc3m.es/esp/Personal/personas/mwiper... · Conceptos...

Post on 02-Oct-2020

10 views 0 download

Transcript of Conceptos estadísticos básicos - UC3Mhalweb.uc3m.es/esp/Personal/personas/mwiper... · Conceptos...

Conceptos estadísticos básicos

M. Wiper Análisis Estadístico del Delito 1 / 16

Objetivo

Introducir los conceptos fundamentales de la estadística como población, muestray dato y los distintos tipos de variables.

M. Wiper Análisis Estadístico del Delito 2 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.

La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.

Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.

Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.

20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.

10.

M. Wiper Análisis Estadístico del Delito 3 / 16

Conceptos básicos

La población es el conjunto de indviduos que queremos estudiar.La población adulta de españa.

Una variable es una característica de la población que se pretende analizar.Grado de apoyo (de 0 a 10) a la Guardia Civil.

Una subpoblación es un grupo dentro de la población.Gente de Madrid.

Una muestra es un subconjunto de individuos extraidos de la población.20 clientes del bar en El Cortijo.

Un dato es el valor de la variable para un individuo.10.

M. Wiper Análisis Estadístico del Delito 3 / 16

¾Porqúe tomar una muestra?

Tipicamente es muy costoso o imposible consultar a toda la población.

Si se puede escoger una muestra representativa, es posible usar los resultadosde la muestra para estimar características de la población.

¾Cómo se debe tomar una muestra?

¾Parece razonable tomar la muestra delbar?

M. Wiper Análisis Estadístico del Delito 4 / 16

¾Porqúe tomar una muestra?

Tipicamente es muy costoso o imposible consultar a toda la población.

Si se puede escoger una muestra representativa, es posible usar los resultadosde la muestra para estimar características de la población.

¾Cómo se debe tomar una muestra? ¾Parece razonable tomar la muestra delbar?

M. Wiper Análisis Estadístico del Delito 4 / 16

¾Cómo tomar una muestra?

Dos enfoques posibles:

Métodos no-probabilísticos.

I Muestreo de conveniencia.I Muestreo sistematico.I Muestreo basado en cuotas.

Estos métodos padecen de sesgos inherentes.

Métodos probabilísticos.I Muestreo aleatorio simple.I Muestreo estrati�cado.I Muestreo por conglomerados.

No hay sesgos inherentes pero no es imposible que la muestra sea pocarepresentativa.

M. Wiper Análisis Estadístico del Delito 5 / 16

¾Cómo tomar una muestra?

Dos enfoques posibles:

Métodos no-probabilísticos.I Muestreo de conveniencia.I Muestreo sistematico.I Muestreo basado en cuotas.

Estos métodos padecen de sesgos inherentes.

Métodos probabilísticos.I Muestreo aleatorio simple.I Muestreo estrati�cado.I Muestreo por conglomerados.

No hay sesgos inherentes pero no es imposible que la muestra sea pocarepresentativa.

M. Wiper Análisis Estadístico del Delito 5 / 16

¾Cómo tomar una muestra?

Dos enfoques posibles:

Métodos no-probabilísticos.I Muestreo de conveniencia.I Muestreo sistematico.I Muestreo basado en cuotas.

Estos métodos padecen de sesgos inherentes.

Métodos probabilísticos.

I Muestreo aleatorio simple.I Muestreo estrati�cado.I Muestreo por conglomerados.

No hay sesgos inherentes pero no es imposible que la muestra sea pocarepresentativa.

M. Wiper Análisis Estadístico del Delito 5 / 16

¾Cómo tomar una muestra?

Dos enfoques posibles:

Métodos no-probabilísticos.I Muestreo de conveniencia.I Muestreo sistematico.I Muestreo basado en cuotas.

Estos métodos padecen de sesgos inherentes.

Métodos probabilísticos.I Muestreo aleatorio simple.I Muestreo estrati�cado.I Muestreo por conglomerados.

No hay sesgos inherentes pero no es imposible que la muestra sea pocarepresentativa.

M. Wiper Análisis Estadístico del Delito 5 / 16

¾Cómo tomar una muestra?

Dos enfoques posibles:

Métodos no-probabilísticos.I Muestreo de conveniencia.I Muestreo sistematico.I Muestreo basado en cuotas.

Estos métodos padecen de sesgos inherentes.

Métodos probabilísticos.I Muestreo aleatorio simple.I Muestreo estrati�cado.I Muestreo por conglomerados.

No hay sesgos inherentes pero no es imposible que la muestra sea pocarepresentativa.

M. Wiper Análisis Estadístico del Delito 5 / 16

Controversias

Recientamente las encuestas del Brexit o del CIS, los periodicos ... con respeto alas elecciones han sido muy criticadas por su poca precisión.

Hay varias razones por la inexactitud de las encuestas:

Muestras pequeñas pueden facilmente ser imprecisas.

Cambios de opinión entre el periodo de la encuesta y el censo �nal.

La gente miente.

Cocina incorrecta.

M. Wiper Análisis Estadístico del Delito 6 / 16

Controversias

Recientamente las encuestas del Brexit o del CIS, los periodicos ... con respeto alas elecciones han sido muy criticadas por su poca precisión.

Hay varias razones por la inexactitud de las encuestas:

Muestras pequeñas pueden facilmente ser imprecisas.

Cambios de opinión entre el periodo de la encuesta y el censo �nal.

La gente miente.

Cocina incorrecta.

M. Wiper Análisis Estadístico del Delito 6 / 16

Controversias

Recientamente las encuestas del Brexit o del CIS, los periodicos ... con respeto alas elecciones han sido muy criticadas por su poca precisión.

Hay varias razones por la inexactitud de las encuestas:

Muestras pequeñas pueden facilmente ser imprecisas.

Cambios de opinión entre el periodo de la encuesta y el censo �nal.

La gente miente.

Cocina incorrecta.

M. Wiper Análisis Estadístico del Delito 6 / 16

Controversias

Recientamente las encuestas del Brexit o del CIS, los periodicos ... con respeto alas elecciones han sido muy criticadas por su poca precisión.

Hay varias razones por la inexactitud de las encuestas:

Muestras pequeñas pueden facilmente ser imprecisas.

Cambios de opinión entre el periodo de la encuesta y el censo �nal.

La gente miente.

Cocina incorrecta.

M. Wiper Análisis Estadístico del Delito 6 / 16

Controversias

Recientamente las encuestas del Brexit o del CIS, los periodicos ... con respeto alas elecciones han sido muy criticadas por su poca precisión.

Hay varias razones por la inexactitud de las encuestas:

Muestras pequeñas pueden facilmente ser imprecisas.

Cambios de opinión entre el periodo de la encuesta y el censo �nal.

La gente miente.

Cocina incorrecta.

M. Wiper Análisis Estadístico del Delito 6 / 16

Controversias

Recientamente las encuestas del Brexit o del CIS, los periodicos ... con respeto alas elecciones han sido muy criticadas por su poca precisión.

Hay varias razones por la inexactitud de las encuestas:

Muestras pequeñas pueden facilmente ser imprecisas.

Cambios de opinión entre el periodo de la encuesta y el censo �nal.

La gente miente.

Cocina incorrecta.

M. Wiper Análisis Estadístico del Delito 6 / 16

Tipos de variables

Una variable cualitativa o un atributo es una característica o rasgo no cuantitativode la población que se quiere estudiar.

Una variable cuantitativa es aquella que podemos medir y expresarnuméricamente.

¾Ha ingerido drogas antes de conducir? ¾Sí o no?

¾Qué tipo de droga ha tomado?

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente ...

¾Cuántas pastillas ha comprado?

¾Qué cantidad de cocaina ha tomado este año?

¾Cuál es su número de teléfono?

M. Wiper Análisis Estadístico del Delito 7 / 16

Tipos de variables

Una variable cualitativa o un atributo es una característica o rasgo no cuantitativode la población que se quiere estudiar.

Una variable cuantitativa es aquella que podemos medir y expresarnuméricamente.

¾Ha ingerido drogas antes de conducir? ¾Sí o no?

¾Qué tipo de droga ha tomado?

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente ...

¾Cuántas pastillas ha comprado?

¾Qué cantidad de cocaina ha tomado este año?

¾Cuál es su número de teléfono?

M. Wiper Análisis Estadístico del Delito 7 / 16

Tipos de variables: variables cualitativas

Una variable cualitativa puede ser dicotómica o politómica.

¾Ha ingerido drogas antes de conducir? ¾Sí o no? Sólo hay dos respuestasposibles.

¾Qué tipo de droga ha tomado? Hay múltiples respuestas.

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente. Hay más de dos respuestas posibles.

Una variable politómica puede ser nominal o ordinal

¾Qué tipo de droga ha tomado? No hay ningún orden en los posibles valoresde la variable.

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente ... Existe un orden claro.Un muchos casos, variables ordinales provienen de variables cuantitativas.

M. Wiper Análisis Estadístico del Delito 8 / 16

Tipos de variables: variables cualitativas

Una variable cualitativa puede ser dicotómica o politómica.

¾Ha ingerido drogas antes de conducir? ¾Sí o no? Sólo hay dos respuestasposibles.

¾Qué tipo de droga ha tomado? Hay múltiples respuestas.

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente. Hay más de dos respuestas posibles.

Una variable politómica puede ser nominal o ordinal

¾Qué tipo de droga ha tomado? No hay ningún orden en los posibles valoresde la variable.

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente ... Existe un orden claro.Un muchos casos, variables ordinales provienen de variables cuantitativas.

M. Wiper Análisis Estadístico del Delito 8 / 16

Tipos de variables: variables cualitativas

Una variable cualitativa puede ser dicotómica o politómica.

¾Ha ingerido drogas antes de conducir? ¾Sí o no? Sólo hay dos respuestasposibles.

¾Qué tipo de droga ha tomado? Hay múltiples respuestas.

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente. Hay más de dos respuestas posibles.

Una variable politómica puede ser nominal o ordinal

¾Qué tipo de droga ha tomado? No hay ningún orden en los posibles valoresde la variable.

¾Con que frecuencia consuma drogas? Rara vez, de vez en cuando,habitualmente ... Existe un orden claro.Un muchos casos, variables ordinales provienen de variables cuantitativas.

M. Wiper Análisis Estadístico del Delito 8 / 16

Tipos de variables: variables cuantitativas

Una variable cuantitativa puede ser discreta o continua (o mixta).

¾Cuántas pastillas ha comprado? 0, 1, 2, 3, ...

¾Qué cantidad de cocaina ha tomado este año? (0,∞)

Cantidad de droga (gm) encontrado en un cacheo de un sospechoso. Larespuesta puede ser exactamente 0 o cualquier cantidad positivo.

M. Wiper Análisis Estadístico del Delito 9 / 16

Tipos de variables: variables cuantitativas

Una variable cuantitativa puede ser discreta o continua (o mixta).

¾Cuántas pastillas ha comprado? 0, 1, 2, 3, ...

¾Qué cantidad de cocaina ha tomado este año? (0,∞)

Cantidad de droga (gm) encontrado en un cacheo de un sospechoso. Larespuesta puede ser exactamente 0 o cualquier cantidad positivo.

M. Wiper Análisis Estadístico del Delito 9 / 16

Resumiendo datos: la tabla de frecuencias

Despúes de tomar una muestra, antes de cualquier análisis grá�co se construyeuna tabla de frecuencias.

AñoINCIDENTES DE DELITOS DE ODIO 2015 2016

ANTISEMITISMO 9 7APOROFOBIA 17 10

CREENCIAS O PRÁCTICAS RELIGIOSAS 70 47DISCAPACIDAD 226 262

ORIENTACIÓN O IDENTIDAD SEXUAL 169 230RACISMO/XENOFOBIA 505 416

IDEOLOGÍA 308 259DISCRIMINACIÓN POR SEXO/GÉNERO 24 41

Había 505 delitos de racismo o xenofobia en 2015 y la cantidad bajó a 416 en2016.

M. Wiper Análisis Estadístico del Delito 10 / 16

Resumiendo datos: la tabla de frecuencias

Si una variable es continua, la mayoría de los datos observados van a ser distintos.Para representarlos en una tabla o grá�co, es necesario agrupar los datos.

¾Cómo decidimos el número de grupos?

Una regla empírica dice que si hay n datos, les dividimos en aproximadamente√n grupos.

¾Cómo decidimos los límites de cada grupo?Utilizamos números redondos.

Si un valor cae en el límite de una región, ¾dónde lo ponemos?Tenemos que ser consistentes en la de�nición de las regiones. Por ejemplo(0, 20000], (20000, 40000], .....

¾Vale usar regiones de distintos tamaños?Sí. Para datos muy asimétricos (consumo de cannabis) por ejemplo, haymuchos usuarios tomando poca cantidad y pocos usuarios con un consumomuy alto.

M. Wiper Análisis Estadístico del Delito 11 / 16

Resumiendo datos: la tabla de frecuencias

Si una variable es continua, la mayoría de los datos observados van a ser distintos.Para representarlos en una tabla o grá�co, es necesario agrupar los datos.

¾Cómo decidimos el número de grupos?Una regla empírica dice que si hay n datos, les dividimos en aproximadamente√n grupos.

¾Cómo decidimos los límites de cada grupo?

Utilizamos números redondos.

Si un valor cae en el límite de una región, ¾dónde lo ponemos?Tenemos que ser consistentes en la de�nición de las regiones. Por ejemplo(0, 20000], (20000, 40000], .....

¾Vale usar regiones de distintos tamaños?Sí. Para datos muy asimétricos (consumo de cannabis) por ejemplo, haymuchos usuarios tomando poca cantidad y pocos usuarios con un consumomuy alto.

M. Wiper Análisis Estadístico del Delito 11 / 16

Resumiendo datos: la tabla de frecuencias

Si una variable es continua, la mayoría de los datos observados van a ser distintos.Para representarlos en una tabla o grá�co, es necesario agrupar los datos.

¾Cómo decidimos el número de grupos?Una regla empírica dice que si hay n datos, les dividimos en aproximadamente√n grupos.

¾Cómo decidimos los límites de cada grupo?Utilizamos números redondos.

Si un valor cae en el límite de una región, ¾dónde lo ponemos?

Tenemos que ser consistentes en la de�nición de las regiones. Por ejemplo(0, 20000], (20000, 40000], .....

¾Vale usar regiones de distintos tamaños?Sí. Para datos muy asimétricos (consumo de cannabis) por ejemplo, haymuchos usuarios tomando poca cantidad y pocos usuarios con un consumomuy alto.

M. Wiper Análisis Estadístico del Delito 11 / 16

Resumiendo datos: la tabla de frecuencias

Si una variable es continua, la mayoría de los datos observados van a ser distintos.Para representarlos en una tabla o grá�co, es necesario agrupar los datos.

¾Cómo decidimos el número de grupos?Una regla empírica dice que si hay n datos, les dividimos en aproximadamente√n grupos.

¾Cómo decidimos los límites de cada grupo?Utilizamos números redondos.

Si un valor cae en el límite de una región, ¾dónde lo ponemos?

Tenemos que ser consistentes en la de�nición de las regiones. Por ejemplo(0, 20000], (20000, 40000], .....

¾Vale usar regiones de distintos tamaños?Sí. Para datos muy asimétricos (consumo de cannabis) por ejemplo, haymuchos usuarios tomando poca cantidad y pocos usuarios con un consumomuy alto.

M. Wiper Análisis Estadístico del Delito 11 / 16

Resumiendo datos: la tabla de frecuencias

Si una variable es continua, la mayoría de los datos observados van a ser distintos.Para representarlos en una tabla o grá�co, es necesario agrupar los datos.

¾Cómo decidimos el número de grupos?Una regla empírica dice que si hay n datos, les dividimos en aproximadamente√n grupos.

¾Cómo decidimos los límites de cada grupo?Utilizamos números redondos.

Si un valor cae en el límite de una región, ¾dónde lo ponemos?Tenemos que ser consistentes en la de�nición de las regiones. Por ejemplo(0, 20000], (20000, 40000], .....

¾Vale usar regiones de distintos tamaños?

Sí. Para datos muy asimétricos (consumo de cannabis) por ejemplo, haymuchos usuarios tomando poca cantidad y pocos usuarios con un consumomuy alto.

M. Wiper Análisis Estadístico del Delito 11 / 16

Resumiendo datos: la tabla de frecuencias

Si una variable es continua, la mayoría de los datos observados van a ser distintos.Para representarlos en una tabla o grá�co, es necesario agrupar los datos.

¾Cómo decidimos el número de grupos?Una regla empírica dice que si hay n datos, les dividimos en aproximadamente√n grupos.

¾Cómo decidimos los límites de cada grupo?Utilizamos números redondos.

Si un valor cae en el límite de una región, ¾dónde lo ponemos?Tenemos que ser consistentes en la de�nición de las regiones. Por ejemplo(0, 20000], (20000, 40000], .....

¾Vale usar regiones de distintos tamaños?Sí. Para datos muy asimétricos (consumo de cannabis) por ejemplo, haymuchos usuarios tomando poca cantidad y pocos usuarios con un consumomuy alto.

M. Wiper Análisis Estadístico del Delito 11 / 16

Ejercicio

Se quiere estudiar la proporción de gente en la provincia de Madrid que vuelvenconduciendo del trabajo los viernes habiendo consumido drogas o alcohol. Parimplementar el estudio, se decide hacer controles aleatorios a 100 conductores enla entrada al A4 en Aranjuez en la hora punta de la tarde del viernes.

Identi�car:

1 La población2 La muestra3 La variable de interés.4 Que tipo de variable es.

¾Parece razonable la manera de seleccionar la muestra?

M. Wiper Análisis Estadístico del Delito 12 / 16

Ejercicio

Se quiere estudiar las nacionalidades de los encarcelados en España. Por estarazón se decide visitar al centro penitenciario Madrid III de Valdemoro y preguntara los internados sobre su nacionalidad.

1 La población2 La muestra3 La variable de interés.4 Que tipo de variable es.

¾Parece razonable la manera de seleccionar la muestra?

M. Wiper Análisis Estadístico del Delito 13 / 16

Ejercicio: ¾Qué tipos de variables son?

Las siguientes preguntas aparecieron en la encuesta sobre experienciasrelacionadas con delitos de odio del Ministerio del Interior en 2013.

M. Wiper Análisis Estadístico del Delito 14 / 16

Ejercicio: ¾Qué tipos de variables son?Los siguiente viene del barómetro del CIS de febrero de 2017 sobre el cibercrimen.

M. Wiper Análisis Estadístico del Delito 15 / 16

Resumen y siguiente sesión

Hemos comentado la utilidad de la estadística en la GC

Hemos introducido los conceptos fundamentales de población, muestra, ...

Hemos identi�cado los distintos tipos de variables

En la sesión práctica:

Queremos ilustrar los rasgos importantes de una muestra de manera grá�ca.

Vamos a ver que diferentes tipos de datos necesitan distintos tipos de grá�co.

M. Wiper Análisis Estadístico del Delito 16 / 16