Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico...

44
Introducción Un estudio estadístico consta de las siguientes fases: Diseño o planteamiento Recogida de datos Organización, análisis y representación de la información Conclusiones

Transcript of Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico...

Page 1: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Introducción

Un estudio estadístico consta de las siguientes fases:◦ Diseño o planteamiento ◦ Recogida de datos◦ Organización, análisis y representación de la

información◦ Conclusiones

Page 2: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Introducción

Un estudio estadístico consta de las siguientes fases:◦ Diseño o planteamiento (coste económico y

tiempo que llevará su realización): Fija el objetivo a conseguir

Población o muestra a estudiar

Caracteres que interesan

Presentación que se hará con los datos recogidos.

Page 3: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Introducción

Un estudio estadístico consta de las siguientes fases:◦ Recogida de datos

Directa: el propio individuo el que facilita los datos, generalmente mediante un cuestionario con preguntas y espacios para las respuestas, bien sea enviado por correo o mediante un entrevistador que anota las respuestas,

Indirecta: se recurre a un fichero, memoria, banco de datos, etc.

Page 4: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Introducción

Un estudio estadístico consta de las siguientes fases:◦ Organización, análisis y representación de la

información Cuadros, tablas, gráficos y operaciones que hay que efectuar para

obtener los resultados.

Si la cantidad de datos es grande, se usan técnicas informáticas.

◦ Conclusiones Los resultados deberá asesorar a quienes deban tomar

decisiones, los cuales, “lógicamente”, actuarán teniendo en cuenta la información recibida (o nó…)

Page 5: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Introducción

Page 6: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias (“tabulación”)

Representación gráfica

Page 7: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias

◦ Las series estadísticas deben presentarse ordenadas y clasificadas según criterios fijados previamente, especialmente si ciertos valores se repiten con frecuencia, los datos son muy numerosos etc..◦ Las tablas (“cuadros”) son el modo habitual de

presentar los resultados resumen los datos de una variable (manera “sencilla” de agrupar mucha información en unos pocos datos comprensibles)

Page 8: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias◦ Tabla de frecuencias

Ordenación asignando a cada dato su frecuenciacorrespondiente en clases o intervalos

Operación básica Estadística Descriptiva

Page 9: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias◦ Distinguir entre variables discretas y continuas

Número N de observaciones (casos) Valores correspondientes a cada variable

◦ Contenido básico: ¿qué valores toma la variable? ¿qué proporción de los sujetos tiene cada valor?

Page 10: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Tipos de distribución de frecuencias◦ Según

Número de valores distintos que tome la variable Número de observaciones o datos que se tengan

◦ Diferentes tipos de distribuciones Distribuciones de Tipo I Distribuciones de Tipo II Distribuciones de Tipo III

Page 11: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Tipos de distribución de frecuencias◦ Distribuciones de Tipo I

Cada valor de la variable aparece una sola vez. No consideradas como distribuciones estadísticas en

el sentido estricto Tratamiento estadístico se reduce a presentar los datos en

forma ordenada. Ejemplo: ordenación 24, 27, 32, 36, 37, 42, 44, 48, 49, 51, 53, 63

representa la edad de cada uno de los 12 profesores de un centro escolar

Page 12: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Tipos de distribución de frecuencias◦ Distribuciones de Tipo II

Algunos valores aparece más de una vez (variable con muchas observaciones –casos- pero pocos valores)

Normalmente, variables discretas Se ordenando los datos en dos columnas:

Valores de la variable xi

Frecuencias absolutas nixi ni

x1 n1

x2 n2

x3 n3

. .

. .

xK nk

Page 13: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Tipos de distribución de frecuencias◦ Distribuciones de Tipo III

Cuando el número de observaciones y de valores elevado (sobre todo variables continuas) El campo de variación de la variable se agrupa en intervalos

de clase cada clase no es un único valor sino un intervalo de valores de igual o desigual amplitud de clase (ai)

Límites de la clase Li-1-Li valores superior e inferior de una clase

Cada clase (todo el intervalo) es representada por un único valor marca de clase xi

Li-1-Li ni xi

L0-L1 n1 x1

L1-L2 n2 x2

L2-L3 n3 x3

. . .

. . .

LK-1-LK nk xk

Page 14: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias:◦ ¿Cómo construir una tabla de frecuencias?

Número de clases

Amplitud de cada clase

Marca de cada clase

Límites inferior y superior de cada clase

Page 15: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias:◦ Número de clases k (en general entre 10 y

15) Criterio de Norcliffe Criterio de Sturgess

Criterio de Huntsberger

Criterio de Brooks and Carruthers

Otros

N=

Nlog 3,31+=Nlog 5=<

N2log 1 +=

= 1 + 3.322(log N)

Page 16: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias ◦ Rango de los datos

◦ Amplitud de cada clase número entero un poco mayor

que sea divisible por el número de intervalos queramos establecer

◦ Marca de clase

Page 17: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias ◦ Distribución de frecuencias agrupadas o tabla

con datos agrupados Notación:

Paréntesis excluido Corchetes incluido

(3,8) no incluye ni el 3 ni el 8 (pero si 4, 5, 6, 7). [3,8] incluye el 3 y el 8, además de los intermedios. (3,8] incluye al 8, pero no al 3 (está abierto por el 3 y

cerrado por el 8) [3,8) incluye al 3, pero no al 8 (está cerrado por el 3 y

abierto por el 8)

Page 18: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias◦ Tipos de frecuencias

Frecuencia absoluta: Número de veces que aparece un determinado valor en un

estudio estadístico. Se representa por ni. La suma de las frecuencias absolutas es igual al número total

de datos (N)

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (suma o sumatorio)

∑=

=n

iinN

1

nnnnnN ++++= ...321

Page 19: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias◦ Tipos de frecuencias

Frecuencia relativa (fi) Cociente entre la frecuencia absoluta de un

determinado valor y el número total de datos La suma de las frecuencias relativas es igual a 1

Se puede expresar en %

Nn

f ii =

Page 20: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias◦ Tipos de frecuencias

Frecuencia (absoluta) acumulada (Ni) Suma de las frecuencias absolutas de todos los valores

inferiores o iguales al valor considerado.

Frecuencia relativa acumulada (Fi) Cociente entre la frecuencia acumulada de un

determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

Page 21: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias◦ Tipos de frecuencias

Temperaturas máximas cada día del mes de julio (¿variable discreta?): 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29

Page 22: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias◦ Tipos de frecuencias

xi ni Ni fi Fi

27 1 1 0.032 0.032

28 2 3 0.065 0.097

29 6 9 0.194 0.290

30 7 16 0.226 0.0516

31 8 24 0.258 0.774

32 3 27 0.097 0.871

33 3 30 0.097 0.968

34 1 31 0.032 1

31 1

Primera: variable ordenada de menor a mayor

Segunda columna: recuento Tercera: frecuencia absoluta

Cuarta: frecuencia acumuladaQuinta: frecuencia relativa absoluta

Sexta: frecuencia relativa acumulada

Este tipo de tablas de frecuencias se utiliza con

variables discretas

Page 23: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias ◦ Distribución de frecuencias agrupadas o tabla

con datos agrupados Construcción

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

Page 24: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias ◦ Distribución de frecuencias agrupadas o tabla

con datos agrupados Construcción

Calcular rango de los datos: sustracción del valor más alto y más bajo (R = 48-3 = 45)

Número de clases k = 5/6 (ver criterios) Amplitud a = 45/6 = 7,5; a = 45/5 = 9 ó 10 Determinar la posición del primer punto de corte:

Primer punto = Mínimo + 1*Amplitud

Page 25: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

Distribución de frecuencias ◦ Datos agrupados

Construcción

Li-1 -Li xi ni Ni fi Fi

[0, 10) 7.5 2 2 0.05 0.05

[10, 20) 17.5 6 8 0.015 0.200

[20, 30) 27.5 9 17 0.225 0.425

[30, 40) 37.5 17 34 0.425 0.85

[40, 50) 47.5 6 40 0.15 1

40 1

Page 26: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica

◦ Otra forma de resumir información

◦ Diferentes tipos según Variables cualitativas o cuantitativas Variables discretas o continuas

Page 27: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Diagrama de barras

Variables cualitativas o cuantitativas discretas Cada valor de la variable: una barra Altura barra: proporcional a la frecuencia del valor

Ejes de coordenadas, Abscisa: valores de la variable Ordenada: frecuencias absolutas, relativas o acumuladas

Page 28: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Diagrama de barras

Ordenada: “orden de los valores”: De izquierda a derecha Variables cualitativas nominales: indiferente Variables cualitativas ordinales/cuantitativas “orden

natural”

Page 29: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Diagrama de barras

Grupo sanguíneo de alumnos (variable…) frecuencias absolutas

Grupo sanguíneo ni

A 6

B 4

AB 1

0 9

20

Page 30: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Diagrama de barras

Barras de frecuencias relativa acumuladas

Page 31: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Diagrama de Pareto

Combinación de frecuencias relativas (barras) y acumuladas (línea)

Orden de los valores: de más frecuente a menos frecuente

Línea que representa las frecuencias acumuladas

Page 32: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Histograma

Similar a diagrama de barras, excepto: Barras no deberían ser contiguas Rótulos corresponden a límites

entre clases

Aplicable a Variables cuantitativas continuas Variables cuantitativas discretas

con un gran número de datos (agrupadas en clases)

Page 33: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Histogramas con intervalos de amplitud

diferente Calcular las alturas de los rectángulos del histograma

hi es la altura del intervalo ni es la frecuencia del intervalo ai es la amplitud del intervalo

i

ii a

nh =

Page 34: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Intervalos de amplitud diferente

Ejemplo: calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de alumnos.

Li-1, Li ni hi

[0, 5) 15 3

[5, 7) 20 10

[7, 9) 12 6

[9, 10) 3 3

50

Page 35: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Histograma

Como en diagrama de barras, su forma no cambia por usar frecuencias absolutas o relativas

La forma del histograma SÍ cambia según el número de las clases

Ejemplo: 4 histogramas con 5, 10, 18 y 34 clases

Page 36: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Histograma

Por tanto: a la hora de hacer un histograma es MUY IMPORTANTE la elección de las clases

Regla empírica: empezar con pocas y a partir de resultados ir aumentando

Para una población grande: el número de clases podrían ser muchas, y muy estrechas

Tendencia: el histograma como una curva

Page 37: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Polígono de frecuencias

Marca de clase que coincide con el punto medio de cada rectángulo

Li-1, Li xi ni Ni

[50, 60) 55 8 8

[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63

[110, 120) 115 2 65

65

Page 38: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Diagrama de sectores (tartas)

Para todo tipo de variables (cualitativas, cuantitativas discretas), pero de pequeño tamaño

El ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente

Se construye con la ayuda de un transportador de ángulos.

inN

•=º360α

Page 39: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Diagrama de sectores

Alumnos Ángulo

Baloncesto 12 124°

Natación 3 36°

Fútbol 9 108°

Sin deporte 6 72°

Total 30 360°

Page 40: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Interpretación de los gráficos

Informan sobre la distribución de una variable Dispersión/concentración de los valores

Cuál es el más frecuente (la moda)

Si hay valores muy alejados del valor más frecuente

Simetría de la distribución: igual número de casos con valores mayores y menores que el valor más frecuente...

Page 41: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Interpretación de los gráficos

Tipos de distribución Histograma unimodal simétrico

Simetría: un valor más común (moda) aproximadamente en el centro. Ejemplos: notas, altura, peso...

Page 42: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Interpretación de los gráficos

Tipos de distribución Histograma simétrico bimodal

Dos valores con más casos (modas) Simétrico en torno a valor con pocos casos Extraño: ¿2 poblaciones?

Page 43: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Interpretación de los gráficos

Tipos de distribución Histograma unimodal asimétrico a la izquierda

Un valor con más casos (moda) “Cola” hacia la izquierda Ejemplo: esperanza de vida

Page 44: Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico consta de las siguientes fases: Recogida de datos Directa: el propio individuo el

Organización y representación de los datos

La representación gráfica◦ Interpretación de los gráficos

Tipos de distribución Histograma unimodal asimétrico a la derecha

Un valor con más casos (moda) “Cola” hacia la derecha Ejemplos: ingresos o gastos