Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico...
Transcript of Título de la presentación de aprendizaje · 2019-10-07 · Introducción Un estudio estadístico...
Introducción
Un estudio estadístico consta de las siguientes fases:◦ Diseño o planteamiento ◦ Recogida de datos◦ Organización, análisis y representación de la
información◦ Conclusiones
Introducción
Un estudio estadístico consta de las siguientes fases:◦ Diseño o planteamiento (coste económico y
tiempo que llevará su realización): Fija el objetivo a conseguir
Población o muestra a estudiar
Caracteres que interesan
Presentación que se hará con los datos recogidos.
Introducción
Un estudio estadístico consta de las siguientes fases:◦ Recogida de datos
Directa: el propio individuo el que facilita los datos, generalmente mediante un cuestionario con preguntas y espacios para las respuestas, bien sea enviado por correo o mediante un entrevistador que anota las respuestas,
Indirecta: se recurre a un fichero, memoria, banco de datos, etc.
Introducción
Un estudio estadístico consta de las siguientes fases:◦ Organización, análisis y representación de la
información Cuadros, tablas, gráficos y operaciones que hay que efectuar para
obtener los resultados.
Si la cantidad de datos es grande, se usan técnicas informáticas.
◦ Conclusiones Los resultados deberá asesorar a quienes deban tomar
decisiones, los cuales, “lógicamente”, actuarán teniendo en cuenta la información recibida (o nó…)
Introducción
Organización y representación de los datos
Distribución de frecuencias (“tabulación”)
Representación gráfica
Organización y representación de los datos
Distribución de frecuencias
◦ Las series estadísticas deben presentarse ordenadas y clasificadas según criterios fijados previamente, especialmente si ciertos valores se repiten con frecuencia, los datos son muy numerosos etc..◦ Las tablas (“cuadros”) son el modo habitual de
presentar los resultados resumen los datos de una variable (manera “sencilla” de agrupar mucha información en unos pocos datos comprensibles)
Organización y representación de los datos
Distribución de frecuencias◦ Tabla de frecuencias
Ordenación asignando a cada dato su frecuenciacorrespondiente en clases o intervalos
Operación básica Estadística Descriptiva
Organización y representación de los datos
Distribución de frecuencias◦ Distinguir entre variables discretas y continuas
Número N de observaciones (casos) Valores correspondientes a cada variable
◦ Contenido básico: ¿qué valores toma la variable? ¿qué proporción de los sujetos tiene cada valor?
Organización y representación de los datos
Tipos de distribución de frecuencias◦ Según
Número de valores distintos que tome la variable Número de observaciones o datos que se tengan
◦ Diferentes tipos de distribuciones Distribuciones de Tipo I Distribuciones de Tipo II Distribuciones de Tipo III
Organización y representación de los datos
Tipos de distribución de frecuencias◦ Distribuciones de Tipo I
Cada valor de la variable aparece una sola vez. No consideradas como distribuciones estadísticas en
el sentido estricto Tratamiento estadístico se reduce a presentar los datos en
forma ordenada. Ejemplo: ordenación 24, 27, 32, 36, 37, 42, 44, 48, 49, 51, 53, 63
representa la edad de cada uno de los 12 profesores de un centro escolar
Organización y representación de los datos
Tipos de distribución de frecuencias◦ Distribuciones de Tipo II
Algunos valores aparece más de una vez (variable con muchas observaciones –casos- pero pocos valores)
Normalmente, variables discretas Se ordenando los datos en dos columnas:
Valores de la variable xi
Frecuencias absolutas nixi ni
x1 n1
x2 n2
x3 n3
. .
. .
xK nk
Organización y representación de los datos
Tipos de distribución de frecuencias◦ Distribuciones de Tipo III
Cuando el número de observaciones y de valores elevado (sobre todo variables continuas) El campo de variación de la variable se agrupa en intervalos
de clase cada clase no es un único valor sino un intervalo de valores de igual o desigual amplitud de clase (ai)
Límites de la clase Li-1-Li valores superior e inferior de una clase
Cada clase (todo el intervalo) es representada por un único valor marca de clase xi
Li-1-Li ni xi
L0-L1 n1 x1
L1-L2 n2 x2
L2-L3 n3 x3
. . .
. . .
LK-1-LK nk xk
Organización y representación de los datos
Distribución de frecuencias:◦ ¿Cómo construir una tabla de frecuencias?
Número de clases
Amplitud de cada clase
Marca de cada clase
Límites inferior y superior de cada clase
Organización y representación de los datos
Distribución de frecuencias:◦ Número de clases k (en general entre 10 y
15) Criterio de Norcliffe Criterio de Sturgess
Criterio de Huntsberger
Criterio de Brooks and Carruthers
Otros
N=
Nlog 3,31+=Nlog 5=<
N2log 1 +=
= 1 + 3.322(log N)
Organización y representación de los datos
Distribución de frecuencias ◦ Rango de los datos
◦ Amplitud de cada clase número entero un poco mayor
que sea divisible por el número de intervalos queramos establecer
◦ Marca de clase
Organización y representación de los datos
Distribución de frecuencias ◦ Distribución de frecuencias agrupadas o tabla
con datos agrupados Notación:
Paréntesis excluido Corchetes incluido
(3,8) no incluye ni el 3 ni el 8 (pero si 4, 5, 6, 7). [3,8] incluye el 3 y el 8, además de los intermedios. (3,8] incluye al 8, pero no al 3 (está abierto por el 3 y
cerrado por el 8) [3,8) incluye al 3, pero no al 8 (está cerrado por el 3 y
abierto por el 8)
Organización y representación de los datos
Distribución de frecuencias◦ Tipos de frecuencias
Frecuencia absoluta: Número de veces que aparece un determinado valor en un
estudio estadístico. Se representa por ni. La suma de las frecuencias absolutas es igual al número total
de datos (N)
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (suma o sumatorio)
∑=
=n
iinN
1
nnnnnN ++++= ...321
Organización y representación de los datos
Distribución de frecuencias◦ Tipos de frecuencias
Frecuencia relativa (fi) Cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos La suma de las frecuencias relativas es igual a 1
Se puede expresar en %
Nn
f ii =
Organización y representación de los datos
Distribución de frecuencias◦ Tipos de frecuencias
Frecuencia (absoluta) acumulada (Ni) Suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
Frecuencia relativa acumulada (Fi) Cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Organización y representación de los datos
Distribución de frecuencias◦ Tipos de frecuencias
Temperaturas máximas cada día del mes de julio (¿variable discreta?): 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29
Organización y representación de los datos
Distribución de frecuencias◦ Tipos de frecuencias
xi ni Ni fi Fi
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.0516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1
31 1
Primera: variable ordenada de menor a mayor
Segunda columna: recuento Tercera: frecuencia absoluta
Cuarta: frecuencia acumuladaQuinta: frecuencia relativa absoluta
Sexta: frecuencia relativa acumulada
Este tipo de tablas de frecuencias se utiliza con
variables discretas
Organización y representación de los datos
Distribución de frecuencias ◦ Distribución de frecuencias agrupadas o tabla
con datos agrupados Construcción
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Organización y representación de los datos
Distribución de frecuencias ◦ Distribución de frecuencias agrupadas o tabla
con datos agrupados Construcción
Calcular rango de los datos: sustracción del valor más alto y más bajo (R = 48-3 = 45)
Número de clases k = 5/6 (ver criterios) Amplitud a = 45/6 = 7,5; a = 45/5 = 9 ó 10 Determinar la posición del primer punto de corte:
Primer punto = Mínimo + 1*Amplitud
Organización y representación de los datos
Distribución de frecuencias ◦ Datos agrupados
Construcción
Li-1 -Li xi ni Ni fi Fi
[0, 10) 7.5 2 2 0.05 0.05
[10, 20) 17.5 6 8 0.015 0.200
[20, 30) 27.5 9 17 0.225 0.425
[30, 40) 37.5 17 34 0.425 0.85
[40, 50) 47.5 6 40 0.15 1
40 1
Organización y representación de los datos
La representación gráfica
◦ Otra forma de resumir información
◦ Diferentes tipos según Variables cualitativas o cuantitativas Variables discretas o continuas
Organización y representación de los datos
La representación gráfica◦ Diagrama de barras
Variables cualitativas o cuantitativas discretas Cada valor de la variable: una barra Altura barra: proporcional a la frecuencia del valor
Ejes de coordenadas, Abscisa: valores de la variable Ordenada: frecuencias absolutas, relativas o acumuladas
Organización y representación de los datos
La representación gráfica◦ Diagrama de barras
Ordenada: “orden de los valores”: De izquierda a derecha Variables cualitativas nominales: indiferente Variables cualitativas ordinales/cuantitativas “orden
natural”
Organización y representación de los datos
La representación gráfica◦ Diagrama de barras
Grupo sanguíneo de alumnos (variable…) frecuencias absolutas
Grupo sanguíneo ni
A 6
B 4
AB 1
0 9
20
Organización y representación de los datos
La representación gráfica◦ Diagrama de barras
Barras de frecuencias relativa acumuladas
Organización y representación de los datos
La representación gráfica◦ Diagrama de Pareto
Combinación de frecuencias relativas (barras) y acumuladas (línea)
Orden de los valores: de más frecuente a menos frecuente
Línea que representa las frecuencias acumuladas
Organización y representación de los datos
La representación gráfica◦ Histograma
Similar a diagrama de barras, excepto: Barras no deberían ser contiguas Rótulos corresponden a límites
entre clases
Aplicable a Variables cuantitativas continuas Variables cuantitativas discretas
con un gran número de datos (agrupadas en clases)
Organización y representación de los datos
La representación gráfica◦ Histogramas con intervalos de amplitud
diferente Calcular las alturas de los rectángulos del histograma
hi es la altura del intervalo ni es la frecuencia del intervalo ai es la amplitud del intervalo
i
ii a
nh =
Organización y representación de los datos
La representación gráfica◦ Intervalos de amplitud diferente
Ejemplo: calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de alumnos.
Li-1, Li ni hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
Organización y representación de los datos
La representación gráfica◦ Histograma
Como en diagrama de barras, su forma no cambia por usar frecuencias absolutas o relativas
La forma del histograma SÍ cambia según el número de las clases
Ejemplo: 4 histogramas con 5, 10, 18 y 34 clases
Organización y representación de los datos
La representación gráfica◦ Histograma
Por tanto: a la hora de hacer un histograma es MUY IMPORTANTE la elección de las clases
Regla empírica: empezar con pocas y a partir de resultados ir aumentando
Para una población grande: el número de clases podrían ser muchas, y muy estrechas
Tendencia: el histograma como una curva
Organización y representación de los datos
La representación gráfica◦ Polígono de frecuencias
Marca de clase que coincide con el punto medio de cada rectángulo
Li-1, Li xi ni Ni
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 110 5 63
[110, 120) 115 2 65
65
Organización y representación de los datos
La representación gráfica◦ Diagrama de sectores (tartas)
Para todo tipo de variables (cualitativas, cuantitativas discretas), pero de pequeño tamaño
El ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente
Se construye con la ayuda de un transportador de ángulos.
inN
•=º360α
Organización y representación de los datos
La representación gráfica◦ Diagrama de sectores
Alumnos Ángulo
Baloncesto 12 124°
Natación 3 36°
Fútbol 9 108°
Sin deporte 6 72°
Total 30 360°
Organización y representación de los datos
La representación gráfica◦ Interpretación de los gráficos
Informan sobre la distribución de una variable Dispersión/concentración de los valores
Cuál es el más frecuente (la moda)
Si hay valores muy alejados del valor más frecuente
Simetría de la distribución: igual número de casos con valores mayores y menores que el valor más frecuente...
Organización y representación de los datos
La representación gráfica◦ Interpretación de los gráficos
Tipos de distribución Histograma unimodal simétrico
Simetría: un valor más común (moda) aproximadamente en el centro. Ejemplos: notas, altura, peso...
Organización y representación de los datos
La representación gráfica◦ Interpretación de los gráficos
Tipos de distribución Histograma simétrico bimodal
Dos valores con más casos (modas) Simétrico en torno a valor con pocos casos Extraño: ¿2 poblaciones?
Organización y representación de los datos
La representación gráfica◦ Interpretación de los gráficos
Tipos de distribución Histograma unimodal asimétrico a la izquierda
Un valor con más casos (moda) “Cola” hacia la izquierda Ejemplo: esperanza de vida
Organización y representación de los datos
La representación gráfica◦ Interpretación de los gráficos
Tipos de distribución Histograma unimodal asimétrico a la derecha
Un valor con más casos (moda) “Cola” hacia la derecha Ejemplos: ingresos o gastos