Tablas de frecuencias

38
Unidad II. Distribución de Frecuencias y Presentación de Datos Prof. Elisa Mendoza G. Universidad de Panamá

Transcript of Tablas de frecuencias

Page 1: Tablas de frecuencias

Unidad II. Distribución de Frecuencias y

Presentación de Datos

Prof. Elisa Mendoza G.

Universidad de Panamá

Page 2: Tablas de frecuencias

Unidad II. Distribución de Frecuencias

OBJETIVOS:• Reconocer los elementos y

conceptos de las tablas defrecuencias.

• Organizar los datos en tablas defrecuencias.

• Interpretar tablas de frecuencias

• Elaborar gráficas a partir de lastablas de frecuencias.

CONTENIDOS:• Conceptos de Tablas de

Frecuencias• Organización de datos. Diagrama de

Tallo – Hoja

• Elementos de una Tabla de Frecuencias

• Frecuencia Absoluta

• Frecuencia Relativa

• Frecuencias Acumuladas

• Gráficas relacionadas con las Tablas de Frecuencias• Histograma

• Polígono de Frecuencias

• Ojiva

Prof. Elisa Mendoza 2

Page 3: Tablas de frecuencias

Distribución de Frecuencias• En la actualidad se recaban una gran cantidad de datos sobre

diversos tópicos en cualquier campo ocupacional, de servicio ode investigación, inclusive en el campo personal para la toma dedecisiones, o la descripción del fenómeno estudiado.

• En cualquiera de los casos, la organización de los datos es uno de los primeros pasos en el análisis de los datos.

• Los datos pueden ser organizados de distintas formas:

• Ordenar los datos, de acuerdo a su magnitud, alfabéticamente, lógico, u otro orden.

• Organizar y Presentar en Diagramas de Tallo y Hoja

• Organizar en Tablas de Frecuencias, Datos no agrupados y Datos agrupados.

• Gráficas para datos cualitativos, y Gráficas para datos cuantitativos.

Prof. Elisa Mendoza 3

Page 4: Tablas de frecuencias

ORGANIZACIÓN DE DATOS: Diagrama de Tallo - Hojas

• Es un arreglo ordenado de los datos en doscolumnas. Los números se dividen en dosgrupos, separando el último dígito o la unidadmínima. En la primera columna se colocarán deforma ordenada los valores restantes sinrepetición. A esta columna se le denomina Tallo;a la siguiente columna se le denomina Hojas. Yse colocan las unidades separadas en cada tallocorrespondiente, de forma ordenada,incluyendo las repeticiones. El total de Hojas,corresponderá al total de datos ordenados.

• Tal y como se observa en el ejemplo

Prof. Elisa Mendoza 4

Ejemplo

Page 5: Tablas de frecuencias

Ejemplo• Los siguientes datos corresponden al Índice de Masa Corporal

(IMC) de los estudiantes del Proyecto Jóvenes en Acción por unAmbiente Sano.

Prof. Elisa Mendoza 5

Tallo Hojas18. 2 6 919. 3 920. 4 8 9 9

21. 4 5 5 5

22. 0 1 1 3 3

23. 0 3 6 824. 5 625. 626. 2 2 927. 2 2 5

28. 129. 4

30. 831. 0 0

Diagrama de tallo – Hoja del IMCIMC

18.2 22.1 25.6

18.6 22.3 26.2

18.9 22.3 26.2

19.3 23.0 26.9

19.9 23.3 27.2

20.4 23.3 27.2

20.8 23.6 27.5

20.9 23.6 28.1

20.9 23.8 29.4

21.4 23.8 30.8

22.0 24.5 31.0

22.1 24.6 31.0

Datos

Los dígitos de las hojas

deben totalizar el número de datos de la muestra.

Page 6: Tablas de frecuencias

Otros Tipos de Diagramas de Tallo - Hoja

Prof. Elisa Mendoza 6

Tallo Hojas

6 1

6* 8 9

7 0 0 3 4

7* 5 5 5 7

8 0 1 1 3 3

8* 5 5 6 8

9 0 0 1

9* 5 7 8

10 0

Tallo y Hoja con frecuencia. Salida de SPSS

Tallo y Hoja clasificado por otra

variable (dos hojas y un solo tallo)

Tallo subdividido,

cuando los datos

tienen poca

variabilidad y la

muestra es grande.

Page 7: Tablas de frecuencias

Tablas de frecuencias• Las tablas de frecuencias son arreglos ordenados de los datos.

Los datos son ordenados de menor a mayor o viceversacolocándoles al lado el número de veces que se repite cada dato(frecuencias).

• El primer paso, es determinar las características de la cantidad yel rango de variabilidad de los datos.

• Si los datos son pocos y tienen poca variabilidad, bastará con sóloordenarlos en una lista de datos.

• Si los datos son muchos y con poca variabilidad, se pueden obtenerlas frecuencias sin agrupar los datos en rangos.

• Si los datos son muchos y con mucha variabilidad, entonces convienehacer una tabla de frecuencias con rangos de agrupación de losdatos.

Prof. Elisa Mendoza 7

Page 8: Tablas de frecuencias

Ejemplos

Prof. Elisa Mendoza 8

Edad

5

6

7

7

8

10

14

17

18

18

Tipo 1.

Pocos datos y

poca variabilidad.

Las frecuencias de los

datos es la misma

(uno) para cada dato

de la lista)

Edad N° %

5 3 3.9

6 7 9.2

7 15 19.7

8 16 21.1

10 8 10.5

14 12 15.8

17 9 11.8

18 6 7.9

Total 76 100

Tipo II.

Muchos datos y poca

variabilidad.

Edad N° %

0-4 18 7.8

5-9 25 10.9

10-14 30 13.0

15-19 34 14.8

20-24 37 16.1

25-29 29 12.6

30-34 36 15.7

35-39 21 9.1

Total 230 100

Tipo III.

Muchos datos y Mucha

variabilidad.

Cuando los datos son

prácticamente los mismos,

pero se repiten muchas

veces, conviene ordenarlos

y colocar su frecuencia.

Si son muchos datos, y son

diferentes muchos de ellos

(variabilidad), entonces,

conviene agrupar los datos y

colocar la frecuencia para cada

grupo de datos.

El Rango de variabilidad, se obtiene como la diferencia del dato con el máximo valor y el dato con

el mínimo valor: R=Xmax-Xmin

R=18-5=13

R=18-5=13 R=39-0=39

Page 9: Tablas de frecuencias

Tablas de Frecuencias.

(Datos Agrupados)

Los datos pueden ser agrupados en rangos o clases, cuando son

muchos en cantidad y variabilidad, proporcionando una mejor

presentación para los usuarios de la información.

Cuando los datos son agrupados en clases, a esta presentación

se le llama Tabla de Frecuencia para datos agrupados.

En las tablas de frecuencias, se presentan las columnas de:

Clases o Intervalos de los datos, Frecuencias Absolutas,

Frecuencias Relativas, entre otras columnas que permiten

además, cálculos de medidas estadísticas.

Prof. Elisa Mendoza 9

Page 10: Tablas de frecuencias

Bien, ¿Cómo se

elabora la tabla

de frecuencias?

Existen diversos Criterios para determinar el

Número de Intervalos de Frecuencias o Clases:

Uso de la fórmula de Sturges: C=1+3.322*log(n)

Calculando la Raíz de n. C= raiz(n)

A Juicio del Investigador

Generalmente, se acostumbra que el Número de

Intervalo de Clases esté entre 5 y 15.

Donde: n, es el número total de datos.

Las clases (rangos o intervalos) de los datos, se

construyen de la siguiente manera:

Prof. Elisa Mendoza 10

Page 11: Tablas de frecuencias

Tabla de frecuencias

Prof. Elisa Mendoza 11

Tabla de Frecuencias Tipo III

Variable

Edad fi fr% Fi Fr%

5 3 3.9 3 3.9

6 7 9.2 10 13.2

7 15 19.7 25 32.9

8 16 21.1 41 53.9

10 8 10.5 49 64.5

14 12 15.8 61 80.3

17 9 11.8 70 92.1

18 6 7.9 76 100.0

Total 76 100

Frecuencias absolutas Frecuencias acumuladas

Tabla de Frecuencias Tipo II

Variable

Peso (kg) fi fr% Fi Fr% mi Lri Lrs

55-59 15 9.4 18 9.4 2 54.5 59.5

60-64 36 22.5 54 31.9 7 59.5 64.5

65-69 21 13.1 75 45.0 12 64.5 69.5

70-74 26 16.3 101 61.3 17 69.5 74.5

75-79 24 15.0 125 76.3 22 74.5 79.5

80-84 18 11.3 143 87.5 27 79.5 84.5

85-89 12 7.5 155 95.0 32 84.5 89.5

90-94 8 5.0 163 100.0 37 89.5 94.5

Total 160 100

Frecuencias absolutas Otros datos de las tablas de frecuenciasFrecuencias acumuladas

Se agregan:

mi: Punto medio (PM)

Límites reales: Lri

(inferior) y Lrs (superior)

Page 12: Tablas de frecuencias

Tablas de Frecuencias.

Conceptos Generales

Frecuencia absoluta (fi): es el número de valores o datos que se

encuentran en el intervalo i. La suma de las frecuencias absolutas

equivale al número total de observaciones (n)

Frecuencia relativa (fr): corresponde a la proporción de datos

que se encuentra en cada intervalo i. Se obtiene de la división de

la frecuencia absoluta (fi) del intervalo i, entre el total de

observaciones (n). Ésta proporción, se puede expresar como una

fracción o porcentaje (si es multiplicada por 100). La suma de fr

debe totalizar 1.00 (si lo deja en fracciones o decimales) ó 100 (si

lo expresa en porcentajes).

Prof. Elisa Mendoza 12

Page 13: Tablas de frecuencias

Tablas de Frecuencias.

Conceptos Generales

Frecuencias Acumuladas (Fi y Fr): es el número de datos que están por

encima o por debajo de un valor determinado del intervalo i. Se obtiene de

la acumulación de las frecuencias de intervalo, se empieza con los

intervalos menores o mayores. Generalmente, se acumula hacia abajo (De

menor a mayor).

La primera Fi y Fr coinciden con la primera fi y fr, respectivamente. La

última Fi y Fr deben ser n y 100, respectivamente. Véase el ejemplo

Puntos Medios o Marcas de Clase (mi o PM): es el punto medio del

intervalo i. Se calcula promediando el límite inferior y el límite superior de

cada clase. También se le denomina marca de clase, ya que es un valor que

representa al intervalo al cual pertenece. La marca de clase es un valor

medio contenido en el intervalo i.

Prof. Elisa Mendoza 13

Page 14: Tablas de frecuencias

Tabla de Distribución de Frecuencias de las Ventas de

Equipos informáticos (en miles) en 210 Tiendas

Electrónicas. 2014

Prof. Elisa Mendoza 14

Venta de equipos(en miles)

Frecuencia

Límite inferior (Li) Límite superior (Ls) fi fr%

10 19 21 10.020 29 35 16.730 39 43 20.540 49 47 22.450 59 31 14.860 69 18 8.670 79 15 7.1Total 210 100.0

fi. Frecuencia absoluta o conteo.

fr%, frecuencia relativa porcentual (fi/total * 100).

Page 15: Tablas de frecuencias

La Distribución NormalLa desviación estándar puede utilizarse para sacar ciertas conclusiones,

como por ejemplo, si el conjunto de datos en cuestión está distribuido

normalmente. Una distribución normal es una distribución de datos

continuos (no discretos) que produce una curva simétrica en forma de

campana. Cuyas características, entre otras, permite generar la regla

empírica de la distribución de los datos.

0 5 10 15

20

x

Fre

cuen

cia

de

Ob

serv

ació

n

f(x)

Prof. Elisa Mendoza 15

Page 16: Tablas de frecuencias

Medidas de Forma

Prof. Elisa Mendoza 16

Page 17: Tablas de frecuencias

Medidas de Forma de la distribución: Sesgo y Curtosis

La distribución de las frecuencias de los datos ordenados,

proveen información sobre la forma de la concentración o

dispersión de los datos. Estas medidas se conocen como

Sesgo y Curtosis. Una se refiere a la forma de la dispersión, y

la otra a la forma de la concentración de los datos.

Una distribución normal, tiene la mayor concentración de

datos en los valores centrales y su media, moda y mediana

son iguales, además que la dispersión de los datos es

simétrica respecto a su media. Cuando esto no ocurre,

entonces se dice que la distribución está sesgada.

Prof. Elisa Mendoza 17

Page 18: Tablas de frecuencias

Medidas de Forma de la distribución: Sesgo y Curtosis

Existen diversas técnicas para evidenciar las medidas de forma de una

distribución de la frecuencia de los datos, entre ellas las de tipo gráfico y

las numéricas.

Una primera aproximación para determinar el SESGO, es comparando las

medidas de tendencia central:

• Cuando las tres medidas de tendencia central: media, mediana y moda

coinciden, se dice que la distribución es INSESGADA o SIMÉTRICA.

• Cuando la Media es mayor que la mediana, el SESGO se da a la

derecha por que se hace una cola larga hacia esa dirección.

• Cuando la Media es menor que la Mediana, entonces el SESGO se da

a la izquierda y la cola larga es en esa dirección.

Prof. Elisa Mendoza 18

Page 19: Tablas de frecuencias

Sesgo o Asimetría

Moda<Mediana< Media

Sesgo a la Derecha

Sesgo a la izquierda

Moda>Mediana> Media

Distribución Normal

(No Sesgo o Insesgada)

Prof. Elisa Mendoza 19

Fórmula de Pearson:

Donde: Md, se refiere a la mediana de los datos.

s, Es la desviación estándar de los datos.

Es la media de los datos.ҧ𝑥

As > 0

As < 0

As = 0

Page 20: Tablas de frecuencias

Curtosis

• Por su parte, la medida de forma con relación a laconcentración de los datos, es la Curtosis.

• La Curtosis, determina el grado de concentración quepresentan los valores alrededor de la media de ladistribución de los datos.

Prof. Elisa Mendoza 20

Donde: N, se refiere al número de datos.

s, Es la desviación estándar de los datos.

Es la media de los datos.ҧ𝑥

Page 21: Tablas de frecuencias

Curtosis

Prof. Elisa Mendoza 21

Distribución

PLATICÚRTICA,

Las frecuencias de la

distribución de los

datos son muy

parecidas o similares.

Distribución

MESOCÚRTICA,

Las frecuencias de la

distribución de los

datos son muy

parecidas o similares.

Distribución

LEPTOCÚRTICA,

Las frecuencias de la

distribución de los

datos son muy

parecidas o similares.

Page 22: Tablas de frecuencias

Cuadros y Gráficas Estadísticas.

Prof. Elisa Mendoza 22

Page 23: Tablas de frecuencias

Formato del Cuadro Estadístico

Cuadro (Número (1) ). (Título (2))

Encabezado (3)

Columna

Matriz

(4)

Matriz de Datos (5)

Casilla (6)

Notas (7)

Llamadas (8)

Fuente (9)

** Los cuadros estadísticos no se cierran con líneas en los bordes izquierdo ni derecho.

Prof. Elisa Mendoza 23

Page 24: Tablas de frecuencias

Formato del Cuadro Estadístico

1. Número de Cuadro: Es el número que identifica un cuadro y se coloca luego de

la palabra Cuadro. Debe concluir con el punto y dejar dos espacios para anotar el

título.

2. Título El título debe ser de corta extensión y debe, expresar claramente el

contenido del cuadro para facilitar su interpretación. Por lo general, el título está

orientado a contestar las siguientes preguntas ¿qué clase de datos? ¿dónde se

obtuvieron? ¿cómo han sido clasificados? y ¿cuándo se obtuvieron?. El título debe

escribirse en letras mayúsculas cerrada y centrado.

3. Encabezamiento: Son las columnas que se colocan a continuación del título, allí

se colocan los títulos que corresponde a cada columna. La principal característica se

coloca en el primer nivel en los siguientes niveles, las características dependientes,

serán las colocadas en el título, precedidas por la preposición "por" y que detallan la

información obtenida para la confección del cuadro.

Prof. Elisa Mendoza 24

Un cuadro estadístico es un arreglo ordenado de los datos, cuyo formato con una estructura

formal, establecido en el Manual para la elaboración y publicación de cuadros elaborado por el

Instituto de Estadística y Censos, de la Contraloría General de la República.

Page 25: Tablas de frecuencias

Ejemplo para redactar el Título

Cuadro No. 1. ESTUDIANTES DE LA UNIVERSIDAD

DE PANAMÁ, POR SEXO, SEGÚN FACULTAD.

Año 2014

Obsérvese que el título responde a las preguntas:

¿qué población? ESTUDIANTES

¿De dónde? DE LA UNIVERSIDAD DE

PANAMÁ

¿cómo se clasifican? POR SEXO, SEGÚN FACULTAD

Cuándo se obtuvieron los datos? Año 2014

Prof. Elisa Mendoza 25

Page 26: Tablas de frecuencias

Formato del cuadro estadístico

4. Columna Matriz: Es la primera columna de la izquierda que

encontrarnos en un cuadro estadístico; el contenido de esta columna debe

guardar relación con la expresión precedida por la preposición "según" en el

título.

5. Cuerpo del Cuadro (Matriz de Datos): Está constituido por los espacios

que forman las filas y columnas, es decir, por líneas que se trazan en forma

vertical u horizontal. Sólo se tratan las líneas verticales dejando los extremos

abiertos.

6. Casillas: Pertenecen al cuerpo del cuadro y resultan como una columna

del encabezamiento en estas casillas debe colocarse siempre algún valor, no

puede aparecer en blanco.

Prof. Elisa Mendoza 26

Page 27: Tablas de frecuencias

Formato del cuadro estadístico

7. Nota: Las notas se hacen en la parte inferior de la página que le corresponde,

su objetivo es el de brindar información más amplia para que la persona que

utilice el cuadro comprenda rápida y directamente su contenido.

8. Llamadas: Se utiliza cuando es necesario llamar la atención sobre una parte

específica de la información que se presenta en el cuadro.

9. Fuentes de Información: En cada cuadro debe anotarse el origen de la

información. La fuente se coloca después de las notas o llamadas si las hay.

Prof. Elisa Mendoza 27

Page 28: Tablas de frecuencias

Ejemplo de Cuadro Estadístico

Cuadro No. 1. ESTUDIANTES DE LA UNIVERSIDAD DE PANAMÁ,

POR SEXO, SEGÚN FACULTAD.

Año 2014

No. % No. No. %%

Estudiantes

TotalHombre Mujer

Facultad

Total

Administración de Empresas

Ciencias de la Educación

Ciencias Naturales, Exactas y Tecnología

Economía

Fuente: Estudio realizado en una población estudiantil en el año 2014.

Prof. Elisa Mendoza 28

Sexo

Obsérvese que los totales de filas y columnas, se ubican en primer lugar. También que el cuadro no se cierra en los bordes

derecho ni izquierdo.

Page 29: Tablas de frecuencias

Gráficas EstadísticasTodo gráfico es la expresión de los números

proporcionados por los cuadros estadísticos. Por lo

mismo, el gráfico nunca podrá reemplazar al cuadro

estadístico y sólo debe aceptarse como un complemento

de aquel.

Las características expresadas en la confección del

cuadro estadístico, como: Título, Notas, Llamadas y

Fuente son válidas en la confección de las Gráficas.

Además el gráfico, incluye títulos de cada uno de los

ejes entre otros.

Prof. Elisa Mendoza 29

Page 30: Tablas de frecuencias

Tipos de Gráficos recomendados, de acuerdo al tipo de variable:

Gráficas Datos cuantitativos:

• Histograma: Barras verticales sobre los límites de clases

• Polígono de Frecuencia: Líneas conectadas en los puntos

medios de cada intervalo de clase y su respectiva frecuencia

(relativa, relativa porcentual o absoluta)

•, Ojiva (menor que): Líneas en secuencia conectadas sobre

los límites de clases inferiores y su frecuencia relativa

acumulada (porcentual).

Gráficas Datos cualitativos:

Barras (Columnas), Pastel (Circular) y Diagrama de Pareto.

Prof. Elisa Mendoza 30

Page 31: Tablas de frecuencias

Gráficas para datos cuantitativos. Histograma:

Presenta la distribución de los datos para comparar con la curva de una

distribución Normal (Gauss). En el eje de las X se ubican los intervalos

o clases (o característica) y en el eje de las Y se colocan las frecuencias

absolutas.

Prof. Elisa Mendoza 31

0

1

2

3

4

5

6

7

8

9

22 37 52 67 82

Clie

nte

s (f

i)

Edad (Punto medio)

DISTRIBUCIÓN DE FRECUENCIAS DE LA EDAD DE CLIENTES BANCARIOS

Page 32: Tablas de frecuencias

Gráficas para datos cuantitativos. Polígono de frecuencias:

Presenta la distribución de los datos para comparar con la curva de unadistribución Normal (Gauss). En el eje de las X se ubican los puntomedios de cada clase de la característica medida y en el eje de las Y secolocan las frecuencias absolutas.

Se llama polígono a la gráfica de líneas cerrada que une los puntosmedios de acuerdo a su frecuencia absoluta.

Prof. Elisa Mendoza 32

0

78

4

12

00

2

4

6

8

10

22 37 52 67 82

Clie

nte

s (f

i)

Edad (Puntos medios)

DISTRIBUCIÓN DE FRECUENCIAS DE LA EDAD DE CLIENTES BANCARIOS

Page 33: Tablas de frecuencias

Gráficas para datos cuantitativos. Ojiva “Menos que”

Es una gráfica de línea continua, que representa en el eje de las Y las

frecuencias acumuladas relativas porcentuales y en el eje de las X se

ubican las clases de la característica medida.

Prof. Elisa Mendoza 33

0%

20%

40%

60%

80%

100%

120%

14.5 29.5 44.5 59.5 74.5 89.5

Fr%

Edad (Límites reales)

DISTRIBUCIÓN DE FRECUENCIA ACUMULADA DE LAS EDADES DE LOS CLIENTES BANCARIOS

Page 34: Tablas de frecuencias

Gráficas recomendadas para datos cualitativos: Barras o Columnas

Prof. Elisa Mendoza

34

Barras o columnas simples Barras o columnas comparativas

Barras horizontales comparativas Barras o columnas Apiladas

Page 35: Tablas de frecuencias

Gráficas recomendadas para datos cualitativos: Pastel o Circulares

Prof. Elisa Mendoza 35

Hombre75%

Mujer25%

ESTUDIANTES DE LA UNIVERSIDAD DE PANAMÁ, SEGÚN SEXO. Año 2015

Gráfica circular simple, cuando se representa una sola variable

Gráfica circular combinada, cuando se representan dos variables

Page 36: Tablas de frecuencias

Gráficas Lineales y de Puntos

Prof. Elisa Mendoza

36

Gráfica lineal simple (serie temporal) Gráfica lineal comparativa (serie temporal)

Gráfica bi variada (dos variables) – Diagrama de dispersión o de puntos.

Page 37: Tablas de frecuencias

Práctica. No.1

1. El siguiente conjunto de datos muestra el precio de venta

en el mercado inmobiliario, de Apartamentos Nuevos en 30

ciudades seleccionadas (los precios están en miles de

dólares):

Construya la tabla de frecuencias.

Elabore las gráficas correspondientes.

Prof. Elisa Mendoza 37

275.6 156.0 172.8158.3 262.0 150.5272.4 156.0 161.0152.9 265.0 360.2161.0 453.0 175.0166.5 177.0 161.2262.5 354.2 179.9182.6 173.4 170.0266.5 472.9 162.0175.3 162.5 154.0

Page 38: Tablas de frecuencias

Práctica. No. 3

Elabore las gráficas correspondientes.

3. Utilice las siguientes tablas de datos para elaborar las gráficas según

corresponda.

Prof. Elisa Mendoza 38

Sexo Labora No labora

Hombre 15 35

Mujer 9 21

Año

Accidentes

laborales

2000 12

2001 10

2002 11

2003 9

2004 5

2005 6

Actividad de

entretenimiento N°

Ver Televisión 18

Hacer deportes 21

Leer 11

Otros 7

Los datos corresponden a pacientes atendidos

en la clínica Dr. Muelita en Junio de 2015

Los datos corresponden al número de accidentes

laborales ocurridos en la empresa XYZ, en los años

2000 a 2005

Los datos corresponden a clientes encuestados

en el MALL Rosalitos, en agosto de 2014

Los datos son ficticios