GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

33
08 2021 Apropiación social del conocimiento Generación de contenidos impresos N.° 8, septiembre de 2021 doi: https://doi.org/10.16925/gcgp.32 GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA DESCRIPTIVA Jorge Alejandro Obando-Bastidas Universidad Cooperativa de Colombia Sede Villavicencio María Teresa Castellanos Sánchez Universidad de los Llanos

Transcript of GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Page 1: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

082021

Apropiación social del conocimientoGeneración de contenidos impresos

N.° 8, septiembre de 2021doi: https://doi.org/10.16925/gcgp.32

GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA

PARA ESTADÍSTICA DESCRIPTIVA

Jorge Alejandro Obando-BastidasUniversidad Cooperativa de Colombia

Sede Villavicencio

María Teresa Castellanos SánchezUniversidad de los Llanos

Page 2: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Acerca de los autores

Jorge Alejandro Obando-Bastidas, doctor en Docencia e

Investigación, profesor tiempo completo de Contaduría

Pública, Universidad Cooperativa de Colombia, sede Vi-

llavicencio.

Correo electrónico: [email protected]

Cvlac:https://scienti.minciencias.gov.co/cvlac/visualiza-

dor/generarCurriculoCv.do?cod_rh=0001281569

Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/

visualiza/visualizagr.jsp?nro=00000000009298

orcid: https://orcid.org/0000-0002-4283-2871

Google Scholar: https://scholar.google.es/cita-

tions?hl=es&user=WHrpjDwAAAAJ

María Teresa Castellanos Sánchez, doctora en Educa-

tion Mathematica, profesora titular de Licenciatura en

matemáticas, Universidad de los Llanos.

Correo electrónico: [email protected]

Cvlac:http://scienti.colciencias.gov.co:8081/cvlac/visua-

lizador/generarCurriculoCv.do?cod_rh=0000609455

Gruplac: https://scienti.minciencias.gov.co/gruplac/jsp/

visualiza/visualizagr.jsp?nro=00000000007746

orcid: https://orcid.org/0000-0001-7850-3183

Google Scholar: https://scholar.google.es/citations?u-

ser=yn9pkUYAAAAJ&hl=es&oi=ao

Cómo citar este documento

Obando Bastidas, J. A. y Castellanos Sánchez, M. T. (2021).

Gráficos estadísticos: guía práctica para estadística descripti-

va (Generación de contenidos impresos N° 08). Ediciones

Universidad Cooperativa de Colombia. doi: https://doi.

org/10.16925/gcgp.32

NOTA LEGALEl presente documento de trabajo ha sido incluido dentro de nuestro repositorio institucional como Apropiación social de conocimiento por solicitud del autor, con fines informativos, educativos o académicos. Asimismo, los argumentos, datos y análisis incluidos en el texto son responsabilidad absoluta del autor y no representan la opinión del Fondo Editorial o de la Universidad.

DISCLAIMERThis coursework paper has been uploaded to our institutional repository as Social Appropriation of Knowledge due to the request of the author. This document should be used for informational, educational or academic purposes only. Arguments, data and analysis included in this document represent authors’ opinion not the Press or the University.

Este documento puede ser consultado, descargado o reproducido desde nuestro repositorio institucional (http://repository.ucc.edu.co/handle/20.500.12494/7369) para uso de sus contenidos, bajo la licencia de Creative Commons Reconocimien-to-NoComercial-SinObraDerivada 4.0 Internacional. http://creativecommons.org/licenses/by-nc-nd/4.0/

Page 3: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

TABLA DE CONTENIDO

Resumen 7

Introducción 8

Propósito 8

Unidad de competencias 8

Elemento de competencia del saber 8

Marcos teóricos 8

Campo de acción 9

División 9

Población 9

Muestra 10

Variables 10

Variables enteras o discretas 10

Variables reales o continuas 10

Variables cualitativas 10

Clasificación de las variables según su naturaleza 10

Tablas de frecuencia 11

Gráficos estadísticos 12

Gráficos para datos categóricos 12

Gráfico de barras 13

Gráfico de sectores 13

Gráfico de arañas 15

Gráfico de anillos o sectores 15

Gráficos para datos numéricos enteros 15

Page 4: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Diagrama de barras para variables numéricas enteras 17

Gráfico de diagramas integrales 18

Tabla de frecuencias para datos continuos a través de intervalos 19

Ejemplo de aplicación 19

Gráficos para datos continuos organizados en intervalos de clase 20

Histograma 21

Diagrama de Tortas 21

Ojivas 22

Polígonos de frecuencia 23

Otras graficas 23

Boxplot 23

Diagrama de Pareto 25

Ejercicios de aplicación 27

Referentes 32

Page 5: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

ÍNDICE DE TABLAS Y FIGURAS

Tabla 1. Clasificación y tipos de variables 11

Tabla 2. Estructura de una tabla de frecuencias 12

Tabla 3. Tabla de frecuencias para la variable motivos de visita al departamento del Meta 13

Tabla 4. Tabla de frecuencias del número de fallecidos por la covid-19 en Colombia discriminado por estratos sociales 17

Tabla 5. Edades de cien personas que se recuperan de la covid-19 20

Tabla 6. Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital 20

Tabla 7. Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital 21

Tabla 8. Tabla de Pareto de personas con la covid-19 que se recuperan en el hospital 25

Figura 1. Asesinatos de líderes sociales (2016-2019). 9

Figura 2. Gráfico de barras para la variable motivos para visitar los Llanos orientales (1) 14

Figura 3. Gráfico de barras para la variable motivos para visitar los Llanos orientales (2) 14

Figura 4. Gráfico de torta para la variable motivos para visitar los Llanos orientales 15

Figura 5. Gráfico de araña o radar para la variable motivos para visitar los Llanos orientales 16

Figura 6. Gráfico anillos para la variable motivos para visitar los Llanos orientales 16

Figura 7. Porcentaje de muertes por la covid-19 en Colombia por estratos sociales 17

Page 6: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Figura 8. Número de muertes por covid-19 en Colombia por estratos sociales 18

Figura 9. Diagrama integral para el número de muertes por covid-19 18

Figura 10. Histograma de personas con la covid-19 que se han hospitalizado. 21

Figura 11. Diagrama de tortas de personas con la covid-19 que se han hospitalizado 22

Figura 12. Ojiva de personas con covid-19 que se han hospitalizado 22

Figura 13. Polígono de frecuencias de personas con covid-19 que se han hospitalizado 23

Figura 14. Boxplot por género de personas con la covid-19 que se han hospitalizado 24

Figura 15. Pirámide poblacional por género de personas con la covid-19 en Colombia 25

Figura 16. Diagrama de Pareto de personas con la covid-19 que se recuperan en el hospital 26

Figura 17. Radiografía de la deforestación en el Amazonas brasileño (junio del 2019). 29

Figura 18. Emisiones gei de Colombia en el 2012 30

Page 7: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

ResumenLos gráficos estadísticos son objetos de la estadís-tica con los que se pretende establecer un grado de comunicación, breve, sencillo y didáctico. El propósito general que motiva el desarrollo de este documento es la apropiación de las características de los gráficos construidos en las tablas de frecuen-cias y en los datos no agrupados que provienen de bases de datos reales. La importancia de adquirir la habilidad de diseñar un gráfico radica principal-mente en la necesidad de comunicar datos de una manera visual, de manera que sea comprendido ampliamente por muchos grupos. Generalmente, los gráficos están en todos los medios de comu-nicación visuales y transmiten la realidad de los acontecimientos; el presente documento contiene, desde la definición de variables hasta la construc-ción de gráficos, estableciendo diferencias entre las variables de tipo numérico y las variables de tipo categórico. Los gráficos que aquí se muestran par-ten de la construcción de una tabla de frecuencias y son datos agrupados; sin embargo, gráficos como los Boxplot, no necesitan agrupación de los datos, puesto que, por su característica, estos gráficos sa-len de las bases de datos y proponen una informa-ción más precisa, ya que provienen de la fuente tal y como se conciben. Finalmente, en el trabajo se proponen algunos ejercicios de bases de datos rea-les y como propósito de evaluación se entrega un cuestionario de diez preguntas, diseñado con base en los lineamientos y los requerimientos de la ta-xonomía solo.

Palabras clave: datos agrupados, datos no agrupados, frecuencias, variables categóricas, variables numéricas.

GRÁFICOS ESTADÍSTICOS:GUÍA PRÁCTICA PARA ESTADÍSTICA DESCRIPTIVA

Jorge Alejandro Obando-Bastidas

María Teresa Castellanos Sánchez

08

Page 8: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

8 · Generación de contenidos impresos

Unidad de competenciasConstruir información para que apoye la toma de decisiones en el entorno organizacional me-diante organización, sistematización y lectura de datos.

Elemento de competencia del saberClasificar las herramientas estadísticas para la sistematización de la información.

Marcos teóricosLa abundancia de datos y fuentes de informa-ción en la era de internet y de las redes sociales genera complejidad en los procesos de comuni-cación, lo cual también genera dificultad para aquellas personas y entidades que toman de-cisiones a partir de ellos. Desde esta posición, Ross (2018) propone que la estadística es un arte que propicia el aprendizaje usando datos como insumo de la información, ya que ayuda en su descripción, organización y análisis, lo que lleva a tomar conclusiones y decisiones. 

Por otro lado, la estadística no solo evidencia un proceso para organizar los datos y tomar decisiones a partir de ellos, también permite evidenciar la realidad, contemplar el contex-to a partir de una problemática real y una po-sición visual (Castellanos y Obando, 2013). Por ejemplo, en forma gráfica, la figura 1 informa sobre el fenómeno social de los asesinatos de líderes en Colombia, cruda realidad que se puede abordar en el estudio de la estadística. Con el análisis de la realidad se trata de fo-mentar el razonamiento estadístico, más que el aprendizaje rutinario y descontextualiza-do de conceptos y propiedades, puesto que la tecnología, hoy en día, permite aplicar la es-tadística con gran facilidad, por consiguiente, cobran mayor importancia las actividades in-terpretativas que el cálculo rutinario (Batane-ro y Díaz, 2011).

INTRODUCCIÓNLos gráficos estadísticos se visualizan en dife-rentes contextos, por ejemplo, en periódicos, revistas, libros, textos, entre otros. Su presen-cia masiva en todos los espacios y el poder de comunicación de ellos proponen un grado de importancia. Teniendo en cuenta la presen-cia de los gráficos estadísticos en las estructu-ras curriculares, esta guía se diseña teniendo en cuenta dos circunstancias: por un lado, se busca que los estudiantes que cursan progra-mas relacionados con las Ciencias Económi-cas, Administrativas y Contables desarrollen competencias en la lectura de gráficos y, por ende, alcanzar una mejor comprensión de este tipo de representación de los datos estadísti-cos; por otro lado, se pretende que esta guía se convierta en un material de apoyo para aque-llos estudiantes que ingresan a la universidad con escasa formación en estadística y que, por lo tanto, requieren un proceso de fortaleci-miento que estructure en ellos el aprendiza-je inicial de esta ciencia. El desarrollo de esta guía parte de una definición de estadística, su campo de acción, el reconocimiento de con-ceptos relacionados, con la muestra, pobla-ción, tipo de variables, construcción de tablas de frecuencia y sus respectivos gráficos. Se hace una distinción entre gráficos para datos discretos y datos continuos, además en la guía se analizan otro tipo de gráficos como el del Boxplot, las pirámides poblaciones, la impor-tancia de la regla de Pareto. Todos los ejercicios relacionados con la presente guía se desarro-llarán completamente en Excel.

PropósitoEstablecer diferencias entre los diferentes tipos de gráficos construidos a partir de tablas de frecuencias en datos agrupados y desde la propuesta de los datos dispuestos en bases de datos reales, como los bases del coronavirus y las bases de datos de las pruebas saber en Colombia.

Page 9: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 9

• Estadística descriptiva: se encarga de la recolección, la clasificación y la descrip-ción de datos muéstrales o poblacionales, para su interpretación y análisis.

• Estadística inferencial: desarrolla modelos teóricos que se ajusten a una determinada realidad con cierto grado de confianza.

Población Se define como un conjunto de individuos o de objetos que poseen una o varias característi-cas comunes. El total de las unidades posibles de observar hace referencia también a una de-finición de población. La población no hace re-ferencia únicamente a los seres vivos; una po-blación puede estar constituida por los peces de un estanque, por animales de una determi-nada raza.

Poblaciones finitasEn este tipo de población, el número de uni-dades observables es contable, es decir, un número conocido de elementos del conjunto llamado población. De la misma manera, se considera finita a una población, si se conoce

Campo de acciónLa aplicación de la estadística en la dirección de procesos enfatiza la toma de decisiones. La necesidad de resolver problemas pone de ma-nifiesto la aplicabilidad de la estadística. La aplicabilidad se extiende a todo el universo social, biológico, físico, ingeniería, educacional, médico, de negocios y leyes, en fin, a casi todas las fases de la vida.

El campo de la estadística es una disciplina dirigida a lograr un mejor entendimiento del mundo que nos rodea, con el objetivo final que todos tengamos una vida más completa y con un mayor entendimiento de esta. No hay parte de nuestro ambiente que no sea una fuente de datos (nosotros mismos, otros individuos, la familia, sociedades, culturas, ciudades, países, planetas, escuelas, colegios religiones, etcéte-ra), en pocas palabras cada aspecto de nuestra existencia, incluso el comportamiento de la covid-19 en Colombia y en el mundo.

DivisiónLa estadística se divide en dos grandes ramas de estudio:

120

100

80

60

40

20

0

1ero

de

ene

- 201

66

de a

go -

2016

7 de

ago

- 20

169

de ju

l - 2

017

10 d

e ju

l - 2

017

6 de

ago

- 20

17

10 d

e ju

l - 2

018

6 de

ago

- 20

18

7 de

ago

- 20

179

de ju

l - 2

018

7 de

ago

- 20

189

de ju

l - 2

019

32

69

5

105

10

68

FIGURA 1. Asesinatos de líderes sociales (2016-2019). Tomado de la Consejería Presidencial de los Derechos Humanos (2019).

Page 10: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

10 · Generación de contenidos impresos

ejemplo, tamaño, edad, precios, rendimiento académico o indicadores económicos.

VARIABLES ENTERAS O DISCRETASEn este conjunto de variables, los valores que se representan se visualizan como número entero. Por ejemplo, número de estudiantes en la universidad, número de personas diarios que se contagian con el virus sars-CoV-2.

VARIABLES REALES O CONTINUAS

Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores, ella se mide uniformemente. Dentro de la escala de los conjuntos numéricos, re-presentan a los números reales. Por ejemplo, estatura de los estudiantes de una universi-dad, salarios devengados por los docentes de un núcleo educativo, temperaturas a ciertas horas del día, edad de una persona.

VARIABLES CUALITATIVAS

Representan características propias de las cualidades de los objetos que conforman la muestra o la población. Por ejemplo, sexo, origen o color de piel.

Las variables cualitativas se dejan expresar en niveles de categoría. Por ejemplo, sexo: mascu-lino o femenino; origen: colombiano, venezola-no o panameño; color de piel: blanco, negro o amarillo.

CLASIFICACIÓN DE LAS VARIABLES SEGÚN SU NATURALEZA

Las variables sean enteras o continuas por su naturaleza se las puede clasificar como cate-góricas y numéricas; a la vez, esta clasificación responde a ciertos criterios de diferenciación.

Variables categóricas: establecen categorías de los datos. Producen muchas informaciones.

la fuente de donde provienen los datos. Por

ejemplo, la población de estudiantes de una

universidad es finita, ya que se sabe que en los

programas existe una base de datos en los que

están inscritos todos los estudiantes de dicha

universidad.

Poblaciones infinitasEn este tipo de población, el conteo de uni-dades observables se hace un poco difícil. El término de infinito en estadística no se ajusta a una definición semántica, puede hacer rela-ción a un grupo de objetos, personas, cosas, en las que se desconoce la fuente de donde pro-vienen. Ejemplo: como el número de vendedo-res informales, que dado la crisis de la pande-mia de covid-19, se ha incrementado en todas las ciudades de Colombia y estos no se regis-tran en una base de datos, se puede considerar una población infinita.

MuestraSe define como la mejor representación de la población. La muestra es un subconjunto de la población a la cual se le efectúa la medi-ción con el fin de estudiar las propiedades del conjunto del cual es obtenida. El tamaño de la muestra, la disponibilidad de recursos, la ho-mogeneidad de los elementos y de los datos que la conforman le da la importancia su-ficiente al uso adecuado de la muestra; un buen conocimiento de la población permite encontrar una buena muestra representativa. Existen muestras tomadas al azar y sin seguir ningún modelo de muestreo que llevan a con-clusiones inadecuadas y, por lo tanto, a tomar decisiones que no corresponden a la solución de un problema planteado dentro de conjunto.

Variables Es el conjunto de características de las entida-des que se interesan en una investigación; por

Page 11: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 11

de las de intervalo y tienen un origen. Por ejemplo, el peso de una persona.

En la tabla 1 se resume la clasificación de estas variables.

Tablas de frecuenciaMuchas veces se presenta una muestra con muchos datos, por lo que se hace necesario organizarlos en una tabla de frecuencias o en una distribución de frecuencias. Este tipo de tabla está formada por las distintas catego-rías (valores o intervalos) del carácter X y por las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.

A manera de definición, se puede decir que una tabla de frecuencias es un método para presentar la información en forma resumida, muestra los datos tal como aparecen en la dis-tribución, organizados en diferentes formas de conteo de los elementos de una variable, a lo que se denomina “frecuencia”. A continuación, se muestran los tipos de frecuencias que se presentan para organizar los datos.

Frecuencias absolutas (f) Se llama frecuencia absoluta (f) de la variable o categoría al número de datos que se presen-tan en el conteo directo de los datos que se repiten en una distribución. La suma de todas las frecuencias absolutas es el tamaño de la muestra, como se aprecia en la ecuación 1.

Por ejemplo: las categorías de bajos, medios,

altos superiores es una escala categórica de

estudiantes evaluados en una universidad.

Nominal: no establecen ningún orden. Corres-

ponde a variables categóricas; por ejemplo,

estado civil, soltero, casado, viudo, unión libre.

Ordinales: indican un orden. Por ejemplo,

grado académico (primaria, bachillerato, uni-

versidad, especialización y maestría).

Variables numéricas: a diferencia de las an-

teriores, producen más información y mejores

procedimientos estadísticos. A toda variable

numérica se la puede categorizar, pero pierde

información y detalles de esta. Por ejemplo, las

edades, siendo numérica producen informa-

ción relacionada con medias, medianas, modas,

entre otras. Se pueden categorizar como: niños,

jóvenes, adultos y tercera edad; en estas cate-

gorías ya no se puede obtener la información

que se obtuvo en el caso numérico.

Para tal efecto, las variables pueden ser:

Intervalo: se pueden asociar en intervalos

de clase y corresponden a variables de tipo

continuo. Preservan de las variables ordina-

les el orden y se acomodan las distancias. Por

ejemplo, salarios, edades, notas estudiantiles.

Razón: son variables que conservan más infor-

mación y detalles de las demás variables. Con-

servan el orden de las ordinales, la distancia

TABLA 1

Clasificación y tipos de variables

Tipo de variable Se dividen en Pueden ser Ejemplos

NuméricasContinuas

Intervalos Temperatura

Razón Salarios, notas obtenidas en un curso, estatura de una persona

Enteras Número de estudiantes en un salón, números de personas recuperadas de la covid-19.

CategóricasNominales Género, estado civil de una persona.

Ordinales Grados militares, formación académica.

Nota. Elaboración propia.

Page 12: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

12 · Generación de contenidos impresos

Finalmente, una tabla de frecuencias propone una estructura determinada, la cual se muestra en la tabla 2.

TABLA 2

Estructura de una tabla de frecuencias

Variable f h F H

X1 f1 h1 F1 H1

X2 f2 h2 F2 H2

X3 f3 h3 F3 H3

. . . . .

. . . . .

Xn fn hn n 1

Total n 1

Nota. Elaboración propia.

Gráficos estadísticosLos gráficos estadísticos son recursos visuales

que permiten comunicar la información, se

constituye en un instrumento estadístico para

analizar los datos en forma eficiente y desde

diferentes niveles de lectura (Castellanos y

Obando, 2013). Existen gráficos para los datos

numéricos y para los datos categóricos.

Gráficos para datos categóricosDe acuerdo con el tipo de frecuencias, se pueden

encontrar gráficos, tipo barra, torta, arañas,

barras acumuladas, pictogramas, anillos, entre

otros. A continuación, se propone una situa-

ción problemas y se construye en Excel la tabla

de frecuencias con sus respectivos gráficos. Por

ejemplo, en un estudio realizado en el Meta y

que está relacionado con el turismo, una de las

preguntas de la encuesta aplicada tenía el si-

guiente contenido: ¿cuál es el principal motivo

por el que usted visita al departamento del

Meta? Señale solo una opción:

∑ fi = n

f = f1 + f2 + f3 + ... + fn = n (1)

En la ecuación 1, n es el tamaño de la muestra.

Frecuencia absoluta relativa (h)Se llama frecuencia relativa de la variable X al cociente entre la frecuencia absoluta de cada dato y el total de elementos que conforman la muestra, como se aprecia en la ecuación 2.

hi = (2)

La suma de todas las frecuencias relativas re-presenta al 100 % de la población y equivale a 1 (uno), como se aprecia en la ecuación 3.

(3)

Frecuencias acumuladas (F)Esta frecuencia se obtiene de la acumula-ción sucesiva de las frecuencias absolutas. El último dato acumulado es el tamaño de la muestra, como se aprecia en la ecuación 4.

(4)

Frecuencias relativas acumuladas (H) Estas se obtienen de la acumulación sucesi-va de las frecuencias relativas. El último dato acumulado es el 100 % de la muestra, como se aprecia en la ecuación 5.

(5)

fn

f1

n

H

F1 = f1 + f2 + f3 + ... . fn = fi

f2

n

F2

nF1

n

f3

n

F3

n

n

n

n

i=1

i=1

i=1

fn

n

fn

n

hi

n

Fi

n

+

+

+

+

+ ... +

+ ... +

=

==

= 100%

= 100%

Page 13: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 13

TABLA 3

Tabla de frecuencias para la variable motivos de visita al departamento del Meta

Motivos f h F H

Paisaje 15 0,15 15 0,15

Gastronomía 15 0,15 30 0,3

Diversión 25 0,25 55 0,55

Calor Humano 19 0,19 74 0,74

Clima 14 0,14 88 0,88

Descanso 12 0,12 100 1

Total 100 1    

Nota. Elaboración propia, haciendo uso del Excel.

Gráfico de barrasEs una figura que permite representar los elementos de la variable de estudio con los valores obtenidos en la frecuencia absoluta o también se pueden representar los valores de la frecuencia relativa. En el ordenado siempre estarán los elementos que constituyen la va-riable y en el eje de las abscisas el valor de las frecuencias. La figura 2 se elaboró en Excel.

Obsérvese que, en la figura 2, se describen ex-clusivamente los valores de la frecuencia ab-soluta; cada barra evidencia el valor de la fre-cuencia absoluta, propuesto en la tabla 3.

En Excel se pueden generar diferentes formas para representar esta información; en la figura 3, se observa la misma gráfica, con la informa-ción sobre las barras y con una tabla de deno-minación de las unidades de variables. Queda a gusto del diseñador la forma como represen-ta la información.

Gráfico de sectoresDenominado también “tartas” (pie), consiste en un círculo dividido en tantas partes o por-ciones como valores de frecuencia relativa existan, a cada valor de frecuencias relativa le corresponde en forma proporcional un arco de círculo (figura 4).

1. Paisaje.

2. Gastronomía.

3. Diversión.

4. Calor humano.

5. Clima.

6. Descanso.

Se realizó la pregunta a 100 turistas y se obtu-vieron los siguientes resultados:

1 4 4 2 5 3 3

2 4 5 1 6 2 3

2 6 1 1 6 3 4

2 6 2 1 6 3 2

3 6 2 1 3 4 1

3 6 2 1 3 6 2

3 6 3 4 3 6 3

5 3 3 4 5 6 3

5 3 3 4 5 5 3

5 3 4 4 5 5 6

1 3 4 4 4 4

1 3 1 4 4 4

1 2 1 5 4 3

1 2 1 5 3 2

4 2 5 5 3 2

Siguiendo un proceso de organización en columna de los datos y en orden ascendente, Excel es una de las mejores herramientas para construir una tabla de frecuencias, ya que fa-cilita su conteo y su proceso de construcción, puesto que el uso de las fórmulas creadas en este permite con rapidez replicarla en otras celdas y obtener los demás resultados de una manera rápida y sencilla. La tabla de frecuen-cias construida a partir de los datos anteriores se puede observar en la tabla 3.

Page 14: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

14 · Generación de contenidos impresos

Figura 2. Gráfico de barras para la variable motivos para visitar los Llanos orientales (1). Elaboración propia haciendo uso de Excel como herramienta.

Figura 3. Gráfico de barras para la variable motivos para visitar los Llanos orientales (2). Elaboración propia haciendo uso de Excel como herramienta.

24

22

20

18

16

14

12

10

8

6

4

2

0Paisaje Gastronomía Diversión Calor

HumanoClima Descanso

15 15

25

19

14

12

Paisaje Gastronomía Diversión CalorHumano

Clima Descanso

Page 15: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 15

constituyen los anillos o los sectores. Son pe-queños sectores en forma de un aro o anillo, divido en forma proporcional de acuerdo con el valor de dicha frecuencia (figura 6).

Los diagramas para las frecuencias absolutas acumuladas, denominados “diagramas integra-les”, no tienen sentido en el contexto de las va-riables categóricas, se observarán en el contexto de las variables numéricas, enteras y continuas.

Gráficos para datos numéricos enterosAlgunos de los gráficos para datos enteros son los mismos que para los datos categóricos, sin embargo, en los datos numéricos enteros ya se pueden realizar gráficos para las frecuen-cias acumuladas. Para revisar el tipo de gráfi-cos, se propone una situación real que ocurre en Colombia en el margen de la aparición de la pandemia de covid-19. Se propone entonces la siguiente situación: en marzo del 2020, se registraron los primeros casos del virus, hasta el 3 de enero del 2021. El total de decesos por covid-19 era de 51 397. El Departamento Ad-ministrativo Nacional de Estadística (dane), con respecto al número de muertos por la covid-19, emitió la siguiente información que se resume en la figura 7.

La lectura de estos gráficos es directa, se lo hace teniendo en cuenta el valor del porcentaje pro-puesto en cada unidad de variable. Por ejemplo, el 25 % de los turistas visitan el Meta, porque aquí encuentran diversión. Una interpretación más general estará amarrada al objetivo de la investigación que generó la pregunta.

Gráfico de arañasUna gráfica de radar, también conocida como

un “diagrama de araña”, es una herramienta

muy útil para mostrar visualmente los valores

de una frecuencia relativa o absoluta. Su

nombre se hereda porque propone la visuali-

zación en la forma de una tela de araña. Pro-

porciona la misma información de un diagra-

ma de barras o de una torta (ver figura 5).

El gráfico de la figura 5 puede ser una exce-

lente alternativa para representar la informa-

ción de los datos propuestos en las frecuencias

relativas, brinda la misma información, pero

desde otra visualización.

Gráfico de anillos o sectoresOtra de las formas de representar las fre-cuencias relativas en variables categorías lo

Paisaje15%

Calor Humano19%

Gastronomía15%

Descanso12%

Clima14%

Diversión25%

Figura 4. Gráfico de torta para la variable motivos para visitar los Llanos orientales. Elaboración propia haciendo uso de Excel como herramienta.

Page 16: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

16 · Generación de contenidos impresos

Figura 5. Gráfico de araña o radar para la variable motivos para visitar los Llanos orientales. Elabora-ción propia haciendo uso de Excel como herramienta.

Paisaje

15%

15%

19%Calor Humano

GastronomíaDescanso

12%

Clima

14%

Diversión25%

Figura 6. Gráfico anillos para la variable motivos para visitar los Llanos orientales. Elaboración propia haciendo uso de Excel como herramienta.

Paisaje15%

15%

Calor Humano19%

Gastronomía

Descanso12%

Clima14%

Diversión25%

Page 17: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 17

por covid-19 en Colombia por estratos socia-les. Por ejemplo, en el estrato 1, a la fecha en las que se tomaron los datos de las bases de datos del ministerio de salud pública de Co-lombia, se observaban 16 910 personas en el estrato 1. La figura 8 permite comparar resul-tados; se observa, por ejemplo, que en los es-tratos 1, 2, y 3 es donde más se han presenta-do casos de mortalidad por la covid-19. Estos gráficos sencillos son ligeros de interpretación, son muy utilizados, ya que proponen la infor-mación de manera directa.

TABLA 4

Tabla de frecuencias del número de fallecidos por la COVID-19 en Colombia discriminado por estratos sociales

Estratos f h F H

Estrato 1 16 910 32,9 % 16 910 32,9 %

Estrato 2 18 863 36,7 % 35 773 69,6 %

Estrato 3 12 078 24 % 47 851 93,1 %

Estrato 4 2364 4,6 % 50 215 97,7 %

Estrato 5 771 1,5 % 50 986 99,2 %

Estrato 6 411 0,80 % 51 397 100,0 %

Total 51 397 100,0 %    

Nota. Información suministrada por el dane (16 de octubre de 2020).

La triste realidad reflejada en la figura 7 (que corresponde a una torta con frecuencias rela-tivas) evidencia que la mayoría de las muertes en Colombia son de personas que carecen de recursos económicos. Corresponde aquí rea-lizar otro tipo de gráficos que permitan evi-denciar la información desde otro punto de vista. Para ello, lo recomendable es reconstruir la tabla de frecuencias y proceder a la cons-trucción de otras representaciones; de esta manera, se presenta la tabla 4, correspondien-te a la tabla de frecuencias para la variable que relaciona el número de personas falleci-das en Colombia y discriminadas por estrato social (ver tabla 4).

Diagrama de barras para variables numéricas enterasUn gráfico de barras o gráfico de columnas es una forma de representar gráficamente un conjunto de datos o valores mediante barras rectangulares de longitud proporcional a los valores representados; los valores represen-tados pueden ser frecuencias relativas o fre-cuencia absolutas. Su lectura es directa. En la figura 8, se evidencia el número de fallecidos

Figura 7. Porcentaje de muertes por la covid-19 en Colombia por estratos sociales. Tomada de dane (16 de octubre de 2020).

Estrato 4: 4,6%

Estrato 5: 1,5%

Estrato 6: 0,80%

Estrato 1: 32,9%

Estrato 2: 36,7%

Estrato 3: 24%

Page 18: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

18 · Generación de contenidos impresos

Figura 8. Número de muertes por covid-19 en Colombia por estratos sociales. Tomado de dane (16 de octubre de 2020).

Figura 9. Diagrama integral para el número de muertes por covid-19. Tomado de dane (16 de octubre de 2020).

16910

18863

12078

2364

771 411

Estrato 1

Estrato 2

Estrato 3

Estrato 4

Estrato 5

Estrato 6

16910

35773

4785150215 50986 51397

Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6

Gráfico de diagramas integralesSe realizan con las frecuencias acumuladas y solo para variables numéricas, ya sean de tipo entero o de tipo continuo. Siguiendo el ejemplo anterior en la figura 9, se representa el diagra-ma integral para muertes por la covid-19 en Colombia determinado por estratos sociales.

Las frecuencias acumuladas indican el número de muertes que se suman por estratos, por ejemplo, la lectura de estas figuras propone que el número de muertes acumulado hasta el estrato 3 que es de 47 851. En el proceso de registros de casos de contagio en Colombia, es este tipo de gráficos los que expresan la canti-dad de contagios que se registran en un periodo determinado.

Page 19: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 19

tener a C constante a lo largo de toda la distri-bución de frecuencias, se calcula mediante la fórmula.

C = (10)

Si esta división es exacta, se procede, con la

construcción de los intervalos y la tabla de

frecuencias, en caso contrario se rediseña un

nuevo rango; para ello, es necesario examinar

si el producto de C*m excede al rango original

y en cuánto excede. Esta diferencia propone la

construcción del nuevo rango. El procedimiento

es el siguiente y se muestra en la ecuación 11.

1. Si RNuevo = C*m > Rango

2. Se realiza la diferencia D = RNuevo – Rango

3. Ahora se construyen los límites del nuevo

rango

Xmin = Min – 1/D

Xmax = Max + 1/D (11)

Intervalos aparentemente nominales

Son los intervalos utilizados en la clase que utilizamos, tal como resulta en el cálculo de la amplitud C.

Ejemplo de aplicación

En el informe diario de contagios por covid-

19 en Colombia, se registran a los pacientes

que se recuperan en casa, en el hospital, en

la uci o que fallecieron. A continuación, se

propone la tabla 5 la cual contiene los datos

con las edades de cien personas que se recu-

peran de la enfermedad en los diferentes hos-

pitales de Colombia.

Tabla de frecuencias para datos continuos a través de intervalosPara determinar las frecuencias en datos con-tinuos, se deben seguir los siguientes pasos que involucran cálculos matemáticos y la uti-lización de algunas fórmulas de aproximación, como la del rango, número de intervalos me-diante la fórmula de Sturges y la amplitud de intervalo.

Rango Es el dato calculado mediante la diferen-cia entre el dato máximo y mínimo, como se muestra en la ecuación 6.

R = Xmax – Xmin (6)

Número de intervalosRepresentado por la letra m y se define me-diante la fórmula denominada formula de Sturges, como se muestra en la ecuación 7.

m = 1 + 3,3*log(n) (7)

Donde n es el tamaño de la muestra. El número de intervalos no puede ser inferior a 5 ni supe-rior a 16, como se muestra en la ecuación 8.

5 ≤ m ≤ 16 (8)

Algunos, sin embargo, utilizan la ecuación 9.

m = (9)

La aproximación de m se puede hacer por defecto o por exceso.

Amplitud del intervaloLa amplitud del intervalo determina la distan-cia que existe entre un dato y otro, se simboli-za por C; depende del criterio establecido para presentar la información, puede variar la am-plitud en cada intervalo, pero se recomienda

√n

Rangom

Page 20: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

20 · Generación de contenidos impresos

D = 70 – 68 = 2; esta diferencia propone la exis-tencia de un nuevo rango que tendrá como límites (ver ecuación 15).

R- Nuevo

Mínimo = Min – 1 = 24 – 1 = 23

Máximo = Max + 1 = 92 + 1 = 93

(15)

El valor de la unidad que se ha restado al mínimo y sumado en el máximo está determi-nado por la diferencia de 2, el cual se reparte en forma equitativa sobre estos valores ex-tremos. Estos resultados indican que el nuevo rango empieza en 23 y termina en 93. De esta manera, se construirá la tabla de frecuencias con 7 intervalos, una longitud de 10 inicia en 23 y termina en 93 años. La tabla 6 de frecuencia, realizada en Excel, tiene el siguiente aspecto.

TABLA 6

Tabla de frecuencias de personas con la covid-19 que se recuperan en el hospital

Edades f h F H

23-33 13 13 % 13 13 %

33-43 10 10 % 23 23 %

43-53 11 11 % 34 34 %

53-63 25 25 % 59 59 %

63-73 13 13 % 72 72 %

73-83 21 21 % 93 93 %

83-93 7 7 % 100 100 %

  100 1    

Nota. Datos tomados del Ministerio de Salud de Colombia (2020).

Gráficos para datos continuos organizados en intervalos de claseLa tabla 7 corresponde a los cien pacientes con la covid-19 que se recuperan en algún hospi-tal de Colombia. A esta tabla se le ha agrega-do una nueva columna que corresponde a la

TABLA 5

Edades de cien personas que se recuperan de la COVID-19

80 27 29 74 80 65 37 42 66 60

54 45 75 58 85 90 60 68 86 49

79 59 57 79 68 79 41 26 42 75

77 60 56 82 57 72 80 51 29 72

60 90 51 80 38 34 67 76 62 58

87 55 37 62 76 46 54 31 28 63

32 80 58 85 57 92 32 31 44 61

27 77 65 60 48 46 44 35 75 55

79 67 55 49 77 34 71 24 68 59

38 64 28 29 78 49 56 58 74 69

Nota. Elaboración propia.

Se pide construir una tabla de frecuencia para estos datos, organizando intervalos. Para ello, el procedimiento es el siguiente:

1. Se calcula el rango, como se muestra en la ecuación 12.

Rango = Xmax – Xmin = 92 – 24 = 68 (12)

El rango indica que una persona de 92 años es la de mayor edad que se encuentra hospita-lizada y que la persona de menor edad en el hospital tiene 24 años.

2. Número de intervalos (ver ecuación 13)

m = 1 + 3,3 * log(100) = 7,6 (13)

Aquí, se pueden escoger 7 intervalos que co-rresponde a un redondeo por defecto o 8, si el redondeo es por exceso. Sin ajustarse a ninguna regla se escogerá el redondeo por defecto, entonces se tienen 7 intervalos.

3. Longitud del intervalo (ver ecuación 14)

C = = = 9,71 ≈ 10 (14)

En este caso, la aproximación se recomienda por exceso, por ejemplo, se la puede aproximar a 10.

El producto C*m = 10 * 7 = 70 excede al Rango = 68

R 68

m 7

Page 21: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 21

HistogramaEl histograma es una figura propia de las va-riables continuas, cuya tabla se ha organizado en intervalos de clase. Sobre el eje horizontal se observan los intervalos de clase y sobre el eje vertical el valor de las frecuencias absolu-tas (figura 10).

La lectura sobre el histograma es directa, cada caja representa el valor absoluto de las fre-cuencias, por ejemplo, para este caso 13 per-sonas entre 23 y 33 años, se encuentran re-cuperándose de la covid-19 en el hospital. El histograma es exclusivo de los datos numéri-cos continuos.

Diagrama de tortasEl diagrama de tortas es una de las gráficas que se usa para representar las frecuencias re-lativas, es común a todo tipo de variables, ya sean numéricas o categóricas. Al igual que en los datos enteros o categóricos, expresan el valor de la frecuencia relativa para cada uno de los elementos de la variable de estudio, en

marca de clase de los intervalos. El concep-to de marca de clase corresponde a la ubica-ción del centro de cada uno de los intervalos de clase.

TABLA 7

Tabla de frecuencias de personas con la COVID-19 que se recuperan en el hospital

Edades f h F H Xi

23-33 13 13 % 13 13 % 28

33-43 10 10 % 23 23 % 38

43-53 11 11 % 34 34 % 48

53-63 25 25 % 59 59 % 58

63-73 13 13 % 72 72 % 68

73-83 21 21 % 93 93 % 78

83-93 7 7 % 100 100 % 88

  100 1    

Nota. Datos tomados del Ministerio de Salud de Colombia (2020).

Teniendo en cuenta la información registrada en la tabla 7, se construyen los siguientes tipos de graficas: histogramas, tortas, ojivas, y polí-gonos de frecuencias.

13

23___33 33___43 43___53 53___63 63___73 73___83 83___93

1011

25

13

21

7

Figura 10. Histograma de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).

Page 22: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

22 · Generación de contenidos impresos

Figura 11. Diagrama de tortas de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).

83 ___ 937%

73 ___ 8321%

23 ___ 3313%

33 ___ 4310%

43 ___ 5311%

53 ___ 6325%

63 ___ 7313%

Figura 12. Ojiva de personas con covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).

este caso representa las categorías o los inter-valos de clase, formadas con la variable edad, de las personas que se han hospitalizado a causa del contagio por covid-19 en Colombia (ver figura 11).

Ojivas Las ojivas son gráficos exclusivos de los datos

numéricos continuos que permiten visualizar

el valor de las frecuencias acumuladas tanto

absolutas como acumuladas. Para este gráfico, en el eje horizontal, se ubican los intervalos de clase; en el eje vertical, se leen las frecuencias absolutas acumuladas (figura 12).

Como el salto de intervalo implica continuidad en sus valores, su lectura se hace con base en el valor acumulado de la frecuencia tomando como final el extremo superior del interva-lo. Por ejemplo, existen 34 personas con la covid19 que están recuperándose en el hospi-tal por debajo de los 53 años.

13

23___33 33___43 43___53 53___63 63___73 73___83 83___93

23

34

59

72

93

100

Page 23: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 23

ellos podemos nombrar a los boxplot, las pirá-mides poblacionales, los diagramas de Pareto y otros que no se abordarán en este documento.

BOXPLOTPara Walker et al. (2018), el diagrama de caja es una herramienta eficaz de visualización de datos y útil en diversas aplicaciones y disci-plinas. Aunque existen métodos gráficos más sofisticados, el diagrama de caja sigue siendo relevante debido a su simplicidad, interpreta-bilidad y utilidad, incluso en la era del big data. Los boxplot se constituyen en gráficos para datos numéricos, generalmente, si agrupan tablas de frecuencias.

Uno de los aspectos importantes que es posible visualizar en los boxplots son los datos atípicos (puntos outlaiers), los cuales suponen una es-pecial atención en el análisis de datos, ya que suponen limitaciones inherentes al tratar con datos de distribuciones sesgadas. Por ejemplo, en la figura 14, para el grupo de mujeres existen cuatro puntos outlaiers, que llaman la atención ya que corresponden a edades de niños que se encuentran hospitalizados por la covid-19

Polígonos de frecuenciaEl polígono de frecuencia es el gráfico estadísti-co creado partir de un histograma de frecuen-cia y las marcas de clase. Estos histogramas emplean columnas verticales para reflejar fre-cuencias: el polígono de frecuencia es realiza-do uniendo los puntos que reflejan las marcas de clase del intervalo y la frecuencia absoluta (ver figura 13).

Visualmente, este gráfico identifica los puntos más altos y bajos de la distribución. Por ejemplo, en la figura 13, se puede evidenciar que las per-sonas entre 53 y 63 años representan el mayor número de hospitalizados por la covid-19. Asi-mismo, se puede determinar cómo el número de personas que tienen edades ente 83 y 93 es el grupo más pequeño en condiciones de hos-pitalización.

Otras gráficasExisten otro tipo de gráficas que tienen que ver con los datos categóricos o con datos numéri-cos y que proponen mucha información, entre

Figura 13. Polígono de frecuencias de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).

13

23___33 33___43 43___53 53___63 63___73 73___83 83___93

1011

25

13

21

7

Page 24: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

24 · Generación de contenidos impresos

PIRÁMIDES POBLACIONALES

Las pirámides poblacionales han venido siendo usadas para representar la distribución de la población en diferentes eventos. En tiempos de la covid-19 se han vuelto muy comunes y han sido usadas para representar y comparar el número de contagios por sexo y por grupos etarios. Pacheco y Rosselli (2018) proponen el uso de estas figuras para hacer proyecciones demográficas, por ejemplo, la transición de-mográfica, y comparar la composición de la población en una región determinada.

La figura 15 se refiere a la pirámide población por grupo etario y género de los contagios por la covid-19 en Colombia. Lo que propone la pi-rámide es una comparación de la forma como se contagian hombres y mujeres; en la mayoría de los intervalos de clase etaria, el problema del contagio es similar, en otros se observa un aumento ligero en los hombres, en síntesis, permite observar el equilibrio o desequilibrio que existe en la población femenina y masculi-na que se ha contagiado con la covid-19.

Otros de los aspectos que permite visualizar

los boxplots es la comparación de grupos; por

ejemplo, en la figura 14 se observa cómo están

los grupos por género de aquellas personas

que se han contagiado por la covid-19 y que

se encuentran hospitalizados. Por la construc-

ción de las cajas, el grupo de hombres es más

grande que el de mujeres; asimismo, se ob-

servan que en el grupo de hombres existe un

nutrido grupo de personas jóvenes que están

en situación de hospitalización. Todas estas

observaciones y otras son posibles a la luz de

la construcción de estas figuras.

Finalmente, estos gráficos permiten obser-

var el valor de las medidas de tendencia

central, de posición, de dispersión e, incluso,

es posible analizar la asimetría y la normali-

dad de los datos, asimismo, observar, valores

mínimos máximos, rangos, entre otros. Todos

estos elementos de información que propo-

nen los boxplots suponen importancia esta-

dística para el análisis de datos números o de

pequeños grupos.

Figura 14. Boxplot por género de personas con la covid-19 que se han hospitalizado. Datos tomados del Ministerio de Salud de Colombia (2020).

101

81

61

41

21

1

Mujeres

Hombres

Page 25: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 25

TABLA 8

Tabla de Pareto de personas con la COVID-19 que se recuperan en el hospital

Edades f h F H

53-63 25 25 % 59 25 %

73-83 21 21 % 93 46 %

23-33 13 13 % 13 59 %

63-73 13 13 % 72 72 %

43-53 11 11 % 34 83 %

33-43 10 10 % 23 93 %

83-93 7 7 % 100 100 %

  100 1    

Nota. Datos tomados del Ministerio de Salud de Colombia.

En la tabla 7, se han preparado los datos para la realización de la gráfica de Pareto. Los inter-valos están dispuestos de acuerdo con el orden descendente de las frecuencias absolutas. La preparación de los datos supone la división de los grupos determinados en grupos críticos y poco críticos, lo cual se observa en la figura 16.

Si da clic en el enlace, puede encontrar un

video titulado “Pirámide poblacional en Excel

| Tips y trucos en Excel”, que le servirá de guía

para la construcción de una pirámide pobla-

cional en Excel.

DIAGRAMA DE PARETO

Un diagrama de Pareto es una técnica gráfica

simple para ordenar elementos, desde el más

frecuente hasta el menos frecuente (en forma

descendente), basándose en el principio de

Pareto. En el caso que aquí se expone (ver

tabla 8), se trata de observar el grupo etario

de mayores casos de contagio por edades, a los

que se los puede dividir en dos grupos: críti-

cos y poco críticos. La proporción de los grupos

críticos para Pareto resulta ser de aproxima-

damente un 20 % para los “pocos críticos” de

un 80 %. Este 20 % serán los grupos etarios res-

ponsables de la mayor parte del efecto que

se produce en casos de hospitalización por la

covid-19 en Colombia.

Figura 15. Pirámide poblacional por género de personas con la COVID-19 en Colombia. Adaptado del Boletín Epidemiológico COVID-19, por la Subred Integrada de Servicios de Salud. (2020).

> 90

80 __ 89

70 __ 79

60 __ 69

50 __ 59

40 __ 49

30 __ 39

20 __ 29

10 __ 19

0 __ 9

6546

32713

69566

7049

30379

64592

134421 124829

211638 196535

249174 231393

341887 317490

322530 299514

103220 95355

49408 45882

400000 4000000300000 300000200000 200000100000 100000

Hombres

Mujeres

Page 26: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

26 · Generación de contenidos impresos

lleguen al hospital producto del contagio por la covid-19.

Una lectura de la figura nos propone que el 72 % está generado por cuatro causas princi-pales, determinados por los grupos etarios de 53-63; 73-83; 23-83; 63-73. Una recomendación a la luz de estos resultados propondría hacer una revisión sobre estos grupos etarios, ya que aquí se concentra la mayoría de las personas con la covid-19 en el hospital.

Si da clic en el siguiente enlace, podrá encontrar un video titulado “¿Cómo hacer un diagrama de Pareto en Excel 2016?”, que le servirá de guía para la construcción de los diagramas de Pareto.

Para obtener la figura 16, los datos tienen que estar ordenados de mayor a menor. Las causas en el eje x, sobre el eje y izquierdo, se dispo-nen los valores de la frecuencia absoluta acu-mulada; sobre el lado derecho, se observan los valores de la frecuencia relativa acumulada.

De acuerdo con lo dispuesto por Pareto, el 80 % de las consecuencias es producto del 20 % de las causas. El grafico identifica el 80 %; como este valor se observa sobre las frecuencias acumuladas, para el caso que se observa el valor cercano corresponde al 72 %, en el cual se concentrará el esfuerzo de grupo etario por disminuir el número de personas que

Figura 16. Diagrama de Pareto de personas con la covid-19 que se recuperan en el hospital. Datos tomados del Ministerio de Salud de Colombia.

100

90

80

70

60

50

40

30

20

10

0

Pers

onas

con

COV

ID-1

9 qu

e se

recu

pera

n en

el h

ospi

tal

Rango de edades de personas con COVID-19 que se recuperan en el hospital

53 __63 73 __83 23 __33 63 __73 43 __53 33 __43 83 __93

Porc

enta

je A

cum

ulad

o

100%

90%

80%

70%

60%

50%

40%

30%

20%

10%

0%

25%

46%

59%

72%

83%

93%

100%

25 2113 13 11 10 7

Page 27: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 27

Aquí:

1. Primaria

2. Secundaria

3. Técnica

4. Universidad

5. Posgrado

Elabore para datos categóricos, la tabla de fre-

cuencias y los respectivos gráficos, acordes

con este tipo de variables. Haga uso de Excel

para la construcción de las tablas y de sus res-

pectivos gráficos.

Ejercicio n.° 2Cuestionario, por niveles taxonómicos de solo,

con lectura de gráficos estadísticos.

Con el propósito de fortalecer la lectura y la

comprensión de los gráficos estadísticos se

hace uso de la taxonomía solo en sus cuatro

niveles. Con respecto a esta taxonomía Biggs

y Collis (1982) observaron que, “en la progre-

sión desde la incompetencia hasta la maes-

tría, los estudiantes muestran una secuencia

consistente, o ciclo de aprendizaje, que es ge-

neralizable a una gran variedad de tareas y

en particular a las tareas escolares”. Esta se-

cuencia se refiere a un progreso jerárquico en

la complejidad estructural de sus respuestas,

cualquiera que sea el modo de funcionar o

modo de representación, en el que se exprese

el aprendizaje. Lo anterior supone que el

proceso de indagar partirá de posiciones sen-

cillas para llegar a propuestas complejas en

las que se evidencia el grado de aprendizaje

en los estudiantes (Biggs y Collis, 1991). En las

siguientes preguntas.

Según la figura 1 que muestra los asesinatos

ocurridos a líderes sociales, responda:

EJERCICIOS DE APLICACIÓN

Ejercicio n.° 1En una encuesta aplicada a microempresarios de la ciudad de Villavicencio se desea indagar sobre su formación. Se realizó la encuesta con 150 microempresarios. Los resultados fueron los siguientes:

4 3 2 4 4

2 2 4 2 4

4 4 3 2 4

3 2 4 3 4

2 3 4 4 4

2 1 3 3 3

2 4 2 3 4

3 4 3 4 4

2 4 4 4 4

4 3 3 3 4

3 3 3 4 4

4 4 2 3 3

4 3 3 3 4

3 5 4 4 4

4 2 3 4 4

4 3 3 3 3

2 2 3 4 4

4 3 4 2 4

1 3 3 4 3

4 5 4 3 4

4 4 4 4 3

4 3 3 4 4

4 3 3 3 4

4 4 4 2 3

4 5 2 4 4

3 4 3 4 4

4 3 2 3 2

4 4 2 4 4

4 4 4 4 2

4 3 4 3 3

Page 28: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

28 · Generación de contenidos impresos

desconfianza de pueblo en torno al se-guimiento y la aplicación de la justicia.

C. La excesiva manifestaciòn de asesina-tos ocurridos a lo largo de un año (2017 y 2018) implica que hubo un mayor de-sarrollo de estrategias en contra la de-lincuencia, lo que provoca disminución de los casos refejados en año siguiente (2018-2019).

D. El registro y analisis de asesinatos en un periodo de un año y el aumento de los pro-blemas de la delincuencia dilatan la apli-cación de estrategias para su prevención.

De acuerdo con la información evidenciada en la figura 17, responda las siguientes preguntas:

De acuerdo con la gráfica del comparativo del mes de junio, responda:

5. La deforestación por km2 para el 2017 es

A. 600.

B. 1000.

C. 200.

D. 6000.

6. Para el 2016 y 2019 la deforestación por km2 está entre

A. 200 y 400.

B. 200 y 1000.

C. 800 y 1000.

D. 400 y 600.

7. Al analizar la deforestación comparati-va por años de agosto a junio por km2 se puede afirmar que

A. Durante el gobierno de Bolsonaro hubo más de 3000 km2 reportados en defores-tación y degradación.

1. Entre el 7 de agosto del 2016 y el 9 de julio del 2017 ocurrieron:

A. 69 asesinatos.

B. 80 asesinatos.

C. 105 asesinatos.

D. 10 asesinatos.

2. Fueron asesinados 105 lideres sociales entre

A. El de 10 de julio del 2017 y el 6 de agosto del 2017.

B. El 7 de agosto del 2017 y el 9 de julio del 2018.

C. El 10 de julio del 2018 y el 6 de agosto del 2018.

D. El 1 de agosto del 2016 y el 9 de julio del 2019.

3. El mayor aumento de asesinatos es

A. 37 correspondiente a la diferencia de ase-sinatos ocurridos entre el 7 de agosto del 2016 y el 9 de julio del 2018.

B. 1 representa el aumento de asesinatos entre el 7 de agosto del 2016 y el 9 de julio del 2019.

C. 5 son los asesinatos ocurridos entre el 10 de julio del 2018 y el 6 de agosto del 2018.

D. 100 corresponde a los asesinatos entre el 6 de agosto del 2017 al 9 de agosto del 2018.

4. Según los asesinatos ocurridos a líderes so-ciales ocurridos entre enero del 2016 y julio del 2019 se infiere que:

A. La disminución de los asesinatos durante julio y agosto del 2017 obedece al aumento de los casos ocurridos en el año imediata-mente anterior.

B. El aumento de asesinatos ocurridos entre agosto del 2017 y julio del 2018 provocan

Page 29: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 29

Figura 17. Radiografía de la deforestación en el Amazonas brasileño (junio del 2019). Tomado de Pasquali (2020), a partir de efe, cifras de deter e inpe y adaptación infográfica etc.

Deforestación

Comparativo mes de junioREPUNTA LA DEFORESTACIÓN Comparativo por años

(agosto a junio. Km2)Gobierno

Bolsonaro3.000 km2

4.638,7

4.181,5 3.975,5

4.574,9

446,56

193,28

153,55

1.025,58

577,25

228,44

Deforestación y degradación

Top 3 por estados Top 3 por estados

Pará

Amazonas

Mato grosso

km2

1.000

800

600

400

200

02016 2017 2018 2019 2016 2017 2018 2019

Mato grosso

Pará

Amazonas

920,21 km2 2.072 km2

B. Para el 2019 la deforestación disminuyó notablemente.

C. Para el 2019 se presentó la cifra más alta en deforestación y degradación.

D. Año tras años la cifra de deforestación y degradación disminuye gradualmente.

8. La deforestación y la degradación de la amazonia brasilera determina:

A. Una alta deforestación en los años 2016 y 2019 producto de la falta de compro-miso del Gobierno con el medio ambien-te, falta de control de los incendios arti-ficiales y la consistente demanda de las empresas productoras de madera.

B. Un decrecimiento mínimo en la defores-tación para el 2019 con respecto al 2016

lo que sugiere una falta de compromi-

so del Gobierno actual por controlar las

causas de este.

C. La deforestación para el 2018 representa

la más baja deforestación lo cual implica

que hubo un mayor control en las políti-

cas de reserva ambiental.

D. Los altibajos en deforestación por kiló-

metro cuadrado en comparación con

junio, en el cual el 2016 y 2019 ocupan el

primer lugar y el 2017 y 2018 el segundo

con más bajos índices de deforestación.

En el 2012, las emisiones totales de Colom-

bia ascienden a 178 000 Gg CO², la distribución

sectorial de emisiones de Gases Efecto de In-

vernadero se representa en la figura 18.

Page 30: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

30 · Generación de contenidos impresos

C. i y iv solamente.

D. y iii solamente.

10. Sabiendo que la producción total de emisión

de gei en Colombia ascienden a 178 000 Gg

CO², cuantos miles de Gg CO² debe dismi-

nuir el sector agricultura, silvicultura y

otros usos de la tierra (afolu) para que su

porcentaje descienda a un 40 %:

A. 14 000,24 Gg CO²

B. 71 000,2 Gg CO²

C. 76 000,54 Gg CO²

D. 5000,34 mil Gg CO²

Teniendo en cuenta la información dada en la figura 18, ¿cuál de las siguientes afirmaciones son verdaderas?

A. El sector que genera mayor contamina-ción es el sector energético.

B. El sector agricultura, silvicultura y otros usos de la tierra (afolu) generan más del 50 % de las emisiones de gei del país.

C. Los sectores energía y procesos indus-triales y uso de productos generan más del 50 % de las emisiones de gei del país.

9. Los sectores energía y residuos generan más del 50 % de las emisiones de gei del país:

A. solamente.

B. solamente.

Figura 18. Emisiones GEI de Colombia en el 2012. Tomado de Inventario Nacional de Gases de Efecto Invernadero (2012).

Residuos

8%

44%43%

5%

Energía

Agricultura,silvicultura y otrosusos de la tierra(AFOLU)

Procesos industrialesy usos de productos

Page 31: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

Gráficos estadísticos: guía práctica para estadística descriptiva· 31

Inte

rval

os

L-Cr

itica

Mat

emát

icas

C-Na

tura

les

C-Ci

udad

anas

26-34,5        

34,5-43        

43-51,5        

51,5-60        

60-68,5        

68,5-77        

Total        

Ejercicio n.° 4Para los datos no organizados de la prueba saber, construya los Boxplot y establezca com-paraciones entre las asignaturas que se pre-sentan en la tabla.

Ejercicio n.° 5Para los valores obtenidos en las asignaturas de L-Critica y Matemáticas, elabore una pirá-mide de resultados y establezca algunas com-paraciones.

Ejercicio n.° 6Al parecer, los resultados de la prueba de lectura crítica están relacionados con la canti-dad de libros leídos por un estudiante. A partir de los datos obtenidos en la siguiente tabla, dibuje un diagrama de Pareto. Concluya con respecto a las variables de lectura.

Variables de lectura Intervalos Promedios

No leen 0 50

Leen poco 0-10 51

Lectura mediana 11-25 56

Bastante lectura 26-100 56,2

Mucha lectura >10 58

Ejercicio n.° 3A continuación, se proponen algunos datos obtenidos en las pruebas saber-2019.

L-Critica Matemáticas C-Naturales C-Ciudadanas

47 48 37 30

60 65 54 59

66 57 41 74

62 54 61 73

63 57 55 57

49 29 41 41

76 70 70 68

57 65 63 66

62 62 66 39

68 66 63 77

42 40 28 39

38 31 41 26

64 56 59 60

52 66 54 52

54 49 40 33

52 55 61 50

63 68 54 69

48 54 58 50

52 55 49 32

61 38 44 45

55 64 57 57

57 51 45 38

58 57 49 42

34 39 38 28

48 71 61 55

75 73 59 75

53 56 54 55

53 48 43 46

40 43 39 39

69 57 63 61

49 55 31 31

59 51 51 45

65 64 54 62

55 55 50 45

56 51 49 51

Para los datos propuestos, obtenga el valor de las frecuencias absolutas, relativas y acu-muladas, propuestas desde la siguiente tabla. Elabore histogramas para matemáticas y L-Crítica, Ojivas para C-naturales y diagramas circulares para C-ciudadanas. Realice lecturas para algunas graficas.

Page 32: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...

32 · Generación de contenidos impresos

REFERENCIASBatanero, C. y Díaz, C. (2011). Estadística con proyectos. Universidad de Granada.

Castellanos. M. T. y Obando J. (2013). Análisis y sistemas de datos poderoso escenario de aprendizaje cultural.

Revista Científica, 2(54), 504-508.

Contreras, A., Cárdenas, C., González, J., Toloza, S., Zambrano, L. y Pulido-Rojan, A. (2019). Herramientas estadísti-

cas para la mejora del control de inventarios: un caso de estudio. Investigación y Desarrollo en tic, 10(1), 13-24.

Consejería Presidencial de los Derechos Humanos. (2019). Informe sobre el balance de las acciones y estrategias ade-

lantadas en el marco de la protección de los líderes, lideresas sociales y defensores de derechos humanos. Consejería

Presidencial de los Derechos Humanos. http://www.derechoshumanos.gov.co/Prensa/2019/Documents/

INFORME%20LDDH%20ACTUALIZADO%2017%20DE%20JULIO_V2.pdf

Departamento Administrativo Nacional de Estadística. (dane). (2020). Boletín técnico. Estadísticas vitales – eevv.

Defunciones por covid-19. 2 de marzo al 4 de octubre de 2020pr. dane. https://www.dane.gov.co/files/investiga-

ciones/poblacion/defunciones-covid19/boletin-defunciones-covid-2020-02mar-04oct.pdf

Ingeniería Industrial Easy. (2017, 11 de marzo). Cómo hacer un diagrama de Pareto en Excel 2016. [Video de You-

Tube]. https://bit.ly/38TKbou

Instituto Nacional de Salud. (ins). (2020). covid-19 en Colombia. Instituto Nacional de Salud. https://www.ins.

gov.co/Noticias/Paginas/coronavirus-casos.aspx

Inventario Nacional de Gases de Efecto Invernadero. (gei). (2012). Tercera Comunicación Nacional de Cambio Cli-

mático. Programa de las Naciones Unidas para el Desarrollo (pnud). http://documentacion.ideam.gov.co/

openbiblio/bvirtual/023421/cartilla_INGEI.pdf

Microsoft Excel a Todo Nivel. (2016, 1 de agosto). Pirámide poblacional en Excel | Tips y trucos en Excel. [Video de

YouTube]. https://bit.ly/3nf0Nzh

Pasquali, M. (2020). La deforestación en la Amazonia brasileña alcanza su nivel más alto en una década. Sta-

tista. https://es.statista.com/grafico/16328/deforestacion-estimada-en-la-amazonia-brasilena/

Polanía, M. J., Pacheco, B. y Rosselli, D. (2018). El uso de pirámides poblacionales como representación gráfica

del sistema de salud colombiano. Archivos de Medicina (Manizales), 18(1), 127-133.

Ross, S. M. (2018). Introducción a la estadística. Reverté.

Subred Integrada de Servicios de Salud. (2020, 26 de agosto). Boletín Epidemiológico covid-19. Datos Abiertos Bogo-

tá. https://datosabiertos.bogota.gov.co/dataset/9de30caa-a772-4fc9-9d8c-6baf0cd5078f/resource/cdecb5cf-

6f63-46b1-bc4a-70d95b6394b4/download/boletin-epidemiologico.pdf

Walker, M. L., Dovoedo, Y. H., Chakraborti, S. y Hilton, C. W. (2018). Un diagrama de caja mejorado para datos

univariados. The American Statistician, 72(4), 348-353.

Page 33: GRÁFICOS ESTADÍSTICOS: GUÍA PRÁCTICA PARA ESTADÍSTICA ...