Organizacion y reporte1

15
18 UNIDAD I TEMA 3 ORGANIZACIÓN Y DESCRIPCIÓN GRÁFICA DE UN CONJUNTO DE DATOS 1.10. Organización de un conjunto de datos. Tablas de frecuencia Es muy común que ante un conjunto de datos obtenidos directamente de la fuente de información, éstos no puedan ser visualizados por presentarse en forma desordenada y demasiado extensa. En el ejemplo seis del tema anterior es dificil decir a simple vista en la tabla 1.1 cuántos obreros tienen tres hijos; hay que hacer un conteo entre los 200 datos para saber cuántas veces ocurrió el número tres. Un modo de organizar los datos para visuarlos más fácil y rápidamente es agrupando los que tengan el mismo valor e indicando cuántas veces se repite cada uno de ellos, es decir, indi- cando la FRECUENCIA de su repetición. Eso puede hacerse mediante una TABLA DE FRE- CUENCIAS, donde la información se pone por columnas o por renglones. La tabla 1.3 corresponde a los 200 datos de la población del ejemplo seis: TABLA 1.3 Dato CONTEO Frecuencia O //111 111 JI JI 111 I 16 1 //111 11111 11111 11111 11 22 2 11111 //111 11111 1/111 1111/ 1/1// 1/1 33 3 111/1 111/1 1/111 11111 1/1/1 1/1/1 1/11/ 1/1/1 1111/ 45 4 1/11/ 111/1 1/11/ 1/1/1 1/1/1 11/1/ I 31 5 11111 //1/1 11111 11111 20 6 1/1/1 111/1 11 12 7 1/1/1111/ 9 8 1111/ // 7 9 //11/ 5 Cuando el número de datos recabados no es demasiado pequefio es conveniente hacer el conteo como se expone en la segunda columna de la tabla de frecuencias 1.3.

Transcript of Organizacion y reporte1

Page 1: Organizacion y reporte1

18 UNIDAD I

TEMA 3

ORGANIZACIÓN Y DESCRIPCIÓN GRÁFICA DE UNCONJUNTO DE DATOS

1.10. Organización de un conjunto de datos. Tablas de frecuencia

Es muy común que ante un conjunto de datos obtenidos directamente de la fuente de información,éstos no puedan ser visualizados por presentarse en forma desordenada y demasiado extensa. En elejemplo seis del tema anterior es dificil decir a simple vista en la tabla 1.1 cuántos obreros tienentres hijos; hay que hacer un conteo entre los 200 datos para saber cuántas veces ocurrió el númerotres.

Un modo de organizar los datos para visuarlos más fácil y rápidamente es agrupando losque tengan el mismo valor e indicando cuántas veces se repite cada uno de ellos, es decir, indi-cando la FRECUENCIA de su repetición. Eso puede hacerse mediante una TABLA DE FRE-CUENCIAS, donde la información se pone por columnas o por renglones. La tabla 1.3 correspondea los 200 datos de la población del ejemplo seis:

TABLA 1.3

Dato CONTEO FrecuenciaO //111 111JI JI 111 I 161 //111 11111 11111 11111 11 222 11111 //111 11111 1/111 1111/ 1/1// 1/1 333 111/1 111/1 1/111 11111 1/1/1 1/1/1 1/11/ 1/1/1 1111/ 454 1/11/ 111/1 1/11/ 1/1/1 1/1/1 11/1/ I 315 11111 //1/1 11111 11111 206 1/1/1 111/1 11 127 1/1/1111/ 98 1111/ // 79 //11/ 5

Cuando el número de datos recabados no es demasiado pequefio es conveniente hacer elconteo como se expone en la segunda columna de la tabla de frecuencias 1.3.

Page 2: Organizacion y reporte1

ESTADfsTICA DESCRIPTIVA 19

1.11. Gráficas de variables numéricas discretas y tablas de frecuencias relativas

Otro modo de presentar la misma información, pero en forma visualmente más resumida, es pormedio de una gráfica denominada HISTOGRAMA o de otra llamada POLÍGONO DE FRE-CUENCIAS.

Para ello se traza un sistema de ejes coordenados; en el eje horizontal localizamos losdistintos valores que toma la variable y en el eje vertical localizamos las frecuencias. El histogramase construye uniendo los datos con barras cuya altura corresponde a la frecuencia de cada dato (VER

GRÁFICA 1.2) Y el polígono de frecuencias se forma uniendo con segmentos los puntos que tienencomo abcisa a cada dato y como ordenada su correlativa frecuencia (VER GRÁFICA 1.3):

4545 4040 353530 3025 2520 2015 1510 105o 5

o 2 3 4 5 6 7 8 9 oo 1 2 3 4 5 6 7 8 9

GRÁFICA ].2 GRÁFICA 1.3

La tabla de frecuencias, el histograma y el polígono de frecuencias para los datos de lamuestra aleatoria seleccionada de la población en el ejemplo seis son (VER TABLA 1.4 y GRÁFICAS 1.4 y

1.5):

TABLA 1.4

Dato CONTEO FrecuenciaO I 11 11 22 1111 43 11111 I 64 11111 I 85 1111 46 I 17 I 18 I 19 11 2

Page 3: Organizacion y reporte1

20

o 23456 7 8 9

GRÁFICA 1.4

UNIDAD I

o 1 2 3 4 5 6 7 8 9

GRÁFICA J.S

Teniendo la información organizada en una tabla de frecuencias o en un histograma, po-demos responder fácil y rápidamente a preguntas como: ¿qué porcentaje de obreros en la poblaciónno tienen hijos?, o ¿qué porcentaje de obreros en la muestra no tienen hijos?

En la tabla de frecuencias para la población vemos que hay 16 obreros sin hijos de untotal de 200, luego el porcentaje es

16-x 100%=(0.08xI00%)=8%200

y para la muestra tenemos que hay un obrero sin hijos de un total de 30, el porcentaje es

1- x 100 % = ( 0.03 x 100 % ) = 3 %30

Las fracciones ~ para calcular el porcentaje en la población y ...!.. para el porcentaje en200 30

la muestra expresan cada una el cociente formado por lafrecuencia del dato dividida entre el totalde elementos. Dicña fraccián se llama FRECUENCIA RELATWA o PROPORCIÓN

Si a la tabla de frecuencias le agregamos otra columna con las frecuencias relativas,tendremos una TABLA DE FRECUENCIAS RELATWAS, la cual consitituye una síntesis delos datos que forman una poblacián -o, en su caso, una muestra- estadística. Este concepto seráesencial para las aplicaciones probabilísticas con variables que veremos en la Unidad m (VER INFRA,

3.3). Las tablas de frecuencias relativas para la población (VER TABLA 1.5) Ypara la muestra del ejem-plo seis (VER TABLA 1.6) son:

Page 4: Organizacion y reporte1

ESTADíSTICA DESCRIPTIVA

TABLA I.S

Dato Frecuencia Frecuencia relativaO 16 16/200 = 0.0801 22 22/200 = 0.1102 33 33/200 = 0.1653 45 45/200 = 0.2254 31 31/200 = 0.1555 20 20/200 = 0.1006 12 12/200 = 0.0607 9 9/200 = 0.0458 7 7/200 = 0.0359 5 5/200 = 0.025

21

TABLA 1.6

Dato Frecuencia Frecuencia relativaO 1 1/30 = 0.0331 2 2/30 = 0.0662 4 4/30 = 0.1333 6 6/30 = 0.2004 8 8/30 = 0.2665 4 4/30 = 0.1336 1 1/30 = 0.0337 1 1/30 = 0.0338 1 1/30 = 0.0339 2 2/30 = 0.066

En las tablas 1.5 y 1.6 se percibe cierta similitud entre las frecuencias relativas de losdatos de la población con los correspondientes de la muestra; lo mismo ocurre con los histogramas(VER GRÁFICAS 1.6 y 1.7). Además, veamos que estas gráficas están hechas con las frecuencias relativasen el eje de las ordenadas, y no con las frecuencias: en general, dos gráficas -sean histogramas opolígonos- resultan ser idénticas cuando se hacen con frecuencias o con frecuencias relativas, loque pasa es que se cambia la escala en el eje de las ordenadas.

Para el estudio estadístico y probabilístico de una población o muestra es más útil trabajar confrecuencias relativas, por lo cual de aquí en adelante se empleará en las gráficas la frecuencia relativa.

° 234 567 8 9

GRÁFICA 1.6

0,3

0,25

0,2

0,15

0,1

0,05

o+--+__~~~~~-+ __~~~~o 234 567 8 9

GRÁFICA 1.7

Cuanto más grande se hace la muestra, mayor es la aproximación entre sus porcentajes ylos de la población. Este resultado nos llevará en la siguiente unidad al concepto de "regularidadestadística" del cual se desprenderá la definición frecuencial de probabilidad.

Suponiendo que necesitamos conocer cuántos obreros de la población del ejemplo seistienen A LO MÁs o COMO MÁXIMO tres hijos. Correlacionamos en la tabla 1.5 la columna de

Page 5: Organizacion y reporte1

22 UNIDAD I

"Dats" con la de "Frecuencias" para sumar las frecuencias que hay entre cero y tres hijos. Elresultado es: 16 + 22 + + 33 + + 45 = 116 obreros. Este procedimiento indica el grado de acumu-lación ordenada de los datos en un nivel determinado, es decir la FRECUENCIA ACUMULADAde los datos hasta dicho nivel.

Pero debemos saber también qué porcentaje o proporción del total de datos representala frecuencia acumulada en un nivel dado: FRECUENCIA RELA TIVA ACUMULADA. Divi-dimos entonces la frecuencia acumulada entre el total de datos. Resulta: 116/200 = 0.580. En sín-tesis, el 58% de los obreros -116 de ellos- tienen entre cero y tres hijos.

La frecuencia relativa acumulada y su generalización como porcentaje o proporciónson ampliamente utilizados en el estudio teórico de la estadística y en la aplicación de esta teoría(VÉASE INFRA, ESTADíSTICA INFERENCIAL: UNIDADES V A VIlJ). PORCENTlLES es la denominación que se daa este concepto: que el dato "3" tenga acumulado el 58% del total de los datos significa este dato esel 0.58 porcentil del conjunto de datos, de igual manera el dato 5 es el 0.835 porcentil y el dato 7 esel 0.975 porcentil.

Se ve que es imprescindible construir tablas que contengan, además de la columna dedatos, las columnas referentes a la frecuencia, la frecuencia acumulada, la frecuencia relativa y lafrecuencia relativa acumulada, como ocurre en la tabla 1.7 que es la ampliación de la tabla 1.5 yen la tabla 1.8 (VER INFRA) referente a los datos de la muestra de la población "número de hijos por /obrero", organizados anteriormente en la tabla 1.6.

TABLA 1.7

Dato Frecuencia Frecuencia Frecuencia Frecuenciarelativa. acumulada relativa

acumuladaO 16 0.080 16 0.0801 22 0.110 38 0.1902 33 0.165 71 0.3553 45 0.225 116 0.5804 31 0.155 147 0.7355 20 0.100 167 0.8356 12 0.060 179 0.8957 9 0.045 188 0.9408 7 0.035 195 0.9759 5 0.025 200 1.000

En el caso de la muestra del ejemplo seis, los obreros con un máximo de tres hijos son 13(frecuencia acumulada), que representa el 43.3% del total de datos, es decir, el dato "3" es el 0.433porcentil (frecuencia relativa acumulada). Cualquier observador podrá Uegar a este resultado consólo ver la última columna de la tabla 1.8.

Page 6: Organizacion y reporte1

ESTADfsTICA DESCRIPTIVA 23TABLA 1.8

Dato Frecuencia Frecuencia Frecuencia Frecuenciarelativa acumulada relativa

acumuladaO 1 0.033 1 0.0331 2 0.066 3 0.0992 4 0.133 7 0.233 ..3 6 0.200 13 0.4334 8 0.266 21 0.7005 4 ~ 0.133 25 0.8336 1 0.033 26 0.8667 1 0.033 27 0.9008 1 0.033 28 0.9339 2 0.06$ 30 1.00

Además, una tabla de frecuencias relativas acumuladas nos ayuda a contestar preguntascomo ¿qué porcentaje de obreros de la muestra tiene POR LO MENOS cuatro hijos? En la tablavemos que el dato "3" posee una frecuencia relativa acumulada de 0.433; como el total de porcen-tajes de todos los datos suma exactamente '1, restamos 0.433 al, y tenemos que los obreros concuatro hijos COMO MÍNlMO son el 0.567 del total. Toda esta información será esencial para elcálculo de probabilidades de la muestra -o de la población- (VER INFRA, 2.16.)

También es importante cotejar las gráficas -tanto histogramas como polígonos- de lasfrecuencias acumuladas y de las frecuencias relativas acumuladas tanto de población como demuestra para percibir similitudes y contrastes entre ambos. Por ejemplo, puedes contrastar el histo-grama acumulativo de la población (VER GRÁFICA 1.8) con el de la muestra (GRÁFICA 1.9.)

0,90,80,70,60,50,40,30,20,1

°° 2 3 4 5 6 7 8 9

GRAFICA 1.8

1.12. Gráficas de variables categóricas

0,90,80,70,60,50,40,30,20,1OT=~--~~~~~~~~~~~° 1 234 5 6 789

GRÁFICA 1.9

Sea nominal u ordinal la variable categórica, se sigue el mismo procedimiento que el visto en elinciso 1.ll. Ilustramos esto con dos ejemplos:

Page 7: Organizacion y reporte1

24 UNIDAD I

Ejemplo 7. Los siguientes datos corresponden a una muestra aleatoria de 50 estudiantesde tercer afio de un colegio de nivel medio superior que han solicitado su pase a una facultad. (VERTABLA 1.9.)

TABLA 1.9

Dato Dato Dato Dato Dato1 O 11 Ad 21 C 31 O 41 I2 Q 12 O 22 O 32 M 42 D3 O 13 O 23 I 33 Q 43 E4 M 14 C 24 F 34 Ad 44 E5 F 15 I 25 Q 35 E 45 O6 M 16 D 26 M 36 O 46 Ad7 O 17 M 27 Ar 37 O 47 M8 Ar 18 O 28 C 38 O 48 I9 E 19 M 29 Ar 39 Q 49 E10 F 20 I 30 O 40 F 50 M

Las letras utilizadas en las columnas de datos de esta tabla son abreviaturas de las facul-tades universitarias que constituyen los valores que ha tomado la variable, y significan lo siguiente:

Ad - - AdministraciónE - - EconomíaO - - Odontología

Ar - - ArquitecturaF - - FilosofíaQ - - Química

e --Ciencias1- - Ingeniería

0/--DerechoM - - Medicina

Una tabla de frecuencias relativas y una gráfica para estos datos son como las siguientes:

TABLA J.IO

Dato Conteo Frecuencia Frecuencia relativaAd 111 3 3/50 = 0.06Ar 111 3 3/50 = 0.06C 111 3 3/50 = 0.06D " 2 2/50 = 0.04E ,,'" 5 5/50 = 0.10F "" 4 4/50 = 0.08I /'" 4 4/50 = 0.08M ,,'" 11/ 8 8/50 = 0.16O 11111 11/1/ 11 12 12/50 = 0.24Q 1111 4 4/50 = 0.08

Hemos ordenado alfabéticamente los valores de la variable "Facultad a la que solicitaningresar los estudiantes de tercer afio del colegio X". Establecer un orden entre los valores adopta-dos por una variable categórica nominal, ya lo hemos visto, no tiene ninguna interpretación prácti-ca (VER SUPRA 1.5). Por eso mismo, tampoco tiene sentido agregar a la tabla 1.1O las columnas defrecuencia acumulada y de frecuencia relativa acumulada.

Page 8: Organizacion y reporte1

ESTADíSTICA DESCRIPTIVA 25

Ad Ar e o E F M o Q

GRÁFICA 1.10

En estadística el tipo de gráficas como la 1.10 recibe diversos nombres: llamaremosGRAFICA DE BARRAS a la gráfica relativa a una variable categórica e HISTOGRAMA a lagráfica correspondiente a una variable numérica. Notarás que en la gráfica de barras éstas apare-cen separadas (VER TAMBIÉN GRÁFICA 1.11) mientras que en el histograma aparecen juntas (VER GRÁFICAS

1.2 y 1.4).

Ejemplo 8. El departamento de servicios escolares de un colegio de nivel medio superiorha elaborado una tabla de frecuencias relativas para las calificaciones finales de la materia de Esta-dística de los 20 grupos en los que se impartió esta asignatura (VER TABLA 1.11). Se añade la gráficade barras respectiva.

TABLA 1.11

Dato Frecuencia Frecuencia relativa Frecuencia Frecuencia relativaacumulada acumulada

NA 296 296/985 = 0.3005 296 296/985 - 0.3005S 198 198/985 = 0.2010 494 494/985 = 0.5015B 307 307/985 = 0.3116 801 801/985 = 0.8131MB 184 184/985 = 0.1868 985 985/985 = 1.0000

Total 985 1 1

0,35

0,3

0,25

0,2

0,15

0,1

0,05

O+-'_-L-+_' __~~~~~~~~NA s B MB

GRÁFICA 1.11

Page 9: Organizacion y reporte1

26 UNIDAD I

En suma, una tabla de frecuencias relativas y una gráfica de barras, un histograma oun polígono sirven, entre otras cosas, para organizar y resumir en poco espacio la informacióncontenida en los datos y nos dan a simple vista una idea de cómo se distribuyen los posibles valo-res de la variable.

1.13.Gráficas de una variable numérica continua

Con una variable continua pocos datos tienen el mismo valor porque la variable puede tomar unainfinidad de valores.

Ejemplo 9. En un día determinado se midió el tiempo que tardan 50 estudiantes del cole-gio X en trasladarse de su casa al plantel escolar. Los resultados, medidos en minutos y décimas deminuto, son:

TABLA 1.12

Dato Dato Dato Dato Dato1 12.5 11 19.3 21 28.1 31 34.1 41 35.72 33.2 12 15.0 22 32.5 32 27.6 42 41.03 7.0 13 35.7 23 18.1 33 24.3 43 11.34 20.8 14 11.2 24 13.8 34 33.8 44 20.85 45.2 15 18.7 25 29.4 35 19.9 45 27.66 4.6 16 29.1 26 21.3 36 18.7 46 30.17 18.1 17 43.7 27 42.8 37 28.6 47 18.78 25.4 18 29.4 28 25.0 38 19.1 48 22.59 28.6 19 38.7 29 30.4 39 28.2 49 38.010 18.3 20 23.1 30 28.4 40 22.4 50 17.5

Una tabla de frecuencias relativas contendría 42 datos diferentes, casi todos con frecuen-cia uno; de hecho esta tabla no resumiría la información -sólo la ordenaría- y un histograma co-rrespondiente a ella contendría 42 barras, lo que haría muy dificil graficarlas porque varios datosdiferirían muy poco entre sí. Lo mismo ocurriría en el polígono de frecuencias (VER GRÁFICA 1.12).

3

2.5

2

1.5

0.5

0~~~~~~~~~~~~~N4~4. 1 1 1 1 2 2 2 2 2 3 3 3 46 1. 5 8. 9. 1. 3. 5. 8. 9. O. 3. 8 2.

3 333142148 8

GRÁFICA 1.12

3.53

2.52

1.51 ~tXJ:Ó

0.5O-ttt-++tti+tt+t+t1I+H+H-++tti+tt+t++Il+Hf+f+f

Page 10: Organizacion y reporte1

ESTADfsTICA DESCRIPTIVA 27

La gráfica 1.12 no permite visualizar cómo se distribuyen todos los valores de la varia-ble. Por ello es conveniente agrupar los datos en una forma más compacta y sintética, un modode hacerlo es por INTERVALOS. No hay una regla general para agrupar por intervalo los datosreferentes a una variable continua. Nos limitaremos a sugerir una forma sencilla de hacerlo y que,además, se adecúa al posterior desarrollo de los temas de este libro. Consta de tres fases:

• Antes que nada, se selecciona el número de intervalos. El número dependerá de la cantidad dedatos obtenidos y de que dicho número permita alcanzar los objetivos del estudio, reflejandoadecuadamente la distribución de los datos. La experiencia demuestra que si se tienen 30 datoslo más adecuado es distribuirlos en cinco O seis intervalos; si son 50 datos, en ocho, nueve odiez intervalos; para alrededor de 100 datos, usar entre 15 y 20 intervalos; para más de 100 da-tos, manejar entre 20 y 30 intervalos.

• Por lo común, los intervalos deberán tener igual longitud. Para calcular ésta se obtiene el RAN-GO, que consiste en restar el dato de menor valor al de mayor valor, luego la longitud se ob-tiene al dividir el rango entre el número de intervalos. Obtenido este resultado se construyen losintervalos según se enuncia a continuación.

• (PARA ENTENDER MEJOR ESTE PASO, VE COMPARANDO CADA lNSTRUCC¡ÓN CON LAS PARTES ALUDIDAS EN ELLA DE LA

TABLA 1.13). El extremo izquierdo del primer intervalo puede ser el dato de menor valor o unnúmero más pequeño. El extremo izquierdo del segundo intervalo debe coincidir con el extre-mo derecho del intervalo anterior, repiténdose el mismo número en ambos extremos. Para sa-ber a qué intervalo pertenece tal número consideramos a los intervalos cerrados por laizquierda y abiertos por la derecha ( o sea que el número de la izquierda ,tipertenece al inter-valo y el de la derecha no-lJ. Repitiendo la misma operación en los demás intervalos éstos seajustarán al rango de los datos -siempre que la división para obtener la longitud de los interva-los sea exacta- porque el dato mayor coincidirá con el extremo derecho del último intervalo; eneste caso habrá que cerrar dicho intervalo por la derecha para incluir en él al dato mayor (SILA DIVISIÓN NO ES EXACTA SE HARÁN LOS AJUSTES QUE VEREMOS EN LOS SI-GUIENTES EJEMPLOS). Una vez obtenidos los extremos de los intervalos, procedemos aelaborar la tabla de frecuencias relativas.

Apliquemos esta sugerencia a los datos del ejemplo nueve. Allí tenemos 50 datos y lorecomendable es que se agrupen en ocho, nueve o diez intervalos. Elijamos el ocho.

El dato mayor es 45.2 y el menor es 4.6; por lo tanto, el rango es R = 45.2 - 4.6 = 40.6.La longitud de los intervalos es aproximadamente 40.6 / 8 = 5.0. (Resultado inexacto, sobran 0.6como residuo.)

4 Los símbolos" [ ", "]" significan respectivamente "intervalo cerrado por la izquierda" e "intervalo cerrado por laderecha". El símbolo" ) " denota "intervalo abierto por la derecha".

Page 11: Organizacion y reporte1

28 UNIDAD I

Si empezamos el primer intervalo con el dato menor 4.6, los intervalos son:

TABLA 1.13

Intervalo[4.6,9.6)[9.6 , 14.6)[14.6,19.6)[19.6,24.6)[24.6 , 29.6)[29.6 , 34.6)[34.6 , 39.6)[39.6 , 44.6]

Los intervalos contienen sólo 49 datos (con la longitud de 5.0 apenas cubrimos el rangodesde 4.6 hasta 44.6); el último dato 45.2 queda afuera: hay que ajustar la longitud de 5.0. Paracubrir hasta el dato mayor faltan las seis décimas del residuo en la división. Aumentamos a 5.1 lalongitud de los intervalos (ocho décimas más, en total). Como teníamos 0.6 de residuo, ahora nossobran 0.8 - - 0.6 = 0.2. Las compensamos, repartiendo estas dos décimas, una antes del inicio delprimer intervalo y la otra después del final del último. Empezaremos en 4.5 y acabaremos en 45.3(VER TABLA 1. 15.)

Ya obtenidos los extremos de los intervalos hacemos la tabla de frecuencias relativas enla que agregamos la columna de laMARCA DE CLASE que se considera como un punto (núme-ro) represenuuivo de su respectivo intervalo (clase). Algunos autores proponen que sea el puntomedio del intervalo, otros sugieren que alguno de sus extremos lo sea (VER TABLA 1.14.)

Los extremos de los intervalos se conocen como Límites reales de clase. Las frecuen-cias correspondientes a cada intervalo son Frecuellcias de clase. Las frecuencias relativas decada intervalo son Frecuencias relativas de clase.

TABLA 1.14

Intervalo Marca de clase Conteo Frecuencia Frecuencia relativa[ 4.5, 9.6) 7.0 1/ 2 2/50 = 0.04[ 9.6,14.7) 12.1 /111 4 4/50 = 0.08[14.7,19.8) 17.2 /111/ /111/ 10 10/50 = 0.20[19.8.24.9) 22.3 //11/ /11 8 8/50 = 0.16[24.9 • 30.0) 27.4 1111/ 1//11 1/ 12 12/50 = 0.24[30.0 , 35.1) 32.5 //111 / 6 6/50 = 0.12[35.1 .40.2) 37.6 1111 4 4/50 = 0.08[40.2 , 45.3) 42.7 1/11 4 4/50 = 0.08

El histograma y el polígono acumulativo de frecuencias correspondientes a esta tablaestán en las gráficas 1.13 y 1.14.

Page 12: Organizacion y reporte1

ESTADfsTICA DESCRIPTIVA 29

0.25

7 12.1 17.2 22.3 27.4 32.5 37.6 42.7

0.90.80.70.60.50.40.30.20.1

O7

0.2

.---

-r--

-.---

1--

0.15

0.1

0.05

O12.1 17.2 22.3 27.4 32.5 37.6 42.7

GRÁFICA 1.13 GRÁFICA 1.14

Algunos llaman histograma únicamente a la gráfica de barras para una variable continua.Nosotros también hemos denominado como histograma a la gráfica de barras para una variablenumérica discreta porque en la práctica también se hace necesario en algunos casos agrupar porintervalos los datos relativos a esta variable, según ahora veremos:

Ejemplo 10. Para medir el nivel de conocimientos en matemáticas de los alumnos querecién han ingresado al colegio X, se aplicó un examen de diagnóstico a una muestra de tamaño 60,representativa de la población. El examen contiene 80 reactivos de opción múltiple y la calificaciónes el número de reactivos contestados correctamente. Estos son los resultados:

TABLA 1.15

Dato Dato Dato Dato Dato Dato1 63 11 50 21 76 31 49 41 67 51 262 40 12 61 22 52 32 58 42 24 52 433 73 13 48 23 32 33 50 43 55 53 264 61 14 49 24 37 34 46 44 51 54 605 68 15 39 25 49 35 20 45 34 55 756 54 16 70 26 62 36 67 46 55 56 317 25 17 37 27 43 37 45 47 55 57 SO8 67 18 61 28 57 38 38 48 58 58 319 37 19 43 29 52 39 27 49 60 59 4810 59 20 33 30 50 40 60 50 38 60 44

Si hiciéramos el histograma directamente con estos datos, obtendríamos 37 barras porquehay 37 valores distintos entre los 60 datos.

Mejor agrupemos los datos en diez intervalos: el rango es R = 76 - 20 = 56, distribuyendo56/ 10 = 5.6 nos da una división que no es exacta; al subir cuatro décimas la longitud de cada in-tervalo quedarán éstas en 6 y el total rebasará el valor del rango en cuatro unidades, las que reparti-remos así: dos unidades antes del dato menor "20" y dos después del dato mayor "76" quedandocomo se muestra en la tabla 1.16.

Page 13: Organizacion y reporte1

30 UNIDAD I

TABLA 1.16

Intervalo Marca Frecuencia Frecuencia rela- Frecuencia Frecuencia Acum.de clase tiva acumulada relativa

[18 ,24) 21 1 0.016 1 0.016[24,30) 27 5 0.083 6 0.100[30,36) 33 5 0.083 11 0.183[36,42) 39 7 0.116 18 0.300[42 ,48) 45 6 0.100 24 0.400[48,52) 51 11 0.183 35 0.583[52,60) 57 8 0.133 43 0.716[60 ,66) 63 9 0.150 52 0.866[66 I 72) 69 5 0.083 57 0.950[72 I 78] 75 3 0.050 60 1.000

Un polígono de frecuencias relativas y un histograma de frecuencias relativas acumuladasson los siguientes.

0.20.180.160.140.120.1

0.080.060.040.02

o22.4 28 33.6 39.2 44.8 50.4 56 61.6 67.2 72.8

GRÁFICA I.JS

10.90.80.70.60.50.40.30.20.1o~-+ +--+ +--+~+--+ __+--+~

22.4 28 33.6 39.2 44.8 50.4 56 61.6 67.2 72.8

GRÁFICA 1.16

Existen otras formas de representar gráficamente la información recabada; por ejemplo,las "gráficas de pastel" son muy empleadas en publicaciones como periodicos, revistas, etc., por sucapacidad representación visual atractiva y concreta.

Para el desarrollo conceptual y práctico de este libro es suficiente con dominar la grafica-ción a través de histogramas y polígonos.

EJERCICIOS

16. Agrupando a los datos del ejercicio 13 del tema anterior en cinco intervalos construye una tablade frecuencias relativas y frecuencias relativas acumuladas para la población.

Page 14: Organizacion y reporte1

ESTADrSTICA DESCRIPTIVA 31

17. Dibuja dos gráficas referentes al mismo ejercicio: histograma de frecuencias relativas y polígo-no de frecuencias relativas acumuladas.

18. Elabora con los siguientes datos la tabla de frecuencias relativas acumuladas y la gráfica debarras que les correspondan:

Médico (frecuencia = 9); Profesor (frecuencia = 15); Licenciado (frecuencia = 46)Ingeniero (frecuencia = 17); Arquitecto (frecuencia = 14); Enfermera (frecuencia = 5)

19. En una compañía los totales de facturas cobradas por semana para las 50 semanas laborables en1997 han sido los siguientes:

238, 215, 188, 182, 235, 188, 248, 261, 248, 200,169, 222, 232, 207, 237, 274, 225, 220, 217, 241,205, 199, 231, 177, 207, 245, 241, 253, 223, 230,189, 204, 201, 224, 199, 216, 230, 264, 240, 22] ,198, 179, 176, 210, 191, 193, 215, 249, 219, 228,

Haz con los siguientes datos:

a. Una tabla de frecuencias relativas y relativas acumuladas, agrupando los datos en siete intervalosde clase.b. El histograma y el polígono de las frecuencias relativas de clase.

20. ¿Cuáles son los límites reales y la marca de clase de cada intervalo en el ejercicio anterior?

21. a. Completa esta tabla con los datos faltantes:

TABLA E 1.1

Dato frecuencia frecuencia frecuencia Frec. Rel.relativa acumulada acumulada

O 51 0.122 0.5034 10

Total 50

b. ¿Cuál es el 0.5 porcentil de este conjunto de datos?c. El dato "3" ¿qué porcentil es?

22. Construye un polígono de frecuencias relativas y un histograma acumulativo para los datos delproblema anterior.

23. Tienes cinco intervalos de clase (marcas de clase: 6, 8.6, 11.2, 13.8 Y 16.4). Sabes de n = 20. Elintervalo de clase 8.6 tiene una frecuencia relativa acumulada de 0.30 y contiene la mitad de datos

Page 15: Organizacion y reporte1

32 UNIDAD I

que los incluidos en el primer intervalo de clase. El dato con mayor frecuencia -de 8- tiene unafrecuencia acumulada igual a 14. Los dos últimos intervalos de clase tienen, cada uno, el mismonúmero de frecuencias de clase. Escribe lo que sabes en una tabla de frecuencias relativas acumu-ladas y complétala.

24. Dibuja el histograma y el polígono de frecuencias relativas de clase de la tabla del ejercicioanterior.

25. Usando la Tabla 1de dígitos aleatorios del apéndice, selecciona una muestra aleatoria simple detamaño n = 50 de la población del ejemplo 6 del tema anterior y con los resultados construye unatabla de frecuencias relativas y relativas acumuladas, además construye los histogramas de fre-cuencias relativas y de frecuencias relativas acumuladas.

26. Asocia a los siguientes conceptos con sus respectivas características:

a. Tabla Síntesis geométrica de la distribución frecuencial delos datos ( )

b. Límites reales de clase

c. Gráfica de barrasHistograma con las barras separadas por graficarvariables categóricas ( )

d. Gráfica Puntos extremos de un intervalo de clase ( )

f. Histograma

Gráfica obtenida al unir los puntos cuya abcisa escada dato y cuya ordenada es su respectiva frecuencia

()e. Polígono

g. Rango Descripción aritmética de la distribución frecuencialde los datos ( )

h. Frecuencia relativaRazón entre el número de veces que se repite cadadatoentre el total de los datos obtenidos ( )

Diferencia entre el dato mayor y el menor delintervaloocupado por los datos ( )

Gráfica de barras unidas, referente a variablesnuméricas discretas y continuas ( )

27. La frecuencia es una propiedad de los datos, ¿en qué consiste?

28. a. ¿Cuál es la diferencia entre la frecuencia y la frecuencia de clase?

b. ¿Cuál es la diferencia entre frecuencia relativa acumulada y porcentil?

J