Estadstica Descriptiva
56
Captulo 255
UNIDAD II
Distribuciones de frecuencia
Distribuciones de frecuencia
Los datos son colecciones de cualquier cantidad de observaciones relacionadas.Una coleccin de datos se conoce como conjunto de datos y una sola observacin es un punto de dato.
Para que los datos sean tiles, necesitamos organizar nuestras observaciones, de modo que podamos distinguir patrones y llegar a conclusiones lgicas.
Recoleccin de datos
Los especialistas en estadstica seleccionan sus observaciones de manera que todos los grupos relevantes estn representados en los datos. Los datos pueden provenir de observaciones reales o de registros que se mantienen para otros propsitos. Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones bien pensadas acerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas en situaciones dadas. Tambin el conocimiento de tendencias adquirido de la experiencia previa puede permitir estar al tanto de posibles resultados y actuar en consecuencia. Cuando los datos son ordenados de manera compacta y til, los responsables de tomar decisiones pueden obtener informacin confiable sobre el ambiente y usarla para tomar decisiones inteligentes. Los administradores deben tener mucho cuidado y asegurar que los datos utilizados estn basados en suposiciones e interpretaciones correctas. Para ello, se utilizan las pruebas para datos.
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato de la variable su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico.Se representa por f
La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.
f1+ f2+ f3+...+fn = nPara indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.Frecuencia Relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos.
Frecuencia Relativa porcentual
Expresada partir de fr en trminos de porcentaje
Frecuencia Acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por fa
Frecuencia acumulada relativa
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Se representa por
Y Respectivamente
Distribuciones de frecuencia Cualitativas
Las distribuciones de frecuencia cualitativas presentan como variable un atributo o caracteres no cuantitativos, por lo que entre ellas tenemos:
Distribucin cronolgica
En ella la variable representa perodos de tiempo no cuantificables
Perodo (Variable)Habitantes de x pas (frecuencia)
Edad de piedra1000000
Edad del metal5667889
Edad media9009090934
Renacimiento76524376743
poca contempornea100893284892392384984
Distribucin Geogrfica
En ste tipo de distribuciones se toma en cuenta como variable regiones del espacio terrestre.
PasCantidad de Automviles rojos, (dato irrelevante)
Guatemala87324578
Costa Rica792365
Panam724435
Honduras13451324
Distribucin por atributos
La variable toma valores de cualidades
Color de AutomvilCantidad
Rojo812734
Verde 123758213
Negro4123123
Blanco1823572234
Distribuciones Cuantitativas de datos
Como hemos visto una serie de datos, podemos clasificarla de diferentes maneras. Todo depender de la naturaleza de los datos, la cantidad de datos, el parmetro a conocer o calcular, o por conveniencia al investigador.
En este tipo de distribuciones, la variable es de carcter estrictamente numrico y se puede clasificar en:
a. Distribucin de Frecuencias Simpleb. Distribucin de frecuencia agrupada en intervalos con amplitud constante
Distribucin de Frecuencias simple
Este ordenamiento es ideal para cuando la variable toma no muchos valores discretos de modo que resulta fcil colocar los valores de la variable:
Para su construccin seguiremos el siguiente esquema:
Ejemplo:
Se tiene la siguiente coleccin de datos
66576872
82666570
66726568
Ordenamos los datos, n = 12
576565666666686870727282
Tabulamos y asignamos la frecuencia
Xf
571
652
663
682
701
722
821
Total12
Recuerde verificar que
A partir de sta distribucin, es posible determinar la frecuencia relativa fr, la frecuencia porcentual fr%, frecuencia acumulada fa, frecuencia acumulada relativa y porcentual, far y far%.
XfFrfr%fafarfar%
5711/120.08(1/12)*100811/120.088
6522/120.17(1/12)*1001733/120.2525
6633/120.25(1/12)*1002566/120.550
6822/120.17(1/12)*1001788/120.6767
7011/120.08(1/12)*100899/120.7575
7222/120.17(1/12)*100171111/120.9292
8211/120.08(1/12)*10081212/121100
Total de la sumatoria1211100%100%
Veamos el detalle de algunas columnas.
Para fr
Para cada valor de frecuencia se calcula su respectiva frecuencia relativa
Para el valor X=57fr1 = 1/12 = 0.08 y su respectiva fr%1 = 8%
Quiere decir que el dato 57 representa un 8% del total de la muestra
Para el valor X=65Fr2 = 2/12 = 0.17 y su respectiva fr%2 = 17%
Quiere decir que el dato 65 representa un 17% del total de la muestra
Para el valor X=66Fr3 = 3/12 = 0.25 y su respectiva fr%3 = 25%
Quiere decir que el dato 66 representa un 25% del total de la muestra
Y as para los dems valores de la variable
Para frecuencia acumulada fa
La fa1 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 1, y como la frecuencia acumulada anterior es fa0 = 0 entonces:
fa1 = frecuencia acumulada anterior + frecuencia del intervalo = 0 + 1 = 1
La fa2 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 2, y como la frecuencia acumulada anterior 1 entonces:
fa2 = frecuencia acumulada anterior + frecuencia del intervalo = 1 + 2 = 3
La fa3 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 3, y como la frecuencia acumulada anterior 3 entonces:
fa3 = frecuencia acumulada anterior + frecuencia del intervalo = 3 + 3 = 6
La fa4 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 4, y como la frecuencia acumulada anterior 6 entonces:
fa4 = frecuencia acumulada anterior + frecuencia del intervalo = 6 + 2 = 8
De igual forma para todos los valores siguientes; hasta que el ltimo valor de frecuencia acumulada es igual a n.Para far y far%
Para far
Para cada valor de frecuencia acumulada se calcula su respectiva frecuencia acumulada relativa
Para el valor X=57far1 = 1/12 = 0.08 y su respectiva fr%1 = 8%
Quiere decir que para el valor x=57 llevamos un 8% acumulado del total de datos.
Para el valor X=65far2 = 3/12 = 0.25 y su respectiva fr%2 = 25%
Quiere decir que para el valor x=65 llevamos un 25% acumulado
Para el valor X=66far3 = 6/12 = 0.5 y su respectiva fr%3 = 50%
Quiere decir que para el valor x=66 llevamos un 50% acumulado
Y as para los dems valores de la variable
Notamos valiosa informacin calculada a partir de una distribucin de frecuencias simple
XfFrfr%fafarfar%
5711/120.08(1/12)*100811/120.088
6522/120.17(1/12)*1001733/120.2525
6633/120.25(1/12)*1002566/120.550
6822/120.17(1/12)*1001788/120.6767
7011/120.08(1/12)*100899/120.7575
7222/120.17(1/12)*100171111/120.9292
8211/120.08(1/12)*10081212/121100
Total de la sumatoria1211100%100%
Ejercicio 1En el siguiente espacio describa detalladamente para cada una de las colecciones de datos el proceso para construir una distribucin de frecuencias simple, y concluya con la tabla que muestre f, fr, fr%, fa, far, far%.
1. 525510500490485480
478475470460455450
445440435430425420
2. 500440510470460425430
490525500525510460455
475485480485480478475
440470460430455450445
435525500490480478485
430475460470450455440
425445430435420425480
490510490430425420470
500490485455
3. 455475470475455485435
495475455475465475480
485495485465500465475
435485430595475475485
495420440480470450485
450465475440420425585
475455440455475495485
495425455475575485495
485505465495465475585
495475
4. 1.001.051.351.951.800.951.351.351.201.13
1.031.301.201.131.000.951.201.201.021.00
1.050.981.021.001.031.151.051.020.961.80
1.101.000.961.800.991.351.351.951.101.00
1.351.021.171.001.001.201.201.131.351.02
1.101.001.061.101.101.051.021.001.101.05
Distribucin de frecuencia en Datos agrupados por intervalos
Una tabla de frecuencias est formada por las categoras o valores de una variable y sus frecuencias correspondientes. sta tabla es lo mismo que una distribucin de frecuencias, se crea por medio de la tabulacin y agrupacin, por lo que se puede construir una distribucin de frecuencias con intervalos o clases.
Si tenemos una coleccin de datos que representen una muestra y el tamao de dicha muestra es
Entonces si no se indica lo contrario utilizaremos una distribucin por intervalos para organizar los datos
Paso 1
Recopilacinde los datos782, 1333, 515, 1475, 696, 832, 1052, 700, 958, 542, 1296, 704, 814, 1482, 1023, 739, 643, 956, 1023, 784.
Paso 2
Se ordenan los datos de menor a mayor5157007849871296
54270481410231333
64373983210231475
69678295610521482
Paso 3
Se determina el nmero de clasesPara esto se emplea la frmula:
En la que n representa el total del nmero de datos que se van a ordenar y analizar.
K = Numero de clases= 4.47
Este valor se redondea al prximo nmero superior ya que aparece un valor decimal, sin importar que este sea menor a 0.5. De esta forma el nmero de clases se quedara:
Nmero de clases, k = 5.
Otro mtodo para el clculo del nmero de clases k
Cabe mencionar que en este caso particular se aplica elmtodode larazcuadrada para determinar el nmero de clases, pues el nmero de datos que se desea analizar es pequeo. Sin embargo, para los casos en que la base de datos es grande, se sugiere aplicar elmtodode Sturges, quien presenta la siguiente frmula para para calcular el nmero de clases:
Paso 4
Calculo del intervalo exactoo amplitud (i). Para esto, la frmula empleada es:
En donde Rango
(R) = Dato mayor Dato menor
Se observa que el valor mayor de la base de datos es 1482, y el valor ms pequeo es de 515, por ello;
Amplitud = 193.4
Paso 5
Se determina el Ancho de Clase ajustado segn el valor de la unidad de variacin o incremento (I)En este ejemplo, la unidad de variacin de los datos es igual a 1, por lo que el tamao ajustado o ancho de clase debe ser por lo menos igual al siguiente valor entero incrementado en 1, o sea 194.
Paso 6
Se calculan los Lmites Aparentes Inferiores (LAI) y Superiores de cada clase (LAS).Para ello se emplea la frmula:
Para los lmites aparentes inferiores. Este clculo se inicia tomando en cuenta que el primer Lmite Aparente Inferior de la primera clase es el valor menor de los datos que se desean ordenar, esto es 515.
Limite Aparente Inferior de la Primera Clase=515
Limite Nominal Inferior de la Segunda Clase=515+Amplitud
= 515+194=709
Limite Nominal Inferior de la Tercera Clase =709+194 =903
Limite Nominal Inferior de la Cuarta Clase =903+194 =1097
Limite Nominal Inferior de la Quinta Clase
=1097+194 =1291
Aunque sabemos que solo son 5 clases las que compondr la Tabla deDistribucinde Frecuencias, calcularemos un Limite Aparente Inferior hipottico, por si fuese necesario.
Limite Aparente InferiorHipottico
=1291+194 =1485
Hasta ahora, lo que hemos logrado, se puede observar de la siguiente manera en la Tabla deDistribucinde Frecuencia
CLASELAILASffafr%far%
1515
2709
3903
41097
51291
6 H1485
En este mismo paso figura la necesidad de calcular los Limites Nominales Superiores
De forma que
Lmite Superior de la clase 1
LAS1= LAI1 + (i I)
LAS1 = 515 + (194 1) = 708
Lmite Superior de la clase 2LAS2= LAI2 + (i I)
LAS2 = 709 + (194 1) = 902
Lmite Superior de la clase 3LAS3= LAI3 + (i I)
LAS3 = 903 + (194 1) =
Lmite Superior de la clase 4LAS4= LAI4 + (i I)
LAS4 = 1097 + (194 1) = 1290
Lmite Superior de la clase 5LAS5= LAI5 + (i I)
LAS5 = 1291 + (194 1) = 1484
Lmite Superior de la clase 6 si fuese necesarioLAS6= LAI6 + (i I)
LAS6 = 1485 + (194 1) = 1687
Recuerde que la unidad de variacin o incremento (I) es igual a 1, segn lo expuesto anteriormente
Los lmites Aparentes, ya completos se veran en la DFI (distribucin de frecuencia por intervalos) as:
CLASELAILASffafr%far%
1515708
2709902
39031096
410971290
512911484
6 H14851687
Calculando la sexta clase si existiese algn dato que sobrepase el LAS5 y fuese necesaria otra clase.
Paso 7
En este paso iniciamos el conteo de los datos. Para ello procedemos de la manera que se explica; a partir de la base de datos que se orden de menor a mayor, se van contando los nmeros que estn comprendidos en cada intervalo de clase, de preferencia, estos se van tachando en la misma base de datos.
Observe que en la primera clase, cuyo intervalo va de 515 a 708, estn los nmeros 515, 542, 643, 696, 700 y 704, por lo que podemos decir que en este primer intervalo o Clase 1, tenemos una frecuencia absoluta de seis, ya que solo hay seis nmeros que estn dentro del intervalo mencionado.
En la segunda clase (intervalo que va de 709 a 902) estn los nmeros 739, 782, 784, 814 y 832. En esta Clase la frecuencia seria de 5.
En la Clase 3, los nmeros que debemos buscar son los que sean iguales o mayores que 903 e iguales o menores de 1096. Los nmeros que estn comprendidos entre estos lmites son el 956, 987, 1023, 1023 otra vez, y el 1052, La frecuencia absoluta seria 5
Para la clase 4, los nmeros deben ser iguales o mayores de 1097 pero iguales o menores de 1290. Vase que en este intervalo no hay ningn valor, por ello la f es igual a cero.
Para terminar, la ltima clase exige que se busquen valores mayores o iguales a 1291 y menores o iguales a 1484. Se observa que los valores comprendidos son el 1296, 1333, 1475 y 1482, lo cual indica que la f es igual a 5.
Con las frecuencias absolutas bien definidas para cada Clase, la DFI quedara de la forma que se exhibe
CLASELAILASffafr%far%
15157086
27099025
390310965
4109712900
5129114844
Frecuencia Acumulada
La Frecuencia acumulada de cierta n clase, corresponde a la sumatoria de los valores de las Frecuencias Absolutas abajo del Limite Real superior de la clase n contemplada.
Nos disponemos ahora a calcular la Frecuencia Acumulada. Para esto se emplea la formula
Con esta frmula calculamos la Frecuencia acumulada de las 5 clases.
fa1 = 0 + 6 = 6
fa2 = 6 + 5 = 11
fa3 = 11 + 5 = 16
fa4 = 16 + 0 = 16
fa5 = 16 + 4 = 20
Incluyendo estos datos en la columna de la Frecuencia acumulada, la DFI quedara
La columna del Porciento de la Frecuencia absoluta (%Fr, Frecuencia Relativa) se calcula fcilmente dividiendo cada valor de la Frecuencia absoluta entre el total de datos que en esta base de datos particular es igual a 20, a saber, para el primer caso n=20
Para lograr la Frecuencia Relativa acumulada se dividi la Frecuencia acumulada (fa) entre el total de datos, el cual es igual a 20 (n), segn la ltima frmula dada anteriormente.
Lmites Reales
Los lmites Reales de Clase son los que realmente se emplean para elaborar cualquier grfico que se desee utilizar para analizar los datos de una manera rpida y precisa. Para ello se emplea la frmula que se muestra enseguida
De forma que los Limites Reales para la primera clase secalcularanas
Lmite Real Inferior de la clase 1
Lmite Real Inferior de la clase 2
O bien con el Lmite Real Inferior 1Mediante:
Entonces
Lmite Real Inferior de la clase 3
O bien con el Lmite Real Inferior 2Mediante:
Entonces
Lmite Real Inferior de la clase 4
O bien con el Lmite Real Inferior 3Mediante:
Entonces
Lmite Real Inferior de la clase 5
O bien con el Lmite Real Inferior 4Mediante:
Entonces
Para los Lmites Reales SuperioresLmite Real Superior de la clase 1
Lmite Real Superior de la clase 2
O bien con el Lmite Real Superior 1Mediante:
Entonces
Lmite Real Superior de la clase 3
O bien con el Lmite Real Superior 2Mediante:
Entonces
Lmite Real Superior de la clase 4
O bien con el Lmite Real Superior 3Mediante:
Entonces
Lmite Real Superior de la clase 5
O bien con el Lmite Real Superior 4Mediante:
Entonces
Incluyendo la nueva columna de estos lmites en la DFIquedara:IntervaloLAILASLRILRSffafrfar
1515708514.5708.56630%30%
2709902708.5902.551125%55%
39031096902.51096.551625%80%
4109712901096.51290.50160%80%
5129114841290.51484.542020%100%
Marca de Clase
sta columna indica un valor representativo para cada intervalo, o su valor medio;
Y para cada intervalo los siguientes valores para la marca de clase:
Intervalo o claseMarca de clase Xi
1(515 + 708)/2 = 611.5
2(709 + 902)/2 = 805.5
3(903 + 1096)/2 = 999.5
4(1097 + 1290)/2 = 1193.5
5(1291 + 1484)/2 = 1387.5
Ejercicio 2Estructure la Tabla de Distribucin de Frecuencia para las bases de datos que se dan enseguida. No se olvide incluir los clculos para el Nmero de Clases, el Ancho de Clases, Limites Nominales, Limites Reales, etc. y colocar el incremento en cada caso.
Tabla 1500440510470460425430
490525500525510460455
475485480485480478475
440470460430455450445
435525500490480478485
430475460470450455440
425445430435420425480
490510490430425420470
500490485455
Determine el nmero de Clases
Determine el rango de la coleccin de datos
Determine la amplitud del intervalo
Determine el incremento
Construya su tabla de lmites aparentes, recuerde comenzar por el valor ms pequeo.
Determine la tabla de lmites reales
Determine las frecuencias; absoluta, relativa porcentual, acumulada, acumulada relativa porcentual, y adems la marca de clase
Tabla 20.820.90.950.961.021.081.091.111.141.16
1.191.231.271.281.291.31.31.351.371.39
1.411.431.441.471.481.491.491.51.531.54
1.571.581.631.651.661.671.681.711.721.75
1.751.781.851.871.911.972.022.062.062.13
Muestre una DFI con las caractersticas de la tabla1
Tabla 39.617.120.217.814.710.215.319.712.79.9
15.718.59.511.617.211.114.821.31316.5
14.114.920.617.512.312.814.416.810.916.7
10.811.91515.411.413.519.113.712.915.8
9.516.320.617.51314.318.716.616.614.9
Muestre una DFI con las caractersticas de la tabla1
Tabla 4
47495149604650584655
45473543473543547655
50684946563738696260
50707262664946625243
61535149305257695055
52544860653753488063
51696863185938436652
39755845664947465560
46494260603860636566
Muestre una DFI con las caractersticas de la tabla1
Tabla 5
0.1650.160.1380.1450.1550.150.1850.16
0.130.140.1450.150.1650.1380.210.125
0.170.1680.1380.1270.1450.1560.1580.16
0.1450.150.150.1550.1450.1440.1480.16
0.1560.160.1650.170.1850.170.1850.19
0.150.20.1750.1150.120.150.170.165
0.1350.140.1450.150.1550.160.160.17
0.170.1650.1550.1450.1560.170.140.21
0.1750.180.1680.1350.1670.1750.20.17
Ejercicio 3
1. Estas son los puntajes obtenidos por los 100 candidatos que se presentaron a un concurso:
38513265252834122943
7162503782419478153
166250374177594625
55384616726461335921
13923743585288277466
6328361956843864250
9851623174347545826
12423468774560317223
1822703455920685549
33521440385450114176
Muestre una DFI con las caractersticas de la tabla1.
2. En una cierta ciudad, se registra el nmero de nacimientos ocurridos por semana durante las 52 semanas del ao, siendo los siguientes los datos obtenidos:
64281816106751289
121711916191818161412710
311712591115941611
78101532139111713128
56
ITVP Emiliani55
Top Related