Estadstica Descriptiva
Mtodos grficos
Diagrama de Barras
Ejemplo 1:
De un conjunto de 30 empleados se estudia la cantidad de das que se llegaron tarde desde el mes de marzo al mes de junio del 2014.
1 1 1 1 1 2 4 4 4 4
4 4 4 4 5 5 5 5 5 5
5 5 6 6 6 7 7 8 9 9
Valor Frecuencia Frecuencia relativa
1 5 5/30 = 0.167
2 1 1/30 = 0.033
3 0 0/30 = 0
4 8 8/30 = 0.267
5 8 8/30 = 0.267
6 3 3/30 = 0.1
7 2 2/30 = 0.067
8 1 1/30 = 0.033
9 2 2/30 = 0.067
n = 30 suma de las frec. relativas = 1
20.5 19.5 15.6 24.1 9.9
15.4 12.7 5.4 17.0 28.6
16.9 7.8 23.3 11.8 18.4
13.4 14.3 19.2 9.2 16.8
8.8 22.1 20.8 12.6 15.9
Ejemplo 2:
Relacin precio-rendimiento de 25 acciones (price earnings ratios)
Valor Frecuencia Frecuencia relativa
[5, 9) 3 3/25 = 0.12
[9, 13) 5 5/25 = 0.20
[13, 17) 7 7/25 = 0.28
[17, 21) 6 6/25 = 0.24
[21, 25) 3 3/25 = 0.12
[25, 29) 1 1/25 = 0.04
n = 25 suma de las frec.
relativas = 1
Ejemplo 3: Los datos que se presentan a continuacin indican el ingreso per capita en miles de dlares para 50 estados de EEUU en 1983.
Estado Ingreso Estado Ingreso Estado Ingreso Estado Ingreso
AL 9.2 IN 10.5 NE 11.2 SC 9.2
AK 17.2 IA 10.7 NV 12.5 SD 9.8
AZ 10.7 KS 12.2 NH 12.2 TN 9.5
AR 9.0 KY 9.4 NJ 14.1 TY 11.7
CA 13.3 LA 10.3 NM 9.6 UT 9.0
CO 12.8 ME 9.8 NY 13.0 VT 10.0
CT 14.9 MD 13.0 NC 9.8 VA 12.1
DE 12.7 MA 13.3 ND 11.7 WA 12.2
FL 11.6 MI 11.5 OH 11.2 WV 9.2
GA 10.4 MN 11.9 OK 11.0 WI 11.4
HI 12.1 MS 8.1 OR 10.7 WY 11.9
ID 9.6 MO 11.0 PA 11.5
IL 12.4 MT 9.9 RI 11.7
Si agrupamos en intervalos de igual longitud resultaran intervalos sin observaciones, por ejemplo:
Valor Frecuencia Frecuencia relativa
[8, 9) 1 1/50 = 0.02
[9, 10) 13 13/50 = 0.26
[10, 11) 7 7/50 = 0.14
[11, 12) 13 13/50 = 0.26
[12, 13) 9 9/50 = 0.18
[13, 14) 4 4/50 = 0.08
[14, 15) 2 2/50 = 0.04
[15, 16) 0
[16, 17) 0
[17, 18) 1 1/50 = 0.02
total 50 1
Ejemplo 4: A cada miembro de una muestra de 120 dueos de motocicletas, se les pregunt la marca de su mquina. Se obtuvo la siguiente tabla de frecuencias:
Marcas Frecuencia Frec. relativa
Honda 41 0.34
Yamaha 27 0.23
Kawasaki 20 0.17
Suzuki 18 0.15
Harley Davidson 3 0.03
Otras 11 0.09
n = 120 1
(por redondeo: 1.01)
Ejemplo 5: Con el objetivo de estudiar la situacin laboral de las personas en relacin con el nivel de educacin que ellas han alcanzado se registraron los siguientes datos:
Mximo
nivel
Nivel
Avanzado
Otras
calificaciones
Sin
calificacion
es
Totales
En
actividad
8.224 5.654 11.167 2.583 27.628
Desem-
pleado
217 231 693 303 1.444
Inactivo 956 1.354 3.107 2.549 7.966
Totales 9.397 7.239 14.967 5.435 37.038
El diagrama de barras con los totales de cada categora de la situacin laboral muestra como es la situacin laboral de los encuestados sin considerar su nivel de educacin:
Table 1 referencias: 1 en actividad; 2 desempleado; 3 - inactivo
El diagrama de barras que permite ver el nivel educativo en cada una de las categoras de la situacin laboral el diagrama de barras mltiple siguiente:
Table 2 referencias: serie 1- activos; serie 2 - desempleados; serie 3 -inactivos Eje x: 1- nivel mximo; 2-nivel avanzado; 3-otras calificaciones; 4-s/calificaciones
Estadstica Descriptiva
Mtodos numricos
a.- Medidas de localizacin
b.- Medidas de dispersin
I.- Media o Promedio muestral:
a.- Medidas de localizacin
Si nuestro conjunto de datos es x1, x2, ..., xn la
Media o Promedio muestral se lo define y
calcula como:
1
n
i
i
x
xn
Se recomienda usar un dgito decimal ms que los
utilizados para las observaciones xi .
Ejemplo 2: Si lo datos vienen dados por sus tablas de frecuencia, como en el
ejemplo de la cantidad de das que los 30 empleados de una fbrica
llegan tarde en un trimestre de trabajo:
Valor Frecuencia
1 5
2 1
3 0
4 8
5 8
6 3
7 2
8 1
9 2
n = 30
1
1
c
i i
i
c
i
i
x f
x
f
1*5 3*1 4*8 5*8 6*3 7*2 8*1 9*2
30x
4.6x
Si la poblacin es finita, de tamao N, entonces
la media poblacional es:
1
N
i
i
x
N
Si se conocen los datos poblacionales
agrupados por intervalos de clase podemos
estimar esta media poblacional con la frmula:
1
1
c
i i
i
c
i
i
x f
f
donde fi es la frecuencia del
intervalo, xi es el punto medio
del intervalo y c es la cantidad
de intervalos de clase
Otras veces se necesita calcular el promedio pesado
porque los valores corresponden a distintos porcentajes
de la poblacin. Por ejemplo:
Ejemplo 6:
Los costos por alumno de los diferentes niveles
educativos en Inglaterra en libras son:
Primaria: 890; Secundaria: 1450; post secundaria:1910
La proporcin de alumnos en cada nivel educativo es:
Primaria: 44,4%; Secundaria: 38,9%; post secundaria:
16,7%.
El gasto promedio de un alumno cualquiera de ese pas
es (media poblacional):
890*0.44 1450*0.389 1910*0.167
= 1277.8 libras
II. Modo:
Es el valor que se presenta con mayor frecuencia en el
conjunto de datos.
Ejemplo 7:
Se registra en dos negocios la cantidad de vestidos de los
distintos talles que se venden en una semana de trabajo.
Los datos son:
Talles Cantidad de vestidos
8 7
10 25
12 36
14 11
16 3
118 1
Talles Cantidad de vestidos
8 8
10 25
12 25
14 15
16 9
118 1
unimodal (un solo modo) bimodal (tiene dos modos)
III. Mediana:
Sean x1, x2, ..., xn las observaciones. Los datos ordenados
de menor a mayor se notan:
(1) (2) ( ); ;...; nx x x
Se define la mediana muestral como:
valor medio o central si n es imparx
promedio de las dos observaciones centrales si n es par
Al igual que en el caso de la media, podemos pensar un
una mediana poblacional a la que notaremos:
Para calcular la mediana en el caso de datos
agrupados por intervalos de clase se debe calcular el
intervalo donde estar ubicada la mediana y usar la
siguiente frmula:
1
2L U L
NF
x x x xf
xL = lmite inferior del intervalo que contiene a la mediana.
xU = lmite superior del intervalo que contiene a la mediana.
N = nmero total de observaciones.
F = frecuencia acumulada hasta el intervalo ms prximo al
de la mediana;
f = frecuencia del intervalo donde se encuentra la mediana.
Ejemplo 3:
Los datos que se presentan a continuacin indican el ingreso per
capita en miles de dlares para 50 estados de EEUU en 1983.
Valor Frecuencia Frecuencia
acumuladas
[8, 9) 1 1
[9, 10) 13 14
[10, 11) 7 21
[11, 12) 13 34
[12, 13) 9 43
[13, 14) 4 47
[14, 15) 2 49
[15, 18) 1 50
totales 50 50
11Lx
12Ux
N = 50
F = 21
f = 13
11.35x
IV. Cuartiles y percentiles:
Ejemplo 3:
Los datos que se presentan a continuacin indican el ingreso per
capita en miles de dlares para 50 estados de EEUU en 1983.
Calcular el tercer cuartil (75% de los datos a su izquierda)
Valor Frecuenc
ia
Frecuencia
acumuladas
[8, 9) 1 1
[9, 10) 13 14
[10, 11) 7 21
[11, 12) 13 34
[12, 13) 9 43
[13, 14) 4 47
[14, 15) 2 49
[15, 18) 1 50
totales 50 50
0.75
3 1
4L U L
NF
x x x xf
0.7538,25 34
12 13 129
x
0.75 12.47x
Ejemplo 2:
En el ejemplo de la cantidad de das que los 30 empleados de una
fbrica llegan tarde en un trimestre de trabajo:
Valor Frecuen-
cia
Frec.
Acumu-
lada
1 5 5
2 1 6
3 0 6
4 8 14
5 8 22
6 3 25
7 2 27
8 1 28
9 2 30
n = 30
El primer cuartil indica el 25% de
las observaciones:
F= 0.25*31 = 7.75
corresponde a x=4
El tercer cuartil indica el 75% de
las observaciones:
F= 0.75*31 = 23.5
corresponde a x=6.
Ejemplo para datos listados:
a) Sean las siguientes 8 observaciones ordenadas:
2 ; 3 ; 5 ; 6 ; 8 ; 8 ; 9.2 ; 10.
QI est en la posicin 9/4= 2.25 3 0.25* 5 3 3.50 IQ
Q3 est en la posicin 27/4= 6.75 3 8 0.75* 9.2 8 8.9 Q
b) Si tuvisemos 9 observaciones:
2 ; 3 ; 5 ; 6 ; 8 ; 8 ; 9 ; 10 ; 12.
QI est en la posicin 10/4= 2. 5 3 0.5* 5 3 4 IQ
9 0.5* 10 9 9.5 IQ Q3 est en la posicin 30/4= 7.5
b.- Medidas de dispersin
I.- Rango muestral:
Se define como la diferencia entre el valor mximo y el valor
mnimo de la muestra.
r = mx(xi) mn(xi) = ( ) (1)nx x
Ejemplo:
x 0 5 5 5 10
y 0 1 5 9 10
5x y 5x y rx = ry = 10
II.- Varianza y Desvo estndar:
a. Varianza poblacional para una poblacin finita
Para datos listados: 2 2
1
1( )
n
i
i
xN
Para tabla de frecuencias: 2 2
1
1
1( )
c
i ic
ii
i
f x
f
b. Varianza muestral
Para datos listados: 2 2
1
1( )
1
n
i
i
s x xn
Para tabla de frecuencias: 2 2
1
1( )
1
c
i i
i
s f x xn
Frmulas de clculo para la varianza poblacional
2 2
2 1
N
i
i
x N
N
2 2
2 1
n
i i
i
x f N
N
Frmulas de clculo para la varianza muestral
2 2
2 1
1
n
i
i
x nx
sn
2 22 1 1
1
1
c c
i i i
i i
c
i
i
x f x f
s
f
El desvo estndar muestral, notado con s , es la raiz cuadrada
de la varianza
Ejemplo 3:
Los datos corresponden al ingreso per capita en miles de
dlares para 50 estados de EEUU en 1983. Calcular la
varianza de esta muestra. Valor fi xi xifi
[8, 9) 1 8.5 8.5 72.25 72.25 [9, 10) 13 9.5 123.5 90.25 1173.25 [10, 11) 7 10.5 73.5 110.25 771.75 [11, 12) 13 11.5 149.5 132.25 1719.25 [12, 13) 9 12.5 112.5 156.25 1406.25 [13, 14) 4 13.5 54.0 182.25 729 [14, 15) 2 14.5 29.0 210.25 420.5 [15, 18) 1 16.5 16.5 272.25 272.25
totales 50 6564.5
2
ix2
i ix f
11.34x
22 6564.5 50*11. 2.7494
3
49
4s
2 1.658s s
El desvo estndar es aproximadamente 1658 dlares
III.- Coeficiente de variacin:
Datos poblacionales: .coef var
Datos muestrales: .s
coef varx
Ejemplo 8:
El salario promedio de las mujeres es $16.800 y el desvo
estndar es $3.800. Para los hombres el salario promedio es
$19.500 y el desvo $4.750. Cul de las dos poblaciones
tiene mayor variabilidad?
0.24364750
.19500
coef var hombres
30
800.
16800.2262coef var mujeres
El desvo es mayor en los hombres.
V.- Rango intercuartil:
Se define como la diferencia entre el tercer cuartil y el
primer cuartil:
3 1Id Q Q
Indica la amplitud del intervalo que contiene al 50%
de las observaciones centrales.
VI. Diagrama de caja o box-plot:
Permite describir caractersticas del conjunto de datos, por
ejemplo:
centro
dispersin
naturaleza y magnitud de cualquier desviacin de la simetra
identificacin de puntos atpicos (outliers)
2.68 3.06 4.31 4.71 5.71 5.99 6.06 7.04 7.17 7.46 7.50
8.27 8.42 8.73 8.84 9.14 9.19 9.21 9.39 11.28 15.19 21.06
Ejemplo:
Consideremos las siguientes observaciones ya
ordenadas ( n = 22 ).
Ejemplo 1:
Losdatos corresponden al ejemplo de la cantidad de das que
los 30 empleados de una fbrica llegan tarde en un trimestre
de trabajo:
Valor Frecuencia
1 5
2 1
3 0
4 8
5 8
6 3
7 2
8 1
9 2
n = 30
Ejemplo 2:
Relacin precio-rendimiento de 25 acciones
(price earnings ratios)
Valor Frecuencia
[5, 9) 3
[9, 13) 5
[13, 17) 7
[17, 21) 6
[21, 25) 3
[25, 29) 1
n = 25
Ejemplo 3:
Los datos que se presentan a continuacin indican el ingreso per
capita en miles de dlares para 50 estados de EEUU en 1983.
Valor Frecuencia
[8, 9) 1
[9, 10) 13
[10, 11) 7
[11, 12) 13
[12, 13) 9
[13, 14) 4
[14, 15) 2
[15, 18) 1
totales 50
Top Related