analisis estadistico poblacional
Transcript of analisis estadistico poblacional
- 1 -
2.1. Los siguientes datos se obtuvieron contando el número de vehículos que cruzan por un punto fijo de una avenida durante intervalos de un minuto. Los 54 conteos se hicieron a lo largo del mismo día. Construya una tabla de dos encabezados mostrando la frecuencia de cada medición obtenida.
Número de vehículos frecuencia Número de vehículos frecuencia
20 3 30 2
Número de vehículos por minuto 21 1 31 3
28 30 25 36 24 27 33 26 29 22 3 32 3
32 25 20 28 20 27 31 23 27 23 3 33 2
24 34 25 24 22 26 28 38 32 � 24 4 34 2
26 30 37 21 28 31 38 28 27 25 4 35 0
23 32 39 26 29 33 28 20 22 26 5 36 1
23 25 34 24 26 31 27 22 27 27 6 37 1
28 6 38 2
29 2 39 1
a) Porcentaje de minutos con 30 o mas vehículos.
a = 17 x 100 / 54 = 31.5% b) Porcentaje de minutos con menos de 25 vehículos.
b = 14 x 100 / 54 = 25.9% c) Porcentaje de minutos con mas de 28 y 32 o menos vehículos.
c = 10 x 100 / 54 = 18.5% 2.2. A continuación se presentan 103 determinaciones del contenido de ácido ascórbico en el jugo de toronja.
0,49 0,56 0,53 0,58 0,53 0,48 0,46 0,41 0,43 0,50
0,49 0,47 0,46 0,43 0,38 0,39 0,51 0,51 0,50 0,45
0,42 0,43 0,42 0,40 0,49 0,47 0,48 0,41 0,44 0,39
0,35 0,33 0,35 0,40 0,43 0,47 0,47 0,46 0,48 0,50
0,45 0,50 0,42 0,38 0,41 0,35 0,32 0,33 0,33 0,38
0,40 0,45 0,50 0,41 0,45 0,48 0,43 0,48 0,47 0,37
0,42 0,36 0,34 0,34 0,36 0,42 0,40 0,44 0,47 0,46
0,50 0,44 0,43 0,41 0,40 0,38 0,41 0,36 0,36 0,34
0,36 0,40 0,43 0,47 0,48 0,46 0,34 0,37 0,34 0,35
0,37 0,39 0,38 0,41 0,46 0,43 0,42 0,44 0,38 0,36
0,36 0,33 0,33
a) ¿Que inconveniente tendría en este caso una tabla como la del problema 2.1?
R = La naturaleza de los datos ya no es discreta y hace difícil la clasificación de los datos. b) Elija límites de clases adecuados para los datos y construya una tabla de frecuencias con límites y valor medio de
clase, frecuencias abs. y frecuencias rel., frecuencias abs. acumuladas y frecuencias rel. acumuladas.
limite de clase valor medio de clase Frecuencia abs. Frecuencia rel. Frecuencia abs. acum.. Frecuencia rel. acum..
(0,31 - 0,33] 0,32 6 0,058 6 0,058
(0,33 - 0,35] 0,34 9 0,087 15 0,146
(0,35 - 0,37] 0,36 10 0,097 25 0,243
(0,37 - 0,39] 0,38 9 0,087 34 0,33
(0,39 - 0,41] 0,40 13 0,126 47 0,456
(0,41 - 0,43] 0,42 14 0,136 61 0,592
(0,43 - 0,45] 0,44 8 0,078 69 0,67
(0,45 - 0,47] 0,46 13 0,126 82 0,796
(0,47 - 0,49] 0,48 9 0,087 91 0,883
(0,49 - 0,51] 0,50 8 0,078 99 0,961
(0,51 - 0,53] 0,52 0 0 99 0,961
(0,53 - 0,55] 0,54 2 0,019 101 0,981
(0,55 - 0,57] 0,56 1 0,01 102 0,99
(0,57 - 0,59] 0,58 1 0,01 103 1
- 2 -
2.3. Los siguientes son conteos del número de cromosomas en una herbácea.
24 28 28 28 27 28 29 29 29 30
29 30 30 29 31 29 31 24 28 29
28 24 28 29 31 31 24 28 29 30
29 28 30 33 28 34 38 28 32 33
28 31 32 34 39 40 31 35 27 28
31 35 30 29 24 28 31 32 28 32
28 29 30 33 41 30 29 42 28 29
32 33 30 28 28 31 32 28 29 30
28 28 31 34 34 28 36 31 36 35
a) Construya una tabla de dos encabezados mostrando la frecuencia de cada conteo.
número de cromosomas frecuencia número de cromosomas frecuencia
24 5 34 4
25 0 35 3
26 0 36 2
27 2 37 0
28 23 38 1
29 15 39 1
30 10 40 1
31 11 41 1
32 6 42 1
33 4
b) Construya una tabla de frecuencias que le permita contestar las siguientes preguntas:
valor de la clase Frecuencia abs. Frecuencia rel. Frecuencia abs. acum. Frecuencia rel. acum.
24 5 0,06 5 0,06
25 0 0 5 0,06
26 0 0 5 0,06
27 2 0,02 7 0,08
28 23 0,26 30 0,33
29 15 0,17 45 0,5
30 10 0,11 55 0,61
31 11 0,12 66 0,73
32 6 0,07 72 0,8
33 4 0,04 76 0,84
34 4 0,04 80 0,89
35 3 0,03 83 0,92
36 2 0,02 85 0,94
37 0 0 85 0,94
38 1 0,01 86 0,96
39 1 0,01 87 0,97
40 1 0,01 88 0,98
41 1 0,01 89 0,99
42 1 0,01 90 1
1. ¿Qué porcentaje de células tienen 32 cromosomas o menos? De acuerdo con la frecuencia acumulada se obtiene que el 80% de las células tienen 32 cromosomas o menos
2. ¿Qué porcentaje de células tienen más de 28 cromosomas? De acuerdo con la frecuencia acumulada se obtiene que el 33.3% de las células tienen 28 cromosomas o menos, por lo tanto las células que tienen mas de 28 cromosomas es: 100 – 33.3 = 66.6%
- 3 -
3.1. En seguida se presenta el número de terremotos ocurridos en cada una de las horas lunares durante cierto tiempo.
hora lunar (y)
número de terremotos (x)
hora lunar
(y) número de terremotos
(x)
hora lunar (y)
número de terremotos (x)
0 7 9 2 18 5
1 2 10 0 19 9
2 3 11 5 20 2
3 5 12 3 21 2
4 8 13 4 22 5
5 5 14 5 23 2
6 8 15 9 24 7
7 6 16 9
8 1 17 6
Con estos datos evalúe:
a) =�=
25
1iix 120
b) =�=
25
1iiy 300
c) =�=
5
1iiy 10
d) =�=
25
19iiy 147
e) =�=
17
12iiy 81
f) ( ) =−�=
8
1
5
iiy 28-40 = -12
g) =−�=
8
1
5
iiy 28 – 5 = 23
h) =�=
25
1
82
iiy. 2.8(25) (300) = 21000
i) =�=
5
1
2
iix 151
j) =��
�
�
��
�
��=
25
1iix 25
2 = 625
k) =�=
ii
i yx8
4
162
l) =��
�
�
��
�
�
��
�
�
��
�
���==
8
4
8
4 ii
ii yx 27x22=594
3.2. Use la notación de sumatoria para abreviar las siguientes expresiones:
a) X8 + X9 + X10 + X11 =�=
11
8iix
b) X2 + X4 + X6 + X8 + X10 = ( )�=
5
1
2
iix
c) X1 + X22 + X3
3 + X4
4 + X5
5 + X6
6 =�
=
6
1i
iix
d) X1 + 2X2 + 3X3 + 4X4 =�=
⋅4
1iixi
e) 8X1 + 7X2 + 6X3 + 5X4 + 4X5 + 3X6 + 2X7 + 1X8 - X10 = ( )�=
−10
1
9
iixi
f) �=
=++++5
1
54321
5432 i
i
i
xxxxxx
- 4 -
3.3. Demuestre las siguientes propiedades:
a) ( ) ���===
+=+n
ii
n
ii
n
iii yxyx
111
( )
( ) ( ) ��
�
==
=
+=+++++++++
++++++++=+
n
ii
n
iinn
nn
n
iii
yxyyyyxxxx
yxyxyxyxyx
11
321321
332211
1
��
�
:forma la de ordenar puede Se
b) ( ) ��==
+=+n
ii
n
ii xgndgxd
11
( ) ( ) ( ) ( ) ( ) ( )
( ) �
�
=
=
+=++++=
++++++=++++++=+
n
iin
n
n
n
n
ii
xgndxxxgnd
gxgxgxdddgxdgxdgxdgxd
1
21
2121
1
�
��������
��
veces
3.4. el gerente de una tienda de auto servicio que permanecerá abierta de las 6 de la mañana a las 12 de la noche, cuenta un día el número de cliente que pasan por las cajas registradoras durante cada una de las 18 horas. Los resultados obtenidos son: 21, 45, 30, 48, 56, 77, 60, 59, 23, 42, 36, 49, 73, 96, 90, 71, 42, 23. Calcule media y mediana del número de clientes por hora. Mediana: (48+49) / 2 =48.5 Media: 52.27 3.5. Calcule media, moda y mediana del número de vehículos por minuto en el ejercicio 2.1. Localice estas medidas en el diagrama de puntos obtenidos en el ejercicio 2.6 y comente sobre su posición relativa.
Número de vehículos frecuencia Número de vehículos frecuencia
20 3 30 2
21 1 31 3
22 3 32 3
23 3 33 2
24 4 34 2
25 4 35 0
26 5 36 1
27 6 37 1
28 6 38 2
29 2 39 1
Mediana: 27
Moda: 27.5
Media: 27.8
Media > moda > mediana
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
- 5 -
3.12. Con los conteos de cromosomas del ejercicio 2.3 elaboramos la siguiente tabla e frecuencias:
Número de cromosomas por planta Frecuencia
(23,26] 5
(26,29] 40
(29,32] 27
(32,35] 11
(35,38] 3
(38,41] 3
(41,44] 1
a) Calcule media, mediana, varianza, desviación estándar y coeficiente de variación del número de cromosomas por
planta usando la tabla.
Intervalo Valor medio, Xi Frecuencia, ni xi ni xi2 ni (xi - x )
2 (xi - x )
2ni
(23-26] 24.5 5 122.5 3001.25 28.44 142.22 (26-29] 27.5 40 1100 30250 5.44 217.78 (29-32] 30.5 27 823.5 25116.75 0.44 12 (32-35] 33.5 11 368.50 12344.75 13.44 147.89 (35-38] 36.5 3 109.50 3996.75 44.44 133.33 (38-41] 39.5 3 118.50 4680.75 93.44 280.33 (41-44] 42.5 1 42.50 1806.25 160.44 160.44
�= 90 2685 81196.5 1094
• Media: cromosomas 29.890
2685===
�=
N
nx
x
N
iii
1
• Mediana: se encuentra entre el dato 45 y 46, por lo tanto: (27.5 + 30.5) / 2 = 29 cromosomas
• Varianza:
( ) ( )2
27
1
27
1
2
2
11cromosomas
N
xNnx
N
nxx
S iii
iii
12.29=−
−
=−
−
=
��==
• Desviación estándar: S = �S2 =
• Coeficiente de variación: 0.11729.8
3.48===
x
S.V.C
b) Calcule estas medidas en los datos individuales y compárelas.
Número de cromosomas frecuencia abs xi ni xi2 ni (xi - x )
2 (xi - x )
2ni
24 5 120 2880 40.25 201.26 25 0 0 0 28.56 0 26 0 0 0 18.87 0 27 2 54 1458 11.19 22.37 28 23 644 18032 5.5 126.42 29 15 435 12615 1.81 27.11 30 10 300 9000 0.12 1.19 31 11 341 10571 0.43 4.73 32 6 192 6144 2.74 16.45 33 4 132 4356 7.05 28.21 34 4 136 4624 13.36 53.45 35 3 105 3675 21.67 65.02 36 2 72 2592 31.99 63.97 37 0 0 0 44.3 0 38 1 38 1444 58.61 58.61 39 1 39 1521 74.92 74.92 40 1 40 1600 93.23 93.23 41 1 41 1681 113.54 113.54 42 1 42 1764 135.85 135.85
�= 90 2731 83957 1086.32
- 6 -
• Media: cromosomas 30.390
2731===
�=
N
nx
x
N
iii
1
• Mediana: se encuentra entre el dato 45 y 46, por lo tanto: (29 + 30) / 2 = 29.5 cromosomas
• Varianza:
( ) ( )2
27
1
27
1
2
2
11cromosomas
N
xNnx
N
nxx
S iii
iii
12.2=−
−
=−
−
=
��==
• Desviación estándar: S = �S2 =
• Coeficiente de variación: 0.11530.3
3.47===
x
S.V.C
Las diferencias observadas se deben al ancho elegido de los intervalos de clases. Se conoce cuantos datos existen en el intervalo pero no su distribución dentro de él, lo que lleva a errores en el cálculo de las medidas descriptivas. 3.14. En seguida se presentan los porcentajes de población y de inversión del gasto público del gobierno federal en cada una de las entidades federativas de la Republica Mexicana:
Entidad (X) (Y) Entidad (X) (Y) Entidad (X) (Y) Entidad (X) (Y)
Aguascalientes 0,7 0,5 Distrito Federal 14,2 29,8 Morelos 1,3 0,5 Sinaloa 2,6 8,2 B. California Norte 1,8 1,9 Durango 1,9 1,8 Nayarit 1,1 0,6 Sonora 2,3 2,5 B. California Sur 0,3 1 Guanajuato 4,7 2,1 Nuevo León 3,4 1,5 Tabasco 1,6 2,1
Campeche 0,5 1,2 Guerrero 3,3 2,9 Oaxaca 4,5 4,1 Tamaulipas 3 3,2 Chiapas 3,2 5,4 Hidalgo 2,5 1,2 Puebla 5,2 1,1 Tlaxcala 0,9 0,4
Chihuahua 3,3 4,8 Jalisco 6,8 3,1 Querétaro 1 1 Veracruz 7,9 3,6 Coahuila 2,3 2,3 México 7,9 3,3 Quintana Roo 0,2 1 Yucatán 1,6 1,2 Colima 0,5 0,8 Michoacán 4,8 3,6 S. Luis Potosí 2,7 2 Zacatecas 2 1,3
Para resolver se construye la siguiente tabla:
xi x (xi - x )2
yi Y (yi -Y )2
(xi - x ) (yi -Y )
Aguascalientes 0,7 3,125 5,88063 0,5 3,125 6,890625 6,365625 B. California Norte 1,8 3,125 1,75563 1,9 3,125 1,500625 1,623125 B. California Sur 0,3 3,125 7,98063 1 3,125 4,515625 6,003125
Campeche 0,5 3,125 6,89063 1,2 3,125 3,705625 5,053125 Chiapas 3,2 3,125 0,00563 5,4 3,125 5,175625 0,170625
Chihuahua 3,3 3,125 0,03063 4,8 3,125 2,805625 0,293125 Coahuila 2,3 3,125 0,68063 2,3 3,125 0,680625 0,680625 Colima 0,5 3,125 6,89063 0,8 3,125 5,405625 6,103125
Distrito Federal 14,2 3,125 122,656 29,8 3,125 711,5556 295,425625
Durango 1,9 3,125 1,50063 1,8 3,125 1,755625 1,623125 Guanajuato 4,7 3,125 2,48063 2,1 3,125 1,050625 -1,614375
Guerrero 3,3 3,125 0,03063 2,9 3,125 0,050625 -0,039375 Hidalgo 2,5 3,125 0,39062 1,2 3,125 3,705625 1,203125 Jalisco 6,8 3,125 13,5056 3,1 3,125 0,000625 -0,091875 México 7,9 3,125 22,8006 3,3 3,125 0,030625 0,835625
Michoacán 4,8 3,125 2,80563 3,6 3,125 0,225625 0,795625 Morelos 1,3 3,125 3,33063 0,5 3,125 6,890625 4,790625 Nayarit 1,1 3,125 4,10063 0,6 3,125 6,375625 5,113125
Nuevo León 3,4 3,125 0,07563 1,5 3,125 2,640625 -0,446875 Oaxaca 4,5 3,125 1,89063 4,1 3,125 0,950625 1,340625 Puebla 5,2 3,125 4,30563 1,1 3,125 4,100625 -4,201875
Querétaro 1 3,125 4,51563 1 3,125 4,515625 4,515625 Quintana Roo 0,2 3,125 8,55563 1 3,125 4,515625 6,215625 S. Luis Potosí 2,7 3,125 0,18062 2 3,125 1,265625 0,478125
Sinaloa 2,6 3,125 0,27562 8,2 3,125 25,75563 -2,664375 Sonora 2,3 3,125 0,68063 2,5 3,125 0,390625 0,515625
Tabasco 1,6 3,125 2,32563 2,1 3,125 1,050625 1,563125 Tamaulipas 3 3,125 0,01562 3,2 3,125 0,005625 -0,009375
Tlaxcala 0,9 3,125 4,95063 0,4 3,125 7,425625 6,063125 Veracruz 7,9 3,125 22,8006 3,6 3,125 0,225625 2,268125 Yucatán 1,6 3,125 2,32563 1,2 3,125 3,705625 2,935625
Zacatecas 2 3,125 1,26563 1,3 3,125 3,330625 2,053125
�= 100 257,88 100 822,20 354,96
- 7 -
a) Calcule x , Sx, y Sy, C.V. (x) y C.V. (y).
Al observar la naturaleza de los datos se decide hacer un análisis estadístico poblacional, debido a que se considera al 100% de la población mexicana y se requieren las medidas descriptivas de la población.
Para X Para Y
Promedio xµ =
32
100=
�=
N
xN
ii
1 = 3.125 yµ =
32
100=
�=
N
yN
ii
1 = 3.125
Varianza �y2 =
( )
32
257.88=
−�=
N
xN
ixi
1
2µ = 8.058 �y
2 =
( )
32
822.20=
−�=
N
yN
iyi
1
2µ = 26.522
Desviación estándar �X = 2
xσ = 2.838 �y = 2
Yσ = 5.15
Coeficiente de variación C.V.(X) = x
X
µ
σ = 0.908 C.V.(Y) =
y
Y
µ
σ = 1.648
b) Dibuje el diagrama de dispersión de datos y calcule SXY y rXY. Interprete el signo y la magnitud de rXY con la ayuda
de su diagrama.
0
5
10
15
20
25
30
0 2 4 6 8 10 12 14 16 % Población
% In
vers
ión
Covarianza: ( )( )
11.09332
354.96==
−−
=−=
��==
N
yx
N
yxN
iyixi
yx
N
iii
XY11
µµ
µµσ
Coeficiente de correlación:
( )( )0.758
5.152.838
11.093==
⋅=
YX
XYXYr
σσ
σ
Se puede observar claramente una tendencia directamente proporcional en el diagrama de dispersión, lo que queda demostrado con la magnitud y el signo del valor de rXY. El coeficiente de determinación es (rXY)
2 = 0.575; por lo tanto se puede afirmar que el 57.5% de la variación en el
porcentaje de inversión del gasto publico se debe a la variación en el porcentaje de la población nacional; lo que es bastante aceptable para suponer un comportamiento lineal.
- 8 -
c) Observe cuidadosamente su diagrama de dispersión. El punto (14.2, 29.8) corresponde al Distrito Federal, se aparta notablemente de la tendencia del resto de los datos. Elimine ese punto y repita los cálculos de los incisos a y b. Interprete los cambios en las medidas descriptivas. En particular observe la reducción en SY, C.V.(Y) y rXY.
Al eliminar el valor del D.F. se obtienen los siguientes valores:
n = 31 �yi = 70.2 �(yi -Y )2 = 87.69
�xi =85.8 �(xi - x )2 = 131.27 �(xi - x )(yi -Y ) = 244.3
Para X Para Y
Promedio x =
31
85.8=
�=
n
xn
ii
1 = 2.767 Y =
31
70.2=
�=
n
yn
ii
1 = 2.264
Varianza Sy2 =
( )
30
131.27=
−
−�=
1
1
2
n
xxn
ii
= 4.375 Sy2 =
( )
30
87.69=
−
−�=
1
1
2
n
yyn
ii
= 2.923
Desviación estándar Sy = 2
xS = 2.091 Sy = 2
YS = 1.709
Coeficiente de variación C.V.(X) = x
S X = 0.755 C.V.(Y) =
y
SY = 0.754
Covarianza: ( )( )
1.66630
50==
−
−−
=−
⋅⋅−
=
��==
11
11
n
yyxx
n
yxnyx
S
n
iii
n
iii
XY
Coeficiente de correlación:
( )( )0.466
1.7092.091
1.666==
⋅=
YX
XYXY
SS
Sr
El coeficiente de determinación es (rXY)
2 = 0.217; por lo tanto se puede afirmar que solo el 21.7% de la variación en el
porcentaje de inversión del gasto publico se debe a la variación en el porcentaje de la población nacional. Con esta información se descarta la posibilidad de que exista una correlación lineal, tal como se observa en la siguiente tabla de dispersión:
0
1
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6 7 8 % Población
% In
vers
ión
Se observa que al eliminar el valor del Distrito Federal: x9, y9 (14.2, 29.8) se disminuye notablemente su contribución en
la sumatoria de (yi -Y )2 con ello se trae la particular reducción de los valores de SY, C.V.(Y) y rXY.