PROBLEMAS E CUESTIÓNS DE ESTATÍSTICA DESCRIPTIVA
111...--- Estudiouse a distribución de albumina total circulante (en gramos) de 50 homes normais comprendido entre os 20 e os 30 anos, obténdose os seguintes resultados:
Albumina circulante (gr.)
99-109 109-119 119-129 129-139 139-159
Nº de homes 6 11 13 12 8
a) Calcula as medidas de centralización b) Fai unha representación gráfica axeitada c) Determina o valor partir do cal o 80% dos homes teñen niveis de albumina superiores? d) Se os niveis de albumina superan os 130 g é necesario introducir medicación. Que porcentaxe de
homes teñen que ser medicados? SOLUCIÓN:
Albumina circulante (gr.)
Nº de homes marca de clase Ni xi*ni
99-109 6 104 6 624
109-119 11 114 17 1254
119-129 13 674 30 8762
129-139 12 134 42 1608
139-159 8 149 50 1192 50 13440
a) MEDIA x 268,850
13440==
MODA Clase modal, a clase do valor que mais se repite 119 159, 12410·11131112
1213119 =
−+−
−+=oM
MEDIANA Clase mediana, a correspondente a frecuencia acumulada posterior a metade dos datos. 119-129
45,11410·13
1725
50
119 =
−
+=eM
b) Por ser unha variable en datos agrupados a representación gráfica axeitada é o histograma, pero neste
caso temos que ter coidado porque a amplitude dos intervalos de clase non é igual. Polo tanto,
deberemos representar no eixo OY a altura dos rectángulos que teñen por área a frecuencia absoluta.
Albumina circulante (gr.)
Nº de homes
hi hi*10 99-109 6 0,6 6
109-119 11 1,1 11 119-129 13 1,3 13 129-139 12 1,2 12 139-159 8 0,4 4
c) Pídenos o percentil 20. O método de cálculo é igual que a da mediana ou cuartis:
102,0*502,0* ==N polo tanto a clase do percentil 20 109-119
=−
+= 10*11
61010920P 112,636364
d) Se nos dixesen superan 129 gr. tomaríamos a suma das frecuencias correspondentes aos dous últimos intervalos de clase. Supomos que os homes están distribuídos de forma homoxénea ao longo dos intervalos e polo tanto:
Na clase 119-129 hai 12 individuos pola tanto: 8,10
9
12
10=⇒= x
x , é dicir: Porcentaxe total de
homes que necesitan medicación: (10,8+8)/50%6,37100·
50
88,10=
+
222...--- Para cada un dos seguintes casos indica: Cales son as variables que se relacionan, cal é o colectivo de
individuos que se estuda, Se se trata dunha relación funcional ou dunha relación estatística. e o signo da correlación. i) Entre os países do mundo: índice de mortalidade infantil ? número de médicos por cada 1 000 habitantes. ii) kW ? h consumidos en cada casa dunha cidade durante o mes de xaneiro ? custo do recibo da luz. iii) Custo do recibo da luz ? número de persoas que viven en cada casa. SOLUCIÓN:
Poboación Variable 1 Variable 2 Signo de ρxy
EXEMPLO 1 Poboación infantil
mundial Índice de mortalidade infantil
Nº de médicos por cada mil habitantes
-
EXEMPLO 2 Casas dunha cidade Kw/hora Costo recibo da luz +
EXEMPLO 3 Casas dunha cidade Costo do recibo de la luz
número de persoas que viven en cada casa.
+
333...--- Ordena de maior a menor as correlacións lineais das seguintes nubes de puntos
SOLUCIÓN:
0
2
4
6
8
10
12
14
99-109
109-119
119-129
129-139
139-159
Se a pendente da recta que se axusta a nube d puntos é negativa tamén o é a correlación lineal. Mais próxima a -1 canto mellor se axusta a nube de puntos a unha recta e mais próxima a cero canto pero sexa.
ρA< ρD< ρC< ρB 444...--- Responde ás seguintes preguntas:
a) calculamos a covarianza dunha certa distribución e resultou negativa. Xustifica por que podemos afirmar que, tanto o coeficiente de correlación como as pendentes das dúas rectas de regresión, son números negativos. b) Os datos {a, b, c} teñen de media 3 e de desviación típica 0. Áchaos. c) Unha mostra de 300 mozos ten de estatura media 170 cm con desviación típica de 8 cm; outra mostra das tallas de 300 mozas ten 168 cm e 7 cm de media e desviación típica, respectivamente. Cal das dúas mostras é menos dispersa? d) Completa a táboa obtida no recoñecemento médico a 100 alumnos dun Centro de Bacharelato, realizada por un dentista
N. º caries 0 1 2 3 4 n 25 20 X 15
f ... ... ... ... 0,05
SOLUCIÓN: a) Trátase simplemente de aplicar as fórmulas correspondente
��� ����
�����, o signo da covarianza é omesmoque o do coeficiente de correlación, xa que as
desviacións típicas, � � �, son sempre positivas
En canto as pendentes das rectas de regresión son:
2x
xy
s
s
2y
xy
s
s
, e polo tanto o razoamento anterior é válido. b) a=b=c=3 c) Teremos que utilizar o coeficiente de variación de Pearson, xa que se trata de dúas series con distinta media
CVmozos=170/8=21,25 CVmozas=168/7=24.
Polo tanto, é menos dispersa a serie de datos dos mozos. d)
N. º caries 0 1 2 3 4
ni 5 20 X 15 Y
fi Z. W A.. B. 0,05
Z=25/100=0,25 W=20/100=0,2 B=15/100=0,15
Y=0,05·100=5 X=100-(25+20+15+5)=35, polo tanto: A=0,35
555...--- Nunha zona dunha cidade tomouse unha mostra para estudar o número de habitacións de que dispón un piso e o de persoas que viven nel, obténdose estes datos:
a) Representa a nube de puntos.
b) Calcula e interpreta o coeficiente de correlación. c) Cantos cuartos espérase que teña un piso no que viven 7 persoas? SOLUCIÓN:
b)
x y xi*yi xi^2 yi^2
2 1 2 4 1
2 2 4 4 4
3 2 6 9 4
3 3 9 9 9
4 3 12 16 9
4 4 16 16 16
4 5 20 16 25
5 4 20 25 16
5 5 25 25 25
5 6 30 25 36
37 35 144 149 145
COEFICIENTE DE CORRELACIÓN
� ���
��� 3,7
�� �35
10� 3,5
�� �
149
10� �3,7�� � 1,21 � � 1,1
�� �
145
10� �3,5�� � 2,25 � � 1,5
�� �144
10� 3,7 � 3,5 � 1,45
� �1,45
1,1 � 1,5� 0,878
O coeficiente de correlación indica que existe unha relación estatística entre o número de cuartos dunha
vivenda e o número de persoas que nela habitan. Ademais a recta de regresión amosase como unha boa
representación desta dependencia.
c) Pídenos que estimemos o número de habitacións (X)dunha casa coñecendo o número de persoas que
nela viven(Y).
É dicir, temos que calcular a recta de regresión de X sobre Y x=a+by con ybxas
sb
y
xy−==
2
b=�,"#
�,�#� 0,64 % � 3,7 � 0,64 � 3,5=1,46 x=1,46+0,64·7=5,94
0
1
2
3
4
5
6
7
0 1 2 3 4 5 6
666...--- Nun grupo de participantes nun concurso, analizouse conxuntamente o tempo que dedicaron á preparación das probas, X (en horas) e a puntuación obtida, Y, obténdose os números da táboa adxunta
a) Calcula a puntuación media obtida polos concursantes que dedicaron máis de 25 horas á súa preparación. b) Se se estableceu un premio de 100 euros/punto, canto gañaron os concursantes, máis ou menos? SOLUCIÓN: a) Trátase dunha variable condicionada polo valor X>25. Os datos neste caso:
ni yi yi*ni
0 < Y ≤≤≤≤ 5 0 2,5 0
5 < Y ≤≤≤≤ 15 0 10 0
15 < Y ≤≤≤≤ 30 7 22,5 157,5
30 < Y ≤≤≤≤ 50 5 40 200
12 357,5
Puntuación media
&�/�#(�(���357,5
12� 29,79
b) Trátase de calcular a puntuación media marxinal dos concursantes e multiplícalo por 100
ni yi yi*ni
0 < Y ≤≤≤≤ 5 4 2,5 10
5 < Y ≤≤≤≤ 15 12 10 120
15 < Y ≤≤≤≤ 30 16 22,5 360
30 < Y ≤≤≤≤ 50 12 40 480
44 970
�� �970
44� 22,045
Polo tanto, a cuantía do premio medio 2204,5€
777...--- Estas tres distribucións teñen a mesma media. Cal é?
As súas desviacións típicas son 3,8; 1,3 e 2,9. Asocia a cada distribución un destes valores SOLUCIÓN:
A media das tres distribucións é 7. a) 2,9 b) 1,3 c) 3,8
0 < X ≤≤≤≤ 10 10 < X ≤≤≤≤ 15 15 < X ≤≤≤≤ 25 25 < X ≤≤≤≤ 30
0 < Y ≤≤≤≤ 5 2 2 0 0 5 < Y ≤≤≤≤ 15 2 5 5 0
15 < Y ≤≤≤≤ 30 0 1 5 7 30 < Y ≤≤≤≤ 50 0 0 2 5