Exercicio estatistica descritiva

5
PROBLEMAS E CUESTIÓNS DE ESTATÍSTICA DESCRIPTIVA 1 1 . . - - Estudiouse a distribución de albumina total circulante (en gramos) de 50 homes normais comprendido entre os 20 e os 30 anos, obténdose os seguintes resultados: Albumina circulante (gr.) 99-109 109-119 119-129 129-139 139-159 Nº de homes 6 11 13 12 8 a) Calcula as medidas de centralización b) Fai unha representación gráfica axeitada c) Determina o valor partir do cal o 80% dos homes teñen niveis de albumina superiores? d) Se os niveis de albumina superan os 130 g é necesario introducir medicación. Que porcentaxe de homes teñen que ser medicados? SOLUCIÓN: Albumina circulante (gr.) Nº de homes marca de clase Ni xi*ni 99-109 6 104 6 624 109-119 11 114 17 1254 119-129 13 674 30 8762 129-139 12 134 42 1608 139-159 8 149 50 1192 50 13440 a) MEDIA x 268,8 50 13440 = = MODA Clase modal, a clase do valor que mais se repite 119 159, 124 10 · 11 13 11 12 12 13 119 = - + - - + = o M MEDIANA Clase mediana, a correspondente a frecuencia acumulada posterior a metade dos datos. 119-129 45 , 114 10 · 13 17 25 50 119 = - + = e M b) Por ser unha variable en datos agrupados a representación gráfica axeitada é o histograma, pero neste caso temos que ter coidado porque a amplitude dos intervalos de clase non é igual. Polo tanto, deberemos representar no eixo OY a altura dos rectángulos que teñen por área a frecuencia absoluta. Albumina circulante (gr.) Nº de homes hi hi*10 99-109 6 0,6 6 109-119 11 1,1 11 119-129 13 1,3 13 129-139 12 1,2 12 139-159 8 0,4 4

Transcript of Exercicio estatistica descritiva

Page 1: Exercicio  estatistica descritiva

PROBLEMAS E CUESTIÓNS DE ESTATÍSTICA DESCRIPTIVA

111...--- Estudiouse a distribución de albumina total circulante (en gramos) de 50 homes normais comprendido entre os 20 e os 30 anos, obténdose os seguintes resultados:

Albumina circulante (gr.)

99-109 109-119 119-129 129-139 139-159

Nº de homes 6 11 13 12 8

a) Calcula as medidas de centralización b) Fai unha representación gráfica axeitada c) Determina o valor partir do cal o 80% dos homes teñen niveis de albumina superiores? d) Se os niveis de albumina superan os 130 g é necesario introducir medicación. Que porcentaxe de

homes teñen que ser medicados? SOLUCIÓN:

Albumina circulante (gr.)

Nº de homes marca de clase Ni xi*ni

99-109 6 104 6 624

109-119 11 114 17 1254

119-129 13 674 30 8762

129-139 12 134 42 1608

139-159 8 149 50 1192 50 13440

a) MEDIA x 268,850

13440==

MODA Clase modal, a clase do valor que mais se repite 119 159, 12410·11131112

1213119 =

−+−

−+=oM

MEDIANA Clase mediana, a correspondente a frecuencia acumulada posterior a metade dos datos. 119-129

45,11410·13

1725

50

119 =

+=eM

b) Por ser unha variable en datos agrupados a representación gráfica axeitada é o histograma, pero neste

caso temos que ter coidado porque a amplitude dos intervalos de clase non é igual. Polo tanto,

deberemos representar no eixo OY a altura dos rectángulos que teñen por área a frecuencia absoluta.

Albumina circulante (gr.)

Nº de homes

hi hi*10 99-109 6 0,6 6

109-119 11 1,1 11 119-129 13 1,3 13 129-139 12 1,2 12 139-159 8 0,4 4

Page 2: Exercicio  estatistica descritiva

c) Pídenos o percentil 20. O método de cálculo é igual que a da mediana ou cuartis:

102,0*502,0* ==N polo tanto a clase do percentil 20 109-119

=−

+= 10*11

61010920P 112,636364

d) Se nos dixesen superan 129 gr. tomaríamos a suma das frecuencias correspondentes aos dous últimos intervalos de clase. Supomos que os homes están distribuídos de forma homoxénea ao longo dos intervalos e polo tanto:

Na clase 119-129 hai 12 individuos pola tanto: 8,10

9

12

10=⇒= x

x , é dicir: Porcentaxe total de

homes que necesitan medicación: (10,8+8)/50%6,37100·

50

88,10=

+

222...--- Para cada un dos seguintes casos indica: Cales son as variables que se relacionan, cal é o colectivo de

individuos que se estuda, Se se trata dunha relación funcional ou dunha relación estatística. e o signo da correlación. i) Entre os países do mundo: índice de mortalidade infantil ? número de médicos por cada 1 000 habitantes. ii) kW ? h consumidos en cada casa dunha cidade durante o mes de xaneiro ? custo do recibo da luz. iii) Custo do recibo da luz ? número de persoas que viven en cada casa. SOLUCIÓN:

Poboación Variable 1 Variable 2 Signo de ρxy

EXEMPLO 1 Poboación infantil

mundial Índice de mortalidade infantil

Nº de médicos por cada mil habitantes

-

EXEMPLO 2 Casas dunha cidade Kw/hora Costo recibo da luz +

EXEMPLO 3 Casas dunha cidade Costo do recibo de la luz

número de persoas que viven en cada casa.

+

333...--- Ordena de maior a menor as correlacións lineais das seguintes nubes de puntos

SOLUCIÓN:

0

2

4

6

8

10

12

14

99-109

109-119

119-129

129-139

139-159

Page 3: Exercicio  estatistica descritiva

Se a pendente da recta que se axusta a nube d puntos é negativa tamén o é a correlación lineal. Mais próxima a -1 canto mellor se axusta a nube de puntos a unha recta e mais próxima a cero canto pero sexa.

ρA< ρD< ρC< ρB 444...--- Responde ás seguintes preguntas:

a) calculamos a covarianza dunha certa distribución e resultou negativa. Xustifica por que podemos afirmar que, tanto o coeficiente de correlación como as pendentes das dúas rectas de regresión, son números negativos. b) Os datos {a, b, c} teñen de media 3 e de desviación típica 0. Áchaos. c) Unha mostra de 300 mozos ten de estatura media 170 cm con desviación típica de 8 cm; outra mostra das tallas de 300 mozas ten 168 cm e 7 cm de media e desviación típica, respectivamente. Cal das dúas mostras é menos dispersa? d) Completa a táboa obtida no recoñecemento médico a 100 alumnos dun Centro de Bacharelato, realizada por un dentista

N. º caries 0 1 2 3 4 n 25 20 X 15

f ... ... ... ... 0,05

SOLUCIÓN: a) Trátase simplemente de aplicar as fórmulas correspondente

��� ����

�����, o signo da covarianza é omesmoque o do coeficiente de correlación, xa que as

desviacións típicas, � � �, son sempre positivas

En canto as pendentes das rectas de regresión son:

2x

xy

s

s

2y

xy

s

s

, e polo tanto o razoamento anterior é válido. b) a=b=c=3 c) Teremos que utilizar o coeficiente de variación de Pearson, xa que se trata de dúas series con distinta media

CVmozos=170/8=21,25 CVmozas=168/7=24.

Polo tanto, é menos dispersa a serie de datos dos mozos. d)

N. º caries 0 1 2 3 4

ni 5 20 X 15 Y

fi Z. W A.. B. 0,05

Z=25/100=0,25 W=20/100=0,2 B=15/100=0,15

Y=0,05·100=5 X=100-(25+20+15+5)=35, polo tanto: A=0,35

555...--- Nunha zona dunha cidade tomouse unha mostra para estudar o número de habitacións de que dispón un piso e o de persoas que viven nel, obténdose estes datos:

a) Representa a nube de puntos.

Page 4: Exercicio  estatistica descritiva

b) Calcula e interpreta o coeficiente de correlación. c) Cantos cuartos espérase que teña un piso no que viven 7 persoas? SOLUCIÓN:

b)

x y xi*yi xi^2 yi^2

2 1 2 4 1

2 2 4 4 4

3 2 6 9 4

3 3 9 9 9

4 3 12 16 9

4 4 16 16 16

4 5 20 16 25

5 4 20 25 16

5 5 25 25 25

5 6 30 25 36

37 35 144 149 145

COEFICIENTE DE CORRELACIÓN

� ���

��� 3,7

�� �35

10� 3,5

�� �

149

10� �3,7�� � 1,21 � � 1,1

�� �

145

10� �3,5�� � 2,25 � � 1,5

�� �144

10� 3,7 � 3,5 � 1,45

� �1,45

1,1 � 1,5� 0,878

O coeficiente de correlación indica que existe unha relación estatística entre o número de cuartos dunha

vivenda e o número de persoas que nela habitan. Ademais a recta de regresión amosase como unha boa

representación desta dependencia.

c) Pídenos que estimemos o número de habitacións (X)dunha casa coñecendo o número de persoas que

nela viven(Y).

É dicir, temos que calcular a recta de regresión de X sobre Y x=a+by con ybxas

sb

y

xy−==

2

b=�,"#

�,�#� 0,64 % � 3,7 � 0,64 � 3,5=1,46 x=1,46+0,64·7=5,94

0

1

2

3

4

5

6

7

0 1 2 3 4 5 6

Page 5: Exercicio  estatistica descritiva

666...--- Nun grupo de participantes nun concurso, analizouse conxuntamente o tempo que dedicaron á preparación das probas, X (en horas) e a puntuación obtida, Y, obténdose os números da táboa adxunta

a) Calcula a puntuación media obtida polos concursantes que dedicaron máis de 25 horas á súa preparación. b) Se se estableceu un premio de 100 euros/punto, canto gañaron os concursantes, máis ou menos? SOLUCIÓN: a) Trátase dunha variable condicionada polo valor X>25. Os datos neste caso:

ni yi yi*ni

0 < Y ≤≤≤≤ 5 0 2,5 0

5 < Y ≤≤≤≤ 15 0 10 0

15 < Y ≤≤≤≤ 30 7 22,5 157,5

30 < Y ≤≤≤≤ 50 5 40 200

12 357,5

Puntuación media

&�/�#(�(���357,5

12� 29,79

b) Trátase de calcular a puntuación media marxinal dos concursantes e multiplícalo por 100

ni yi yi*ni

0 < Y ≤≤≤≤ 5 4 2,5 10

5 < Y ≤≤≤≤ 15 12 10 120

15 < Y ≤≤≤≤ 30 16 22,5 360

30 < Y ≤≤≤≤ 50 12 40 480

44 970

�� �970

44� 22,045

Polo tanto, a cuantía do premio medio 2204,5€

777...--- Estas tres distribucións teñen a mesma media. Cal é?

As súas desviacións típicas son 3,8; 1,3 e 2,9. Asocia a cada distribución un destes valores SOLUCIÓN:

A media das tres distribucións é 7. a) 2,9 b) 1,3 c) 3,8

0 < X ≤≤≤≤ 10 10 < X ≤≤≤≤ 15 15 < X ≤≤≤≤ 25 25 < X ≤≤≤≤ 30

0 < Y ≤≤≤≤ 5 2 2 0 0 5 < Y ≤≤≤≤ 15 2 5 5 0

15 < Y ≤≤≤≤ 30 0 1 5 7 30 < Y ≤≤≤≤ 50 0 0 2 5