Joan Carles Martori ([email protected]) · 2013. 11. 20. · S'observa que la distribució d'edats...

26
Psicologia Departament de Psicologia . Psicometria Tema 2. Distribucions unidimensionals Joan Carles Martori ([email protected])

Transcript of Joan Carles Martori ([email protected]) · 2013. 11. 20. · S'observa que la distribució d'edats...

Page 1: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

Psicologia

Departament de Psicologia

.

Psicometria

Tema 2. Distribucions unidimensionals

Joan Carles Martori ([email protected])

Page 2: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 2 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Introducció

En aquest Tema estudiarem el tractament de les dades unidimensionals, és ad ir el

trctament d’una sola variable.

En primer lloc veurem diferens maneres de presentar les dades, en forma de taula o en

forma de gràfic.

En segon lloc veurem els principals instruments per resumir i descirure el comporatmet de

la variable.

Page 3: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 3 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Continguts

Tema 2. Distribucions Unidimensionals

2.1. Distribució de freqüències

Freqüència absoluta d’un valor xi : és el nombre de vegades que és repeteix cada valor

de la variable xi i es simbolitza per ni

n1 + n2 + n3 + ... + nn = N ( Nombre total d’observacions)

Nnn

ii

1

Freqüència relativa d’un valor xi : és igual a la freqüència absoluta dividit pel nombre total

d’observacions, es simbolitza per fi

f1 + f2 + f3 + ... + fn = 1

11

n

iif ;

N

nf i

i

Freqüència absoluta acumulada d’un valor xi : és la suma de les freqüències absolutes

dels valors anteriors i igual al valor considerat; es simbolitza per Ni

Ni = n1 + n2 +n3 + ... + ni

Nn = N

Freqüència relativa acumulada d’un valor xi : és la suma de les freqüències relatives

dels valors anteriors i igual al valor considerat; es simbolitza per Fi

Fi = f1 + f2 +f3 + ... + fi

Fn = 1

N

NF i

i

Page 4: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 4 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Exemple:

El sou mensual de 20 persones és el següent:

Sou € (xi) ni fi Ni Fi

700

800

1000

1200

1300

2000

4

3

4

6

2

1

0,2

0,15

0,2

0,3

0,1

0,05

4

7

11

17

19

20

0,2

0,35

0,55

0,85

0,95

1

N = 20 1

2.2. Tipus de distribucions estadístiques

Distribucions tipus I: Es dóna quan hi ha pocs valors de la variable i no es repeteixen.

Exemple: Edat dels fills d’una parella ( sempre que no hi hagin bessons o trigèmins)

Distribucions tipus II: Es dóna quan hi ha pocs valors de la variable però es repeteixen.

Exemple: Un comerciant ha venut 200 camises de les talles 38, 39, 40 i 41, corresponent a

cada talla una venda de 40, 60, 75 i 25 peces.

Distribucions tipus III: Es dóna quan hi ha molts valors de la variable i es repeteixen. Al tenir

molts valors s’agrupen en intervals d’igual o diferent amplitud. El punt mig de cada interval

s’anomena marca de classe i es representa per “ci” , així transformem una distribució tipus

III en una distribució tipus II.

2

1 iii

LLc

; ai = amplitud de l’interval = 1 ii LL

On 1iL és el valor mínim de l’interval

iL és el valor màxim de l’interval

Exemple: les puntuacions en un test de 1.000 persones

Page 5: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 5 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Li-1 - Li ni ci fi Ni Fi

10-12

12-14

14-16

16-18

18-20

20-22

22-24

24-26

26-28

28-30

12

18

91

182

239

321

97

25

9

6

11

13

15

17

19

21

23

25

27

29

0,012

0,018

0,091

.

.

.

.

.

.

.

12

30

121

.

.

.

.

.

.

.

0,012

0,03

0,121

.

.

.

.

.

.

.

N = 1.000 1

2.3. Representacions gràfiques

Les representacions gràfiques més usuals són:

Si la variable té caràcter quantitatiu:

Diagrama de barres.

Histograma.

Gràfic de Caixa i bigotis.

Si la variable té caràcter qualitatiu:

Sector circular.

Gràfica de barres.

Page 6: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 6 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Diagrama de barres: en uns eixos de coordenades col·loquem les valors de la variable en

l’eix d’abscisses i en el d’ordenades les freqüències.

Exemple:

Xi ni

18

19

20

22

10

5

15

7

N = 37

Edats des alumnes

0

2

4

6

8

10

12

14

16

18 19 20 22

Edat

Fre

èn

cia

Histograma: S’utilitza en distribucions estadístiques del tipus III; és a dir distribucions en

intervals. Diferenciem dos tipus:

a) Si les amplituds dels intervals són constants, dibuixarem rectangles de base igual a

l’amplitud i alçada igual a la freqüència. Exemple:

Page 7: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 7 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Li-1 - Li ni

3-5

5-7

7-9

9-11

11-13

2

3

5

6

3

xi

1210864

Fre

cu

en

cia

6

5

4

3

2

1

0

Casos ponderados por ni

Media =8,53Desviación típica =2,48

N =19

b) Si les amplituds dels intervals són diferents, es dibuixen rectangles de base igual a

l’amplitud i l’alçada serà

i

ii

a

nh . D’aquesta manera les àrees seran igual a les

freqüències. Exemple:

Page 8: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 8 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Li-1 - Li ni ai hi

3-7

7-11

11-21

21-24

3

5

7

4

4

4

10

3

0,75

1,25

0,7

1,3

Gràfic de Caixa i bigotis

Tipus de gràfic, basat en els quartils, amb informació sobre la dispersió de la distribució, la

simetria i especialment sensible en detectar casos extrems o atípics (valors estremadament

alts o baixos respecte els valors centrals, que poden distorsionar l’anàlisi). Consisteix en

una caixa rectangular central (que mostra el 50% de les dades), amb uns bigotis ( o

patilles) que indiquen la dispersió de la distribució. Tipus de gràfic molt útil per comparar

diferents distribucions.

Exemple 1: en una enquesta feta a 105 famílies, el diagrama de caixa i bigotis del nombre

de fills per família té la següent expressió:

10 5N =

Nombre de fills

7

6

5

4

3

2

1

0

-1

5

6

7

S'observa que la distribució és asimètrica a l'esquerra en la seva part central. A més, es

considera atípica un família que tingui 4 fills, i molt atípica, una família amb 5 o 6 fills.

Exemple 2. En el següent gràfic s'analitza l'edat dels 1847 votants en unes eleccions

municipals en funció del sexe i les preferències per un dels dos candidats a alcalde.

Page 9: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 9 Grau de Psicologia

Tema 2. Distribucions unidimensionals

12 767 7 47 856 5N =

VOT

Candidat BCandidat A

ED

AT

100

80

60

40

20

0

SEXE

dona

home

17 1512 62

12 2515 3818 331 110 9224 126 999 1

21 7

S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i

els homes. En canvi, en els votants del candidat A, els homes són, en general, més grans

que les dones. També s'observa que els votants del candidat B tenen, clarament, més edat

que els votants del candidat A. El 75% dels votants del candidat B supera els 50 anys

d'edat i, a més, els votants de 20 anys es consideren atípics.

Sector Circular. És un cercle dividit en sectors on cada sector representa el

percentatge del total que correspon a cada atribut. Exemple: companyies utilitzades

per un individu en 30 vitages.

Companyia ni

Lufthansa

Alitalia

Air-France

Iberia

8

3

7

12

Page 10: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 10 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Venda de bitllets d'avió

Lufthansa

27%

Iberia

40%

Air-France

23%

Alitalia

10%

Gràfica de barres.

Exemple: Comarca de procedència dels estudiants de primer curs:

Procedència ni

Osona

Com.properes Os.

Barcelonès

Altres

10

30

42

15

Procedència dels estudiants

0 10 20 30 40 50

Osona

Barcelonès

Com.properes

Osona

Altres

Page 11: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 11 Grau de Psicologia

Tema 2. Distribucions unidimensionals

2.4. Mesures de posició o tendència Central

Ara veurem una sèrie de mesures que consisteixen en substituir la taula estadística per uns

nombres que mesuren les característiques més importants de la distribució. Aquestes

mesures són:

Mitjana aritmètica.

Mediana.

Moda

Mitjana aritmètica ( X ): es defineix com la suma de tots els valors de la

distribució dividida pel nombre total d’observacions.

N

x

X

n

i

i 1

Si hi ha freqüències: N

nx

X

n

i

ii 1

*

Si treballem amb intervals: N

nc

X

n

i

ii 1

*

Exemples: Edat dels pacients:

xi ni xi ni

18

20

22

23

10

15

20

7

180

300

440

161

N = 52 1081

anysanysX 2178,2052

1081

Page 12: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 12 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Hores d’estudi setmanal dels alumnes:

Li-1 - Li ni ci ci ni

3-5

5-9

9-11

11-13

13-15

3

5

10

4

2

4

7

10

12

14

12

35

100

48

28

N = 24 223

horesX 29,924

223

Propietats de la mitjana aritmètica:

1. La suma de les desviacions dels valors de la variable respecte de la mitjana és zero.

0).(1

i

n

i

i nxx

2. Si a tots els valors de la distribució els hi sumem ( o restem) una constant k, aleshores la

mitjana resultant serà la suma ( o la resta) de la mitjana inicial més la constant k.

( xi , ni ) x

( x’i , ni ) = ( xi + k, ni ) kxx '

3. Si tots els valors de la variable els multipliquem ( o dividim) per una constant k, la nova

mitjana quedarà multiplicada ( o dividida) per aquesta constant

( xi , ni ) x

( x’i , ni ) = ( xi . k, ni ) kxx .'

Observació: quan existeixen un o varis valors clarament alts o baixos respecte de la resta, la

mitjana aritmètica s’altera molt i perd representativitat; és molt sensible als valors extrems. En

aquest cas és millor utilitzar la mediana, que veurem més endavant.

Page 13: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 13 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Mitjana aritmètica ponderada: Quan tots els valors de la variable no tenen la mateixa

importància, la mitjana aritmètica es calcula multiplicant a cada valor de la variable per un factor (

pes) que es representa per wi.

n

i

i

n

i

ii

w

wx

X

1

1

*

Exemple: Notes dels exàmens:

xi : 6,5,7,3,6 25,5x

wi : 1,2,2,2,1

Mediana: (Me ) : és aquell valor de la distribució (ordenada sempre de menor a major) que deixa a

la seva esquerra i a la seva dreta el mateix nombre de freqüències, és a dir el valor que ocupa el

lloc central, suposant un nombre parell de dades. Si el nombre de dades és parell la mediana és la

mitjana aritmètica dels dos valors centrals.

Exemples:

1. xi : 2,5,,6,8,11,15,18 Me = 8

2. xi : 2,5,,6,8,11,15 Me = (6+8 ) / 2 = 7

Si treballem amb freqüències la Me serà aquell valor x tal que N 2

N però, si N =

2

N

aleshores la Me serà: Me = 2

1 ii xx

Page 14: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 14 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Exemples:

xi ni Ni

3

4

5

6

10

6

4

8

10

16

20

28

Me = 4

N = 28

xi ni Ni

2

3

4

5

6

5

3

2

6

4

5

8

10

16

20

Me = 4,5

N = 20

En una distribució tipus III la Mediana serà:

i

i

ii a

n

NNLMe *

2/ 11

on Li-1 és el primer interval tal que Ni> N/2

Page 15: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 15 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Li-1 - Li ni Ni

15-20

20-25

25-35

35-50

50-65

65-100

3

5

7

10

12

16

3

8

15

25

37

53

N = 53

Me = 51,875

Moda: ( Mo ) : és el valor de la variable que és repeteix més vegades, és a dir, aquell valor de

més freqüència. En una distribució tipus I no hi ha Moda. En una distribució hi pot haver més

d’una moda ( bimodal, trimodal....)

xi ni

1

2

5

7

3

7

4

2

Mo = 2

Per calcular la Mo en distribucions tipus III hem de diferenciar:

Si els intervals són d’amplitud constant: La Mo es trobarà en l’interval de màxima

freqüència.

i

ii

i

i ann

nLMo *

11

1

1

Page 16: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 16 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Si els intervals són d’amplitud diferent: La Mo es trobarà en l’interval de màxima altura (

i

ii

a

nh )

i

ii

i

i ahh

hLMo *

11

1

1

Exemples:

Li-1 - Li ni

0-25

25-50

50-75

75-100

20

40

100

60

Mo = 65

Li-1 - Li ni ai hi

0-25

25-50

50-100

100-150

150-200

20

140

180

40

20

25

25

50

50

50

0,8

5,6

3,6

0,8

0,4

Mo = 45,45

Page 17: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 17 Grau de Psicologia

Tema 2. Distribucions unidimensionals

2.5. Mesures de posició no centrades

Són mesures de posició semblants a la mediana però que divideixen la distribució amb més

de dues parts iguals.

Quartils ( Qr)

Decils (Dr )

Centils o Percentils ( Cr )

Quartils : Són tres valors que divideixen la distribució en 4 parts iguals.

Si treballem sense intervals:

Q1 és el valor xi tal que 4

NN i

Q2 és el valor xi tal que 2

NN i

Q3 és el valor xi tal que 4

3NN i

Si treballem amb intervals:

i

i

ii a

n

NNrLQr *

4/* 11

r : 1, 2,3

on 1iL és l’interval tal que Ni > r*N/4

Decils: Són 9 valors que divideixen la distribució en 10 parts iguals, és a dir, en 10 intervals

estan inclosos el 10% dels valors de la distribució:

Si treballem sense intervals:

D1 és el valor xi tal que 10

NN i

D2 és el valor xi tal que 10

2NN i

D9 és el valor xi tal que 10

9NN i

Si treballem amb intervals:

i

i

ii a

n

NNrLDr *

10/* 11

r : 1,2......9

on 1iL és l’interval tal que Ni > r*N/10

Centils o Percentils: Són aquells valors de la distribució que la divideixen en 100 parts iguals,

per tant, hi haurà 99 centils.

Page 18: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 18 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Si treballem sense intervals:

C1 és el valor xi tal que 100

NN i

C2 és el valor xi tal que 100

2NN i

C99 és el valor xi tal que 100

99NN i

Si treballem amb intervals:

i

i

ii a

n

NNrLCr *

100/* 11

r : 1,2......99

on 1iL és l’interval tal que Ni > r*N/100

2.6. Mesures de dispersió

Les mesures de dispersió tracten de mesurar quina és la variabilitat de les dades respecte

la mesura de posició central que les representa. A més dispersió menys representativitat de

la mesura de posició central. Aquestes mesures poden ser:

Absolutes: Depenen de les unitats de mesura:

Recorregut

Rang interquartil

Variància

Desviació tipus (tipica o estàndard)

Relatives: estan definides per un quocient i no depenen de les unitats de mesura

Coeficient de variació de Pearson

Recorregut ( R) : és la diferència entre el valor més gran i més petit de la distribució,

R = xn – x1

Rang Interquartil (IQR) : ens expressa la diferència entre els valors extrems del 50% de

les dades.

IQR = Q3 – Q1

Variància: (Sx2 ) :és la mitjana aritmètica dels quadrats de les desviacions dels valors de

la distribució respecte de la mitjana aritmètica.

Page 19: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 19 Grau de Psicologia

Tema 2. Distribucions unidimensionals

21

2

2

*

XN

nx

S

n

i

ii

Desviació tipus ( Sx ) : és l’arrel quadrada de la variància

2SS

Propietats de la variància i la desviació tipus

1. La variància mai pot ser negativa.

2. Si sumem ( o restem) una constant a tots els valors de la distribució ni la variància ni

la desviació tipus varien.

( xi , ni ) xx SS ,2 '22

xx SS

( x’i , ni ) = ( xi + k, ni ) ','2

xx SS 'xx SS

3. Si tots els valors de la variable els multipliquem per una constant k, la nova variància

quedarà multiplicada pel quadrat d’aquesta constant i la desviació típica només

multiplicada per la constant.

( xi , ni ) xx SS ,2 222 .' xx SkS

( x’i , ni ) = ( xi. .k, ni ) ','2

xx SS xx SkS .'

Coeficient de Variació de Pearson (Vx ) : Per resoldre el problema de comparació de

mitjanes aritmètiques de dues distribucions que poden ser en unitats diferents i en les que

les mitjanes no siguin iguals, s’utilitza el coeficient de Variació de Pearson.

Vx : és el quocient entre la desviació tipus i la mitjana aritmètica, expressat en percentatge.

100*X

SV Si Vx=0 No hi ha dispersió

Vx més baix Menys dispersió Mitjana més representativa

Vx més alt Més dispersió Mitjana menys representativa

Page 20: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 20 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Exercicis

1. Les edats de 80 alumnes de 1er curs d'una universitat són:

18 19 20 18 19 20 18 21 19 23 24 25 22 18 19 20 29 21 20 18 20 20 18 19 19 19 22 21 22 21 19 19 19 19 20 18 18 19 22 30 21 20 19 19 18 19 21 20 18 19 19 20 20 21 22 19 28 19 22 23 24 23 21 20 21 24 27 23 21 19 20 25 22 24 23 19 18 22 21 25

Construïu una taula de freqüències i contesteu les següents preguntes:

a) Quants alumnes tenen més de 20 anys? b) Quants alumnes tenen entre 19 i 21 anys? c) Quin percentatge d'alumnes té 18 anys? d) Quin percentatge d'alumnes té menys de 22 anys? e) Quin percentatge d'alumnes supera els 25 anys?

2. Els pesos en quilograms de cadascun dels alumnes de l'exercici anterior són:

59 47 61 60 56 61 53 53 56 74 71 67 60 57 53 61 71 65 51 62 56 62 52 68 67 53 63 60 61 54 58 64 64 61 66 60 66 48 69 76 73 63 61 73 65 57 72 63 67 60 69 65 67 72 69 68 76 68 71 71 72 66 72 61 65 81 71 75 65 68 60 70 63 68 65 65 71 62 71 70

Agrupeu les dades en intervals d'una amplitud de 5 quilograms, començant pel valor

45, i construïu la taula de freqüències. Dibuixeu l'histograma de freqüències. Si els 40

primers alumnes són dones i els 40 restants homes, dibuixeu l'histograma per a cada

grup. Que s'observa clarament?

3. Les qualificacions obtingudes en l'assignatura d'estadística han estat:

A N N S E NP NP N S N N A S S A E

A E N S S A NP NP NP A A N E N N N

A S A E NP E A N S S A A A A N S

S A A N NP E S E A N N A N A S S

S A A N A NP NP A A A A NP N NP NP A

Representeu gràficament aquesta informació. Determineu quin és el percentatge de no

presentats (NP), de suspensos (S), i dels que varen superar l’examen (A,N,E).

4. En la següent taula de freqüències completeu la informació que hi falta tenint en compte que l'extrem final de cada interval coincideix amb l'inici del següent:

Page 21: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 21 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Li-1 - Li ni Ni fi Fi ai ci hi

0,25 2

3- 17 0,425 4

16 4

40 11

5. Calculeu la mitjana, la mediana, la moda, els quartils i la desviació típica de les dades dels exercicis 1 i 2.

6. La distribució d’edats en una unitat hospitalària al llarg de l’últim any ha estat la següent:

Edats

Nº de dies

0-3 3-6 6-9

9-12 12-15 15-18 18-21

92 26 25 19 15 35 83

Trobeu la mitjana aritmètica, mediana, moda i percentil 80, interpretant el significat de cadascun dels valors obtinguts.

7. El nombre d'unitats d'un determinat producte adquirides anualment per 110 consumidors entrevistats es distribueix de la manera següent:

Nombre d'unitats

Nombre de Consumidors

20-30 30-40 40-50 50-60

60-100

25 20 35 15 15

a) Quin és el nombre mínim d'unitats adquirides pel 25% de consumidors que més unitats adquireixen?

b) Quin és el nombre màxim d'unitats adquirides pel 15% de consumidors que menys unitats adquireixen?

c) Quin és el nombre d'unitats anuals que amb més freqüència s'ha adquirit per els consumidors?

Page 22: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 22 Grau de Psicologia

Tema 2. Distribucions unidimensionals

8. Trobeu la mediana de les següents dades:

4,1, 5,4, 2,3, 3,8, 1,4, 6,6, 3,2, 1,9, 2,5, 7,1, 3,3, 4,2, 6,1, 4,9, 2, 5,1

a) Sumeu 10 a cada observació i torneu a calcular la mediana. Què observeu? b) Multipliqueu per 10 totes les dades originals i torneu a calcular la mediana. Què

observeu? c) Afegiu una observació amb valor 20 a les dades originals i torneu a calcular la

mediana. Ha canviat gaire? I si a més, hi afegim una observació amb valor 30?

9. En un estudi social estem analitzant com està organitzada una empresa que té 2 factories. Les seves distribucions de salaris són:

Salaris (€ / mes)

Factoria A (nombre de treballadors)

Factoria B (nombre de treballadors)

600-800 800-1000

1000-1200 1200-1400

5 13 15 7

2 10 8 5

a) Quina factoria té un salari mitjà més representatiu? b) Quin és el salari mínim que cobren els treballadors de la factoria A, per a

considerar-se entre el 20% que més cobren?

10. Les distribucions de les puntuacions en una prova psicotècnica que es va fer als executius d'una important companyia telefònica van ser:

Filial Nord-americana

Puntuacions 20 30 40 50 60

Nombre d'executius

5 15 10 5 5

Filial Europea

Puntuacions 40 50 60 70 80

Nombre d'executius

5 15 10 5 5

a) Quina de les dues distribucions presenta menys dispersió absoluta al voltant de la mitjana?

b) Quina de les dues distribucions presenta menys dispersió relativa al voltant de la mitjana?

11. En una enquesta feta a 215 famílies aquestes es classifiquen segons unes determinades característiques en famílies tipus A i famílies tipus B. El nombre de fills per família es distribueix de la següent manera:

Page 23: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 23 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Nombre de fills

Famílies tipus A

Famílies tipus B

0 30 5

1 40 45

2 25 30

3 10 15

4 3 5

5 1 2

6 1 3

Es demana:

a) En quin tipus de família el nombre de fills presenta més dispersió relativa? Com ho interpreteu?

b) En les famílies tipus A, quin percentatge de famílies tenen menys de 3 fills? c) En les famílies tipus B, quants fills ha de tenir com a mínim una família per a que

es pugui considerar en el grup del 25% de les famílies amb més fills? d) En les 215 famílies conjuntament, quan val la mediana? Com s'interpreta? e) Quants fills tenen en total aquestes 215 famílies?

Solucionari

1. a) 35 b) 45 c) 13,75% d) 70% e) 5%

5. Exercici 1: Mitjana: 20,8; Mediana: 20; Moda: 19; 1rQuartil: 19; 2nQuatil: 20; 3rQuartil: 22; Desviació: 2,58

Exercici 2: Mitjana: 64; Mediana: 63,91; Moda: 62,83; 1rQuartil: 59,23; 2nQuatil: 63,91; 3rQuartil:

69,41; Desviació: 7,13

6. Mitjana: 10.306,78€; Mediana: 9.710,53€; Moda: 0-3000€; Percentil 80: 18.867,47€

7. a) 51,6 b) 20-30 c) 44,29

8. Mediana: 3,95

9. a) La Factoria B b) 1186,6€

10. a) Totes dues presenten la mateixa dispersió absoluta. b) La filial europea presenta menys dispersió relativa. 11. a) Les famílies tipus A presenten més dispersió relativa.

b) 86,36% c) 2 d) 1 e) 341

Problemes Resolts

1. Una empresa en expansió necessita contractar 100 nous venedors. Per tal de dur a terme la selecció dels aspirants s'han realitzat unes proves, a partir de les quals s'ha obtingut la taula següent, que recull les qualificacions dels candidats:

Page 24: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 24 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Qualificació Nre. candidats

0-5

5-6

6-9

9-10

50

40

90

20

a) Quin gràfic seria adequat per representar aquesta distribució de freqüències? b) Quina és la qualificació mitjana dels aspirants? c) Quina serà la qualificació mínima necessària per estar entre els seleccionats? d) Un candidat ha obtingut una qualificació de 7,5 i insisteix a dir que es troba entre el 25%

millor classificat. Té raó? Justifica la resposta.

SOLUCIÓ

a) Com la variable és quantitativa contínua, el millor gràfic serà un histograma de freqüències.

b) Cal calcular la mitjana a partir de la marca de classe (xi) dels intervals:

puntsxnn

X ii 05,6200

12101

c) Coincideix amb la mediana, ja que hi ha 200 candidats. La mediana es troba a l’interval [6-9):

puntscn

NN

LMe i

i

i

i 33,6390

9010062

1

1

d) Cal trobar el percentil 75 o tercer quartil. Aquest es troba ubicat a l’interval [6-9):

punts8390

901506c

n

N4

N3

LQ i

i

1i

1i3

Per tant, el candidat no té raó. No es troba entre el 25% millor classificat.

2. La taula adjunta representa les notes d’Estadística obtingudes per 100 alumnes

Qualificacions Freqüència absoluta Freqüència relativa

Suspensos - 0.05

Page 25: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 25 Grau de Psicologia

Tema 2. Distribucions unidimensionals

Aprovats 65 -

Notables 20 -

Excel·lents - -

Quines són les freqüències absolutes de suspensos i excel·lents ?

a) suspensos = 10 i excel·lents = 5 b) suspensos = 5 i excel·lents = 10 c) suspensos = 10 i excel·lents = 10 d) no es pot saber

3. La següent taula recull la distribució del temps (en minuts) d’atenció als malalts d’un

centre d’assistència primària per part dels facultatius que hi treballen, calculada a partir

d’una mostra de 200 consultes:

Temps 0-10 10-20 20-30 30-40

Freqüència 60 90 40 ?

a) Calculeu mediana i mitjana. b) Calculeu la variància i el coeficient de variació. Què mesura aquest segon? c) Si el temps s'expressés en hores, quins serien els valors de la mitjana i la variància

de la nova distribució? d) Per sobre de quin temps es troba el 10% de les visites més llargues?

a) (1Q=8.33; Mediana=19.44; 3Q=25) Efectivament:

33.8)10*60

050(01

Q 44.14)10*

90

60100(10

Mediana

15200

3000

200

)10*35()40*25()90*15()60*5(

X

La proximitat dels estadístics mitjana i mediana indica que la distribució és bastant

simètrica.

b)

70200

4000400006000

200

10*)1535(40*)1525(90*)1515(60*)155(

1

)( 22222

2

n

nXXS

ii

557773.015

70

X

SCV

El coeficient de variació és una mesura relativa de la dispersió d’una distribució.

Page 26: Joan Carles Martori (martori@uvic.cat) · 2013. 11. 20. · S'observa que la distribució d'edats dels votants del candidat B és semblant per les dones i els homes. En canvi, en

UVIC 26 Grau de Psicologia

Tema 2. Distribucions unidimensionals

c) La mitjana quedaria dividida per 60 i la variància dividida pel quadrat d’aquesta constant (3600).

d) 5.27)10*40

150180(2090

P

4. D’un conjunt de dades hem obtingut la mitjana aritmètica, la desviació estàndard i la

mediana. Els seus valors respectius han estat: 8, 1.60 i 7. Si a cadascuna de les dades

li sumem el valor 2, quan valen la mitjana, desviació estàndard i mediana.

10, 1,60, 9

5. Quina de les següents distribucions té una mitjana aritmètica més

representativa?Justifica la teva resposta.

a) =10 i Sx=100

b) =1000 i Sx=100

c) =10 i Sx=1000

d) =100 i Sx=100

6. Els següents diagrames de caixa i bigotis mostren com s'han distribuït les

notes de 4 grups d'estadística. Justifica la teva resposta.

a) En quin grup ha aprovat més del 50% dels alumnes? A b) Quin grup presenta més variabilitat en les notes més baixes? A c) Quin grup té més dispersió en termes de rang interquatil? C d) Quin grup té menys variabilitat en les notes altes ? D