Anàlisi multivariant d’unes dades morfomètriques

9
Departament d’Estadística Divisió de Ciències Experimentals i Matemàtiques Anàlisi multivariant d’unes dades morfomètriques Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull

description

Anàlisi multivariant d’unes dades morfomètriques. Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull. Hi ha relació entre la supervivència i mesures biomètriques als pardals?. - PowerPoint PPT Presentation

Transcript of Anàlisi multivariant d’unes dades morfomètriques

Page 1: Anàlisi multivariant d’unes dades morfomètriques

Departament d’EstadísticaDivisió de Ciències Experimentals i

Matemàtiques

Anàlisi multivariant d’unes dades morfomètriques

Llicenciatura de Biologia

Disseny d’Experiments i Anàlisi de Dades

Jordi Ocaña Rebull

Page 2: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Hi ha relació entre la supervivència i mesures biomètriques als pardals?

49 pardals recollits per H.C. Bumpus desprès d’una tempesta, 21 sobrevisqueren. En mesurà:– X1: llargada total

– X2: amplitud alar

– X3: llargada de bec + cap

– X4: llargada de l’húmer

– X5: llargada de la quilla de l’esternó.

Raonà que hi havia selecció natural estabilitzant: Bumpus, H.C. (1898). The elimination of the unfit as illustrated by the introduced sparrow, Passer domesticus. Biologiacl Lectures, Marine Biology Laboratory, Woods Hole, 11th Lecture, pp.209-226.

Page 3: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Anàlisi de les dades anteriors

No sembla que hi hagi diferències entre les mitjanes dels que han sobreviscut i els morts.

Correlacions entre variables:

1,000 ,735 ,662 ,645 ,605,735 1,000 ,674 ,769 ,529,662 ,674 1,000 ,763 ,526,645 ,769 ,763 1,000 ,607

,605 ,529 ,526 ,607 1,000

Totes significatives, i correlacions parcials no (signe d’estructuració). Altres proves d’estructura de la matriu de correlacions també significatives.

Page 4: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Anàlisi de components principals

Provarem d’obtenir una nova variable, que sigui combinació lineal de les observades, t.q.

Una segona variable, incorrelacionada amb l’anterior i definida similarment, etc:

1 11 1 12 2 13 3 14 4 15 5

2 2 2 2 211 12 13 14 15

1

amb 1

t.q. var sigui màxima

P a X a X a X a X a X

a a a a a

P

2 21 1 22 2 23 3 24 4 25 5

2 2 2 2 221 22 23 24 25

2

2 1

amb 1

t.q. var sigui el més gran possible

(però lògicament var var )

P a X a X a X a X a X

a a a a a

P

P P

Page 5: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Anàlisi de components principalsPesos dels coeficients de les components principals (segons Statgraphics 4.1)

Factor“grandària”?

Factor“forma”?

“rabassuderia”?

Component Component

1 2

------------ ------------

AmplitudAlar 0,461681 -0,299564

bec_cap 0,450542 -0,324572

humer 0,470739 -0,184684

Llargada 0,451799 0,0507214

quilla 0,397675 0,876489

Page 6: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Variància explicada per les c.princ.

Els vectors anteriors a1, a2, ..., a3 són els “vectors propis” de la matriu de correlacions o de covariàncies de les dades, ordenats de major a menor “valor propi”

1 2 ... 5

var(Pi) = i

1 + 2 ... + 5 = var(X1) + ... + var(X5)

Page 7: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Anàlisi de components principalspart de la sortida de Statgraphics 4.1

Component Percent of Cumulative

Number Eigenvalue Variance Percentage

1 3,61598 72,320 72,320

2 0,531504 10,630 82,950

3 0,386425 7,728 90,678

4 0,301566 6,031 96,709

5 0,164528 3,291 100,000

Page 8: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Importància de les diverses components principals (Statgraphics 4.1)

La primera component principal “grandària corporal”(?) explica més del 72% de la variació d’aquestes dades.

Les dues primeres juntes, “grandària corporal”(?) i “forma”(???) casi el 83%.

Scree Plot

Component

Eig

enva

lue

0 1 2 3 4 50

1

2

3

4

Page 9: Anàlisi multivariant d’unes dades morfomètriques

Departament

d’Estadística

Gràfic de dispersió per 2 primeres components: selecció estabilitzant per “grandària”?

Si comparem les mitjanes dels dos grups per la variable “primera component principal” NO hi ha diferències.

SI que hi ha diferències molt significatives entre les variàncies dels dos grups: major dispersió pels morts.

Plot of PCOMP_2 vs PCOMP_1

PCOMP_1

PCO

MP_

2

Superviventnosi

270 280 290 300 310-2,9

-0,9

1,1

3,1

5,1

7,1