2 Semana Analisis Multivariante Parte I

32
UNIVERSIDAD NACIONAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS MAYOR DE SAN MARCOS Universidad del Perú, DECANA DE AMERICA Universidad del Perú, DECANA DE AMERICA FACULTAD DE CIENCIAS MATEMÁTICAS FACULTAD DE CIENCIAS MATEMÁTICAS Mg. María Estela Ponce Aruneri Mg. María Estela Ponce Aruneri ESCUELA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ACADÉMICO PROFESIONAL DE ESTADÍSTICA DEPARTAMENTO ACADÉMICO DE ESTADÍSTICA DEPARTAMENTO ACADÉMICO DE ESTADÍSTICA SEMESTRE 2009-II

Transcript of 2 Semana Analisis Multivariante Parte I

Page 1: 2 Semana Analisis Multivariante Parte I

UNIVERSIDAD NACIONAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOSMAYOR DE SAN MARCOS

Universidad del Perú, DECANA DE AMERICAUniversidad del Perú, DECANA DE AMERICA

FACULTAD DE CIENCIAS MATEMÁTICASFACULTAD DE CIENCIAS MATEMÁTICAS

Mg. María Estela Ponce AruneriMg. María Estela Ponce Aruneri

ESCUELA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ACADÉMICO PROFESIONAL DE ESTADÍSTICA

DEPARTAMENTO ACADÉMICO DE ESTADÍSTICADEPARTAMENTO ACADÉMICO DE ESTADÍSTICA

SEMESTRE 2009-II

Page 2: 2 Semana Analisis Multivariante Parte I
Page 3: 2 Semana Analisis Multivariante Parte I

¿Cuál es la distribución de probabilidad conjunta de un vector que sigue una distribución normal p-dimensional?

1º Para el caso univariado se tiene que :2

1

21( )

x

f x e

2

1

2( ) kx

f x e

2º Sea

2( )2

2

1( )

x bb y f x ke

Page 4: 2 Semana Analisis Multivariante Parte I

3º Sea el vector aleatorio:

1

2

.

p

x

xx

x

1

2

.

p

βY el vector de constantes:

Page 5: 2 Semana Analisis Multivariante Parte I

4º Reemplazando 3º en 2º se tiene: 1

2( ) kf e

'

x-β A x-βx

1

21 2 ................ 1pdx dx dxke

'

x-β A x-β

El exponente es una forma cuadrática o distancia estadística.

5º ¿A qué es igual k?

* 1Sea k

k

Utilizaremos el siguiente corolario: Sí A es simétrica y definida positiva entonces existe una matriz C no singular tal que: C’AC =I

Page 6: 2 Semana Analisis Multivariante Parte I

Si hacemos:

1

2

.:

.

p

y

y

donde

y

(x - β) = Cy

y

' ' ' '(x - β) A(x - β) = y C ACy y y

Necesitamos calcular el jacobiano de la transformación , el que es igual al valor del determinante de la matriz C.

Luego:

2

2

1 2

1 2

1* 2 .......

1* 2 .......

1

1* 2

1

1..........

..........i

i

p

p

i

p y

i

p y

i

y y y

y y y

y

d d d

d d d

d

k Mod ek

k Mod e

k Mod e

y'yC

C

C

Page 7: 2 Semana Analisis Multivariante Parte I

1/ 2

1pero Mod C

A

2

2

1* 2

1

1/ 2 / 2* 2

1

1

2

1

2

2

2 2 (*)

i

i

i

i

p y

i

p yp p

i

y

y

d

d

k Mod e

k Mod e Mod

C

C C

1/ 2

/ 22( ) p

k

A

Reemplazando en (*) se tiene:

Page 8: 2 Semana Analisis Multivariante Parte I

1/ 2 1

2/ 2

2( )

( ) pf e

'x-β A x-βA

x

Reemplazando el valor de k en 4º se tiene:

Es la función de densidad de una distribución normal p-variante.¿Quién es ?

Sea el vector aleatorio: '1 2 .............. px x xX

( ) ( )

( ) ?

E E

E

(x - β) = Cy x Cy β

x C y β

y

Page 9: 2 Semana Analisis Multivariante Parte I

1 2

1 1

2 2 ...../ 2 / 2

1 1

2 2( ) ( ) .........

( ) ( ) pi ip pdy dy dyyf e E y e

' 'y y y y

y

2

2 2

1 2

1

2 .....1/ 2

1

1 1

2 21/ 2 1/ 2

1

1

2

1 1

2 2

( ) .........( )

( )( ) ( )

( ) 0

i

i i

p

i j

p y

i ii

py y

i ijj i

i

dy dy dy

dy dy

y

y

E y e

E y e e

E y

Page 10: 2 Semana Analisis Multivariante Parte I

1

.( )

.

p

E

x μ

( )

( ) ( )

E

E E

y 0

x C y β μ

Page 11: 2 Semana Analisis Multivariante Parte I

¿A qué es igual A?

( )

( )como

V E

V E E

'x x - μ x - μ

x Cyy'C' C yy' C'

2 2 2

1 2

1

2 ...../ 2

1 1 1

2 2 21/ 2 1/ 2 1/ 2

1

1

2

1 1 1

2 2 2

( ) .........( )

( ) 0( ) ( ) ( )

( ) 0

i j h

p

i j h

i j i j p

py y y

i j i jhh i j

i j

dy dy dy

dy dy dy

y y

y y

E y y e

E y y e e e

E y y

y'y

Sí i j

Page 12: 2 Semana Analisis Multivariante Parte I

Sí i = j

2 2

1 2

12 2 .....

/ 2

1 12 2 2

1/ 2 1/ 21

2

2

2

1

2

1 1

2 2

( ) .........( )

( ) 1( ) ( )

( ) 0 ( )

i j

p

i j

i p

py y

iji j

i

i

i

dy dy dy

dy dy

y

y

E y e

E y e e

E y E

y'y

yy' I

1

:

( )

ademas

V E

x C yy' C' CIC' CC'

C'AC = I A CC'

Page 13: 2 Semana Analisis Multivariante Parte I

1( ) ( ) 'V V E x A Σ x x - μ x - μ Σ

Teorema: Si la función de densidad de un vector aleatorio x p-dimensional está dada por:

1/ 2 1

2/ 2

2( )

( ) pf e

'x-β A x-βA

x

Donde:

1

( )

( ) ( )

E

V Cov

x β

x x A

Page 14: 2 Semana Analisis Multivariante Parte I

Recíprocamente para un vector µ y una matriz simétrica

definida positiva , existe una f.d.p., dada por:

1

21/ 2/ 2

1

2( )

( ) pf e

' -1x-μ Σ x-μx

ΣTal que:

21 1 12 1

22 21 2 2

21 2

)

. .

. .

.( ) ( . . . . .

. . . . . .

. .

p

p

p p p p

yE Cov

x x Σμ

Page 15: 2 Semana Analisis Multivariante Parte I

Propiedades de la distribución normal p-variante

Teorema Nº 1

Si X Np(µ,) y y = AX+c donde Akxp y c k y Nk(?, ?) .

Prueba 1

21/ 2/ 2

1

2( )

( ) pf e

' -1x-μ Σ x-μx

Σ

( ) ?f

-1y = Ax + c x = A (y - c)

y

Page 16: 2 Semana Analisis Multivariante Parte I

El jacobiano de la transformación es:

1

2

1/ 21

1/ 2

1/ 21

1/ 2

1 1 1

' ( ' )

'

ModMod

Mod

Mod

AA A AA

Σ Σ ΣA

A Σ A A Σ A A Σ A

ΣA

AΣA

1/ 2 1

21/ 2 1/ 2/ 2

1

2( )

( ) 'pf e

'-1 -1 -1A (y-c)-μ Σ A (y-c)-μx

Σ

Σ AΣA

Page 17: 2 Semana Analisis Multivariante Parte I

Resolviendo la forma cuadrática se tiene:

1( ) ' ( )

' '-1-1 -1A (y-c)-μ Σ A (y-c)-μ y- Aμ c AΣA y- Aμ c

11( ) ' ( )

21/ 2/ 2

1

2( )

( ) '

, '

p

k

f e

N

'y- Aμ c AΣA y- Aμ c

xAΣA

y Aμ c AΣA

Page 18: 2 Semana Analisis Multivariante Parte I

Teorema Nº 2

Si X Np(µ,) y y = -1/ 2(X- µ) es una transformación de X con -1/ 2 simétrica y definida positiva y1, y2, ……….., yp son v.a.i. N(0,1) .

Prueba

Usando las propiedades de transformaciones de vectores aleatorios, así como de esperanza y varianza de una vector aleatorio, se puede probar este teorema.

Page 19: 2 Semana Analisis Multivariante Parte I

Interpretación geométrica de c2

La distribución normal p-variada tiene densidad constante sobre elipses o elipsoides de la forma:

2c -1x - μ 'Σ x - μ

A estos elipsoides se denominan contornos de la distribución o elipsoides de igual concentración.

Estos elipsoides están centrados en µ y la longitud media del i-ésimo eje en dirección i es igual a c i

1/2

Page 20: 2 Semana Analisis Multivariante Parte I

Ejemplo

Graficar el elipsoide de igual concentración para la distribución normal bivariada con c=2 y:

1 1 0

1 0 2

μ Σ

Page 21: 2 Semana Analisis Multivariante Parte I

Distribuciones Marginales

Si

1 11 12

2 21 22

μ Σ Σμ = Σ =

μ Σ Σ

Es particionada en “q” y “p-q” componentes, con

2

1),(x

xxΣμ~x pN

),(~),,(~ 22221111 ΣμxΣμx qpq NN

Page 22: 2 Semana Analisis Multivariante Parte I

Prueba:

1

1

1

( )

( )

E

Cov Cov Cov

1q

2

1q 1

2

1q 1 11

2

xx I 0

x

μx I 0 μ

μ

xx I 0 x Σ

x

De forma similar se puede probar para la otra partición de X2.

),(~ 1111 Σμx qN

Page 23: 2 Semana Analisis Multivariante Parte I

Ejemplo:

1 2

31 2 4

65

,

x x

x x

xx

x x

Encuentre las distribuciones marginales de los vectores.

16

2

( , )N

xx ~ μ Σ x

x

Page 24: 2 Semana Analisis Multivariante Parte I

Distribuciones Condicionales

Si

1 11 12

2 21 22

μ Σ Σμ = Σ =

μ Σ Σ

Es particionada en “q” y “p-q” componentes, con

2

1),(x

xxΣμ~x pN

12

11121221.22

111

112121.2

1.221.21.2 ),(

ΣΣΣΣΣ

μxΣΣμμ

Σμ~x

qpN

Page 25: 2 Semana Analisis Multivariante Parte I

Prueba:

12

22

( )

( )

E

Cov

q1 1 1-1-1

21 11 p-q2 2 21 11 1 2

q 1 1-1 -1

21 11 p-q 2 2 21 11 1

q q11 11-1 -1

21 11 p-q 21 11 p-q21

I 0y x xy =

Σ Σ Iy x - Σ Σ x x

I 0 μ μy

Σ Σ I μ μ Σ Σ μ

I 0 I 0Σ Σ Σ 0y

Σ Σ I Σ Σ IΣ Σ 22 12

12.1 2 21 11 1 1( )

-121 110 Σ Σ Σ Σ

μ μ Σ Σ x μ

Page 26: 2 Semana Analisis Multivariante Parte I

11 2 2

3

,x

xx

x x

Ejemplo:

Hallar la distribución condicional de la segunda participación conociendo la primera.

321

221

111

3

2

1

),(3 ΣμΣμ~x N

Page 27: 2 Semana Analisis Multivariante Parte I

CORRELACIÓN MÚLTIPLE

La máxima correlación entre xi y la combinación lineal x2, es:

20 1

i

R R

-1

i2 22 2iΣ Σ Σ

11 1 12 22

'1 1

( / )

( / )

E x

E x

2 2 2

2 2 2

x x μ

x x μSe tiene que

21 1

2 2 2 11 1 2 2

1 1

1 1

( / )

( / )( / )

Var x

Var xVar x R R

-12 12 22 21

-12 12 22 21

2

x Σ Σ Σ

x Σ Σ Σx

Page 28: 2 Semana Analisis Multivariante Parte I

11 2 2

3

,x

xx

x x

Ejemplo:

Hallar la correlación entre la segunda y primera partición

321

221

111

3

2

1

),(3 ΣμΣμ~x N

Page 29: 2 Semana Analisis Multivariante Parte I

CORRELACIÓN PARCIAL

1.2 ,R diag -1/2 -1/21.2 11.2 1.2 1.2 11.2D Σ D D Σ

Es la matriz de correlaciones parciales.

Ejemplo: calcular e interpretar las correlaciones parciales para los datos del ejercicio anterior,( de X2 eliminado el efecto de X1)

Page 30: 2 Semana Analisis Multivariante Parte I
Page 31: 2 Semana Analisis Multivariante Parte I

OBSERVACIONES

1°Las curvas de equidensidad de una distribución normal multivariante son elipsoides (es decir, transformaciones lineales de hiperesferas) centrados en la media. Las direcciones de los ejes principales de los elipsoides vienen dados por los autovectores de la matriz de covarianza Σ. Las longitudes relativas de los cuadrados de los ejes principales vienen dados por los correspondientes autovalores.

2° Sí un vector aleatorio tiene una distribución normal multivariante, cada uno de los componentes del vector aleatorio tiene distribución normal.

Page 32: 2 Semana Analisis Multivariante Parte I

3° Sí un vector aleatorio tiene una distribución normal multivariante, entonces cualesquiera dos o más de sus componentes que sean incorrelacionadas, son independientes.