Capitulo 9 Interpretaciones Geometricas

8/6/2019 Capitulo 9 Interpretaciones Geometricas

1/20

Captulo 9 INTERPRETACIONES

GEOMTRICAS

9.1. INTRODUCCIN.

En este captulo se presenta el tema del lgebra Lineal que mayor contribucintiene en el Anlisis de Datos Multivariante como lo son las InterpretacionesGeomtricas. Se exponen sus principales tpicos asociados como lo son laRepresentacin Grfica de los Vectores Filas y Columnas de una Matriz de

Datos, ngulo entre 2 vectores y Rectas y Planos en

n

, y los Subespacios deMejor Ajuste Mnimo Cuadrtico, herramienta que justamente es la quepermite la reduccin de datos.

9.2. REPRESENTACIN GRFICA DE LOS VECTORES FILAS YVECTORES COLUMNAS DE UNA MATRIZ DE DATOS.

Sea XMnxp() una matriz de datos. Dicha matriz tiene n vectores filas quepuede representarse grficamente como puntos en p; estos puntos representana los elementos. Igualmente tiene p vectores columnas que puedenrepresentarse grficamente como puntos en n; estos puntos representan a lasvariables. Si p = 1, 2, 3 es posible representar grficamente a los elementos

pero si p 4 esto resulta imposible. De la misma forma, si n = 1, 2, 3 esposible representar grficamente a las variables pero si n 4 esto resultaimposible. De all que es ms factible representar grficamente a los elementosde una matriz de datos que a las variables siempre y cuando se midan a losumo 3 variables.

Ejemplo Aplicado 9.1.

Consideremos la matriz de datos cuyas columnas son las 2 primeras columnasde la matriz de datos del ejemplo aplicado 1.3.:

=

0913

1012

1315

1917

1408

12101112

X

En este caso se pueden representar grficamente los 7 vectores filas(elementos) sobre 2 (Figura 9.1.).

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

315

Figura 9.1.

El grfico obtenido es un grfico de dispersin. A primera vista se observan 3

grupos de elementos: {C, B}, {A, F, G} y {E, D}. Sin embargo, no se disponede mayor informacin para caracterizar esos grupos. Para ello, consideremos lamatriz de datos centrada:

=

57,357,0

57,243,0

43,057,2

43,657,4

43,143,4

57,043,2

57,143,0

X

La representacin grfica de los 7 vectores filas (elementos) sobre 2 se puedeapreciar en la figura 9.2.:

Figura 9.2.

En este caso el punto (0,0) representa el punto de medias de las 2 columnas de

X , de manera que los 4 cuadrantes del grfico anterior tienen caractersticasparticulares:


2/20


3/20

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

318

Igualando (1) y (2) se tiene que:

)(CosYX2YXYX2YX22t22 +=+

YX2)(CosYX2 t= YX)(CosYX t=

YX

YX)(Cos

t

=

Teorema 9.2.

Sea XMnxp() una matriz de datos. Entonces el coseno del ngulo entre los

vectores hX y jX es:

hjr)(Cos =

Siendo rhj el coeficiente de correlacin lineal de Pearson entre las variablesh-sima y j-sima.

Demostracin

1. = =

===n

1i

n

1ihjjijhihijih

jth nS)XX)(XX(XXX)X(

2. h2hn

1i

2hih

n

1i

2ih

hthh

SnnS)XX()X(X)X(X ===== ==

3. j2jn1i

2jij

n

1i

2ij

jtjj SnnS)XX()X(X)X(X ===== ==

Luego,

hjjh

hj

jh

hj rSS

S

SnSn

nS)(Cos ===

Es decir, el coseno del ngulo entre los vectores hX y jX coincide con elcoeficiente de correlacin lineal de Pearson entre las variables h-sima y

j-sima.

Definicin 9.1.

Sean X, Yn tales que X Y. Se define como recta que pasa por X e Y, y sedenota por LYX al conjunto:

LYX = {Zn: Z = Y + c(X Y); c}


319

El vector (X Y) se dice que es el vector director de la recta LYX. Si Y = nx1entonces la recta LX es una recta en n que pasa por el origen nx1. La figura9.4., muestra una recta LX en

3.

Figura 9.4.

Ejemplo 9.1.

Sean X, Y3 los vectores:

X =

2

2

1

, Y =

3

0

1

En este caso,

X Y =

5

2

2

Luego,

LYX = {Z3: Z =

3

0

1

+ c

5

2

2

; c}

Ejemplo 9.2.

Sea X3 el vector:

X =

3

2

1

LX


4/20


320

La recta que pasa por el origen 3x1 y el vector X es:

LX = {Z3: Z = c

3

2

1

; c}

Teorema 9.3.

Sea Xn. Entonces la Recta LX es un subespacio de n.

Demostracin

Por definicin:

LX = {Zn: Z = cX; c}

Veamos que LX es un subespacio de n.

1. Es claro que si c = 0 entonces Z = 0X = nx1. Luego, nx1LX.2. Sean Z1, Z2LX. Luego, existen c1, c2 tales que Z1 = c1X y

Z2 = c2X. Luego, dZ1 + Z2 = d(c1X) + c2X, es decir,

dZ1 + Z2 = (dc1 + c2)X; d. Por lo tanto, (dZ1 + Z2)LX.

Por consiguiente, LX es un subespacio de n.

Teorema 9.4.

Sean X, Yn. Entonces la Proyeccin Ortogonal de Y sobre la Recta LX es:

( )XoyPr YLYL XX =

Siendo ( )XX

XYt

tYL X

=

la componente de proyeccin.

Demostracin

Por el teorema 9.3., LX es un subespacio de n. Es claro que V = n es un

espacio eucldeo con el producto interno usual YXY,X t=>< , X, Yn.

Por definicin de proyeccin ortogonal (definicin 5.6.):

YWoyPr =

=

>


5/20


322

= (Yt ( XXX

XYt

t

)t)(Y XXX

XYt

t

)

= (Yt tt

t

X)XX

XY( )(Y X

XX

XYt

t

)

= YtY Yt X)XXXY(

t

t YX)

XXXY( t

t

t+ t

t

tX)

XXXY( X

XXXY

t

t

= YtY XY)XX

XY( t

t

t

XY)XX

XY( t

t

t

+ XX)XX

XY)

XX

XY( t

t

t

t

t

= YtY 2 XY)XX

XY( t

t

t

+ XY)XX

XY( t

t

t

= YtY XY)XX

XY( t

t

t

= Yt

Y )XX

XX

(XY)XX

XY

( t

tt

t

t

= YtY XX)XX

XY( t2

t

t

= YtY XX)( t2YL X

2. d2( YL XoyPr , nx1) = || YL XoyPr ||2 = ( YL XoyPr )t YL XoyPr = ( )( ) ( )XX YL

tYL XX

= ( ) XX t2YL X

Ejemplo 9.3.

Consideremos la recta LX del ejemplo 9.2.:

LX = {Z3: Z = c

3

2

1

; c}

Calculemos la proyeccin ortogonal del vector Y =

1

2

3

sobre la recta LX:

X)(oyPr YLYL XX

=

La componente de proyeccin es:


323

[ ]

[ ]

14

2

3

2

1

321

3

2

1

123

XX

XY)(

t

tYL X

=

==

Luego,

=

==

73

72

71

3

2

1

14

2X)(oyPr YL

YL XX

Adems,

d2(Y, LX) = YtY XX)( t2YL X

= [ ] [ ]

3

2

1

32114

2

1

2

3

1232

= 14196

414

=7214

=7

96

Finalmente,

7

214.

14

2XX)(),oy(Prd

2t2Y

L1x3YL

2XX

=

==

Definicin 9.2.

Sean X0, X1, X2, , Xpn vectores L.I. Se define como plano de dimensin

p+1 en n generado por los vectores X0, X1, X2, , Xp y se denota por n 1pP + al

conjunto:

=

+ =+==p

1jj

jj

0nn1p p}...,2,,1j,B;XBXZ:Z{P


6/20


324

Si X0 = nx1 entonces se dice que el plano pasa por el origen, es generado por

los vectores L.I. X1, X2, , Xp y se denota por npP . Es claro que si Zn

1pP +

entonces Z es combinacin lineal de los vectores X0, X1, X2, , Xp.

Por otro lado,

Si Z n 1pP + entonces =

+=p

1j

jj

0 XBXZ , es decir:

[ ]

=

p

2

1p210

B

B

B

1

XXXXZ

M

L = XB

Siendo XMnx(p+1)() = [X0 X1 X2 . Xp] y Bp+1 =

p

2

1

B

B

B

1

M

De modo que:

}B),(MX;XBZ:Z{P 1p1)nx(pnn 1p +++ ==

En particular, si p = 1 entonces:

10XX11

10nn

11 L}B;XBXZ:Z{P =+==+

Si adems X0 = nx1 entonces:

}B),(MX;XBZ:Z{P pnxpnn

p ==

Para p = 1 entonces:

1X11

1nn

1 L}B;XBZ:Z{P ===

En la figura 9.6., se puede apreciar un plano 3pP .


325

Figura 9.6.

Ejemplo 9.4.

Sean X1, X23 los vectores:

X1 =

2

2

1

, X2 =

3

0

1

El plano de dimensin 2 en 3 que pasa por el origen y es generado por los

vectores X1

y X2

es:

}B;XBZ:Z{}B,B;

3

0

1

B

2

2

1

BZ:Z{P 23212133

2 ==

+

==

Siendo:

=

32

02

11

X y

=

2

1

B

BB

Teorema 9.5.

Sean X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I. Entonces

el plano npP que pasa por el origen y es generado por los vectores

X1, X2, , Xp es un subespacio de n.

Demostracin

Por definicin:

3pP

X1X2

Xp


7/20


326

=

===p

1jj

jj

nnp p}...,2,,1j,B;XBZ:Z{P

Veamos que npP es un subespacio de n.

1. Es claro que si B1 = B2 = = Bp = 0 entonces Z = nx1. Luego,nx1

npP .

2. Sean Z1, Z2 npP . Luego, existen Bij; i = 1, 2; j = 1, 2, , p talesque

=

=p

1j

jj1

1 XBZ y =

=p

1j

jj2

2 XBZ . Luego,

dZ1 + Z2 = ==

+p

1j

jj2

p

1j

jj1 XBXBd , es decir,

dZ1 + Z2 = =

+p

1j

jj2j1 X)BdB( ; d. Por lo tanto, (dZ

1 + Z2) npP .

Por consiguiente, npP es un subespacio de n.

Teorema 9.6.

Sean Y, X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I.

Entonces la Proyeccin Ortogonal de Y sobre el plano npP generado por los

vectores X1, X2, , Xp es:

HYoyPr YPnp

=

Siendo:

1. X = [ p21 XXX L ]2. t1t X)XX(XH = . Esta matriz se denomina Matriz de Proyeccin.

Demostracin

Por el teorema 9.5., npP es un subespacio de n. Es claro que V = n es un

espacio eucldeo con el producto interno usual YXY,X t=>< , X, Yn.Por definicin de proyeccin ortogonal (definicin 5.6.):

YWoyPr =

=

><

====

Luego,

Y

PnpoyPr =

= =

p

1j

p

1i

ijij ))XC(D(

YPnpoyPr = = =p

1j

p

1i

ijij XCD

YPnp

oyPr = = =

p

1i

p

1j

ijij XCD

YPnp

oyPr = [ p21 XXX L ]

=

=

=

p

1jjpj

p

1j2jj

p

1j1jj

CD

CD

CD

M

YPnp


p

2

1

ppp2p1

2p2212

1p2111

D

D

D

CCC

CCC

CCC

M

L

MMM

L

L


8/20


328

YPnp


=

=

=

p

1i

tipi

p

1i

tii2

p

1i

tii1

ppp2p1

2p2212

1p2111

Y)X(C

Y)X(C

Y)X(C

CCC

CCC

CCC

ML

MMM

L

L

YPnp

oyPr = [ p21 XXX L ] Y

)X(C

)X(C

)X(C

CCC

CCC

CCC

p

1i

tipi

p

1i

tii2

p

1i

tii1

ppp2p1

2p2212

1p2111

=

=

=

ML

MMM

L

L

YPnp

oyPr =

[ p21 XXX L ] Y

)X(

)X(

)X(

CCC

CCC

CCC

CCC

CCC

CCC

tp

t2

t1

pp2p1p

p22221

p11211

ppp2p1

2p2212

1p2111

M

L

MMM

L

L

L

MMM

L

L

YPnp


Y)X(

)X(

)X(

CCCCC

CCCCC

CCCCC

tp

t2

t1

p

1r

2rp

p

1r2rrp

p

1r1rrp

p

1r

rp2r

p

1r

22r

p

1r

1r2r

p

1rrp1r

p

1r2r1r

p

1r

21r

===

===

===

M

L

MMM

L

L

YPnp

oyPr = XCXtY; siendo:

=

===

===

===

p

1r

2rp

p

1r2rrp

p

1r1rrp

p

1rrp2r

p

1r

2

2r

p

1r1r2r

p

1rrp1r

p

1r2r1r

p

1r

21r

CCCCC

CCCCC

CCCCC

C

L

MMM

L

L

una matriz de orden pxp

Por otra parte,

np

Y

PPoyPr n

p (Y Y

PnpoyPr ) npP

(Y YPnp

oyPr ) Xj; j = 1, 2, , p (Ver figura 9.7. en 3)


329

Figura 9.7.

Luego,

(Y YPnp

oyPr )tXj = 0

(Y YPnp

oyPr )tXj = 0

YtXj ( YPnp

oyPr )tXj = 0

YtXj = ( YPnp

oyPr )tXj

Por lo tanto,

[ pt2t1t XYXYXY L ] = [ ptYP

2tYP

1tYP

X)oy(PrX)oy(PrX)oy(Pr np

np

np

L ]

Yt[ p21 XXX L ] = tYP

)oy(Pr np

[ p21 XXX L ]

YtX = tYP

)oy(Pr np

X

(YtX)t = ( tYP

)oy(Pr np

X)t

XtY = Xt YPnp

oyPr

XtY = XtXCXtY

Como X tiene sus p columnas L.I. entonces Rango(X) = p. En consecuencia,por el teorema 8.10., la matriz XtX es definida positiva y por lo tanto nosingular. Luego,

(XtX)-1XtY = CXtY ((XtX)-1 C)XtY = px1

Como XtY px1 entonces (XtX)-1 C = pxp. Por consiguiente, C = (X

tX)-1. Deesta forma:

3pP

X1 X2

XpYP3p

oyPr

)oyPrY( YP3p

Y


9/20


330

Y

PnpoyPr = XCXtY = X(XtX)-1XtY = HY

Observaciones:

1. Por el teorema 5.11., d2(Y, npP ) = d2(Y, YPnpoyPr ), es decir:d2(Y, npP ) = d

2(Y, HY)

= (Y HY)t(Y HY)= ((In H)Y)

t(In H)Y= Yt(In H)

t(In H)Y= YtQtQY

Siendo Q = In H. Las matrices Q y H son simtricas eidempotentes (ver Ejercicio 23, Captulo 1).

Por lo tanto:

d2(Y, npP ) = YtQY

Es decir, el cuadrado de la distancia de un vector Y al plano npP es

una forma cuadrtica con matriz simtrica asociada Q, la cual porser simtrica e idempotente de orden nxn y de rango n p essemidefinida positiva.

En particular, si los p vectores columnas que generan el planonpP

forman una base ortonormal de n entonces ( ) 1XX jtj = , j = 1, 2, , p y XtX = Ip. Luego, Q = In H = In XXt y

( )jt

jtj

jtY

L XYXX

XYjX

==

. En consecuencia:

d2(Y, npP ) = YtQY = Yt(In XX

t)Y

= YtY YtXXtY

= Y)X(XYYY

n

1i

tii

tt

=

= Y)X(XYYYn

1j

tjjtt =

= =

n

1j

tjjtt Y)X(XYYY

= )Y)X)((XY(YYn

1j

tjjtt =

= )XY)(XY(YY

n

1j

jtjtt

=


331

= =

n

1j

2jtt )XY(YY

= =

n

1j

2Y

Lt

jXYY

2. d2( YPnp

oyPr , nx1) = (Y

PnpoyPr )t Y

PnpoyPr = (HY)t(HY) = YtHtHY =

YtHY. Es decir, el cuadrado de la longitud de la proyeccin

ortogonal de Y sobre el plano npP es una forma cuadrtica con

matriz simtrica asociada H, la cual por ser simtrica e idempotentede orden nxn y de rango p es semidefinida positiva.

3. Si los vectores X1, X2, , Xp forman una base ortonormal de nentonces XtX = Ip. Luego, H = XX

t y Q = Ip XXt. En

consecuencia:

3.1. YPnp

oyPr = HY = XXtY.

3.2. d2(Y, npP ) = Yt(Ip XXt)Y.3.3. d2( Y

PnpoyPr , nx1) = Y

tXXtY.

Ejemplo 9.5.

Consideremos el plano 32P del ejemplo 9.3.:

}B,B;

3

0

1

B

2

2

1

BZ:Z{P 212133

2

+

==

Calculemos la proyeccin ortogonal del vector Y =

1

2

3

sobre el plano 32P :

En este caso,

=

32

02

11

X

Luego,

=

=

107

79

32

02

11

301

221XX t


10/20


332

Se puede determinar que:

=

419

417

417

4110

)XX( 1t

La matriz de proyeccin es:

t1t X)XX(XH =

=

=

4137

41241

1241

241

40416

4112

416

415

301

221

419

417

417

4110

32

02

11

H

Por lo tanto,

=

==

4177

4164

4115

1

2

3

4137

41241

1241

241

40416

4112

416

415

HYowPr YP32

Por otra parte,

=

==

41441

241

12412411416

4112

41641

36

4137

412

4112

4124140416

4112

416

415

100010

001

HIQ 3

En consecuencia,

d2(Y, 32P ) = [ ]123

41441

241

1241

241

1416

4112

41641

36

1

2

3

=41

324

Finalmente,

d2( YP32

oyPr , 3x1) = YtHY = [ ]41

250

4177

4164

4115

123 =


333

9.4. SUBESPACIOS DE MEJOR AJUSTE MNIMO CUADRTICO.

Definicin 9.3.

Sea XMnxp() tal que Rango(X) = p. Se define como subespacio de mejor

ajuste mnimo cuadrtico de dimensin q (q < p) al conjunto de vectores filasde X y se denota por q)X(SMA al plano generado por vectores ortonormales

V1, V2, , Vq que verifica que =

n

1iqi

2 ))X(SMA,X(d es mnima.

Observaciones:

1. Como )oyPr,X(d))X(SMA,X(d iq

X)X(SMAi

2qi

2 = entonces el

subespacio de mejor ajuste mnimo cuadrtico q)X(SMA es aquel

que verifica que =

n

1i

X)X(SMAi

2 )oyPr,X(d iq

es mnima.

2. Si X es una matriz de datos entonces independientemente del valorde p es posible representar los vectores filas (elementos) de X sobreun plano de dimensin q (q = 1, 2, 3).

Teorema 9.7.

Sea XMnxp() tal que Rango(X) = p. Entonces se cumple que:

1)X(SMA = 1VL

Siendo V1 el autovector normalizado de la matriz XtX asociado con su mayorautovalor.

Demostracin

Por definicin, el subespacio de mejor ajuste mnimo cuadrtico 1)X(SMA es

el plano de dimensin 1 generado por un vector normalizado V1 con la

condicin (V1)tV1 = 1 que verifica que

=n

1i 1i

2 ))X(SMA,X(d es mnima. Es

claro que SMA(X)1 es la recta 1VL (ver figura 9.8., en 3).


11/20


334

Figura 9.8.

Ahora bien,

)oyPr,X(d)L,X(d))X(SMA,X(d i1V

1X

Li2

Vi2

1i2

==

Por la observacin 1 del teorema 9.4.:

( ) 1t12

XLi

ti

XLi

2 VVX)X()oyPr,X(d i1V

i

1V

=

Pero ( ) 1VV 1t1 = . Luego,

2X

Lit

iX

Li2 i

1V

i

1VX)X()oyPr,X(d

=

=

n

1i

XLi

2 )oyPr,X(d i1V

= =

n

1ii

ti X)X(

=

n

1i

2XL

i

1V

El trmino =

n

1ii

ti X)X( es constante. Por lo tanto, minimizar

=

n

1i

XLi

2 )oyPr,X(d i1V

equivale a maximizar

=

n

1i

2XL

i

1V

, expresin que puede

escribirse de la siguiente manera:

=

n

1i

2XL

i

1V=

( )=

n

1i

2

t1

1ti

V)V(

VX

= ( )( )=

n

1i

21ti VX

= ( )( ) ( )( )=

n

1i

1ti

1ti VXVX

1

1V

XLoyPr

1V

L

X1 )L,X(d 1V1

X22

1V

XLoyPr

Xnn

1V

XLoyPr

)L,X(d 1V2

)L,X(d 1Vn


335

= ( ) ( )( )=

n

1i

1tii

t1 VXX)V(

= 1n

1i

tii

t1 V)X(X)V(

=

= [ ]

( )( )

( )

1

tn

t2

t1

n21t1 V

X

X

X

XXX)V(

ML

= 1tt1 XVX)V(

Es decir, =

n

1i

2X

Li

1Ves una forma cuadrtica con matriz simtrica asociada

XtX. Por lo tanto, el subespacio de mejor ajuste mnimo cuadrtico dedimensin 1 es la recta 1VL que maximiza la forma cuadrtica (V

1)tXtXV1

con la restriccin (V1)tV1 = 1. Para hallar el vector V1 utilizaremos el mtodode los multiplicadores de Lagrange:

Definimos las funciones:

f(V1) = (V1)tXtXV1 y g(V1) = (V1)tV1 1

La expresin (V1)tV1 es una forma cuadrtica con matriz simtrica asociada Ip.

Luego,

)V(g)V(f 11 =

)VI2(XVX2 1p1t =

11t V2XVX2 =

11t VXVX =

11t VXVX =

Por lo tanto, el multiplicador de Lagrange es autovalor de la matriz XtX con

autovector asociado V1

. Adems, si premultiplicamos a ambos lados de laigualdad anterior por (V1)t se obtiene que:

=== 1t11t11tt1 V)V()V()V(XVX)V(

f(V1) =

Es decir, maximizar f(V1) sujeto a (V1)tV1 = 1 equivale a maximizar , siendoste ltimo autovalor de XtX con autovector asociado V1. En consecuencia, elvector V1 es el autovector normalizado asociado al mayor autovalor de lamatriz XtX.


12/20


336

Observacin:

Las filas de X en lugar de representarse en p se pueden representar en el

subespacio de ajuste mnimo cuadrtico )X(Pp1 = 1VL a travs de su

proyeccin ortogonal sobre dicha recta, especficamente a travs de sucomponente de proyeccin, la cual toma la siguiente forma:

( ) ( ) ( ) 1ti1t

i1t1

1tiX

L VX1

VX

V)V(

VXi

1V===

= [ ]

( )( )

( )

p1

21

11

ip2i1i

V

V

V

XXXM

L = ( )=

p

1jj

1ij VX

Es decir, la componente de proyeccin de la i-sima fila de X sobre la recta demejor ajuste mnimo cuadrtico es una combinacin lineal de las medicionesde las p variables sobre el i-simo elemento. De tal forma que el coeficiente

( )j1V mide la contribucin de la j-sima variable en la componente. Estopermite caracterizar intervalos de la recta de mejor ajuste mnimo cuadrticopara as caracterizar los grupos de elementos de X cuyas componentes deproyeccin se encuentran en dichos intervalos.

Para obtener el vector de componentes de proyeccin se hace lo siguiente:

11

tn

t2

t1

1tn

1t2

1t1

XL

XL

XL

XL XVV

)X(

)X()X(

V)X(

V)X(V)X(

n

1V

2

1V

11V

1V=

=

=

=

MMM


En el perodo II-2004 se le consult a un grupo de once (11) alumnos del cursode Algebra Lineal II su apreciacin acerca del nivel de dificultad de las cuatro(4) materias del 4 semestre de la EECA, es decir, Algebra Lineal II,

Matemtica IV, Introduccin a la Economa y Teora de la Probabilidad II.Para cada respuesta se adopt la siguiente escala:

1: Nivel de dificultad alto.0: Nivel de dificultad medio.-1: Nivel de dificultad bajo.

Los resultados de la consulta se muestran a continuacin:


337

AlumnoAlgebraLineal II

MatemticaIV

Introduccin ala Economa

Teora de laProbabilidad II

A 1 -1 -1 1B 1 0 -1 0C 1 0 -1 1

D 1 -1 -1 1E 0 0 -1 1F 1 0 0 0G 1 0 -1 1H 1 0 -1 1I 1 1 -1 1J 1 -1 0 0K 1 0 0 1

Determinemos 1)X(SMA .

En este caso, la matriz de datos es:

=

1001

0011

11111101

1101

0001

1100

1111

1101

0101

1111

X

Se puede verificar que:

=

8717

7817

1142

77210

XX t

Igualmente se puede constatar que los autovalores y autovectoresortonormalizados de la matriz XtX son:

231 = , 42 = , 23 = y 14 =

=

5518,0

5518,0

1226,0

6131,0

V1 ,

=

2294,0

2294,0

9177,0

2294,0

V2 ,

=

3780,0

3780,0

3780,0

7559,0

V3 y

=

7071,0

7071,0

0

0

V4


13/20


14/20


340

Siendo p2P el plano de dimensin 2 en p generado por los vectores V1 y V2,

autovectores ortonormalizados de la matriz XtX asociados con sus 2 mayoresautovalores.

Demostracin

Por definicin el subespacio de mejor ajuste mnimo cuadrtico 2)X(SMA es

el plano de dimensin 2 generado por 2 vectores ortonormalizados V1 y V2((V1)tV1 = 1, (V2)tV2 = 1 y (V1)tV2 = 0) que verifica que

=

n

1i

X)X(SMAi

2 )oyPr,X(d i2

es mnima, es decir, es el plano p2P generado por los

vectores V1 y V2 que verifica que =

n

1i

X

Pi2 )oyPr,X(d ip

2es mnima (ver figura

9.11., en 3).

Figura 9.11.

El vector V1 necesariamente debe ser el vector director de la recta de mejorajuste mnimo cuadrtico SMA(X)1, ya que de lo contrario existira otro planode dimensin 2 mejor. El objetivo es determinar el vector V2.

Ahora bien,

)oyPr,X(d)P,X(d))X(SMA,X(dip2

X

Pi2p

2i2

2i2

==

Como V1 y V2 forman una base ortonormal de p entonces por la observacin1 del teorema 9.6., se tiene que:

2X

L

2X

Lit

iX

Pi2 i

2V

i

1V

ip2

X)X()oyPr,X(d

=

=

n

1i

XLi

2 )oyPr,X(d i1V

= =

n

1ii

ti X)X(

=

n

1i

2XL

i

1V

=

n

1i

2XL

i

2V

De forma anloga al teorema anterior se deduce que:

132

X

PoyPr

32P

X1 )P,X(d 321X2

232

X

PoyPr Xn

n32

X

PoyPr )P,X(d 322

)P,X(d 32n


341

=

n

1i

XLi

2 )oyPr,X(d i1V

= =

n

1ii

ti X)X( ( ) 1t

t1 XVXV ( ) 2tt2 XVXV

=

n

1i

XLi

2 )oyPr,X(d i1V

= =

n

1ii

ti X)X( 1 ( ) 2t

t2 XVXV

Donde 1 es el mayor autovalor de XtX y el trmino =

n

1ii

ti X)X( es constante.

Por lo tanto, minimizar =

n

1i

XLi

2 )oyPr,X(d i1V

equivale a maximizar la forma

cuadrtica 2tt2 XVX)V( con las restricciones (V2)tV2 = 1 y (V2)tV1 = 0. Para

hallar el vector V2 utilizaremos el mtodo de los multiplicadores de Lagrange:Definimos las funciones:

f(V2

) = (V2

)t

Xt

XV2

, g(V2

) = (V2

)t

V2

1 y h(V2

) = (V2

)t

V1

La expresin (V2)tV2 es una forma cuadrtica con matriz simtrica asociada Ipy (V2)tV1 es una funcin lineal en V2.

Luego,

)V(h)V(g)V(f 212

22 +=

112

p22t V)VI2(XVX2 +=

112

22t VV2XVX2 +=

( ) ( ) ( )( ) ( ) ( ) 11

t222

t22tt2

11t122t12tt1

VVV2VXVX2VVVV2VXVX2V

+=+=

( ) ( ) ( )( ) ( ) ( ) 1t212

t22

2tt2

1t11

2t12

2tt1

VVVV2XVXV2

VVVV2XVXV2

+=

+=

( )( ) 0.1.2XVXV2

1.0.2XVXV2

122tt2

122tt1

+=

+=

( )

( ) 22tt2

12tt1

XVXV

XVXV2

=

=

Ahora bien, V1 es autovector de XtX con autovalor asociado 1, es decir,XtXV1 = 1V1. Por lo tanto:

(XtXV1)t = (1V1)t

(V1)tXtX = 1(V1)t

En consecuencia,

( ) 22tt2

12t1

1

XVXV

V)V(2

=

= ( ) 22t

t211

XVXV

0.2

=

= ( ) 22t

t21

XVXV

0

=

=


15/20


16/20


344

Figura 9.12.

Se puede observar que el grfico se divide en 2 cuadrantes; el I y el IV. En el Icuadrante se encuentran los alumnos cuyas componentes son positivas conrespecto a V1 y V2, es decir, los alumnos que en general opinan que lgebraLineal II, Matemtica IV y Teora de la Probabilidad II son materias con altonivel de dificultad. En el IV cuadrante se encuentran los alumnos cuyascomponentes son positivas con respecto a V1 y negativas con respecto a V2, esdecir, los alumnos que en general opinan que lgebra Lineal II y Teora de laProbabilidad II son materias con alto nivel de dificultad pero Matemtica IVtiene bajo nivel de dificultad. De esta forma se pueden obtener con mayorprecisin grupos de alumnos internamente homogneos y externamenteheterogneos (figura 9.13.).

Figura 9.13.

Teorema 9.10.

Sean XMnxp() tal que Rango(X) = r, VMpxr() y UMnxr(). Si V y Uson las matrices cuyas columnas son los autovectores ortonormalizados de lasmatrices XtX y XXt, respectivamente, asociados con los autovalores comunesno nulos entonces:

tV)A(UDX

=


345

Siendo )A(D

Mrxr() la matriz diagonal definida por:

( )

==

jisi0

jisi)A(D i

ij

Donde 1, 2, , r son los autovalores comunes no nulos de XtX y XXt.

Demostracin

Por el teorema 7.23., se sabe que:

=

=r

1i

tiii )V(UX

[ ]( )( )

( )

=

tr

t2

t1

rr

22

11

V

V

V

UUUXM

L

[ ]( )( )

( )

=

tr

t2

t1

r

2

1

r21

V

V

V

00

00

00

UUUXM

L

MMM

L

L

L

tV)A(UDX

=

Definicin 9.4.

Sea XMnxp() tal que Rango(X) = p. Se define como matriz aproximada deX por el subespacio de mejor ajuste mnimo cuadrtico de dimensin q

q)X(SMA y se denota por qX~

a la matriz )(MX~

nxpq definida por:

tq V)A(UDX

~

=

Siendo VMpxq() y UMnxq() las matrices cuyas columnas son losautovectores ortonormalizados de las matrices XtX y XXt, respectivamente,asociados con los q mayores autovalores comunes de ambas matrices.

Definicin 9.5.

Sea XMnxp(). Se define como Norma de Frobenius de X y se denota por

FX al escalar siguiente:

FX = )XX(Traza t


17/20


346

Observacin:

Por el teorema 7.13. (lema de Schur), si 1, 2, , p son los autovalores

comunes no nulos de XtX entonces Traza(XtX) = =

p

1ii . Luego,

FX =

=

p

1ii

Definicin 9.6.

Sea XMnxp(). Se define como Medida de la Bondad del Ajuste delSubespacio de Mejor Ajuste Mnimo Cuadrtico de dimensin q a las filas deX y se denota por BSMA(X)q a:

( )2F

2

Fq

qX

X~

)X(BSMA

= .100%

Teorema 9.11.

Sean XMnxp() y 1, 2, , p. Si 1, 2, , p son los autovalores de lamatriz XtX tales que 12 p entonces:

=

=

=p

1ii

q

1i i

q)X(BSMA .100%

Demostracin

Por definicin:

( )2

F

2

Fq

q

X

X~

)X(BSMA

= .100%

Tambin por definicin:

1. =

==

=

q

1iiq

tq

2

qt

q

2

Fq )X

~)X

~((Traza)X

~)X

~((TrazaX

~.

2. ( ) =

==

=

p

1ii

t2

t2

F)XX(Traza)XX(TrazaX .

En consecuencia,


347

=

=

=p

1ii

q

1ii

q)X(BSMA .100%


En relacin a los ejemplos aplicados 9.2., y 9.3., se tiene que:

12423

23)X(BSMA 1 +++

= .100% = 76,67%

y

12423

423)X(BSMA

2 +++

+= .100% = 90,00%

Se aprecia que el subespacio de mejor ajuste mnimo cuadrtico de dimensin1 tiene una bondad de la aproximacin del 76,67%, medida que esrelativamente alta y bastante buena para ser 1 dimensin. Sin embargo, elsubespacio de mejor ajuste mnimo cuadrtico de dimensin 2 tiene unabondad de la aproximacin del 90%, medida que es excelente por lo cualresulta el subespacio de mejor ajuste mnimo cuadrtico idneo para analizar elcomportamiento de los vectores filas de X (elementos).


18/20


19/20


20/20


352

13.3. Calcule y grafique las componentes de proyeccinortogonal de las filas de la matriz de datos sobre el sub-espacio de 3 generado en el apartado 13.1. Realice einterprete el grfico.

14. Se le consult a un grupo de diez (10) personas si les gusta o no hacerlas siguientes actividades: Ir al Cine, Ir a la Playa, Pasear enCentros Comerciales. y Rumbear. Para ello se utiliz la siguienteescala: 1: Si les gusta y 0: No les gusta. A continuacin se muestranlos resultados:

Persona Ir al Cine Ir a la Playa Pasear en C.C. Rumbear

A 1 1 0 0

B 0 0 1 1

C 1 1 0 1

D 1 1 0 0E 0 1 0 0

F 0 0 0 1

G 0 1 0 0

H 1 1 1 1

I 0 1 0 0

J 1 0 1 0

14.1. Determine el sub-espacio de ajuste mnimo cuadrtico a lasfilas de la matriz de datos anterior que Ud. mejor considerepara este caso. Justifique su respuesta.

14.2. Interprete la estructura general de la(s) componente(s) deproyeccin.

14.3. Calcule y grafique las componentes de proyeccin de lasfilas de la matriz de datos sobre el sub-espacio de 4generado en el apartado 16.1. Interprete el grfico.

Capitulo 9 Interpretaciones Geometricas

Documents

Transcript of Capitulo 9 Interpretaciones Geometricas

construcciones geometricas

FIGURAS GEOMETRICAS LOGICO MATEMÁTICO. ¿QUÉ FIGURAS GEOMETRICAS CONOCES?

Roscas Geometricas

Correcciones Geometricas

Progresiones geometricas

Formas geometricas

demostraciones geometricas

Transformaciones Geometricas

Fotografias geometricas

figuras geometricas