Post on 08-Apr-2018
8/6/2019 Capitulo 9 Interpretaciones Geometricas
1/20
Captulo 9 INTERPRETACIONES
GEOMTRICAS
9.1. INTRODUCCIN.
En este captulo se presenta el tema del lgebra Lineal que mayor contribucintiene en el Anlisis de Datos Multivariante como lo son las InterpretacionesGeomtricas. Se exponen sus principales tpicos asociados como lo son laRepresentacin Grfica de los Vectores Filas y Columnas de una Matriz de
Datos, ngulo entre 2 vectores y Rectas y Planos en
n
, y los Subespacios deMejor Ajuste Mnimo Cuadrtico, herramienta que justamente es la quepermite la reduccin de datos.
9.2. REPRESENTACIN GRFICA DE LOS VECTORES FILAS YVECTORES COLUMNAS DE UNA MATRIZ DE DATOS.
Sea XMnxp() una matriz de datos. Dicha matriz tiene n vectores filas quepuede representarse grficamente como puntos en p; estos puntos representana los elementos. Igualmente tiene p vectores columnas que puedenrepresentarse grficamente como puntos en n; estos puntos representan a lasvariables. Si p = 1, 2, 3 es posible representar grficamente a los elementos
pero si p 4 esto resulta imposible. De la misma forma, si n = 1, 2, 3 esposible representar grficamente a las variables pero si n 4 esto resultaimposible. De all que es ms factible representar grficamente a los elementosde una matriz de datos que a las variables siempre y cuando se midan a losumo 3 variables.
Ejemplo Aplicado 9.1.
Consideremos la matriz de datos cuyas columnas son las 2 primeras columnasde la matriz de datos del ejemplo aplicado 1.3.:
=
0913
1012
1315
1917
1408
12101112
X
En este caso se pueden representar grficamente los 7 vectores filas(elementos) sobre 2 (Figura 9.1.).
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
315
Figura 9.1.
El grfico obtenido es un grfico de dispersin. A primera vista se observan 3
grupos de elementos: {C, B}, {A, F, G} y {E, D}. Sin embargo, no se disponede mayor informacin para caracterizar esos grupos. Para ello, consideremos lamatriz de datos centrada:
=
57,357,0
57,243,0
43,057,2
43,657,4
43,143,4
57,043,2
57,143,0
X
La representacin grfica de los 7 vectores filas (elementos) sobre 2 se puedeapreciar en la figura 9.2.:
Figura 9.2.
En este caso el punto (0,0) representa el punto de medias de las 2 columnas de
X , de manera que los 4 cuadrantes del grfico anterior tienen caractersticasparticulares:
8/6/2019 Capitulo 9 Interpretaciones Geometricas
2/20
8/6/2019 Capitulo 9 Interpretaciones Geometricas
3/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
318
Igualando (1) y (2) se tiene que:
)(CosYX2YXYX2YX22t22 +=+
YX2)(CosYX2 t= YX)(CosYX t=
YX
YX)(Cos
t
=
Teorema 9.2.
Sea XMnxp() una matriz de datos. Entonces el coseno del ngulo entre los
vectores hX y jX es:
hjr)(Cos =
Siendo rhj el coeficiente de correlacin lineal de Pearson entre las variablesh-sima y j-sima.
Demostracin
1. = =
===n
1i
n
1ihjjijhihijih
jth nS)XX)(XX(XXX)X(
2. h2hn
1i
2hih
n
1i
2ih
hthh
SnnS)XX()X(X)X(X ===== ==
3. j2jn1i
2jij
n
1i
2ij
jtjj SnnS)XX()X(X)X(X ===== ==
Luego,
hjjh
hj
jh
hj rSS
S
SnSn
nS)(Cos ===
Es decir, el coseno del ngulo entre los vectores hX y jX coincide con elcoeficiente de correlacin lineal de Pearson entre las variables h-sima y
j-sima.
Definicin 9.1.
Sean X, Yn tales que X Y. Se define como recta que pasa por X e Y, y sedenota por LYX al conjunto:
LYX = {Zn: Z = Y + c(X Y); c}
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
319
El vector (X Y) se dice que es el vector director de la recta LYX. Si Y = nx1entonces la recta LX es una recta en n que pasa por el origen nx1. La figura9.4., muestra una recta LX en
3.
Figura 9.4.
Ejemplo 9.1.
Sean X, Y3 los vectores:
X =
2
2
1
, Y =
3
0
1
En este caso,
X Y =
5
2
2
Luego,
LYX = {Z3: Z =
3
0
1
+ c
5
2
2
; c}
Ejemplo 9.2.
Sea X3 el vector:
X =
3
2
1
LX
8/6/2019 Capitulo 9 Interpretaciones Geometricas
4/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
320
La recta que pasa por el origen 3x1 y el vector X es:
LX = {Z3: Z = c
3
2
1
; c}
Teorema 9.3.
Sea Xn. Entonces la Recta LX es un subespacio de n.
Demostracin
Por definicin:
LX = {Zn: Z = cX; c}
Veamos que LX es un subespacio de n.
1. Es claro que si c = 0 entonces Z = 0X = nx1. Luego, nx1LX.2. Sean Z1, Z2LX. Luego, existen c1, c2 tales que Z1 = c1X y
Z2 = c2X. Luego, dZ1 + Z2 = d(c1X) + c2X, es decir,
dZ1 + Z2 = (dc1 + c2)X; d. Por lo tanto, (dZ1 + Z2)LX.
Por consiguiente, LX es un subespacio de n.
Teorema 9.4.
Sean X, Yn. Entonces la Proyeccin Ortogonal de Y sobre la Recta LX es:
( )XoyPr YLYL XX =
Siendo ( )XX
XYt
tYL X
=
la componente de proyeccin.
Demostracin
Por el teorema 9.3., LX es un subespacio de n. Es claro que V = n es un
espacio eucldeo con el producto interno usual YXY,X t=>< , X, Yn.
Por definicin de proyeccin ortogonal (definicin 5.6.):
YWoyPr =
=
>
8/6/2019 Capitulo 9 Interpretaciones Geometricas
5/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
322
= (Yt ( XXX
XYt
t
)t)(Y XXX
XYt
t
)
= (Yt tt
t
X)XX
XY( )(Y X
XX
XYt
t
)
= YtY Yt X)XXXY(
t
t YX)
XXXY( t
t
t+ t
t
tX)
XXXY( X
XXXY
t
t
= YtY XY)XX
XY( t
t
t
XY)XX
XY( t
t
t
+ XX)XX
XY)
XX
XY( t
t
t
t
t
= YtY 2 XY)XX
XY( t
t
t
+ XY)XX
XY( t
t
t
= YtY XY)XX
XY( t
t
t
= Yt
Y )XX
XX
(XY)XX
XY
( t
tt
t
t
= YtY XX)XX
XY( t2
t
t
= YtY XX)( t2YL X
2. d2( YL XoyPr , nx1) = || YL XoyPr ||2 = ( YL XoyPr )t YL XoyPr = ( )( ) ( )XX YL
tYL XX
= ( ) XX t2YL X
Ejemplo 9.3.
Consideremos la recta LX del ejemplo 9.2.:
LX = {Z3: Z = c
3
2
1
; c}
Calculemos la proyeccin ortogonal del vector Y =
1
2
3
sobre la recta LX:
X)(oyPr YLYL XX
=
La componente de proyeccin es:
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
323
[ ]
[ ]
14
2
3
2
1
321
3
2
1
123
XX
XY)(
t
tYL X
=
==
Luego,
=
==
73
72
71
3
2
1
14
2X)(oyPr YL
YL XX
Adems,
d2(Y, LX) = YtY XX)( t2YL X
= [ ] [ ]
3
2
1
32114
2
1
2
3
1232
= 14196
414
=7214
=7
96
Finalmente,
7
214.
14
2XX)(),oy(Prd
2t2Y
L1x3YL
2XX
=
==
Definicin 9.2.
Sean X0, X1, X2, , Xpn vectores L.I. Se define como plano de dimensin
p+1 en n generado por los vectores X0, X1, X2, , Xp y se denota por n 1pP + al
conjunto:
=
+ =+==p
1jj
jj
0nn1p p}...,2,,1j,B;XBXZ:Z{P
8/6/2019 Capitulo 9 Interpretaciones Geometricas
6/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
324
Si X0 = nx1 entonces se dice que el plano pasa por el origen, es generado por
los vectores L.I. X1, X2, , Xp y se denota por npP . Es claro que si Zn
1pP +
entonces Z es combinacin lineal de los vectores X0, X1, X2, , Xp.
Por otro lado,
Si Z n 1pP + entonces =
+=p
1j
jj
0 XBXZ , es decir:
[ ]
=
p
2
1p210
B
B
B
1
XXXXZ
M
L = XB
Siendo XMnx(p+1)() = [X0 X1 X2 . Xp] y Bp+1 =
p
2
1
B
B
B
1
M
De modo que:
}B),(MX;XBZ:Z{P 1p1)nx(pnn 1p +++ ==
En particular, si p = 1 entonces:
10XX11
10nn
11 L}B;XBXZ:Z{P =+==+
Si adems X0 = nx1 entonces:
}B),(MX;XBZ:Z{P pnxpnn
p ==
Para p = 1 entonces:
1X11
1nn
1 L}B;XBZ:Z{P ===
En la figura 9.6., se puede apreciar un plano 3pP .
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
325
Figura 9.6.
Ejemplo 9.4.
Sean X1, X23 los vectores:
X1 =
2
2
1
, X2 =
3
0
1
El plano de dimensin 2 en 3 que pasa por el origen y es generado por los
vectores X1
y X2
es:
}B;XBZ:Z{}B,B;
3
0
1
B
2
2
1
BZ:Z{P 23212133
2 ==
+
==
Siendo:
=
32
02
11
X y
=
2
1
B
BB
Teorema 9.5.
Sean X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I. Entonces
el plano npP que pasa por el origen y es generado por los vectores
X1, X2, , Xp es un subespacio de n.
Demostracin
Por definicin:
3pP
X1X2
Xp
8/6/2019 Capitulo 9 Interpretaciones Geometricas
7/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
326
=
===p
1jj
jj
nnp p}...,2,,1j,B;XBZ:Z{P
Veamos que npP es un subespacio de n.
1. Es claro que si B1 = B2 = = Bp = 0 entonces Z = nx1. Luego,nx1
npP .
2. Sean Z1, Z2 npP . Luego, existen Bij; i = 1, 2; j = 1, 2, , p talesque
=
=p
1j
jj1
1 XBZ y =
=p
1j
jj2
2 XBZ . Luego,
dZ1 + Z2 = ==
+p
1j
jj2
p
1j
jj1 XBXBd , es decir,
dZ1 + Z2 = =
+p
1j
jj2j1 X)BdB( ; d. Por lo tanto, (dZ
1 + Z2) npP .
Por consiguiente, npP es un subespacio de n.
Teorema 9.6.
Sean Y, X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I.
Entonces la Proyeccin Ortogonal de Y sobre el plano npP generado por los
vectores X1, X2, , Xp es:
HYoyPr YPnp
=
Siendo:
1. X = [ p21 XXX L ]2. t1t X)XX(XH = . Esta matriz se denomina Matriz de Proyeccin.
Demostracin
Por el teorema 9.5., npP es un subespacio de n. Es claro que V = n es un
espacio eucldeo con el producto interno usual YXY,X t=>< , X, Yn.Por definicin de proyeccin ortogonal (definicin 5.6.):
YWoyPr =
=
><
====
Luego,
Y
PnpoyPr =
= =
p
1j
p
1i
ijij ))XC(D(
YPnpoyPr = = =p
1j
p
1i
ijij XCD
YPnp
oyPr = = =
p
1i
p
1j
ijij XCD
YPnp
oyPr = [ p21 XXX L ]
=
=
=
p
1jjpj
p
1j2jj
p
1j1jj
CD
CD
CD
M
YPnp
oyPr = [ p21 XXX L ]
p
2
1
ppp2p1
2p2212
1p2111
D
D
D
CCC
CCC
CCC
M
L
MMM
L
L
8/6/2019 Capitulo 9 Interpretaciones Geometricas
8/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
328
YPnp
oyPr = [ p21 XXX L ]
=
=
=
p
1i
tipi
p
1i
tii2
p
1i
tii1
ppp2p1
2p2212
1p2111
Y)X(C
Y)X(C
Y)X(C
CCC
CCC
CCC
ML
MMM
L
L
YPnp
oyPr = [ p21 XXX L ] Y
)X(C
)X(C
)X(C
CCC
CCC
CCC
p
1i
tipi
p
1i
tii2
p
1i
tii1
ppp2p1
2p2212
1p2111
=
=
=
ML
MMM
L
L
YPnp
oyPr =
[ p21 XXX L ] Y
)X(
)X(
)X(
CCC
CCC
CCC
CCC
CCC
CCC
tp
t2
t1
pp2p1p
p22221
p11211
ppp2p1
2p2212
1p2111
M
L
MMM
L
L
L
MMM
L
L
YPnp
oyPr = [ p21 XXX L ]
Y)X(
)X(
)X(
CCCCC
CCCCC
CCCCC
tp
t2
t1
p
1r
2rp
p
1r2rrp
p
1r1rrp
p
1r
rp2r
p
1r
22r
p
1r
1r2r
p
1rrp1r
p
1r2r1r
p
1r
21r
===
===
===
M
L
MMM
L
L
YPnp
oyPr = XCXtY; siendo:
=
===
===
===
p
1r
2rp
p
1r2rrp
p
1r1rrp
p
1rrp2r
p
1r
2
2r
p
1r1r2r
p
1rrp1r
p
1r2r1r
p
1r
21r
CCCCC
CCCCC
CCCCC
C
L
MMM
L
L
una matriz de orden pxp
Por otra parte,
np
Y
PPoyPr n
p (Y Y
PnpoyPr ) npP
(Y YPnp
oyPr ) Xj; j = 1, 2, , p (Ver figura 9.7. en 3)
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
329
Figura 9.7.
Luego,
(Y YPnp
oyPr )tXj = 0
(Y YPnp
oyPr )tXj = 0
YtXj ( YPnp
oyPr )tXj = 0
YtXj = ( YPnp
oyPr )tXj
Por lo tanto,
[ pt2t1t XYXYXY L ] = [ ptYP
2tYP
1tYP
X)oy(PrX)oy(PrX)oy(Pr np
np
np
L ]
Yt[ p21 XXX L ] = tYP
)oy(Pr np
[ p21 XXX L ]
YtX = tYP
)oy(Pr np
X
(YtX)t = ( tYP
)oy(Pr np
X)t
XtY = Xt YPnp
oyPr
XtY = XtXCXtY
Como X tiene sus p columnas L.I. entonces Rango(X) = p. En consecuencia,por el teorema 8.10., la matriz XtX es definida positiva y por lo tanto nosingular. Luego,
(XtX)-1XtY = CXtY ((XtX)-1 C)XtY = px1
Como XtY px1 entonces (XtX)-1 C = pxp. Por consiguiente, C = (X
tX)-1. Deesta forma:
3pP
X1 X2
XpYP3p
oyPr
)oyPrY( YP3p
Y
8/6/2019 Capitulo 9 Interpretaciones Geometricas
9/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
330
Y
PnpoyPr = XCXtY = X(XtX)-1XtY = HY
Observaciones:
1. Por el teorema 5.11., d2(Y, npP ) = d2(Y, YPnpoyPr ), es decir:d2(Y, npP ) = d
2(Y, HY)
= (Y HY)t(Y HY)= ((In H)Y)
t(In H)Y= Yt(In H)
t(In H)Y= YtQtQY
Siendo Q = In H. Las matrices Q y H son simtricas eidempotentes (ver Ejercicio 23, Captulo 1).
Por lo tanto:
d2(Y, npP ) = YtQY
Es decir, el cuadrado de la distancia de un vector Y al plano npP es
una forma cuadrtica con matriz simtrica asociada Q, la cual porser simtrica e idempotente de orden nxn y de rango n p essemidefinida positiva.
En particular, si los p vectores columnas que generan el planonpP
forman una base ortonormal de n entonces ( ) 1XX jtj = , j = 1, 2, , p y XtX = Ip. Luego, Q = In H = In XXt y
( )jt
jtj
jtY
L XYXX
XYjX
==
. En consecuencia:
d2(Y, npP ) = YtQY = Yt(In XX
t)Y
= YtY YtXXtY
= Y)X(XYYY
n
1i
tii
tt
=
= Y)X(XYYYn
1j
tjjtt =
= =
n
1j
tjjtt Y)X(XYYY
= )Y)X)((XY(YYn
1j
tjjtt =
= )XY)(XY(YY
n
1j
jtjtt
=
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
331
= =
n
1j
2jtt )XY(YY
= =
n
1j
2Y
Lt
jXYY
2. d2( YPnp
oyPr , nx1) = (Y
PnpoyPr )t Y
PnpoyPr = (HY)t(HY) = YtHtHY =
YtHY. Es decir, el cuadrado de la longitud de la proyeccin
ortogonal de Y sobre el plano npP es una forma cuadrtica con
matriz simtrica asociada H, la cual por ser simtrica e idempotentede orden nxn y de rango p es semidefinida positiva.
3. Si los vectores X1, X2, , Xp forman una base ortonormal de nentonces XtX = Ip. Luego, H = XX
t y Q = Ip XXt. En
consecuencia:
3.1. YPnp
oyPr = HY = XXtY.
3.2. d2(Y, npP ) = Yt(Ip XXt)Y.3.3. d2( Y
PnpoyPr , nx1) = Y
tXXtY.
Ejemplo 9.5.
Consideremos el plano 32P del ejemplo 9.3.:
}B,B;
3
0
1
B
2
2
1
BZ:Z{P 212133
2
+
==
Calculemos la proyeccin ortogonal del vector Y =
1
2
3
sobre el plano 32P :
En este caso,
=
32
02
11
X
Luego,
=
=
107
79
32
02
11
301
221XX t
8/6/2019 Capitulo 9 Interpretaciones Geometricas
10/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
332
Se puede determinar que:
=
419
417
417
4110
)XX( 1t
La matriz de proyeccin es:
t1t X)XX(XH =
=
=
4137
41241
1241
241
40416
4112
416
415
301
221
419
417
417
4110
32
02
11
H
Por lo tanto,
=
==
4177
4164
4115
1
2
3
4137
41241
1241
241
40416
4112
416
415
HYowPr YP32
Por otra parte,
=
==
41441
241
12412411416
4112
41641
36
4137
412
4112
4124140416
4112
416
415
100010
001
HIQ 3
En consecuencia,
d2(Y, 32P ) = [ ]123
41441
241
1241
241
1416
4112
41641
36
1
2
3
=41
324
Finalmente,
d2( YP32
oyPr , 3x1) = YtHY = [ ]41
250
4177
4164
4115
123 =
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
333
9.4. SUBESPACIOS DE MEJOR AJUSTE MNIMO CUADRTICO.
Definicin 9.3.
Sea XMnxp() tal que Rango(X) = p. Se define como subespacio de mejor
ajuste mnimo cuadrtico de dimensin q (q < p) al conjunto de vectores filasde X y se denota por q)X(SMA al plano generado por vectores ortonormales
V1, V2, , Vq que verifica que =
n
1iqi
2 ))X(SMA,X(d es mnima.
Observaciones:
1. Como )oyPr,X(d))X(SMA,X(d iq
X)X(SMAi
2qi
2 = entonces el
subespacio de mejor ajuste mnimo cuadrtico q)X(SMA es aquel
que verifica que =
n
1i
X)X(SMAi
2 )oyPr,X(d iq
es mnima.
2. Si X es una matriz de datos entonces independientemente del valorde p es posible representar los vectores filas (elementos) de X sobreun plano de dimensin q (q = 1, 2, 3).
Teorema 9.7.
Sea XMnxp() tal que Rango(X) = p. Entonces se cumple que:
1)X(SMA = 1VL
Siendo V1 el autovector normalizado de la matriz XtX asociado con su mayorautovalor.
Demostracin
Por definicin, el subespacio de mejor ajuste mnimo cuadrtico 1)X(SMA es
el plano de dimensin 1 generado por un vector normalizado V1 con la
condicin (V1)tV1 = 1 que verifica que
=n
1i 1i
2 ))X(SMA,X(d es mnima. Es
claro que SMA(X)1 es la recta 1VL (ver figura 9.8., en 3).
8/6/2019 Capitulo 9 Interpretaciones Geometricas
11/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
334
Figura 9.8.
Ahora bien,
)oyPr,X(d)L,X(d))X(SMA,X(d i1V
1X
Li2
Vi2
1i2
==
Por la observacin 1 del teorema 9.4.:
( ) 1t12
XLi
ti
XLi
2 VVX)X()oyPr,X(d i1V
i
1V
=
Pero ( ) 1VV 1t1 = . Luego,
2X
Lit
iX
Li2 i
1V
i
1VX)X()oyPr,X(d
=
=
n
1i
XLi
2 )oyPr,X(d i1V
= =
n
1ii
ti X)X(
=
n
1i
2XL
i
1V
El trmino =
n
1ii
ti X)X( es constante. Por lo tanto, minimizar
=
n
1i
XLi
2 )oyPr,X(d i1V
equivale a maximizar
=
n
1i
2XL
i
1V
, expresin que puede
escribirse de la siguiente manera:
=
n
1i
2XL
i
1V=
( )=
n
1i
2
t1
1ti
V)V(
VX
= ( )( )=
n
1i
21ti VX
= ( )( ) ( )( )=
n
1i
1ti
1ti VXVX
1
1V
XLoyPr
1V
L
X1 )L,X(d 1V1
X22
1V
XLoyPr
Xnn
1V
XLoyPr
)L,X(d 1V2
)L,X(d 1Vn
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
335
= ( ) ( )( )=
n
1i
1tii
t1 VXX)V(
= 1n
1i
tii
t1 V)X(X)V(
=
= [ ]
( )( )
( )
1
tn
t2
t1
n21t1 V
X
X
X
XXX)V(
ML
= 1tt1 XVX)V(
Es decir, =
n
1i
2X
Li
1Ves una forma cuadrtica con matriz simtrica asociada
XtX. Por lo tanto, el subespacio de mejor ajuste mnimo cuadrtico dedimensin 1 es la recta 1VL que maximiza la forma cuadrtica (V
1)tXtXV1
con la restriccin (V1)tV1 = 1. Para hallar el vector V1 utilizaremos el mtodode los multiplicadores de Lagrange:
Definimos las funciones:
f(V1) = (V1)tXtXV1 y g(V1) = (V1)tV1 1
La expresin (V1)tV1 es una forma cuadrtica con matriz simtrica asociada Ip.
Luego,
)V(g)V(f 11 =
)VI2(XVX2 1p1t =
11t V2XVX2 =
11t VXVX =
11t VXVX =
Por lo tanto, el multiplicador de Lagrange es autovalor de la matriz XtX con
autovector asociado V1
. Adems, si premultiplicamos a ambos lados de laigualdad anterior por (V1)t se obtiene que:
=== 1t11t11tt1 V)V()V()V(XVX)V(
f(V1) =
Es decir, maximizar f(V1) sujeto a (V1)tV1 = 1 equivale a maximizar , siendoste ltimo autovalor de XtX con autovector asociado V1. En consecuencia, elvector V1 es el autovector normalizado asociado al mayor autovalor de lamatriz XtX.
8/6/2019 Capitulo 9 Interpretaciones Geometricas
12/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
336
Observacin:
Las filas de X en lugar de representarse en p se pueden representar en el
subespacio de ajuste mnimo cuadrtico )X(Pp1 = 1VL a travs de su
proyeccin ortogonal sobre dicha recta, especficamente a travs de sucomponente de proyeccin, la cual toma la siguiente forma:
( ) ( ) ( ) 1ti1t
i1t1
1tiX
L VX1
VX
V)V(
VXi
1V===
= [ ]
( )( )
( )
p1
21
11
ip2i1i
V
V
V
XXXM
L = ( )=
p
1jj
1ij VX
Es decir, la componente de proyeccin de la i-sima fila de X sobre la recta demejor ajuste mnimo cuadrtico es una combinacin lineal de las medicionesde las p variables sobre el i-simo elemento. De tal forma que el coeficiente
( )j1V mide la contribucin de la j-sima variable en la componente. Estopermite caracterizar intervalos de la recta de mejor ajuste mnimo cuadrticopara as caracterizar los grupos de elementos de X cuyas componentes deproyeccin se encuentran en dichos intervalos.
Para obtener el vector de componentes de proyeccin se hace lo siguiente:
11
tn
t2
t1
1tn
1t2
1t1
XL
XL
XL
XL XVV
)X(
)X()X(
V)X(
V)X(V)X(
n
1V
2
1V
11V
1V=
=
=
=
MMM
Ejemplo Aplicado 9.2.
En el perodo II-2004 se le consult a un grupo de once (11) alumnos del cursode Algebra Lineal II su apreciacin acerca del nivel de dificultad de las cuatro(4) materias del 4 semestre de la EECA, es decir, Algebra Lineal II,
Matemtica IV, Introduccin a la Economa y Teora de la Probabilidad II.Para cada respuesta se adopt la siguiente escala:
1: Nivel de dificultad alto.0: Nivel de dificultad medio.-1: Nivel de dificultad bajo.
Los resultados de la consulta se muestran a continuacin:
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
337
AlumnoAlgebraLineal II
MatemticaIV
Introduccin ala Economa
Teora de laProbabilidad II
A 1 -1 -1 1B 1 0 -1 0C 1 0 -1 1
D 1 -1 -1 1E 0 0 -1 1F 1 0 0 0G 1 0 -1 1H 1 0 -1 1I 1 1 -1 1J 1 -1 0 0K 1 0 0 1
Determinemos 1)X(SMA .
En este caso, la matriz de datos es:
=
1001
0011
11111101
1101
0001
1100
1111
1101
0101
1111
X
Se puede verificar que:
=
8717
7817
1142
77210
XX t
Igualmente se puede constatar que los autovalores y autovectoresortonormalizados de la matriz XtX son:
231 = , 42 = , 23 = y 14 =
=
5518,0
5518,0
1226,0
6131,0
V1 ,
=
2294,0
2294,0
9177,0
2294,0
V2 ,
=
3780,0
3780,0
3780,0
7559,0
V3 y
=
7071,0
7071,0
0
0
V4
8/6/2019 Capitulo 9 Interpretaciones Geometricas
13/20
8/6/2019 Capitulo 9 Interpretaciones Geometricas
14/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
340
Siendo p2P el plano de dimensin 2 en p generado por los vectores V1 y V2,
autovectores ortonormalizados de la matriz XtX asociados con sus 2 mayoresautovalores.
Demostracin
Por definicin el subespacio de mejor ajuste mnimo cuadrtico 2)X(SMA es
el plano de dimensin 2 generado por 2 vectores ortonormalizados V1 y V2((V1)tV1 = 1, (V2)tV2 = 1 y (V1)tV2 = 0) que verifica que
=
n
1i
X)X(SMAi
2 )oyPr,X(d i2
es mnima, es decir, es el plano p2P generado por los
vectores V1 y V2 que verifica que =
n
1i
X
Pi2 )oyPr,X(d ip
2es mnima (ver figura
9.11., en 3).
Figura 9.11.
El vector V1 necesariamente debe ser el vector director de la recta de mejorajuste mnimo cuadrtico SMA(X)1, ya que de lo contrario existira otro planode dimensin 2 mejor. El objetivo es determinar el vector V2.
Ahora bien,
)oyPr,X(d)P,X(d))X(SMA,X(dip2
X
Pi2p
2i2
2i2
==
Como V1 y V2 forman una base ortonormal de p entonces por la observacin1 del teorema 9.6., se tiene que:
2X
L
2X
Lit
iX
Pi2 i
2V
i
1V
ip2
X)X()oyPr,X(d
=
=
n
1i
XLi
2 )oyPr,X(d i1V
= =
n
1ii
ti X)X(
=
n
1i
2XL
i
1V
=
n
1i
2XL
i
2V
De forma anloga al teorema anterior se deduce que:
132
X
PoyPr
32P
X1 )P,X(d 321X2
232
X
PoyPr Xn
n32
X
PoyPr )P,X(d 322
)P,X(d 32n
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
341
=
n
1i
XLi
2 )oyPr,X(d i1V
= =
n
1ii
ti X)X( ( ) 1t
t1 XVXV ( ) 2tt2 XVXV
=
n
1i
XLi
2 )oyPr,X(d i1V
= =
n
1ii
ti X)X( 1 ( ) 2t
t2 XVXV
Donde 1 es el mayor autovalor de XtX y el trmino =
n
1ii
ti X)X( es constante.
Por lo tanto, minimizar =
n
1i
XLi
2 )oyPr,X(d i1V
equivale a maximizar la forma
cuadrtica 2tt2 XVX)V( con las restricciones (V2)tV2 = 1 y (V2)tV1 = 0. Para
hallar el vector V2 utilizaremos el mtodo de los multiplicadores de Lagrange:Definimos las funciones:
f(V2
) = (V2
)t
Xt
XV2
, g(V2
) = (V2
)t
V2
1 y h(V2
) = (V2
)t
V1
La expresin (V2)tV2 es una forma cuadrtica con matriz simtrica asociada Ipy (V2)tV1 es una funcin lineal en V2.
Luego,
)V(h)V(g)V(f 212
22 +=
112
p22t V)VI2(XVX2 +=
112
22t VV2XVX2 +=
( ) ( ) ( )( ) ( ) ( ) 11
t222
t22tt2
11t122t12tt1
VVV2VXVX2VVVV2VXVX2V
+=+=
( ) ( ) ( )( ) ( ) ( ) 1t212
t22
2tt2
1t11
2t12
2tt1
VVVV2XVXV2
VVVV2XVXV2
+=
+=
( )( ) 0.1.2XVXV2
1.0.2XVXV2
122tt2
122tt1
+=
+=
( )
( ) 22tt2
12tt1
XVXV
XVXV2
=
=
Ahora bien, V1 es autovector de XtX con autovalor asociado 1, es decir,XtXV1 = 1V1. Por lo tanto:
(XtXV1)t = (1V1)t
(V1)tXtX = 1(V1)t
En consecuencia,
( ) 22tt2
12t1
1
XVXV
V)V(2
=
= ( ) 22t
t211
XVXV
0.2
=
= ( ) 22t
t21
XVXV
0
=
=
8/6/2019 Capitulo 9 Interpretaciones Geometricas
15/20
8/6/2019 Capitulo 9 Interpretaciones Geometricas
16/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
344
Figura 9.12.
Se puede observar que el grfico se divide en 2 cuadrantes; el I y el IV. En el Icuadrante se encuentran los alumnos cuyas componentes son positivas conrespecto a V1 y V2, es decir, los alumnos que en general opinan que lgebraLineal II, Matemtica IV y Teora de la Probabilidad II son materias con altonivel de dificultad. En el IV cuadrante se encuentran los alumnos cuyascomponentes son positivas con respecto a V1 y negativas con respecto a V2, esdecir, los alumnos que en general opinan que lgebra Lineal II y Teora de laProbabilidad II son materias con alto nivel de dificultad pero Matemtica IVtiene bajo nivel de dificultad. De esta forma se pueden obtener con mayorprecisin grupos de alumnos internamente homogneos y externamenteheterogneos (figura 9.13.).
Figura 9.13.
Teorema 9.10.
Sean XMnxp() tal que Rango(X) = r, VMpxr() y UMnxr(). Si V y Uson las matrices cuyas columnas son los autovectores ortonormalizados de lasmatrices XtX y XXt, respectivamente, asociados con los autovalores comunesno nulos entonces:
tV)A(UDX
=
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
345
Siendo )A(D
Mrxr() la matriz diagonal definida por:
( )
==
jisi0
jisi)A(D i
ij
Donde 1, 2, , r son los autovalores comunes no nulos de XtX y XXt.
Demostracin
Por el teorema 7.23., se sabe que:
=
=r
1i
tiii )V(UX
[ ]( )( )
( )
=
tr
t2
t1
rr
22
11
V
V
V
UUUXM
L
[ ]( )( )
( )
=
tr
t2
t1
r
2
1
r21
V
V
V
00
00
00
UUUXM
L
MMM
L
L
L
tV)A(UDX
=
Definicin 9.4.
Sea XMnxp() tal que Rango(X) = p. Se define como matriz aproximada deX por el subespacio de mejor ajuste mnimo cuadrtico de dimensin q
q)X(SMA y se denota por qX~
a la matriz )(MX~
nxpq definida por:
tq V)A(UDX
~
=
Siendo VMpxq() y UMnxq() las matrices cuyas columnas son losautovectores ortonormalizados de las matrices XtX y XXt, respectivamente,asociados con los q mayores autovalores comunes de ambas matrices.
Definicin 9.5.
Sea XMnxp(). Se define como Norma de Frobenius de X y se denota por
FX al escalar siguiente:
FX = )XX(Traza t
8/6/2019 Capitulo 9 Interpretaciones Geometricas
17/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
346
Observacin:
Por el teorema 7.13. (lema de Schur), si 1, 2, , p son los autovalores
comunes no nulos de XtX entonces Traza(XtX) = =
p
1ii . Luego,
FX =
=
p
1ii
Definicin 9.6.
Sea XMnxp(). Se define como Medida de la Bondad del Ajuste delSubespacio de Mejor Ajuste Mnimo Cuadrtico de dimensin q a las filas deX y se denota por BSMA(X)q a:
( )2F
2
Fq
qX
X~
)X(BSMA
= .100%
Teorema 9.11.
Sean XMnxp() y 1, 2, , p. Si 1, 2, , p son los autovalores de lamatriz XtX tales que 12 p entonces:
=
=
=p
1ii
q
1i i
q)X(BSMA .100%
Demostracin
Por definicin:
( )2
F
2
Fq
q
X
X~
)X(BSMA
= .100%
Tambin por definicin:
1. =
==
=
q
1iiq
tq
2
qt
q
2
Fq )X
~)X
~((Traza)X
~)X
~((TrazaX
~.
2. ( ) =
==
=
p
1ii
t2
t2
F)XX(Traza)XX(TrazaX .
En consecuencia,
ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS
347
=
=
=p
1ii
q
1ii
q)X(BSMA .100%
Ejemplo Aplicado 9.4.
En relacin a los ejemplos aplicados 9.2., y 9.3., se tiene que:
12423
23)X(BSMA 1 +++
= .100% = 76,67%
y
12423
423)X(BSMA
2 +++
+= .100% = 90,00%
Se aprecia que el subespacio de mejor ajuste mnimo cuadrtico de dimensin1 tiene una bondad de la aproximacin del 76,67%, medida que esrelativamente alta y bastante buena para ser 1 dimensin. Sin embargo, elsubespacio de mejor ajuste mnimo cuadrtico de dimensin 2 tiene unabondad de la aproximacin del 90%, medida que es excelente por lo cualresulta el subespacio de mejor ajuste mnimo cuadrtico idneo para analizar elcomportamiento de los vectores filas de X (elementos).
8/6/2019 Capitulo 9 Interpretaciones Geometricas
18/20
8/6/2019 Capitulo 9 Interpretaciones Geometricas
19/20
8/6/2019 Capitulo 9 Interpretaciones Geometricas
20/20
CAPTULO 9: INTERPRETACIONES GEOMTRICAS
352
13.3. Calcule y grafique las componentes de proyeccinortogonal de las filas de la matriz de datos sobre el sub-espacio de 3 generado en el apartado 13.1. Realice einterprete el grfico.
14. Se le consult a un grupo de diez (10) personas si les gusta o no hacerlas siguientes actividades: Ir al Cine, Ir a la Playa, Pasear enCentros Comerciales. y Rumbear. Para ello se utiliz la siguienteescala: 1: Si les gusta y 0: No les gusta. A continuacin se muestranlos resultados:
Persona Ir al Cine Ir a la Playa Pasear en C.C. Rumbear
A 1 1 0 0
B 0 0 1 1
C 1 1 0 1
D 1 1 0 0E 0 1 0 0
F 0 0 0 1
G 0 1 0 0
H 1 1 1 1
I 0 1 0 0
J 1 0 1 0
14.1. Determine el sub-espacio de ajuste mnimo cuadrtico a lasfilas de la matriz de datos anterior que Ud. mejor considerepara este caso. Justifique su respuesta.
14.2. Interprete la estructura general de la(s) componente(s) deproyeccin.
14.3. Calcule y grafique las componentes de proyeccin de lasfilas de la matriz de datos sobre el sub-espacio de 4generado en el apartado 16.1. Interprete el grfico.