Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de...

30
Ingenier´ ıas: Aeroespacial, Civil y Qu´ ımica. Matem´ aticas I. 2010-2011. Departamento de Matem´ atica Aplicada II. Escuela Superior de Ingenieros. Universidad de Sevilla. Tema 6.- Ortogonalidad y mejor aproximaci´on. 6.1.- El producto escalar. Norma, distancia, ´angulos y ortogonalidad. Desigualdades y teorema de Pit´agoras. 6.2.- El complemento ortogonal de un subespacio. 6.3.- Bases ortogonales. Bases ortogonales de un subespacio. El m´ etodo de Gram-Schmidt. Matrices ortogonales. 6.4.- La proyecci´on ortogonal. Proyecci´on ortogonal sobre un subespacio. El teorema de la mejor aproximaci´on. 6.5.- Problemas de m´ ınimos cuadrados. Ecuaciones normales de Gauss. Regresi´onlineal. 6.7.- Ejercicios. 6.8.- Ap´ endice: MATLAB. En este tema estudiamos la estructura m´ etrica de los espacios R n , es decir, las cuestiones relacionadas con distancias y ´ angulos con especial ´ enfasis en la ortogonalidad entre vectores y entre subespacios vectoriales. En el estudio de la resoluci´on de sistemas de ecuaciones lineales, el ´algebra de matrices, etc., pod´ ıamos considerar coeficientes reales o complejos de manera indistinta sin afectar ni a los conceptos ni a los resultados. Aqu´ ı no sucede lo mismo. El hecho de considerar vectores reales es esencial. Para poder considerar conceptos etricos en los espacios C n , de vectores de coordenadas complejas, habr´ ıa que considerar la definici´on apropiada (coherente) de producto escalar de vectores complejos, que se suele denominar producto herm´ ıtico (ver el ap´ endice dedicado a MATLAB) y habr´ ıa que modificar el enunciado de algunas propiedades. Al aplicar dicha definici´on, de vectores complejos, a vectores reales nos dar´ ıa ladefinici´on usualque vemos a continuaci´on yque el alumno conoce en dimensiones dos y tres. Adem´as de considerar las definiciones y propiedades b´asicas estudiaremos algunos tipos de matrices directamente relacionadas con la estructura metrica de los espacios de coordenadas reales (matrices de proyecci´on ortogonal sobre un subespacio, matrices ortogonales,...) 173

Transcript of Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de...

Page 1: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

Ingenierıas: Aeroespacial, Civil y Quımica.Matematicas I. 2010-2011.

Departamento de Matematica Aplicada II.Escuela Superior de Ingenieros. Universidad de Sevilla.

Tema 6.- Ortogonalidad y mejor aproximacion.

6.1.- El producto escalar.

Norma, distancia, angulos y ortogonalidad.Desigualdades y teorema de Pitagoras.

6.2.- El complemento ortogonal de un subespacio.

6.3.- Bases ortogonales.

Bases ortogonales de un subespacio.El metodo de Gram-Schmidt.Matrices ortogonales.

6.4.- La proyeccion ortogonal.

Proyeccion ortogonal sobre un subespacio.El teorema de la mejor aproximacion.

6.5.- Problemas de mınimos cuadrados.

Ecuaciones normales de Gauss.Regresion lineal.

6.7.- Ejercicios.

6.8.- Apendice: MATLAB.

En este tema estudiamos la estructura metrica de los espacios Rn, es decir, las cuestionesrelacionadas con distancias y angulos con especial enfasis en la ortogonalidad entre vectoresy entre subespacios vectoriales. En el estudio de la resolucion de sistemas de ecuacioneslineales, el algebra de matrices, etc., podıamos considerar coeficientes reales o complejosde manera indistinta sin afectar ni a los conceptos ni a los resultados. Aquı no sucede lomismo. El hecho de considerar vectores reales es esencial. Para poder considerar conceptosmetricos en los espacios Cn, de vectores de coordenadas complejas, habrıa que considerarla definicion apropiada (coherente) de producto escalar de vectores complejos, que se sueledenominar producto hermıtico (ver el apendice dedicado a MATLAB) y habrıa que modificarel enunciado de algunas propiedades. Al aplicar dicha definicion, de vectores complejos, avectores reales nos darıa la definicion usual que vemos a continuacion y que el alumno conoceen dimensiones dos y tres.

Ademas de considerar las definiciones y propiedades basicas estudiaremos algunos tipos dematrices directamente relacionadas con la estructura metrica de los espacios de coordenadasreales (matrices de proyeccion ortogonal sobre un subespacio, matrices ortogonales,...)

173

Page 2: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

174 Tema 6.- Ortogonalidad y mejor aproximacion.

6.1.- El producto escalar. Norma, distancia, angulos y ortogonalidad.

El Producto escalar de dos vectores reales x, y ∈ Rn es el numero real

x · y = x1y1 + x2y2 + · · ·+ xnyn ∈ R.

6.1.1.- Norma, distancia, angulos y ortogonalidad.

Definiciones. Consideremos x, y ∈ Rn.

Se denomina Norma de un vector x ∈ Rn al numero real no-negativo

||x|| =q|x1|2 + · · ·+ |xn|2 =

√x · x ≥ 0.

Se denomina Distancia entre dos vectores x, y ∈ Rn al numero real no-negativo

d(x, y) = ||x − y|| .

Ortogonalidad.

(a) Se dice que dos vectores x, y ∈ Rn son ortogonales (x ⊥ y) si x · y = xT y = 0.

(b) Se dice que un conjunto de vectores {v1, . . . , vm} de Rn es un conjunto ortogonalsi cada uno de los vectores vk es ortogonal a todos los demas,

vk · vj = 0, j 6= k.

(c) Se dice que un conjunto de vectores {v1, . . . , vm} de Rn es un conjunto ortonor-mal si es un conjunto ortogonal y cada uno de los vectores vk tiene norma uno,

vk · vj = 0, j 6= k; ||v1|| = · · · = ||vm|| = 1.

Las propiedades del producto escalar, la norma, la distancia y la ortogonalidad son cono-cidas por el alumno para vectores en R2 y en R3. En los espacios Rn, las propiedades sonesencialmente las mismas. Notemos que si considerasemos dichos conceptos de forma inde-pendiente de un sistema de referencia, en cada uno de ellos aparecen involucrados uno o dosvectores. Algunas de las propiedades del producto escalar pueden obtenerse directamentedel hecho de que el producto escalar de dos vectores puede expresarse como un productomatricial, vector-fila por vector-columna, x · y = xT y = yTx. Es inmediato comprobar quese verifican las siguientes propiedades:Propiedades.-

(1) El producto escalar es simetrico: x · y = y · x.

(2) El producto escalar es lineal en cada variable, es decir, siendo x, x′, y, y′ ∈ Rn y

α, β, λ, µ ∈ R,(αx + βx′) · y = αx · y + βx′ · y,x · (λy + µy′) = λx · y + µx · y′.

(3) ||x|| = 0 ⇐⇒ x = 0.

(4) ||αx|| = |α| ||x|| , ∀α ∈ R, x ∈ Rn.

Notemos que el producto escalar No es asociativo. Es decir, puede suceder que (x · y)z 6=x(y · z). De hecho es lo mas probable. Ejercicio. Busca un ejemplo e interpreta geometrica-mente el resultado.

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 3: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.2.- El complemento ortogonal de un subespacio. 175

6.1.2.- Desigualdades y teorema de Pitagoras.

Teorema. Sean x, y ∈ Rn

(1) Desigualdad de Cauchy-Schwartz: |x · y| ≤ ||x|| ||y||.

(2) Desigualdad triangular: ||x + y|| ≤ ||x|| + ||y|| ( ||x − y|| ≤ ||x|| + ||y||)

(3) Teorema de Pitagoras: x ⊥ y ⇐⇒ ||x + y||2 = ||x||2 + ||y||2 .

Ejercicios.

1) Demuestra que ||x − y|| ≥ | ||x|| − ||y|| | , ∀ x, y ∈ Rn.

2) ¿Que relacion tiene que haber entre los vectores x y y para que se verifique cada una delas siguientes igualdades?

||x + y|| = ||x|| + ||y|| , |x · y| = ||x|| ||y|| , x · y = ||x|| ||y|| , x · y = − ||x|| ||y|| .

El angulo (los angulos) determinado por dos vectores no-nulos x, y ∈ Rn puede caracteri-zarse (definirse) mediante la igualdad

x · y = ||x|| ||y|| cos(θ).

Los resultados clasicos de la geometrıa metrica plana, como el Teorema del seno o el Teorema

del coseno, son validos cuando consideramos vectores n−dimensionales.

6.2.- El complemento ortogonal de un subespacio.

Definicion. (El complemento ortogonal de un subespacio) Dado un subespacio vectorial Sde Rn se denomina complemento ortogonal de S al conjunto

S⊥ = {v ∈ Rn : v ⊥ u ∀u ∈ S} .

Es decir, S⊥ esta formado por todos los vectores que son ortogonales a todos los vectores deS. Por tanto, el complemento ortogonal del subespacio nulo

�~0©

es Rn puesto que cualquiervector es ortogonal al vector nulo. Por otra parte, el complemento ortogonal del espacio totalRn es el subespacio nulo, puesto que el vector nulo (de Rn) es el unico que es ortogonal atodos los vectores de Rn.

Ejemplos. Cuando se trabaja con el complemento ortogonal de un subespacio es conve-niente tener presente como se puede caracterizar dicho complemento ortogonal cuando elsubespacio viene dado en forma parametrica o cuando viene dado en forma implıcita. En R2,un subespacio vectorial de dimension 1 es una recta que pasa por el origen y su complementoortogonal sera (como es natural) la recta que pasa por el origen (es un subespacio vectorial)y es perpendicular a la recta dada. En R3, un subespacio vectorial de dimension 1 es unarecta que pasa por el origen. Su complemento ortogonal sera el plano que pasa por el origen(es un subespacio vectorial) y es perpendicular a la recta dada. Un subespacio vectorial dedimension 2 es un plano que pasa por el origen. Su complemento ortogonal sera la recta quepasa por el origen (es un subespacio vectorial) y es perpendicular al plano dado.

Matematicas I. 2010-2011

Page 4: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

176 Tema 6.- Ortogonalidad y mejor aproximacion.

(1) Consideremos un subespacio de dimension 1 en R2, dado en forma parametrica, es decir,una recta que pasa por el origen de coordenadas, dada por un vector direccion v1. Porejemplo, para v1 = [2,−1]T

S = Gen {v1} = {v = αv1 : α ∈ R} ≡¨

x1 = 2αx2 = −α

,

su complemento ortogonal estara formado por los vectores v = [x1, x2]T ∈ R2 que son

ortogonales a todos los vectores de la forma αv1, α ∈ R

v ∈ S⊥ ⇔ (αv1) · v = 0, ∀α ∈ R ⇐⇒ v1 · v = 0 ⇔ 2x1 − x2 = 0.

Es decir, el complemento ortogonal S⊥ esta formado por los vectores v = [x1, x2]T ∈ R2

cuyas coordenadas verifican la ecuacion 2x1 − x2 = 0. Por tanto, S⊥ es un subespaciovectorial (de dimension 1) que viene dado en forma implıcita y los coeficientes de laecuacion implıcita son las coordenadas del vector direccion de S. Si hubieramos consi-derado otro vector direccion de S (que sera un multiplo no-nulo de v1), habrıamosobtenido una ecuacion equivalente.

(2) Si consideramos un subespacio vectorial S de dimension 1 en Rn, es decir una recta que

pasa por el origen, generada por un vector no-nulo v1 ∈ Rn

S = Gen

8><>:v1 =

2664 a1

...an

37759>=>;su complemento ortogonal estara formado por los vectores v = [x1, . . . , xn]T ∈ R

n

cuyas coordenadas verifican la ecuacion

v1 · v = 0 ≡ a1x1 + · · ·+ anxn = 0

con lo cual S⊥ es un subespacio vectorial (de dimension n−1) que viene dado medianteuna ecuacion implıcita y los coeficientes de dicha ecuacion son las coordenadas delvector direccion de S.

Teorema. Sea S un subespacio vectorial de Rn.

(1) S⊥ es un subespacio vectorial de Rn.

(2)�S⊥�⊥

= S.

(3) S ⊕ S⊥ = Rn. Es decir,

¨(a) S ∩ S⊥ = {0}(b) S + S⊥ = Rn

«.

Por tanto, todo vector v de Rn se puede expresar de forma unica como suma de unvector de S y un vector de S⊥. (Esto sera consecuencia del teorema de la proyeccionortogonal que veremos mas adelante).

(4) Si S = Gen {v1, . . . , vp}, entonces

v ∈ S⊥ ⇐⇒ v ⊥ v1, . . . , v ⊥ vp.

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 5: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.3.- Bases ortogonales. 177

Puesto que Rn = S ⊕ S⊥ cada vector v ∈ Rn se puede expresar de forma unica comov = u + w con u ∈ S y w = v − u ∈ S⊥. El vector u es la proyeccion ortogonal de v sobre Sy w es la proyeccion ortogonal de v sobre S⊥. El vector u = proyS(v) queda caracterizadopor

u = proyS(v) ⇐⇒¨

u ∈ Sv − u ∈ S⊥

«.

Ejemplo. Antes hemos obtenido el complemento ortogonal de un subespacio de Rn de di-mension 1, que era un subespacio vectorial de dimension n − 1 (estos subespacio se suelendenominar hiperplanos). Las propiedades anteriores permiten obtener facilmente el comple-mento ortogonal de un subespacio de dimension n − 1 dado en forma implıcita

W ≡ a1x1 + · · · + anxn = 0

(para que esta ecuacion defina un subespacio de dimension 1 alguno de los coeficientesa1, . . . , an tiene que ser no nulo). Puesto que, como vimos antes,

W = S⊥ siendo S = Gen

8><>:2664 a1

...an

37759>=>;tenemos que W⊥ =

�S⊥�⊥

= S. Es decir, de manera inmediata obtnemos W⊥ en formaparametrica.

El hecho de expresar el complemento ortogonal de una u otra forma parametrica/implıcitadependiendo de como venga expresado el subespacio vectorial:

S en forma parametrica −→ S⊥ en forma implıcitaS en forma implıcita −→ S⊥ en forma parametrica

queda reflejado con el siguiente Teorema.

Teorema. (Los cuatro subespacios asociados a una matriz) Sea A una matriz real m × n.Se verifica:

[Col (A)]⊥ = Nul (AT ), [Nul (A)]⊥ = Col (AT ).

El espacio Col (AT ) se suele denominar espacio fila de la matriz A.

Notemos que en lo que se refiere a las dimensiones de los complementos ortogonalestenemos

dim�[Col (A)]⊥

�= dim

�Nul (AT )

�= m− pivotes de AT = m−rang (A) = m−dim (Col (A)) .

Puesto que cualquier subespacio vectorial se puede expresar como el espacio columna de unamatriz tenemos que para cualquier subespacio vectorial S de Rm se verifica

dim�S⊥� = m − dim (S).

Matematicas I. 2010-2011

Page 6: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

178 Tema 6.- Ortogonalidad y mejor aproximacion.

6.3.- Bases ortogonales.

6.3.1.- Bases ortogonales de un subespacio.

Una base ortogonal de un subespacio vectorial S es una base de S formada por vectoresque son ortogonales dos a dos. Para calcular las coordenadas de un vector respecto de unabase generica de S hay que resolver un sistema de ecuaciones lineales cuya soluci’on son lascoordenadas del vector respecto de dicha base. Como veremos en la seccion 6.4, la principalventaja, de tener una base ortogonal de un subespacio, es que el calculo de las coordenadasde un vector respecto de dicha base es particularmente sencillo y se tiene una formula paradichas coordenadas (ver el desarrollo de Fourier). Una base ortonormal de un subespaciovectorial es una base formada por vectores que son ortogonales dos a dos y unitarios (connorma igual a 1).

Teorema. Si {v1, v2, . . . , vr} es un conjunto de vectores no-nulos ortogonales dos a dos,entonces son linealmente independientes.

Demostracion.- Si tenemos una combinacion lineal de los vectores dados igual al vector nulo

α1v1 + α2v2 + · · · + αrvr = ~0 (∗)

al multiplicar escalarmente por el vector v1 tenemos (α1v1 + α2v2 + · · · + αrvr) · v1 = ~0 · v1 = 0.Desarrollando el primer miembro de la igualdad

α1v1 · v1 + α2v2 · v1 + · · · + αrvr · v1 =

264 usando lacondicion deortogonalidad

375 =

= α1 ||v1||2 + α20 + · · · + αr0 = 0

�puesto

que v1 6= 0

�=⇒ α1 = 0.

De manera analoga, al multiplicar escalarmente la igualdad (∗) por un vector vk, k = 2, . . . , r, seobtiene

α10 + α20 + · · · + αk ||vk||2 + · · · + αn0 = 0 ⇒�

puestoque vk 6= 0

�⇒ αk = 0.

Por tanto, la unica combinacion lineal que es igual al vector nulo es la combinacion lineal identi-

camente nula (todos los coeficientes son nulos). Es decir, los vectores dados son linealmente inde-

pendientes. 2

Cuando se tiene un conjunto ortogonal de vectores no-nulos y se normalizan (se divide ca-da uno por su norma), obtenemos un conjunto ortonormal de vectores que formaran una baseortonormal del subespacio vectorial que generan. Vamos a considerar ahora las propiedadesde las matrices cuyas columnas son ortonormales. Mas adelante veremos el caso particularde las matrices cuadradas cuyas columnas son ortonormales.

Proposicion. Sea U = [u1, . . . , un] una matriz real m × n.

(1) U tiene columnas ortonormales ⇐⇒ UT U = I.

(2) Si U tiene columnas ortonormales, entonces conserva angulos y distancias. Es decir(Ux) · (Uy) = x · y, ∀x, y ∈ Rn. En particular,

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 7: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.3.2.- El metodo de Gram-Schmidt. 179

(a) ||Ux|| = ||x|| , ∀x ∈ Rn.

(b) Ux ⊥ Uy ⇐⇒ x ⊥ y.

6.3.2.- El metodo de Gram-Schmidt.

En los temas anteriores hemos visto como obtener una base de un subespacio vectoriala partir de un conjunto de vectores que genere dicho subespacio vectorial. El metodo deortogonalizacion de Gram-Schmidt, que vamos a describir, permite construir, de maneraprogresiva, una base ortogonal de un subespacio vectorial a partir de una base de dichosubespacio e incluso de un conjunto de vectores que genere el subespacio, sin necesidad deque los vectores sean linealmente independientes.

Partiendo de una base {v1, v2, . . . , vp} de un subespacio S, el metodo consiste en gener-ar uno a uno vectores que son ortogonales a los construidos. Denotamos por S1, S2, · · · lossubespacios vectoriales definidos por

S1 = Gen {v1} , S2 = Gen {v1, v2} , . . . , Sp = Gen {v1, v2, . . . , vp} = S.

El metodo de Gram-Schmidt consiste en generar los vectores:

u1 = v1 ∈ S1,

u2 = v2 − proy S1(v2) ∈ S2, es decir, u2 es el unico vector de la forma

u2 = v2 + αu1 que es ortogonal a u1,

u3 = v3 − proy S2(v3) ∈ S3, es decir, u3 es el unico vector de la forma

u3 = v3 + αu1 + βu2 que es ortogonal a u1 y a u2,

. . .Notemos que, puesto que los vectores {v1, v2, . . . , vp} son linealmente independientes, los

subespacios

S1 ⊂ S2 ⊂ · · · ⊂ Sp = S

son todos distintos (dim (Sk) = k, k = 1, 2, . . . , p), los vectores u1, u2, . . . , up son todos no-nulos y linealmente independientes y se verifica que

S1 = Gen v1 = Genu1,S2 = Gen {v1, v2} = Gen {u1, u2} ,S3 = Gen {v1, v2, v3} = Gen {u1, u2, v3} = Gen {u1, u2, u3} ,

......

Sp = Gen {v1, . . . , vp} = · · · = Gen {u1, · · · , up} .

Teorema (Metodo de ortogonalizacion de Gram-Schmidt). Consideremos una base{v1, v2, . . . , vp} de un subespacio vectorial S de R

n. Entonces, los siguientes vectores estanbien definidos

Matematicas I. 2010-2011

Page 8: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

180 Tema 6.- Ortogonalidad y mejor aproximacion.

u1 = v1

u2 = v2 −v2 · u1

||u1||2u1

u3 = v3 −v3 · u1

||u1||2u1 −

v3 · u2

||u2||2u2

...

up = vp −vp · u1

||u1||2u1 − · · · vp · up−1

||up−1||2up−1

y son no-nulos y ortogonales dos a dos. Ademas, para cada k = 1, . . . , p, {u1, u2, . . . , uk}es una base ortogonal de Sk = Gen {v1, v2, . . . , vk}. En particular {u1, u2, . . . , up} es unabase ortogonal de S = Gen {v1, v2, . . . , vp}.

Observaciones.

(a) Si el objetivo es obtener una base ortonormal de S, una vez que se ha obtenido una baseortogonal basta normalizar los vectores obtenidos.

(b) En cada paso del metodo de Gram-Schmidt que acabamos de describir podrıamos mul-tiplicar (o dividir) el vector obtenido por un coeficiente no-nulo y seguir los calculoscon dicho vector.

(c) ¿Que sucede al aplicar el metodo de Gram-Schmidt a un conjunto de vectores linealmentedependientes?

6.3.3.- Matrices ortogonales.

Un caso particularmente importante de matrices reales con columnas ortonormales loconstituyen las matrices cuadradas con dicha propiedad.

Definicion. (Matriz ortogonal) Se denomina matriz ortogonal a toda matriz Q realcuadrada no-singular cuya inversa coincide con su traspuesta, Q−1 = QT .

Ejercicio. Prueba las siguientes propiedades de las matrices ortogonales

(1) Si Q es ortogonal =⇒ det (Q) = ±1

(2) Q es ortogonal ⇐⇒ QT es ortogonal.

(3) Si Q1 y Q2 son ortogonales, entonces Q1Q2 es ortogonal.

Proposicion. Sea Q una matriz real cuadrada n × n. Son equivalentes:

(1) Q es una matriz ortogonal.

(2) Las n columnas de Q son ortonormales (y por tanto forman una base ortonormal deRn).

(3) Las n filas de Q son ortonormales (y por tanto forman una base ortonormal de Rn).

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 9: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.4.- La proyeccion ortogonal. 181

Observacion.- Notemos que el que las columnas de una matriz (real) sean ortonormales es equiv-alente a que lo sean las filas solo en el caso de una matriz cuadrada. Una matriz real no cuadradapuede tener columnas (o filas) ortonormales sin serlo sus filas (o columnas). Por ejemplo, las ma-trices 264 1 0

0 10 0

375 ,

264 1√2

0

0 11√2

0

375 ,

2664 1√3

1√2

1√3

− 1√2

1√3

0

3775tienen sus columnas ortonormales pero no sus filas. Las traspuestas tienen filas ortonormales pero

no columnas.

6.4.- La proyeccion ortogonal.

6.4.1.- Proyeccion ortogonal sobre un subespacio.

Si consideramos el subespacio vectorial S, de dimension uno (una recta), generado porun vector, u1, no-nulo, S = Gen {u1}, la proyeccion ortogonal de un vector v ∈ Rn sobre Ssera el vector u = αu1 ∈ S que verifica que

v − u = v − αu1

es ortogonal a S. Es decir, tenemos que determinar α con la condicion de que v − αu1 seaortogonal a u1,

(v − αu1) · u1 = v · u1 − α ||u1||2 = 0 ⇐⇒ α =v · u1

||u1||2⇒

=⇒ u = proy S(v) =v · u1

||u1||2u1,

=⇒ ||u|| =

�����v · u1

||u1||

�����! .

No hay que confundir el vector proyeccion ortogonal de v sobre (la recta que genera) otro,

u1, que es un vectorv · u1

||u1||2u1, con la magnitud de dicha proyeccion ortogonal,

�����v · u1

||u1||

�����, que

es un numero real.

Para un subespacio de dimension arbitraria puede darse una expresion de la proyeccionortogonal de un vector sobre dicho subespacio cuando disponemos de una base ortogonal dedicho subespacio. Considerando una base ortonormal puede darse una expresion comoda dela matriz de la proyeccion ortogonal.

Teorema (de la descomposicion ortogonal). Sea S un subespacio vectorial de Rn. Dadocualquier vector v ∈ Rn existe un unico vector u ∈ S (llamado proyeccion ortogonal de vsobre S) tal que v−u ∈ S⊥. De hecho, si {u1, u2, . . . , ur} es una base ortogonal de S, entoncesla proyeccion ortogonal de v sobre S es

u := proy S(v) =v · u1

||u1||2u1 + · · ·+ v · ur

||ur||2ur.

y la proyeccion ortogonal de v sobre S⊥ es

w = v − u.

Matematicas I. 2010-2011

Page 10: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

182 Tema 6.- Ortogonalidad y mejor aproximacion.

Demostracion.- Dada una base ortogonal {u1, u2, . . . , ur} de S y un vector generico v ∈ Rn, sea

u ∈ S el vector definido por

u =v · u1

||u1||2u1 + · · · + v · ur

||ur||2ur.

Vamos a comprobar que u es la proyeccion ortogonal de v sobre S. Para ello hay que comprobarque v − u ∈ S⊥ (puesto que obviamente u ∈ S) o lo que es equialente, que v − u es ortogonal a losvectores u1, u2, . . . , ur (que generan S). Basta calcular (v − u) · uk, k = 1, 2, . . . , n,

(v − u) · uk =

�v − v · u1

||u1||2u1 − · · · − v · ur

||ur||2ur

�· uk = v · uk −

v · uk

||uk||2uk · uk = 0.

Por tanto, w = v − u ∈ S⊥ con lo cual

u = proyS(v) ≡¨

u ∈ S,

v − u ∈ S⊥,w = v − u = proyS⊥(v) ≡

¨w ∈ S⊥,

v − w = u ∈ S.

2

Notemos que:

Cada sumando de la expresion

v · u1

||u1||2u1 + · · ·+ v · ur

||ur||2ur

nos da la proyeccion ortogonal del vector v sobre el subespacio generado por el corres-pondiente vector uk.

El vector u = proy S(v) verifica que ||u||2 ≤ ||v||2 y expresando ||u||2 en terminos dela base ortogonal dada esta desigualdad es la desigualdad de Bessel considerada en lasiguiente proposicion.

Corolario. Sea {u1, u2, . . . , ur} una base ortogonal de un subespacio S de Rn. Entonces:

(a) Desigualdad de Bessel: Para cada vector v ∈ Rn se verifica que�v · u1

||u1||

�2

+ · · ·+�

v · ur

||ur||

�2

≤ ||v||2 .

Ademas, en la desigualdad de Bessel se verifica la igualdad si, y solo si, v ∈ S.

(b) Las coordenadas de un vector u ∈ S respecto de dicha base vienen dadas poru · uk

||uk||2, es

decir, se verifica que

u =u · u1

||u1||2u1 + · · ·+ u · ur

||ur||2ur.

La expresion anterior se suele denominar desarrollo de Fourier de v respecto a labase {u1, u2, . . . , ur}.

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 11: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.4.- La proyeccion ortogonal. 183

(c) Identidad de Parseval:. Para cada u ∈ S se verifica que

||u||2 =

�u · u1

||u1||

�2

+ · · ·+�

u · ur

||ur||

�2

.

Demostracion.

(a) La desigualdad de Bessel esta relacionada con la proyeccion ortogonal de un vector sobreel subespacio generado por el conjunto ortogonal de vectores dados. Dado un vector v ∈ R

n,consideremos el vector u = proyS(v) ∈ S obtenido en el teorema de la descomposicionorotogonal

u =v · u1

||u1||2u1 + · · · + v · ur

||ur||2ur

y sea w = v − u. Aplicando el teorema de Pitagoras a v = u + w, (u ⊥ w) obtenemos

||v||2 = ||u||2 + ||w||2 ≥ ||u||2 .

Ahora basta calcular ||u||2 usando la expresion de u,

||u||2 = u · u =

�v · u1

||u1||2u1 + · · · + v · ur

||ur||2ur

�·�

v · u1

||u1||2u1 + · · · + v · ur

||ur||2ur

�=

nXi,j=1

v · ui

||ui||2v · uj

||uj||2ui · uj =

nXk=1

�v · uk

||uk||2�2

uk · uk

=

�v · u1

||uk||

�2

+

�v · u2

||u2||

�2

+ · · · +�

v · ur

||ur||

�2

.

En la desigualdad obtenida se verifica la igualdad si y solo si

||v||2 = ||u||2 ⇐⇒ w = v − u = 0 ⇐⇒ v = u ∈ S.

(b) Basta tener en cuenta que si u ∈ S, entonces proyS(u) = u y aplicar el teorema de la descom-posicion ortogonal.

(c) Para obtener la igualdad de Parseval basta tener en cuenta lo que sucede con la desigualdadde Bessel cuando se aplica a un vector de S.

2

Corolario. (Matriz de una proyeccion ortogonal) Sea S un subespacio vectorial de Rn.

(a) Si {u1, u2, . . . , ur} es una base ortonormal de S, la proyecion ortogonal de un vectorv ∈ Rn sobre S es

u := proy S(v) = (v · u1)u1 + · · ·+ (v · ur) ur.

(b) Siendo U una matriz cuyas columnas forman una base ortonormal de S, la matriz de laproyeccion ortogonal sobre S es PS = UUT , es decir

proy S(v) = UUT v, ∀v ∈ Rn.

Matematicas I. 2010-2011

Page 12: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

184 Tema 6.- Ortogonalidad y mejor aproximacion.

Aunque puedan considerarse distintas matrices U como en el enunciado, la matriz PS =UUT que representa a la proyeccion ortogonal, respecto a la base canonica, es unica. Laspropiedades caracterısticas de las matrices de proyeccion ortogonal son:

P 2

S = PS,�UUT

�2= U(UT U)UT = UIUT = UUT , y

PS es simetrica,�UUT

�T= (UT )T UT = UUT .

En el ejercicio 10 se consideran las matrices de proyeccion generales (no necesariamenteproyecciones ortogonales) y la determinacion de los subespacios proyeccion y proyectante apartir de la matriz de la proyeccion.

6.4.2.- El teorema de la mejor aproximacion.

El teorema de la mejor aproximacion resuelve el problema de la mınma distancia deun punto a un subespacio vectorial. Dado un subespacio vectorial S de Rn y un pun-to/vector x ∈ Rn, se trata de minimizar la distancia de x a un punto/vector generico w ∈ S,min {‖x − w‖ : w ∈ S}, y de obtener el punto/vector donde se alcanza dicho mınimo. Esteproblema se puede plantear como un problema de optimizacion en varias variables (calculodiferencial de varias variables) sin mas que expresar un vector generico w ∈ S como combi-nacion lineal arbitraria de los vectores de un base de S. El teorema de la mejor aproximacionnos dira que es equivalente resolver el problema de mınima distancia (la mejor aproximaciona x desde S) que el problema de la proyeccion ortogonal sobre S. La mınima distancia de xa S se alcanza en proyS(x) (y en ningun otro punto).

Teorema (de la mejor aproximacion). Sea S un subespacio vectorial de Rn y consider-emos un vector x ∈ Rn y un vector y ∈ S. Son equivalentes:

(a) y es la proyeccion ortogonal de x sobre S, es decir,

y ∈ S, x − y ∈ S⊥.

(b) y es la mejor aproximacion de x desde S, es decir,

y ∈ S, ||x − y|| ≤ ||x − w|| para todo w ∈ S.

O

x

y

wS

S⊥

Sea y = proy S(x) y sea w ∈ S.Puesto que

x−w = (x−y)+(y−w), x−y ∈ S⊥, y−w ∈ S,

aplicando el Teorema de Pitagorastenemos

||x − w||2 = ||x − y||2+||y − w||2 ≥ ||x − y||2 .

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 13: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.5.- Problemas de mınimos cuadrados. 185

6.5.- Problemas de mınimos cuadrados.

6.5.1.- Ecuaciones normales de Gauss.

En terminos generales, resolver un problema en el sentido de los mınimos cuadrados essustituir un problema en el que hay que resolver un sistema de ecuaciones (que no tienesolucion) por el problema de minimizar una suma de cuadrados.

Ejemplo. El problema de la regresion lineal. Si consideramos dos magnitudes, x ey, de las que suponemos que estan relacionadas mediante una igualdad del tipo y = ax + b,donde tenemos que determinar a y b mediante la obtencion de resultados experimentales, ydichos resultados son

x x1 x2 · · · xn

y y1 y2 · · · yn

los valores a y b los obtendremos de la resolucion del sistema de ecuaciones lineales

ax1 + b = y1

ax2 + b = y2

· · ·axn + b = yn

9>>=>>; ≡

266664 x1 1x2 1...

...xn 1

377775 � ab

�=

266664 y1

y2

...yn

377775 .

Lo habitual es que un sistema de ecuaciones como el anterior no tenga solucion. Resolver elsistema anterior en el sentido de los mınimos cuadrados consiste en determinar los valores ay b para los cuales la suma de cuadrados

(ax1 + b − y1)2 + (ax2 + b − y2)

2 + · · ·+ (axn + b − yn)2

es mınima (si hubiera solucion dicho valor mınimo serıa cero). Puesto que esta suma decuadrados es el cuadrado de la norma del vector266664 x1 1

x2 1...

...xn 1

377775 � ab

�−

266664 y1

y2

...yn

377775y los vectores de la forma 266664 x1 1

x2 1...

...xn 1

377775 � ab

�∀ a, b ∈ R

forman el espacio columna S de la matriz considerada, resolver el sistema en mınimos cuadra-dos es determinar el vector de S mas cercano al termino independiente considerado y resolverel sistema (que sera compatible) con ese nuevo termino independiente.

Para un sistema generico de ecuaciones lineales Ax = b, resolverlo en el sentido de losmınimos cuadrados es determinar el vector (o vectores) x ∈ R

n para los cuales

||Ax − b|| es mınima.

Puesto que los vectores Ax recorren el espacio columna de A (cuando x recorre Rn), ||Ax − b||sera mınima para los vectores x ∈ R

n tales que Ax es igual a la proyeccion ortogonal de bsobre el espacio Col (A).

Matematicas I. 2010-2011

Page 14: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

186 Tema 6.- Ortogonalidad y mejor aproximacion.

Rn

Rm

O

Ox

b

proyS(b)

A

AxCol (A)

Teorema. Consideremos un sistema de ecuaciones Ax = b, A matriz real m × n, b ∈ Rm,

S = Col (A) y sea x ∈ Rn. Son equivalentes:

(a) x es solucion en mınimos cuadrados del sistema Ax = b, es decir,

||Ax − b|| ≤ ||Ax − b|| , ∀x ∈ Rn.

(b) x verifica Ax = proy S(b).

(c) x verifica las ecuaciones normales de Gauss AT Ax = AT b.

Observaciones.

(a) El sistema de ecuaciones Ax = proy S(b) (sistema m × n) y el sistema AT Ax = AT b(sistema n × n) son siempre compatibles y tienen el mismo conjunto de soluciones.

(b) El sistema Ax = proy S(b) sera compatible determinado (es decir el problema en mınimoscuadrados tendra solucion unica) si y solo si el sistema homogeneo asociado Ax = 0tiene solucion unica. Por tanto,

el sistema Ax = b tiene solucionunica en mınimos cuadrados

⇐⇒ las columnas de A son linealmenteindependientes (rango(A) = n).

6.5.2.- Regresion lineal.

En el epıgrafe anterior hemos planteado el problema de la regresion lineal. Resolviendoen mınimos cuadrados el sistema planteado se obtiene la recta de regresion de y sobre x(en el planteamiento del sistema, la variable y esta expresada en funcion de x) para la nubede puntos dada. Notemos que la resolucion en mınimos cuadrados considerada consiste endeterminar la recta que hace mınima la suma de cuadrados de las distancias sobre la vertical

de los puntos dados a la recta.

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 15: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.5.- Problemas de mınimos cuadrados. 187

X

Y

xk

yk

axk + b

y = ax + b

De forma similar (y resultado distinto, por lo general) podrıamos haber planteado elproblema de determinar una recta x = αy + β que pase por los puntos (xk, yk), k = 1, . . . , ndados. Por lo general, el sistema resultante

αy1 + β = x1

αy2 + β = x2

· · ·αyn + β = xn

9>>=>>; ≡

266664 y1 1y2 1...

...yn 1

377775 � αβ

�=

266664 x1

x2

...xn

377775no tiene solucion y su resolucion en el sentido de los mınimos cuadrados permite determinarla recta que hace mınima la suma de cuadrados de las distancias sobre la horizontal de lospuntos dados a la recta. La recta que se obtiene mediante la resolucion en mınimos cuadradosdel sistema anterior se denomina recta de regresion de x sobre y para la nube de puntosdada. Notemos que cualquier recta que no sea paralela a ninguno de los ejes coordenadospuede expresarse mediante y = ax+b y mediante x = αy+β. Sin embargo, no es equivalenteresolver en el sentido de los mınimos cuadrados el sistema asociado a una u otra expresion.

X

Y

xk

yk

αyk + β

x = αy + β

Desde un punto de vista mas generico que el de la regresion lineal (ajustar una recta a unanube de puntos), puede considerarse el problema de ajustar, a una nube de puntos del plano(x1, y1), . . . , (xn, yn), una curva de un cierto tipo (dada por un tipo de ecuacion explıcitay = f(x) o implıcita F (x, y) = 0). Ası, podemos considerar el problema de determinar

la parabola (de eje principal vertical) y = ax2 + bx + c,

Matematicas I. 2010-2011

Page 16: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

188 Tema 6.- Ortogonalidad y mejor aproximacion.

la circunferencia x2 + y2 + ax + by + c = 0

. . .

que mejor se ajusta, en el sentido de los mınimos cuadrados, a una nube de puntosdada. En cualquier caso, se trata de problemas que llevan a sistemas de ecuaciones linealesque no tienen solucion y se resuelven en el sentido de los mınimos cuadrados.

Un planteamiento similar al de ajustar una curva a una nube de puntos es valido paraajustar una superficie en R3, de un tipo prefijado, a una determinada nube de puntos

(x1, y1, z1), . . . , (xn, yn, zn).

Por ejemplo, puede considerarse el problema de ajustar , en el sentido de los mınimos cuadra-dos, a los puntos dados,

un plano dado por la ecuacion z = ax + by + c (regresion lineal z sobre (x, y));

una esfera de ecuacion x2 + y2 + z2 + ax + by + cz + d = 0;

. . .

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 17: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.6.- Ejercicios. 189

6.6.- Ejercicios.

Ejercicio 1. (1) Demuestra el Teorema de Thales que afirma que los angulos inscritos enuna semicircunferencia son todos rectos.

(2) Sea ABC un triangulo rectangulo isosceles, rectangulo en A y sean M, N y P los puntosmedios de los segmentos AB, BC y AC respectivamente. Dado un punto generico,X, del segmento AB, consideremos el punto, Y , del segmento BC y el punto Z delsegmento AC tales que AXY Z es un rectangulo. Demuestra que el triagulo XNZ esun triangulo rectangulo isosceles.

(3) Determina la ecuacion que deben cumplir los puntos P = (x, y) del plano desde loscuales el segmento AB de extremos A = (−1, 0) y B = (0, 1) se ve con un anguloθ ∈ [0, π]. Estudia en particular los casos θ = π

2, θ = 0, θ = π y θ = π

3.

Ejercicio 2. Sea u = [1, 2, 3]T .

(1) Describe geometricamente el conjunto de vectores v ∈ R3 que verifican, respectivamente,

(a)

¨v · u = 0||v|| = 1

«, (b)

¨v · u = 2||v|| = 1

«, (c)

¨v · u = 4||v|| = 1

«, (d)

¨v · u = 2

||v|| = 2/√

14.

«.

(2) Calcula el radio y el centro de la circunferencia dada por las siguientes ecuaciones¨v · u = 3||v|| = 1

«.

Ejercicio 3. Halla una base y unas ecuaciones implıcitas de E⊥ y de F⊥ siendo E y F lossubespacios

E = Gen

8>><>>:26664 1021

37775 ,

26664 2123

37775 ,

26664 01−21

377759>>=>>; y F ≡

8><>: 2x + y + 3z − t = 03x + 2y − 2t = 0

3x + y + 9z − t = 0

9>=>; .

Ejercicio 4. Indica la respuesta correcta:Si v y w son dos vectores linealmente independientes de Rn y S es el subespacio de Rn

de ecuaciones implıcitas vtx = 0, wtx = 0, entonces

S es el espacio nulo de la matriz [v, w] cuyas columnas son v y w.

Rn = S ⊕ Gen {v, w}.

Ninguna de las dos afirmaciones anteriores es correcta.

Matematicas I. 2010-2011

Page 18: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

190 Tema 6.- Ortogonalidad y mejor aproximacion.

Ejercicio 5. Expresa el vector (1, 3,−1, 4)T como suma de dos vectores u + v siendo uproporcional a (2, 1, 0, 1)T y v ⊥ u.

Ejercicio 6. Halla la proyeccion ortogonal de los siguientes vectores sobre los subespaciosque se indican:

(1) (4, 1, 3,−2)T sobre el subespacio definido por x1 + x2 + x3 + x4 = 0.

(2) (1, 1, 1, 1)T sobre el subespacio de R4 dado por:

E ≡¨

x − y + z − 2t = 0,y + z = 0.

(3) (3,−4, 5)T sobre el subespacio f(E) siendo f la aplicacion lineal dada por la matriz

A =

264 1 0 1−1 1 00 1 −1

375y E el subespacio de R

3 dado por x − y − z = 0.

Ejercicio 7. Halla una base de (E + F )⊥ siendo E y F los subespacios de R3 dados por

E ≡ {3x + y − 2z = 0} y F ≡ {x + 7y + z = 0, x − y − z = 0},

.

Ejercicio 8. Demuestra:

(1) El producto de matrices ortogonales es ortogonal.

(2) La suma de matrices ortogonales puede no ser ortogonal.

Ejercicio 9. Dadas las bases ortonormales de R2

B1 =§u1 =

�1/√

2, 1/√

2�T

, u2 =�−1/

√2, 1/

√2�Tª

y

B2 =§w1 =

�1/2,

√3/2

�T, w2 =

�−√

3/2, 1/2�Tª

halla la matriz correspondiente al cambio de una de esas bases a la otra. Comprueba que lamatriz de paso es ortogonal.

Ejercicio 10. Matrices de proyeccion.Sea P una matriz cuadrada real de orden n tal que P 2 = P y sean E y F definidos por

E = {x ∈ Rn : Px = x} y F = {x ∈ R

n : Px = 0} .

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 19: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.6.- Ejercicios. 191

(a) Demuestra que E y F son subespacios vectoriales.

(b) Demuestra que E ⊕ F = Rn.

(c) Comprueba que P es la matriz de la proyeccion sobre E en la direccion de F .

(d) Demuestra que si P es simetrica entonces E y F son uno el complemento ortogonaldel otro (con lo cual P es la matriz de la proyeccion ortogonal sobre E).

Ejercicio 11. Halla el vector perteneciente al subespacio de R4 generado por los vectores

(2, 0,−1, 2)T , (1, 2,−2, 0)T y(−1, 2, 0,−2)T

que esta mas cerca del vector (1, 1, 1, 1)T .

Ejercicio 12. Halla la matriz de la proyeccion ortogonal sobre cada uno de los siguientessubespacios de R4:

(1) el subespacio generado por (0, 2, 1, 0)T y (1, 1, 0, 1)T .

(2) el subespacio generado por (0, 0, 2, 1)T y (1, 1,−1, 0)T .

(3) Sobre E y sobre E⊥, siendo E ≡¨

x − 3y + z + t = 02x − 5y + z + 2t = 0

Comprueba que, como debe

ser, la suma de ambas matrices vale I.

Ejercicio 13. Sea u ∈ Rm un vector no nulo y y sea T : Rm −→ Rm la transformacion linealdefinida mediante

T (x) = x − u · x||u||2

u.

(a) Prueba que T es lineal y calcula la matriz A asociada.

(b) Prueba que A2 = A (o lo que es lo mismo T ◦ T = T ).

(c) ¿Es A invertible?

(d) Prueba que ||Ax|| ≤ ||x|| para cualquier x ∈ Rm.

(e) Describe esta transformacion en terminos geometricos para m = 2 y para m = 3.

Ejercicio 14. Sea S un subespacio vectorial de Rm y sean PS y PS⊥ las matrices de laproyeccion ortogonal sobre S y sobre S⊥ respectivamente.

(a) Calcula la matriz de la simetrıa respecto a S y la matriz de la simetrıa respecto a S⊥.

(b) Prueba que PSPS⊥ = PS⊥PS = 0.

(c) Calcula el espacio columna y el espacio nulo de PS.

Matematicas I. 2010-2011

Page 20: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

192 Tema 6.- Ortogonalidad y mejor aproximacion.

Ejercicio 15. Dado el subespacio S ⊂ R3 definido por x1 − 2x2 + 2x3 = 0, se pide:

(a) Halla la matriz de la proyeccion ortogonal sobre S. ¿Cual es la matriz de la proyeccionortogonal sobre S⊥?

(b) Determina una base de S⊥.

(c) Demuestra que Col (A) = S, siendo A =

264 2 00 1−1 1

375 .

(d) Halla el vector de S que dista menos de v = (1, 1, 1)T .

Ejercicio 16. Aplica el metodo de Gram-Schmidt a;

(a) La base de R4,�(1, 0, 1, 0)T , (1, 1, 0, 0)T , (0, 1, 1, 1)T , (0, 1, 1, 0)T

©.

(b) Las columnas de las matrices

A =

�1 10 11 0

Ǒ, B =

264 1 11 22 1

375 .

Ejercicio 17. La proyeccion ortogonal del vector v = (5,−2, 3)T sobre la recta x = y, y = zes:

(−1,−1,−1)T .

(3, 3, 3)T .

(2, 2, 2)T .

Ejercicio 18. Halla una base ortonormal de Col (A) y otra de Nul (A) siendo

A =

26664 1 1 00 −1 11 1 −11 1 1

37775 .

Ejercicio 19. Dado el vector u ∈ Rn, que verifica utu = 1, se define la familia de matricesA = I − (α+1)uut, con α ∈ R. Discutir, segun los valores del parametro α, cuando la matrizA es ortogonal.

Ejercicio 20. Consideremos el subespacio E definido mediante

E = Gen�(a, 0, 0, 0)T , (a, a, b, 0)T , (a, b,−a, 1)T

©, a, b ∈ R.

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 21: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.6.- Ejercicios. 193

(a) Hallar una base ortonormal del subespacio E segun los valores de a y b.

(b) Hallar la matriz de la proyeccion ortogonal sobre E, cuando a = 0.

(c) Calcular los valores de los parametros a y b tales que el subespacio dado por las ecua-ciones 8><>: x1 = 0

5x1 + x2 + 3x3 = 0−2x1 + 3x2 − x3 + x4 = 0

sea ortogonal a E.

Ejercicio 21. Consideremos los vectores y el subespacio vectorial dados por

v1 =

264 −11−3

375 , v2 =

264 2αα3

375 , u =

264 α0−1

375 ; S ≡ x1 + x2 + αx3 = 0.

Determina α sabiendo que proy S(v1) = proy S(v2) = u. (un dibujo puede ayudar)

Ejercicio 22. Sea A una matriz cuadrada de orden 25 cuyo rango es 21. ¿Que sucede alaplicar el metodo de Gram-Schmidt a los vectores columna de A? ¿Cuantas veces? ¿Por que?

Ejercicio 23. Sean S1 y S2 los subespacios vectoriales de R4 definidos mediante

S1 ≡ x1 + x2 + x3 + x4 = 0, y S2 ≡ x1 + x2 − x3 − x4 = 0.

(a) Determina el vector v ∈ R4 cuyas proyecciones ortogonales sobre S1 y S2 son, respecti-vamente,

u1 = proy S1(v) =

26664 3−55−3

37775 , u2 = proy S2(v) =

26664 7−17−1

37775(b) Siendo S1 y S2 los subespacios vectoriales dados en el apartado anterior, calcula la

matriz de la proyeccion ortogonal sobre el subespacio S = S1 ∩ S2.

Ejercicio 24. Sea A una matriz 4 × 3 tal que

Nul (A) = Gen

8><>:264 −351

3759>=>; , Col (A)⊥ = Gen

8>><>>:v1 =

26664 1−110

37775 , v2 =

26664 2−101

377759>>=>>; .

(a) Calcula la proyeccion ortogonal del vector v = [1 1 1 1]T ∈ R4 sobre el subespacio

Col (A).

Matematicas I. 2010-2011

Page 22: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

194 Tema 6.- Ortogonalidad y mejor aproximacion.

(b) Determina la matriz A sabiendo que es de la forma A =

26664 1 0 ∗2 1 ∗∗ ∗ ∗∗ ∗ ∗

37775 .

Ejercicio 25. Sean Q1 (n × n) y Q2 (m × m) dos matrices ortogonales. Sea Q la matrizdada por bloques de la siguiente manera

Q =

�Q1 UV Q2

�,

donde U y V son matrices con las dimensiones adecuadas. Probar que Q es ortogonal si, ysolo si, U = 0 y V = 0.

Ejercicio 26. Resolver en el sentido de los mınimos cuadrados los siguientes sistemas deecuaciones

(1) x = 1, x = 7, x = −3, x = 12.

(2) x = a1, x = a2, ..., x = an, siendo a1, a2, ..., an numeros reales. ¿Que se obtiene cuandoalguno de los valores ak aparece repetido?

(3) Ax = b siendo A =

�1 11 1

�y b =

�24

�.

Ejercicio 27. Resuelve en el sentido de los mınimos cuadrados los dos sistemas equivalentessiguientes (que tendrıan las mismas soluciones exactas si fueran compatibles)¨

x1 + x2 = 32x1 + 2x2 = 4

«y

¨x1 + x2 = 3x1 + x2 = 1

«.

Ejercicio 28. Dados el subespacio E = Gen�[1, 0, 0, 1]T , [0, 1, 0, 2]T , [0, 0, 1, 1]T

©y la matriz

A =

26664 a1 b1

a2 2a3 b2

−2 b3

37775 .

(a) Calcular una base de E⊥.

(b) Hallar la matriz de la proyeccion ortogonal sobre E.

(c) Calcular A sabiendo que Col (A)) esta contenido en E⊥.

(d) Resolver en el sentido de los mınimos cuadrados, el sistema Ax = b con b = (1,−1, 0, 0)t.

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 23: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.6.- Ejercicios. 195

Ejercicio 29. Calcular las rectas de regresion y = ax + b y x = αy + β para los datos:

x 1 2 3 4 5 6 7y 2 3 1 4 6 7 5

Ejercicio 30. Por el metodo de los mınimos cuadrados, ajustar una parabola, y = ax2 +bx + c, a los puntos (1,−3), (1, 1), (−1, 2) y (−1,−1).

Ejercicio 31. Resolviendo el sistema sobredeterminado que se obtiene de la ecuacion generalde la circunferencia x2 + y2 + ax + by + c = 0, calcular la circunferencia que mejor se ajuste,en el sentido de los mınimos cuadrados a los puntos (0, 0), (1, 0), (0, 1) y (1, 1), indicandolas coordenadas del centro y el radio de la misma.

Ejercicio 32. Se supone que el numero de horas de autonomıa de un avion esta relacionadacon las cantidades de dos tipos de combustible x1 y x2 (que se pueden utilizar de maneraindistinta o mezclados) mediante y = c1x1 + c2x2. Despues de realizar un experimento seobtienen los siguientes datos.

x1 1 0 1 2 1x2 0 1 1 1 2y 4 5 6 8 8

¿Cuales son los mejores coeficientes c1 y c2 en el sentido de los mınimos cuadrados?

Ejercicio 33. Consideremos el sistema26664 0 11 1−1 12 1

37775� xy

�=

�1133

�.

Sus ecuaciones normales de Gauss son:�6 11 4

� �xy

�=

�48

�.�

6 22 4

� �xy

�=

�24

�.�

6 22 4

� �xy

�=

�48

�.

Ejercicio 34. Considera los vectores v1, v2, v3 y v4 de R4 y la matriz C dados por

v1 =

26664 1−120

37775 , v2 =

26664 0122

37775 , v3 =

26664 1−123

37775 , v4 =

26664 −1−812

37775 ; C =

264 v1 v2

375 .

(a) Calcular la matriz de la proyeccion ortogonal sobre S = Gen {v1, v2, v3}, el vector de Smas cercano a v4 y la distancia de v4 a S.

(b) Resolver, en el sentido de los mınimos cuadrados, el sistema Cx = v3.

Matematicas I. 2010-2011

Page 24: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

196 Tema 6.- Ortogonalidad y mejor aproximacion.

Ejercicio 35. Sea S el subespacio vectorial de Rn definido por la ecuacion

x1 + x2 + · · ·+ xn = 0.

Calcula la matriz P de la proyeccion ortogonal sobre S y resuelve, en el sentido de losmınimos cuadrados, el sistema

Px =

266666664 110...0

377777775 .

Interpreta geometricamente el resultado (en dimension 2 y en dimension 3).

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 25: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.7.- Apendice: MATLAB. 197

6.7.- Apendice: MATLAB.

Ahora podemos describir algunos de los comandos de Matlab, relacionados con la resolu-cion de un sistema de ecuaciones lineales, que no pudieron ser descritos en el Tema 4.

El problema de la resolucion de un sistema de ecuaciones lineales uno de los problemascentrales del algebra lineal. Para poder describir todas las capacidades y las herramientasque usa MATLAB para tratar con dicho problema necesitarıamos conceptos y resultadosque se encuentran en temas posteriores. No obstante, citaremos los comandos basicos y suscaracterısticas generales, aunque sin entrar en demasiados detalles.

Producto escalar: DOT. Para obtener el producto escalar (tambien llamado producto in-terior o producto punto) de dos vectores x e y de la misma longitud (vectores fila ovectores columna) basta con utilizar el comando dot. Al ejecutar

> dot(x,y)

se obtiene el producto escalar de los vectores x e y. Si se trata de vectores complejos

x = (xk) = (x′1+ ix′′

1, · · · , x′

n + ix′′n) , x′

1, x′′

1, · · · , x′

n, x′′n ∈ R,

y = (yk) = (y′1+ iy′′

1, · · · , y′

n + iy′′n) , y′

1, y′′

1, · · · , y′

n, y′′n ∈ R,

dicho producto escalar/hermıtico esta definido mediante

x · y = x1y1 + x2y2 + · · ·+ xnyn = [x1 · · ·xn]

266664 y1

y2

...yn

377775 .

Si se trata de dos vectores columna, el producto escalar puede obtenerse mediante lasoperaciones matriciales dadas por la expresion

> x’*y

que es aplicable tanto a vectores reales como complejos. Cuando el comando dot se apli-ca a dos matrices con las mismas dimensiones se obtienen los productos escalares/hermıticosde las columnas correspondientes (primera con primera, segunda con segunda, ...).

Norma de un vector: NORM. La norma que hemos estudiado de un vector x real se de-nomina norma euclidea o norma-2. Tanto si se trata de un vector fila como si se tratade un vector columna, la orden

> norm(x)

proporciona la norma del vector x. El comando norm tambien es aplicable a vectorescomplejos y a matrices. Tanto si se trata de vectores x = (xk) reales como complejosla norma viene dada por

||x|| = +√

x · x = +√

x1x1 + · · · + xnxn = +q|x1|2 + · · · + |xn|2.

No entraremos en el significado del resultado que se obtiene cuando x es una matriz.

Matematicas I. 2010-2011

Page 26: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

198 Tema 6.- Ortogonalidad y mejor aproximacion.

Angulo: SUBSPACE. Mediante la orden

> t=subspace(x,y)

se obtiene el angulo t determinado por dos vectores columna x e y. El comandosubspace tambien puede ser aplicado para obtener el angulo determinado por dossubespacios, pero no entraremos en detalles.

Sistemas de ecuaciones: MLDIVIDE. Recordemos que, en lo que se refiere a la resolucionde un sistema de ecuaciones Ax = b (A matriz m × n, b vector m × 1 y x vectorincognita n × 1), el comando basico es

\ (mldivide)

y que, en la que descripcion que hicimos de dicho comando en el Tema 4, se dejabanabiertas algunas cuestiones relativas al significado del resultado que se obtiene en loscasos de sistema incompatible. En estos casos, el resultado que da Matlab al ejecutarcualquiera de las ordenes

> x=A\b

> x=mldivide(A,b)

es una solucion x, en el sentido de los mınimos cuadrados, del sistema Ax = b. Cuandoel sistema tiene infinitas soluciones, en el sentido de los mınimos cuadrados, MATLABselecciona una con un cierto criterio relacionado con el rango de A.

Ejemplo.-

(1) >> A=rand(4,3);

>> b=rand(4,1);

y resolvemos el sistema mediante el comando \,>> x=A\b

¿Es el vector x obtenido solucion del sistema dado? Para comprobarlo basta concalcular el vector diferencia Ax − b

>> er=A*x-b

que sera el vector nulo si x es solucion del sistema, y sera un vector no-nulo si setrata de una solucion en el sentido de los mınimos cuadrados.

Para obtener el conjunto de todas las soluciones, en el sentido de los mınimos cuadrados,de un sistema que tenga infinitas soluciones en mınimos cuadrados basta con seguir lasmismas pautas que al considerar un sistema compatible indeterminado. Recordemosque resolver un sistema en mınimos cuadrados no es otra cosa que resolver un sistemacompatible asociado.

Bases ortonormales.

Subespacio dado en forma implıcita: NULL. Dada una matriz A, al ejecutarla orden

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 27: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.7.- Apendice: MATLAB. 199

> Z = NULL(A)

se obtiene una matriz Z cuyas columnas forman una base ortonormal del espacionulo de A. De esta forma AZ es una matriz nula, el numero de columnas de Z,size(Z,2) es la nulidad de A (dimension del espacio nulo) y, en el caso de que Asea real, ZT Z = I. Recordemos que null admite una opcion null(A,’r’) que dauna base del espacio nulo de A obtenida a partir de la forma escalonada reducidade A.

Ejemplo.-

(2) Al ejecutar

>> A=[1 2 1 0 2; 2 4 3 1 2; -1 -2 1 1 -5];

>> Z=null(A)

obtenemos

Z =

0.1083 -0.9291

-0.6812 0.1897

0.4180 0.1832

0.4180 0.1832

0.4180 0.1832

con lo cual las dos columnas de la matriz Z forman una base ortonormal delespacio nulo de la matriz A.

Subespacio dado en forma parametrica: ORTH. Dada una matriz A la orden

> Q=orth(A)

proporciona una matriz Q. Las columnas de esta matriz Q forman una baseortonormal del subespacio generado por las columnas de A. De esta forma, elnumero de columnas de Q es el rango de A y, en el caso real, la matriz Q verificaque QT Q = I (no confundir con la igualdad QQT = I).

Matriz de giro en el plano: PLANEROT. Siendo X un vector columna real de dos coorde-nadas,

> [G,Y] = planerot(X)

nos da la matriz G del giro que lleva el vector X sobre el semieje positivo de abscisasy el vector Y resultante de aplicar dicho giro al vector X. Es decir,

Y (1) ≥ 0, Y (2) = 0, Y = G ∗ X.

Ajuste de Datos: POLYFIT, POLYVAL. Consideremos en el plano un conjunto de puntoscon coordenadas respectivas

(x(1), y(1)), . . . , (x(n), y(n)).

El comando polyfit permite ajustar un polinomio de un cierto grado a los puntosdados. Concretando, siendo X el vector (fila o columna) dado por las primeras co-ordenadas de los puntos considerados, siendo Y el vector (fila o columna) dado porlas segundas coordenadas de los puntos considerados y siendo N un numero natural,mediante la orden

Matematicas I. 2010-2011

Page 28: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

200 Tema 6.- Ortogonalidad y mejor aproximacion.

> p= polyfit(X,Y,N)

se obtienen los coeficientes p=[p(1),...,p(N),p(N+1)] del polinomio de grado menoro igual que N ,

p(1)tN + p(2)tN−1 + · · · + p(N)t + p(N + 1)

que mejor se ajusta a los puntos dados en el sentido de los mınimos cuadrados. Esdecir, se obtiene la solucion, en el sentido de los mınimos cuadrados, del sistema dadopor las ecuaciones

p(1)x(k)N + p(2)x(k)N−1 + · · ·+ p(N)x(k) + p(N + 1) = y(k), k = 1, 2, . . . , n

con incognitas p(1), . . . , p(N), p(N + 1). Consultar la ayuda de MATLAB sobre el co-mando polyfit para saber que sucede cuando entre los puntos dados hay coordenadasx repetidas o cuando N es mayor o igual que n.

Mediante el comando polyval se puede obtener el valor del polinomio de coeficientesp en una o varias abscisas x prefijadas. Siendo x un vector, al ejecutar la orden

> y=polyval(p,x)

se obtinen los valores y que alcanza el polinomio de coeficientes p en los correspon-dientes valores de x.

Para obtener una recta de regresion basta tomar N = 1. Mediante la orden

> p=polyfit(x,y,1)

se obtienen los coeficientes p = [a, b] de la recta de regresion y = ax + b (y sobre x)asociada a la nube de puntos dada y mediante

> q=polyfit(y,x,1)

se obtienen los coeficientes q = [c, d] de la recta de regresion x = cy + d (x sobre y)asociada a la misma nube de puntos.

Ejemplo.-

(3) Vamos a resolver, directamente, el Ejercicio 35 usando MATLAB. Tenemos que tomarun valor concreto de n, por ejemplo n = 10.

Teniendo en cuenta que S = Nul [11 · · ·1], obtenemos una base ortonormal de Smediante

>> A=ones(1,10);

>> Z=null(A)

que da como resultado la matriz Z

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

Page 29: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

6.7.- Apendice: MATLAB. 201

Z =

-0.3162 -0.3162 -0.3162 -0.3162 -0.3162 -0.3162 -0.3162 -0.3162 -0.3162

0.9240 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760

-0.0760 0.9240 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760

-0.0760 -0.0760 0.9240 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760

-0.0760 -0.0760 -0.0760 0.9240 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760

-0.0760 -0.0760 -0.0760 -0.0760 0.9240 -0.0760 -0.0760 -0.0760 -0.0760

-0.0760 -0.0760 -0.0760 -0.0760 -0.0760 0.9240 -0.0760 -0.0760 -0.0760

-0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 0.9240 -0.0760 -0.0760

-0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 0.9240 -0.0760

-0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 -0.0760 0.9240

cuyas columnas forman una base ortonormal de S.

La matriz de la proyeccion ortogonal sobre S se puede obtener mediante

>> P=Z*Z’

que da como resultado

P =

0.9000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000

-0.1000 0.9000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000

-0.1000 -0.1000 0.9000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000

-0.1000 -0.1000 -0.1000 0.9000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000

-0.1000 -0.1000 -0.1000 -0.1000 0.9000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000

-0.1000 -0.1000 -0.1000 -0.1000 -0.1000 0.9000 -0.1000 -0.1000 -0.1000 -0.1000

-0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 0.9000 -0.1000 -0.1000 -0.1000

-0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 0.9000 -0.1000 -0.1000

-0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 0.9000 -0.1000

-0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 -0.1000 0.9000

El termino independiente b del sistema que hay que resolver en mınimos cuadradoses

>> b=zeros(10,1);

>> b(1)=1;

>> b(2)=1;

y una solucion en mınimos cuadrados de Px = b es

>> x=P\b

x =

1.0e+014 *

-2.1969

-2.1969

-2.1969

-2.1969

-2.1969

-2.1969

-2.1969

-2.1969

-2.1969

-2.1969

Matematicas I. 2010-2011

Page 30: Tema 6.- Ortogonalidad y mejor aproximaci´on. · m´etricos en los espacios Cn, de vectores de coordenadas complejas, habr´ıa que considerar la definici´on apropiada (coherente)

202 Tema 6.- Ortogonalidad y mejor aproximacion.

Ejercicios (MATLAB).

Ejercicio 36. Consultar la ayuda de MATLAB sobre las funciones/comandos:

\ (mldivide), polyfit.

(a) Resuelve los ejercicios 26, 27, 29, 30, 31 y 32 utilizando el comando \ (planteandopreviamente el sistema de ecuaciones apropiado).

(b) Resuelve los ejercicios 29 y 30 utilizando el comando polyfit.

Ejercicio 37. Disena una funcion en MATLAB que tenga como argumento de entrada unnumero natural n y que genere de forma aleatoria n puntos del plano, dibuje dichos puntosy las rectas de regresion y sobre x y x sobre y correspondientes a dicha nube de puntos (todoen la misma grafica).

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica