Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra...

152
` Algebra lineal Enginyeria Qu´ ımica Jaume Amor´ os UPC Barcelona 2002/10/11

Transcript of Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra...

Page 1: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Algebra linealEnginyeria Quımica

Jaume AmorosUPC

Barcelona

2002/10/11

Page 2: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2

Page 3: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Index

0.1 Programa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

0.2 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1 Matrius i sistemes lineals 9

1.1 Matrius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2 Sistemes d’equacions lineals . . . . . . . . . . . . . . . . . . . 13

2 Espais vectorials 15

2.1 Definicio i propietats . . . . . . . . . . . . . . . . . . . . . . . 15

2.1.1 Components d’un vector. Canvis de base . . . . . . . . 27

2.2 Subespais vectorials . . . . . . . . . . . . . . . . . . . . . . . . 31

2.2.1 Sumes directes . . . . . . . . . . . . . . . . . . . . . . 36

2.3 Rang de matrius . . . . . . . . . . . . . . . . . . . . . . . . . 37

3 Aplicacions lineals 45

3.1 Definicio i elements caracterıstics . . . . . . . . . . . . . . . . 45

3.2 Canvis de base . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.3 Mono, epi i isomorfismes . . . . . . . . . . . . . . . . . . . . . 58

3.4 Imatges i antiimatges de subespais . . . . . . . . . . . . . . . 62

4 Determinants 71

4.1 Matrius elementals . . . . . . . . . . . . . . . . . . . . . . . . 71

4.2 Propietats del determinant . . . . . . . . . . . . . . . . . . . . 75

5 Diagonalitzacio 81

5.1 Endomorfismes . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.2 Subespais invariants, valors i vectors propis . . . . . . . . . . . 84

5.3 Cayley–Hamilton i forma de Jordan . . . . . . . . . . . . . . . 99

5.3.1 Polinomis evaluats en matrius . . . . . . . . . . . . . . 99

5.3.2 Forma de Jordan d’endomorfismes del pla . . . . . . . 107

3

Page 4: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

4 INDEX

6 Geometria del pla i de l’espai 1116.1 Varietats lineals . . . . . . . . . . . . . . . . . . . . . . . . . . 111

6.1.1 El pla . . . . . . . . . . . . . . . . . . . . . . . . . . . 1126.1.2 L’espai . . . . . . . . . . . . . . . . . . . . . . . . . . . 1126.1.3 Canvis de referencia . . . . . . . . . . . . . . . . . . . 114

6.2 El producte escalar euclidia . . . . . . . . . . . . . . . . . . . 1186.2.1 Producte escalar, distancia i angle . . . . . . . . . . . . 1186.2.2 Subespais ortogonals, projeccions . . . . . . . . . . . . 122

6.3 Arees, volums, producte vectorial . . . . . . . . . . . . . . . . 1296.3.1 Determinants, arees i volums . . . . . . . . . . . . . . . 1296.3.2 El producte vectorial . . . . . . . . . . . . . . . . . . . 136

A Nombres complexes 141A.1 Definicio i operacions . . . . . . . . . . . . . . . . . . . . . . . 141A.2 Formes rectangular i exponencial . . . . . . . . . . . . . . . . 142A.3 Arrels de nombres complexes . . . . . . . . . . . . . . . . . . . 147

B Polinomis 149

Page 5: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Introduccio

Aquestes notes recullen el contingut basic de l’assignatura d’Algebra linealde primer d’Enginyeria Quımica de la ETSEIB, tal com s’imparteix des delcurs 2000-1. Es facilita a traves de la pagina web

http://www-ma1.upc.es/∼amorosa mesura que es escrita, a fi de proporcionar un guio del curs als alumnes.

Debut al seu caracter de versio inicial son poc detallades. Per a seguirl’assignatura es recomanable complementar–les amb (o reemplacar–les per)qualsevol dels llibres de la bibliografia, i sobretot resoldre una llista llarga deproblemes.

Tambe debut a que son la versio inicial, aquestes notes apareixen amberrors tipografics, ortografics i potser tambe en els calculs que hi surten.Sisplau aviseu–me de qualsevol d’aquests errors que hi trobeu i no feu correraquests apunts fora de l’ambit de l’assignatura.

Agraıments: A mes de les citades a la bibliografia, una altra font impor-tant d’aquests apunts ha estat un curs d’Algebra lineal preparat per Cristi-na Blancafort. Jose Tomas Lazaro, Josep Maria Mondelo, Joaquim OrtegaCerda i Javier Vindel han asesorat a l’autor en els aspectes informatics de lapreparacio de les notes.

Jaume [email protected]

0.1 Programa

Tema 0: Nombres complexos i polinomis.

- C, operacions, conjugacio.

- Forma exponencial. Potencies i arrels.

- Polinomis. Zeros i factors lineals, divisio per Ruffini. Teorema fona-mental de l’Algebra.

5

Page 6: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6 INDEX

Tema 1: Matrius i sistemes lineals.

- Matrius: definicio i operacions.

- Sistemes lineals: solucio per eliminacio gaussiana.

- Rang d’una matriu. Teorema de Rouche–Frobenius.

- Sistemes lineals matricials. Calcul d’inverses pel metode de Gauss–Jordan.

Tema 2: Espais vectorials

- Espais vectorials. Bases, dimensio, coordenades. Canvis de base.

- Subespais vectorials. Suma i interseccio.

- Rang de matrius.

Tema 3: Aplicacions lineals

- Definicio. Matriu, canvis de base. Endomorfismes.

- Nucli, imatge, isomorfismes. Antiimatges.

- Sumes directes, projeccions. Espai quocient. Teorema d’isomorfisme.

Tema 4: Determinants

- Descomposicio en matrius elementals. Determinant com a volum ori-entat.

- Calcul per transformacions elementals i per desenvolupament per fi-la/columna.

- Determinant d’un endomorfisme.

Tema 5: Diagonalitzacio

- Subespais invariants. Valors i vectors propis. Polinomi caracterıstic.

- Diagonalitzacio. Teorema de Cayley–Hamilton.

- Forma de Jordan de matrius 2× 2.

Page 7: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

0.2. BIBLIOGRAFIA 7

Tema 6: Geometria del pla i de l’espai.

- Rectes y plans, parametritzacio i ecuacions implıcites. Posicio, inter-seccions.

- El producte escalar euclidia en Rn. Distancies, angles. Ortogonalitat,projeccio ortogonal.

- Arees, volums, determinants 2× 2 i 3× 3. Producte vectorial.

Tema 7: Formes quadratiques i productes escalars

- Formes bilineals i quadratiques. Index. Producte escalar. Criteri deSylvester.

- Ortogonalitat. Aplicacions ortogonals. Desplacaments en R2, R3. Re-flexions en Rn.

- Ortogonalitzacio d’una base. Descomposicio QR.

- Aplicacions adjuntes, autoadjuntes i matrius simetriques. El teoremaespectral.

0.2 Bibliografia

Pel que fa a teoria i exemples addicionals, recomanem:

- E. Hernandez, Algebra y Geometrıa. Addison–Wesley, 1994.

- S. Lipschutz, Algebra lineal 2a Ed. McGraw–Hill, 1992.

- F. Puerta, Algebra lineal I i II. Col. Aula ETSEIB. Edicions UPC,1995.

Hi han molts altres llibres sobre Algebra lineal i Geometria a les bibliote-ques i llibreries. En general estan be.

L’ETSEIB publica tambe col·leccions d’examens i problemes resolts.

Page 8: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

8 INDEX

Page 9: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Capıtol 1

Matrius i sistemes lineals

1.1 Matrius

Definicio 1.1. Una matriu es una taula rectangular de nombres.

Els nombres que la formen son anomenats els coeficients de la matriu.Al ser la taula rectangular, per a identificar cada coeficient necessitem dosındexs: el de fila i el de columna. Seguint una convencio molt comu enMatematiques i Fısica, indicarem la fila de la matriu on es troba el coeficientper un superındex, i la columna per un subındex. Aixı, el coeficient ai

j estroba a la fila i i a la columna j de la matriu. Mes graficament, els coeficientsd’una matriu de 3 files i 4 columnes son:

A =

a11 a1

2 a13 a1

4

a21 a2

2 a23 a2

4

a31 a3

2 a33 a3

4

Notacio 1.2. Direm que una matriu es de mida m×n si te m files i n columnes,i denotarem

Mm×n(R)

el conjunt de les matrius m × n amb coeficients reals. Altres possibles co-eficients son els nombres complexes (vegeu l’apendix A), els enters (Z ={0, 1,−1, 2,−2, . . . }), . . .

L’interes de les matrius no prove tant de la seva estructura, forca simple,com de les operacions que suporten:

(i) la suma de matrius,

(ii) la multiplicacio (o producte) per un escalar,

9

Page 10: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

10 CAPITOL 1. MATRIUS I SISTEMES LINEALS

(iii) la multiplicacio (o producte) de matrius,

(iv) la transposicio.

Procedim a definir aquestes operacions, i a indicar les propietats quetenen. Aquestes propietats es poden demostrar totes a partir de la definiciode les operacions i de les propietats de la suma i el producte de nombres, perocom la llista es llarga i les demostracions senzilles ens limitarem a enunciarles propietats gairebe sempre. Treballarem amb coeficients reals en la restade la seccio, pero tot el que hi apareix es cert prenent coeficients en qualsevolcos commutatiu.

La suma de matrius:

- Esta definida nomes per matrius de la mateixa mida m × n, que estambe la mida de la suma.

- Es sumen els coeficients que ocupen el mateix lloc.

- Exemple: 1 −32 011 3

2

+

2 1−3 10 5

=

3 −2−1 111 13

2

Les propietats de la suma de matrius son: Per A, B, C matrius qualsevols

de la mateixa mida m× n:

(i) Prop. associativa: (A + B) + C = A + (B + C)

(ii) Prop. commutativa: A + B = B + A

(iii) Element neutre: A + 0 = A, on 0 denota la matriu m× n amb tots elscoeficients iguals a zero.

(iv) Element oposat: per qualsevol A existeix una matriu −A, amb coefi-cients els de A canviats de signe, tal que A + (−A) = 0.

La multiplicacio per escalar:

- Esta definida per un nombre i una matriu de mida m × n qualsevol,que es tambe la mida de la matriu multiplicada.

- Es multipliquen tots els coeficients de la matriu pel nombre.

Page 11: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

1.1. MATRIUS 11

- Exemple:

5 ·(

3 11−1 2

3

)=

(15 55−5 10

3

)

Les propietats de la multiplicacio per escalar son: Per A matriu, λ, µ ∈ Rqualsevols:

(i) Prop. associativa: λ · (µ · A) = (λ · µ) · A

(ii) Element unitat: 1 · A = A

Les propietats de la suma i la multiplicacio per escalar son:

(i) Prop. distributiva respecte de la suma de matrius: λ · (A + B) =λ · A + λ ·B.

(ii) Prop. distributiva respecte de la suma d’escalars: (λ + µ) ·A = λ ·A +µ · A.

La multiplicacio de matrius: Comencem definint un cas particular, lamultiplicacio d’un vector columna per una matriu.

- Podem multiplicar una matriu de mida m × n (m files, n columnes),per un vector columna de longitud n.

- El resultat es un vector columna de longitud m.

- Cal multiplicar cada fila pel vector columna terme a terme i sumar,com en un producte escalar, i sumar els productes.

- Exemple:

(2 −1 0 31 3 1

2−10

523−4

=

(2 · 5 + (−1) · 2 + 0 · 3 + 3 · (−4)1 · 5 + 3 · 2 + 1

2· 3 + (−10) · (−4)

)=

(−41052

)

- Si multipliquem una matriu per un vector columna de la mida equivo-cada ens n’adonarem perque no podem aparellar els coeficients de cadafila de la matriu amb els del vector, ens sobraran o faltaran termes.

La multiplicacio de matrius, cas general:

- Podem multiplicar una matriu de mida m× n per una matriu de midan × p, es a dir, nomes cal que les files de la primera matriu tinguin lamateixa longitud que les columnes de la segona.

Page 12: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

12 CAPITOL 1. MATRIUS I SISTEMES LINEALS

- El resultat es una matriu de mida m×p (el nombre de files de la primerai de columnes de la segona).

- Cal multiplicar la primera matriu per cada columna de la segona comen el cas de matriu per vector columna, i aixı obtenim les columnes dela matriu producte.

- La formula es: si A te coeficients aij, i B te coeficients bk

l , la matriuproducte C = A ·B te coeficients

cij = ai

1 · b1j + ai

2 · b2j + · · ·+ ai

n · bnj

- Exemple:

(2 −1 0 31 3 1

2−10

5 12 03 −1−4 7

=

(2 · 5 + (−1) · 2 + 0 · 3 + 3 · (−4) 2 · 1 + (−1) · 0 + 0 · (−1) + 3 · 71 · 5 + 3 · 2 + 1

2· 3 + (−10) · (−4) 1 · 1 + 3 · 0 + 1

2· (−1) + (−10) · 7

)

=

(−4 231052

−1392

)

Propietats de la multplicacio de matrius:

(i) Propietat associativa: (A · B) · C = A · (B · C) (pregunta: quines hande ser les mides de les matrius A, B, C?).

(ii) La multiplicacio de matrius no es commutativa: per exemple, per lesmatrius

A =

(2 1 0−1 4 3

)B =

1 1 0−1 2 −32 1 1

el producte A · B esta definit, pero el producte B · A no ho esta perproblemes de mida. Fins i tot quan tots dos productes ho estan podenser diferents, per exemple:(

1 20 1

)·(

1 02 1

)=

(5 22 1

) (1 02 1

)·(

1 20 1

)=

(5 22 1

)

(iii) Matriu identitat: si denotem Idl la matriu quadrada de mida l× l quete tots els coeficients de la diagonal iguals a 1 i els de fora de la diagonaliguals a zero, tenim que per A de mida m×n: Idm·A = A, A·Idn = A.

Page 13: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

1.2. SISTEMES D’EQUACIONS LINEALS 13

Exercici 1. Busqueu dues matrius A, B tals que els dos productes A · B iB · A estiguin definits, pero no tinguin la mateixa mida.

Les propietats de la multiplicacio de matrius respecte de la suma i delproducte per escalar son:

(i) Propietat distributiva respecte de la suma, pels dos costats: A · (B +C) = (A ·B) + (A · C), (D + E) · F = (D · F ) + (E · F ).

(ii) Propietat commutativa respecte de la multiplicacio per escalars: A ·(λ ·B) = λ · (A ·B).

La transposicio de matrius:

- Esta definida per matrius de qualsevol mida.

- Si A es de mida m× n, la seva transposada At es de mida n×m.

- Consisteix en reescriure la matriu de manera que les files es converteixinen columnes i viceversa, es a dir, si B = At la relacio entre els coeficientses bi

j = aji .

- Exemple:

A =

(2 1 0−1 4 3

), At =

2 −11 40 3

Les propietats de la transposicio de matrius respecte de les operacions

son (atencio a la darrera!):

(i) Transposar dues vegades retorna la matriu original: (At)t = A.

(ii) La transposicio de la suma es la suma de transposades: (A + B)t =At + Bt.

(iii) La transposicio del producte per un escalar es el producte de l’escalarper la matriu transposada: (λ · A)t = λ · At.

(iv) La transposicio d’un producte de matrius es el producte de les matriustransposades en ordre invers: (A ·B)t = Bt · At.

1.2 Sistemes d’equacions lineals

Els apunts de sistemes d’equacions lineals apareixeran en unes setmanes.

Page 14: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

14 CAPITOL 1. MATRIUS I SISTEMES LINEALS

Page 15: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Capıtol 2

Espais vectorials

2.1 Definicio i propietats

Un espai vectorial es un conjunt on podem fer combinacions lineals: hi had’haver una suma de vectors, un producte per escalar, i aquests han de compliruna llista de propietats llarga pero bastant raonable. Les combinacions lineals(a vegades dites superposicions en Fısica) son combinacions d’aquestes duesoperacions basiques.

Definicio 2.1. Un espai vectorial sobre R es un conjunt E que te duesoperacions

(i) la suma + de vectors, ~u + ~v ∈ E definit per ~u,~v ∈ E qualsevols,

(ii) el producte per escalar, λ · ~v ∈ E definit per λ ∈ R, ~v ∈ E qualsevols,

tals que compleixen les seguents propietats:

- Propietat associativa de la suma: (~u + ~v) + ~w = ~u + (~v + ~w) per~u,~v, ~w ∈ E qualsevols.

- Existencia d’element neutre per la suma: hi ha un vector zero ~0 ∈ Etal que ~v +~0 = ~v per tot ~v ∈ E.

- Existencia d’element oposat per la suma: tot vector ~v ∈ E te un vectoroposat −~v ∈ E tal que ~v + (−~v) = ~0.

- Propietat commutativa de la suma: ~u + ~v = ~v + ~u per ~u,~v ∈ E qual-sevols.

- Propietat associativa del producte: λ ·(µ ·~v) = (λµ) ·~v per λ, µ ∈ R, ~v ∈E qualsevols.

15

Page 16: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

16 CAPITOL 2. ESPAIS VECTORIALS

- Existencia d’element neutre pel producte: 1 · ~v = ~v per tot ~v ∈ E.

- Propietat distributiva respecte de la suma de vectors: λ · (~u + ~v) =λ · ~u + λ · ~v per λ ∈ R, ~u,~v ∈ E qualsevols.

- Propietat distributiva respecte de la suma d’escalars: (λ + µ) · ~v =λ · ~v + µ · ~v per λ, µ ∈ R, ~v ∈ E qualsevols.

Els elements de E s’anomenen vectors.

Notacio 2.2. Als nombres que multipliquen als vectors se’ls anomena escalars,aquesta notacio es d’origen fısic.

Quan treballem amb variables i convingui distingir quines son escalars iquines vectors, escriurem els escalars amb lletres gregues (α, β, γ, λ, µ, . . . ) iels vectors amb lletres llatines, a vegades amb un superindex → (~u,~v,~e, . . . ).

Hem definit els espais vectorials reals, on els escalars son els nombresreals. Aquesta definicio es pot repetir prenent com a escalars el cos C delsnombres complexes, el cos Q dels racionals, o qualsevol altre cos k. Parlarıemaleshores de k–espais vectorials. Tot aquest capıtol es valid per qualsevol cosd’escalars.

Els espais vectorials son ubicus en les Matematiques. Donem uns quantsexemples sense comprovar que les operacions compleixen les propietats dela definicio 2.1 (la comprovacio es facil usant que els nombres reals tenenaquestes propietats).

Exemple 2.3. El pla, l’espai, . . . , Rn.

(i) El conjunt de vectors es E = Rn = {(x1, x2, . . . , xn) |x1, . . . , xn ∈ R},on n pot ser 1, 2, 3, . . . .

(ii) La suma es la suma component a component

(x1, . . . , xn) + (y1, . . . , yn) = (x1 + y1, . . . , xn + yn)

(iii) El producte per escalar es el producte component a component

λ · (x1, . . . , xn) = (λx1, . . . , λxn)

Exemple 2.4. Els espais de matrius

(i) El conjunt de vectors es E = Mm×n(R).

(ii) La suma es la suma de matrius.

(iii) El producte per escalar es el d’un escalar per una matriu.

Page 17: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.1. DEFINICIO I PROPIETATS 17

Exemple 2.5. Les equacions lineals en les variables x1, . . . , xn.

(i) El conjunt de vectors es E = {α1x1+α2x2+· · ·+αnxn = β α1, . . . αn, β ∈R}.

(ii) La suma es (exemple)

(7x1 + 2x2 − 5x3 = 8)

+ (x1 − 4x2 + 9x3 = 6)(8x1 − 2x2 + 4x3 = 14)

(iii) El producte per escalar es (exemple)

6 · (2x1 − x2 + 3x3 = 10) = (12x1 − 6x2 + 18x3 = 60)

Exemple 2.6. Els polinomis reals.

(i) El conjunt de vectors es R[x] = {p(x) = a0+a1x+· · ·+anxn | a0, . . . , an ∈

R}.

(ii) La suma es la suma de polinomis (exemple)

(1− x + x2) + (3 + 5x) = 4 + 4x + x2

(iii) El producte per escalar es el de polinomis (exemple)

2 · (3− x + x4) = 6− 2x + 2x4

Exemple 2.7. Funcions reals.

(i) El conjunt de vectors es C0([−π, π]) = {f : [−π, π] → R contınues}(podem canviar [−π, π] per qualsevol domini: R, . . . El punt clau esque la suma de funcions contınues torna a ser–ho, i el producte per unescalar tambe)

(ii) La suma es la de funcions

(f + g)(x) = f(x) + g(x)

(iii) El producte per escalar es el de funcions

(λ · f)(x) = λf(x)

Page 18: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

18 CAPITOL 2. ESPAIS VECTORIALS

Exemple 2.8. Successions de nombres reals.

(i) El conjunt de vectors es E = {(x1, x2, . . . , xn, . . . ) |xi ∈ R per a tot i}.

(ii) La suma es la suma terme a terme

(x1, . . . , xn, . . . ) + (y1, . . . , yn, . . . ) = (x1 + y1, . . . , xn + yn, . . . )

(iii) El producte per escalar es la multiplicacio de tots els termes

λ · (x1, . . . , xn, . . . ) = (λx1, . . . , λxn, . . . )

Exemple 2.9. Solucions d’un sistema lineal homogeni Ax = 0.

(i) El conjunt de vectors es

E =

x =

x1

. . .xn

|Ax =

0. . .0

,

on A es una matriu m× n fixada.

(ii) La suma es la de vectors de Rn (exemple 2.3).

(iii) El producte per escalar es el de Rn.

En aquest exemple cal comprovar un parell de detalls que son obvis enels anteriors:

- La suma de dues solucions del sistema Ax = 0 es tambe solucio.

A(x + y) = Ax + Ay = 0 + 0 = 0

- El producte d’un escalar per una solucio del sistema Ax = 0 torna aser solucio.

A(λx) = λ(Ax) = λ · 0 = 0

En canvi, si el sistema d’equacions lineals no es homogeni la suma de duessolucions o el producte per escalar deixen de ser–ho.

Veurem mes endavant que aquests exemples son subespais vectorials deRn.

Exemple 2.10. Solucions de l’equacio diferencial y′′ + y = 0.

(i) El conjunt de vectors es E = {y : R → R | y′′ + y = 0}.

Page 19: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.1. DEFINICIO I PROPIETATS 19

(ii) La suma es la suma de funcions (exemple 2.7)

(iii) El producte per escalar es el de funcions.

Com en l’exemple anterior, s’ha de comprovar que la suma de dues solucionsde l’equacio o el producte d’una per una constant real torna a ser–ho.

Exercici 2. Proveu a partir de la definicio d’espai vectorial que 0 ·~v = ~0 pertot vector ~v ∈ E.

Definicio 2.11. Diem que uns vectors v1, v2, . . . , vn, · · · ∈ E son linealmentdependents si algun d’ells es combinacio lineal dels altres.

Si cap d’ells es combinacio lineal dels altres diem que son linealmentindependents

Notacio 2.12. Linealment independents es sol abreujar com l.i., i linealmentdependents com l.d..

Observacio 2.13. La nostra definicio no te sentit per a conjunts d’un solvector. Diem aleshores que v es l.i. quan v 6= ~0, i l.d. quan v = ~0.

Exercici 3. Comproveu que dos vectors son linealment dependents si i nomessi algun d’ells es multiple de l’altre.

Exemple 2.14. Portem a forma esglaonada el seguent sistema d’equacions:2x− y + 3z = 4

y + 8z = 54x + y + 30z = 23

2x− y + 3z = 4

y + 8z = 53y + 24z = 15

2x− y + 3z = 4

y + 8z = 50 = 0

Les operacions d’esglaonament mostren que la tercera fila del sistema originales combinacio lineal de les dues primeres:

2 (2x− y + 3z = 4) + 3 (y + 8z = 5) = (4x + y + 30z = 23)

Debut a aixo per a resoldre el sistema n’hi ha prou amb resoldre les duesprimeres equacions. Aquestes son linealment independents perque cap d’elleses multiple de l’altra, no podem prescindir–ne de cap per resoldre el sistema.

La caracterizacio mes practica de la independencia lineal de vectors solser la seguent:

Proposicio 2.15. Un conjunt de vectors v1, v2, . . . vn ∈ E es linealment in-dependent si i nomes si la unica manera de tenir ~0 com a combinacio lineal

λ1v1 + λ2v2 + · · ·+ λnvn = ~0

es fer λ1 = λ2 = · · · = λn = 0.

Page 20: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

20 CAPITOL 2. ESPAIS VECTORIALS

Exemple 2.16. Siguin u1 = (2, 5, 1), u2 = (3,−1, 4), u3 = (−1, 6,−3) ∈ R3.Per a comprovar si son linealment dependents o independents discutim elsistema d’equacions de la proposicio 2.15:

λ1u1+λ2u2+λ3u3 = (2λ1+3λ2−λ3, 5λ1−λ2+6λ3, λ1+4λ2−3λ3) = (0, 0, 0)

Discutint el sistema en forma de matriu ampliada tenim2 3 −15 −1 61 4 5

∣∣∣∣∣∣∣000

∼ · · · ∼

1 4 50 −5 50 0 0

∣∣∣∣∣∣∣000

El sistema es compatible indeterminat, per tant la solucio λ1 = λ2 = λ3 = 0no es unica i els vectors son linealment dependents. Calculant solucionstrobem que u1 − u2 − u3 = ~0, pel que podem despejar qualsevol dels tresvectors com a combinacio lineal dels altres dos.

En aquest exemple observem que si un conjunt de vectors es l.i. o l.d.depen nomes del rang de la matriu que formen. Estudiem aixo a la seccio2.3.

Exemple 2.17. Vegem que el conjunt de les potencies de x {1, x, x2, . . . , xn, . . . }es linealment independent en R[x].

Si una de les potencies xn fos combinacio lineal de les altres, tindrıemuna igualtat de polinomis

xn = α0 + α1x + · · ·+ αn−1xn−1 + αn+1x

n+1 + · · ·+ αNxN

Ara be, dos polinomis son iguals quan tenen els mateixos termes en cada graui el polinomi de la dreta no te terme de grau n. Per tant cap xn es combinaciolineal dels altres i les potencies de x son linealment independents.

Exercici 4. En l’espai vectorial de l’exemple 2.10, comproveu que sin(x), cos(x)son linealment independents.

Definicio 2.18. Un sistema de generadors es un conjunt de vectors v1, v2, . . . ,∈E tals que tot vector v ∈ E es combinacio lineal

v = λ1v1 + · · ·+ λnvn

per alguns escalars λ1, . . . , λn ∈ R.

Exemple 2.19. Comprovem que els vectors u1 = (2, 3), u2 = (1, 5) son unsistema de generadors de R2:

Page 21: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.1. DEFINICIO I PROPIETATS 21

En efecte, per a posar un vector qualsevol (x, y) ∈ R2 com a combinaciolineal λ1u1 + λ2u2 = (x, y) cal resoldre el sistema(

2 13 5

∣∣∣∣∣ xy)∼(

2 10 7

2

∣∣∣∣∣ xy − 3

2x

)

Tenim rang A = rang (A|b) = 2 per qualsevol (x, y), per tant el sistemasempre te solucio. Tornem a observar que la propietat de ser generadorsdepen del rang de la matriu formada pels vectors (seccio 2.3).

En ajuntar les dues definicions anteriors obtenim la de base:

Definicio 2.20. Una base d’un espai vectorial E es un conjunt de vectorsque son linealment independents i generen E.

Exemple 2.21. La base canonica de Rn: Comprovem que per tot n ≥ 1 elsvectors e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), en = (0, . . . , 0, 1) son una base.Sistema de generadors: Per qualsevol vector v = (α1, . . . , αn) ∈ Rn tenimv = α1e1 + α2e2 + · · ·+ αnen.Independencia lineal: El sistema de la proposicio 2.15

λ1e1 + · · ·+ λnen = (λ1, λ2, . . . , λn) = (0, . . . , 0)

te solucio unica λ1 = · · · = λn = 0.

Exemple 2.22. La base canonica 1, x, x2, x3, . . . de R[x]. Observeu que esinfinita.Sistema de generadors: Per definicio tot polinomi es de la forma p(x) =α0 · 1 + α1x + · · ·+ αnx

n amb α0, . . . , αn ∈ R.Independencia lineal: vista a l’exemple 2.17.

Una base d’un espai vectorial ens proporciona informacio completa sobreaquest espai. Per exemple, si coneixem una propietat per una base de E iaquesta propietat es mante per combinacions lineals, aleshores la coneixemper tot E (vegi’s exemple 2.1).

El seguent teorema te un enunciat forca abstracte i la demostracio llarga,pero es fonamental per la teoria d’espais vectorials i tambe per la seva apli-cacio.

Teorema 2.23. (Teorema de Steinitz) Sigui E un espai vectorial, i {v1, v2, . . . , vn, . . . }una base seva. Si u1, u2, . . . , um ∈ E es un conjunt de vectors linealment in-dependents, podem substituır m vectors de la base vi1 , . . . , vim per u1, . . . , um

de manera que el conjunt resultant es tambe base de E.

Page 22: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

22 CAPITOL 2. ESPAIS VECTORIALS

Demostracio. La idea de la demostracio es anar introduınt un a un els vectorsl.i. u1, . . . , um en la base, de manera que en cada insercio eliminem un vectorvi, i no un dels uj que acabem d’insertar, i en cada pas obtinguem una basenova. La demostracio es doncs per induccio en el nombre m de vectors l.i. aintroduır.

Farem la prova nomes en el cas en que la dimensio de E es finita (dim E =n), pero el lector pot comprovar que en el cas dim E = ∞ es pot aprofitar lamateixa prova complicant els subındexs dels vectors.

Primer vector: Com {v1, . . . , vn} es una base, podem posar u1 com a combi-nacio lineal

u1 = α1v1 + · · ·+ αnvn (2.1)

Que el conjunt u1, . . . , um sigui l.i. implica en particular que u1 6= ~0, pelque sabem que algun coeficient αi es diferent de zero. Si reordenem elsvectors d’una base continua sent–ho, ja que ser sistema de generadors i l.i.no depenen de l’ordre en que estiguin els vectors. Per aixo reordenem la basesi conve per assegurar–nos que α1 6= 0 en (2.1).

Substituım ara v1 per u1, i comprovem que els vectors {u1, v2, v3, . . . vn}continuen sent una base de E.

Comprobar que generen E es senzill: de la igualtat (2.1), com α1 6= 0despejem

v1 =1

α1

u1 −α2

α1

v2 − · · · −αn

α1

vn . (2.2)

Ara, com v1, . . . vn son base, per qualsevol vector w ∈ E tenim una combi-nacio lineal

w = µ1v1 + · · ·+ µnvn ,

en la que podem substituır v1 pel seu valor en (2.2) i obtenim

w =µ1

α1

u1 +(µ2 −

µ1α2

α1

)v2 + · · ·+

(µn −

µ1αn

α1

)vn ,

pel que els vectors u1, v2, . . . , vn generen E.Provem ara la independencia lineal de u1, v2, . . . , vn discutint el sistema

λ1u1 + λ2v2 + · · ·+ λnvn = ~0

Substituınt u1 pel seu valor en (2.1) arribem a

λ1α1v1 + (λ2 + λ1α2)v2 + · · ·+ (λn + λ1αn)vn = ~0

Els vectors v1, . . . , vn son l.i. per ser base, per tant en la darrera igualtat elcoeficient de cada vector v1, . . . , vn ha de ser 0. Com α1 6= 0, del coeficient

Page 23: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.1. DEFINICIO I PROPIETATS 23

de v1 deduım que λ1 = 0. Substituınt aquest valor en els coeficients dev2, . . . , vn tenim les igualtats λ2 = 0, . . . , λn = 0. Per la prop. 2.15 totesaquestes anulacions volen dir que els vectors u1, v2, . . . , vn son l.i.

Hipotesi d’induccio: Suposem ara que, despres de reordenar la base v1, . . . , vn

quan ha calgut, hem comprovat que els vectors u1, . . . , uk−1, vk, . . . , vn formenuna base de E.

Comprovem ara que, reordenant de nou vk, . . . , vn si conve, podem sub-stituir el vector vk per uk i tenir de nou una base.

El proces es el mateix que el del primer vector, amb el detall afegit quehem de vigilar de no eliminar un dels vectors ui ja introduıts al insertar uk.Escribim aquest vector com a combinacio lineal de la base u1, . . . , uk−1, vk, . . . , vn:

uk = α1u1 + · · ·+ αk−1uk−1 + αkvk + · · ·+ αnvn (2.3)

No pot ser que αk = αk+1 = · · · = αn = 0, ja que aleshores tindrıem uk

com a combinacio lineal de u1, . . . , uk−1, i aixo no pot ser perque els vectorsu1, . . . , um son l.i. Per tant el coeficient d’algun dels vectors vk, . . . , vn es nonul, i reordenant–los si cal podem assegurar que αk 6= 0.

Comprovem ara que un cop tenim αk 6= 0 els vectors u1, . . . , uk−1, uk, vk+1 . . . vn

son una base de E:Com u1, . . . , uk−1, vk, . . . , vn ja eren base de E, donat un vector qualsevol

w ∈ E el podem posar com

w = µ1u1 + · · ·+ µk−1uk−1 + µkvk + · · ·+ µnvn

per alguns escalars µ1, . . . , µn. Despejant vk de (2.3) i substituınt–lo aquıobtenim w com a combinacio lineal

w = µ1u1 + · · ·+ µk

(−α1

αk

u1 − · · · −αk−1

αk

uk−1 +1

αk

uk − · · · −αn

αk

vn

)+ µk+1vk+1 + · · ·+ µnvn

=(µ1 − µk

α1

αk

)u1 + · · ·+ muk

αk

uk + · · ·+(µn − µk

αn

αk

)vn

Aixı qualsevol vector de E es combinacio lineal de u1, . . . , uk, vk+1, . . . , vn.Probem ara la independencia lineal del nou conjunt de vectors. Cal dis-

cutir el sistema

λ1u1 + · · ·+ λkuk + λk+1vk+1 + · · ·+ λnvn = ~0

Com en el cas del primer vector u1, substituım uk pel seu valor en (2.3) iagrupem termes:

(λ1 + λkα1) u1 + · · ·+ λkαkvk + · · ·+ (λn + λkαn) vn = ~0

Page 24: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

24 CAPITOL 2. ESPAIS VECTORIALS

Els vectors u1, . . . , uk−1, vk, . . . , vn ja eren base. Per tant tots els seus co-eficients en la darrera igualtat son 0. Del de vk deduım que λk = 0, jaque αk 6= 0. Si substituım λk pel seu valor en els demes coeficients, aligualar–los a 0 ens queda λ1 = · · · = λk−1 = λk+1 = · · · = λn = 0, pel queu1, . . . , uk, vk+1, . . . , vn son l.i., i tambe base.

Amb aixo hem completat la prova del teorema per induccio: en efecte,al probar el cas del primer vector u1 hem demostrat la hipotesi d’induccioper k = 2. La demostracio de la insercio de uk que hem fet despres val perqualsevol k, per tant ens diu en particular que si la hipotesi d’induccio escerta per k = 2, podem insertar u2 en la base. Amb aixo establim que lahipotesi d’induccio es certa per k = 3, i de nou pel raonament d’inserciode uk en aquest cas podem insertar u3... El proces continua fins arribar aqualsevol valor finit de m.

En el seguent exemple fem la substitucio del teorema de Steinitz seguintla demostracio per a ilustrar–la. En l’exemple 2.64 farem la substitucio demanera mes efectiva.

Exemple 2.24. Els vectors u1 = (0, 1, 1), u2 = (3, 0, 2) ∈ R3 son l.i. perque noson l’un multiple de l’altre. Comprovem que podem substituir dos vectorsde la base canonica per ells:

En base canonica tenim u1 = e2+e3. Aixo permet despejar e2 o e3. Trieme2, aixı tenim

e2 = −u1 + e3

Els vectors e1, u1, e3 son un sistema de generadors de R3 perque e1, e2, e3 espoden obtenir a partir d’ells i generen tot l’espai. Si tenim una igualtat

λ1e1 + λ2u1 + λ3e3 = ~0

substituınt u1 per la seva expressio original e2 + e3 tenim

λ1e1 + λ2e2 + (λ2 + λ3)e3 = ~0

Com e1, e2, e3 eren l.i. aixo implica que λ1 = λ2 = 0 i per tant tambe λ3 = 0.Per tant e1, u1, e3 son l.i., i son de nou base de R3.

Ara posem u2 com a combinacio lineal de la nova base e1, u1, e3. Surt

u2 = 3e1 + 2e3

D’aquı podem despejar e1 o e3 perqe apareixen amb un coeficient diferent dezero (en aquest punt sempre apareix algun dels ei originals amb coeficient

Page 25: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.1. DEFINICIO I PROPIETATS 25

no zero, del contrari els u1, . . . , um originals serien l. dependents). Triem e3.Fem doncs

e3 = −3

2e1 + u2

i ara podem comprovar que e1, u1, u2 generen R3 i son l.i. exactament igualque ho acabem de fer per e1, u1, e3.

Una consequencia immediata del teorema de Steinitz es:

Corol·lari 2.25. Si un espai vectorial E te una base amb n vectors, totes lesbases de E tenen el mateix nombre n de vectors.

Demostracio. Si hi habes dues bases amb diferent nombre de vectors, pre-nent la que en te mes com a conjunt de vectors l.i. en el teorema de Steinitzarribem a contradiccio, ja que en aquest cas ens assegura que podem reem-placar un a un part dels vectors de la base mes petita per tots els de la mesgran.

Es pot veure de manera analega que si E te una base infinita no en pottenir cap de finita, la diferencia amb el cas finit es nomes una questio d’ındexs.Aixo permet definir:

Definicio 2.26. La dimensio d’un espai vectorial es el nombre de vectorsque tenen les seves bases.

Veiem dels exemples anteriors que dim Rn = n, dim R[x] = ∞. Aixıaquesta definicio de dimensio coincideix amb la intuıtiva del pla i de l’espai.

Exemple 2.27. L’espai E = M2×3(R) te una base canonica

E11 =

(1 0 00 0 0

)E1

2 =

(0 1 00 0 0

)E1

3 =

(0 0 10 0 0

)

E21 =

(0 0 01 0 0

)E2

2 =

(0 0 00 1 0

)E2

3 =

(0 0 00 0 1

)

Com en el cas dels polinomis, podem posar tota matriu A = (aij) ∈ E com

A =∑2

i=1

∑3j=1 ai

jEij, per tant les matrius Ei

j generen E.Tambe es comprova immediatament que

2∑i=1

3∑j=1

aijE

ij =

(0 0 00 0 0

)=⇒ a1

1 = · · · = a23 = 0

Per tant les matrius formen una base i dim E = 6.De la mateixa manera podem comprovar que les matrius Ei

j amb un 1 enel coeficient (i, j) i els demes 0 son base de Mm×n(R) per m, n qualsevols.Per tant aquests espais tenen dimensio mn.

Page 26: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

26 CAPITOL 2. ESPAIS VECTORIALS

Finalment, algunes altres consequencies interessants del teorema de Steinitz:

Corol·lari 2.28. Sigui E un espai vectorial de dimensio n.

(i) Tot conjunt de vectors linealment independents u1, . . . , um pot ampliar–se fins una base u1, . . . , um, vm+1, . . . , vn.

(ii) Tot sistema de generadors u1, . . . , uN conte algun subconjunt de vectorsque es base.

(iii) Si n vectors son linealment independents, son base.

(iv) Si n vectors generen E, son base.

Demostracio. (i) Prendre una base v1, . . . , vn de E i aplicar el teorema deSteinitz a aquesta base i els vectors l.i. u1, . . . , um.

(ii) Aquesta part no necessita el teorema de Steinitz. Si u1, . . . , uN son l.i. ames de generadors aleshores son base. Si no son l.i., aleshores algun d’ells escombinacio lineal dels altres. Els reordenem per a que sigui l’ultim

uN = α1u1 + . . . αN−1uN−1 (2.4)

Aleshores els vectors u1, . . . , uN−1 son tambe sistema de generadors de E: enefecte, com u1, . . . , uN eren sistema de generadors podem escriure tot v ∈ Ecom a combinacio lineal

v = λ1u1 + · · ·+ λNuN (2.5)

Substituınt uN segons (2.4) en (2.5) obtenim el vector qualsevol v com acombinacio lineal de u1, . . . , uN−1.

Repetim aquest proces d’eliminacio mentre els generadors que quedin nosiguin l.i. Com el nombre de vectors es finit hem d’acabar, els vectors quequeden son l.i. i generadors.

(iii) Per (i) un conjunt de vectors l.i. es pot ampliar fins tenir una base. Peroles bases de E tenen n = dim E elements, pel que no podem afegir vectorsal nostre conjunt i ha de ser directament una base.

(iv) Per (ii) un sistema de generadors ha de contenir una base. Pero les basesde E tenen n = dim E elements, pel que no podem treure vectors al nostreconjunt i ha de ser directament una base.

Per a exemples d’aquest corol.lari ens remetem a la seccio 2.3.

Page 27: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.1. DEFINICIO I PROPIETATS 27

Exercici 5. Sigui E = {succesions {xn}n≥1 tals que xn+2 = xn+1+xn per tot n ≥1}. Les successions amb aquesta propietat van ser introduıdes per Fibonacci(∼ 1170– ∼ 1250), que estudiava el cas concret

1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, . . . (2.6)

(i) Comproveu que E es un subespai vectorial de l’espai de successionsreals (veure seccio 2.2).

(ii) Calculeu la dimensio de E i trobeu una base.

(iii) Busqueu les successions de E que son aritmetiques (xn = cn per c ∈ Rfixat) o geometriques (xn = rn per r ∈ R fixat). Podem formar unabase de E amb aquestes successions?

(iv) Doneu una formula pel terme n–essim de la successio (2.6), i per qual-sevol successio de E a partir dels seus dos primers termes x1, x2.

2.1.1 Components d’un vector. Canvis de base

Per a definir les coordenades en Algebra lineal necessitem la seguent propi-etat:

Proposicio 2.29. Sigui E un espai vectorial, i e1, . . . , en una base seva. Pera tot vector v ∈ E existeixen uns unics nombres λ1, . . . , λn ∈ R tals que

v = λ1e1 + λ2e2 + · · ·+ λnen

Demostracio. L’existencia dels λ1, . . . , λn es deu a que e1, . . . , en es sistemade generadors de E.

La unicitat de la solucio prove de que els vectors e1, . . . , en son linealmentindependents: en efecte, si tenim dues expressions per v

v = λ1e1 + λ2e2 + · · ·+ λnen = µ1e1 + · · ·+ µnen

agrupant termes a un costat tenim

(λ1 − µ1)e1 + (λ2 − µ2)e2 + · · ·+ (λn − µn)en = ~0

Com els vectors e1, . . . , en son linealment independents cal que λi − µi = 0per i = 1, 2, . . . , n, es a dir λ1 = µ1, λ2 = µ2, . . . , λn = µn i l’expressio de vcom a combinacio lineal de la base es unica.

Page 28: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

28 CAPITOL 2. ESPAIS VECTORIALS

Definicio 2.30. Sigui E un espai vectorial i e1, . . . , en una base seva. Lescomponents (o coordenades) d’un vector v ∈ E son la n–epla (λ1, . . . , λn) ∈Rn tal que

v = λ1e1 + λ2e2 + · · ·+ λnen

Veiem de la definicio que un cop fixada la base les components d’un vectorson uniques, pero si variem la base aquestes components variaran.

Exemple 2.31. En R2, un vector (x, y) te components (x, y) en la base canonicae1 = (1, 0), e2 = (0, 1) (per aixo l’anomenem canonica). Busquem ara lescomponents d’aquest vector qualsevol v = (x, y) en la base u1 = (2, 3), u2 =(1, 4). Cal trobar (λ1, λ2) tals que

λ1u1 + λ2u2 = (2λ1 + λ2, 3λ1 + 4λ2) = (x, y)

Per tant cal resoldre el sistema lineal(2 13 4

∣∣∣∣∣xy)∼(

2 10 5

2

∣∣∣∣∣ xy − 3

2x

)∼(

2 00 5

2

∣∣∣∣∣x− 25(y − 3

2x)

y − 32x

)∼(

1 00 1

∣∣∣∣∣ 45x− 1

5y

−35x + 2

5y

)

Es a dir, en base u1, u2 el vector v �’e components (45x− 1

5y,−3

5x + 2

5y).

Des d’un punt de vista de minimitzar l’esforc ens podem demanar si calestudiar el problema dels canvis de base. Els espais Rn, de polinomis o dematrius que hem vist fins ara tenen cadascun una base canonica (natural,distingida), que a mes es la mes practica per fer calculs. Pero en els subespaisvectorials, que estudiarem a partir de la seguent seccio, no hi sol haver unabase canonica. I quan estudiem aplicacions lineals necessitarem bases del’espai amb propietats especials. En l’exemple 2.1 tambe es necessita uncanvi a una base no canonica.

El problema del canvi de base resulta ser una questio de calcul i inversiode matrius, com ja s’ha vist en l’exemple 2.31.

Proposicio 2.32. Sigui E un espai vectorial, i {u1, . . . , un}, {w1, . . . , wn}dues bases seves. Per a un vector v ∈ E qualsevol, la relacio entre les com-ponents de v (α1, . . . , αn) en base u1, . . . , un i (β1, . . . , βn) en base w1, . . . , wn

ve donada pel producte de matriusβ1...

βn

= Cuw

α1...

αn

,

on la matriu Cuw te en la columna i–essima les components del vector ui en

la base w1, . . . , wn.

Page 29: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.1. DEFINICIO I PROPIETATS 29

Definicio 2.33. La matriu de canvi de base d’una base u1, . . . , un a una altraw1, . . . , wn es la matriu Cu

w de la proposicio 2.32.

La matriu de canvi de base Cuw te doncs la propietat de que al multiplicar

les components d’un vector en la base inicial u dona les seves components enla base final w. Si coneixem les components de cada vector de la base inicialen la base final, tenim les columnes de la matriu de canvi. Els altres metodesde calcul son el directe de l’exemple 2.31, o el de la seguent proposicio:

Proposicio 2.34. Sigui E un espai vectorial i {u1, . . . , un}, {w1, . . . , wn}, {e1, . . . , en}tres bases de E. Aleshores les matrius de canvi de base compleixen lesseguents relacions entre elles:

(i) Cwu = (Cu

w)−1.

(ii) Cuw = Ce

w · Cue .

Exemple 2.35. En l’exemple 2.31 veiem que si un vector v ∈ R2 te components(x, y) en base canonica, en base u1, u2 te components(

45

−15y

−35

25

)(xy

)

La matriu Ceu =

(45

−15y

−35

25

)es la de canvi de base e1, e2 a base u1, u2.

Per contra, si un vector v te components (α, β) en base u1, u2 les sevescomponents en base canonica son

αu1 + βu2 = α(2, 3) + β(1, 4) = (2α + β, 3α + 4β)

La matriu de canvi de base u1, u2 a la canonica es doncs

Cue =

(2 13 4

)

Aquesta matriu te per columnes les components de u1, u2 en base e1, e2, i esinversa de l’anterior.

Exemple 2.36. En R2[x] prenem les tres bases e1 = 1, e2 = x, e3 = x2, u1 =x2, u2 = x, u3 = 1, w1 = 1, w2 = (x− 1), w3 = (x− 1)2. Calculem les matriusde canvi de base entre aquestes tres bases.Canvi de e1, e2, e3 a u1, u2, u3: Cal expressar els vectors de la primera baseen termes de la segona:

e1 = u3 , e2 = u2, e3 = u1

Page 30: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

30 CAPITOL 2. ESPAIS VECTORIALS

La matriu de canvi de base Ceu que busquem te per columnes les components

de e1, e2, e3 en la base u1, u2, u3:

Ceu =

0 0 10 1 01 0 0

Canvi de w1, w2, w3 a e1, e2, e3:

w1 = e1 , w2 = x− 1 = −e1 + e2 , w3 = x2 − 2x + 1 = e1 − 2e2 + e3

Per tant la matriu de canvi de base es

Cwe =

1 −1 10 1 −20 0 1

Canvi de w1, w2, w3 a u1, u2, u3: Es el producte

Cwu = Ce

uCwe =

0 0 10 1 −21 −1 1

En aquest exemple podem comprovar la rao per l’ordre en que es multipliquenels canvis de base: la columna de components del vector apareix per la dretai cal aplicar–li els canvis de base succesius de dreta a esquerra. Si tenimp(x) = 3(x−1)2 +2(x−1)+8 = 3x2−4x+9 = 9−4x+3x2 la transformaciode les seves components es0 0 1

0 1 01 0 0

1 −1 1

0 1 −20 0 1

8

23

=

0 0 10 1 01 0 0

9−43

=

3−49

En efecte, la primera multiplicacio per la dreta ha passat p(x) a base e1, e2, e3,la segona d’aquesta base a u1, u2, u3.

Invertint les matrius Ceu, C

we i multiplicant–les podem obtenir tots els

demes canvis de base:

Cue = (Ce

u)−1 =

0 0 10 1 01 0 0

Cew = (Cw

e )−1 =

1 1 10 1 20 0 1

Cuw = (Cw

u )−1 = CewCu

e =

1 1 12 1 01 0 0

Page 31: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.2. SUBESPAIS VECTORIALS 31

2.2 Subespais vectorials

Definicio 2.37. Un subespai vectorial d’un espai vectorial E es un subcon-junt F ⊂ E tal que amb la suma de vectors i el producte per escalar de E estambe espai vectorial.

Per escurcar, direm simplement subespai als subespais vectorials.A la practica, el que s’ha de comprovar per a veure si F ⊂ E es un

subespai es que la suma i el producte per escalar estiguin definits sense sortirde F , es a dir,

- que per tots u, v ∈ F es te tambe u + v ∈ F ,

- que per tots u ∈ F , λ ∈ R, es te λu ∈ F .

Aquestes dues propietats equivalen a que podem fer combinacions lineals dinsde F , es a dir,

per tots u, v ∈ F, λ, µ ∈ R, λu + µv ∈ F

No cal comprovar si la suma i el producte compleixen les propietats de ladefinicio d’espai vectorial perque si les compleixen en tot E en particular lesverifiquen a F .

Alguns exemples:

Exemple 2.38. Els exemples trivials: tot espai vectorial E te subespais E,{~0}.Exemple 2.39. Podem pensar R2 com un subespai de R3 via la inclusio F ={(x, y, 0) ∈ R3}. Es immediat comprovar que les combinacions lineals devectors de F continuen pertanyent–hi.

Exemple 2.40. Les solucions d’un sistema lineal homogeni Ax = ~0 (exemple2.9), on A es una matriu m× n fixada son un exemple de subespai vectorialde Rn. Un exemple mes concret:{

3x− y + z = 02x− 2y + 7z = 0

(Questio: que es aquest subespai?)Veurem a la seccio 2.3 que tots els subespais de Rn son d’aquesta forma.

El sistema lineal homogeni Ax = ~0 es un sistema d’equacions del subespai.

Notacio 2.41. Denotarem el subespai F de solucions d’un sistema lineal ho-mogeni per

F = {Ax = 0}

Page 32: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

32 CAPITOL 2. ESPAIS VECTORIALS

A mes de per equacions, l’altra presentacio habitual dels subespais es persistemes de generadors:

Definicio 2.42. Siguin v1, v2, . . . , vm ∈ E uns vectors qualsevols. El subespaigenerat per v1, . . . , vm es el conjunt de vectors de E que son combinacio linealde v1, . . . , vm. Ho denotem

[v1, . . . , vm] = {v ∈ E tals que v = λ1v1 + · · ·+ λmvm}

No costa gaire justificar aquesta definicio:

Lema 2.43. [v1, . . . , vm] es un subespai vectorial de E.

Demostracio. Si tenim dos vectors u, w ∈ [v1, . . . , vm], per definicio vol dirque u = α1v1 + · · ·+αmvm i w = β1v1 + · · ·+βmvm per certs α1, . . . , βm ∈ R.Aleshores u+w = (α1+β1)v1+· · ·+(αm+βm)vm, i λu = λα1v1+· · ·+λαmvm.Es a dir, u + w, λw son tambe de [v1, . . . , vm].

Una altra propietat immediata dels subespais es

Proposicio 2.44. Sigui E un espai vectorial de dimensio finita, i F ⊂ E unsubespai. Aleshores dim F ≤ dim E, i nomes hi ha igualtat de dimensions siF = E.

Demostracio. Sigui v1, . . . , vm una base de F . Com son vectors l.i., podemprendre una base u1, . . . , un de E, i pel teorema de Steinitz (T. 2.23) tenimque v1, . . . , vm mes n − m dels vectors e1, . . . formen una nova base de E.Com aquesta nova base ha de tenir n = dim E elements, deduım que m ≤ ni que si m = n els vectors v1, . . . , vm son base de F i de E.

Exemple 2.45. La dimensio d’un subespai F ⊂ Rn donat per un sistemad’equacions Ax = ~0 es n − rang A. Aquest es el nombre de parametres delque depenen les solucions.

Exercici 6. Comproveu que els subespais de R2 son exactament {0, 0}, R2 iles rectes que passen per l’origen (0, 0). Quins son els subespais de R3?

Els subespais d’un espai vectorial E son subconjunts que tornen a serespais vectorials. Les operacions habituals amb subconjunts son la interseccioi la unio. Amb espais vectorials podem fer la primera:

Proposicio 2.46. La interseccio F ∩ G de dos subespais vectorials F, G estambe un subespai vectorial.

Pero no podem fer directament unions:

Page 33: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.2. SUBESPAIS VECTORIALS 33

F G

u v

u+v

Exemple 2.47. La unio dels dos subespais de R2 F = {x + y = 0}, G ={x− y = 0} no es un subespai.

El problema es que F es una recta, G es una altra recta, pero si prenemvectors no nuls u ∈ F, v ∈ G la suma u + v no es de F ni de G.

La solucio a aquest problema es simple: enlloc de la unio F ∪G, prendremel subespai que genera:

Definicio 2.48. La suma de dos subespais F, G es el subespai F +G generatper tots els vectors de F ∪G.

Una altra caracteritzacio practica es:

Lema 2.49. La suma F + G de dos subespais F, G ⊂ E es el conjunt devectors de E que es poden posar com suma de un vector de F mes un vectorde G.

Els dos problemes habituals amb interseccions i sumes de subespais vec-torials son: calcular–les i simplement discutir la seva dimensio.

La interseccio de subespais es calcula mitjancant les seves equacions: enefecte, si la condicio que ha de complir un vector x per a ser de F es sersolucio d’un sistema Ax = 0 i per a ser de G es ser solucio d’un altre sistemaBx = 0, aleshores x es de F i de G alhora quan es solucio de les equacionsdels dos sistemes.

En canvi la suma es sol haver de calcular amb sistemes de generadors:

Lema 2.50. Si F = [u1, . . . , um] i G = [v1, . . . , vd] son dos subespais de E,aleshores F + G = [u1, . . . , um, v1, . . . , vd].

Page 34: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

34 CAPITOL 2. ESPAIS VECTORIALS

Demostracio. Els vectors u1, . . . , um, v1, . . . , vd son tots de F + G, per tanttenim una inclusio [u1, . . . , vd] ⊆ F + G.

D’altra banda, si w ∈ F + G aleshores tenim una igualtat w = u + vamb u ∈ F = [u1, . . . , um] ⊂ [u1, . . . , um, v1, . . . , vd] i v ∈ G = [v1, . . . , vd] ⊂[u1, . . . , vd]. Per tant F + G ⊆ [u1, . . . , vd], i com tenim inclusio en les duesdireccions els dos conjunts son el mateix.

Pel que fa a la dimensio de F ∩G, F + G, ens trobem amb que aquestesno estan determinades per dim F, dim G. La unica relacio entre aquestesdimensions es la formula de Grassman:

Teorema 2.51. (formula de Grassman) Si F, G ⊂ E son subespais de di-mensio finita aleshores

dim F + dim G = dim F + G + dim F ∩G

La formula de Grassman es una manifestacio de l’analogia entre la inter-seccio i suma de subespais i la interseccio i unio de conjunts. En efecte, siA, B son dos subconjunts finits d’un conjunt mes gran, i denotem per # elcardinal d’un conjunt tenim

#A + #B = #(A ∪B) + #(A ∩B)

Dit d’una altra manera: si 20 estudiants juguen a futbol i 6 fan altres esports,quants fan futbol o altres esports? 26 menys els que fan les dues coses.

Demostracio. Siguin m = dim F i k = dim G. Prenem una base v1, . . . , vl deF ∩G. Com aquests vectors son de F i linealment independents, pel teoremade Steinitz (t. 2.23), podem ampliar aquesta base fins tenir una base de Fde la forma u1, . . . , um−l, v1, . . . , vl. De la mateixa manera podem ampliar labase de F ∩G a una base de G v1, . . . , vl, w1, . . . , wk−l.

Comprovem ara que la reunio d’aquestes bases u1, . . . , um−l, v1, . . . , vl, w1, . . . , wk−l

es una base de la suma F + G:Els vectors escollits generen F + G perque hem reunit una base de F i

una base de G (lema 2.50). Comprovem que son linealment independents: sitenim una equacio

λ1u1 + · · ·+ λm−lum−l + η1v1 + · · ·+ ηlvl + µ1w1 + · · ·+ µk−lwk−l = ~0

podem despejar

~z = λ1u1 + · · ·+ λk−luk−l = −η1v1 − · · · − µk−lwk−l

Page 35: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.2. SUBESPAIS VECTORIALS 35

El vector ~z pertany a F per la seva expressio de la dreta i a G per la del’esquerra, per tant es de F ∩ G. Ara be, com v1, . . . , vl es base de F ∩ Gtenim una expressio ~z = α1v1 + · · ·+ αlvl.

Com u1, . . . , um−l, v1 . . . , vl es base de F l’expressio de ~v com a combinaciolineal d’aquests vectors existeix i es unica. Ara be, fins aquı hem vist que

~v = λ1u1 + · · ·+ λm−lum−l = α1v1 + · · ·+ αlvl

Cal doncs que λ1 = · · · = αl = 0. Aixı ~v = 0, η1v1 + · · ·+ ηlvl + µ1w1 + · · ·+µk−lwl = 0, i com v1, . . . , wk−l eren base de G cal que η1 = · · · = µk−l = 0.

Les dimensions dim F ∩G = l, dim F + G = m + k − l compleixen doncsla formula de Grassman.

Exercici 7. Busqueu la formula de Grassman per 3 subespais (Des–pista:Compte, que no es el mateix que comptar els elements la unio de tres sub-conjunts!)

Figura 2.1: Despiste per l’exercici 2.2

Exemple 2.52. Siguin F = [(1, 3, 1)], G = [(2,−1, 1), (1, 1, 0)] ⊂ R3. Es im-mediat veure que el generador de F i els de G son l.i. (exercici 2.1), per tantson base dels subespais, F es una recta i G un pla per l’origen.

La suma dels dos subespais es F + G = [(1, 3, 1), (2,−1, 1), (1, 1, 0)]. Po-dem comprovar que aquests tres vectors son l.i. (veure seccio 2.3), aixı perdimensio (prop. 2.44) tenim que F + G = R3.

Aplicant la formula de Grassman calculem

dim F ∩G = dim F + dim G− dim(F + G) = 1 + 2− 3 = 0

pel que deduım que F ∩G = {0} sense calcular–la explıcitament.

Page 36: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

36 CAPITOL 2. ESPAIS VECTORIALS

Exemple 2.53. Siguin F = {x− 2y + z = 0}, G = {2x + y + z = 0}. Aquestssubespais son solucio d’un sistema lineal homogeni de rang 1, per tant tenendimensio dos (prop. ??).

Els vectors de F ∩G han de complir les dues equacions, es a dir que sonles solucions del sistema {

x− 2y + z = 02x + y + z = 0

Aquest sistema te solucio x = −35z, y = 1

5z, z ∈ R parametre. Per tant F ∩G

es la recta [(−35, 1

5, 1)] = [(−3, 1, 5)].

Aplicant la formula de Grassman veiem que dim F + G = 3. Per tantF + G = R3.

2.2.1 Sumes directes

Definicio 2.54. La suma de dos subespais vectorials F, G es directa quanF ∩G = {0}.

Denotem la suma directa com F ⊕G.

Obviament, per la formula de Grassman tenim que

dim F ⊕G = dim F + dim G

Les sumes directes tenen altres propietats agradables:

Proposicio 2.55. Si la suma de F i G es directa:

(i) La reunio d’una base de F i una base de G es una base de F ⊕G.

(ii) Tot vector w ∈ F⊕G te una descomposicio unica com a suma w = u+vamb u ∈ F, v ∈ G.

Demostracio. (i) Si u1, . . . , uk es una base de F , i v1, . . . , vd es una base deG, com tot vector de F ⊕ G es suma d’un de F mes un de G la reuniou1, . . . , uk, v1, . . . , vd genera la suma (per aixo no cal que la suma sigui direc-ta!).

Tenim doncs un sistema de generadors de F ⊕G format per tants vectorscom la dimensio del subespai, per tant son una base (Cor. 2.28).(ii) Sabem que si w ∈ F ⊕ G podem posar–lo com suma d’un vector de F iun de G (lema 2.49). Si tenim dues d’aquestes descomposicions

w = u + v = u′ + v′ u, u′ ∈ F , v, v′ ∈ G

agrupant termes ens queda

u− u′ = v − v′

Page 37: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.3. RANG DE MATRIUS 37

Ara be, u− u′ ∈ F , v − v′ ∈ G, aixı que u− u′ = v − v′ ∈ F ∩G = {0}, pertant u = u′, v = v′.

Definicio 2.56. Les components en F i G d’un vector w ∈ F ⊕ G sonrespectivament els vectors u ∈ F , v ∈ G tals que w = u + v.

Un cas notable de suma directa es el dels subespais complementaris: sonsubespais F, G tals que la seva suma es directa i es l’espai total. Les com-ponents dels vectors en els subespais complementaris donen les projeccions.Tractarem aquest tema en el capıtol 3.

Exemple 2.57. Hem vist a l’exemple 2.52 que els dos subespais F = [(1, 3, 1)], G =[(2,−1, 1), (1, 1, 0)] ⊂ R3 tenen interseccio {0} i suma R3. Per tant la sevasuma es directa, i son complementaris.

Busquem les components del vector v = (3, 1, 8) en F, G. Comencemtriant una base de F ⊕G = R3 formada reunint una base de F i una de G.Podem triar u1 = (1, 3, 1), u2 = (2,−1, 1), u3 = (1, 1, 0).

Busquem les components de v en la base adaptada u1, u2, u3. Son lasolucio del sistema 1 2 1

3 −1 11 1 0

∣∣∣∣∣∣∣318

Aquesta solucio es x = 22

5, y = 18

5, z = −43

5. Per tant v = 22

5u1+(18

5u2− 43

5u3),

i agrupant termes del mateix subespai tenim que la component de v en F es225u1 = (22

5, 66

5, 22

5) i la component de v en G es 18

5u2 − 43

5u3.

Geometricament, trobar les components del vector v en els subespaiscomplementaris F, G correspon a projectar v sobre cada subespai seguint ladireccio paral·lela a l’altre.

2.3 Rang de matrius

Aquesta seccio tracta sobre metodes efectius de calcul en els espais Rn pertrobar dimensions, bases, sistemes d’equacions de subespais . . .

Aquests metodes serveixen en qualsevol espai vectorial de dimensio finita,ja que un cop triem una base i treballem amb les components dels vectors enaquesta base un espai E es isomorf a Rdim E.

Definicio 2.58. Les transformacions elementals en un conjunt de vectors{v1, . . . , vm} d’un espai vectorial E son les seguents tres operacions:

(i) intercanviar dos vectors de lloc

{. . . vi . . . vj . . . } ∼ {. . . vj . . . vi . . . }

Page 38: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

38 CAPITOL 2. ESPAIS VECTORIALS

F

G

w

u

v

(ii) multiplicar un vector per un escalar λ 6= 0

{. . . vi . . . } ∼ {. . . λvi . . . }

(iii) sumar a un vector un multiple α ∈ R d’un altre

{. . . vi . . . vj . . . } ∼ {. . . vi . . . vj + αvi . . . }

Lema 2.59. Si fem una transformacio elemental a un conjunt de vectors, elsubespai que generen el conjunt inicial i el final es el mateix.

Demostracio. Sigui F = [v1, . . . , vm] i F ′ el subespai generat pels vectorstransformats.

Per la seva definicio, amb cadascuna de les tres menes de transformacioelemental els vectors resultants son combinacio lineal dels originals v1, . . . , vm.Per tant F ′ ⊆ F .

A mes, els vectors originals son combinacio lineal dels transformats. Aixoes evident per transformacions de tipus (i) i (ii) (on usem que λ 6= 0). Perles de tipus (iii) tambe es senzill:

vj = (vj + αvi)− αvi

Per tant novament F ⊆ F ′, i els dos subespais han de ser el mateix.

Proposicio 2.60. Les files diferents de zero d’una matriu esglaonada sonlinealment independents.

Page 39: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.3. RANG DE MATRIUS 39

Demostracio. Denotem v1, . . . , vm les files diferents de zero en una matriuesglaonada. La condicio d’esglaonament es que aquests vectors siguin de laforma

v1 = (0 . . . a1k1 . . . )

v2 = (0 . . . 0 a2k2 . . . )

. . .

vm = (0 . . . . . . 0 amkm . . . )

amb a1k1 , . . . , amkm 6= 0, i k1 < k2 < · · · < km. Estudiem ara el sistema

λ1v1 + λ2v2 + · · ·+ λmvm = (0, . . . , 0)

En la component k1 dels vectors tenim nomes λ1a1k1 = 0, ja que els vectorsv2, . . . , vm tenen zero a aquesta component. Com a1k1 6= 0 cal que λ1 = 0.Un cop sabem que λ1 = 0 podem repetir el raonament amb λ2 i la componentk2 per veure que λ2 = 0, i aixı succesivament amb λ3, . . . , λm

El lema 2.59 implica que quan fem transformacions elementals per filesa una matriu no canviem el subespai vectorial generat per les seves files. Siajuntem aixo amb la darrera proposicio tenim:

Proposicio 2.61. El rang d’una matriu es la dimensio del subespai quegeneren les seves files.

La proposicio 2.61 es la definicio mes convenient de rang, ja que evita elproblema de la no–unicitat de la forma esglaonada d’una matriu. Aixo si,necessita les idees d’espai vectorial i de subespai.

Exemple 2.62. Esglaonem la seguent matriu A:2 1 3 1−2 4 1 10 −5 3 14 2 13 5

2 1 3 10 5 4 20 −5 3 10 0 7 3

2 1 3 10 5 4 20 0 7 30 0 7 3

2 1 3 10 5 4 20 0 7 30 0 0 0

Deduım que rang A = 3. A mes, si denotem F el subespai generat per les filesde A, la forma esglaonada final ens dona la base de F u1 = (2, 1, 3, 1), u2 =(0, 5, 4, 2), u3 = (0, 0, 7, 3). Aquesta base es ’esglaonada’, aixo sera convenientper calculs ulteriors.

Exemple 2.63. Sigui G = [3x2−x−1, x3−2x+1, 4x3−6x2−6x+6] ⊂ R3[x].Volem calcular la dimensio de F i obtenir una base. Triem la base canonica

Page 40: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

40 CAPITOL 2. ESPAIS VECTORIALS

x3, x2, x, 1, escribim els generadors de G com a files d’una matriu i la portema forma esglaonada:0 3 −1 −1

1 0 −2 14 −6 −6 6

∼1 0 −2 1

0 3 −1 −14 −6 −6 6

∼1 0 −2 1

0 3 −1 −10 −6 2 2

∼1 0 −2 1

0 3 −1 −10 0 0 0

La matriu te rang 2, per tant dim G = 2. A mes, una base de F es x3− 2x+1, 3x2 − x− 1.

Exemple 2.64. Fem ara la substitucio del teorema de Steinitz (t. 2.23) demanera efectiva:

Els vectors u1 = (1, 3,−1, 4), u2 = (−2,−6, 3, 5) ∈ R4 son linealment in-dependents, per tant hem de poder substituır dos vectors de la base canonicaper ells. Per a comencar els posem en fila en una matriu i els esglaonem:(

1 3 −1 4−2 −6 3 5

)∼(

1 3 −1 40 0 1 13

)

Ara veiem a ull que si intercalem e2 = (0, 1, 0, 0) entre la primera i la segonafiles, i posem e4 = (0, 0, 0, 1) com a quarta fila, tindrem una matriu triangular

1 3 −1 40 1 0 00 0 1 130 0 0 1

de rang maxim. Per tant aquestes files son base de R4, i com la primera itercera generen el mateix subespai que u1, u2 arribem a la conclusio de queu1, e2, u2, e4 son base de R4.

Observem de pas que el subespai [e2, e4] es un complementari de [u1, u2].

Aquesta caracteritzacio del rang dona un metode per a trobar el sistemad’equacions d’un subespai de Rn (i de pas per demostrar que tots els subespaistenen sistema d’equacions):

Lema 2.65. Sigui F =⊂ Rn un subespai generat per vectors v1, . . . , vm.Aleshores, un vector x = (x1, . . . , xn) pertany a F si i nomes si el rang de

la matriu A que te per files v1, . . . , vm i el rang de la matriu ampliada

(Ax

)son iguals.

Indicacio de la prova: Com

(Ax

)es A amb una fila extra, el subespai que

generen les seves files es F + [x]. Ara, o be x es de F i aleshores dimensions

Page 41: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.3. RANG DE MATRIUS 41

i rangs son iguals, o be x no es de F , i aleshores la dimensio de la suma i elrang creixen en 1 respecte als de F ,A.

Exemple 2.66. Calculem un sistema d’equacions pel subespai G de l’exemple2.63. Ampliem la matriu de la seva base esglaonada amb una fila de variables,i tornem a esglaonar:1 0 −2 1

0 3 −1 −1a b c d

∼1 0 −2 1

0 3 −1 −10 b c + 2a d− a

∼1 0 −2 1

0 3 −1 −10 0 c + 2a + 1

3b d− a + 1

3b

La condicio que han de complir a, b, c, d per a que el rang de la matriu am-pliada sigui 2 es que els termes que queden a la tercera fila siguin zero. Pertant les equacions per G son:

G = {ax3 + bx2 + cx + d ∈ R3[x] | 2a +1

3b + c = 0, −a +

1

3b + d = 0}

Ara mirarem que els passa a les columnes d’una matriu quan fem trans-formacions elementals per files:

Lema 2.67. Sigui A una matriu m × n amb columnes c1, . . . , cn ∈ Rm.Aleshores:

(i) Si invercanviem les files i i j de A, les noves columnes c′1, . . . , c′n son les

components dels vectors c1, . . . , cn respectivament en la base e1 . . . ej . . . ei . . . em.

(ii) Si multipliquem la fila i per un escalar λ 6= 0, les noves columnesc′1, . . . , c

′n son les components dels vectors c1, . . . , cn respectivament en

la base e1, . . . ,1λei, . . . , em.

(iii) Si a la fila j li sumem α·fila i, les noves columnes c′1, . . . , c′n son les

components dels vectors c1, . . . , cn respectivament en la base e1, . . . , ei−αej, . . . , ej, . . . , em.

Indicacio de la prova: Nomes cal escriure per cada transformacio elemen-tal les combinacions lineals indicades per ci, c

′i en les bases corresponents i

comprovar que son iguals.Aixı un cop hem fet transformacions elementals per files a una matriu

no podem interpretar les columnes com vectors de Rm expressats en basecanonica. Ara be, els canvis de base cambien les components dels vectors iles equacions dels subespais, pero no la seva dimensio. Per tant:

Proposicio 2.68. Si fem una transformacio elemental per files a una matriu,la dimensio del subespai generat per les columnes no varia.

Page 42: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

42 CAPITOL 2. ESPAIS VECTORIALS

Aixo te consequencies que ens interessen:

Proposicio 2.69. El rang d’una matriu es la dimensio del subespai vectorialque generen les seves columnes.

Indicacio de la prova: Portem la matriu A a forma esglaonada mitjancanttransformacions elementals per files. Al fer aixo alterem les columnes dela matriu, pero la dimensio del subespai que generen no varia. La matriuesglaonada queda de la forma

0 . . . 0 a1k1

0 a2k2

... 0 a3k3 . . .... 0

. . ....

. . .

Les columnes c1, . . . , cn de la matriu esglaonada nomes tenen les d = rang A

1

3

2

k k k1 2 3

primeres components diferents de zero, per tant generen un subespai G ambdim G ≤ rang A. Ara be, si ens fixem en les columnes k1, k2, . . . , km en quecomencen les files no nul·les de la matriu esglaonada, veiem que la matriuformada per les seves transposades

B =

ctkm

ctkm−1

. . .ct1

es esglaonada amb totes les files diferents de zero. Per tant el subespai Ggenerat per les columnes c1, . . . , cn te dimensio d = rang A.

Una aplicacio immediata d’aquesta igualtat es:

Page 43: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

2.3. RANG DE MATRIUS 43

Corol·lari 2.70.rangA = rangAt

Aixı per exemple el rang d’una matriu mai es mes gran que el seu nombrede files o de columnes. Una altra aplicacio d’aquest corol·lari es que podem’transposar’ totes les definicions i enunciats de la seccio i deduir l’efecte deles transformacions elementals per columnes en les matrius.

La rao que ens ha portat a estudiar l’efecte de les transformacions ele-mentals en les files i columnes d’una matriu es que, excepte per resoldre unsistema d’equacions lineals, al fer calculs efectius per buscar bases de sube-spais, sistemes d’equacions, . . . es pot triar entre posar els vectors com a fileso com a columnes. Un cop colocats els vectors, si el nostre problema no esresoldre un sistema lineal podem triar tambe entre fer transformacions ele-mentals per files o per columnes. Els enunciats i exemples d’aquesta secciomostren que per calcular rangs, dimensions o sistemes d’equacions podemtriar qualsevol de les quatre possibles combinacions vector–transformacio,mentre que si volem calcular vectors explıcits de Rn es mes practic posar elsvectors i transformar la matriu de la mateixa manera (tot per files o tot percolumnes).

Page 44: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

44 CAPITOL 2. ESPAIS VECTORIALS

Page 45: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Capıtol 3

Aplicacions lineals

3.1 Definicio i elements caracterıstics

Un espai vectorial es un conjunt on podem fer combinacions lineals. De lamateixa manera, una aplicacio lineal es una aplicacio entre espais vectorialsque conserva les combinacions lineals.

Definicio 3.1. Una aplicacio lineal entre espais vectorials reals E, F es unaaplicacio f : E → F tal que per u, v ∈ E i λ ∈ R qualsevols compleix que

f(u + v) = f(u) + f(v)

if(λu) = λf(u)

Observacio 3.2. Com en el cas dels subespais vectorials, no costa gaire com-provar que una aplicacio f : E → F es lineal si i nomes si f(λu + µv) =λf(u) + µf(v) per u, v ∈ E, λ, µ ∈ R qualsevols.

Aquesta caracteritzacio es pot fer per combinacions lineals de dos vectorso de n ≥ 2: f : E → F es lineal si i nomes si per u1, . . . , uk ∈ E i λ1, . . . , λk ∈R qualsevols

f(λ1u1 + · · ·+ λkuk) = λ1f(u1) + · · ·+ λkf(uk)

Exemple 3.3. Multiplicacio per una matriu. Aquest es l’exemple principald’aplicacio lineal: sigui una matriu A ∈ Mm×n(R) fixada. Escrivint els vec-tors de Rn, Rm en columna, definim amb la matriu una aplicacio

fA : Rn −→ Rm

x 7−→ Ax

45

Page 46: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

46 CAPITOL 3. APLICACIONS LINEALS

Comprovem que aquesta aplicacio es lineal: per x, y ∈ Rn i λ ∈ R qualsevolses te

fA(x + y) = A(x + y) = Ax + Ay = fA(x) + fA(y)

fA(λx) = A(λx) = λAx = λfA(x)

Per tant fA es lineal. Diem que A es la matriu de l’aplicacio en les basescanoniques de Rn, Rm.

Un cas concret: triem A =

(6 −1 40 2 2

). Aixo defineix una aplicacio

lineal

fA : R3 −→ R2xyz

7−→ (6 −1 40 2 2

)xyz

=

(6x− y + 4z

2y + 2z

)

Observem que les columnes de la matriu A son les imatges dels vectors de labase:

f(1, 0, 0) = (6, 0) , f(0, 1, 0) = (−1, 2) , f(0, 0, 1) = (4, 2)

Aquesta propietat es compleix sempre, tornarem a ella.

Exemple 3.4. Evaluacio en un punt. Fixem un punt de la recta real a ∈ R, iamb ell definim una aplicacio que envia cada polinomi al seu valor en a:

eva : R[x] −→ Rp(x) 7−→ p(a)

Aquesta aplicacio es lineal: en efecte, per p(x), q(x) ∈ R[x], i λ, µ ∈ Rqualsevols es te

eva(λp(x) + µq(x)) = λp(a) + µq(a) = λeva(p(x)) + µeva(q(x))

Exemple 3.5. El coeficient bm de la serie de Fourier. Sigui C0([−π, π], R)l’espai vectorial de les funcions contınues de [−π, π] en R. Per tot nombrenatural m ≥ 1 definim una aplicacio bm : C0([−π, π], R) −→ R per

bm(f) =1

∫ π

−πf(x) cos(mx)dx

Page 47: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.1. DEFINICIO I ELEMENTS CARACTERISTICS 47

Aquesta aplicacio es lineal, ja que per f, g funcions contınues i λ, µ ∈ Rqualsevols es te

bm(λf + µg) =1

∫ π

−π(λf(x) + µg(x)) cos(mx)dx

= λ1

∫ π

−πf(x) cos(mx)dx + µ

1

∫ π

−πg(x) cos(mx)dx

= λbm(f) + µbm(g)

Exemple 3.6. La composicio d’aplicacions lineals es lineal. Recordem queper dues aplicacions qualsevols f : E → F , g : F → G podem definir lacomposicio g ◦ f : E → G per g ◦ f(x) = g(f(x)). Comprovem que si f, gson lineals la seva composicio torna a ser–ho: Siguin u, v ∈ E i λ, µ ∈ Rqualsevols. Com f es lineal es te

g ◦ f(λu + µv) = g(f(λu + µv)) = g(λf(u) + µf(v))

i com g tambe es lineal

g(λf(u) + µf(v)) = λg(f(u)) + µg(f(v)) = λg(f(u)) + µg(f(v))

Per tant la composicio g ◦ f es lineal.

Exercici 8. Comproveu que l’aplicacio

C2(R, R) −→ C0(R, R)

y(x) 7−→ y′′ + y

es lineal.

Exemple 3.7. Les translacions no son lineals. Sigui un vector v ∈ Rn, ambv 6= 0. La translacio per v es una aplicacio que usarem al fer canvis d’origenen les referencies afins de l’espai (subseccio 6.1.3):

Tv : Rn −→ Rn

x 7−→ x + v

Aquesta aplicacio no es lineal: per exemple constatem que

Tv(x + y) = x + y + v

Tv(x) + Tv(y) = (x + v) + (y + v) = x + y + 2v

Aixı, si v 6= 0 es te que Tv(x + y) 6= Tv(x) + Tv(y) per tots els x, y. Amb quela desigualtat falli per un sol parell x, y l’aplicacio ja no es lineal.

Page 48: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

48 CAPITOL 3. APLICACIONS LINEALS

La propietat de conservar combinacions lineals caracteritza immediata-ment les aplicacions lineals entre espais vectorials:

Lema 3.8. Siguin E, F espais vectorials, u1, u2, . . . un sistema de generadorsde E, i f, g : E → F dues aplicacions lineals tals que f(ui) = g(ui) per totsels vectors ui del sistema. Aleshores f = g.

Demostracio. Tot vector u ∈ E es combinacio lineal de vectors del sistemade generadors u1, . . . . Com f, g son lineals tenim

g(u) = g(λ1u1 + λ2u2 + . . . ) = λ1g(u1) + λ2g(u2) + . . .

= λ1f(u1) + λ2f(u2) + · · · = f(λ1u1 + λ2u2 + . . . ) = f(u)

Les aplicacions f, g coincideixen en tots els vectors u del domini, son per tantiguals.

En particular,

Corol·lari 3.9. Una aplicacio lineal queda determinada pels seus valors sobreuna base de l’espai de sortida.

La demostracio del lema 3.8 mostra com calcular la imatge de qualsevolvector per una aplicacio lineal a partir de les imatges d’una base de sortida.Com en el cas dels canvis de base, hi ha una manera mes compacta de feraquest calcul usant matrius.

Definicio 3.10. Siguin E, F espais vectorials de dimensio finita, e1, . . . , en

una base de E, u1, . . . , um una base de F , i f : E → F una aplicacio lineal.La matriu de f en les bases e1, . . . , en, u1, . . . , um es la matriu A que te percolumnes els vectors f(e1), . . . , f(en) expressats en base u1, . . . , um.

Notacio 3.11. Quan sigui important recordar en quines bases de E, F tre-ballem, denotarem la matriu de f com

M eu(f)

Quan no hi hagi confusio possible, usarem lletres com A, B, . . . .

Proposicio 3.12. Amb les notacions de la definicio anterior, si un vec-tor x ∈ E te components (α1, . . . , αn) en base e1, . . . , en, les components(β1, . . . , βm) de f(x) en base u1, . . . , um son

β1...

βm

= A

α1...

αn

Page 49: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.1. DEFINICIO I ELEMENTS CARACTERISTICS 49

Demostracio. Recordem que el significat de les components de x es que x =α1e1 + · · ·+ αnen. Per linealitat de f tenim

f(x) = f(α1e1 + · · ·+ αnen) = α1f(e1) + · · ·+ αnf(en)

Aixı, si les imatges de la base de sortida e1, . . . , en son

f(e1) = a11u1 + a2

1u2 + · · ·+ am1 um

f(e2) = a12u1 + a2

2u2 + · · ·+ am2 um

. . .

f(e2) = a1nu1 + a2

nu2 + · · ·+ amn um

la imatge f(x) en base u1, . . . , um es

f(x) = α1(a11u1 + a2

1u2 + · · ·+ am1 um)

+ α2(a12u1 + a2

2u2 + · · ·+ am2 um)

+ . . .

+ αn(a1nu1 + a2

nu2 + · · ·+ amn um)

= (a11α1 + a1

2α2 + · · ·+ a1nαn)u1

+ (a21α1 + a2

2α2 + · · ·+ a2nαn)u2

+ . . .

+ (am1 α1 + am

2 α2 + · · ·+ amn αn)um

Si fem ara el producte de matrius de l’enunciat de la proposicio obtenima1

1 a12 . . . a1

n

a21 a2

2 . . . a2n

.... . .

am1 am

2 . . . amn

α1......

αn

=

a1

1α1 + a12α2 + · · ·+ a1

nαn

a21α1 + a2

2α2 + · · ·+ a2nαn

...am

1 α1 + am2 α2 + · · ·+ am

n αn

Observem per tant que el producte de la matriu de l’aplicacio per la columnade les components de x en la base de sortida dona les components de la imatgef(x) en la base d’arribada.

Observacio 3.13. La matriu de l’aplicacio lineal depen de les bases que es-collim en els espais de sortida i d’arribada. En la seccio 3.2 estudiarem comvaria al canviar de base.

Exemple 3.14. L’aplicacio derivacio

D : R2[x] −→ R1[x]

p(x) 7−→ p′(x)

Page 50: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

50 CAPITOL 3. APLICACIONS LINEALS

es lineal, ja que per polinomis p(x), q(x) i λ ∈ R qualsevols es te (p(x) + q(x))′ =p′(x) + q′(x), (λp(x))′ = λp′(x).

Triem ara bases e1 = 1, e2 = x, e3 = x2 de R2[x], i u1 = 1, u2 = x deR1[x], i busquem la matriu de la derivacio D en elles.

En primer lloc calculem les imatges de la base de sortida i les expressemen la base d’arribada:

D(e1) = (1)′ = 0 = 0u1 + 0u2

D(e2) = (x)′ = 1 = 1u1 + 0u2

D(e3) = (x2)′ = 2x= 0u1 + 2u2

La matriu de D en aquestes bases te per columnes les components de lesimatges en la base d’arribada:

A =

(0 1 00 0 2

)

Podem comprovar que aquesta matriu realment calcula D. Un polinomiqualsevol p(x) = a0 + a1x + a2x

2 te components (a0, a1, a2) en la base desortida escollida e1, e2, e3. Les components de la seva imatge en la based’arribada u1, u2 haurien de ser

(0 1 00 0 2

)a0

a1

a2

=

(a1

2a2

)

Les components (a1, 2a2) corresponen al polinomi a1 + 2a2x ∈ R1[x], queefectivament es la derivada de p(x).

Exemple 3.15. L’aplicacio f : R3 → R3 donada per f(x, y, z) = (x + y +2z, x − z, 2x + 3y + z) es lineal, com pot comprovar–se facilment. Triem labase canonica de R3 com a base de sortida i d’arribada. Tenim f(1, 0, 0) =(1, 1, 2), f(0, 1, 0) = (1, 0, 3), f(0, 0, 1) = (2,−1, 1). Per tant en base canonicade sortida i d’arribada f te matriu

A =

1 1 21 0 −12 3 1

Novament, es pot comprovar facilment que f(x, y, z) = A

xyz

.

Amb la matriu de l’aplicacio lineal podem provar tambe un resultatrecıproc al corol·lari 3.9:

Page 51: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.1. DEFINICIO I ELEMENTS CARACTERISTICS 51

Proposicio 3.16. Siguin E, F espais vectorials de dimensio finita, e1, . . . , en

una base de E, i w1, . . . , wn ∈ F vectors qualsevols. Aleshores existeix unaaplicacio lineal f : E → F tal que f(e1) = u1, . . . , f(en) = wn, i a mes esunica.

Demostracio. Triem una base u1, . . . , um, i definim una matriu A que tinguiper columnes els vectors w1, . . . , wn expressats en la base u1, . . . , um.

Definim ara una aplicacio f : E → F amb aquesta matriu: per un vectorx ∈ E que tingui components (x1, . . . , xn) en base e1, . . . , en la seva imatge

es el vector w que te components A

x1...

xn

.

Podem comprovar que aquesta aplicacio f es lineal com en l’exemple 3.3.La imatge d’un vector basic ei es la columna i–essima de la matriu A, quecorrespon al vector wi. Per tant l’aplicacio f compleix les condicions del’enunciat. A mes es unica pel corol·lari 3.9.

La proposicio 3.16 mostra que un cop fixem bases de sortida i d’arribadahi ha una correspondencia bijectiva entre les aplicacions lineals de E a Fi les matrius de mida dim E × dim F . Aquesta correspondencia es de fetun isomorfisme (exemple 3.3), i encara mes, fa correspondre el producte dematrius a la composicio d’aplicacions lineals:

Proposicio 3.17. Siguin f : E → F i g : F → G aplicacions lineals,e1, . . . , en base de E, u1, . . . , um base de F , i w1, . . . , wd base de G. Aleshoresla composicio g ◦ f : E → G en bases e1, . . . , en de E i w1, . . . , wd de G tematriu

M ew(g ◦ f) = Mu

w(g)M eu(f)

on Muw(g), M e

u(f) son les matrius de g, f respectivament en les bases escol-lides.

Demostracio. La matriu M ew(g ◦ f) es la matriu tal que al multiplicar a les

components d’un vector x ∈ E en base e1, . . . , en dona les components deg(f(x)) en base w1, . . . , wd. Comprovem que el producte Mu

w(g)M eu(f) te

aquesta propietat: si x te components (α1, . . . , αn), tenim

Muw(g)M e

u(f)

α1...

αn

= Muw(g)

β1...

βm

=

γ1...γd

Notem ara que per definicio de la matriu M e

u(f) el vector (β1, . . . , βm) esla imatge f(x) en base u1, . . . , um. Tambe per definicio, el producte per la

Page 52: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

52 CAPITOL 3. APLICACIONS LINEALS

matriu Muw(g) envia un vector f(x) de F en base u1, . . . , um a la seva imatge

g(f(x)) en base w1, . . . , wd.

Exemple 3.18. Siguin f : R2 → R3, g : R3 → R2 les aplicacions lineals queen base canonica de R2, R3 tenen matriu

A =

2 −14 03 1

, B =

(3 −2 22 1 5

)

respectivament. L’aplicacio g ◦ f : R2 → R2 te en base canonica de sortida id’arribada la matriu

BA =

(4 −123 3

)Si les matrius son l’eina per a calcular aplicacions lineals, els invariants

que permetran classificar–les son

Definicio 3.19. Sigui f : E → F una aplicacio lineal.

(i) El nucli de f , denotat Nuc f o ker f , es l’antiimatge del vector zero.

Nuc f = {x ∈ E | f(x) = 0}

(ii) La imatge de f , denotada Im f , es la seva imatge com a aplicacio.

Im f = {y ∈ F | y = f(x) per algun x ∈ E}

El nucli i la imatge estan definits per aplicacions qualsevols, siguin linealso no. Pero si f es lineal tenen propietats especıfiques. La primera es:

Lema 3.20. El nucli i la imatge d’una aplicacio lineal f : E → F sonsubespais vectorials de E i F respectivament.

La demostracio es senzilla i es deixa com a exercici. Tambe ens interessael calcul efectiu de nuclis i imatges:

Proposicio 3.21. Sigui f : E → F una aplicacio lineal, e1, . . . , en unabase de E, u1, . . . , um una base de F , i A la matriu de f en aquestes bases.Aleshores:

(i) En la base e1, . . . , en de E, el nucli de f te sistema d’equacions

ker f =

(x1, . . . , xn) |A

x1...

xn

=

0...0

Page 53: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.1. DEFINICIO I ELEMENTS CARACTERISTICS 53

(ii) En la base u1, . . . , um de F la imatge de f esta generada per les columnesde la matriu A.

Demostracio. (i) es la definicio de nucli.

(ii) Les columnes de A son les imatges de la base de sortida f(e1), . . . , f(en)i per tant son de Im f . A mes, si v = f(u) es un vector qualsevolde la imatge, com tenim una descomposicio u = α1e1 + · · · + αnen

es compleix que v = f(u) = α1f(e1) + · · · + αnf(en). Aixı doncsIm f = [f(e1), . . . , f(en)].

Corol·lari 3.22. Sigui f : E → F una aplicacio lineal, e1, . . . , en i u1, . . . , um

bases de E, F respectivament, i A la matriu de f en aquestes bases. Tenimaleshores

(i) dim Im f = rangA.

(ii) dim ker f = dim E − rangA.

Demostracio. (i) El rang de la matriu A es la dimensio del subespai gen-erat per les seves columnes (prop. 2.69), que es la imatge de f .

(ii) Ho demostrarem al corol·lari 3.46. Per a evitar arguments circulars, noho aplicarem en cap demostracio fins aquell punt.

Aquesta propietat de la dimensio justifica la seguent

Definicio 3.23. El rang d’una aplicacio lineal f : E → F es la dimensio dela seva imatge.

Exemple 3.24. Sigui f : R3 → R3 l’aplicacio lineal que en la base canonicae1, e2, e3 de sortida i d’arribada te matriu

A =

1 −1 −13 4 112 8 18

El nucli d’aquesta aplicacio es el subespai solucio del sistema lineal

x− y − z = 03x + 4y + 11z = 02x + 8y + 18z = 0

Page 54: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

54 CAPITOL 3. APLICACIONS LINEALS

Discutim el sistema:1 −1 −13 4 112 8 18

∣∣∣∣∣∣∣000

∼1 −1 −1

0 7 140 10 20

∣∣∣∣∣∣∣000

∼1 −1 −1

0 7 140 0 0

∣∣∣∣∣∣∣000

Veiem que rang A = 2, dim ker f = 1, dim Im f = 3 − 2 = 1. Si volem lesequacions implıcites del nucli ens podem quedar les dos primeres del sistema(o tot el sistema, naturalment). Si volem una base del nucli resolvem elsistema i obtenim

ker f = [(1, 2,−1)]

Com la imatge te dimensio dos, una base esta formada per un parell decolumnes de A que siguin l.i., per exemple

Im f = [(1, 3, 2), (−1, 4, 8)]

Si volem l’equacio implıcita de Im f l’hem de calcular a partir de la seva base(o del sistema de generadors format per totes les columnes), per exemple pelsmetodes de la seccio 2.3. El resultat es

Im f = {(x, y, z) | 16x− 10y + 7z = 0}

3.2 Canvis de base

Com hem vist a la proposicio 3.12, un cop triem bases per un parell d’espaisvectorials de dimensio finita E, F tota aplicacio lineal de E en F te unamatriu en aquestes bases, i viceversa. Apart de l’interes teoric, aquestacorrespondencia entre aplicacions lineals i matrius permet fer calculs efectiusd’imatges, antiimatges, nucli de l’aplicacio lineal . . . (exemple 3.24).

En canviar la base de l’espai de sortida E, la de l’espai d’arribada F oambdues alhora, varia la matriu de l’aplicacio lineal.

Si tot espai vectorial tingues una base canonica com tenen els Rn podrıemintentar evitar aquest problema triant sempre aquesta base per cada espaivectorial. Aixo no succeeix en la practica, per exemple els subespais F ⊂ Rn

no tenen base canonica. Per tant el problema dels canvis de base per lamatriu d’una aplicacio lineal es inevitable.

D’altra banda, el canvi de base a mes de ser un problema es tambe unaoportunitat: per estudiar el comportament d’una aplicacio lineal, podembuscar les bases de manera que la seva matriu sigui mes senzilla possible.Aquesta es la idea de la descomposicio pel rang (cor. 3.48) en aplicacionslineals, i de la diagonalitzacio per endomorfismes (cap. 5). En tots dos casos,la simplificacio de la matriu es extraordinaria.

Page 55: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.2. CANVIS DE BASE 55

En primer lloc introduım notacions convenients per a treballar amb ma-trius en bases diverses:

Notacio 3.25. Denotarem com (E, e1, . . . , en) la parella d’un espai vectorialE i una base seva e1, . . . , en.

Si un vector v ∈ E te components v = α1e1 + · · · + αnen en la basee1, . . . , en el denotarem com el vector (α1, . . . , αn) de (E, e1, . . . , en).

Proposicio 3.26. Sigui f : E → F una aplicacio lineal, e1, dots, en i v1, . . . , vn

dues bases de E, u1, . . . , um i w1, . . . , wm dues bases de F . Aleshores les ma-trius M e

u(f), M vw(f) de f en els dos parells de bases cumpleixen la igualtat

M vw(f) = Cu

wM eu(f)Cv

e

on Cuw, Cv

e son les matrius de canvi de base u1, . . . , um a w1, . . . , wm en F ,v1, . . . , vn a e1, . . . , en en E respectivament.

Demostracio. La matriu de f en bases v1, . . . , vn de E, w1, . . . , wm de Fes caracteritza per la propietat de que al multiplicar les components d’unvector x ∈ E en base v1, . . . , vn produeix les components de la imatge f(x)en base w1, . . . , wm. Hem de comprovar que el producte Cu

wM eu(f)Cv

e teaquesta propietat.

Siguin (α1, . . . , αn) les components de x en base v1, . . . , vn. Aleshorestenim

CuwM e

u(f)Cve

α1...

αn

= CuwM e

u(f)

β1...

βn

= Cuw

γ1...

γm

=

δ1...

δm

Identifiquem el vector columna que tenim en cada pas:

β1...

βn

es el vector x expressat en base e1, . . . , en, ja que es el producte de

les components de x en base v1, . . . , vn per la matriu de canvi d’aquesta basea e1, . . . , en.

γ1...

γm

es el vector f(x) expressat en la base u1, . . . , um de F , ja que es

el producte de x en base e1, . . . , en per la matriu de l’aplicacio f en aquestesbases.

Finalment,

δ1...

δm

es el vector f(x) expressat en base w1, . . . , wm, ja que

es el producte de f(x) en base u1, . . . , um per la matriu de canvi d’aquestabase a w1, . . . , wm.

Page 56: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

56 CAPITOL 3. APLICACIONS LINEALS

Aixı el producte CuwM e

u(f)Cve al multiplicar les components d’un vector

de E en base v1, . . . , vn produeix les components de la seva imatge f(x) enbase w1, . . . , wm, per tant es la matriu de f en aquestes bases.

Hi han dues maneres de recordar la formula de la proposicio 3.26 sensehaver d’aprendre–la de memoria.

La primera es veure el canvi de base com un proces en cadena: hem derebre un vector x, expressat en base v1, . . . , vn, que ens vindra per la dreta,i el resultat final ha de ser la imatge f(x) en base w1, . . . , wm. La solucio espassar el vector x per una cadena de muntatge de matrius: primer el posemen base e1, . . . , en (producte Cv

e x, a partir d’aixo calculem la imatge en baseu1, . . . , um (producte M e

u(f)(Cve x), i finalment hem de canviar la imatge de

base u1, . . . , um a base w1, . . . , wm (el producte Cuw(M e

u(f)Cve x)).

La segona manera de recordar els canvis de base per aplicacions linealses pensar en un diagrama d’espais vectorials i matrius

(E, v1, . . . , vn)Mv

w(f)−→ (F, w1, . . . , wm)

Cve

y xCuw

(E, e1, . . . , en)Me

u(f)−→ (F, u1, . . . , um)

en el que les fletxes verticals son les operacions de canvi de base, i les horizon-tals les de calcul d’imatge. La proposicio 3.26 diu que els dos camins possiblesper passar de (E, v1, . . . , vn) a (F, w1, . . . , wm) donen el mateix resultat.

Exemple 3.27. Hem vist a l’exemple 3.14 que la derivacio D : R2[x] → R1[x],D(p(x)) = p′(x) es una aplicacio lineal, i que la seva matriu en la base departida e1 = 1, e2 = x, e3 = x2 i la base d’arribada u1 = 1, u2 = x es

M eu(D) =

(0 1 00 0 2

)

Calculem ara la seva matriu en les bases v1 = x2, v2 = x, v3 = 1 de R2[x] iw1 = x, w2 = 1 de R1[x] amb la formula de la proposicio 3.26.

El canvi de base de sortida que necessitem es de base v1, v2, v3 a e1, e2, e3.Aquesta matriu Cv

e te per columnes els vectors de la base inicial expressatsen la base final. Com v1 = e3, v2 = e2, v3 = e1, la matriu es

Cve =

0 0 10 1 01 0 0

Page 57: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.2. CANVIS DE BASE 57

El canvi de base d’arribada requerit es de u1, u2 a w1, w2. Com u1 = w2, u2 =w1 la matriu de canvi de base es

Cuw =

(0 11 0

)

Aixı la matriu de D en les bases v1, v2, v3 i w1, w2 es

M vw(D) = Cu

wM eu(D)Cv

e =

(2 0 00 1 0

)

Exemple 3.28. Sigui f : R3 → R2 l’aplicacio que en base canonica de sortidai d’arribada te matriu

A =

(0 −2 13 −1 4

)

Calcularem la seva matriu en les bases v1 = (1, 1, 0), v2 = (2, 0, 4), v3 =(3, 7, 1) de R3, w1 = (2, 1), w2 = (5, 3) de R2.

En R3 necessitem el canvi de base v1, v2, v3 a la base canonica. Aquestamatriu te per columnes precisament els vectors v1, v2, v3 en base canonica

Cve =

1 2 31 0 70 4 1

En R2 ens cal el canvi de base canonica a base w1, w2. Com el que tenim esw1, w2 en base canonica, invertim la matriu del canvi de base contrari

Cew = (Cw

e )−1 =

(2 51 3

)−1

=

(3 −5−1 2

)

Ara ja podem aplicar la formula del canvi de base de la proposicio 3.26: lamatriu de f en les noves bases es

B = CewACv

e =

(−16 −98 −696 40 25

)

Per a que aquesta solucio sigui correcta cal que les columnes de la matriu Bsiguin les imatges f(v1), f(v2), f(v3) en base w1, w2. El lector pot fer aquestacomprovacio.

Page 58: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

58 CAPITOL 3. APLICACIONS LINEALS

3.3 Mono, epi i isomorfismes

La idea d’isomorfisme es molt important en Algebra lineal. Que dos espaissiguin isomorfs no vol dir que siguin iguals, pero sı que tots els calculs quees facin en un d’ells es tenen per l’altre espai mitjancant un canvi de base.

Comencem amb notacio:

Definicio 3.29. (i) Un monomorfisme es una aplicacio lineal que es in-jectiva.

(ii) Un epimorfisme es una aplicacio lineal que es exhaustiva.

(iii) Un isomorfisme es una aplicacio lineal que es bijectiva.Diem que E, F son isomorfs si hi ha algun isomorfisme entre ells.

Les propietats d’injectivitat, exhaustivitat i bijeccio s’estudien en totes lesaplicacions i funcions, siguin lineals o no (per exemple en el curs de Calcul).En particular, recordem una propietat que ens sera util: una aplicacio qual-sevol f : E → F es bijectiva si i nomes si te inversa. La inversa es unaaplicacio f−1 : F → E tal que les composicions de f i f−1 son la identitat:f ◦ f−1 = IdF , f−1 ◦ f = IdE.

Com en el cas del nucli i la imatge, aquestes idees que es poden estudiarper qualsevol aplicacio tenen una caracteritzacio senzilla per les aplicacionslineals:

Proposicio 3.30. Sigui f : E → F una aplicacio lineal. Aleshores:

(i) f es un monomorfisme si i nomes si ker f = {0}.

(ii) f es un epimorfisme si i nomes si Im f = F .

(iii) f es un isomorfisme si i nomes si ker f = {0} i Im f = F .

Demostracio. (i) Si f es un monomorfisme vectors diferents de E han detenir imatges diferents. Aixı, com f(0) = 0, si u 6= 0 f(u) 6= 0, iker f = {0}. Recıprocament, si ker f = {0} i dos vectors u, v ∈ Etenen la mateixa imatge, de la igualtat f(u) = f(v) deduım

f(u) = f(v) ⇐⇒ f(u− v) = 0 ⇐⇒ u− v ∈ ker f = {0}

per tant u = v, i f es un monomorfisme.

(ii) Per definicio f es epimorfisme quan es una aplicacio exhaustiva, es dirquan la seva imatge Im f es tot l’espai d’arribada F .

Page 59: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.3. MONO, EPI I ISOMORFISMES 59

(iii) f es isomorfisme quan es monomorfisme i epimorfisme alhora.

Com els isomorfismes juguen un paper mes important en problemes d’Algebralineal, en donem mes caracteritzacions:

Proposicio 3.31. Sigui f : E → F una aplicacio lineal. Aleshores:

(i) f es un isomorfisme si i nomes si te una aplicacio lineal inversa f−1 :F → E.

(ii) f es un isomorfisme si i nomes si existeix alguna base de E e1, . . . , en

tal que les seves imatges f(e1), . . . , f(en) son una base de F .

(iii) f es un isomorfisme si i nomes si la imatge de qualsevol base de E esuna base de F .

(iv) Si E, F son de dimensio finita, f es isomorfisme si i nomes si dim E =dim F i la matriu de f es invertible.

En el cas (iv), a mes, si triem bases e1, . . . , en de E i u1, . . . , un de F lesmatrius de f i de la seva inversa cumpleixen

Mue (f−1) = (M e

u(f))−1

Observacio 3.32. En la caracteritzacio (iv) no especifiquem en quines basesmirem el rang de la matriu de f . No cal especificar–les perque per qualsevoltria el rang de la matriu de f es el mateix: la dimensio de Im f .

Demostracio. (i) Qualsevol aplicacio f : E → F es bijectiva si i nomes si teinversa f−1 : F → F , que envia cada v ∈ F a l’unic u ∈ E tal que f(u) = v.El que cal comprovar es que si f es lineal, la seva inversa f−1 tambe ho es.

Per v1, v2 ∈ F hi ha u1, u2 ∈ E tals que f(u1) = v1, f(u2) = v2. Com f eslineal f(u1+u2) = v1+v2. Per tant f−1(v1+v2) = u1+u2 = f−1(v1)+f−1(v2).

De la mateixa manera, per v ∈ F i λ ∈ R hi ha u ∈ E tal que f(u) = v,i com f es lineal f(λu) = λv. Aixı f−1(λv) = λu = λf−1(v).

(ii) Si hi ha una base e1, . . . de E tal que v1 = f(e1), v2 = f(e2), . . .es base de F , podem definir una aplicacio lineal g : F → E triant els seusvalors sobre aquesta base: g(v1) = e1, g(v2) = e2, . . . (prop. 3.16). Comg(f(ei)) = ei i f(g(vj)) = vj per tots els ei, vj, es te que f ◦g = Id, g ◦f = Id.Per tant g es la inversa de f , i f es ismorfisme.

La implicacio contraria la probem a (iii).(iii) Ja hem vist a (ii) que si f envia alguna base de E a una base de

F l’aplicacio f es un isomorfisme. El que falta per completar la proba de

Page 60: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

60 CAPITOL 3. APLICACIONS LINEALS

(ii),(iii) es mostrar que si f es un isomorfisme qualsevol base de E va a parara una base de F .

Sigui e1, e2, . . . una base de E. Comprovem que les seves imatges f(e1), f(e2), . . .son base de F .

En primer lloc generen tot F : per qualsevol v ∈ F com Im f = F hiha u ∈ E tal que f(u) = v. Com e1, . . . es base de E podem posar ucom una combinacio lineal u = λ1e1 + · · · + λnen, i aleshores v = f(u) =λ1f(e1) + · · ·+ λnf(en).

Comprovem ara que f(e1), f(e2), . . . son linealment independents: si ten-im una combinacio lineal λ1f(e1) + · · ·+ λnf(en) = 0, per linealitat de f

f(λ1e1 + · · ·+ λnen) = 0

Com f a mes es injectiva, cal que λ1e1 + · · ·+ λnen = 0. Pero e1, . . . era unabase de E, per tant λ1 = λ2 = · · · = λn = 0, i les imatges f(e1), f(e2), . . .son l.i. en F .

(iv) Si f : E → F es un isomorfisme, com les imatges de una basee1, . . . , en de E formen una base de F es te dim E = dim F . A mes, el rangde f (de la matriu de f en bases qualsevols) es la dimensio de Im f . Comf(e1), . . . , f(en) es base de F , Im f = F i la seva dimensio es la maximapossible dim F . Recordem ara que una matriu n× n es invertible si i nomessi te rang maxim n.

Recıprocament, si tenim una aplicacio f : E → F on dim E = dim F i lamatriu de f en bases qualsevols M e

u(f) es invertible, equivalentment te rangmaxim dim F , aixo vol dir que el subespai generat per les imatges de la basede sortida f(e1), . . . , f(en) es F (prop. 2.69). Per tant f(e1), . . . , f(en) esbase (Cor. 2.28), i f es un isomorfisme per (ii).

Finalment, comparem les matrius de f, f−1 en aquest cas de dimensio fini-ta: Amb bases qualsevols e1, . . . , en de E i u1, . . . , un de F , per la proposicio3.17 es te

Muu (f ◦ f−1) = M e

u(f)Mue (f−1) , M e

e (f−1 ◦ f) = Mue (f−1)M e

u(f)

Com f, f−1 son inversos les seves composicions son la identitat, i tenen ma-triu identitat en qualsevol base. Per tant les matrius M e

u(f), Mue (f−1) son

inverses.

Exemple 3.33. Sigui E un espai vectorial qualsevol de dimensio n. Qualsevolbase seva v1, . . . , vn defineix una aplicacio que envia un vector x ∈ E a lesseves components en aquesta base:

c : E −→ Rn

x = α1v1 + · · ·+ αnvn 7−→ (α1, . . . , αn)

Page 61: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.3. MONO, EPI I ISOMORFISMES 61

Es molt facil comprovar que aquesta aplicacio es lineal. Vegem que es unisomorfisme perque cumpleix les condicions de la proposicio 3.30:

(i) c te nucli zero, ja que c(x) = (0, . . . , 0) vol dir que x = 0v1 + · · ·+0vn =~0.

(ii) La imatge de c es tot Rn, ja que per qualsevol (α1, . . . , αn) ∈ Rn es teque c(α1v1 + · · ·+ αnvn) = (α1, . . . , αn).

Una consequencia d’aquest isomorfisme es que en qualsevol espai vectorial dedimensio finita, un cop triem una base tots els calculs amb els seus vectorses converteixen en calculs en un Rn.

Exemple 3.34. Rm[x] es isomorf a Rm+1. Aquest es un cas particular del’exemple 3.33. Al triar una base de potencies de x tot polinomi s’identificaamb el vector dels seus coeficients.

Exemple 3.35. L’espai vectorial de matrius Mm×n(R) es isomorf a Rmn. Aque-st es un altre cas particular de l’exemple 3.33. Amb la base canonica totamatriu m×n es pot identificar amb el vector m×n de les seves components.

Exemple 3.36. Sigui Hom (E, F ) el conjunt de les aplicacions lineals de E enF .

Aquest conjunt es un espai vectorial, amb suma (f + g) : E → F donadaper x 7→ f(x) + g(x) i producte per escalar (λf) : E → F donat per x 7→λf(x).

Si fixem bases e1, . . . , en de E i u1, . . . , um de F , tenim l’aplicacio queenvia cada aplicacio lineal a la seva matriu

M eu : Hom (E, F ) −→ Mm×n(R)

f 7−→ M eu(f)

Es facil comprovar que aquesta aplicacio es lineal, es a dir, que sempre es teM e

u(f +g) = M eu(f)+M e

u(g) i M eu(λf) = λM e

u(f) (recordeu que les columnesde la matriu de l’aplicacio lineal son les imatges de la base de sortida).

La proposicio 3.16 diu que aquesta aplicacio es bijectiva, per tant es unisomorfisme.

Una altra propietat interessant dels isomorfismes es:

Lema 3.37. La composicio de dos isomorfismes es un altre isomorfisme.

Demostracio. Siguin f : E → F i g : F → G dos isomorfismes. sabem per laproposicio 3.31 que si prenem una base e1, e2, . . . de E la seva imatge per ff(e1), f(e2), . . . es una base de F . Per la mateixa rao, com f(e1), f(e2), . . .es base de F i g es un isomorfisme, les imatges g(f(e1)), g(f(e2)), . . . son unabase de G. Per tant la composicio g ◦ f envia una base de E a una base deG i es un isomorfisme.

Page 62: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

62 CAPITOL 3. APLICACIONS LINEALS

Exercici 9. Demostrar el lema 3.37 per espais de dimensio finita, usant lesmatrius de les aplicacions.

Corol·lari 3.38. Dos espais vectorials son isomorfs si i nomes si tenen lamateixa dimensio.

3.4 Imatges i antiimatges de subespais

En les aplicacions sovint interessa coneixer la imatge o l’antiimatge no d’unsol vector, sino de tot un subespai. En aquesta seccio veurem com calcularaquestes imatges i antiimatges a partir de la matriu de l’aplicacio lineal, ialgunes de les seves propietats.

Com a aplicacions d’aquests calculs demostrarem el teorema d’isomor-fisme i alguns resultats relacionats: la dimensio del nucli (per fi!), el teoremade Rouche–Frobenius i la descomposicio pel rang.

Per a comencar, recordem que per qualsevol aplicacio f : E → F , siguilineal o no, si tenim subconjunts G ⊂ E i H ⊂ F :

(i) la imatge de G es f(G) = {v ∈ F | v = f(u), u ∈ G}.

(ii) l’antiimatge de H es f−1(H) = {u ∈ E | f(u) ∈ H}.

Com de costum, si f es lineal i G, H subespais vectorials, les imatges i an-tiimatges tornen a ser–ho. Comprovem aixo i indiquem directament comcalcular–los:

Lema 3.39. Sigui f : E → F una aplicacio lineal, i G = [u1, . . . , uk] unsubespai vectorial de E. Aleshores la imatge de G es el subespai vectorialf(G) = [f(u1), . . . , f(uk)].

Demostracio. Tot vector de G es de la forma u = λ1u1 + · · · + λkuk, pertant totes les imatges d’un vector u ∈ G son combinacions lineals f(u) =λ1f(u1) + · · · + λkf(uk) amb λ1, . . . , λk ∈ R. Recıprocament, per qualsevolcombinacio lineal de les imatges dels generadors es te

λ1f(u1) + · · ·+ λkf(uk) = f(λ1u1 + · · ·+ λkuk)

per tant f(G) = [f(u1), . . . , f(uk)], i es un subespai.

Lema 3.40. Sigui f : E → F una aplicacio lineal, e1, . . . , en una basede E, u1, . . . , um una base de F , i H ⊂ F un subespai vectorial que en

la base u1, . . . , um te sistema d’equacions H =

(y1, . . . , ym) |B

y1...

ym

= 0

.

Page 63: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.4. IMATGES I ANTIIMATGES DE SUBESPAIS 63

Aleshores l’antiimatge f−1(H) es un subespai vectorial de E, i en base e1, . . . , en

te equacions

f−1(H) =

(x1, . . . , xn) |BM eu(f)

x1...

xn

=

0...0

on M eu(f) es la matriu de f en les bases escollides.

Demostracio. Denotem x,y els vectors columna

x1...

xn

∈ Rn,

y1...

ym

∈ Rm

respectivament.Per ser By = 0 el sistema d’equacions de H en la base u1, . . . , um, si un

vector v ∈ F te components y en aquesta base aleshores

v ∈ H ⇐⇒ By = 0 (3.1)

Si un vector u ∈ E te components x en base e1, . . . , en, la seva imatge f(u) teen base u1, . . . , um components M e

u(f)x. Per tant, aplicant la caracteritzacio(3.1) trobem que

v = f(u) ∈ H ⇐⇒ BM eu(f)x = 0

Aixo significa que l’antiimatge f−1(H) es el conjunt de vectors u tals queles seves components en base e1, . . . , en son solucio del sistema homogeni(BM e

u(f))x = 0. Dit d’una altra manera, que f−1(H) es un subespai i teaquestes equacions en base e1, . . . , en.

Exemple 3.41. Sigui f : R3 → R4 l’aplicacio lineal que en base canonica desortida i d’arribada te matriu

A =

3 2 −10 −1 38 4 61 2 0

Calculem en primer lloc la imatge del subespai G = [(1, 2, 2), (−1, 3, 1)]: estagenerat per les imatges

f(1, 2, 2) = A

122

=

54285

, f(−1, 3, 1) = A

−131

=

20105

Page 64: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

64 CAPITOL 3. APLICACIONS LINEALS

Per tant f(G) = [(5, 4, 28, 5), (2, 0, 10, 5)].Busquem ara l’antiimatge del subespai H ⊂ R4 que te equacions {x −

4y + 3z + t = 0 , 3x − y + 8t = 0}. El sistema d’equacions de H reescritmatricialment es (

1 −4 3 13 −1 0 8

)xyzt

=

(00

)

Les equacions de f−1(H) son

(1 −4 3 13 −1 0 8

)3 2 −10 −1 38 4 61 2 0

x

yz

=

(00

)

ja que aquesta es la condicio que ha de cumplir un vector (x, y, z) de R3 per

a que la seva imatge A

xyz

pertanyi a H. Multiplicant les matrius trobem

que les equacions de f−1(H) son

(28 20 517 23 −6

)xyz

=

(00

)

Com les imatges i antiimatges de subespais tornen a ser–ho, les restric-cions a ells d’una aplicacio lineal son de nou aplicacions lineals:

Definicio 3.42. Sigui f : E → F una aplicacio lineal, i G ⊂ E un subespai.La restriccio de f a G es l’aplicacio lineal fG : G → F que envia cada vectorde G a la seva imatge per f .

Observacio 3.43. La restriccio d’una aplicacio lineal a un subespai es uncanvi d’espai de sortida. Tambe podem canviar l’espai d’arribada per unsubespai H ⊂ F sempre que Im f ⊆ H, ja que com H conte les imatgespodem aprofitar la definicio original de l’aplicacio f . Quan es fa un canvid’espai d’arribada no es sol indicar en la notacio, i es mante el mateix nom del’aplicacio lineal a menys que la confusio d’espai d’arribada comporti algunperill.

Lema 3.44. Sigui f : E → F una aplicacio lineal, G ⊂ E un subespaivectorial, i fG : G → F la restriccio de f a G. Aleshores

ker fG = ker f ∩G

Page 65: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.4. IMATGES I ANTIIMATGES DE SUBESPAIS 65

Demostracio. La prova es escriure les definicions dels dos nuclis i poca cosames: si u ∈ ker fG, aixo vol dir que u ∈ G i que fG(u) = f(u) = 0. Per tanttambe es te que u ∈ ker f ∩G.

Recıprocament, si u ∈ ker f ∩ G aixo vol dir que u ∈ G i que fG(u) =f(u) = 0, per tant u ∈ ker fG.

Tot i ser tant senzill, el lema 3.44 es la base del teorema definitiu sobrel’estructura de les aplicacions lineals. Aquest teorema te un enunciat mesnatural en termes de l’espai quocient, pero en aquest curs no estudiem aquestsespais, aixı que presentem un enunciat equivalent:

Teorema 3.45. (Teorema d’isomorfisme) Sigui f : E → F una aplicaciolineal, i G ⊂ E un subespai complementari del nucli ker f . Aleshores, larestriccio

fG : G −→ Im f

es un isomorfisme.

Demostracio. Com ker f i G son complementaris, la seva interseccio es ker f∩G = {0}, i pel lema 3.44 la restriccio fG es injectiva.

Comprovem ara que la restriccio fG es exhaustiva. L’espai d’arribada esla imatge de l’aplicacio original Im f , aixı que el que s’ha de comprovar esque al restringir el domini de tot E al subespai G la imatge no canvia.

De nou per ser ker f i G complementaris, tenim que ker f ⊕G = E. Aixı,per qualsevol u ∈ E tenim una descomposicio u = v+w amb v ∈ ker f, w ∈ G.Aplicant f tenim f(u) = f(v) + f(w) = f(w), ja que f(v) = 0. Per tanttot vector de F que sigui imatge d’algun vector u ∈ E es tambe imatge dew ∈ G, i la imatge de la restriccio fG es tot Im f .

Aixı la restriccio fG : G → Im f te nucli zero i imatge tot l’espai d’arrib-ada, pel que es un isomorfisme (prop. 3.30).

Si hom es mira be la demostracio del teorema d’isomorfisme en la nostraversio, tambe serveix per demostrar un altre enunciat molt proper:

Corol·lari 3.46. Sigui f : E → F una aplicacio lineal entre espais de di-mensio finita. Aleshores

dim ker f = dim E − rang f

Demostracio. Per l’isomorfisme del teorema 3.45, tenim rang f = dim G,on G es un complementari del nucli. Aixı dim ker f = dim E − dim G =dim E − rang f .

Page 66: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

66 CAPITOL 3. APLICACIONS LINEALS

Una altra aplicacio del teorema d’isomorfisme 3.45 es el resultat fonamen-tal de la teoria de sistemes lineals, que apareix per segona vegada en aquestesnotes:

Teorema 3.47. (de Rouche–Frobenius) Sigui

(A | b)

un sistema d’equacions lineals en n incognites. Aleshores:

(i) El sistema es compatible si i nomes si rangA = rang (A | b).

(ii) Si rangA = rang (A | b) = r, la solucio del sistema depen de n − rparametres.

Demostracio. La observacio clau es que, si considerem la matriu A de coefi-cients del sistema com la matriu en bases canoniques d’una aplicacio lineal

fA : Rn → Rm

x =

x1...

xn

7→ Ax

aleshores les solucions del sistema son exactament les antiimatges del vector

b =

cb1...

bm

de termes independents. Per tant, el sistema te solucio si i nomes

si b ∈ Im fA, i com aquest espai esta generat per les columnes de A, lacondicio es cumpleix si i nomes si el rang de la matriu ampliada (A |b) es elmateix que el de A.

Pel que fa al nombre de parametres quan la solucio existeix: hem vist a laprop. ?? que si calculem una solucio particular x0 de Ax = b, aleshores totasolucio del sistema es de la forma x = x0 +y, on y es una solucio del sistemahomogeni associat Ay = 0, es a dir que les solucions del sistema Ax = b sonels vectors del conjunt

x0 + ker fA = {x0 + y |y ∈ ker fA}

Si el rang de A i del sistema Ax = b es r, la dimensio de ker fA es n − rpel corol·lari 3.46. D’aqui deduım que la solucio general de Ax = b es de laforma

x = x0 + λ1y1 + · · ·+ yn−r

on y1, . . .yn−r formen una base de ker fA, i λ1, . . . , λn−r son escalars qual-sevols.

Page 67: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.4. IMATGES I ANTIIMATGES DE SUBESPAIS 67

Abans d’enunciar–lo hem afirmat que el teorema d’isomorfisme determinaper complet com son les aplicacions lineals. Expliquem aixo amb mes detall:

Corol·lari 3.48. (Descomposicio pel rang) Sigui f : E → F una aplicaciolineal entre espais de dimensio finita, i d = rang f . Aleshores existeixen basese1, . . . , en de E i u1, . . . , um de F tals que

f(e1) = u1, f(e2) = u2, . . . , f(ed) = ud,

f(ed+1) = 0, . . . , f(en) = 0

Es dir, en aquestes bases la matriu de f es

M eu(f) =

1 0 . . . 0

0. . .

... 10

0. . .

Demostracio. Trobarem aquestes bases amb el teorema d’isomorfisme: comrang f = dim Im f = d, sabem que dim ker f = dim E − d = n− d (corol·lari3.22). Triem ara una base e1, . . . , en de E de manera que els darrers vectorsed+1, . . . , en siguin una base de ker f .

Els primers vectors e1, . . . , ed de la base de E que hem triat son based’un subespai G complementari de ker f . Pel teorema d’isomorfisme 3.45la restriccio fG : G → Im f es un isomorfisme. Per tant, les imatges u1 =f(e1), . . . , ud = f(ed) de la base de G son una base de Im f (prop. 3.31).

Com els vectors u1, . . . , ud son base de Im f son l.i., i podem ampliar–losper tenir una base u1, . . . , ud, ud+1, . . . , um de tot F . Amb aquestes bases escompleix l’enunciat.

Aixı, la descomposicio pel rang ens diu que per qualsevol aplicacio linealexisteixen bases de sortida i arribada de manera que la matriu de l’aplicaciote nomes uns quants uns a la diagonal. Aquesta es la matriu mes senzilla quepot tenir una aplicacio lineal si deixem variar les bases de sortida i d’arribada.

Una altra interpretacio de la descomposicio pel rang es que si dues aplica-cions lineals tenen el mateix rang les podem portar a tenir la mateixa matriutriant adequadament les bases de sortida i d’arribada. La condicio de tenirel mateix rang es evidentment necessaria, ja que el rang de l’aplicacio es elde la matriu en qualsevols bases que usem.

Aquestes questions de quina es la matriu mes senzilla que pot tenir unaaplicacio si triem be les bases i de quan podem fer que dues aplicacions

Page 68: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

68 CAPITOL 3. APLICACIONS LINEALS

lineals tinguin la mateixa matriu tornarem a estudiar–les en el capıtol 5 pelsendomorfismes. En aquest altre cas, al haber de treballar amb la mateixabase de sortida i d’arribada la solucio que s’obte no es tan senzilla.

Exemple 3.49. Sigui f : R3 → R4 l’aplicacio lineal que en bases canoniquesde sortida i d’arribada te matriu

A =

1 −1 28 4 47 6 15 0 5

Busquem la descomposicio pel rang.

En primer lloc calculem el rang de la matriu de l’aplicacio:1 −1 28 4 47 6 15 0 5

1 −1 20 12 −120 13 −130 5 −5

1 −1 20 12 −120 0 00 0 0

El rang de A (i de l’aplicacio f) es 2. Per tant, pel corol·lari 3.48 existeixenbases v1, v2, v3 de R3 i u1, u2, u3, u4 de R4 tals que en elles f te matriu

M vu(f) =

1 0 00 1 00 0 00 0 0

Busquem aquestes bases tal com ho hem fet a la demostracio del corol·lari.En primer lloc busquem una base de ker f aprofitant el calcul del rang

1 −1 28 4 47 6 15 0 5

∣∣∣∣∣∣∣∣∣0000

∼ . . .

1 −1 20 12 −120 0 00 0 0

∣∣∣∣∣∣∣∣∣0000

La solucio del sistema es x = −z, y = z, z ∈ R parametre. Prenent z = 1tenim una base del nucli, ker f = [(−1, 1, 1)], i triem aquest vector com eldarrer de la base de sortida, v3 = (−1, 1, 1).

La resta de la base de sortida es la base de qualsevol complementari G deker f . Per a trobar–ne una nomes cal completar la base de ker f fins una basede l’espai de sortida. Veiem a ull que una solucio es v1 = (1, 0, 0), v2 = (0, 1, 0)ja que la matriu formada per v1, v2, v3 te rang 3. A mes, al coincidir la novabase i la canonica en els dos primers vectors les matrius de canvi de base

Page 69: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

3.4. IMATGES I ANTIIMATGES DE SUBESPAIS 69

es simplifiquen molt. Aquesta solucio no ha estat una coincidencia, es moltcomu que en aquest punt puguem aprofitar els primers vectors de la basecanonica.

Ara cal trobar la base d’arribada. Com ja hem triat v1, v2, cal que u1 =f(v1) = (1, 8, 7, 5), u2 = f(v2) = (−1, 4, 6, 0). Els vectors u1, u2 son una basede Im f pel teorema d’isomorfisme, i per tant son linealment independents.Ens falta completar u1, u2 per tenir una base de l’espai d’arribada. Esglaonemla matriu que els te per files(

1 8 7 5−1 4 6 0

)∼(

1 8 7 50 12 13 5

)

i aixı veiem a ull que per a completar una base de R4 podem triar u3 =(0, 0, 1, 0), u4 = (0, 0, 0, 1). Novament triar els mateixos vectors de la basecanonica simplificara qualsevol canvi de base que s’hagi de fer despres. Icom en la base de sortida, poder aprofitar vectors de la base canonica es lasituacio habitual, no una coincidencia.

Aixı les bases de la descomposicio pel rang de f son:

- A R3: v1 = (1, 0, 0), v2 = (0, 1, 0), v3 = (−1, 1, 1).

- A R4: u1 = (1, 8, 7, 5), u2 = (−1, 4, 6, 0), u3 = (0, 0, 1, 0), u4 = (0, 0, 0, 1).

Page 70: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

70 CAPITOL 3. APLICACIONS LINEALS

Page 71: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Capıtol 4

Determinants

La definicio natural del determinant es com a funcio det : Mn×n(R) → Rlineal en totes les files (o columnes) de la matriu, que canvia de signe alintercanviar–ne dues i que val 1 en la identitat. Comprovar que aquestafuncio existeix i te les propietats que ens convenen demana un esforc i laintroduccio del grup simetric.

En aquest curs no dediquem prou temps als determinants per fer aquestaconstruccio. La substituım per una altra interpretacio dels determinants quees tambe natural: el determinant mesura el (hiper)volum d’un paral·lelepıpedamb signe. Lamentablement presentarem aquesta construccio incompleta,sense aclarar el signe ni justificar algunes propietats forca utils. Per a unadescripcio completa, el lector pot consultar qualsevol dels llibres de la bibli-ografia.

4.1 Matrius elementals

Per a resoldre sistemes lineals i calcular rangs hem introduıt les transforma-cions elementals per files d’una matriu. Aquestes transformacions eren detres menes:

(i) Intercanviar dues files.

(ii) Multiplicar una fila per un escalar λ 6= 0.

(iii) Sumar a una fila un multiple d’una altra.

Hi ha transformacions analogues per columnes.Les transformacions per files es poden interpretar en termes de multipli-

cacio de matrius. Primer recordem la base canonica d’un espai de matrius

71

Page 72: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

72 CAPITOL 4. DETERMINANTS

Mm×n(R). Esta formada per les matrius Eij que tenen un 1 en el coeficient

(i, j) i 0 en tots els altres.

Lema 4.1. Sigui A una matriu n× n. Aleshores

(i) Si intercanviem les files i i j de A, la matriu que obtenim es EA, onE es la matriu n× n donada per

E = Id− Eii − Ej

j + Eij + Ej

i

(ii) Si multipliquem la fila i de A per un λ 6= 0, la matriu que obtenim esEA, on E es la matriu n× n donada per

E =

. . . 01

λ1

0. . .

= Id + (λ− 1)Eii

(iii) Si sumem a la fila i de A α vegades la fila j, la matriu que obtenim esEA, on E es la matriu n× n donada per

E = Id + αEji

Notacio 4.2. Anomenarem les matrius E del lema matrius elementals.

La demostracio d’aquest lema es nomes fer les multiplicacions EA i com-provar que donen les transformacions elementals esperades en A. Trans-posant els productes obtenim una descripcio de les transformacions elemen-tals per columnes:

Corol·lari 4.3. Si apliquem a una matriu n × n A una transformacio ele-mental per columnes la matriu que obtenim es AE ′, on E ′ es la transposadade la corresponent matriu del lema 4.1.

Si prenem una matriu quadrada A de rang maxim i li apliquem trans-formacions elementals per files i per columnes, cap baix i cap dalt, podemarribar a la identitat. Aquest calcul demostraria la seguent

Proposicio 4.4. (i) Si A es una matriu n×n de rang n, aleshores admetuna descomposicio

A = E1 . . . Ek

on E1, . . . , Ek son matrius elementals de les descrites en el lema 4.1.

Page 73: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

4.1. MATRIUS ELEMENTALS 73

(ii) Si rangA < n, A admet una descomposicio

A = E1 . . . EkB

on B es esglaonada i te el mateix rang que A.

Enlloc de demostrar la proposicio 4.4 ens conformarem amb un exempleque mostra com fer aquesta descomposicio.

Exemple 4.5. Calcularem la descomposicio en matrius elementals de A =−1 2 14 −9 00 1 2

. Primer portem A a la identitat (o a forma esglaonada si no

te rang maxim), apuntant les transformacions elementals que fem:−1 2 14 −9 00 1 2

∼2a fila + 4 · 1a fila

−1 2 10 −1 40 1 2

∼3a fila+ 2a fila

−1 2 10 −1 40 0 6

(−1)1a fila(−1)2a fila

163a fila

1 −2 −10 1 −40 0 1

1a fila+ 3a fila2a fila + 4 3a fila1 −2 0

0 1 00 0 1

∼1a fila+ 2 2a fila

1 0 00 1 00 0 1

Hem llistat per ordre les transformacions elementals per files que fan falta pertransformar A en Id. Si volem transformar Id en A cal fer les transformacions

inverses i en l’ordre contrari, es a dir cal prendre

1 0 00 1 00 0 1

i aplicar–li

per ordre les seguents transformacions elementals (indiquem en cada cas lamatriu elemental associada)

(i) 1a fila −2 · 2a fila: E1 =

1 −2 00 1 00 0 1

(ii) 2a fila −4 · 3a fila: E2 =

1 0 00 1 −40 0 1

(iii) 1a fila −3a fila: E3 =

1 0 −10 1 00 0 1

Page 74: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

74 CAPITOL 4. DETERMINANTS

(iv) 6 · 3a fila: E4 =

1 0 00 1 00 0 6

(v) (−1) · 2a fila: E5 =

1 0 00 −1 00 0 1

(vi) (−1) · 1a fila: E6 =

−1 0 00 1 00 0 1

(vii) 3a fila −2a fila: E7 =

1 0 00 1 00 −1 1

(viii) 2a fila −4 · 1a fila: E8 =

1 0 0−4 1 00 0 1

Aixı tenim A = E8E7E6E5E4E3E2E1. A mes, si es van multiplicant les ma-trius elementals Ei de dreta a esquerra van apareixent els passos intermitjosde les transformacions elementals que hem aplicat abans a A

Finalment, citem com transformen els volums les matrius elementals:

Proposicio 4.6. Sigui E una matriu elemental n× n, i P el paral·lelepıpedn–dimensional format pels n vectors columna de E. Aleshores, l’(hiper)volumde P es

(i) 1 si E es la matriu elemental de tipus (i) en el lema 4.1.

(ii) |λ| si E es una matriu elemental del tipus (ii) en el lema 4.1.

(iii) 1 si E es una matriu elemental del tipus (iii) en el lema 4.1.

No demostrarem aquesta proposicio ja que caldria entrar en la definiciode arees i volums en qualsevol dimensio, pero es pot justificar si admetem queper tota dimensio n el volum n–dimensional d’un producte de solids S1 × S2

es el producte dels volums v(S1)× v(S2) (per exemple, en un paral·lelepıpedrecte de R3 el volum es el producte de l’area de la base per l’alcada). Comles transformacions elementals nomes afecten a una o dues files, podem de-scomposar el paral·lelepıped original com a producte de un de dimensio n−1o n− 2 que no varia al multiplicar per E, i un altre de dimensio 1 o 2 al quepodem estudiar la longitud/area amb les formules que demostrem al capıtol6 per l’area de paral·lelograms.

Page 75: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

4.2. PROPIETATS DEL DETERMINANT 75

Exemple 4.7. En la descomposicio en matrius elementals de la matriu A del’exemple 4.5 nomes la matriu E4 varia el volum, multiplicant–lo per 6. Comveurem en la seccio seguent (t. 4.8), aixo significa que la matriu A multiplicael volum dels solids per 6.

4.2 Propietats del determinant

Teorema 4.8. El determinant es una funcio definida sobre les matrius n×nper qualsevol n que compleix les seguents propietats:

(i) det(Id) = 1.

(ii) Si intercanviem dues files de A, la nova matriu A′ te determinant

det A′ = − det A

(iii) Si multipliquem una fila de A per un escalar λ ∈ R, la nova matriu A′

te determinantdet A′ = λ det A

(iv) Si sumem a una fila de A un multiple d’una altra, la nova matriu A′

te determinantdet A′ = det A

(v) det AB = det A det B.

(vi) det At = det A.

(vii) Siguin Au, Av, Au+v matrius que en la fila i–essima tenen el vectoru, v, u+ v ∈ Rn respectivament, i totes les demes files iguals. Aleshores

det Au+v = det Au + det Av

(viii) Si triem una fila i–essima qualsevol de la matriu A =

a1

1 . . . a1n

.... . .

an1 . . . an

n

,

aleshores el determinant de A es

det A = (−1)i+1ai1 det Ai

1 + (−1)i+2ai2 det Ai

2 + · · ·+ (−1)i+nain det Ai

n

on cada matriu Aij es l’adjunta de l’element ai

j: es la matriu (n− 1)×(n− 1) formada al treure a A la fila i i la columna j.

Page 76: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

76 CAPITOL 4. DETERMINANTS

(ix) Si P es el paral·lelepıped definit per les columnes de A, el (hiper)volumde P es

v(P ) = | det A|

Aquesta funcio determinant existeix i es unica.

D’aquestes propietats definidores del determinant, que deixem sense de-mostrar, se’n poden deduır facilment unes quantes mes. Les transformacionsdel determinant segons les transformacions elementals per files i el fet que eldeterminant no varia al tranposar la matriu impliquen

Corol·lari 4.9. Si apliquem a una matriu A una transformacio elemental percolumnes el seu determinant varia de la mateixa manera que per la transfor-macio elemental per files corresponent.

Altres consequencies encara mes utils son:

Corol·lari 4.10. El determinant d’una matriu triangular es el producte delselements de la diagonal.

Indicacio de la prova: Com det A = det At, transposant si conve podem ferque la matriu sigui triangular superior, es a dir de la forma

A =

a1

1 . . . . . . . . .0 a2

2 . . .

0 0. . .

Ara podem desenvolupar per la primera columna, despres per la segona, iaixı succesivament fins la darrera columna. En cada cas nomes hi ha unsumand de la formula del desenvolupament no nul, i apareix com a factor elterme de la diagonal amb un signe +.

Corol·lari 4.11. (regla de Sarrus) El determinant d’una matriu 3× 3 es

det

a11 a1

2 a13

a21 a2

2 a23

a31 a3

2 a33

= a11a

22a

33 + a1

2a23a

31 + a1

3a21a

32

− a11a

23a

32 − a1

2a21a

33 − a1

3a22a

31

Indicacio de la prova: Desenvolupar la matriu A per qualsevol fila o columnai reordenar els termes.

Page 77: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

4.2. PROPIETATS DEL DETERMINANT 77

Corol·lari 4.12. Una matriu n× n A es inversible si i nomes si det A 6= 0.

Demostracio. Si A es inversible, per la multiplicativitat del determinant ten-im

det A det A−1 = det(AA−1) = det Id = 1

Per tant cal que det A 6= 0.

Si A no es inversible per la proposicio 4.4 te una descomposicio A =E1 . . . EkB on les Ei son matrius elementals i B es esglaonada i de rangrang A < n. Com B es esglaonada es tambe triangular, i com te rang menorque n ha d’apareixer algun coeficient 0 al final de la diagonal. Per tant pelcorol·lari 4.10 det B = 0, i det A = det E1 . . . det Ek det B = 0.

Exemple 4.13. Calculem el seguent determinant de la manera mes rapida:

∣∣∣∣∣∣∣∣∣2 4 0 2−1 −3 1 23 1 2 9−2 2 5 1

∣∣∣∣∣∣∣∣∣ = 2

∣∣∣∣∣∣∣∣∣1 2 0 1−1 −3 1 23 1 2 9−2 2 5 1

∣∣∣∣∣∣∣∣∣= 2

∣∣∣∣∣∣∣∣∣1 2 0 10 −1 1 30 −5 2 60 6 5 3

∣∣∣∣∣∣∣∣∣ = 2

∣∣∣∣∣∣∣∣∣1 2 0 10 −1 1 30 0 −3 −90 0 11 21

∣∣∣∣∣∣∣∣∣ = 2(−3)

∣∣∣∣∣∣∣∣∣1 2 0 10 −1 1 30 0 1 30 0 11 21

∣∣∣∣∣∣∣∣∣ =

(−6)

∣∣∣∣∣∣∣∣∣1 2 0 10 −1 1 30 0 1 30 0 0 −12

∣∣∣∣∣∣∣∣∣ = (−6) · 1 · (−1) · 1 · (−12) = −72

Hem triangulat la matriu mitjancant transformacions elementals que no al-teren el determinant, i treient factor comu d’una fila o columna sempre queha estat posible. Un cop la matriu es triangular, el determinant es el productedels elements de la diagonal.

Exemple 4.14. Quan s’ha de calcular el determinant d’una matriu que conteparametres triangular–la pot ser una mala opcio, perque introdueix fraccionsracionals que dificulten el calcul. La opcio alternativa es desenvolupar peruna fila o columna. Calculem aixı el determinant de la matriu

2− t 3 2 34 2− t 1 2−2 3 1− t 03 4 −1 3− t

Page 78: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

78 CAPITOL 4. DETERMINANTS

Abans de desenvolupar, usarem el coeficient 1 en la posicio (2, 3) per a posarmes zeros en la seva columna primer i fila despres amb transformacions el-ementals. No farem calculs que produeixin polinomis de grau mes gran queu. ∣∣∣∣∣∣∣∣∣

2− t 3 2 34 2− t 1 2−2 3 1− t 03 4 −1 3− t

∣∣∣∣∣∣∣∣∣ =∣∣∣∣∣∣∣∣∣−6− t −1 + 2t 0 −1

4 2− t 1 2−2 3 1− t 07 6− t 0 5− t

∣∣∣∣∣∣∣∣∣=

∣∣∣∣∣∣∣∣∣−6− t −1 + 2t 0 −1

0 2− t 1 0−6 + 4t 3 1− t −2 + 2t

7 6− t 0 5− t

∣∣∣∣∣∣∣∣∣Ara podem desenvolupar per qualsevol fila o columna que nomes continguidos elements diferents de zero, i el calcul es reduira al de dos determinants3× 3, que completarem per la regla de Sarrus. Triem la tercera columna perfer el desenvolupament.∣∣∣∣∣∣∣∣∣−6− t −1 + 2t 0 −1

0 2− t 1 0−6 + 4t 3 1− t −2 + 2t

7 6− t 0 5− t

∣∣∣∣∣∣∣∣∣ = (−1)2+3 · 1

∣∣∣∣∣∣∣−6− t −1 + 2t −1−6 + 4t 3 −2 + 2t

7 6− t 5− t

∣∣∣∣∣∣∣+ (−1)3+3(1− t)

∣∣∣∣∣∣∣−6− t −1 + 2t −1

0 2− t 07 6− t 5− t

∣∣∣∣∣∣∣= (−1) ((−6− t)3(5− t) + (−1 + 2t)(−2 + 2t)7 + (−1)(−6 + 4t)(6− t)

−(−6− t)(−2 + 2t)(6− t)− (−1 + 2t)(−6 + 4t)(5− t)− (−1)3 · 7)

+ (1− t)(2− t)

∣∣∣∣∣−6− t −17 5− t

∣∣∣∣∣= (−1)

(6t3 − 19t2 + 89t− 121

)+(t4 − 2t3 − 24t2 + 71t− 46

)= t4 − 8t3 − 5t2 − 18t + 75

Una altra situacio comu es la de les matrius anomenades triangulars perblocs:

Lema 4.15. Si una matriu n× n M admet una subdivisio en blocs

M =

(A B0 D

)

Page 79: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

4.2. PROPIETATS DEL DETERMINANT 79

on A, D son caixes quadrades de mides k×k, (n−k)×(n−k) respectivament,i la caixa (n− k)× k es tota zero, aleshores

det M = det A det D

Indicacio de la prova: Podem fer transformacions elementals a les darreresn − k files de M per portar D a forma esglaonada. Si el rang de D noes n − k aleshores es te det D = 0, i com M tampoc te el rang maximdet M = 0 i el lema es compleix. Si el rang de D es el maxim n− k aleshoresla seva forma esgalonada es triangular superior. Podem desenvolupar M perla darrera fila, despres per l’anterior, i aixı succesivament amb les n − kdarreres files. En cada desenvolupament nomes hi ha un terme no nul, i elresultat es el producte dels elements de la diagonal de les n− k darreres filespel determinant de A.

Exemple 4.16. La matriu

M =

3− t −1 2 −7 2

4 6− t 3 −1 50 0 4− t 0 00 0 −1 4− t 30 0 2 0 1− t

compleix les hipotesis del lema amb A =

(3− t −1

4 6− t

), C =

4− t 0 0−1 4− t 32 0 1− t

.

La matriu C torna a ser triangular per blocs, amb caixes quadrades (4 − t)

i

(4− t 3

0 1− t

). Per tant tenim

det M = (t2 − 9t + 22)(4− t)(4− t)(1− t)

Page 80: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

80 CAPITOL 4. DETERMINANTS

Page 81: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Capıtol 5

Diagonalitzacio

5.1 Endomorfismes

Definicio 5.1. Un endomorfisme es una aplicacio lineal f : E → E que teel mateix espai de sortida i d’arribada.

Els endomorfismes tenen propietats addicionals respecte de les aplicacionslineals en general:

(i) Si la dimensio de E es finita, la matriu de f es quadrada.

(ii) La composicio de dos endomorfismes de E es un altre endomorfismede E. Si un endomorfisme f te invers f−1, aquest invers es tambeendomorfisme de E.

Aixı els endomorfismes d’un espai E a mes de poder sumar–se i multiplicar–se per un escalar es poden composar, i aquesta composicio correspon a lamultiplicacio de matrius (prop. 3.17). Es diu que formen una algebra.

La diferencia crucial entre l’estudi de les aplicacions lineals d’un espaiE a un altre espai F i el dels endomorfismes de E en si mateix prove d’unconveni que es fa a l’hora de treballar amb la matriu de l’aplicacio lineal:

Convencio 5.2. Sigui f : E → E un endomorfisme d’un espai vectorial E dedimensio finita. Quan triem bases de E per obtenir la matriu de f , sempretriarem la mateixa base de sortida i d’arribada. Anomenarem a la matriuresultant la matriu de f en la base triada.

Aixı podem buscar la matriu d’una aplicacio f : R3 → R3 en basecanonica de sortida i d’arribada, pero queda ”prohibit” triar una base desortida i una diferent d’arribada com hem fet per exemple per fer la descom-posicio pel rang (cor. 3.48).

81

Page 82: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

82 CAPITOL 5. DIAGONALITZACIO

Com veurem en les seguents seccions del tema, el conveni d’usar la mateixabase de sortida i d’arribada fa que la matriu de la composicio d’endomor-fismes sigui el producte de matrius, facilitant els calculs a l’hora de composarendomorfismes i estudiar la seva estructura. La primera consequencia es comvan els canvis de base per endomorfismes:

Proposicio 5.3. Sigui f : E → E un endomorfisme, i e1, . . . , en, u1, . . . , un

dues bases de E. Aleshores les matrius de f en aquestes bases compleixen larelacio

M ee (f) = Cu

e Muu (f)(Cu

e )−1

on Cue es la matriu de canvi de base u1, . . . , un a e1, . . . en.

Demostracio. Aquest enunciat es simplement un cas particular del canvi debase general per aplicacions lineals (Prop. 3.26), que diu que

M ee (f) = Cu

e Muu (f)Ce

u

i la relacio entre el canvi de base Cue i el seu canvi invers Ce

u = (Cue )−1.

La propietat que tenen les matrius d’un endomorfisme en diferents basesrep un nom:

Definicio 5.4. Diem que dues matrius quadrades A, B ∈ Mn×n(R) son con-jugades si existeix una matriu inversible S tal que

B = SAS−1

Aquesta propietat ens permet parlar del determinant d’una aplicacio lin-eal:

Lema 5.5. Les matrius conjugades tenen el mateix determinant.

Demostracio. Si B = SAS−1, tenim

det B = det S det A det(S−1) = det S det A1

det S= det A

Definicio 5.6. Sigui E un espai vectorial de dimensio finita. El determinantd’un endomorfisme f : E → E es

det f = det M ee (f)

per qualsevol base e1, . . . , en de E.

Page 83: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.1. ENDOMORFISMES 83

El lema 5.5 diu que la nostra definicio de det f no depen de quina baseescollim.

Com el determinant d’un endomorfisme es el de la seva matriu un cophem fixat una base, conserva moltes propietats dels determinants de matrius.Les que ens interessen son:

Proposicio 5.7. Siguin E un espai vectorial de dimensio finita i f, g : E →E endomorfismes.

(i) det f ◦ g = det f det g

(ii) det Id = 1

(iii) f es inversible si i nomes si det f 6= 0. En aquest cas det(f−1) = 1det f

.

La demostracio d’aquesta proposicio es deixa pel lector perque nomes calfixar una base e1, . . . , en de E i aplicar les propietats conegudes del determi-nant (Tma. 4.8).

Exemple 5.8. Sigui f : R2[t] → R2[t] l’endomorfisme donat per f(p(t)) =p(1) + p′(t)(t− 1). Fixem la base u1 = 1, u2 = t, u3 = t2 de l’espai R2[t]. Lesimatges de la base son

f(1) = 1

f(t) = 1 + (t− 1) = t

f(t2) = 1 + 2t(t− 1) = 1− 2t + 2t2

Per tant la matriu de f en aquesta base es

Muu (f) =

1 0 10 1 −20 0 2

i es te det f = det Mu

u (f) = 2.

L’estudi practic dels endomorfismes planteja el seguent problema fona-mental: donat un endomorfisme f : E → E, quina base de E hem de triarper a que la matriu de f sigui la mes senzilla possible? En termes de ma-trius dirıem: si f te matriu A en certa base, quina es la matriu mes senzillapossible que sigui conjugada a A? En el cas d’aplicacions lineals qualsevolsla descomposicio pel rang (cor. 3.48) respon aquesta pregunta. Pels endo-morfismes la questio es fa mes complicada al haver de mantenir la mateixabase de sortida i d’arribada. Per a simplificar la matriu de f necessitaremestudiar els seus valors i vectors propis.

Page 84: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

84 CAPITOL 5. DIAGONALITZACIO

5.2 Subespais invariants, valors i vectors propis

Definicio 5.9. Sigui f : E → E un endomorfisme. Diem que un subespaiF ⊂ E es invariant per f si f(F ) ⊆ F .

Notem que una definicio equivalent es demanar que F ⊆ f−1(F ). Comja va apareixer en el capıtol 3 en cas de trobar un subespai invariant podemdefinir la restriccio de f a aquest subespai com l’endomorfisme

fF : F −→ F

v 7−→ f(v)

Els subespais invariants permeten simplificar la matriu de l’aplicacio lin-eal:

Lema 5.10. Sigui f : E → E un endomorfisme d’un e.v. de dimensio finita,i F ⊂ E un subespai invariant per f . Si triem una base u1, . . . , un de E demanera que u1, . . . , uk sigui una base de F , la matriu de f en aquesta basete la forma

Muu (f) =

(A B0 D

)on A es la matriu de la restriccio fF en la base u1, . . . , uk.

Demostracio. La matriu de f en base u1, . . . , un te per columnes les imatgesf(u1), . . . , f(un) expressades en base u1, . . . , un.

Com hem triat la base de E prenent una base de F u1, . . . , uk i ampliant–la a una base de l’espai total, els vectors de F son aquells de la forma v =α1u1 + · · ·+ αkuk, es a dir els que tenen component 0 en uk+1, . . . , un.

Com el subespai F es invariant, els vectors f(u1), . . . , f(uk) tornen a serde F i per tant tenen component 0 en uk+1, . . . , un, es a dir que son de laforma

f(u1) = α11u1 + α2

1u2 + · · ·+ αk1uk

f(u2) = α12u1 + α2

2u2 + · · ·+ αk2uk

. . .

f(uk) = α1ku1 + α2

ku2 + · · ·+ αkkuk

Per tant la matriu de la restriccio fF en aquesta base es

A =

α1

1 α12 . . . α1

k

α21 α2

2 . . . α2k

. . .αk

1 αk2 . . . αk

k

Page 85: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.2. SUBESPAIS INVARIANTS, VALORS I VECTORS PROPIS 85

Ara be, la descomposicio que hem trobat per f(u1), . . . , f(uk) es tambe laque tenen com a vectors de E en base u1, . . . , un. Per tant la matriu de f enla base u1, . . . , un te en les primeres k columnes la matriu A continuada perun bloc de (n − k) × k zeros a sota. En les darreres n − k columnes podenapareixer coeficients qualsevols formant els blocs k×(n−k) B i (n−k)×(n−k)D.

Exemple 5.11. Sigui f : R3 → R3 l’endomorfisme que en la base canonica tematriu

M =

5 3 −60 2 04 4 −5

Podem comprovar que el subespai F = [(0, 3, 2), (3, 3, 4)] es invariant perf : en efecte, si calculem les imatges dels dos generadors u1 = (0, 3, 2), u2 =(3, 3, 4) de F obtenim

f(u1) = (−3, 6, 2) = 3u1 − u2

f(u2) = (0, 6, 4) = 2u1

Aixı la matriu de la restriccio fF en base u1, u2 es

A =

(3 2−1 0

)

Ara podem completar la base u1, u2 de F a una base de R3 afegint u3 =e3 = (0, 0, 1). Per a coneixer la matriu de f en aquesta base nomes enscal expressar f(u3) = (−6, 0,−5) com a combinacio lineal de u1, u2, u3. Siresolem el sistema lineal constatem que f(u3) = 2u1 − 2u2 − u3. Per tant lamatriu de f en la base u1, u2, u3 es

Muu (f) =

3 2 2−1 0 −20 0 −1

Es pot apreciar la forma triangular per blocs d’aquesta matriu: la caixa 2×2de dalt a l’esquerra es la matriu A de la restriccio fF en base u1, u2, i la caixa1× 2 sota A es zero.

Exercici 10. Trobar els valors de a, b ∈ R pels que l’endomorfisme f : R3 →R3 que en base canonica te matriu 2 0 1

−1 1 ab −1 2

Page 86: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

86 CAPITOL 5. DIAGONALITZACIO

deixa invariant el subespai F = {(x, y, z) |x + 3y + 2z = 0}.Solucio: La solucio unica es a = −13

9, b = 2

3.

Per a buscar subespais invariants conve comencar pels mes senzills (de-spres de l’exemple trivial {0}:

Lema 5.12. Un subespai de dimensio 1 F es invariant si i nomes si existeixun escalar λ tal que f(v) = λv per tot v ∈ F .

Demostracio. Com F te dimensio 1 esta generat per un sol vector u, i totvector de F es un multiple v = αu per α ∈ R.

Si F es invariant per f , aixo vol dir que f(u) ∈ F , per tant la imatge deu es un multiple f(u) = λu.

Com f es lineal, si f(u) = λu tenim per tot v = αu ∈ F que

f(v) = f(αu) = αf(u) = αλu = λ(αu) = λv

Aixı si F = [u] es invariant tot vector seu queda multiplicat per λ en aplicar–lif .

Recıprocament, si f(v) = λv per tot v ∈ F , com λv ∈ F el subespai F esinvariant.

Definicio 5.13. Sigui f : E → E un endomorfisme.

- Un vector propi (o VEP) de f es un vector u 6= 0 tal que f(u) = λuper algun escalar λ.

- Un valor propi (o VAP) de f es un escalar λ tal que per algun vectoru 6= 0 es te f(u) = λu.

Diem que un vector propi es de valor propi λ quan f(v) = λv. Pel lema5.12 buscar valors i vectors propis es buscar subespais invariants de dimensio1. Comencarem pels valors propis.

Lema 5.14. Sigui f : E → E un endomorfisme. Aleshores:

(i) Un vector v ∈ E es vector propi de valor propi λ si i nomes si v ∈ker(f − λId).

(ii) Un escalar λ es valor propi de f si i nomes si ker(f − λId) 6= {0}.

Demostracio. Que v sigui vector propi de f de valor propi λ vol dir que v 6= 0i f(v) = λv. Aixo darrer equival a que (f − λId)(v) = f(v)− λv = 0.

Per tant ser vector propi de valor propi λ equival a ser del nucli de f−λId,i un escalar λ te vectors propis si i nomes si aquest nucli no es {0}.

Page 87: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.2. SUBESPAIS INVARIANTS, VALORS I VECTORS PROPIS 87

Notacio 5.15. El subespai vectorial dels vectors propis de valor propi λ,ker(f − λId) rep el nom de subespai propi de λ per f : E → E, i a veg-ades es denota Eλ.

Definicio 5.16. Sigui f : E → E un endomorfisme d’un e.v. E de dimensiofinita. El polinomi caracterıstic de f es

cf (t) = det(f − tId)

Observacio 5.17. Si A es la matriu de f en una base qualsevol u1, . . . , un de E,el polinomi caracterıstic de f es det(A− tId). Aixo es deu a que la matriu de

l’endomorfisme tId es

t . . . 0...

. . ....

0 . . . t

en qualsevol base, i per tant si f te matriu

A en la base u1, . . . , un, f − tId te matriu A − tId. A vegades anomenempolinomi caracterıstic d’una matriu quadrada A a cA(t) = det(A − tId), esel polinomi caracterıstic de l’endomorfisme que tingui matriu A en una basequalsevol.

Si ajuntem el lema 5.14 i el corol·lari 4.12 tenim:

Corol·lari 5.18. Sigui f : E → E un endomorfisme. Un escalar λ es valorpropi de f si i nomes si es un zero del seu polinomi caracterıstic.

Ara ja estem en condicions de calcular els valors i vectors propis d’unendomorfisme a partir de la seva matriu sempre que puguem factoritzar elseu polinomi caracterıstic.

Exemple 5.19. Busquem els valors i vectors propis de l’endomorfisme f :R3 → R3 que en base canonica te matriu

A =

5 3 −60 2 04 4 −5

Comencem calculant el polinomi caracterıstic:

cf (t) =

∣∣∣∣∣∣∣5− t 3 −6

0 2− t 04 4 −5− t

∣∣∣∣∣∣∣ = (−1)2+2(2−t)

∣∣∣∣∣5− t −64 −5− t

∣∣∣∣∣ = (2−t)(t2−1)

Els valors propis son els zeros de cf (t): λ = −1, 1, 2. Busquem ara vectorspropis per cada valor propi.

Page 88: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

88 CAPITOL 5. DIAGONALITZACIO

λ = −1. El subespai de vectors propis ker(f + Id) es el nucli de la matriu

A + Id =

6 3 −60 3 04 4 −4

Aquest nucli es [(1, 0, 1)]. Per a comprovar la correccio del calcul, nomes calveure que en efecte f(1, 0, 1) = (−1, 0,−1).λ = 1. El subespai de vectors propis ker(f − Id) es el nucli de

A− Id =

4 3 −60 1 04 4 −6

Aquest nucil es ker(f − Id) = [(3, 0, 2)].λ = 2. ker(f − 2Id) es el nucli de

A− 2Id =

3 3 −60 0 04 4 −7

i te base (1,−1, 0).

Aquests son tots els valors i vectors propis de f .

Exemple 5.20. Sigui g : R2 → R2 l’endomorfisme que en base canonica tematriu

B =

(−3 4−9 9

)Li buscarem els valors i vectors propis. Comencem per calcular el polinomicaracterıstic:

cg(t) =

∣∣∣∣∣−3− t 4−9 9− t

∣∣∣∣∣ = t2 − 6t + 9

Aquest polinomi te un unic zero doble λ = 3. Aquest es doncs l’unic valorpropi de g.

Busquem ara els vectors propis: La matriu B − 3Id es(−6 4−9 6

)

El seu nucli es el subespai [(2, 3)]. Aquest es l’unic subespai de vectors propisde g.

Per a discutir quins endomorfismes diagonalitzen, definirem un parell demultiplicitats per cada valor propi:

Page 89: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.2. SUBESPAIS INVARIANTS, VALORS I VECTORS PROPIS 89

Definicio 5.21. Sigui f : E → E un endomorfisme, i λ un valor propi de f .Aleshores:

(i) La multiplicitat algebraica de λ, denotada ma(λ), es la seva multiplicitatcom a zero del polinomi caracterıstic.

(ii) La multiplicitat geometrica de λ es la dimensio del seu subespai devectors propis

mg(λ) = dim ker(f − λId)

Hi ha una relacio entre aquestes multiplicitats:

Lema 5.22. Sigui f : E → E un endomorfisme i λ un valor propi de f . Lesdues multiplicitats de λ compleixen

1 ≤ mg(λ) ≤ ma(λ)

Demostracio. Per definicio, tot valor propi λ ha de tenir algun vector propiu 6= 0, per tant mg(λ) ≥ 1. Comprovem ara que la multiplicitat algebraicasempre es mes gran o igual que la geometrica.

Sigui k = mg(λ) = dim ker(f − λId). Prenem una base u1, . . . , uk delsubespai propi ker(f −λId), i l’ampliem fins a obtenir una base u1, . . . , un detot E. Ara busquem la matriu de f en aquesta base: com els primers vectorsels hem triat propis de valor propi λ tenim

f(u1) = λu1 , f(u2) = λu2 , . . . f(uk) = λuk

Dels demes vectors uk+1, . . . un no en podem dir gairebe res, pero tenim lesk primeres columnes de la matriu:

Muu (f) =

λ 0 0 . . .

0. . . . . .

... λ . . .0 0 . . .

Ara calculem el polinomi caracterıstic en aquesta base

cf (t) = det(Muu (f)− tId) =

∣∣∣∣∣∣∣∣∣∣∣

λ− t 0 0 . . .

0. . . . . .

... λ− t . . .0 0 . . .

∣∣∣∣∣∣∣∣∣∣∣

Page 90: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

90 CAPITOL 5. DIAGONALITZACIO

Podem desenvolupar aquest determinant succesivament per la primera, seg-ona, . . . k–essima columna, i cada vegada surt un factor (λ− t). El resultatdel proces es

cf (t) = (λ− t)kq(t)

on q(t) es el determinant de la caixa (n−k)×(n−k) de la cantonada inferiordreta. Aixı al polinomi caracterıstic cf (t) li hem trobat k factors (λ− t), pertant arribem a una desigualtat ma(λ) ≥ k = mg(λ), amb igualtat o no segonssi λ es tambe zero de q(t).

Ara podem presentar la idea central del tema:

Definicio 5.23. Sigui f : E → E un endomorfisme. Diagonalitzar f estrobar una base u1, . . . , un de E formada per vectors propis de f . La matriuD de f en aquesta base es una forma diagonal de f .

Exemple 5.24. Hem vist que l’aplicacio f : R3 → R3 de l’exemple 5.19 tevalors propis −1, 1, 2, i per cada valor propi un subespai de vectors propisker(f+Id) = [(1, 0, 1)], ker(f−Id) = [(3, 0, 2)], ker(f−2Id) = [(1,−1, 0)]. Elstres generadors u1, u2, u3 d’aquests subespais son l.i. (comprovar–ho directa-ment o aplicar el lema 5.26). Per tant formen una base de vectors propis, if diagonalitza. Com f(u1) = −u1, f(u2) = u2, f(u3) = 2u3 la matriu de fen aquesta base es

D = Muu (f) =

−1 0 00 1 00 0 2

La relacio entre la matriu A de f en base canonica i la forma diagonal D esque son conjugades: podem pasar d’una a l’altra per la formula del canvi debase:

A = Cue D(Cu

e )−1

on Cue =

1 3 10 0 −11 2 0

es la matriu de canvi de la base de vectors propis

u1, u2, u3 a la base canonica.

Exemple 5.25. En canvi, l’aplicacio g : R2 → R2 de l’exemple 5.20 no diago-nalitza, ja que com l’unic subespai de vectors propis te dimensio 1 no podemformar una base de R2 amb ells.

Veurem que la forma diagonal d’un endomorfisme es unica llevat de l’ordreen que ordenem els valors propis en la diagonal. Aquesta es la matriu messenzilla que pot tenir un endomorfisme, i es molt util de cara a les aplicacionsde l’algebra lineal. Ara caracterizarem quan un endomorfisme diagonalitza, i

Page 91: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.2. SUBESPAIS INVARIANTS, VALORS I VECTORS PROPIS 91

per fer–ho necessitem una propietat important dels subespais propis ker(f −λId):

Lema 5.26. Sigui f : E → E un endomorfisme, i λ1, . . . , λk valors propisdiferents de f . Aleshores, la suma dels subespais propis ker(f−λ1Id), . . . , ker(f−λkId) es directa.

Demostracio. Probarem el lema per induccio sobre el nombre k de valorspropis.

Per k = 1 el lema es cert, ja que nomes hi ha un subespai.(Hipotesi d’induccio) Suposem ara que el lema es cert per k − 1, es a dir

que si λ1, . . . , λk−1 son valors propis diferents de f , la suma dels subespaispropis ker(f−λ1Id), . . . ker(f−λk−1Id) es directa. Volem veure que aleshoresel lema tambe es cert per k.

Per k ≥ 1, la suma de k subespais e directa quan un vector no nul dequalsevol d’ells no es combinacio lineal de vectors dels altres k − 1. Equiva-lentment, la suma de k subespais es directa si al prendre k vectors no nuls,un de cada subespai, el conjunt obtingut es sempre linealment independent.Usarem aquesta darrera caracteritzacio.

Siguin vectors propis u1 ∈ ker(f − λ1Id), . . . , uk ∈ ker(f − λkId), tots ellsno nuls. Volem trobar els escalars αi pels que

α1u1 + · · ·+ αkuk = 0

Si apliquem f als dos costats i usem que cada vector ui es propi obtenim

λ1α1u1 + · · ·+ λkαkuk = 0

Si a la segona igualtat li restem λk vegades la primera, tenim

(λ1 − λk)α1u1 + · · ·+ (λk−1 − λk)αk−1uk−1 = 0

Ara be, hem partit de la hipotesi de que la suma de ker(f−λ1Id), . . . , ker(f−λk−1Id) es directa, per tant en la darrera igualtat els escalars que multipliquena u1, . . . , uk−1 son tots zero. Com λk 6= λ1, . . . , λk−1, cada igualtat (λi −λk)αi = 0 implica que αi = 0, per i = 1, . . . , k − 1. Aleshores la combinacioinicial queda en la forma

αkuk = 0

Pero uk 6= 0, per tant tambe αk = 0. La unica combinacio de u1, . . . , uk quedona el vector zero es la trivial, els vectors son l.i., i per tant el lema es certper k.

Amb aixo hem completat la proba per tot k: Hem vist que si el lema escert pel nombre anterior k− 1 tambe ho es per k. Aixı, el lema es cert per 2perque es cert per l’anterior natural 1, es cert per 3 perque acabem de veureque ho es per 2, i aixı succesivament podem arribar a qualsevol natural.

Page 92: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

92 CAPITOL 5. DIAGONALITZACIO

Ara ja tenim totes les propietats per a caracteritzar quins endomorfismesdiagonalitzen. Previsiblement, la condicio que han de complir resulta ser quetinguin suficients valors i vectors propis:

Teorema 5.27. Un endomorfisme f : E → E, amb dim E = n < ∞,diagonalitza si i nomes si compleix les dues seguents condicions:

(i) (Suficients valors propis) El polinomi caracterıstic de f te n = dim Ezeros, comptats amb multiplicitat.

(ii) (Suficients vectors propis) Per cada valor propi, la dimensio del seusubespai de vectors propis es igual a la seva multiplicitat com a zero delpolinomi caracterıstic.

Naturalment, la condicio de tenir suficients VEPs es la igualtat de mul-tiplicitats ma(λ) = mg(λ) per tot valor propi λ.

Observem tambe que el polinomi caracterıstic te grau n = dim E, pertant demanar–li que tingui n zeros equival a demanar que descomposi enfactors de grau 1.

Demostracio. Si f diagonalitza, aixo vol dir que existeix una base u1, . . . , un

de E formada per vectors propis de f , es a dir, tal que la matriu de f enaquesta base es diagonal

D = Muu (f) =

λ1

. . .

λ2

. . .

Calculem el polinomi caracterıstic de f en aquesta base: surt

cf (t) = (λ1 − t)m1(λ2 − t)m2 . . . (λk − t)mk

on m1, . . . ,mk son els nombres de vectors propis de cada valor propi queapareixen en la base u1, . . . , un. Aixı, el polinomi caracterıstic descomposaen factors de grau u. Notem tambe que per cada valor propi λi la sevamultiplicitat algebraica es mi com acabem de veure, i la geometrica es tambemi, ja que han aparegut mi vectors propis per λi l.i. en la base u1, . . . , un, iel subespai ker(f − λiId) no pot tenir dimensio mes gran pel lema 5.26. Pertant f satisfa les dues condicions de tenir suficients valors i vectors propis.

Recıprocament, sigui f : E → E endomorfisme que satisfa les condicionsde l’enunciat. Per la condicio (i) (suficients VAPs), el polinomi caracterısticde f factoritza com

cf (t) = (λ1 − t)m1 . . . (λk − t)mk

Page 93: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.2. SUBESPAIS INVARIANTS, VALORS I VECTORS PROPIS 93

i les multiplicitats algebraiques m1, . . . ,mk dels valors propis sumen n =dim E. La condicio (ii) (suficients VEPs) diu que les dimensions dels sube-spais propis son dim ker(f − λ1Id) = m1, . . . dim ker(f − λkId) = mk. Arabe, la suma dels subespais propis dels diferents valors propis es directa (lema5.26), per tant

dim ker(f − λ1Id)⊕ · · · ⊕ ker(f − λkId) =

dim ker(f − λ1Id) + · · ·+ dim ker(f − λkId) =

m1 + · · ·+ mk = n = dim E

Per tant ker(f − λ1Id) ⊕ · · · ⊕ ker(f − λkId) = E, i hi ha una base de Eformada per vectors propis de f .

Hi ha un cas molt comu en el que es encara mes simple comprovar ladiagonalitzacio:

Corol·lari 5.28. Sigui f : E → E endomorfisme tal que el seu polinomicaracterıstic te n = dim E zeros i tots son simples. Aleshores f diagonalitza.

Demostracio. Com el polinomi caracterıstic te n = dim E zeros, f compleixla primera condicio de tenir suficients valors propis. Com tots els valorspropis son zeros simples, la desigualtat entre les multiplicitats algebraica igeometrica del lema 5.22 diu que per cada valor propi es te

1 ≤ mg(λ) ≤ ma(λ) = 1

Per tant les multiplicitats algebraica i geometrica son 1 per cada valor propi,i f diagonalitza.

Exemple 5.29. Diagonalitzarem, si es posible, l’endomorfisme f : R3 → R3

que en base canonica te matriu

A =

1 2 −2−4 8 −4−3 4 0

Comencem calculant el polinomi caracterıstic:

cf (t) =

∣∣∣∣∣∣∣1− t 2 −2−4 8− t −4−3 4 −t

∣∣∣∣∣∣∣ = (1− t)(8− t)(−t) + 24 + 32 + 16(1− t) + 8(−t)− 6(8− t)

= −t3 + 9t2 − 26t + 24

Page 94: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

94 CAPITOL 5. DIAGONALITZACIO

Busquem ara els valors propis: no hem vist en aquest curs cap manera sis-tematica de trobar els zeros de polinomis de grau mes gran que dos, perosabem que si cf (t) te zeros racionals han de ser enters divisors de 24, aixı quepodem fer proves per Ruffini i un cop hem identificat un dels zeros resoldrel’equacio quadratica resultant. La solucio es

cf (t) = (2− t)(3− t)(4− t)

Han sortit tres valors propis simples (mult. algebraica 1). Pel corol·lari 5.28f diagonalitza. Una forma diagonal de f sera la matriu

D =

2 0 00 3 00 0 4

Busquem ara una base de vectors propis en la que f tingui matriu D.λ = 2. Els vectors propis de valor propi 2 son els del nucli de

A− 2Id =

−1 2 −2−4 6 −4−3 4 −2

Resolvent el sistema del nucli veiem que el subespai ker(f − 2Id) te baseu1 = (2, 2, 1).λ = 3. Els vectors propis d’aquest valor propi son els del nucli de

A− 3Id =

−2 2 −2−4 5 −4−3 4 −3

Resolvent el sistema del nucli veiem que el subespai ker(f − 3Id) te baseu2 = (1, 0,−1).λ = 4. Els vectors propis de valor propi 4 son els del nucli de

A− 4Id =

−3 2 −2−4 4 −4−3 4 −4

Resolvent el sistema del nucli veiem que el subespai ker(f − 4Id) te baseu3 = (0, 1, 1).

Aixı, la matriu de f en la base u1, u2, u3 es la matriu D indicada abans(hem calculat els vectors propis en el mateix ordre que els valors propis

Page 95: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.2. SUBESPAIS INVARIANTS, VALORS I VECTORS PROPIS 95

apareixen a la diagonal de D). La relacio entre la matriu A en base canonicai la forma diagonal D ve donada per la formula del canvi de base:

A = SDS−1

on S = Cue =

2 1 02 0 11 −1 1

.

Exemple 5.30. Estudiem si diagonalitza l’endomorfisme r : R2 → R2 que enbase canonica te matriu

A =

(cos θ − sin θsin θ cos θ

)

amb θ ∈ (0, π2) (es la rotacio d’angle θ).

El polinomi caracterıstic es

cr(t) =

∣∣∣∣∣cos θ − t − sin θsin θ cos θ − t

∣∣∣∣∣ = t2 − 2 cos θt + 1

Els zeros d’aquest polinomi son cos θ + i sin θ, cos θ− i sin θ. Com 0 < θ < π2,

r no te valors propis reals i no diagonalitza com a endomorfisme de R2 pertenir insuficents valors propis.

En aquest cas podem fer una cosa que ens donara totes les aplicacionsde les formes diagonals: podem pensar r com un endomorfisme de C2 que tematriu real A en base canonica. Diem que hem estes r a coeficients complexes.Ara els escalars poden ser complexes, aixı el polinomi caracterıstic te doszeros simples, i r diagonalitza pel corol·lari 5.28. La forma diagonal sera

D =

(cos θ + i sin θ 0

0 cos θ − i sin θ

)

Per trobar els vectors propis podem resoldre el sistema lineal del nucli de lamateixa manera que ho feiem a coeficients reals:λ = cos θ + i sin θ. El subespai de vectors propis es el nucli de la matriu

A− (cos θ + i sin θ)Id =

(−i sin θ − sin θsin θ −i sin θ

)

Resolvem el sistema del nucli:(−i sin θ − sin θsin θ −i sin θ

∣∣∣∣∣00)∼(−i −11 −i

∣∣∣∣∣00)∼(−i −10 0

∣∣∣∣∣00)

Page 96: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

96 CAPITOL 5. DIAGONALITZACIO

(primer hem dividit les equacions per sin θ, despres hem restat a la segonai per la primera). La solucio es x = iy, y ∈ C parametre. Per tant ker(r −(cos θ + i sin θ)Id) = [(i, 1)].λ = cos θ− i sin θ. En aquest cas ens podem estalviar els calculs per una raosenzilla:

Lema 5.31. Si un endomorfisme f : Cn → Cn te matriu real en base canonica,els vectors propis d’un valor propi λ seran els conjugats dels del seu valorpropi conjugat λ.

Indicacio de la prova: Si f te matriu real A, i u ∈ Cn es vector propi de valorpropi λ, conjugant tenim

Au = Au = Au = λu = λu

Per tant ker(r − (cos θ − i sin θ)Id) = [(−i, 1)].En la base u1 = (i, 1), u2 = (−i, 1) r te matriu D.

Ara mostrem un parell d’aplicacions del calcul de formes diagonals, primeren abstracte i despres en un exemple (gairebe) de la vida real.

Exemple 5.32. (calcul de potencies i d’arrels quadrades) Sigui

A =

1 2 −2−4 8 −4−3 4 0

la matriu en base canonica de l’aplicacio f : R3 → R3 de l’exemple 5.29.Calcularem A1000 i trobarem una matriu 3× 3 R tal que R2 = A.

Comencem per la potencia: per tot natural n An es la matriu de fn enbase canonica. Ara be, en la base de vectors propis u1, u2, u3 calculada en

l’exemple 5.29 f te matriu D =

2 0 00 3 00 0 4

, i fn te matriu Dn. Pel canvi de

base per endomorfismes (Prop. 5.3) la relacio entre les dues matrius es

An = M ee (fn) = Cu

e Muu (fn)(Cu

e )−1 = Cue Dn(Cu

e )−1

Ara, podem comprovar facilment (i demostrar per induccio) que2 0 00 3 00 0 4

n

=

2n 0 00 3n 00 0 4n

Page 97: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.2. SUBESPAIS INVARIANTS, VALORS I VECTORS PROPIS 97

La matriu de canvi de base Cue ha estat calculada en l’exemple 5.29, i tenim

A1000 = Cue D1000(Cu

e )−1 =

2 1 02 0 11 −1 1

21000 0 0

0 31000 00 0 41000

1 −1 1−1 2 −2−2 3 −2

Busquem ara una ”arrel quadrada”per A: una matriu R tal que R2 = A.

Com en el cas anterior de les potencies, comencem resolvent el problemaper la forma diagonal D: si busquem matrius diagonals Q tals que Q2 = Dveurem de seguida que les vuit solucions possibles son

Q =

±√

2 0 0

0 ±√

3 00 0 ±2

Triem ara una solucio Q =

2 0 0

0√

3 00 0 2

. L’endomorfisme g : R3 → R3 que

te matriu Q en la base de vectors propis u1, u2, u3 compleix g2 = f . Per tantla seva matriu R en base canonica cumplira

R2 = M ee (g2) = M e

e (f) = A

Una solucio es doncsR = Cu

e Q(Cue )−1

Exemple 5.33. Un projecte de construccio es porta a cap en una zona tropicalmolt insalubre. Per a evitar malalties mes greus, als treballadors se’ls dona labaixa medica tan bon punt mostren sımptomes lleus de febres i guarden reposfins recuperar–se per complet. Cada setmana el 30% dels treballadors enactiu reben la baixa per aquest motiu, i el 60% dels treballadors que estavende baixa reben l’alta. Siguin x, y les proporcions inicials de treballadors sansi de baixa respectivament, expressades en tant per 1. Es demana:

(i) Quines seran les proporcions de treballadors en actiu i de baixa al capde 13 setmanes? de 26? de 50?

(ii) Si a llarg termini volem tenir 3000 treballadors en actiu, quants trebal-ladors hi hem de destinar?

Si x, y son les proporcions inicials d’altes i baixes en tant per 1 (x+y = 1),les proporcions al cap d’una setmana seran

D’alta: x1 = 0.7x + 0.6y

De baixa: y1 = 0.3x + 0.4y

Page 98: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

98 CAPITOL 5. DIAGONALITZACIO

En la primera equacio, el terme 0.7x correspon al 70% de treballadors queestaven d’alta i hi continuen. L’altre terme 0.6y correspon al 60% de trebal-ladors que estaven de baixa i s’han recuperat. Aquests dos grups formen elcol·lectiu dels treballadors d’alta al cap d’una setmana. La segona equacio,per les baixes, es justifica de la mateixa manera.

Podem expressar la relacio entre les proporcions inicials i al cap d’unasetmana de manera matricial(

x1

y1

)=

(0.7 0.60.3 0.4

)(xy

)

Denotem A =

(0.7 0.60.3 0.4

). Aquesta matriu te la propietat de que quan

multiplica al vector de proporcions d’altes i baixes en un moment donatens dona la proporcio d’altes i baixes al cap d’una setmana. Per tant, simultipliquem el vector inicial (x, y) per A repetides vegades, anirem obtenintles proporcions d’altes i baixes en la setmana n–essima per tot n:(

x1

y1

)= A

(xy

)(x2

y2

)= A

(x1

y1

)= A2

(xy

)(x3

y3

)= A

(x2

y2

)= A3

(xy

). . .

Aixı, per calcular aquestes proporcions cal calcular les potencies de la matriuA. Per a fer aixo la diagonalitzarem:

Polinomi caracterıstic:

cA(t) =

∣∣∣∣∣0.7− t 0.60.3 0.4− t

∣∣∣∣∣ = t2 − 1.1t + 0.1

Valors propis: λ = 1, 0.1 simples.

Per tant A diagonalitza, i una forma diagonal es D =

(1 00 0.1

).

Vectors propis: Per λ = 1 tenim ker(A−Id) =

{(−0.3 0.60.3 −0.6

∣∣∣∣∣00)}

= [(2, 1)].

Per λ = 0.1 tenim ker(A− 0.1Id) =

{(0.6 0.60.3 0.3

∣∣∣∣∣00)}

= [(−1, 1)].

Page 99: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.3. CAYLEY–HAMILTON I FORMA DE JORDAN 99

Aixı l’aplicacio lineal que te matriu A en base canonica diagonalitza ambmatriu D en base u1 = (2, 1), u2 = (−1, 1), i la relacio entre les dues matriuses

A = Cue D(Cu

e )−1 =

(2 −11 1

)D

(13

13

−13

23

)

Les proporcions d’alta i de baixa en n setmanes son(xn

yn

)= An

(xy

)=

(2 −11 1

)(1 00 0.1n

)(13

13

−13

23

)(xy

)

Prenent n = 13, 26, 50 obtenim la resposta a (i).

Les proporcions de treballadors d’alta i de baixa a llarg termini tendiran

cap al lımit limn→∞

(xn

yn

)= lim

n→∞An

(xy

)(aquesta es la definicio de lımit!).

Calculem–lo:

limn→∞

An

(xy

)= lim

n→∞

(2 −11 1

)(1 00 0.1n

)(13

13

−13

23

)(xy

)

=

(2 −11 1

)(1 00 0

)(13

13

−13

23

)(xy

)=

(23(x + y)

13(x + y)

)=

(2313

)

(recordem que x + y = 1).

Aixı, siguin quines siguin les proporcions inicials de treballadors sans imalalts, aquestes proporcions convergiran cap a 2

3, 1

3respectivament. Es pot

comprovar amb exemples concrets que la convergencia es rapida. Si volemtenir 3000 treballadors en actiu caldra destinar–ne uns 4500 al projecte.

5.3 El teorema de Cayley–Hamilton i la for-

ma de Jordan

5.3.1 Polinomis evaluats en matrius

Una diferencia notable entre els endomorfismes d’un espai vectorial E i lesaplicacions lineals entre espais vectorials es que podem composar els endo-morfismes entre ells i continuen sent endomorfismes de E, es a dir, tenim unproducte f ◦ g definit en l’espai vectorial dels endomorfismes de E. Si fixemuna base de E, aquest producte d’endomorfismes correspon a la multiplicaciode matrius. No tractarem les propietats d’aquest producte en general, peron’hi ha que ens interessen:

Page 100: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

100 CAPITOL 5. DIAGONALITZACIO

Definicio 5.34. Sigui f : E → E un endomorfisme, i p(t) = antn + · · · +

a1t + a0 ∈ R[t] un polinomi. El polinomi p(t) avaluat en f es l’endomorfismede E

p(f) = anfn + · · ·+ a1f + a0Id

on fk(v) = f◦ k. . . ◦f(v).

L’avaluacio de polinomis en endomorfismes te algunes propietats de com-provacio immediata:

Proposicio 5.35. Sigui f : E → E un endomorfisme, i p(t) = amtm + · · ·+a1t + a0, q(t) ∈ R[t]. Aleshores

(i) (p + q)(f) = p(f) + q(f).

(ii) (p · q)(f) = p(f) ◦ q(f).

(iii) Si f te matriu A en una base e1, . . . , en, p(f) te matriu

p(A) = anAn + · · ·+ a1A + a0Id

Exemple 5.36. Si A =

(2 11 −1

)i p(t) = t2 − 2t + 4,

p(A) = A2 − 2A + 4Id =

(5 11 2

)− 2

(2 11 −1

)+ 4

(1 00 1

)=

(5 −1−1 8

)

Per a estudiar els polinomis de R[t] cal mirar–los els zeros, reals o com-plexes. Ara ens trobem amb una situacio inversa: fixat un endomorfisme f ,mirar quins polinomis compleixen p(f) = 0 dona informacio sobre f :

Lema 5.37. Sigui p(t) un polinomi de R[t], i f un endomorfisme. Si p(f) =0, tots els valors propis de f han de ser zeros de p(t).

Demostracio. Sigui λ un valor propi de f , i u ∈ E un vector propi no nul devalor propi λ. Sabem que p(f) = 0, per tant

p(f)(u) = anfn(u) + an−1f

n−1(u) + · · ·+ a1f(u) + a0u = 0

Ara be, com u es un vector propi de f tenim que f(u) = λu, f 2(u) = f(λu) =λ2u, . . . , fn(u) = f(fn−1(u)) = f(λn−1u) = λn−1λu = λnu. Es dir, comaplicar f a u es multiplicar–lo per λ, aplicar–li f k vegades es multiplicar–lok vegades per λ, i u es vector propi de cada potencia fk amb valor propi λk.Per tant la igualtat de p(f)(u) queda

p(f)(u) = anλnu + an−1λ

n−1u + · · ·+ a1λu + a0u = p(λ)u = 0

Com u 6= 0, cal que p(λ) = 0, es a dir que λ sigui un zero de p(t).

Page 101: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.3. CAYLEY–HAMILTON I FORMA DE JORDAN 101

La questio natural en aquest punt es si donat un endomorfisme f hi haalgun polinomi tal que p(f) = 0. Com les matrius n× n i els endomorfismesd’un espai de dimensio n formen un espai vectorial de dimensio n2, els en-domorfismes Id, f, f 2, . . . fn2

han de ser linealment dependents, i una relacioentre ells donara un polinomi amb p(f) = 0 de grau n2 o menys. Ara be, perla relacio entre valors propis de f i zeros de p resulta que hi ha un polinomide grau molt mes petit que tambe annula f :

Teorema 5.38. (Teorema de Cayley–Hamilton)

cf (f) = 0

Exemple 5.39. Sigui f : R2 → R2 l’endomorfisme que en base canonica te

matriu A =

(2 −11 1

). El polinomi caracterıstic es

cf (t) = t2 − 3t + 3

Comprovem si l’enunciat del teorema de Cayley–Hamilton es cert en aquestcas:

A2 − 3A + 3Id =

(3 −33 0

)− 3

(2 −11 1

)+

(3 00 3

)=

(0 00 0

)

Coneixer un polinomi que s’annuli en la matriu permet per exemple calcularla seva inversa: com A2− 3A+3Id = 0, podem aıllar Id en un costat i treurefactor comu A a l’altre

−1

3A(A− 3Id) = Id

Com la inversa es unica, aixo significa que

A−1 = −1

3(A− 3Id) =

(13

13

−13

23

)

De totes maneres, aquest metode per calcular la inversa es molt poc eficienten general.

Per a demostrar el teorema de Cayley–Hamilton necessitarem la seguentpropietat dels subespais invariants:

Lema 5.40. Sigui f : E → E un endomorfisme, i F ⊂ E un subespaiinvariant per f . Aleshores el polinomi caracterıstic de la restriccio f

|F divideix

al de f .

Page 102: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

102 CAPITOL 5. DIAGONALITZACIO

Demostracio. Com s’ha vist al lema 5.10, si prenem una base u1, . . . , uk deF i l’ampliem a una base u1, . . . , un de E, la matriu de f en aquesta base tela forma

Muu (f) =

(A B0 D

)

on A es la matriu k × k de la restriccio f|F en base u1, . . . , uk. Si li restem el

terme tId obtenim

Muu (f)− tId =

(A− tId B

0 D − tId

)

Aquesta matriu es triangular per blocs, per tant pel lema 4.15 tenim lafactoritzacio

cf (t) = det(Muu (f)− tId) = det(A− tId) det(D − tId) = c

f|F

(t)q(t)

Aixı el polinomi caracterıstic de la restriccio es un factor del de f .

Tambe necessitarem el seguent calcul de polinomis caracterıstics:

Lema 5.41. Sigui g : F → F un endomorfisme que en alguna base u1, . . . , uk

te matriu

M =

0 . . . . . . 0 −a0

1. . .

......

0. . . . . .

......

.... . . . . . 0 −ak−2

0 . . . 0 1 −ak−1

El polinomi caracterıstic de g es

cg(t) = (−1)k(tk + ak−1tk−1 + ak−2t

k−2 + · · ·+ a1t + a0)

Demostracio. Es un calcul que hom pot fer per induccio sobre k = dim F .Per k = 2 tenim

cg(t) =

∣∣∣∣∣−t −a0

1 −a1 − t

∣∣∣∣∣ = t2 + a1t + a0

(Hipotesi d’induccio) Suposem ara que el lema es cert per un natural k.Vegem que aleshores tambe es cert pel seguent natural k+1. Si desenvolupem

Page 103: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.3. CAYLEY–HAMILTON I FORMA DE JORDAN 103

el determinant per la primera columna tenim

cg(t) =

∣∣∣∣∣∣∣∣∣∣∣∣∣∣

−t . . . . . . 0 −a0

1. . .

......

0. . . . . .

......

.... . . . . . −t −ak−1

0 . . . 0 1 −ak − t

∣∣∣∣∣∣∣∣∣∣∣∣∣∣

= (−t)

∣∣∣∣∣∣∣∣∣∣∣∣∣∣

−t . . . . . . 0 −a1

1. . .

......

0. . . . . .

......

.... . . . . . −t −ak−1

0 . . . 0 1 −ak − t

∣∣∣∣∣∣∣∣∣∣∣∣∣∣−

∣∣∣∣∣∣∣∣∣∣∣∣∣∣

0 . . . . . . 0 −a0

1 −t...

0. . . . . .

......

. . . . . . −t −ak−1

0 . . . 0 1 −ak − t

∣∣∣∣∣∣∣∣∣∣∣∣∣∣Ara, per la hipotesi d’induccio el primer sumand es (−t)(−1)k(tk + akt

k−1 +ak−1t

k−2 + · · · + a2t + a1). Si desenvolupem el segon determinant per laprimera fila ens queda un coeficient (−1)k+1(−a0) multiplicant un determi-nant triangular amb uns a la diagonal. Per tant

cg(t) = (−t)(−1)k(tk + aktk−1 + ak−1t

k−2 + · · ·+ a2t + a1)− (−1)k+1(−a0)

= (−1)k+1(tk+1 + aktk + · · ·+ a1t + a0)

Es dir, si el lema es cert per un natural k tambe es cert pel seguent, k + 1.Com es cert per k = 2, aplicant succesivament aquest argument es cert pertot k.

Demostracio. (del teorema de Cayley–Hamilton)Per a provar que cf (f) = 0 n’hi ha prou amb comprovar que l’endomor-

fisme cf (f) envia tots els vectors de E a 0.Sigui v ∈ E un vector qualsevol. Identificarem un subespai F ⊂ E

invariant per f que conte a v (de fet es el mes petit, pero no necessitemaquesta propietat): com la dimensio de E es finita, en la successio de vectors

v, f(v), f2(v), . . . , fk(v), . . .

tard o d’hora algun dels vectors haura de ser combinacio lineal dels anteriors.Sigui fk(v) el primer vector on aixo passa, es a dir tal que existeixen escalarsa0, . . . , ak−1 pels que

fk(v) = −ak−1fk−1(v)− · · · − a1f(v)− a0v (5.1)

Page 104: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

104 CAPITOL 5. DIAGONALITZACIO

Aixo ens diu que al avaluar el polinomi pv(t) = tk + ak−1tk−1 + · · ·+ a1t + a0

en f obtenim pv(f)(v) = 0.Sigui ara el subespai F = [v, f(v), . . . , fk−1(v)]. Aquest subespai es in-

variant per f , ja que les imatges de tots els seus generadors tornen a pertanyera F (aixo es trivial per v, . . . , fk−2(v), i per fk−1(v) es conseqencia de (5.1)).A mes, com fk(v) era la primera potencia combinacio lineal de les anteriors,els vectors u1 = v, u2 = f(v), . . . , uk = fk−1(v) son l.i. i formen una base deF .

Busquem la matriu de la restriccio f|F en la base u1, . . . , uk: pels primers

vectors tenim

f(u1) = f(v) = u2

f(u2) = f(f(v)) = f 2(v) = u3

. . .

f(uk−1) = f(fk−2(v)) = fk−1(v)= uk

i per uk tenim per (5.1)

f(uk) = fk(v) = −a0u1 − a1u2 − · · · − ak−1uk

Aixı la matriu de f|F en aquesta base sera

0 −a0

1. . .

.... . . 0 −ak−2

0 1 −ak−1

Pel lema 5.41 el polinomi caracterıstic de f

|F es doncs c

f|F

(t) = (−1)k(tk +

ak−1tk−1 + · · ·+ a1t + a0) = (−1)kpv(t). Hem vist abans que aquest polinomi

avaluat en f dona un endomorfisme que envia el vector v a zero. Pel lema5.40 es a mes un divisor del polinomi caracterıstic cf (t). Ajuntant–ho tottenim

cf (f)(v) = q(f)((−1)kpv(f)(v)) = q(f)(0) = 0

El polinomi pv(t) pot variar amb el vector v ∈ E, pero la conclusio es que elpolinom caracterıstic cf (t) avaluat en f annula a tots els vectors v. Per tantcf (f) = 0.

El polinomi caracterıstic no te perque ser el mes senzill que s’annula enun endomorfisme f .

Page 105: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.3. CAYLEY–HAMILTON I FORMA DE JORDAN 105

Definicio 5.42. El polinomi mınim d’un endomorfisme f : E → E es elpolinomi mf (t) de grau mes petit tal que mf (f) = 0.

Justifiquem haver dit el i no un polinomi mınim:

Lema 5.43. El polinomi mınim existeix i es unic llevat de producte perescalar.

Demostracio. Ja hem vist que hi han polinomis que s’annulen en f . Com elsgraus son nombres naturals, algun ha de ser el mes petit.

Siguin p(t), d(t) dos polinomis que s’annulen en f , amb grau p = grau d.Si fem la divisio de p(t) per d(t), p(t) = q · d(t) + r(t), el reste r(t) tambes’annula en f ja que

r(f) = p(f)− q · d(f) = 0− q · 0 = 0

Aixı, si p(t), d(t) tenen grau mınim entre els polinomis que s’annulen en fl’unic reste possible per la divisio es r(t) = 0, i p(t) = qd(t), on el quocient qes una constant per questio de grau.

Exemple 5.44. L’endomorfisme f : R3 → R3 que en base canonica te matriu

D =

2 0 00 2 00 0 −1

te polinomi caracterıstic cf (t) = (2 − t)2(−1 − t), pero podem comprovarfacilment que p(t) = (2− t)(−1− t) verifica p(f) = 0. Pel lema 5.37 tot p(t)tal que p(f) = 0 ha de tenir com a zeros els valors propis −1, 2, per tant(2− t)(−1− t) es el polimomi mınim de f .

De la mateixa manera que en l’exemple anterior podem resoldre:

Exercici 11. Si un endomorfisme f : E → E diagonalitza i te valors propisλ1, . . . , λk, el seu polinomi mınim es mf (t) = (λ1 − t) . . . (λk − t).

Una altra propietat dels polinomis que annulen a endomorfismes que enssera util es la seguent:

Teorema 5.45. Sigui f : E → E un endomorfisme. Si existeix un polinomip(t) tal que annula a f i te tots els seus zeros (reals i complexes) simples,aleshores f diagonalitza (si alguns dels zeros de p(t) son complexes potserdiagonalitza en C).

Page 106: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

106 CAPITOL 5. DIAGONALITZACIO

Demostracio. Sigui p(t) = (t− λ1) . . . (t− λm) la factoritzacio del polinomi,amb els zeros λ1, . . . , λm diferents dos a dos. Demostrarem el teorema perinduccio sobre el grau m del polinomi.

Si m = 1 tenim f − λ1Id = 0, i f = λ1Id diagonalitza.Hipotesi d’induccio: Suposem que l’enunciat del teorema es cert per poli-

nomis fins grau m − 1. Vegem que aleshores tambe es cert per grau m. Hofarem en quatre pasos:1) Els subespais Im (f −λiId) son invariants per f . En efecte, si v ∈ Im (f −λiId) per definicio v = f(u) − λiu per algun u ∈ E. Aleshores f(v) =(f − λiId)(f(u)), pel que tambe f(u) ∈ Im (f − λiId).2) Im (f −λmId)∩ker(f −λmId) = 0 per tots els zeros λ1, . . . , λm. Per a queaixo sigui cert es essencial que els zeros de p(t) siguin tots diferents: siguiv ∈ Im (f − λmId) ∩ ker(f − λmId). Per ser de la imatge, v = f(u) − λmuper algun u ∈ E. Per ser del nucli, f(v) = λmv i (f − λiId)(v) = (λm − λi)vpels demes zeros λi. Ara apliquem el polinomi p(f) a aquest vector u:

p(f)(u) = (f − λ1Id) . . . (f − λmId)(u) = (f − λ1Id) . . . (f − λm−1Id)(v)

= (λm − λ1) . . . (λm − λm−1)v

Ara be, p(f)(u) = 0 perque el polinomi p(t) s’annula en f . Per tant (λm −λ1) . . . (λm − λm−1)v = 0, i com els escalars (λm − λi) no son zero cal quev = 0.3) ker(f − λmId) ⊕ Im (f − λmId) = E. La propietat 2) diu que la suma esdirecta. La dimensio de la suma directa es dim E − dim rang (f − λmId) +rang (f−λmId) = dim E (cor. 3.22). Per tant la suma es l’espai total. Notemque els dos subespais de la descomposicio son invariants per f , el primer perestar format per vectors propis i el segon per la propietat 1).

Observem que com es poden reordenar els factors del polinomi les propi-etats 2) i 3) valen per tots els zeros λ1, . . . , λm.4) Les restriccions de f als subespais invariants ker(f−λmId), Im (f−λmId)diagonalitzen. El primer subespai es per definicio el dels vectors propis devalor propi λm. Pel segon subespai es menys evident: notem que el polinomiq(t) = (t− λ1) . . . (t− λm−1) s’annula en f sobre el subespai Im (f − λmId),ja que en els seus vectors v son de la forma v = f(u)− λmu i tenim

(f − λ1Id) . . . (f − λm−1Id)(v) = p(f)(u) = 0

Per tant, com q(t) te grau m− 1 per hipotesi d’induccio f diagonalitza en elsubespai Im (f − λmId).

Ara, que f diagonalitzi en els dos subespais de la descomposicio 3) voldir que cadascun d’ells te una base formada per vectors propis de f . Reunintaquestes dues bases tenim una base de E formada per vectors propis de f ,pel que l’aplicacio diagonalitza.

Page 107: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.3. CAYLEY–HAMILTON I FORMA DE JORDAN 107

Exemple 5.46. Sigui p : E → E un endomorfisme tal que p2 = p. Podeminterpretar aquesta propietat com que el polinomi q(t) = t2 − t s’annula enp. Aixo ens proporciona molta informacio sobre p:

(i) Pel lema 5.37 els valors propis de p han d’estar entre els zeros de f :nomes poden ser 0 o 1.

(ii) Com q(t) te els zeros simples, per la proposicio 5.45 p diagonalitza.

Aixı, si fem F = ker(p−Id), G = ker p, com son els unics subespais de vectorspropis i p diagonalitza tenim

E = ker(p− Id)⊕ ker p = F ⊕G

es a dir, F i G son subespais complementaris.El subespai F es propi de valor propi 1, aixo vol dir que per u ∈ F es te

p(u) = u. El subespai G es el nucli de p. Com E = F ⊕ G, podem escriurequalsevol vector v ∈ E de manera unica com v = u + w, amb u ∈ F, w ∈ G.Al aplicar–li p tenim

p(v) = p(u + w) = p(u) + p(w) = u

Per tant, l’aplicacio p envia cada vector a la seva component en F per ladescomposicio en suma directa E = F ⊕ G. Aquest endomorfisme es laprojeccio sobre F en la direccio de G, que ja havıem vist en l’exemple 2.57.Totes les aplicacions tals que p2 = p son d’aquest tipus.

5.3.2 Forma de Jordan d’endomorfismes del pla

En la seccio anterior hem caracteritzat quan un endomorfisme diagonalitza,i hem vist que si no ho fa per tenir insuficients valors propis podem resoldreaquest problema treballant a coeficients complexes, ja que pel teorema fona-mental de l’Algebra tots els polinomis descomposen en factors de grau u enC.

L’altra causa possible de no diagonalitzacio, que algun valor propi tinguiinsuficients vectors propis, no te una solucio tan senzilla. En aquest casl’endomorfisme no diagonalitza ni en R ni en C, i la matriu mes senzillapossible per f es la forma de Jordan.

No discutirem formes de Jordan en qualsevol dimensio (estudiades en elsllibres de la bibliografia), sino que ens limitarem als endomorfismes de espaisde dimensio dos, per ser aquest un cas molt senzill pero en el que ja es veuel mecanisme de la reduccio de Jordan. Per a recalcar aquesta restriccioprendrem E = R2.

Page 108: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

108 CAPITOL 5. DIAGONALITZACIO

En primer lloc discutirem quan s’ha de calcular la forma de Jordan d’unendomorfisme f : R2 → R2. Buscant primer els valors propis i despres elsvectors propis, els possibles casos son:

(i) El polinomi caracterıstic cf (t) no te zeros reals. En aquest cas te doszeros complexes, conjugats i per tant simples. Pel corol·lari 5.28 fdiagonalitza en C.

(ii) El polinomi caracterıstic te els zeros reals. En aquest cas hi han variespossibilitats:

(a) Els dos zeros son diferents. De nou pel corol·lari 5.28 f diagonal-itza, aquest cop ja sobre R.

(b) El polinomi caracterıstic te un zero doble. Hi ha un unic valorpropi λ amb ma(λ) = 2. Com la multiplicitat geometrica ha decomplir 1 ≤ mg(λ) ≤ ma(λ) = 2, en aquest cas encara hi han duesopcions:

i. Hi ha suficients vectors propis (mg(λ) = 2). ker(f − λId) =R2, per tant f = λId (es un multiple de la identitat, hom elsdiu homotecies).

ii. No hi ha suficients vectors propis (mg(λ) = 1). f no diago-nalitza, es en aquest cas que cal calcular la forma de Jordan.

Ara vegem que es pot fer en el darrer cas:

Proposicio 5.47. Sigui f : R2 → R2 un endomorfisme tal que te un unicvalor propi λ amb ma(λ) = 2 i dim ker(f−λId) = 1. Existeix una base u1, u2

de R2 tal que en ella f te matriu

J =

(λ 01 λ

)

Anomenem a J la forma de Jordan de f , i diem que u1, u2 es una base deJordan per f .

Demostracio. Com el subespai de vectors propis no es tot R2, podem triarun primer vector u1 6∈ ker(f − λId). Un cop hem triat aquest u1, definim u2

comu2 = f(u1)− λu1

Tal com hem triat u1 ja sabem que u2 6= 0. Podem dir mes: u2 no es unmultiple de u1, ja que u2 = f(u1) − λu1 = αu1 implicaria que f(u1) =(α+λ)u1, pero λ es l’unic valor propi de f i hem triat u1 que no sigui vectorpropi. Per tant u1, u2 son base de R2.

Page 109: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

5.3. CAYLEY–HAMILTON I FORMA DE JORDAN 109

Comprovem ara que u2 ha de ser vector propi de valor propi λ. Pelteorema de Cayley–Hamilton (5.38) cf (f) = (f − λId)2 = 0. En particular

(f − λId)2(u1) = (f − λId) ◦ (f − λId)(u1) = (f − λId)(u2) = 0

Aixı les imatges de la base escollida son f(u1) = λu1 + u2, f(u2) = λu2.Per tant la matriu de f en aquesta base es

Muu (f) = J =

(λ 01 λ

)

Exemple 5.48. Tornem a l’endomorfisme de l’exemple 5.20, l’aplicacio g :R2 → R2 que en base canonica te matriu

B =

(−3 4−9 9

)

Com ja hem vist aleshores, el polinomi caracterıstic de g es

cg(t) = (3− t)2

pero mg(3) = dim ker(g − 3Id) = 1. Aquesta aplicacio te suficents valorspropis pero no te suficients vectors propis per diagonalitzar. La seva formade Jordan sera

J =

(3 01 3

)Procedim a calcular–li una base de Jordan: com a primer vector cal triar unu1 que no sigui vector propi. Algun dels vectors de la base canonica ha deservir, en cas contrari g diagonalitzaria. Triem u1 = e1 ja que

g(e1)− 3e1 = (−6,−9) 6= (0, 0)

Ara hem de prendre u2 = g(u1) − 3u1 = (−6,−9), i ja tenim la base en laque la matriu de g es J . La relacio entre les dues matrius de g es

A = Cue J(Cu

e )−1

on Cue =

(1 −60 −9

)es la matriu de canvi de base de Jordan a canonica.

La forma de Jordan d’un endomorfisme no es tan senzilla com la formadiagonal, pero es la mes simple de la que hom disposa en cas de no diagonal-itzacio. Continua sent prou senzilla per a tenir moltes de les aplicacions dela forma diagonal, com ilustra el seguent

Page 110: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

110 CAPITOL 5. DIAGONALITZACIO

Lema 5.49. Sigui J =

(λ 01 λ

)una matriu de Jordan. Aleshores:

(i) Jn =

(λn 0

nλn−1 λn

).

(ii) Dues solucions J12 per l’equacio (J

12 )2 = J son(√

λ 01

2√

λ

√λ

),

(−√

λ 0

− 12√

λ−√

λ

)

Indicacio de la prova: Les potencies de J es poden calcular per induccio sobren. Les ”arrels quadrades”poden ser comprovades aixecant–les al quadrat.

Exercici 12. Comproveu que les uniques matrius 2 × 2 X tals que sontriangulars inferiors i X2 = J son les dues de l’enunciat del lema 5.49.

Exemple 5.50. Per l’endomorfisme g dels exemples 5.20, 5.48 calcularem lapotencia g12 i buscarem h : R2 → R2 tal que h2 = g.

Imitarem el que hem fet en el cas d’una aplicacio diagonalizable (exemple5.32). Comencem per la potencia g12: en la base de Jordan u1, u2 g te matriuJ i g12 te matriu J12. Si apliquem la formula de canvi de base (Prop. 5.3)resulta que la matriu de g12 en base canonica es

B12 = Cue J12(Cu

e )−1 =

(1 −60 −9

)(312 0

12 · 311 312

)(1 −2

3

0 −19

)= 312

(−23 16−36 25

)

Ara buscarem l’arrel quadrada h. Pel lema 5.49 una solucio es l’aplicacioque en la base de Jordan u1, u2 te matriu

J12 =

(√3 0

12√

3

√3

)

En base canonica aquesta aplicacio tindra matriu

R = Cue J

12 (Cu

e )−1 =

(1 −60 −9

)(√3 0

12√

3

√3

)(1 −2

3

0 −19

)=√

3

(0 2

3

−32

2

)

Es pot comprovar en un moment que la matriu R efectivament compleix

R2 =

(−3 4−9 9

).

Page 111: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Capıtol 6

Geometria del pla i de l’espai

6.1 Varietats lineals

Definicio 6.1. Una varietat lineal de Rn es el conjunt V de solucions d’unsistema d’equacions lineals m× n Ax = b.

El sistema Ax = b es el sistema d’equacions implıcites de la varietat V .El subespai vectorial F amb equacions Ax = 0 es el subespai director de

la varietat.La dimensio de la varietat es la del seu subespai director.

Les varietats lineals son una generalitzacio a qualsevol dimensio de lesrectes (varietats de dimensio 1) i plans (varietats de dimensio 2).

Basicament hi han dues maneres de presentar una varietat lineal V :

(i) Per les seves equacions implıcites: donant el sistema Ax = 0 que te Vper solucio.

(ii) Per les seves equacions parametriques: donant un punt P ∈ V i unabase del subespai director F .

Passar de l’equacio implıcita a la parametrica es resoldre el sistema d’e-quacions. El pas contrari es pot fer per exemple trobant les equacions delsubespai F (per exemple amb el lema 2.65) i ajustant el terme independentper a que el punt P sigui solucio.

Estudiar la posicio relativa de dues varietats vol dir calcular la seva in-terseccio i comparar els seus subespais directors. Un cas particular es:

Definicio 6.2. Dues varietats V1, V2 son paral·leles quan el subespai directord’una esta contingut en el de l’altra.

La resta de la seccio son casos particulars d’aquestes idees.

111

Page 112: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

112 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

6.1.1 El pla

Definicio 6.3. L’equacio implıcita d’una recta en el pla es de la forma

ax + by = c

i l’equacio parametrica es de la forma

(x, y) = (x0, y0) + λ(α, β) λ ∈ R

amb (x0, y0) ∈ R2 un punt de la recta i ~v = (α, β) el seu vector director.Tambe escriurem l’equacio parametrica aixı

(x0, y0) + [(α, β)]

El pendent d’una recta (x0, y0) + [(α, β)] es m = βα.

Exemple 6.4. Trobem l’equacio parametrica de la recta 5x + 3y = 8:El sistema te solucions x = 8−3y

5, y ∈ R parametre. Per tant una equacio

parametrica es

(x, y) = (8

5, 0) + y(−3

5, 1) y ∈ R

o be (85, 0) + [(−3, 5)].

Equacio implıcita de {(2, 1) + [(3, 7)]}:Com els punts de la recta son de la forma (x, y) = (2, 1) + λ(3, 7) per

λ ∈ R qualsevol, despejant λ en totes dues components tenim l’equacio

x− 2

3=

y − 1

7

Exercici 13. Trobar formules tancades per l’equacio de la recta (x0, y0) +[(α, β)], i per la recta pels punts (x0, y0), (x1, y1).

6.1.2 L’espai

Definicio 6.5. L’equacio implıcita d’un pla a l’espai es de la forma

x + by + cz = d

i l’equacio parametrica es de la forma

(x, y, z) = (x0, y0, z0) + λ~u + µ~v λ, µ ∈ R

on (x0, y0, z0) es un punt del pla, i ~u,~v una base del subespai director. Tambedenotarem l’equacio parametrica de la forma (x0, y0, z0) + [~u,~v].

Page 113: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.1. VARIETATS LINEALS 113

Exemple 6.6. Calculem l’equacio parametrica del pla x− 2y − z = 3:El sistema te solucions x = 2y + z + 3, y, z ∈ R parametres. Per tant

l’equacio parametrica es

(x, y, z) = (3, 0, 0) + y(2, 1, 0) + z(1, 0, 1) = (3, 0, 0) + [(2, 1, 0), (1, 0, 1)]

Calculem l’equacio implıcita del pla Π = {(1, 1, 1) + [(2, 3, 1), (−1, 0, 7)]}:El vector normal (6.2) al pla es el producte vectorial (6.3.2)

(2, 3, 1)× (−1, 0, 7) =

∣∣∣∣∣∣∣i j k2 3 1−1 0 7

∣∣∣∣∣∣∣ = (21,−15, 3)

Per tant el subespai director F = [(2, 3, 1), (−1, 0, 7)] te equacio 21x− 15y +3z = 0, i el pla Π te equacio 21x− 15y +3z = d per algun d. Com (x, y, z) =(1, 1, 1) ha de ser solucio de l’equacio tenim 21− 15 + 3 = d, i aixı l’equacioes

21x− 15y + 3z = 9

Exercici 14. Proveu que per tres punts no alineats passa un unic pla, itrobeu una formula tancada per l’equacio implıcita del pla a partir de lescoordenades dels tres punts (x1, y1, z1), (x2, y2, z2), (x3, y3, z3).

Definicio 6.7. L’equacio implıcita d’una recta en l’espai es un sistema derang 2 {

a1x + b1y + c1z = d1

a2x + b2y + c2z = d2

i l’equacio parametrica es de la forma

(x0, y0, z0) + λ(α, β, γ) λ ∈ R

amb (x0, y0, z0) ∈ R3 un punt de la recta i ~v = (α, β, γ) el seu vector director.Tambe escriurem l’equacio parametrica aixı

(x0, y0, z0) + [(α, β, γ)]

Exemple 6.8. Calculem l’equacio parametrica de la recta{x− 3y − z = 2

2x + 4y + 6z = 5

Aquest sistema te solucio x = 2310− 7

5z, y = 1

10− 4

5z, z ∈ R parametre. Per

tant l’equacio parametrica es

(x, y, z) = (23

10,

1

10, 0) + z(−7

5,−4

5, 1) z ∈ R

Page 114: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

114 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Busquem ara l’equacio implıcita de la recta (2, 1, 1)+[(3,−1, 1)]. Com unpunt de la recta si i nomes si es de la forma (x, y, z) = (2, 1, 1) + λ(3,−1, 1)per algun λ ∈ R, despejant λ de les tres components del vector i igualant lestres expressions obtingudes arribem a l’anomenada equacio contınua

x− 2

3=

y − 1

−1=

z − 1

1

Un parell qualsevol d’aquestes igualtats son un sistema d’equacions implıcitesper la recta.

El calcul que acabem de fer de l’equacio implıcita funciona clarament perqualsevol recta tal que les components del vector director son diferents dezero. Si alguna es zero el procediment es simplifica:

Exemple 6.9. Trobem l’equacio implıcita de la recta (3,−1, 1) + [(4, 0, 6)]:El vector director te segona component zero, pel que tots els punts de la

recta tenen y = −1. Si a mes repetim la deduccio de λ i igualacio com al’exemple anterior arribem al sistema{

y = −1x−3

4= z−1

6

Exercici 15. Poseu–vos un exemple de recta en forma parametrica ambdues components del vector director zero i calculeu la seva equacio implıcita.Pot tenir el vector director les tres components nul·les?

Exercici 16. Doneu una formula tancada per l’equacio implıcita d’una rectaa l’espai que passa pels punts (x0, y0, z0), (x1, y1, z1). Si conve tracteu apartels casos en que una o dues components dels punts coincideixen.

6.1.3 Canvis de referencia

En un espai vectorial E el vector zero es un vector especial, amb moltespropietats com ara pertanyer a tots els subespais o mantenir–se fix per endo-morfismes. Per aixo es l’origen canonic de l’espai i tots els seus subespais, iun sistema de referencia per posar coordenades als vectors consisteix en triaruna base e1, . . . , en de E.

Quan fem geometria en el mon real no hi ha cap origen privilegiat (nitan sols l’observatori de Greenwich!), i es mes convenient poder triar el puntorigen a partir del qual posem les nostres coordenades.

Definicio 6.10. Un sistema de referencia afı de Rn es el conjunt format perun punt P ∈ Rn (l’origen) i una base u1, . . . , un de Rn (els eixos).

Page 115: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.1. VARIETATS LINEALS 115

Exemple 6.11. El sistema de referencia canonic de Rn te origen en el (0, . . . , 0)i eixos la base canonica e1, . . . , en.

Definicio 6.12. Les coordenades d’un punt Q ∈ Rn en un sistema de re-

ferencia {O, e1, . . . , en} son les components del vector−→OQ en la base e1, . . . , en.

La Geometria Afı estudia la transformacio de les propietats de l’espaisota aquests canvis de referencia. Aquests canvis son utils en la practica:sovint en un problema fısic els calculs es simplifiquen prenent una referenciaadaptada al problema (que el centre de masses sigui l’origen i l’eix de rotacioun dels eixos, . . . ). Un cop calculades posicions de punts o equacions devarietats en la referencia adaptada cal pasar–les a la original. Aquest canviconsisteix en un canvi de base seguit d’una translacio:

Lema 6.13. Siguin e = {O, e1, . . . , en}, u = {P, u1, . . . , un} dues referenciesafins de Rn. Aleshores, si Q ∈ Rn te coordenades (α1, . . . , αn) en la referenciae, les seves coordenades en la referencia u son

β1...

βn

= Ceu

α1...

αn

+

b1...bn

on Ce

u es la matriu de canvi de base e1, . . . , en a u1, . . . , un i (b1, . . . , bn) son

les components del vector−→PO en la nova base u1, . . . , un.

Demostracio. Que Q tingui coordenades (α1, . . . , αn) en referencia e vol dirque −→

OQ = α1e1 + · · ·+ αnen

i que tingui coordenades (β1, . . . , βn) en referencia u significa que

−→PQ = β1u1 + · · ·+ βnun

Per a calcular les βi partim de la suma de vectors−→PQ =

−→PO +

−→OQ

Les components del vector−→PO en base u1, . . . , un son per definicio (b1, . . . , bn).

Les components de−→OQ en base u1, . . . , un les podem calcular a partir de les

components (α1, . . . , αn) aplicant la matriu de canvi de base Ceu (Prop. 2.32),

aixı la suma−→PQ =

−→PO +

−→OQ en base u1, . . . , un s’escriuβ1...

βn

=

b1...bn

+ Ceu

α1...

αn

Page 116: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

116 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Hi ha una manera encara mes compacta de presentar aquesta formula decanvi de referencia:

β1...

βn

1

=

(Ce

u b0 . . . 1

)α1...

αn

1

Aquı (α1, . . . , αn), (β1, . . . , βn), Ce

u son com abans, b es el vector columna(b1, . . . , bn) i hem afegit un 1 a cada vector columna i una fila de zeros sota lamatriu Cu

e per a que el canvi funcioni (la rao de que funcioni es mes profunda,pero).

Definicio 6.14. La matriu Aue =

(Cu

e b0 . . . 1

)es la matriu ampliada de canvi

de referencia {O, e1, . . . , en} a {P, u1, . . . , un}.

Aquesta presentacio matricial te altres similituds amb el canvi de baseque son molt convenients. Ens limitem a enunciar–les i deixem el calcul dela seva demostracio pel lector.

Proposicio 6.15. Siguin {P, u1, . . . , un}, {Q, w1, . . . , wn}, {O, e1, . . . , en} tressistemes de referencia afı de Rn. Aleshores les matrius ampliades de canvide referencia compleixen les seguents relacions entre elles:

(i) Awu = (Au

w)−1.

(ii) Auw = Ae

w · Aue .

Exemple 6.16. Considerem a R2 els sistemes de referencia canonic {O, e1, e2} ={(0, 0), (1, 0), (0, 1)} i {P, u1, u2} = {(2, 3), (1, 2), (2, 5)}.

La matriu de canvi de referencia {P, u1, u2} a la canonica es

Aue =

1 2 22 5 30 0 1

on la caixa 2 × 2 de dalt a l’esquerra es la matriu de canvi de base Cu

e i ladarrera columna son les coordenades de l’origen P en la nova referencia, mesl’1 final.

La matriu de canvi de referencia canonica a {P, u1, u2} es

Aeu = (Au

e )−1 =

5 −2 −4−2 1 10 0 1

,

Page 117: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.1. VARIETATS LINEALS 117

veiem que en efecte la caixa 2× 2 de dalt a l’esquerra es la matriu de canvide base Ce

u = (Cue )−1 i el vector columna format pels termes (1, 3), (2, 3) de

la matriu es el (−4, 1), que son les components del vector de canvi d’origen−→PO en base u1, u2.

Per exemple, el punt Q = P + 6u1 − 4u2 te coordenades (6,−4) en re-ferencia {P, u1, u2} (per definicio) i (2, 3) + 6(1, 2) − 4(2, 5) = (0,−5) enreferencia canonica. Podem comprovar que efectivament 0

−51

= Aue

6−41

,

6−41

= Aeu

0−51

Mirem ara com es transformen les equacions implıcites d’una recta amb

un canvi de referencia: Sigui l la recta que en referencia canonica te equaciox− 3y − 4 = 0. Aixo vol dir que

l =

(x, y) ∈ R2 |(1 −3 −4

)xy1

= 0

Per distingir–les de les canoniques, denotem ara (u, v) les coordenades d’unpunt del pla en la referencia {P, u1, u2}. Volem saber ara quins son els punts(u, v) tals que al posar–los en referencia canonica son de l. Aixo vol dir queles coordenades (x, y) resultants del canvi de referencia han de ser solucio dex− 3y − 4 = 0. Podem reescriure aquesta condicio com

(1 −3 −4

)xy1

=(1 −3 −4

)1 2 22 5 30 0 1

u

v1

= 0

es a dir, que (−5 −13 −11

)uv1

= 0

L’equacio de la recta l en la referencia {P, u1, u2} es

−5u− 13v − 11 = 0

El lector pot verificar si aquest calcul es correcte prenent un parell de puntsde l en referencia canonica i comprovant que al aplicar–los el canvi de coor-denades Ae

u els dos vectors (u, v) resultants son solucio d’aquesta equacio.

Tal com hem fet en l’exemple 6.16 per la recta l, podem fer per qualsevolvarietat lineal V . Posem un altre exemple amb una recta de R3.

Page 118: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

118 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Exemple 6.17. Busquem les equacions implıcites en referencia {P = (2, 8, 5), u1 =(1, 2, 0), u2 = (−1, 1, 1), u3 = (2, 0, 1)} de la recta l que en referencia canonicate equacions l = {2x− y + 3z = 1, x + 4y + 2z = 6}.

Si denotem (u, v, w) les coordenades dels punts de R3 en la referencia{P, u1, u2, u3} tenim que la seva relacio amb les coordenades (x, y, z) en re-ferencia canonica es

xyz1

=

1 −1 2 22 1 0 80 1 1 50 0 0 1

uvw1

Per tant les equacions de la recta en la nova referencia son

(2 −1 3 11 4 2 −6

)1 −1 2 22 1 0 80 1 1 50 0 0 1

uvw1

=

(00

)

multiplicant tenim {7w + 10 = 0

9u + 5v + 4w + 38 = 0

6.2 El producte escalar euclidia

6.2.1 Producte escalar, distancia i angle

Definicio 6.18. El producte escalar euclidia de dos vectors x = (x1, . . . , xn),y =(y1, . . . , yn) ∈ Rn es el nombre real

〈x,y〉 = x1y1 + · · ·+ xnyn

Proposicio 6.19. (Propietats del producte escalar euclidia) Siguin x,y, z ∈Rn, λ, µ ∈ R qualsevols. El producte escalar euclidia es:

(i) Bilineal:

〈λx + µy, z〉 = λ〈x, z〉+ µ〈y, z〉, 〈x, λy + µz〉 = λ〈x, z〉+ µ〈y, z〉

(ii) Simetric: 〈x,y〉 = 〈y,x〉.

(iii) Definit positiu: Si x 6= 0, 〈x,x〉 > 0.

Page 119: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.2. EL PRODUCTE ESCALAR EUCLIDIA 119

La demostracio d’aquestes propietats es un calcul senzill i es deixa pellector.

Definicio 6.20. La norma (o longitud) d’un vector x = (x1, . . . , xn) ∈ Rn

es‖x‖ =

√〈x,x〉 =

√x2

1 + · · ·+ x2n

La norma es la versio en Algebra lineal de la distancia:

Definicio 6.21. La distancia entre dos punts P, Q ∈ Rn es la norma delvector que els uneix.

d (P, Q) = ‖−→PQ‖

Una propietat molt util de la norma es:

Proposicio 6.22. (desigualtat de Schwartz) Per x,y ∈ Rn qualsevols,

|〈x,y〉| ≤ ‖x‖‖y‖

A mes, hi ha igualtat si i nomes si y,x son linealment dependents.

Demostracio. Com el producte escalar es definit positiu per tot λ ∈ R tenim

0 ≤ 〈λx− y, λx− y〉 = λ2‖x‖2 − 2λ〈x,y〉+ ‖y‖2 ,

amb igualtat si i nomes si λx − y = 0. El terme de la dreta es un polinomide grau 2 en λ que no pot tenir valors negatius. Per tant aquest polinomi note dos zeros reals (no pot canviar de signe), i el seu discriminant ha de sernegatiu, aixı

4 (〈x,y〉)2 − 4‖x‖2‖y‖2 ≤ 0

Prenent arrels quadrades tenim la desigualtat buscada. A mes, observemque |〈x,y〉| = ‖x‖‖y‖ si i nomes si el polinomi te algun zero real λ. Com elproducte escalar es definit positiu, aixo equival a que λx− y = 0.

La desigualtat de Schwarz permet demostrar–ne una altra mes familiar:

Proposicio 6.23. (desigualtat triangular) La longitud d’un costat d’un tri-angle es mes petita que la suma de longituds dels altres dos costats.

Tal com veiem a la figura, els tres costats del triangle4

PQR son els vectors

x =−→PQ,y =

−→QR,x + y =

−→PR. El costat

−→PR te doncs longitud

‖−→PR‖ =

√〈x + y,x + y〉 =

√‖x‖2 + 2〈x, y〉+ ‖y‖2

Page 120: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

120 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Demostracio. P

Q

R

x y

x+y

Apliquem ara la desigualtat de Schwarz als vectors x,y. Per ser dos costats

d’un triangle son l.i. (del contrari el triangle4

PQR seria un segment), i tenimla desigualtat estricta |〈x,y〉| < ‖x‖‖y‖. Ajuntem que per tot nombre reales te t ≤ |t|, i tenim la desigualtat triangular

‖−→PR‖ =

√‖x‖2 + 2〈x, y〉+ ‖y‖2

<√‖x‖2 + 2‖x‖‖y‖+ ‖y‖2 = ‖x‖+ ‖y‖ = ‖

−→PQ‖+ ‖

−→QR‖

Tambe a partir de la desigualtat de Schwarz podem definir angle en gen-eral:

Definicio 6.24. Dos vectors no nuls x,y ∈ Rn formen un angle α quan

cos α =〈x,y〉‖x‖‖y‖

Aquesta definicio coincideix amb la classica d’angle entre dos vectors. Percomprovar–ho recordem breument aquesta: donats un parell de vectors x,y,que podem suposar unitaris perque nomes volem l’angle, podem posar unsistema de referencia ortonormal en el que els dos vectors estan en el pla XYi a mes en aquest pla x te components (1, 0). Aleshores com el vector y esunitari te components (cos(α), sin(α)), i aquest α es l’angle xy.

Tenim aixı 〈x, y〉 = cos(xy), el cosinus de l’angle classic. Si els vectorsx,y son qualsevols, podem posar–los com ‖x‖x, ‖y‖y i aplicant el raonamentanterior als vectors unitaris x, y obtenim 〈x,y〉 = ‖x‖‖y‖ cos(xy).

Notem que la definicio que hem donat no determina el signe de l’angle α,ja que cos(−α) = cos(α). Aquesta ambiguetat es una questio d’orientacio:podem mesurar l’angle d’un vector cap a l’altre o viceversa. Com el producteescalar es simetric no detecta aquests detalls.

Page 121: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.2. EL PRODUCTE ESCALAR EUCLIDIA 121

= (cos α , sin α )y

x =(1,0)

α

Definicio 6.25. (i) L’angle entre dues rectes es l’angle entre els seus re-spectius vectors directors.

(ii) L’angle entre dos plans es l’angle entre els seus respectius vectors nor-mals.

Definicio 6.26. Dos vectors x,y ∈ Rn son ortogonals (o perpendiculars)quan

〈x,y〉 = 0

Teorema 6.27. (Teorema de Pitagores) En un triangle rectangle el quadratde la longitud de la hipotenusa es igual a la suma dels quadrats de les longitudsdels catets.

Demostracio. PQ

R

x

yy−x

Si PQR es l’angle recte del triangle, aixo vol dir que els vectors x =−→QP,y =

−→QR son ortogonals. La hipotenusa es aleshores el vector

−→PR = y−x,

i el quadrat de la seva longitud es

‖y − x‖2 = ‖y‖2 − 2〈x,y〉+ ‖x‖2

Al ser x,y ortogonals el terme central s’annula i ens queda el teorema dePitagores.

Page 122: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

122 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

a

c

b

A B

C

Exercici 17. Apliqueu l’anterior prova del teorema de Pitagores a un trian-gle qualsevoli deduıu el teorema del cosinus

c2 = a2 + b2 − 2 cos(CAB)

6.2.2 Subespais ortogonals, projeccions

Definicio 6.28. Sigui S ⊂ Rn un subconjunt de vectors. El subespai ortog-onal (o anulador) de S es el conjunt de vectors x ∈ Rn que son ortogonals atots els de S. Ho denotem

S⊥ = {x ∈ Rn | 〈x,v〉 = 0∀v ∈ S}

Justifiquem el nom que li hem donat:

Lema 6.29. El subespai ortogonal S⊥ es un subespai vectorial de Rn.

Demostracio. Si x,y ∈ S⊥ i λ, µ ∈ R, per tot v ∈ S tenim 〈x,v〉 =0, 〈y,v〉 = 0 i per tant

〈λx + µy,v〉 = λ〈x,v〉+ µ〈y,v〉 = 0 =⇒ λx + µy ∈ S⊥

La seguent proposicio explica com calcular el subespai ortogonal a partird’un sistema de generadors o d’equacions del subespai, i es la base de moltesde les seves propietats:

Proposicio 6.30. (i) Sigui F = [v1, . . . , vm] ⊂ Rn. El seu subespai ortog-onal te equacions

F⊥ =

x = (x1, . . . , xn) ∈ Rn |

〈v1,x〉 = 0

...〈vm,x〉 = 0

Page 123: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.2. EL PRODUCTE ESCALAR EUCLIDIA 123

(ii) Sigui G el subespai de Rn de les solucions del sistema lineal homogeniAx = 0. Aleshores el subespai ortogonal G⊥ esta generat per les filesde la matriu A.

En particular, per tot subespai F ⊂ Rn es te

dim F⊥ = n− dim F

Demostracio. Com F = [v1, . . . , vm], tenim que v ∈ F si i nomes si v = α1v1+· · · + αmvm. Aixı, si un vector x compleix que 〈v1,x〉 = 0, . . . , 〈vm,x〉 = 0per qualsevol v ∈ F es te

〈v,x〉 = α1〈v1,x〉+ · · ·+ αm〈vm,x〉 = 0

Recıprocament, si x ∈ F⊥ es compleix que 〈v1,x〉 = 0, . . . 〈vm,x〉 = 0 ja quev1, . . . , vm ∈ F . Per tant tenim una igualtat de subespais

F⊥ = {x = (x1, . . . , xn) |

〈v1,x〉 = 0

...〈vm,x〉 = 0

Denotem per Ax = 0 aquest sistema, i observem que les files de la matriu decoeficients A son els vectors v1, . . . , vm.

Sabem pel teorema de Rouche–Frobenius que la dimensio de F⊥ es n −rang A, i tambe que el rang d’una matriu es la dimensio del subespai generatper les seves files (Prop. 2.61). Aixı

dim F⊥ = n− rang A = n− dim[v1, . . . , vm] = n− dim F

Finalment, si el subespai G ve donat per un sistema d’equacions

a11 . . . a1

n

. . .am

1 . . . amn

x1...

xn

=

0...0

aixo vol dir tambe que els vectors fila de la matriu de coeficients v1 =(a1

1, . . . , a1n), . . . , vm = (am

1 , . . . , amn ) son ortogonals a tot G. Per tant ten-

im una inclusio [v1, . . . , vm] ⊂ G⊥. Ara be, si contem dimensions tenim

dim G⊥ = n− dim G = rang A = dim[v1, . . . , vm]

Per tant G⊥ = [v1, . . . , vm].

Page 124: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

124 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Exemple 6.31. El subespai F = [(3,−1, 4), (2, 1, 1)] ⊂ R3 te ortogonal

F⊥ = {(x, y, z) ∈ R3 | 3x− y + 4z = 0, 2x + y + z = 0}

El subespai G = {x−3y +2z +8t = 0,−2x+3z +5t = 0} ⊂ R4 te ortogonal

G⊥ = [(1,−3, 2, 8), (−2, 0, 3, 5)]

Notem que F⊥, G⊥ son complementaris de F, G respectivament, i que aquestaes una manera molt rapida d’obtenir un complementari.

Proposicio 6.32. Siguin F, G ⊂ Rn subespais vectorials. Aleshores:

(i) F i F⊥ son complementaris.

(ii) (F⊥)⊥ = F .

(iii) (F ∩G)⊥ = F⊥ + G⊥.

(iv) (F + G)⊥ = F⊥ ∩G⊥.

Demostracio. (i): Si x ∈ F∩F⊥, per definicio de F⊥ es te que 〈x,x〉 = 0. Arabe, el producte escalar es definit positiu (Prop. 6.19). Per tant si 〈x,x〉 = 0cal que x = 0.

Aixı F ∩ F⊥ = 0, i si apliquem la formula de Grassman i el calcul dedim F⊥ de la Prop. 6.30 tenim

dim F ⊕ F⊥ = dim F + n− dim F − 0 = n

Per tant F ⊕ F⊥ = Rn.(ii): Si x ∈ F , per qualsevol y ∈ F⊥ tenim 〈x,y〉 = 0. Per tant F ⊂

(F⊥)⊥. Si contem la dimensio de (F⊥)⊥ amb la Proposicio 6.30 resulta que

dim(F⊥)⊥ = n− dim F⊥ = n− (n− dim F ) = dim F

D’aquı que la inclusio F ⊆ (F⊥)⊥ sigui una igualtat.(iv): Si x ∈ (F + G)⊥, com F, G ⊂ F + G tenim que x ∈ F⊥, G⊥, es a

dir que x ∈ F⊥ ∩G⊥.Recıprocament, si x ∈ F⊥ ∩G⊥ i tenim un v ∈ F + G qualsevol, posant

v = u + w amb u ∈ F, w ∈ G observem que

〈x, v〉 = 〈x, u〉+ 〈x, w〉 = 0

ja que x ∈ F⊥, G⊥. Per tant x ∈ (F + G)⊥, i com hem mostrat que tenenels mateixos elements els dos subespais son iguals.

Page 125: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.2. EL PRODUCTE ESCALAR EUCLIDIA 125

(iii): Si x ∈ F⊥+G⊥, podem posar–lo com x = y+z amb y ∈ F⊥, z ∈ G⊥.Aleshores per tot v ∈ F ∩G es te que

〈x, v〉 = 〈y, v〉+ 〈z, v〉 = 0

ja que v ∈ F i v ∈ G. Per tant hi ha una inclusio F⊥ + G⊥ ⊆ (F ∩G)⊥.Comparem ara les dimensions dels dos subespais. La formula de Grass-

man i la igualtat (iv) mostren que

dim F⊥+G⊥ = dim F⊥+dim G⊥−dim F⊥∩G⊥ = dim F⊥+dim G⊥−dim(F+G)⊥

Si substituım els valors dim F⊥ = n− dim F, dim G⊥ = n− dim G, dim(F +G)⊥ = n− dim(F + G) = n− dim F − dim G + dim F ∩G tenim

dim F⊥ + G⊥ = n− dim F ∩G

Per tant, com F⊥ + G⊥ ⊆ (F ∩ G)⊥ i els dos subespais tenen la mateixadimensio son iguals.

Les propietats dels subespais ortogonals es poden aplicar a l’estudi dedistancies:

Definicio 6.33. Siguin V1, V2 ⊂ Rn varietats lineals. La distancia entreV1, V2 es

d (V1, V2) = infP ∈ V1

Q ∈ V2

d (x,y)

Com les varietats lineals son tancades, es facil comprovar que

d (V1, V2) = 0 ⇐⇒ V1 ∩ V2 6= ∅

(es a dir, distancia zero vol dir que es tallen).En els casos en que no es tallin podem aplicar un metode basat en el

teorema de Pitagores: Es busquen punts P ∈ V1, Q ∈ V2 tals que el vector−→PQ sigui ortogonal a les dues varietats V1, V2. Aleshores la distancia entre

V1 i V2 es ‖−→PQ‖. Per a demostrar que aixo es cert i funciona, comprovem

que sempre existeixen aquests parells de punts P, Q i que son els mes properspossibles:

Lema 6.34. Donades dues varietats lineals V1, V2 ⊂ Rn sempre existeixen

punts P ∈ V1, Q ∈ V2 tals que el vector−→PQ es ortogonal a V1 i a V2. La

distancia entre V1, V2 es la distancia entre un d’aquests parells de punts P, Q.

Page 126: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

126 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �� � � � �

� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �� � � �

� � � � � � � � �� � � � � � � � �� � � � � � � � �� � � � � � � � �� � � � � � � � �

� � � � � � � � �� � � � � � � � �� � � � � � � � �� � � � � � � � �� � � � � � � � �

Q

P

V

V

W

2

1

1

Demostracio. Siguin V1 = p1 + F1, V2 = p2 + F2 equacions parametriques deV1, V2.

Si la suma d’espais directors es F1 + F2 = Rn, aleshores −−→p1p2 ∈ F1 + F2,es a dir que podem posar–lo com −−→p1p2 = ~u +~v, amb ~u ∈ F1, ~v ∈ F2. Aquestadescomposicio dona una igualtat de punts Q = p2 − ~v = p1 + ~u = P . Lesdues expressions d’aquest punt P = Q mostren que es de V1 i de V2, i com−→PQ = 0 es ortogonal a F1, F2 aquesta solucio es valida.

Si la suma d’espais directors es F1 + F2 6= Rn, considerem ara la varietat

W1 = p1 + F1 + (F1 + F2)⊥ = p1 + F1 + F⊥

1 ∩ F⊥2

Aquesta varietat es l’ampliacio de V1 amb els vectors que son simultaneamentortogonals a les dues varietats V1, V2. Els dos subespais directors de W1, V2

compleixen (F1 + (F1 + F2)

⊥)

+ F2 = Rn

Per tant pel raonament que hem fet en el cas anterior existeix un punt d’in-terseccio Q ∈ W1 ∩ V2. Aixo significa que podem posar aquest punt comQ = p2 + v, amb v ∈ F2, i com Q = p1 + u + w, amb u ∈ F1, w ∈ (F1 + F2)

⊥.

Si triem ara P = p1 + u observem que P ∈ V1, i que−→PQ ∈ F⊥

1 ∩ F⊥2 . Per

tant els punts P, Q compleixen l’enunciat.

Page 127: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.2. EL PRODUCTE ESCALAR EUCLIDIA 127

Proposicio 6.35. Siguin V1, V2 ⊂ Rn varietats lineals, P ∈ V1, Q ∈ V2 punts

tals que el vector−→PQ es ortogonal a V1 i a V2, i P ′ ∈ V1, Q′ ∈ V2 qualsevols.

Aleshores ‖−−→P ′Q′‖ ≥ ‖

−→PQ‖.

La igualtat nomes s’assoleix si−−→P ′Q′ es tambe ortogonal a V1, V2. En

aquest cas hi ha una igualtat de vectors−→PQ =

−−→P ′Q′.

P

QQ’

P’

Demostracio. Volem comparar les normes dels vectors−→PQ,

−−→P ′Q′ descom-

posant el darrer com a suma del primer mes un altre vector ortogonal.Per aixo, tal com s’indica a la figura descomposem

−−→P ′Q′ =

−→PQ +

−−→P ′P +

−−→QQ′

Ara observem que−−→P ′P ∈ F1,

−−→QQ′ ∈ F2, per tant els dos vectors son ortogo-

nals a−→PQ i pel teorema de Pitagores es te

‖−−→P ′Q′‖2 = ‖

−→PQ‖2 + ‖

−−→P ′P +

−−→QQ′‖2

Per tant ‖−−→P ′Q′‖ ≥ ‖

−→PQ‖, amb igualtat si i nomes si

−−→P ′P =

−−→Q′Q, o equiva-

lentment−→PQ =

−−→P ′Q′.

Ajuntant els dos darrers resultats i la definicio de distancia obtenim:

Corol·lari 6.36. La distancia entre dues varietats lineals V1, V2 ⊂ Rn es la

distancia entre qualsevol parell de punts P ∈ V1, Q ∈ V2 tal que−→PQ sigui

ortogonal a V1 i a V2.

Page 128: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

128 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Exemple 6.37. Calculem la distancia entre les dues rectes de l’espai

l1 =

{2x + y − z = 1

2x− 3y − 5z = −19l2 =

{x− y = 3

z = 2

Comencem per posar–les en forma parametrica:

l1 : P = (3, 0, 5) + λ(1,−1, 1) λ ∈ Rl2 : Q = (3, 0, 2) + µ(1, 1, 0) µ ∈ R

Ara prenem P ∈ l1, Q ∈ l2 qualsevols, i imposem que el vector−→PQ = (3 +

µ, µ, 2) − (3 + λ,−λ, 5 + λ) sigui ortogonal als vectors directors de les duesrectes:

〈(µ− λ, µ− λ,−3− λ), (1,−1, 1)〉 = −3− λ = 0

〈(µ− λ, µ− λ,−3− λ), (1, 1, 0)〉 = 2µ− 2λ= 0

La solucio del sistema d’equacions es λ = −3, µ = −3. Per tant els punts

son P = (0, 3, 2), Q = (0,−3, 2) i la distancia entre l1, l2 es ‖−→PQ‖ = 6.

Com a exemples finals, presentem formules per calcular la distancia d’unpunt a una recta en el pla o a un pla en l’espai.

Exemple 6.38. (Distancia d’un punt a una recta en el pla) Sigui P = (x0, y0),i l la recta d’equacio ax + by = c.

Un vector normal de la recta es (a, b). Com la primera varietat es un

punt el punt P esta fixat i nomes cal buscar Q = (x, y) a l tal que−→PQ sigui

l.d. amb (a, b). Aquesta condicio d’ortogonalitat a l es

b(x− x0)− a(y − y0) = 0

i podem reescriure la condicio Q ∈ l com

a(x− x0) + b(y − y0) = c− ax0 − by0

Resolent el sistema en x− x0, y − y0 trobem

(x− x0, y − y0) =c− ax0 − by0

a2 + b2(a, b)

Per tant la distancia ‖(x− x0, y − y0)‖ del punt a la recta es

d(P, l) =|ax0 + by0 − c|√

a2 + b2

Page 129: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.3. AREES, VOLUMS, PRODUCTE VECTORIAL 129

Exercici 18. Calcular la distancia d’un punt P = (x0, y0, z0) a un pla Πd’equacio ax + by + cz = d en R3.Indicacio i solucio: Es pot fer igual que l’exemple anterior del punt i la rectaen el pla. La solucio es

d(P, Π) =|ax0 + by0 + cz0 − d|√

a2 + b2 + c2

6.3 Arees, volums, producte vectorial

6.3.1 Determinants, arees i volums

Comencem calculant l’area del paral·lelogram format per dos vectors ~u =(a, c), ~v = (b, d) en el pla situats segons la figura

� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �� � � � � � � � � � � �

� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �� � � � � � � � � � �

(a,c)

(b,d)

a a+b

d

c+d

1

2

3

4

5

6

Tal com veiem, podem presentar el paral·lelogram com el quadrat decostats (a + b, 0), (0, c + d) menys les regions rectangulars 1 i 2 i els trianglesrectangles 3,4,5,6. Aixı l’area A del paral·lelogram central es la diferencia

A = Aquadrat − A1 − A2 − A3 − A4 − A5 − A6

= (a + b)(c + d)− bc− bc− ac

2− bd

2− bd

2− ac

2= ad− bc

Aixo motiva la seguent

Page 130: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

130 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Definicio 6.39. El determinant d’una matriu 2× 2 A =

(a bc d

)es

det A =

∣∣∣∣∣a bc d

∣∣∣∣∣ = ad− bc

En el calcul anterior la posicio dels vectors ha influit en la descomposiciode la regio. Si analitzem tots els casos possibles i fem el calcul arribem a laseguent conclusio:

Proposicio 6.40. L’area del paral·lelogram pla format pels vectors (a, c), (b, d)es

A = | det

(a bc d

)|

Dit en altres paraules, el determinant calcula l’area del paral·lelogram,pero amb signe positiu o negatiu.

Aquest problema de signe no es cap cosa nova: si volem calcular la lon-gitud del segment que va d’un nombre real a a un altre b, aquesta longitudes |a− b|. Seguir la recepta de calcular a− b produeix la longitud o menys lalongitud segons l’ordre en el que estiguin els dos nombres reals. La formuladel determinant es l’analeg en dimensio superior de la formula a − b, i te elmateix problema de signe segons com ordenem els vectors. Aquesta questiod’ordre en dimensio superior rep el nom d’orientacio.

Definicio 6.41. Una base (a, c), (b, d) de R2 es directa (o te orientacio di-

recta, o positiva) si det

(a bc d

)> 0.

Si el determinant es negatiu, es diu que la base es inversa (o te orientacioinversa, o negativa).

Exemple 6.42. La base canonica (1, 0), (0, 1) es positiva.

Notem que en la practica, podem fer que una base directa passi a serinversa o viceversa nomes canviant l’ordre dels dos vectors. El que una basetingui orientacio directa o inversa es pot caracteritzar pel sentit de gir de labase.

Aquest concepte es facil de definir si es col·loquen els vectors en la posicioadequada: donada una base u1, u2 de R2 podem fer girar els eixos de maneraque el primer vector u1 estigui en la part positiva de l’eix OX. Un girdel pla no canvia les arees i el signe tampoc pot canviar de cop en unatransformacio continua, aixo fa que tot i que les components dels vectorscanviin, el determinant que formen no varia (aquest raonament no es unademostracio! els detalls cal buscar–los al capıtol ??).

Page 131: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.3. AREES, VOLUMS, PRODUCTE VECTORIAL 131

Per tant ens podem reduir al cas en que u1 te components (a, 0) amba > 0. Com el vector u2 completa la base, ha de tenir components (b, d) ambd 6= 0, i el determinant det(u1u2) = ad te el mateix signe que d. Hi han duespossibilitats:

(i) d > 0: la base es directa i u2 esta en el semipla superior.

(ii) d < 0: la base es inversa i u2 esta en el semipla inferior.

uu

12

base directa

12

6

39

u

u

2

1

base inversa

Hem distingit els dos casos mirant en quin semipla esta u2 en una re-ferencia adaptada, pero tambe podem fer–ho sense variar la referencia:

- En el cas en que la base es directa, si volem fer girar u1 fins que essobreposi a u2 el sentit de gir en el que hem de recorrer un angle mespetit es l’antihorari (al reves que les agulles del rellotge) ja que u2 estaen el semipla superior.

- En canvi, si la base te orientacio inversa, com el vector u2 esta en elsemipla inferior el sentit de gir en el que u1 arribara abans a superposar–se a u2 es el sentit horari (com les agulles del rellotge).

Completant els detalls d’aquest raonament es te un criteri practic perdistingir les orientacions a ull:

Proposicio 6.43. Una base u1, u2 de R2 es directa si el sentit de gir en elque u1 ha de recorrer un angle mes petit per superposar–se a u2 es el sentitantihorari.

Si aquest sentit de gir es horari, la base es inversa.

Page 132: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

132 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

El determinant tambe permet calcular l’area de triangles a partir delsseus vertexs, estalviant–nos de buscar la base i alcada:

Proposicio 6.44. L’area d’un triangle del pla4

PQR es

A =1

2

∣∣∣det(−→PQ

−→PR)

∣∣∣on det(

−→PQ

−→PR) es el determinant de la matriu que te a aquests dos vectors

per columnes.

P

Q

R

T=Q+PR

Demostracio. Observem a la figura que per paral·lelisme dels costats, el

paral·lelogram format per P, Q,R, T = Q +−→PR es descomposa com a unio

de dos triangles4

PQR,4

QRT . Com−→PQ =

−→RT,

−→PR =

−→QT , els dos triangles

tenen les mateixes longituds de costats i per tant la mateixa area, i resulta

A(�

PQTR) = 2A(4

PQR) =∣∣∣det(

−→PQ

−→PR)

∣∣∣

En la Proposicio 6.44 hem escollit dos vectors costat del triangle amborigen comu, pero com el valor absolut del determinant no varia al multiplicarper -1 un dels vectors podem usar dos vectors costat qualsevols pel calcul.

Un dels motius de l’interes del calcul d’arees de triangles es que podemdescomposar qualsevol regio poligonal del pla en triangles, i d’aquesta maneracalcular–li l’area.

Exemple 6.45. Calculem l’area del quadrilater format pels punts P = (0, 0), Q =(5, 3), R = (2, 5), T = (−1, 2).

Page 133: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.3. AREES, VOLUMS, PRODUCTE VECTORIAL 133

P=(0,0)

Q=(5,3)

R=(2,5)

T=(−1,2)

En primer lloc constatem que−→PQ 6=

−→TR. Per tant els costats no son

paral·lels, i no podem calcular l’area directament amb un determinant. De-

scomposem el quadrilater en els triangles4

PRT ,4

PQR, i tenim

APQRT = APQR + APRT =1

2

∣∣∣det(−→PQ

−→PR)

∣∣∣+ 1

2

∣∣∣det(−→PR

−→PT )

∣∣∣=

1

2

(∣∣∣∣∣5 23 5

∣∣∣∣∣+∣∣∣∣∣2 −15 2

∣∣∣∣∣)

= 14

Exercici 19. Calculeu l’area de l’hexagon

(3,−1)

(4,3)

(1,6)

(−3,4)

(−4,2)

(1,1)

Solucio: 28.Els determinants de mida superior seran tractats en el capıtol 4, junta-

ment amb el seu comportament per transformacions elementals, transposicio,producte, etc. De totes maneres enunciem aquı per conveniencia propietatsdels determinants 3× 3 utils per la geometria de l’espai.

Page 134: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

134 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Definicio 6.46. El determinant d’una matriu 3× 3 A =

a11 a1

2 a13

a21 a2

2 a23

a31 a3

2 a33

es

∣∣∣∣∣∣∣a1

1 a12 a1

3

a21 a2

2 a23

a31 a3

2 a33

∣∣∣∣∣∣∣ = a11a

22a

33 + a1

2a23a

31 + a1

3a21a

32 − a1

1a23a

32 − a1

2a21a

33 − a1

3a22a

31

Donats tres vectors ~u,~v, ~w ∈ R3, denotarem det(~u,~v, ~w) el determinantde la matriu que els te per columnes.

El determinant 3×3 te propietats de calcul de volums analogues a les del2× 2. Les citem aquı i la demostracio ja es veura en el capıtol 4.

Proposicio 6.47. Siguin tres vectors x,y, z ∈ R3. Aleshores:

(i) El volum del paral·lelepıped generat per x,y, z es

V = | det(x,y, z)|

(ii) El volum del prisma amb base el triangle format per x,y i alcada z es

V =1

2| det(x,y, z)|

(iii) El volum del tetraedre amb vertexs 0,x,y, z es

V =1

6| det(x,y, z)|

Recordem quins son el paral·lelepıped, prisma triangular i tetraedre gen-erats per x,y, z que cubiquem en la proposicio anterior:

Com en el cas del pla (definicio 6.41), en l’espai podem distingir entrebases directes quan det(x,y, z) > 0 i inverses quan det(x,y, z) < 0. Nova-ment, en dimensio tres podem distingir a ull si una base es directa o inversamitjancant la regla del llevataps (o de la ma dreta). Per a fer–ho necessitemun resultat que podrem demostrar en el capıtol ??:

Lema 6.48. Donada una base u1, u2, u3 de R3, existeix una referencia ortonor-mal en la que u1, u2 son una base directa del pla OXY , i tal que el determi-nant de la matriu de les components de u1, u2, u3 en la nova base es el mateixque en la canonica.

Page 135: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.3. AREES, VOLUMS, PRODUCTE VECTORIAL 135

0

x y

z

x+z y+z

x+y+z

x+y

0

x y

z

x+z y+z

0

x y

z

Intuıtivament, aquest canvi de referencia consisteix en moure el pla OXYfins que contingui els vectors u1, u2, i si aquests formen una base inversa (elsentit de gir mes curt de u1 a u2 es l’antihorari) donar la volta al pla. Aquestestransformacions preserven volums i per continuıtat el signe no pot saltar, peraixo el determinant no varia.

Un cop tenim la referencia ben posada, com el vector u3 no es del pla[u1, u2] haura d’estar en el semipla superior o en l’inferior. Tenim aleshores:

Proposicio 6.49. (regla del llevataps, o del vis, o de la ma dreta) Siguiu1, u2, u3 una base de R3.

(i) Si en la referencia del lema 6.48 el vector u3 esta en el semipla superior,la base u1, u2, u3 es directa.

(ii) Si esta en el semipla inferior, la base u1, u2, u3 es inversa.

Indicacio de la prova: Com en la nova referencia els vectors u1, u2 estan enel pla OXY , tenen components (a, c, 0), (b, d, 0) respectivament. Que formin

una base directa d’aquest pla vol dir que

∣∣∣∣∣a bc d

∣∣∣∣∣ > 0. Ara, si u3 te compoennts

(e, f, g) en la nova referencia el determinant de la base val

det(u1, u2, u3) =

∣∣∣∣∣∣∣a b ec d f0 0 g

∣∣∣∣∣∣∣ = g

∣∣∣∣∣a bc d

∣∣∣∣∣Per tant el signe de det(u1, u2, u3) es el de g. Si u3 esta en el semiespaisuperior g > 0 i la base es directa, si esta en el semiespai inferior g < 0 i labase es inversa.

Page 136: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

136 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

u

u

u

1

2

3u

u

u

1

2

3

u

u

u

1

3

2

bases directes

base inversa

Figura 6.1: Base directa, base inversa i el vis

El nom d’aquesta caracteritzacio de les bases directes prove del convenide disseny industrial de que si fem girar un vis (o un llevataps) en sentitantihorari (directe, en notacio geometrica) el vis puja. Aquest es el compor-tament de les bases directes de R3: si ens mirem el pla [u1, u2] de maneraque el sentit de gir mes breu de u1 a u2 sigui l’antihorari, el tercer vector dela base apunta cap a dalt del pla.

6.3.2 El producte vectorial

El producte vectorial es una operacio que, a diferencia de l’escalar, nomesesta definit a R3. Es una eina util en problemes de geometria de l’espai itambe de Fısica i Calcul Integral, on serveix per definir moments angulars,el rotacional, . . . .

Definicio 6.50. El producte vectorial de dos vectors x = (x1, x2, x3),y =(y1, y2, y3) ∈ R3 es el vector

x× y = (

∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣ ,∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣ ,∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣) ∈ R3

Notacio 6.51. La presentacio mes senzilla del producte vectorial es la usual enFısica: Denotem la base canonica com ~i = (1, 0, 0),~j = (0, 1, 0), ~k = (0, 0, 1).

Page 137: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.3. AREES, VOLUMS, PRODUCTE VECTORIAL 137

Aleshores

x× y =

∣∣∣∣∣∣∣~i ~j ~kx1 x2 x3

y1 y2 y3

∣∣∣∣∣∣∣ =∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣~i +

∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣~j∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣~k= (

∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣ ,∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣ ,∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣)No hem definit matrius amb vectors com a coeficients, aixı que veiem laformula del determinant 3 × 3 com un truc mnemotecnic per recordar ladefinicio.

Proposicio 6.52. (Propietats del producte vectorial) Siguin x,y, z ∈ R3

qualsevols.

(i) Es anticommutatiu: x× y = −y × x.

(ii) 〈x× y, z〉 = det(x,y, z)

(iii) x× y es ortogonal a x i a y.

(iv) x× y 6= 0 si i nomes si x,y son l.i.

(v) Regla del llevataps: si x,y son l.i. x,y,x× y formen una base directade R3.

(vi) ‖x× y‖ = ‖x‖‖y‖| sin(xy)|

Demostracio. (i) Canviar l’ordre dels dos vectors intercanvia dues files enels determinants de la definicio i aixo canvia el signe de cada component.

(ii)

〈x× y, z〉 = 〈(∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣ ,∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣ ,∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣), (z1, z2, z3)〉

= z1

∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣+ z2

∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣+ z3

∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣=

∣∣∣∣∣∣∣x1 y1 z1

x2 y2 z2

x3 y3 z3

∣∣∣∣∣∣∣(iii) Per (ii) es te 〈x× y,x〉 = det(x,y,x) = 0, i analogament 〈x× y,y〉 =

det(x,y,x) = 0.

Page 138: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

138 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

(iv) x,y son l.d. si i nomes si la matriu

(x1 x2 x3

y1 y2 y3

)te rang ¡2. Aquesta

condicio equival a que els tres determinants de la definicio 6.50 siguinzero, ja que si el rang de la matriu es dos el determinant format per lesdos columnes dels primers termes 6= 0 de cada fila es no nul.

(v)

det(x,y,x× y) =

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

x1 y1

∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣x2 y2

∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣x3 y3

∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣=

∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣2

+

∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣2

+

∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣2

Per (iii) si x,y son l.i. algun d’aquests determinants es no nul, idet(x,y,x× y) = ‖x× y‖ > 0.

(vi) Calculem:

‖x× y‖2 =

∣∣∣∣∣x2 x3

y2 y3

∣∣∣∣∣2

+

∣∣∣∣∣x1 x3

y1 y3

∣∣∣∣∣2

+

∣∣∣∣∣x1 x2

y1 y2

∣∣∣∣∣2

= (x2y3 − x3y2)2 + (x1y3 − x3y1)

2 + (x1y2 − x2y1)2

= (x21 + x2

2 + x23)(y

21 + y2

2 + y23)− (x1y1 + x2y2 + x3y3)

2

(el pas de la penultima a l’ultima lınea s’ha de fer amb calma). Pertant

‖x× y‖2 = ‖x‖2 + ‖y‖2 − 〈x,y〉2

I com 〈x,y〉 = ‖x‖‖y‖ cos(xy), x× y te el modul que enunciem.

A l’inici de la subseccio 6.3.1 hem vist com el determinant d’un parellde vectors de R2 calcula l’area del paral·lelogram que formen. El productevectorial permet fer aquest calcul quan el paral·lelogram esta a l’espai.

Proposicio 6.53. El paral·lelogram format pels vectors x,y ∈ R3 te area‖x× y‖.

Page 139: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

6.3. AREES, VOLUMS, PRODUCTE VECTORIAL 139

0x

yx+y

Demostracio. L’area d’un paral·lelogram es el producte de la longitud de labase per l’alcada.

α

b

h

En el cas del format per x,y, si prenem x com a base aleshores la sevalongitud es ‖x‖, i l’alcada es ‖y‖ sin(xy). El producte d’aquestes longitudses ‖x× y‖ com s’ha calculat a la proposicio 6.52.

I com hem fet en el pla, descomposant el paral·lelogram en dos trianglessemblants obtenim

Corol·lari 6.54. El triangle de R3 amb vertexs 0,x,y te area A = 12‖x×y‖

Page 140: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

140 CAPITOL 6. GEOMETRIA DEL PLA I DE L’ESPAI

Page 141: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Apendix A

Nombres complexes

A.1 Definicio i operacions

Els nombres complexes es van introduır al segle XVI per a fer front a unproblema: no totes les equacions de grau 2 reals tenen solucions reals. No-tablement

x2 + 1 = 0 =⇒ x = ±√−1 6∈ R

De fet la no existencia de√−1 en R es l’unic problema, ja que sempre podem

fer coses com

x2 + x + 1 = 0 =⇒ x =−1±

√−3

2=−1±

√3√−1

2

La solucio que es dona a aquest problema es:

Definicio A.1. El nombre i es√−1. Es a dir, es un nombre no real (imag-

inari) tal que i2 = −1.Un nombre complex es un parell z = a + bi on a, b son nombres reals. La

part real de z es Re z = a, i la part imaginaria de z es Im z = b.

Els nombres complexes son doncs una mena de polinomis de grau 1 enun sımbol i que compleix i2 = −1. Aquesta caracteritzacio permet definirles operacions amb complexes:

- La suma, component a component

(3 + 2i) + (5− 8i) = 8− 6i

- La multiplicacio, com els polinomis pero fent i2 = −1:

(2+4i)(−3+5i) = −6+10i−12i+20i2 = −6+10i−12i−20 = −26−2i

141

Page 142: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

142 APENDIX A. NOMBRES COMPLEXES

- La conjugacio, es canviar el signe a la part imaginaria

(a + bi) = a− bi

Les propietats de la suma i la multiplicacio en els nombres complexesson les mateixes que en els reals (associativa, commutativa, distributiva . . . ).Diem que amb elles els nombres complexes formen el cos dels complexesC = {z = a + bi | a, b ∈ R}.

Entre les propietats de la conjugacio remarquem:

Proposicio A.2. Siguin z, z1, z2 nombres complexes. Aleshores

(i) (z1 + z2) = z1 + z2.

(ii) (z1 · z2) = z1 · z2.

(iii) z · z ∈ R.

Demostracio. Si z = a + bi, z1 = a1 + b1i, z2 = a2 + b2i tenim

(i) (z1 + z2) = a1 + a2 + (b1 + b2)i = a1 + a2 − (b1 + b2)iz1 + z2 = a1 − b1i + a2 − b2i = a1 + a2 − (b1 + b2)i.

(ii) (z1 · z2) = a1a2 − b1b2 + (a1b2 + a2b1)i = a1a2 − b1b2 − (a1b2 + a2b1)iz1 · z2 = (a1 − b1i)(a2 − b2i) = a1a2 − b1b2 − (a1b2 + a2b1)i.

(iii) zz = (a + bi)(a− bi) = a2 + b2

La darrera propietat de la conjugacio permet dividir nombres complexes,mitjancant la multiplicacio i divisio pel conjugat:

3 + 2i

5 + i=

(3 + 2i)(5− i)

(5 + i)(5− i)=

15− 3i + 10i + 2

25 + 1=

17

26+

7

26i

A.2 Formes rectangular i exponencial

Els nombres complexes admeten una interpretacio geometrica coneguda comel pla de Gauss: consisteix en identificar cada nombre complex z = a + biamb el vector (a, b) ∈ R2. D’aquesta manera podem pensar els complexescom punts del pla. L’eix horizontal OX = {z = a + 0i = a ∈ R} es larecta real, i l’eix vertical OY = {z = 0 + bi = bi} es la recta imaginaria. Lapresentacio del nombre complex com z = a+ bi ↔ (a, b) rep el nom de formarectangular del nombre complex.

Page 143: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

A.2. FORMES RECTANGULAR I EXPONENCIAL 143

Im z

b

a Re z

z=a+bi

|z|

Arg z

Figura A.1: Nombre complex: modul i argument

zz’

z+z’

La suma de nombres complexes es la suma de vectors del pla

i la conjugacio es la reflexio respecte de l’eix real

Aquesta interpretacio geometrica permet introduir l’anomenada formapolar dels nombres complexes:

Definicio A.3. El modul d’un nombre complex z es la seva longitud com avector de R2, i es denota |z|.

L’argument d’un nombre complex z es l’angle que forma com a vector deR2 amb el semieix real positiu, i es denota arg z.

Modul i argument estan indicats en la figura A.2, de la que deduım comcalcular–los a partir de les parts real i imaginaria d’un nombre complex z =a + bi usant el teorema de Pitagores i una mica de trigonometria:

|z| = r =√

a2 + b2

ϕ = arg z, cos ϕ = ar, sin ϕ = b

r, tan ϕ = b

a

(A.1)

Page 144: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

144 APENDIX A. NOMBRES COMPLEXES

b

−b

a

z

z

Recıprocament, del modul r i l’argument ϕ podem deduır les seves parts reali imaginaria, per tant determinar el nombre complex:

a = r cos ϕb = r sin ϕ

(A.2)

Observacio A.4. L’argument d’un nombre complex no es unic. Es un angle,per tant li podem sumar multiples enters de 1 volta (2π rd = 360◦) sensevariar–lo.

Aixı com la forma rectangular z = a+ bi dels nombres complexes es moltconvenient per a fer sumes, la caracteritzacio per modul i angle ho es per acalcular multiplicacions (i divisions, potencies, arrels, logaritmes . . . ):

Lema A.5. Si z1, z2 ∈ C tenen moduls r, s i arguments α, β respectivament,aleshores el producte z1 · z2 te modul rs i argument α + β.

Demostracio. De les formules (A.2) deduım que z1 = r(cos α + i sin α), z2 =s(cos β + i sin β). Multiplicant els nombres tenim

z1 · z2 = rs(cos α cos β + i cos α sin β + i sin α cos β + i2 sin α sin β)

= rs(cos α cos β − sin α sin β) + irs(cos α sin β + sin α cos β)

= rs(cos(α + β) + i sin(α + β))

i les formules (A.1) mostren immediatament que z1z2 te modul rs i argumentα + β.

Notacio A.6. Si un nombre complex z te modul r i argument ϕ el denotaremen forma exponencial per

z = reiϕ

Page 145: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

A.2. FORMES RECTANGULAR I EXPONENCIAL 145

Amb la forma exponencial, podem reescriure el lema A.5 simplement dient

z1z2 = reiαseiβ = rsei(α+β)

Aixo mostra que la notacio exponencial es molt convenient per productes ioperacions relacionades. Quan veieu les series de Taylor en el curs de Calculcomprovareu que identitat exponencial eiϕ = cos ϕ+ i sin ϕ no es una notacioinventada, sino que prove d’una igualtat de funcions de variable complexa.

Exemple A.7. Passar nombres complexes de forma exponencial a forma rect-angular es aplicar mecanicament la formula

z = reiϕ = r cos ϕ + i r sin ϕ

La conversio recıproca es un pel mes delicada perque calcular el sinus, cosinuso tangent de l’argument ens el determina llevat de quadrant:

- z = 1 te modul√

12 + 02 = 1, i el seu argument te tangent tan ϕ = 01

=0. El vector es del primer quadrant, per tant ϕ = 0 i 1 = ei0.

- z = −1 te modul 1, i el seu argument te tangent 0−1

= 0. Ara be, estaentre el segon i tercer quadrant, per tant Arg (−1) = π, i tenim

−1 = eiπ

- z = 6 − 6i te modul r =√

62 + (−6)2 = 6√

2, i el seu argument te

tangent tan ϕ = −1. Aixo significa que ϕ = −π4

o be ϕ = 5π4

. Com elnombre complex z = 6− 6i esta en el quart quadrant el valor correctees el primer

z = 6− 6i = 6√

2e−i π4

La forma exponencial dona la interpretacio geometrica de la multiplicaciocomplexa: multiplicar per z = reiϕ es fer una rotacio d’angle ϕ respectede l’origen, seguida d’una homotecia de rao r (un estirament si r > 1, unencongiment si r < 1).

La forma exponencial facilita encara mes el calcul de potencies: si tenimun nombre complex z = reiϕ aleshores

zn = reiϕ . . . reiϕ = rneinϕ

Una aplicacio trigonometrica es el calcul de formules pel cosinus i el sinusd’angles multiples:

Page 146: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

146 APENDIX A. NOMBRES COMPLEXES

Proposicio A.8. (Formula de de Moivre) Per un angle ϕ i un multiple nqualsevols es te:

cos(nϕ) + i sin(nϕ) =n∑

j=0

(n

j

)cosn−j ϕ ij sinj ϕ

Demostracio. Sigui el nombre complex de modul 1 z = eiϕ = cos ϕ + i sin ϕ.Calculem-li la potencia n–essima en forma exponencial i rectangular. Enforma exponencial:

zn = (eiϕ)n = einϕ = cos(nϕ) + i sin(nϕ)

d’on deduım que cos(nϕ) = Re zn, sin(nϕ) = Im zn. Si calculem la potenciaen forma rectangular tenim pel binomi de Newton

zn = (cos ϕ + i sin ϕ)n =n∑

j=0

(n

j

)cosn−j ϕ ij sinj ϕ

Mostrem un parell d’aplicacions de la formula de de Moivre, primer lames trillada i despres la mes interessant.

Exemple A.9. Trobarem les formules pel sinus i el cosinus de l’angle triple.Per la formula de de Moivre

cos 3ϕ + i sin 3ϕ = (cos ϕ + i sin ϕ)3

= cos3 ϕ + 3 cos2 ϕ i sin ϕ + 3 cos ϕ i2 sin2 ϕ + i3 sin3 ϕ

=(cos3 ϕ− 3 cos ϕ sin2 ϕ

)+ i

(3 cos2 ϕ sin ϕ− sin3 ϕ

)Igualant les parts real i imaginaria arribem a:{

cos 3ϕ = cos3 ϕ− 3 cos ϕ sin2 ϕsin 3ϕ = 3 cos2 ϕ sin ϕ− sin3 ϕ

(A.3)

Exemple A.10. A qualsevol taula trigonometrica podem llegir que sin π6

=12, cos π

6=

√3

2, sin π

3=

√3

2, cos π

3= 1

2. Ara podem demostrar que aquests son

els valors exactes de sin i cos en aquests angles.Per ϕ = π

6tenim 3ϕ = π

2, i per tant cos 3ϕ = 0, sin 3ϕ = 1. Si apliquem

la formula de de Moivre, o la (A.3) directament, tenim

0 = cos3 π6− 3 cos π

6sin2 π

6

1 = 3 cos2 π6

sin π6− sin3 π

6

Page 147: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

A.3. ARRELS DE NOMBRES COMPLEXES 147

A la primera equacio podem treure factor comu cos π6, que sabem que es no

nul perque cos es estrictament positiu entre 0 i π2, on val zero per primer cop.

Per tantcos2 π

6− 3 sin2 π

6= 0

Si ara apliquem que sin2 ϕ = 1− cos2 ϕ tenim

4 cos2 π

6− 3 = 0

d’on deduım que cos π6

=√

32

i sin π6

=√

1− cos2 π6

= 12, ja que per estar

l’angle al primer quadrant el seu sinus i cosinus han de ser positius.Els valors per π

3es dedueixen ara de les identitats trigonometriques sin(π

2−

ϕ) = cos ϕ, cos(π2− ϕ) = sin ϕ.

A.3 Arrels de nombres complexes

Les arrels quadrades, cubiques, . . . son potencies fraccionaries dels nombrescomplexes, i com a tals les podem calcular facilment en forma exponencial.Ara be, cal vigilar de no deixar–se solucions debut a la indeterminacio de l’ar-gument. Enlloc de demostrar la formula de les arrels calcularem un exempleque mostra com funciona.

Exemple A.11. Trobar totes les arrels cubiques, reals o complexes, de 1:Busquem els nombres complexes de la forma exponencial z = reiϕ tals

quez3 = r3ei3ϕ = 1 = 1 · ei0

Igualant modul i argument aixo equival al sistema{r3 = 1

3ϕ = 0 + k2π, k ∈ Z

L’equacio del modul te solucio unica 1. Hauria estat aixı per qualsevol arrelja que el modul r ha de ser un nombre real positiu, i la funcio r 7→ rn esestrictament creixent en [0,∞) per tot n.

L’equacio de l’argument te en canvi mes solucions: dos angles son igualsquan la diferencia entre ells es un multiple enter de 2π (comptem en radians).Aixı tenim

3ϕ = 0, 2π, 4π, 6π, · · · − 2π,−4π, . . .

i l’argument pot ser

ϕ = 0,2π

3,4π

3, 2π, . . . ,−2π

3, . . .

Page 148: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

148 APENDIX A. NOMBRES COMPLEXES

Observem pero que per cada 6π radians que sumem o restem a 3ϕ estemsumant o restant 2π a ϕ, cosa que no canvia l’angle. Per tant nomes hi hantres solucions diferents per l’argument: ϕ = 0, 2π

3, 4π

3. Les arrels cubiques de

1 son doncs

z1 = 1ei0 = 1, z2 = 1ei 2π3 =

1

2+ i

√3

2, z3 = 1ei 4π

3 =1

2− i

√3

2

De la mateixa manera que hem fet el darrer calcul podem deduır laformula general:

Proposicio A.12. Si z = reiϕ es un nombre complex no nul, te n arrels n–essimes complexes, totes elles amb modul n

√r (la unica solucio real positiva)

i argumentsϕ

n,ϕ

n+

n,ϕ

n+ 2

n, . . .

ϕ

n+ (n− 1)

n

Notem com a detall geometric que les n arrels de z formen un polıgonregular de n costats i radi n

√r en el pla complex.

Page 149: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

Apendix B

Polinomis

Un polinomi en una variable x es una funcio combinacio lineal de potenciesde x

p(x) = anxn + an−1x

n−1 + · · ·+ a1x + a0

Els coeficients del polinomi son els nombres an, . . . , a0 que multipliquen a lespotencies de la variable. El grau del polinomi (grau p(x) o deg p(x)) es lapotencia de x mes alta amb coeficient no nul.

Les operacions amb polinomis son operacions com a funcions:

- La suma es fa terme a terme

(7x3+5x2−3x+4)+(2x2−18) = 7x3+(5+2)x2−3x+(4−18) = 7x3+7x2−3x−14

- El producte segueix la propietat distributiva

(x2−2x+6)(x2+x−4) = x4+x3−4x2−2x3−2x2+8x +6x2+6x−24 = x4−x3+6x−24

En canvi, la funcio quocient de dos polinomis en general ja no es un polinomi,per exemple f(x) = x

x+1. Aixo dona lloc a la seguent

Definicio B.1. La divisio d’un polinomi p(x) (el dividend) per un altrepolinomi d(x) (el divisor) es una igualtat

p(x) = q(x)d(x) + r(x)

on q(x) es el quocient i r(x) el reste, tals que

grau r(x) < grau d(x)

Diem que la divisio es exacta (o sense reste) si r(x) = 0. Tambe diem sir(x) = 0 que d(x) es un factor de p(x).

149

Page 150: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

150 APENDIX B. POLINOMIS

Proposicio B.2. La divisio d’un polinomi p(x) per un altre d(x) existeixsempre i es unica.

La demostracio de que la divisio de polinomis existeix es l’algoritme per afer–la, del que recordem un exemple a continuacio. La unicitat del quocienti el reste les deixem com a exercici teoric, que es pot trobar a la bibliografia.

Exemple B.3. Dividim p(x) = −2x3 + 11x2− 3x + 5 per d(x) = x2− 3x + 2:

−2x +11x −3x +5 x −3x +2

+2x −6 x +4x −2x+5

5x +x +5

−5x +15x−10

16x −5

3 2 2

3 2

2

2

reste

quocient

divisordividend

Si hem de dividir un polinomi p(x) per un divisor de la forma d(x) = x−aho podem fer per la regla de Ruffini, que tambe recordem amb un exemple:

Exemple B.4. Dividim p(x) = 2x3 − 3x2 + 12 per d(x) = x + 1:

2 −3 0 12−1

2

−2

−5

5

5

−5

7

quocient reste

Figura B.1: Quocient 2x2 − 5x + 5, reste 7

Com son les divisions per un polinomi de la forma d(x) = x− a? Com elgrau del reste ha de ser mes petit que el del divisor cal que sigui zero, es adir que el reste es una constant:

p(x) = q(x)(x− a) + r0 (B.1)

Aquest reste es facil d’identificar:

Proposicio B.5. El reste de dividir p(x) per x− a es el nombre p(a).

Page 151: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

151

Demostracio. Si substituım x = a a la igualtat (B.1) tenim

p(a) = q(a)(a− a) + r0 = r0

El sistema de calcul de p(a) dividint per x−a amb el metode de Ruffini imirant el reste es coneix com regla de Horner. Es el procediment mes rapid(que requereix menys operacions) per calcular p(a), i es molt precıs si tre-ballem amb dades aproximades o arrodonides. Una altra aplicacio immediatade la Prop. B.5 es:

Corol·lari B.6.

p(a) = 0 ⇐⇒ x− a divideix exactament a p(x)

Quan p(a) = 0 diem que x = a es una arrel (o zero) de p(x). Pel Cor.B.6 aixo equival a que x− a sigui un factor de p(x), aixo justifica la seguent

Definicio B.7. El polinomi p(x) te un zero d’ordre m en x = a, per m ≥ 1,si p(x) = (x− a)mq(x) i q(x) no te cap mes factor x− a.

L’ordre dels zeros d’un polinomi tambe es pot trobar amb les derivades:

Lema B.8. x = a es zero d’ordre m de p(x) si i nomes si x = a es zero dep(x), p′(x), p′′(x), . . . p(m−1)(x).

La demostracio del lema B.8 es pot fer per induccio sobre m i es deixapel lector.

Notem ara que si un polinomi te grau n, no pot tenir mes de n zeros(comptats amb multiplicitat), ja que el grau del producte es la suma degraus. Si treballem amb nombres reals no sempre arribem a aquest lımit,per exemple x2 + 1 no te zeros reals. La situacio canvia si admetem zeroscomplexes:

Teorema B.9. (Teorema fonamental de l’Algebra) Si p(x) es un polinomia coeficients reals (o complexes) de grau n, aleshores te exactament n zeroscomplexes comptats amb multiplicitat.

Es a dir, per p(x) = anxn + · · ·+ a1x + a0 tenim sempre una factoritzacio

p(x) = an(x− α1)(x− α2) . . . (x− αn)

on α1, α2, . . . , αn ∈ C poden no ser reals o estar repetits.

Page 152: Jaume Amoros UPC Barcelona 2002/10/11web.mat.upc.edu/jaume.amoros/algquim.pdf- S. Lipschutz, Algebra lineal´ 2a Ed. McGraw–Hill, 1992. - F. Puerta, Algebra lineal I` i II. Col.

152 APENDIX B. POLINOMIS

La demostracio del teorema fonamental de l’Algebra utilitza propietatsde la Topologia del pla complex per sobre dels continguts d’aquest curs. Re-marquem nomes que els nombres complexes es van introduir per a resoldre lesequacions quadratiques (vegeu l’apendix A), pero han resultat ser suficientsper a resoldre totes les equacions polinomials a coeficients en els reals o enels propis complexes. Hom expressa aquesta propietat dient que C es un cosalgebraicament tancat.

Trobar els zeros de polinomis, com de funcions en general, es un problemad’importancia evident (resolucio d’equacions, calcul d’extrems, representaciode funcions . . . ). Si volem trobar les arrels a partir dels coeficients del poli-nomi el que ens trobem es:

- Als polinomis de graus 1 i 2 els podem trobar els zeros amb les formulestıpiques d’ensenyament secondari.

- Pels polinomis de graus 3 i 4 tambe existeixen formules per calcular elszeros, pero son complicades i poc practiques.

- Pels polinomis de grau 5 o mes no existeix cap formula que dongui elszeros excepte en casos molt especials (i simples).

El que hom pot fer a partir de grau 3 (i per sota tambe, si es vol) escalcular els zeros del polinomi aproximadament . . . amb un marge d’error tanpetit com es vulgui! amb metodes numerics com ara el de Newton. Deixemaquest problema pels cursos de Calcul, i assenyalem nomes alguns trucs quepodem aplicar per trobar zeros a ull en casos molt senzills:

Lema B.10. Si p(x) es un polinomi real, i α ∈ C es un zero complex de p,el seu conjugat α tambe ho es i te la mateixa multiplicitat.

Lema B.11. Si p(x) = xn + an−1xn−1 + · · · + a1x + a0 te an = 1 i tots els

coeficients enters, qualsevol zero racional seu ha de ser un enter que divideixia a0.

Lema B.12. Si p(x) = anxn +an−1x

n−1 + · · ·+a1x+a0 te tots els coeficientsenters i sense cap factor comu, qualsevol zero racional seu ha de ser de laforma a = p

qamb p, q sense factor comu, p dividint a a0 i q dividint a an.