Unidad 2 matrices

30
Matrices 3.1 El concepto de matriz 3.2 Operaciones con matrices 3.3 Propiedades de las operaciones con matrices 3.4 La inversa de una matriz 3.5 Aplicación: Distribución de población matrices 1

Transcript of Unidad 2 matrices

Matrices

3.1 El concepto de matriz

3.2 Operaciones con matrices

3.3 Propiedades de las operaciones con

matrices

3.4 La inversa de una matriz

3.5 Aplicación: Distribución de población

matrices 1

3.1El concepto de matrizComo se vio en el capítulo anterior, la solución de sistemas deecuaciones lineales puede hallarse eficientemente utilizandosolamente los coeficientes de las incógnitas asociadas a los sistemaslineales. Este ordenamiento de números se conoce como una matriz,y los elementos de esta matriz se llaman entradas de la matriz.Ejemplos de matrices son:

El tamaño o dimensión de una matriz de define como el número defilas por el número de columnas. En el ejemplo, la primera matriz esde dimensión 3x2, la segunda es de 3x3, la tercera es de 1x4 y lacuarta es de 4x1. Si una matriz es de dimensión 1xn, como en eltercer ejemplo, se llamará un vector fila, mientras que una matriz nx1,como en el cuarto ejemplo, se llamará un vector columna. En generalse usarán las primeras letras mayúsculas del alfabeto para denotaruna matriz, es decir, se escribirán como A, B, C, etc.. Las entradas deuna matriz se denotarán como aij y representarán la entrada que seencuentra en la fila i-ésima y la columna j-ésima.

matrices 2

1

1

1

1

;

54

03

21

;

000

2/10

12

e ;1012

Entonces, en general una matriz de dimensión mxn se puederepresentar como

Si la matriz es de dimensión nxn, se llama matriz cuadrada deorden n, y las entradas a11, a22, ....,ann se dice que están sobre ladiagonal principal de A.

Dos matrices son iguales si tienen la misma dimensión y lasentradas correspondientes son iguales. Una matriz es cero,denotada con O, si todas sus entradas son idénticamente igual acero.

matrices 3

mnmm

n

n

ij

aaa

aaa

aaa

aA

21

22221

11211

nnnn

n

n

aaa

aaa

aaa

21

22221

11211

3.2 Operaciones con matrices

Definición (Suma de matrices): Sean A={aij} y B={bij} matrices de la

misma dimensión mxn. La suma A+B es la matriz C={cij} de

dimensión mxn, donde

cij = aij + bij ,

esto es, la suma de las entradas correspondientes.

Ejemplo:

Definición (Producto de una matriz por un escalar): Sea A={aij}

una matriz mxn y r un escalar. El producto rA del escalar r y la matriz

A es la matriz B={bij} de la misma dimensión de A tal que bij = r aij

Ejemplo:

matrices 4

221

220

151

201

130

421

0622

01668

0024

12402

0311

0834

0012

6201

2

Definición (Matriz transpuesta): Sea A={aij} una matriz mxn. La

matriz transpuesta, denotada como AT, es la matriz cuyas

columnas son las filas de A. Una matriz simétrica es aquella que

es igual a su transpuesta, es decir, A=AT. Evidentemente una

matriz simétrica tiene que ser cuadrada.

Ejemplos:

Definición (Matriz Identidad): La matriz identidad de dimensión

nxn, denotada In , es la matriz cuyos elementos sobre la diagonal

principal es igual a 1, y todas las otras entradas son iguales a cero.

Ejemplo:

matrices 5

024

201A

02

20

41TA

1085

860

501

A

1085

860

501TA

100

010

001

3I10

012I

Multiplicación de matrices:Como ya se había visto en el capítulo anterior, un sistema deecuaciones lineales, por ejemplo 2x1 - 3x2=7

3x1 - x2=2,

tiene asociado una matriz A correspondiente a las incógnitas, y unvector b correspondiente a los términos independientes, es decir,

Si ahora se escriben las incógnitas como un vector

se puede denotar el sistema de ecuaciones lineales

como Ax=b, es decir

Esta última ecuación sugiere la noción de multiplicación de una matrizA por un vector columna x. Como noción preliminar, se introducirá elconcepto de producto escalar o producto punto de dos vectores.

matrices 6

2

7b

13

32A

2

1

x

xx

2

7

13

32

2

1

x

x

Definición (Producto punto o escalar): Sean a un vector 1xn y b un

vector nx1, es decir,

entonces el producto punto o escalar, denotado como a.b o <a,b> se

define como

Ejemplo:

matrices 7

nn aaaaa 121

n

n

b

b

b

b

b

1

2

1

nnnn babababababa 112211,.

62401a

5

7

0

3

2

b

14)5)(6()7)(2()0)(4()3)(0()2)(1(,. baba

Definición (Multiplicación de matrices): Sean A={aik} una matriz dedimensión mxn y B={bkj} una matriz de dimensión nxs. El productoAB es la matriz C={cij} de dimensión mxs, donde la entrada cij de C esel producto punto de la i-ésima fila de A y la j-ésima columna de B.

Nota: Obsérvese que el producto de dos matrices está definidosolamente cuando el número de columnas de A es igual al número defilas de B.

Ejemplo:

(-3)(5) + (5)(0) + (8)(2) = 1

matrices 8

36166874

1618471

4102012

1254

4046

4583

.

870

853

012

Posición c23

Columna 3Fila 2

En general, el elemento cij está dado por

Por ejemplo, si A3x4 , B4x7 , C7x3 , los productos AB3x7, BC4x3 y CA7x4

están definidos, mientras que no es posible multiplicar BA, AC y CB.

Debe observarse que el producto de matrices en general no es

conmutativa, esto es, aún cuando los productos AB y BA están

definidos, no es necesariamente cierto que AB=BA, como muestra el

siguiente ejemplo

matrices 9

sj

mi

bacn

k

kjikij

,...,1

,...,1

;1

178

94

52

10.

43

21

1613

43

43

21.

52

10

Algunas veces es deseable calcular una fila o una columna particular

del producto AB. El siguiente resultado permite obtenerlas:

* La j-ésima columna del producto AB=A[j-ésima columna de la matriz

B]

* La i-ésima fila del producto AB=[i-ésima fila de la matriz A]B

Ejemplos:

matrices 10

122648

13302712

2572

1310

3414

.062

421

4

27

7

1

1

.062

421

13302712

2572

1310

3414

.421

3

9

1

3

1

2

.

212

321

231

3

9

1

2

3

2

3

1

2

3

)1(

2

1

1

2

De este último ejemplo se puede concluir que la j-ésima columna del

producto AB puede verse como una combinación de las columnas de

la matriz A con los coeficientes de la j-ésima columna de la matriz B.

matrices 11

122648

13302712

2572

1310

3414

.062

421

0

42

6

20

2

14

8

12

0

47

6

2)1(

2

11

4

27

0

45

6

23

2

14

26

30

0

42

6

21

2

13

12

13

3.3 Propiedades de las operaciones con

matrices

Propiedades del producto punto o escalara) Propiedad conmutativa u . v = v . u

b) Propiedad distributiva u . (v + w) = u . v + u . w

c) Propiedad homogénea (r u) . v = u . (r v) = r (u . v)

Propiedades de las transpuestasa) Transpuesta de la transpuesta ( AT )T = A

b) Transpuesta de la suma ( A + B )T = AT + BT

c) Transpuesta del producto ( AB )T = BT AT

matrices 12

Propiedades de la aritmética matricial

a) Conmutatividad de la suma A+B =B+A

b) Asociatividad de la suma (A + B) + C = A + (B +

C)

c) Identidad para la suma A + O = O + A = A

d) Ley distributiva izquierda r (A + B) = r A + r B

e) Ley distributiva derecha (r + s) A = r A + s A

f) Asociatividad del producto por un escalar (r.s) A = r (s A)

g) Asociatividad del producto de matrices A(BC) = (AB)C

h) Producto por matriz identidad I A = A y B I =

B

i) Ley distributiva izquierda A (B + C) = AB + AC

j) Ley distributiva derecha (A + B) C = AC + BC

matrices 13

3.4 La inversa de una matrizRecordando que un sistema de n ecuaciones lineales con n incógnitasx1 ,x2 ,....,xn se puede expresar en la forma matricial

Ax=bdonde A es la matriz de coeficientes de nxn, x es el vector columna denx1

y b es el vector columna de nx1 de valores constantes, se puedepensar que una manera de resolver esta ecuación sería hallar unamatriz C tal que CA=I, de modo que

C(Ax)=Cb (CA)x=Cb Ix=Cb x=CbLo cual muestra que la solución al vector de incógnitas x debe ser elvector columna Cb. La cuestión es saber cuándo existe una matriz Cde nxn tal que

CA=I.

matrices 14

nx

x

x

x2

1

Por ejemplo, para la matriz no es difícil verificar que lamatriz

satisface que

Se dice entonces que la matriz C es una inversa de la matriz A. Estose define enseguida:

Definición (Inversa de una matriz): Sea A una matriz nxn. Una matrizC de nxn es una inversa de A si CA=AC=I.

Teorema: Sea A una matriz nxn con inversa C tal que CA=AC=I. SiD es otra matriz nxn tal que AD=I, entonces C=D.

Demostración: Como la multiplicación de matrices es asociativa, setiene que

C(AD)=(CA)D, de donde, como AD=I y CA=I, se tiene que

C(AD)=CI=C y (CA)D=ID=D, por tanto, C=D.

matrices 15

21

94A

41

92C

10

01

21

94

41

92

Se denotará la inversa de una matriz A, cuando exista, como A-1.

Entonces A A-1 = A-1 A = I. Nótese que no se debe expresar A-1

como 1/A.

Definición: Una matriz cuadrada que tiene inversa se llama invertible.

Una matriz cuadrada que no tiene inversa se llama singular.

Teorema: La matriz

es invertible si ad - bc 0, en cuyo caso la inversa está dada por la

fórmula

Teorema: Sean A y B matrices invertibles nxn. Entonces:

a) AB es invertible

b) (AB)-1 = B-1 A-1matrices 16

dc

baA

bcad

a

bcad

cbcad

b

bcad

d

ac

bd

bcadA

11

Definición: Si A es una matriz cuadrada, entonces se definen las

potencias de A como

Más aún, si A es invertible, entonces

Teorema: Si A es una matriz cuadrada y r y s son enteros, entonces

Teorema: Si A es una matriz cuadrada invertible, entonces

a) A-1 es invertible y (A-1 )-1 = A.

b) An es invertible y (An )-1 = (A-1 )n para n=0,1,2,....

c) Para cualquier escalar k>0, la matriz kA es invertible y (kA)-1 =

(1/k)A-1 .

matrices 17

;0 IA )0( veces

nAAAAAAn

n

veces

1111)(n

nn AAAAA

rssrsrsr AAAAA )(

Cálculo de las inversas:

Sea A={aij}una matriz nxn. Para hallar A-1 si es que existe, se debe

encontrar una matriz X={xij} nxn tal que AX=I, esto es, tal que

Esto es un sistema de ecuaciones con n vectores de incógnitas, y

entonces es posible aplicar el Método de Gauss-Jordan para

encontrar la inversa de A. La idea es transformar, por medio de

operaciones elementales por filas, la matriz aumentada del sistema

(A,I) a un sistema (I, A-1)

A-1 (A,I) (A-1 A, A-1 I) (I, A-1)

matrices 18

100

010

001

21

22221

11211

21

22221

11211

nnnn

n

n

nnnn

n

n

xxx

xxx

xxx

aaa

aaa

aaa

O sea, lo siguiente:

matrices 19

100

010

001

21

22221

11211

nnnn

n

n

aaa

aaa

aaa

nnnn

n

n

ccc

ccc

ccc

21

22221

11211

100

010

001

Operaciones elementales por filas

(Método de Gauss-Jordan)

A I

I A-1

Solución del sistema de ecuaciones Ax=b

¿Cuando el sistema de ecuaciones con el mismo número de

incógnitas que ecuaciones

Ax=b

tiene solución única?

Evidentemente, de la discusión anterior, la solución es única cuando

la transformación de Gauss-Jordan lleva a una matriz identidad, en

cuyo caso la solución es de la forma

x=A-1b.

En el caso de la ecuación

Ax=0,

esta tiene solución única si y solo si A-1 existe. Sin embargo, en este

último caso, si la reducción de Gauss-Jordan lleva a una fila con todos

los elementos iguales a cero, entonces habrá infinitas soluciones. En

el caso de que el elemento del vector b correspondiente sea diferente

de cero, entonces no habrá solución.

matrices 20

Ejercicios:

a) Determine si el producto de dos matrices simétricas es simétrica

b) Demuestre que si una matriz A es simétrica e invertible, entonces

la inversa es simétrica.

c) Demuestre que si A y B son matrices simétricas, entonces la

transpuesta de A es simétrica y que A+B y A-B son simétricas.

d) ¿Cómo es la transpuesta de una matriz triangular superior?

e) ¿Cuando una matriz triangular (superior o inferior) es

invertible?¿cómo es la respectiva inversa?

matrices 21

Aplicación: Distribución de población

Consideremos situaciones en las que se por alguna razón se divide un

conjunto (una población) en varios subconjuntos de acuerdo a una

regla dada. Tómese por ejemplo el caso de que se divide a los

ciudadanos de un país de acuerdo con sus ingresos en pobres,

ingreso medio y ricos. Otro ejemplo es la división de los habitantes de

México de acuerdo con el clima en el que viven: caluroso, templado,

frío. En general se hablará de la población (ciudadanos de un país,

habitantes de México) y de los estados (pobres, ingresos medios,

ricos; caluroso, templado, frío).

Con frecuencia las poblaciones constan de personas, pero pueden

constar de la población de automóviles, de presas-predadores, etc.

El interés aquí consiste en determinar como la distribución de

población puede cambiar de estado durante un período de tiempo

(cuantos pobres se vuelven ricos, cuántos de ingresos medios se

vuelven pobres y cuántos ricos, etc.). Las matrices pueden

desempeñar un papel importante en este análisis.

matrices 22

La tendencia de una población a moverse entre n estados se puede

describir mediante una matriz nxn. Considérese una población

distribuida entre n=3 estados 1,2 y 3. Se asumirá que se conoce la

proporción de la población que se encuentra en un estado j que se

mueve al estado i en un determinado periodo de tiempo. Esto se

denotará como tij. La matriz formada con todos los elementos tij se

llamará una matriz de transición.

Tomemos como ejemplo la clasificación de un país en los estados:

Estado 1: Pobres

Estado 2: ingresos medios

Estado 3: Ricos

Supóngase que en un periodo de 20 años (alrededor de una

generación), se tienen los siguientes datos para la población y su

descendencia:

a) De la gente pobre, el 19% pasó a ingresos medios y el 1% a ricos

b) De la gente de ingresos medios, el 15% pasó a pobre y el 10% a

ricos.

c) De la gente rica, el 5% pasó a pobre, y el 30% a ingresos medios.

Entonces se pueden escribir las siguientes transiciones:matrices 23

t11 = .8 (80% permaneció pobre);

t12 = .19 (19% de pobre a ingresos medios)

t13 = .01 (1% de pobre a ricos)

t21 = .15 (15% de ingresos medios a pobre )

t22 = .75 (75% permaneció en ingresos medios)

t23 = .10 (10% de ingresos medios a ricos)

t31 = .05 (5% de ricos a pobres)

t32 = .30 (30% de ricos a ingresos medios)

t33 = .19 (19% permaneció ricos)

por lo cual la matriz de transición está dada por

Obsérvese que la suma de las entradas de cada columna es igual a 1,pues la suma refleja el movimiento de toda la población durante elperiodo de tiempo.

matrices 24

mediopobre

pobre

rico

medio

rico

65.10.01.

30.75.19.

05.15.80.

T

Supóngase que las proporciones iniciales de toda la población están

dadas en el vector x(0) de dimensión nx1, por ejemplo

indicaría que el total de la población estaría inicialmente dividida por igual

entre los estados. También la suma de las entradas de este vector x(0)

debe ser igual a 1. Ahora bien, ¿cuál es la proporción de la población que

se encuentra en el estado 1 después del periodo de 20 años? Para esto,

la proporción de la población del estado 1 que permanece en el estado 1

es t11 , por lo que la contribución a la proporción de toda la población que

se encontrará en el estado 1 después de 20 años es precisamente t11

x1(0). De la misma manera la contribución de los estados 2 y 3 será t12

x2(0) y t13 x3(0) respectivamente. Así, después de 20 años, la proporción

del estado 1 es t11 x1(0) + t12 x2(0) + t13 x3(0), que es precisamente el

primer elemento del producto

matrices 25

3/1

3/1

3/1

)0(

)0(

)0(

)0(

3

2

1

x

x

x

x

)0(

)0(

)0(

)0(

3

2

1

333231

232221

131211

x

x

x

ttt

ttt

ttt

Tx

De manera similar se hallan las componentes de población del estado

2 y el estado 3 después de un periodo de tiempo.

Supongamos ahora que la misma matriz de transición es válida para

os siguientes 20 años, y también para los sucesivos periodos, esto es,

existe una sucesión o cadena de periodos de 20 años para los cuales

es válida la matriz de transición. Una situación así se llama una

cadena de Markov.

Definición: Una matriz de transición para una cadena de Markov de n

estados es una matriz de nxn con todos las entradas no negativas y

con la propiedad adicional de que la suma de las entradas de cada

columna es igual a 1.

Las cadenas de Markov aparecen de manera natural en biología,

economía, psicología, y en muchas otras áreas. La entrada tij en una

matriz de transición T se conoce como la probabilidad de pasar del

estado j al estado i en un periodo de tiempo.

Ejemplo: Analizar la matriz

matrices 26

010

001

100

T

Retomado el ejemplo anterior, si se quiere calcular el valor del estado

después de un periodo, tomando como condición inicial el vector

anterior, entonces este estado, que denotaremos como x(1), será:

Asimismo, el estado x(2) después de otro periodo de 20 años será:

Nótese que el vector de estados x(2) = T x(1), pero dado que x(1) = T

x(0), entonces x(2) puede también escribirse como x(2) = T2 x(0), con

T2 dada por

matrices 27

3/76.

3/24.1

3/1

3/1

3/1

3/1

65.1.01.

3.75.19.

05.15.8.

)0()1( Txx

3/628.

3/348.1

3/024.1

3/76.

3/24.1

3/1

65.1.01.

3.75.19.

05.15.8.

)1()2( Txx

453.1415.0335.

4295.621.2975.

1175.2375.669.2T

Esto se puede extender a m periodos, es decir, una cadena de Markov

con matriz de transición T, tiene Tm como matriz de transición para m

periodos, y el estado después de m periodos está dado por

x(m)=Tmx(0).

Definición: Una matriz de transición T es regular si para algún entero

m, la matriz Tm no tiene ninguna entrada igual a cero. Una cadena de

Markov con una matriz de transición regular se llama cadena regular.

Ejemplo: Verificar la matriz de transición del ejemplo anterior.

Es posible demostrar que si una cadena de Markov es regular, entonces

después de muchos periodos de tiempo (o cuando el tiempo tiende al

infinito) , la distribución de población entre los estados tiende a un valor

fijo, o estado estacionario.

Teorema: Sea T una matriz de transición regular. Entonces existe un

única vector columna s con entradas estrictamente positivas cuya suma

es igual a 1 tal que satisface

a) Para m suficientemente grande, todas las columna de Tm tienden al

vector s

b) Ts = s matrices 28

En conclusión, para obtener el estado estacionario es necesario

resolver la ecuación Ts = s

o lo que es lo mismo, la ecuación

(T - I) s = 0

que puede resolverse usando el Método de Gauss-Jordan, verificando

que la suma de las entradas del vector s sea igual a 1.

En resumen, para resolver este tipo de problemas, hay que efectuar el

procedimiento siguiente:

Paso 1: Escribir la matriz de transición T.

Paso 2: Verificar que la cadena de Markov es regular, esto es, Tm no

tiene entradas cero para algún m.

Paso 3: Resolver la ecuación (T - I) s =0 con la restricción

s1 + s2 + ...+ sn = 1.

matrices 29

Ejemplo: Los habitantes de una comunidad con tendencias

vegetarianas acuerdan las reglas siguientes:

a) Nadie comerá carne dos días seguidos

b) Una persona que no coma carne un día, lanzará una moneda legal

al aire y comerá carne el día siguiente si y solo si, sale cruz.

Determinar la proporción de la población que no comen carne y las que

sí comen carne.

Solución: La matriz de transición es

Asimismo, por lo que la cadena de

Markov es regular.

Resolviendo la matriz aumentada se tiene que s1 =

2t; s2 = t, lo que, junto con la restricción

s1 + s2 = 1, resulta en 2t + t = 1, de donde t=1/3 y en consecuencia, el

estado estacionario es

matrices 30

05.0

15.0T

carne

No carne carneNo carne

5.25.

5.75.2T

0

0

15.

15.

3/1

3/2s