UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

70
UNIVERSIDAD NACIONAL DE SAN AGUST ´ IN DE AREQUIPA FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEM ´ ATICAS APLICACI ´ ON DEL PRINCIPIO DEL M ´ AXIMO DE PONTRYAGIN SOBRE GRUPOS DE DIMENSI ´ ON DOS Y TRES Tesis presentada por el Bachiller: William Eduardo Valdivia Hanco, para optar el ıtulo profesional de Licenciado en Matem´aticas. Asesor: Dra. Maria Luisa Torreblanca Todco Co-Asesor: Dr. Victor Alberto Jos´ e Ayala Bravo AREQUIPA - PER ´ U 2021

Transcript of UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Page 1: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

UNIVERSIDAD NACIONAL DE SAN AGUSTIN DEAREQUIPA

FACULTAD DE CIENCIAS NATURALES Y FORMALES

ESCUELA PROFESIONAL DE MATEMATICAS

APLICACION DEL PRINCIPIO DEL MAXIMO DEPONTRYAGIN

SOBRE GRUPOS DE DIMENSION DOS Y TRES

Tesis presentada por el Bachiller:William Eduardo Valdivia Hanco,para optar el tıtulo profesional deLicenciado en Matematicas.

Asesor: Dra. Maria LuisaTorreblanca Todco

Co-Asesor: Dr. Victor Alberto JoseAyala Bravo

AREQUIPA - PERU2021

Page 2: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

UNIVERSIDAD NACIONAL DE SAN AGUSTIN DEAREQUIPA

FACULTAD DE CIENCIAS NATURALES Y FORMALES

ESCUELA PROFESIONAL DE MATEMATICAS

APLICACION DEL PRINCIPIO DEL MAXIMO DEPONTRYAGIN

SOBRE GRUPOS DE DIMENSION DOS Y TRES

William Eduardo Valdivia Hanco

Tesis presentada a la Facultad de Ciencias Naturales yFormales de la Universidad Nacional de San Agustın paraoptar el Tıtulo profesional de Licenciado en Matematicas.

Asesor: Dra. Maria Luisa Torreblanca TodcoCo-Asesor: Dr. Victor Alberto Jose Ayala Bravo

Este ejemplar corresponde a la version finalde la tesis defendida por el alumno WilliamEduardo Valdivia Hanco, y orientado por losprofesores: Dra. Marıa L. Torreblanca Todco yDr. Vıctor Ayala Bravo.

Dra. Maria Luisa Torreblanca Todco Dr. Victor Alberto Jose Ayala BravoASESOR CO-ASESOR

AREQUIPA- PERU2021

Page 3: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

FICHA CATALOGRAFICA

Valdivia Hanco, William Eduardo

APLICACION DEL PRINCIPIO DEL MAXIMO DE PONTRYAGIN

SOBRE GRUPOS DE DIMENSION DOS Y TRES

Arequipa, 2021

Tesis presentada a la Facultad de Ciencias Naturales y Formales de laUniversidad Nacional de San Agustın para optar el Tıtulo profesional

de Licenciado en Matematicas.

Asesor: Dra. Maria Luisa Torreblanca TodcoCo-Asesor: Dr. Victor Alberto Jose Ayala Bravo

1. Sistemas de Control Lineales, Controlabilidad. 2. Principio del Maximode Pontryagin. 3. Hamiltoniano. 4. Grupos de Lie. 5. Algebras de Lie.

Page 4: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

FICHA DE APROBACION

APLICACION DEL PRINCIPIO DEL MAXIMO DE PONTRYAGIN

SOBRE GRUPOS DE DIMENSION DOS Y TRES

William Eduardo Valdivia Hanco

Tesis presentada a la Facultad de Ciencias Naturales y Formales de la UniversidadNacional de San Agustın para optar el Tıtulo profesional de Licenciado en Matematicas.

JURADO DICTAMINADOR:

Mg. Doris Salome Tupacyupanqui JaenPresidenta

Dra. Maria Luisa Torreblanca TodcoAsesor

Mg. Edwin Chaina CahuiSecretario

Fecha de aprobacion: 12 de julio de 2021

Page 5: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Dedicatoria

Dedico este trabajo de tesis a mis padres Richard y Martha quienes me brindaron suapoyo y buenos consejos, por ser los principales promotores de mis suenos, graciasa ellos por que cada dıa confiaron y creyeron en mı y en mis ideales.

Dedico este trabajo a mi hermano, quien fue mi amigo incondicional en los tiemposdifıciles.

I

Page 6: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Agradecimientos

Quiero agradecer en primer lugar a Dios, por guıarme en el camino de mi desarrolloprofesional y permitirme la conclusion de la presente tesis.

Agradezco al equipo de investigacion en el cual se desarrollo este proyecto, en es-pecial al Dr. Vıctor Ayala Bravo y la Dra. Marıa Torreblanca Todco. Gracias por suguıa, apoyo e ideas que motivaron al desarrollo de cada etapa del trabajo.

Y tambien quiero agradecer a mis companeros con los cuales compartimos y man-tenemos una amistad, creando ası una familia.

Ademas, debo agradecer a mis profesores de la Escuela Profesional de Matematicaspor sus consejos y apoyo continuo para ser mejor cada dıa, en especial al Dr. VladimirRosas Meneses.

Gracias a la vida por este triunfo que me motiva a seguir superandome. Gracias atodas las personas que me apoyaron y creyeron en la realizacion y culminacion de estetrabajo de tesis.

Agradezco a la Universidad Nacional de San Agustın, que me permitio ser integrantedel equipo de investigacion del Proyecto “ Principio del Maximo de Pontryagin sobresistemas de control afines en grupos de Lie con contrato Nro. IAI-014-2018-UNSA”.

II

Page 7: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Resumen

En este trabajo se presenta un analisis de la aplicacion del Principio del Maximo dePontryagin (PMP) para grupos de Lie de dimension 2 (grupo afın) y de dimension 3(grupo de Heisenberg, grupo rotacional y grupo especial lineal) a traves del estudiode las ecuaciones Hamiltonianas dadas por el PMP. Ademas, se dan las condicionesnecesarias generales para la existencia de minimizadores de tiempo, los cuales apa-recen cuando los controles son no-acotados para los grupos de Lie ya mencionados.

Palabras clave: Sistemas de Control Lineales, Controlabilidad, Principio del Maxi-mo de Pontryagin, Hamiltoniano, Grupos de Lie, Algebras de Lie.

III

Page 8: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Abstract

This paper presents an analysis of the application of the Principle of MaximumPontryagin (PMP) for Lie groups of dimension 2 (affine group) and of dimension 3(Heisenberg group, rotational group and linear special group) through the study ofthe Hamiltonian equations given by the PMP. In addition, the necessary conditionsare met general rules for the existence of time minimizers, which appear when thecontrols they are unbounded for the Lie groups already mentioned.

Keywords: Linear Control Systems, Controllability, Pontryagin’s Maximum Prin-ciple, Hamiltonian, Lie Groups, Lie Algebra.

IV

Page 9: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Indice

Introduccion 1

1. Preliminares 41.1. Curva integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2. Grupos de Lie y Algebras de Lie . . . . . . . . . . . . . . . . . . . . . . 51.3. Campos Invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.4. Representacion adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.5. Aplicacion Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2. Sistemas de Control Lineales en Rn 222.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3. Sistemas de Control Lineales sobre grupos de Lie 303.1. Normalizador de un algebra de Lie . . . . . . . . . . . . . . . . . . . . 303.2. Sistema de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2.1. La condicion del rango . . . . . . . . . . . . . . . . . . . . . . . 393.3. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4. El Principio del Maximo de Pontryagin 414.1. El Principio del Maximo de Pontryagin para problemas de tiempo Optimal 414.2. Resultados Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.2.1. El caso No-acotado . . . . . . . . . . . . . . . . . . . . . . . . . 434.2.2. Caso Acotado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.3. Aplicacion del Principio del Maximo de Pontryagin . . . . . . . . . . . 444.3.1. El grupo Afın Aff+(2) . . . . . . . . . . . . . . . . . . . . . . . 444.3.2. El grupo de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . 504.3.3. El caso compacto SO(3,R) . . . . . . . . . . . . . . . . . . . . 554.3.4. El caso semi-simple no-compacto SL(2,R) . . . . . . . . . . . . 56

Conclusiones 57

Bibliografıa 59

V

Page 10: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Introduccion

El principio del maximo tiene sus raıces en el calculo de variaciones y se desarrolladentro de la teorıa de ecuaciones diferenciales ordinarias y de la teorıa de control. Laidea central del principio del maximo nace en las condiciones necesarias de optimali-dad estudiadas inicialmente por Weierstrass, y desarrolladas posteriormente por Bolzay Caratheodory a finales del siglo XIX y principios del siglo XX y mas recientementeen la segunda mitad del siglo pasado por Bellman y Hestenes.

El Principio del Maximo de Pontryagin surge como respuesta a una serie de interro-gantes de los ingenieros, que le hacen llegar repetidas veces al grupo de investigadoresde Pontriagyn, del Instituto de Steklov. Este grupo de investigadores establece esteprincipio y lo publica en su libro (Pontryagin, Lev Semenovich, 1987).Ver [37].

El proposito de esta Tesis es considerar posibles aplicaciones a traves del Principiodel Maximo de Pontryagin para sistemas de control Lineal ΣG en un grupo de Lie Gde matrices de dimension menor.

La Teorıa de Lie se refiere a la teorıa que integra el concepto de grupo de Lie yalgebra de Lie a traves de la aplicacion exponencial. Los grupos de Lie se utilizan am-pliamente en todos los aspectos de la matematica y la fısica moderna. La relevanciade la Teorıa de Lie en las aplicaciones se ha hecho evidente. Con respecto a esta tesis,mencionamos que la Teorıa de Lie es una poderosa herramienta para el estudio de lasecuaciones diferenciales, ver [19] y [31]. Por lo tanto, la extension del sistema de controllineal sobre Rn a cualquier grupo de Lie conexo, es relevante.

Para construir ejemplos, en esta tesis mostramos explıcitamente las algebras de Liede dimension 2 y 3 y sus correspondientes grupos de Lie simplemente conexos. Ademascalculamos todos los campos vectoriales lineales posibles y los campos vectoriales inva-riantes a izquierda, los cuales son los ingredientes principales para construir la dinamicade ΣG. Para ambas dimensiones, caracterizamos la condicion de rango de algebra LieLARC, la propiedad de controlabilidad, la existencia y la forma de los conjuntos decontrol en la dimension 2. Todavıa no hay informacion para los conjuntos de control ΣG

en dimension 3. Desde un punto de vista de la optimizacion, damos en forma explıcitalas ecuaciones Hamiltonianas de un problema de tiempo optimo para ΣG como apareceen [4, 11]. El problema cuadratico esta abierto para esta clase de sistemas.

Es bien sabido que los sistemas de control, particularmente la clase ΣRn , se hautilizado como modelo para aplicaciones hermosas y concretas. Por ejemplo, problemasde control optimo: en crecimiento economico [3], en mecanica [31, 39], en Medicina,Biologıa y Quımica en [33, 45], en naves espaciales [20], en sistemas de ingenierıa en

1

Page 11: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

[25], para el problema de Dubin en [35], para la braquistocrona y temas relacionadosen [42], etc. Ademas, estamos seguros de que lo mismo es cierto para ΣG. Hay algunasrazones para creer eso. En primer lugar, la nocion de grupo de Lie permite descubrirlas simetrıas de las estructuras analıticas. Ademas, es capaz de descubrir las simetrıasde clases de ecuaciones diferenciales, [36]. Ejemplos de estas variedades son el grupoAbeliano Rn, las esferas Sn ⊂ Rn+1 para n = 1, 3 y 7, el conjunto GL(n,R) de lasmatrices reales invertibles de orden n, y sus subgrupos relevantes SL(n,R) de matricescon determinante 1, el grupo ortogonal O(n,R), el grupo espinor Spin(n,R), el grupounitario U(n,R) y muchos otros. Esto se aplica no solo a matrices con coeficientes reales,sino tambien con coeficientes complejos. Sin embargo, la razon principal proviene delTeorema de Equivalencia de Jouan [29] que dice en palabras: “Cualquier sistema decontrol afın en una variedad diferenciable arbitraria es equivalente a un sistema decontrol lineal en un grupo de Lie, o en un espacio homogeneo si y solo si el algebra deLie generada por los campos vectoriales del sistema inicial es de dimension finita ”.

Para comprender el significado del Teorema de equivalencia, y tambien como mo-tivacion general, considere un crecimiento tumoral con condicion inicial x0 y dinamicadeterminada por un campo vectorial f sobre el espacio de estados M , como la solucionx(t) de la ecuacion diferencial asociada,

x(t) = f(x(t)), x(t) ∈M, con x(0) = x0.

Decidir que combinacion de tratamientos es la adecuada para un paciente es fun-damental. La introduccion de los tratamientos g1, · · · , gm y las funciones de controlu = (u1, · · · , um) ∈ U definen un sistema de control afın que cambia el comporta-miento del tumor, a traves de las soluciones de la familia controlada de ecuacionesdiferenciales.

ΣM : x(t) = f(x(t)) +m∑i=1

ui(t)gi(x(t)), x(t) ∈M, u ∈ U , x(0) = x0.

Aquı, U es la clase admisible de funciones de control a escoger de manera adecuadaen cada caso.

Este proceso le brinda una forma de combinar un tratamiento global del control deun tumor. Aparecen dos problemas teorico-practicos:

En primer lugar, calcular A(x0) ⊂ M , el conjunto alcanzable desde x0 a traves delos controles u ∈ U , en tiempo positivo.

Por otra parte, suponga x1 ∈ A(x0). A partir de x0, ¿es posible llegar a x1 en tiempomınimo o con mınimo dano colateral ?.

El sistema ΣM es controlable desde x0 si A(x0) = M . Ademas, es controlable si escontrolable desde cualquier elemento de M . Sea t > 0, por razones tecnicas a veces esnecesario considerar el conjunto A(x0, t), es decir, el conjunto alcanzable desde x0 atraves de los controles u ∈ U hasta el tiempo t.

Al igual que ocurre con el problema del tratamiento del tumor, en el mundo realse pueden hacer preguntas similares para muchas situaciones. Desde un punto de vis-ta practico, dada una variedad M , el drift f a controlar y los vectores de controlg1, · · · , gm, la clase de control admisible U debe elegirse adecuadamente, de acuerdocon cualquier situacion real.

2

Page 12: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Para establecer el Teorema de equivalencia, necesitamos introducir la nocion decorchete de Lie entre campos vectoriales que en la practica se transforma en una medidade la no conmutatividad de las dinamicas involucradas dado por la formula,

[X, Y ] = X.Y − Y.X, donde X.Y =∂

∂XY.

El algebra de Lie SpanL.A.f, g1, · · · , gm denota el menor espacio vectorial gene-rado por f, g1, · · · , gm y cerrado por el corchete [ · , · ].

Teorema 0.1. (Teorema de equivalencia de Jouan, [29]) Si para ΣM

dim(SpanL.A.f, g1, · · · , gm) <∞,

entonces, existe un grupo de Lie G tal que ΣM es equivalente a ΣG o, es equivalente aΣG/H , donde H es un subgrupo cerrado de G y G/H es un espacio homogeneo.

Los sistemas equivalentes comparten las mismas propiedades topologicas, dinamicasy algebraicas. Por tanto, es posible obtener informacion de cualquier sistema ΣM arbi-trario que satisfaga la condicion de Jouan mediante un sistema lineal ΣG, o medianteun sistema homogeneo ΣG/H . Aquı, H es un subgrupo cerrado de G. Esta es una de lasprincipales razones por las que es necesario clasificar ΣG para diferentes clases de gru-pos: compactos, no-compactos, Abelianos, nilpotentes, solubles, simples, semi-simples,y los productos directos y semidirectos entre ellos. Desde 1999, un grupo de matemati-cos ha estado trabajando en la estructura de ΣG. Los resultados sobre controlabilidad yla existencia, unicidad y propiedades topologicas de los conjuntos de control (regionesmaximas de controlabilidad) se establecieron para varias clases de grupos. Invitamos alos lectores revisar las siguientes referencias [5, 6, 7, 8, 9, 13, 14, 15, 29, 34].

De acuerdo con el objetivo de esta Tesis, nos concentramos en los grupos matricia-les. Precisamente, para un grupo G de dimension 2 y 3, describimos los ingredientesprincipales para construir ΣG mostrando una base del algebra de Lie g de G, la ex-presion explicita de las g-derivaciones y todos los posibles campos lineales asociados adichas derivaciones. Tambien mencionamos los resultados de controlabilidad existen-tes y las ecuaciones Hamiltonianas para aplicar el Principio Maximo de Pontryagin enestos casos.

Para obtener una vision general de la teorıa de los sistemas de control, remitimosa los lectores a [1, 18, 19, 21, 24, 27, 28, 31, 44]. Para la teorıa de Lie, mencionamos[26, 38, 40, 43]. Para la conexion con la geometrıa sub-Riemanniana, casi Riemanniana,sugerimos las referencias [2, 4, 23].

Esta Tesis esta organizada de la siguiente manera. El capıtulo 1 presenta las estruc-turas algebraicas para definir los sistemas de control lineal ΣG sobre el grupo de Lie G.El capıtulo 2 contiene una descripcion explıcita de los sistemas de control lineal sobreRn y sus principales propiedades. En el capıtulo 3 se desarrolla una pequena descrip-cion de los sistemas de control lineal sobre grupos de Lie en general. Finalmente, en elcapıtulo 4, establecemos el Principio Maximo de Pontryagin para ΣG de manera gene-ral para distintos casos (caso acotado y no-acotado) y terminamos con las aplicacionesdel Principio del Maximo de Pontryagin para el grupo afın Aff+(2) de dimension 2, elgrupo de Heisenberg de dimension 3, el grupo lineal especial SL(2,R) de dimension 3y el grupo rotacional SO(3,R) de dimension 3.

3

Page 13: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Capıtulo 1

Preliminares

En este capıtulo presentaremos algunas definiciones y resultados basicos que nospermitiran la comprension del presente trabajo. Empezamos introduciendo algunosconceptos de ecuaciones diferenciales, y sus soluciones. Asumimos que el lector es fami-liarizado con el concepto de variedad diferenciable y aspectos basicos asociados a estanocion.

Como referencia basica tomaremos [23], [31], [40], [41] y [43].

1.1. Curva integral

Definicion 1.1. Sea X un campo vectorial diferenciable sobre una variedad M , yp ∈ M con Ip = [−ε, ε], ε > 0. Una curva integral de X es una curva diferenciableα : Ip −→M tal que

dα(t)

dt= X(α(t)) =: Xα(t), ∀t ∈ Ip α(0) = p.

Una curva integral es maximal si su dominio de definicion es conexo maximal.

Ejemplo 1.1. Sea X(x,y) = (−y, x) un campo vectorial sobre R2. Ahora hallaremosuna curva integral α(t) de X que empiece en el punto (1, 0) ∈ R2. Recordemos que lacondicion para que α(t) = (x(t), y(t)) sea una curva integral es que α(t) = Xα(t), estoes,

α(t) =

[x(t)y(t)

]=

[−y(t)x(t)

]= Xα(t)

De modo que, solo debemos de hallar la solucion del sistema de ecuaciones diferencialesde primer orden,

x = −y,y = x,

con condicion inicial (x(0), y(0)) = (1, 0), de la primera ecuacion se tiene que y = −x,luego derivando se tiene y = −x. Sustituyendo esto en la segunda ecuacion se obtiene,

x = −x

4

Page 14: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

cuya solucion viene dada por

x(t) = c1cos(t) + c2sen(t),

por lo tanto,y(t) = −x(t) = c1sen(t)− c2cos(t).

De las condiciones iniciales se tiene que c1 = 1, c2 = 0, ası que la curva integral α(t)que se inicia en (1, 0) viene dada por

α(t) = (cos(t), sen(t)).

Definicion 1.2. El flujo del campo X es una aplicacion Φ : R ×M −→ M definidapor Φ(t, g) = αt(g), donde M es una variedad diferenciable y αt(g) denota la curvaα(t) pasando por el punto g ∈M .

Observacion 1.1. En otras palabras, el flujo aplicado al par (t, g) genera la curvaintegral con condicion inicial g en cuanto transcurre el tiempo real t.

Proposicion 1.1. Sea Φ el flujo de X y M una variedad. Entonces Φ cumple lassiguientes propiedades:

i) Φ(0, g) = g, para todo g ∈M .

ii) Φ(t+ s, g) = Φ(t,Φ(s, g)), para cualesquier t, s ∈ R y g ∈M .

iii) ∂Φ(t,g)∂t

∣∣∣t

= X(Φ(t, g)), para cualquier t ∈ R y g ∈M .

1.2. Grupos de Lie y Algebras de Lie

Definicion 1.3. Un grupo de Lie es una variedad diferenciable G con una estructurade grupo, de modo que las aplicaciones µ e I llamadas de multiplicacion e inversa sondiferenciables, i.e.

µ : G×G −→ G I : G −→ G(g, h) 7−→ µ(g, h) = gh, g 7−→ I(g) = g−1

Ejemplo 1.2.i) El espacio euclideano Rn es un grupo de Lie bajo la operacion de adicion.ii) El conjunto C− 0 es un grupo de Lie bajo la operacion de multiplicacion.iii) El cırculo unitario S1 en C− 0 es un grupo de Lie bajo la multiplicacion.

Lema 1.1. (Caracterizacion alternativa de la propiedad de diferenciabili-dad) Sea G una variedad diferenciable con estructura de grupo de forma que la apli-cacion

p : G×G −→ G(g, h) 7−→ p(g, h) = gh−1

sea diferenciable, entonces G es un grupo de Lie.

5

Page 15: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Demostracion. Tomando g = e la aplicacion de la hipotesis se convierte en la inversion,la cual sera diferenciable pues la aplicacion p lo es. Por otra parte al ser G grupo, elelemento gh−1 ∈ G y h2 ∈ G, luego se obtiene

p(gh−1, h2) = gh−1h2 = gh

es la multiplicacion la cual es tambien diferenciable por hipotesis.

Ejemplo 1.3. Grupo Lineal General

Dados m,n enteros positivos, sea M(m,n) el espacio vectorial de todas las matricesreales de orden m × n. Como M(m,n) es isomorfo a Rmn, M(m,n) es dotado de latopologıa de Rmn. El grupo lineal general GL(n,R) es por definicion

GL(n,R) := A ∈M(n) | det(A) 6= 0= det−1(R− 0).

Como la funcion determinante

det : M(n) −→ R

es continua, GL(n,R) es un subconjunto abierto de M(n) ' Rn2. Por lo tanto GL(n,R)

es una variedad diferenciable, luego GL(n,R) es un grupo de Lie bajo la multiplicacionde matrices.En efecto, dadas A, B ∈ GL(n,R) la (i, j)− entrada del producto de

(AB)ij =n∑k=1

aikbkj,

es un polinomio en los coeficientes de A y B, luego la multiplicacion de matrices

µ : GL(n,R)×GL(n,R) −→ GL(n,R)

es diferenciable. Denotemos por Mij(A) el determinante de la submatriz de A obtenidade la eliminacion de la i-esima fila y la j-esima columna de A. De modo que, por laregla de Cramer las entradas de la matriz inversa quedan definidas, i.e,

(A−1)ij =1

detA· (−1)i+jMji(A),

la cual es una funcion diferenciable. Dado que el detA 6= 0, la aplicacion inversa

I : GL(n,R) −→ GL(n,R)

tambien es diferenciable. Ası, GL(n,R) es un grupo de Lie.

Ejemplo 1.4. Grupo Lineal Especial

Sea SL(n,R) = A ∈ GL(n,R) | detA = 1. Como

det(AB) = (detA)(detB) y det(A−1) =1

detA

6

Page 16: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

se tiene que SL(n,R) es un subgrupo de GL(n,R). Ahora probaremos que SL(n,R) esuna subvariedad regular de GL(n,R), para esto definamos

f : GL(n,R) −→ RA 7−→ f(A) = detA,

y notemos que f−1(1) = SL(n,R). Para que SL(n,R) sea una subvariedad regular deGL(n,R), basta probar que 1 es un valor regular de f . Ver [18] y [23].En efecto, sea aij 1 ≤ i ≤ n, 1 ≤ j ≤ n en las coordenadas usuales de Rn2

. Sidenotamos mij := Mij(A) obtenemos

f(A) = detA = (−1)i+1ai1mi1+(−1)i+2ai2mi2+· · ·+(−1)i+jaijmij+· · ·+(−1)i+nainmin.

Entonces∂f

∂aij= (−1)i+jmij.

Por lo tanto, la matriz A ∈ GL(n,R) es un punto crıtico de f si y solo si todos losmenores mij de orden (n− 1)× (n− 1) de A son 0. Puesto que, todas las matrices enSL(n,R) tienen determinante 1, se tiene que 1 es punto regular de la funcion determi-nante, por lo tanto SL(n,R) es una subvariedad regular de GL(n,R) de codimension1, esto es,

dimSL(n,R) = dimGL(n,R)− 1 = n2 − 1.

Las aplicaciones multiplicacion e inversa,

µ : SL(n,R)× SL(n,R) −→ SL(n,R)

I : SL(n,R) −→ SL(n,R)

son diferenciables, pues son heredadas de las mismas aplicaciones definidas sobre GL(n,R).Ası, SL(n,R) es un grupo de Lie.

Ejemplo 1.5. Grupo Ortogonal

Sea O(n) = A ∈ GL (n,R) | ATA = Id . Para mostrar que O(n) es un grupo deLie definamos la siguiente aplicacion

f : GL(n,R) −→ SA 7−→ f(A) = ATA,

donde S es el espacio vectorial de las matrices simetricas de dimension n(n+1)2

. Luego

calculando la dfA en X ∈ Rn2, se obtiene,

dfA(X) = lımt→0

f(A+ tX)− f(A)

t

= lımt→0

(A+ tX)T (A+ tX)− ATAt

= lımt→0

tXTA+ tATX + t2XTX

t= ATX +XTA.

7

Page 17: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

De modo que, si A es ortogonal, dada cualquier matriz simetrica S ∈ S podemos tomarX = 1

2AS para mostrar que la diferencial es sobreyectiva.

Ası, O(n) = f−1(Id), donde Id es punto regular de f . Por lo tanto, O(n) sera una

subvariedad regular de GL(n,R) de codimension n(n+1)2

, esto es,

dimO(n) = dimGL(n,R)− n(n+ 1)

2= n2 − n(n+ 1)

2=n2 − n

2.

Las aplicaciones multiplicacion e inversa,

µ : O(n)×O(n) −→ O(n)

I : O(n) −→ O(n)

son diferenciables, pues son heredadas de las mismas aplicaciones definidas sobre GL(n,R).Ası, O(n) es un grupo de Lie.

Ejemplo 1.6. Grupo de Heisenberg

Sea H =

1 x1 x3

0 1 x2

0 0 1

| x1, x2, x3 ∈ R

el grupo de Lie de Heisenberg.

En efecto, H es difeomorfo a R3 y por lo tanto una variedad diferenciable. Porotro lado definimos las siguientes aplicaciones. Para x, y ∈ H con x = (x1, x2, x3) yy = (y1, y2, y3) considere

µ : H ×H −→ H(x, y) 7−→ µ(x, y) = (x1 + y1, x2 + y2, x3 + y3 + x1y2)

=

1 x1 + y1 x3 + y3 + x1y2

0 1 x2 + y2

0 0 1

I : H −→ H

x 7−→ I(x) = (−x1,−x2, x1x2 − x3)

=

1 −x1 x1x2 − x3

0 1 −x2

0 0 1

las cuales son analıticas. Ası, H es un grupo de Lie.

Ejemplo 1.7. Grupo de Rotaciones

Sea SO2(R) =

(cosθ −senθsenθ cosθ

)| 0 ≤ θ < 2π

, el grupo de las rotaciones del

plano.

Notemos que SO2(R) es un subgrupo de GL2(R), ahora identifiquemos este grupocon el circulo unitario S1 =

eiθ | 0 ≤ θ < 2π

de modo que las aplicaciones quedan

definidas de la siguiente manera

µ : SO2 × SO2 −→ SO2 I : SO2 −→ SO2

(eiθ, eiϕ) 7−→ µ(eiθ, eiϕ) = ei(θ+ϕ) eiθ 7−→ I(eiθ) = e−iθ

Siendo ambas aplicaciones diferenciables. Por lo tanto, SO2(R) es un grupo de Lie.

8

Page 18: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Definicion 1.4. Un algebra de Lie es determinada por un espacio vectorial g dotadode un producto (corchete o bracket) definido por:

[ · , · ] : g× g −→ g

el cual cumple las siguientes propiedades:

1) Es bilineal.

2) Es antisimetrico, esto es,

[X, Y ] = −[Y,X] ∀X, Y ∈ g.

3) Satisface la identidad de Jacobi, esto es, para todo X, Y, Z ∈ g,

[X, [Y, Z]] + [Z, [X, Y ]] + [Y, [Z,X]] = 0.

Esta ultima igualdad se puede escribir de dos formas alternativas.

3’) [X, [Y, Z]] = [X, [Y, Z]] + [Y, [X,Z]]3”) [[X, Y ], Z] = [[X,Z], Y ] + [X, [Y, Z]]

Notemos que la antisimetria y la identidad de Jacobi son propiedades caracterısticasde las algebras de Lie.

Definicion 1.5. Sea g un algebra de Lie. Una subalgebra de g es un subespacio vectorialh de g el cual es cerrado bajo el corchete, esto es, [X, Y ] ∈ h para X, Y ∈ h.

Es claro que una subalgebra de Lie es una algebra de Lie con las propiedadesheredadas por la estructura de g.

Ejemplo 1.8. Sea gl(n,K) el espacio de todas las transformaciones lineales de unespacio vectorial de dimension n sobre el cuerpo K que es el mismo espacio de lasmatrices de orden n× n con coeficientes en K. El corchete es dado por

[A,B] = AB −BA,

con A y B matrices. Para simplificar la notacion en algunos casos, denotaremos porgl(V) como el algebra de las transformaciones lineales de un espacio vectorial V, sinespecificar el cuerpo cuando este no fura relevante.

Definicion 1.6. Sean g y h algebras de Lie con X, Y ∈ g. Una aplicacion linealϕ : g −→ h es llamada,1. Homomorfismo si ϕ[X, Y ] = [ϕX,ϕY ].2. Isomorfismo si fuera un homomorfismo invertible.3. Automorfismo si es un isomorfismo y g = h.

Ejemplo 1.9. Los homomorfismos entre espacios vectoriales (los cuales son algebrasAbelianas), son las transformaciones lineales. Dos espacios vectoriales son isomorfossi y solo si tienen la misma dimension. Pero la dimension no caracteriza las algebrasde Lie arbitrarias. En general, la existencia de un isomorfismo depende de los coefi-cientes determinados por los corchetes entre la bases de las distintas algebras. En elcaso Abeliano, todos los coeficientes son nulos.

9

Page 19: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Ejemplo 1.10. Dada una algebra Abeliana h y ϕ : g −→ h un homomorfismo, entoncesel Kerϕ contiene todos los elementos de la forma [X, Y ], ya que

ϕ[X, Y ] = [ϕX,ϕY ] = 0

Ejemplo 1.11. Sea P una transformacion lineal invertible del espacio vectorial V ensi mismo. Definimos la conjugacion inducida por P ,

A ∈ gl(V) 7−→ PAP−1 ∈ gl(V),

la cual es un automorfismo de gl(V).

Ejemplo 1.12. La aplicacion traza, tr : gl(n,K) −→ K, es un homomorfismo. Enefecto, tr(XY − Y X) = 0 ∀X, Y ∈ gl(n,K), ası, tr[X, Y ] = 0 = [trX, trY ], pues Kes de dimension uno y por lo tanto Abeliana.

1.3. Campos Invariantes

Definicion 1.7. Sea G un grupo de Lie. Todo g ∈ G define las aplicaciones Lg, Rg

definidas por:

Lg : G −→ G Rg : G −→ Gh 7−→ Lg(h) = gh, h 7−→ Rg(h) = hg

llamadas de traslacion izquierda y traslacion derecha respectivamente.

Proposicion 1.2. Las traslaciones Lg y Rg anteriormente definidas son diferenciables.

Demostracion. Veamos para el caso Lg, como G es un grupo de Lie se tiene que µ comola multiplicacion es diferenciable y ig como la inclusion tambien diferenciable, esto es,

ig : G→ G×G µ : G×G→ Gh 7→ ig(h) = (g, h) (g, h) 7→ µ(g, h) = gh

De modo que Lg = µ ig es diferencible pues es la composicion de dos aplicacionesdiferenciables, con lo cual se concluye la prueba. Para Rg la prueba es analoga.

Proposicion 1.3. Las traslaciones a la izquierda y a la derecha son difeomorfismospues sus inversas Lg−1 y Rg−1 son diferenciables.

Observacion 1.2. Dados a, b ∈ G (G grupo de Lie), existe una unica traslacion a laizquierda de G que lleva a hasta b y es la traslacion a la izquierda dada por ba−1 oLba−1.

Definicion 1.8. Sea G un grupo de Lie. Un campo de vectores X en G se dice:

Invariante a Izquierda, si para todo g ∈ G, (Lg)∗X = X, esto es,

(DLg)h(X(h)) = X(gh), ∀g, h ∈ G.

Invariante a Derecha, si para todo g ∈ G, (Rg)∗X = X, esto es,

(DRg)h(X(h)) = X(hg), ∀g, h ∈ G.

10

Page 20: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Los campos invariantes a derecha o a izquierda son completamente determinadospor sus valores en el elemento de la identidad e ∈ G, pues para todo g ∈ G, la condi-cion de invarianza a derecha, por ejemplo, implica que X(g) = (DRg)e(X(e)). Por lotanto, cada elemento del espacio tangente TeG determina un unico campo invariante aderecha y un unico campo invariante a izquierda.

Dado X ∈ TeG, la notacion XR indica el campo invariante a derecha, tal queXR(e) = X. Ademas XL denota el campo invariante a izquierda correspondiente.Explıcitamente,

XR(g) = (DRg)eX, XL(g) = (DLg)eX.

Denotemos por InvR el conjunto de los campos invariantes a derecha. Este conjun-to es un subespacio vectorial (sobre R) del espacio de todos los campos de vectoresen G, ya que (Rg)∗ es una aplicacion lineal sobre los campos de vectores. De ma-nera similar, el conjunto InvL de los campos invariantes a izquierda tambien es unsubespacio vectorial (en general, diferente de los campos invariantes a derecha). Lasaplicaciones X ∈ TeG 7−→ XR ∈ InvR y X ∈ TeG 7−→ XL ∈ InvL son isomor-fismos entre los espacios vectoriales correspondientes, cuyas inversas son dadas porXR,L ∈ InvR,L 7−→ XR,L(e) ∈ TeG.

Denotemos por g el conjunto de los campos de vectores invariantes a izquierda enG. Notemos que es posible hacer lo mismo para los campos invariantes a derecha. Peroprimero daremos una definicion mas.

Sea ψ : G −→ H una aplicacion diferenciable entre los grupos de Lie G y H. Apartir de ψ, podemos relacionar los campos vectoriales de G con los campos vectorialesde H.

Definicion 1.9. Dados g ∈ G, X ∈ g y ψ(g) ∈ H. El “push-forward” del campo Xpor la aplicacion ψ, se define como el campo vectorial en H dado por

(dψX)(ψ(g)) = dψ|g (X(g)).

Ejemplo 1.13. Campos invariantes a izquierda

Veamos que la siguiente igualdad se cumple

I Rg = Lg−1 I,

donde I es la aplicacion inversion. En efecto, sea h ∈ G, se tiene

I Rg(h) = I(hg) = g−1 · h−1 = Lg−1(h−1) = Lg−1 I(h).

Derivando la igualdad, tenemos

DI DRg = DLg−1 DI.

Dado X ∈ g, al aplicar la diferencial de la aplicacion inversa, se tiene

(DIX)(g−1) = DI|g (X(g)), por definicion de push-forward.

= DI X Rg(e)

= DI DRg X(e)

= DLg−1 DI X(e)

= DLg−1 DI(X(e)),

11

Page 21: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

donde e denota la identidad del grupo de Lie G. Ası, DI(g) es el conjunto de los camposinvariantes a izquierda.

Ahora, sea M una variedad diferenciable y denotemos por X(M) como el conjuntode los campos de vectores diferenciables en M , y por C∞(M) como el conjunto de lasfunciones diferenciables en M .

Definicion 1.10. Sean p ∈ M y X, Y ∈ X(M) se define el corchete de de Lie entrelos campos X, Y como el campo de vectores dado por,

[X, Y ]p = Xp(Y )− Yp(X).

Esto es, dada f ∈ C∞(M) se tiene,

[X, Y ]pf = Xp(Y f)− Yp(Xf),

donde Xp(f) es la derivada direccional de la funcion f en la direccion del campo X, yen el punto p.

El conjunto X(M) dotado del corchete [ · , · ] : X(M) × X(M) −→ X(M) es unalgebra de Lie real.

A continuacion daremos un teorema que relacionara los campos invariantes a iz-quierda con el espacio tangente del grupo de Lie G en la identidad.

Teorema 1.1. Sea G un grupo de Lie, denotemos e ∈ G el elemento identidad, enton-ces g es isomorfa a TeG.

Demostracion. En efecto, definamos la aplicacion ε(X) = Xe definida de g en TeG, lacual es lineal.Ahora dados X, Y ∈ g supongamos que ε(X) = ε(Y ), entonces

X(g) = (DLg)e(X(e)) = (DLg)e(Y (e)) = Y (g) ∀g ∈ G.

Por lo tanto ε es inyectiva. Para probar la sobreyectividad de ε, sea v ∈ TeG arbitrarioy definamos el campo vectorial sobre G como:

X(g) = (DLg)e(v), ∀g ∈ G.

Probemos que X(g) es invariante a izquierda

(DLh)g(X(g)) = (DLh)g(DLg)e(v) = (D(Lh Lg))e(v) = (DLhg)e(v) = X(hg)

Ası, Xg es invariante a la izquierda, ademas ε(X) = v, por lo tanto ε es un isomorfismolineal, en particular dim(g) = dim(G).

Ejemplo 1.14. Algebra de Lie del grupo de Heisenberg H

Consideremos el grupo de Heisenberg H dado por

H =

1 x1 x3

0 1 x2

0 0 1

| x1, x2, x3 ∈ R

.

12

Page 22: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Tomemos como base de R3 a e1, e2, e3 y definamos las curvas αi : R −→ R3,donde i = 1, 2 y 3,

α1(t) = (t, 0, 0), α2(t) = (0, t, 0), α3(t) = (0, 0, t),

de modo que, αi(0) = 0 y αi(0) = ei. Ahora definamos la siguiente carta, ψ : H −→ R3,como: 1 x1 x3

0 1 x2

0 0 1

7−→ (x1, x2, x3)

ψ

1 x1 x3

0 1 x2

0 0 1

= (x1, x2, x3)

De modo que sea ϕi = ψ−1 αi, luego se tiene que para i = 1

ϕ1(t) = ψ−1 α1(t) =

1 t 00 1 00 0 1

Se sigue que, ddt

∣∣t=0

ϕ1(t) =

0 1 00 0 00 0 0

. Calculando de manera analoga para ϕ2(t), ϕ3(t)

se obtiene TIdH, la cual corresponde al algebra de Lie h del grupo de Heisenberg H.Esto sera,

h = Span

0 1 0

0 0 00 0 0

,

0 0 00 0 10 0 0

,

0 0 10 0 00 0 0

.

Ejemplo 1.15. Algebra de Lie del grupo Afın Aff+(2)

Consideremos el grupo de Afın Aff+(2) dado por

Aff+(2) =

(x1 x2

0 1

)| x1, x2 ∈ R con x1 > 0

.

Tomemos como base de R2 a e1, e2 y definamos las curvas βi : R −→ R2, dondei = 1 y 2,

β1(t) = (t, 0), β2(t) = (0, t),

de modo que, βi(0) = 0 y βi(0) = ei. Ahora tomemos la siguiente carta,

φ : Aff+(2) −→ R2,(x1 x2

0 1

)7−→ φ

(x1 x2

0 1

)= (x1, x2)

De modo que sea ϕi = φ−1 βi, luego se tiene que para i = 1

ϕ1(t) = φ−1 β1(t) =

(t 00 1

)13

Page 23: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Se sigue que, ddt

∣∣t=0

ϕ1(t) =

(1 00 0

). Calculando de manera analoga para ϕ2(t), se

obtiene TIdAff+(2), la cual corresponde al algebra de Lie aff+(2) del grupo de AfınAff+(2). Esto sera,

aff+(2) = Span

(1 00 0

),

(0 10 0

).

Ejemplo 1.16. Algebra de Lie de SO3(R)

Dado el grupo de rotaciones SO3(R) en R3, como

SO3(R) = A ∈M3(R) | ATA = Id con detA = 1.

El grupo SO3(R) es una subvariedad cerrada de M3(R) 3-dimensional. Para obtenerel algebra de Lie so3(R) del grupo de Lie SO3(R), tomaremos las siguientes curvasϕi : R −→ SO3(R) con i = 1, 2, 3 definidas de la siguiente manera,

ϕ1(t) =

cos(t) sen(t) 0−sen(t) cos(t) 0

0 0 1

, ϕ2(t) =

cos(t) 0 sen(t)0 1 0

−sen(t) 0 cos(t)

,

ϕ3(t) =

1 0 00 cos(t) sen(t)0 −sen(t) cos(t)

Como se sabe TIdSO3(R) es isomorfa a so3(R), esto es, TIdSO3(R) ' so3(R). Ası que,tomando ϕ1(0) = ϕ2(0) = ϕ3(0) = Id. Se tiene que

so3(R) = Span

d

dt

∣∣∣∣t=0

ϕi(t) | i = 1, 2, 3

.

Donde,

d

dt

∣∣∣∣t=0

ϕ1(t) =

0 1 0−1 0 00 0 0

,d

dt

∣∣∣∣t=0

ϕ2(t) =

0 0 10 0 0−1 0 0

,

d

dt

∣∣∣∣t=0

ϕ3(t) =

0 0 00 0 10 −1 0

.

Por lo tanto, so3(R) =

0 x1 x2

−x1 0 x3

−x2 −x3 0

| x1, x2, x3 ∈ R

. Definamos los cam-

pos de vectores invariantes Xi inducidos por ddt

∣∣t=0

ϕi(t), i = 1, 2, 3. Notemos que,[X1, X2] = X3. Por simple inspeccion se observa que so3(R) esta formada por un grupode matrices antisimetricas de M3(R).

14

Page 24: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

1.4. Representacion adjunta

Tomemos un elemento X del algebra de Lie g y la siguiente aplicacion lineal

ad(X) : g −→ g

definida de la siguiente manera ad(X)(Y ) = [X, Y ]. La aplicacion

ad : g −→ gl(g)X 7−→ ad(X)

En otras palabras, esto es,

ad : g −→ gl(g)X 7−→ ad(X) : g −→ g

Y 7−→ ad(X)(Y ) = [X, Y ],

define una representacion de g en g, la cual es llamada de representacion adjunta.

El hecho de que ad sea lineal viene dada por la bilinealidad del corchete. Tambienla propiedad de homomorfismo de ad es equivalente a la identidad de Jacobi. En efecto,la igualdad

ad([X, Y ]) = ad(X)ad(Y )− ad(Y )ad(X),

es lo mismo que

[[X, Y ], Z] = [[X,Z], Y ] + [X, [Y, Z]], ∀Z ∈ g.

Esta ultima expresion es exactamente una de las formas de la identidad de Jacobi.

Se llama centro de g, al nucleo de la representacion adjunta y este es denotado porz(g):

z(g) = X ∈ g : ad(X)(Y ) = [X, Y ] = 0, ∀Y ∈ g.

Esto es, el centro de una algebra de Lie es el conjunto de elementos que conmutancon todos los elementos de g. Claramente, z(g) es un ideal de g. De manera mas general,el centralizador de un subconjunto A ⊂ g es definido como

z(A) = Y ∈ g : [X, Y ] = 0, ∀X ∈ A.

Es claro que, el centralizador de g es el propio centro (por lo tanto, la notacion esconsistente). Por otro lado, el centralizador de un conjunto unitario X es precisa-mente el nucleo Ker ad(X).

Ejemplo 1.17. La representacion adjunta de una algebra Abeliana g es trivial, estoes,

ad(X) = 0, ∀X ∈ g.

15

Page 25: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Ejemplo 1.18. Sea

g =

X ∈ gl(3,R) : X =

0 ∗ ∗0 0 ∗0 0 0

,

el algebra de Heisenberg. Ahora tomemos la base X, Y, Z donde

X =

0 1 00 0 00 0 0

, Y =

0 0 00 0 10 0 0

, Z =

0 0 10 0 00 0 0

.

De modo que, [X, Y ] = Z y los otros corchetes son todos nulos. Ası que, ad(Z) = 0 ylas matrices de ad(X) y ad(Y ) en la base dada son

[ad(X)] =

0 0 00 0 00 1 0

, [ad(Y )] =

0 0 00 0 0−1 0 0

.

El centro z(g) es el subespacio generado por Z.

Definicion 1.11. El algebra de Lie g sera llamada:

Abeliana, si para cualquier X, Y ∈ g, [X, Y ] = 0.

Nilpotente, si ∃k ≥ 1 : ad1 = [g, g] ⊃ ... ⊃ adk+1 =[adk, g

]= 0.

Soluble, si ∃k ≥ 1 : ad1 ⊃ ... ⊃ ad(k) =[ad(k−1), ad(k−1)

]= 0.

Semisimple, si la mayor subalgebra soluble r(g) de g es trivial.

Finalmente, el grupo G sera llamado Abeliano, nilpotente, soluble y semisimple, si gsatisface la propiedad correspondiente.

1.5. Aplicacion Exponencial

La aplicacion exponencial exp : g −→ G es la herramienta matematica usada paratransferir al grupo de Lie G las propiedades de su algebra de Lie g. Los elementos de gson ecuaciones diferenciales ordinarias en G (campos invariantes), pues estas tienen suflujo asociado, los cuales son formados por difeomorfismos locales de G. Los elementosque conforman estos flujos se identifican naturalmente a elementos de G, permitiendoası construir, a partir de X ∈ g, un subgrupo de G parametrizado por t ∈ R (subgrupo1-parametro). La aplicacion exponencial es construida a partir de estos subgrupos.

Definiendo lo anterior de manera mas precisa, sea X un campo invariante (a iz-quierda o a derecha en G). Denotemos por Xt el flujo asociado a X.

Primeramente Xt es un flujo local, es decir, dado un t fijo, el dominio DomXt de Xt

es el subconjunto abierto de G de las condiciones iniciales cuyas soluciones se prolonganhasta t.

16

Page 26: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

La invarianza de X conlleva la siguiente simetrıa del flujo Xt: supongamos, porejemplo, que X ∈ InvL y dados g, h ∈ G con h ∈ DomXt , de modo que al considerarla curva

α(t) = g Xt(h) = Lg(Xt(h)),

su dominio sea un intervalo abierto de R que contiene a cero con α(0) = gh, puesX0 = h. Ademas por la regla de la cadena, se tiene

α′(t) = (DLg)Xt(h)d

dtXt(h)

= (DLg)Xt(h)X(Xt(h))

= X(g Xt(h)), por la invarianza de X

= X(α(t)).

Ası, α es solucion de ddtg = X(g) con condicion inicial de α(0) = gh, esto es,

α(t) = Xt(gh). Esto significa que

Xt(gh) = gXt(h) X ∈ InvL. (1.1)

Ahora evaluando h = e, obtenemos Xt(g) = gXt(e). Ası que, la solucion que pasapor g es obtenida por traslacion a la izquierda de la solucion que pasa por el elementoidentidad.

De manera similar, se muestra que

Yt(hg) = Yt(h)g Y ∈ InvR, (1.2)

y Yt(g) = Yt(e)g si Y es campo invariante a la derecha.

Como observamos, las trayectorias son obtenidas unas de las otras por traslacion,estas se prolongan al mismo intervalo de R, esto es, las soluciones maximales de los cam-pos invariantes tienen todos los mismos intervalos de definicion. Esto permite mostrarque los campos invariantes son completos, es decir, que sus trayectorias se prolongana (−∞,+∞).

Proposicion 1.4. Un campo invariante a la izquierda o a la derecha es completo.

Demostracion. En efecto, sea X un campo invariante a la izquierda, cuyo flujo es deno-tado por Xt. Ahora para α < 0 y ω > 0, sea (α, ω) el intervalo comun de las solucionesmaximales t 7−→ Xt(g), g ∈ G.

Supongamos que ω <∞ y definamos las siguientes curvasx(t) = Xt(e) si α < t < ω

y(t) = Xt−ω2

(Xω2(e)) si α + ω

2< t < 3ω

2.

Ambas son soluciones de la ecuacion diferencial g = X(g). Como

x(ω/2) = y(ω/2) = Xω2(e),

la unicidad de soluciones garantiza que

x(t) = y(t) en el intervalo (α +ω

2, ω) = (α, ω) ∩ (α +

ω

2,3ω

2).

17

Page 27: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Por lo tanto, las dos curvas definen una solucion z(t), cuyo dominio de definicion es launion (α, 3ω/2) de los intervalos de definicion de x e y. Como z(0) = e, eso contradiceel hecho de que el intervalo de la solucion maximal es (α, ω). De ahı que ω = ∞. Deuna forma similar se prueba para, α = −∞, concluyendo con la demostracion.

Ademas, como una consecuencia de las propiedades de la invarianza de (1.1) y (1.2)se obtienen las siguientes igualdades:

i) Si X ∈ InvL entonces Xt+s(e) = Xt(Xs(e)) = Xt(e)Xs(e) = Xs(e)Xt(e).ii) Si Y ∈ InvR entonces Yt+s(e) = Yt(Ys(e)) = Yt(e)Ys(e) = Ys(e)Yt(e).

Estas igualdades implican que X−t(e) = (Xt(e))−1, pues

e = X0(e) = Xt−t(e) = Xt(X−t(e)) = Xt(e)X−t(e),

de manera similar se obtiene para Y−t(e) = (Yt(e))−1. De ahı que, si X ∈ InvL y

Y ∈ InvR entonces sus trayectorias que pasan por el origen

Xt(e) : t ∈ R y Yt(e) : t ∈ R

son subgrupos de G. En si, esos subgrupos coinciden en el caso que X(e) = Y (e).

Proposicion 1.5. Dados dos campos de vectores invariantes a la izquierda y a la de-recha, respectivamente X y Y , que coinciden en el elemento neutro, es decir, X(e) =Y (e). Entonces sus trayectorias Xt(e) y Yt(e), que pasan por el elemento neutro, coin-ciden para todo t ∈ R.

Demostracion. Basta verificar que la curva β(s) = Xs(e) satisface la ecuacion diferen-cial g = Y (g), luego se tiene del calculo

β′(s) =d

dtXs+t(e)

∣∣∣∣t=0

=d

dtXt(e)Xs(e)

∣∣∣∣t=0

=d

dtRXs(e)

(Xt(e))

∣∣∣∣t=0

= (DRXs(e)

)X0(e)d

dtXt(e)

∣∣∣∣t=0

.

= (DRβ(s)

)eX(X0(e))

= (DRβ(s)

)eY (e) = Y (β(s))

Despues de hacer un analisis de los campos invariantes, definiremos la aplicacion

exponencial en un grupo de Lie.

Definicion 1.12. Dado X ∈ TeG. Entonces, expX = XLt=1

(e) = XRt=1

(e). Como esusual, expX tambien se escribe como eX . Eso define una aplicacion exp : g −→ G,donde g = TeG es el algebra de Lie de G.

18

Page 28: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

La aplicacion exponencial esta bien definida, pues los campos invariantes son com-pletos, de ahı que la solucion de g = X(g) que pasa por el elemento neutro, cuandot = 0, se extiende a t = 1.

Si Z es un campo de vectores y r ∈ R entonces las trayectorias de Z y rZ coinciden,ademas sus flujos satisfacen (rZ)t = Zat . Aplicando esa observacion a los campos XL

y XR, se ve que sus trayectorias por el elemento neutro son dadas por

(XL)t(e) = (XR)t(e) = exp tX.

Por las propiedades de las trayectorias dadas anteriormente, se tiene que la aplica-cion exponencial t 7−→ exp (tX), X ∈ g, es un homomorfismo, esto es,

exp (t+ s)X = Xt+s(e) = exp (tX) · exp (sX) = exp (sX) · exp (tX),

y su imagen exp (tX) : t ∈ R es un subgrupo de G. Ese subgrupo es llamado desubgrupo a 1-parametro generado por X ∈ g.

Ahora daremos algunas propiedades de la aplicacion exponencial y de los flujos delos campos invariantes que se analizaron anteriormente.

Proposicion 1.6. Son verdaderas las siguientes afirmaciones:i) Si X es campo invariante a la derecha, entonces Xt = L

exp (tX), esto es,

Xt(g) = exp(tX) · g.

ii) Si X es campo invariante a la izquierda, entonces Xt = Rexp (tX)

, esto es,

Xt(g) = g · exp(tX).

iii) exp (0) = e.iv) Si n ∈ Z, entonces (exp(X))n = exp(nX) para todo n ∈ Z. En particular,

(exp(X))−1 = exp(−X).

Demostracion.

i) Basta verificar que Xt(g) = exp(tX) ·g satisface la ecuacion diferencial g = X(g)para g ∈ G, luego se obtiene del calculo

d

dt(exp(tX) · g) =

d

dt(Rg(exp(tX)))

= (DRg)exp (tX)d

dtexp (tX)

= (DRg)exp (tX)X(exp (tX))

= X(exp(tX) · g)

= X(Xt(g)).

ii) Siguiendo el mismo analisis se prueba ii).iii) Por definicion se tiene que

exp (0) = Θt(e) = e, donde Θt es el flujo asociado a 0 ∈ g.

iv) Es inmediata.

Esas propiedades generalizan propiedades conocidas de exponenciales en situacionesconcretas.

19

Page 29: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Ejemplo 1.19. Los campos invariantes a la izquierda en GL(n,R) son de la formaX(g) = gA, con A una matriz de orden n × n. La ecuacion diferencial asociada a Xes el sistema lineal

dg

dt= gA,

en el espacio de las matrices. La solucion fundamental es dada por la exponencial dematrices

expA =∑i≥0

1

i!Ai.

Definicion 1.13. Una aplicacion lineal D : g −→ g es una derivacion del algebra deLie g, si satisface la regla de Leibnitz, esto es,

D[X, Y ] = [DX, Y ] + [X,DY ], ∀X, Y ∈ g.

El conjunto de todas las derivaciones del algebra de Lie g forma un espacio vecto-rial, que al unir con el corchete [D1 , D2 ] = D1 D2 −D2 D1, forman un algebra deLie. A este espacio lo denotaremos por Der(g).

Un tipo de derivacion muy frecuente en la Teorıa de Lie son las adjuntas de loselementos de g. Como consecuencia de la identidad de Jacobi, se tiene como resultadoque la adjunta es una derivacion. En efecto,

ad(X)[Y, Z] = [X, [Y, Z]]

= [[X, Y ], Z] + [Y, [X,Z]], por la identidad de Jacobi

= [ad(X)Y, Z] + [Y, ad(X)Z].

De modo que,ad(X)[Y, Z] = [ad(X)Y, Z] + [Y, ad(X)Z].

Ası, ad(X) es una derivacion. Las derivaciones de este tipo son llamadas de derivacionesinternas.

Proposicion 1.7. Sea g un algebra de Lie real de dimension finita y D : g −→ g unatransformacion lineal. Entonces, D es una derivacion si y solo si para todo t ∈ R, etD

es un automorfismo de g.

Demostracion. Supongamos que D es una derivacion, ası que, sean las curvas en g,definidas de la siguiente manera

α(t) = etD[X, Y ] β(t) = [etDX, etDY ].

Se tiene tambien que, α(0) = [X, Y ] = β(0). Luego derivando estas curvas se obtiene,

α′(t) = DetD[X, Y ] = Dα(t),

β′(t) = [DetDX, etDY ] + [etDX,DetDY ] = D[etDX, etDY ] = Dβ(t).

Ası, α(t) y β(t) satisfacen la misma ecuacion diferencial lineal con las mismas condi-ciones iniciales, de ahı que α = β.Por otro lado, asumiendo que para todo real t, etD es un automorfismo, esto es

etD[X, Y ] = [etDX, etDY ], ∀X, Y ∈ g.

20

Page 30: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

La derivada de esta igualdad, como funcion de t, sera

DetD[X, Y ] = [DetDX, etDY ] + [etDX,DetDY ],

ahora evaluando en t = 0, se obtiene lo que se querıa probar,

D[X, Y ] = [DX, Y ] + [X,DY ].

Ejemplo 1.20. Sea g una algebra no-Abeliana bidimensional y X, Y una base demodo que [X, Y ] = Y . Sea D : g −→ g una aplicacion lineal, de modo que su matrizasociada en esta base es dada por,

D =

(a bc d

)Para encontrar las relaciones entre los valores a, b, c y d, de modo que D sea unaderivacion es suficiente hacer cumplir la siguiente relacion

D[X, Y ] = [DX, Y ] + [X,DY ].

Para esto reescribiremos D en la base X, Y , esto es

DX=aX+cYDY=bX+dY,

luego calculamos lo siguiente

DY = D[X, Y ]

= [DX, Y ] + [X,DY ]

= [aX + cY, Y ] + [X, bX + dY ]

= a[X, Y ] + c[Y, Y ] + b[X,X] + d[X, Y ]

= (a+ d)Y

comparando esta ultima igualdad con DY = bX + dY , se tiene que D sera una deri-vacion si y solo si

b = 0, y a+ d = d.

Ası, la matriz de derivacion D en g sera de la forma

D =

(0 0c d

).

21

Page 31: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Capıtulo 2

Sistemas de Control Lineales en Rn

En este capıtulo desarrollamos las ecuaciones basicas de los sistemas de controllineales sobre Rn, los cuales sirven para entender los sistemas de control lineales so-bre grupos Lie G. Comenzamos dando una descripcion algebraica de los sistemas decontrol lineales sobre Rn y los conjuntos de accesibilidad. Ademas, analizamos estosconjuntos de accesibilidad desde un punto de vista del corchete de Lie, para luego daruna generalizacion de controlabilidad con el Teorema de Kalman.

La presentacion de este capıtulo esta basada en las referencias [16], [31], [32] y [34],para informacion adicional el lector puede consultar [37] y [42].

Definicion 2.1. Un sistema de control lineal ΣRn, sobre el espacio Euclidiano Rn,viene dado por la siguiente data:

ΣRn : x(t) = Ax(t) +B u(t) (2.1)

donde A ∈ gl(n;R), B ∈ gl(n ×m; R), B es una matriz de orden n ×m, u ∈ U ,donde U es la familia de controles localmente integrables, esto es, u es una funcionmedible del tipo u : [0;T ] −→ Ω ⊆ Rm; y Ω es un conjunto cerrado, convexo y con0 ∈ int(Ω).

Observacion 2.1. A traves de esta tesis, el conjunto Ω podra ser acotado o no acotado,dependiendo de la situacion en estudio.

Proposicion 2.1. Dado ΣRn un sistema de control lineal como en la definicion 2.1,la solucion del sistema con condicion inicial x0 y control u, es dada de la siguientemanera.

φut (x0) = etA(x0 +

∫ t

0

e−τAB u(τ) dτ

).

Demostracion. En efecto, por el metodo de factor integrante para cada x en Rn, setiene

d

dt

[e−Atx

]= e−AtB u(t)

22

Page 32: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

luego, integrando respecto a t

e−Atx(t)− x0 =

∫ t

0

e−Aτ B u(τ) dτ

x(t) = eAt(x0 +

∫ t

0

e−Aτ B u(τ) dτ

)Por lo tanto, x(t) es la solucion de la ecuacion (2.1), y la denotaremos por φut (x0).

2.1. Controlabilidad

Iniciamos el estudio de la controlabilidad de ΣRn definiendo ciertas clases de conjun-tos accesibles. Para cada T > 0, denotemos por EΣRn (x0, T ) el conjunto de accesibilidadde ΣRn desde x0 en exactamente T unidades de tiempo, esto es,

EΣRn (x0, T ) = φuT (x0) : u ∈ U .

Partiendo del origen, esta familia de conjuntos de accesibilidad es totalmente orde-nada. En efecto:

Proposicion 2.2. Si 0 ≤ T1 ≤ T2 entonces

EΣRn (0;T1) ⊂ EΣRn (0;T2)

Demostracion. Dado x ∈ EΣRn (0;T1), entonces existe un control u1 tal que φu1T1(0) = x,luego definamos el control u2 de la siguiente forma

u2(t) =

0 si 0 < t ≤ T2 − T1

u1(t− (T2 − T1)) si T2 − T1 < t ≤ T2.

ya que el control u1 esta definido sobre el intervalo [0, T1], la solucion para el controlu2 es dada por

φu2t (0) = etA∫ t

0

e−τAB u2(τ) dτ.

En particular se tiene para t = T2,

φu2T2(0) = eT2A∫ T2

0

e−τAB u2(τ) dτ

= 0 + eT2A∫ T2

T2−T1e−τAB u2(τ) dτ

= eT2A∫ T2

T2−T1e−τAB u2(τ) dτ

Como τ ∈ [T2 − T1, T2], entonces

T2 − T1 ≤ τ ≤ T2

T2 ≤ τ + T1 ≤ T2 + T1

0 ≤ τ − T2 + T1 ≤ T1

0 ≤ τ − (T2 − T1) ≤ T1.

23

Page 33: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Haciendo el cambio de variable, dado por v = τ − (T2 − T1) se tiene que

φu2T2(0) = eT2A∫ T1

0

e−(v+T2−T1)AB u2(v + T2 − T1) dv

= eT2A∫ T1

0

e(−v−T2+T1)AB u2(v + T2 − T1) dv

= eT2Ae−T2AeT1A∫ T1

0

e−vAB u2(v + T2 − T1) dv

= eT1A∫ T1

0

e−vAB u2(v + T2 − T1)dv

= eT1A∫ T1

0

e−vAB u1(v + T2 − T1 − (T2 − T1)) dv

= eT1A∫ T1

0

e−vAB u1(v) dv

= φu1T1(0)

= x,

Por lo tanto x ∈ EΣRn (0, T2).

Debido a la naturaleza de la solucion de la ecuacion (2.1), EΣRn (0, T ) con T > 0 esun subespacio vectorial de Rn, la prueba se muestra en la siguiente proposicion.

Proposicion 2.3. La solucion del sistema (2.1) dada por

φut (x0) = etA(x0 +

∫ t

0

e−τAB u(τ) dτ

).

es lineal respecto al control u, cuando x0 = 0.

Demostracion. En efecto, sean u1, u2 ∈ U y α ∈ R

φu1+u2t (0) = etA

(∫ t

0

e−τAB(u1 + u2)(τ) dτ

)= etA

(∫ t

0

e−τAB(u1(τ) + u2(τ)) dτ

)= etA

(∫ t

0

e−τAB u1(τ) dτ

)+ etA

(∫ t

0

e−τAB u2(τ) dτ

)= φu1t (0) + φu2t (0).

Ası, φu1+u2t (0) = φu1t (0) + φu2t (0). Para φαu1t (0) se tiene,

φαu1t (0) = etA(∫ t

0

e−τAB(αu1)(τ) dτ

)= etA

(∫ t

0

e−τAB αu1(τ) dτ

)= α etA

(∫ t

0

e−τAB u1(τ) dτ

)= αφu1t (0).

24

Page 34: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

De modo que, φα·u1t (0) = α · φu1t (0). Por lo tanto φut (0) es lineal respecto a u.

La orbita positiva SΣRn (x0) de ΣRn desde el estado inicial x0, se define por

SΣRn (x0) =⋃T>0

EΣRn (x0, T ). Debido al orden establecido en la proposicion anterior,

SΣRn (0) es un subespacio vectorial de Rn.

Definicion 2.2. Sea ΣRn un sistema lineal en Rn y x0 ∈ Rn. El sistema ΣRn es dicho:i) Controlable desde x0, si SΣRn (x0) = Rn.ii) Controlable, si ΣRn es controlable desde x0, ∀x0 ∈ Rn.

A continuacion, se estudia una alternativa algebraica para resolver el problema decalcular SΣRn (0). En otras palabras, se quiere evitar el calculo explıcito de las solucionesde la familia de ecuaciones diferenciales del sistema, determinada por los controles.

Definicion 2.3. Sea V ⊂ Rn un subespacio vectorial y A ∈ gl(n;R). El subespacio Vse dice A− invariante si A(V ) ⊂ V .

Observacion 2.2. Denotemos por 〈A | B〉 el menor subespacio A− invariante de Rn

que contiene la imagen Im(B) = B(Rm) de la matriz B.

Mostraremos, que para todo T > 0, EΣRn (0, T ) = 〈A | B〉. En consecuencia,

SΣRn (0) = 〈A | B〉 = EΣRn (0, T ), ∀T > 0.

Es decir, los estados accesibles de ΣRn se encuentran en 〈A | B〉 y cualquier elementode 〈A | B〉 puede ser alcanzado desde el origen en un tiempo positivo arbitrario.Esto no debiera ser demasiado sorprendente, debido a que los controles que estamosconsiderando son no-acotados y por lo tanto su implementacion sera en general cadavez mas costosa si el tiempo disminuye.

Teorema 2.1. Sea ΣRn un sistema lineal en Rn. Entonces, para todo T > 0 se tiene

EΣRn (0, T ) = 〈A | B〉.

Demostracion. Notemos las siguientes propiedades de 〈A | B〉.Afirmacion 1: 〈A | B〉 es topologicamente cerrado.

Es claro, pues 〈A | B〉 es un subespacio de Rn.

Afirmacion 2: 〈A | B〉 es eτA − invariante para todo T > 0.

Se tiene que 〈A | B〉 es el menor subespacio A−invariante de Rn, y por construccion

A(〈A | B〉) ⊂ 〈A | B〉... ⊂ ...

Ak(〈A | B〉) ⊂ 〈A | B〉, ∀ k ∈ N.

25

Page 35: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Como 〈A | B〉 es topologicamente cerrado y Ak − invariante. Se sigue que la serie,vista como una aplicacion eτA : Rn −→ Rn aplicada a cada x ∈ 〈A | B〉 es dada por

eτAx =

(I + τA+

τ 2A2

2!+ · · ·

)(x)

= I(x) + τA(x) +τ 2A2

2!(x) + · · · .

De donde, notamos que la serie converge uniformemente en 〈A | B〉, lo que demuestraque 〈A | B〉 es eτA − invariante.

Afirmacion 3: φuT (0) ∈ 〈A | B〉 para todo T > 0 y u ∈ U .

Sea x ∈ EΣRn (0, T ), entonces existe un control u tal que φuT (0) = x, esto es

eTA(∫ T

0

e−τABu(τ) dτ

)= φuT (0) = x.

Sabemos que u(τ) ∈ Rm, luego Bu(τ) ∈ B(Rm). Ya que por hipotesis 〈A | B〉 contienea B(Rm), se tiene que Bu(τ) ∈ 〈A | B〉.

Ademas, como 〈A | B〉 es eτA − invariante, eτABu(τ) ∈ 〈A | B〉. Por ultimo, setiene que, ∫ T

0

e−τABu(τ) dτ ∈ 〈A | B〉,

puesto que la integral es un lımite de sumas de Riemann y 〈A | B〉 es topologicamentecerrado. Tomando nuevamente el hecho de que 〈A | B〉 es eτA − invariante, se tieneque φuT (0) ∈ 〈A | B〉.

Como caso particular, se tiene que para cada T > 0, EΣRn (0, T ) ⊂ 〈A | B〉. Ası,SΣRn (0) ⊂ 〈A | B〉.

Recıprocamente, tomemos la interseccion de subespacios vectoriales como

I =⋂T>0

EΣRn (0, T ).

Dado que, Rn es de dimension finita y la interseccion de subespacios vectoriales esun espacio vectorial, se tiene que, existe T0 > 0 tal que 0 < T < T0, entonces I =EΣRn (0, T ). Sea u = u(t) ∈ Rm un control constante, entonces φuT (0) ∈ I para todoT ∈ (0, T0), por ser I un espacio vectorial, la derivada en cualquier punto de una curvadiferenciable contenida en I es un vector que pertenece a I, esto es,

dφuT (0)

dT

∣∣∣∣T

∈ I, ∀T ∈ (0, T0).

En efecto, notemos que

dφuT (0)

dT

∣∣∣∣T=0

=d

dT

(eTA

∫ T

0

e−τAB u(τ) dτ

)∣∣∣∣T=0

=

(AeTA

∫ T

0

e−τAB u(τ) dτ + eTA(e−TAB u(T )− e−0·AB u(0) · 0)

)∣∣∣∣T=0

=

(AeTA

∫ T

0

e−τAB u(τ) dτ +B u(T )

)∣∣∣∣T=0

= B u(0) ∈ I.

26

Page 36: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Para cada T ∈ (0, T0) definimos el control uT

: [ 0 , Tu ] −→ Rm definido por T ≤ Tu,de la siguiente manera

uT(t) =

u si 0 < t ≤ T0 si T < t ≤ Tu.

Ahora, calculando el flujo φuTT (0) a partir del origen, para el control u

T, se tiene

φuTt (0) = etA

∫ t

0

e−τAB u(τ) dτ = φut (0), 0 < t ≤ T,

φuTt (0) = φ0

t (φuT (0)) = etA

φuT (0) +

∫ T

0

e−τAB · 0 · dτ, T < t.

Ası que, φuTt (0) = etAφuT (0). De modo que,

φuTt (0) =

φuT (0) si 0 < t ≤ T

etA φuT (0) si T < t.

Luego, eligiendo T y t lo suficientemente cercanos al origen, se tiene que la aplicacionΦ(T, t) = φ

uTt (0) ∈ I.

En efecto, dada

Φ(T, t) =

φut (0) ∈ IetA φuT (0) ∈ I, para T cercano a 0.

Y derivando parcialmente, se obtiene que ∀ k ∈ N,

∂k

∂tk

∣∣∣∣t=0

(∂Φ(T, t)

∂T

∣∣∣∣T=0

)=

∂k

∂tk

∣∣∣∣t=0

(∂φ

uTt (0)

∂T

∣∣∣∣T=0

)=

∂k

∂tk

∣∣∣∣t=0

(∂

∂T(etA φuT (0))

∣∣∣∣T=0

)=

(∂k

∂tketAB u(0)

)∣∣∣∣t=0

=(Ak etAB u(0)

)∣∣t=0

= Ak B u(0) ∈ I.

Particularmente se tiene que, 〈A | B〉 ⊂ I. De modo que,

〈A | B〉 ⊂ I =⋂T>0

EΣRn (0, T ) ⊂⋃T>0

EΣRn (0, T ) = SΣRn (0).

De aquı, 〈A | B〉 = SΣRn (0). Como 〈A | B〉 ⊂ I =⋂T>0

EΣRn (0, T ), entonces para todo

T ∈ (0, T0) se tiene 〈A | B〉 ⊂ EΣRn (0, T ).

Ası que, 〈A | B〉 = EΣRn (0, T ), ∀T > 0. Con lo cual concluimos la prueba.

27

Page 37: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Observacion 2.3. Notemos que, como consecuencia de la forma de la solucion, tene-mos que, para cada x0 ∈ Rn,

EΣRn (x0, T ) = eTAx0 + EΣRn (0, T ).

Puesto que, SΣRn (x0) =⋃T>0

EΣRn (0, T ), entonces ΣRn es controlable desde x0 si y solo

si ΣRn es controlable desde 0.

Es ası, que podemos enunciar el siguiente teorema, [32].

Teorema 2.2. Sea ΣRn un sistema lineal en Rn. Son equivalentes,

ΣRn es controlable desde el origen ⇔ ΣRn es controlable desde algun x0 ∈ Rn.ΣRn es controlable desde x0, ∀x0 ∈ Rn ⇔ 〈A|B〉 = Rn.

A continuacion, se analiza el subespacio 〈A | B〉 desde el punto de vista del cor-chete de Lie. Nuestro interes es describir una generalizacion de la clase de sistemaslineales ΣRn sobre Rn a grupos de Lie de matrices y el concepto de corchete de Lie esfundamental para dicha generalizacion.

Definicion 2.4. Dado ΣRn un sistema de control lineal sobre Rn con

D = Ax+Bu , tal que u ∈ U .

El algebra de Lie de ΣRn aplicada al punto x ∈ Rn, es SpanL.A.(D)(x).

El conjunto SpanL.A.(D) denota el espacio vectorial generado por los elementos deD y todos los corchetes de Lie posibles entre los elementos de D.

Denotemos b1, · · · , bm ∈ Rn las columnas de la matriz B. Si x ∈ Rn, el espaciovectorial SpanL.A.(D)(x) contiene a los vectores

Ax± bj, ±Abj, A(bj ∓ bi), y Ak+1bj, para i, j = 1, · · · ,m, y k ∈ N.

En efecto, consideremos el control uj como el j-esimo vector canonico de Rm, dondej = 1, · · · ,m. Ası, Buj = bj, luego se tiene que:

Ax±Buj = Ax± bj ∈ SpanL.A.(D)(x)

[Ax , bj ] = Abj y [ bj , Ax ] = −Abj =⇒ ±Abj ∈ SpanL.A.(D)(x)

[Ax± bi , Ax± bj ] = ±A(bj ± bi) ∈ SpanL.A.(D)(x)

[Ax+ bi , Abj ] = A2bj ∈ SpanL.A.(D)(x),

y ası sucesivamente. El Teorema de Cayley-Hamilton, afirma que no es necesariocontinuar indefinidamente el calculo de corchetes de Lie. Mas precisamente, este resul-tado afirma que el proceso se detiene en el paso n− 1.

En consecuencia,

SpanL.A.(D)(x) = SpanAx± bj, Abj, A2bj, · · · , An−1bj | j = 1, · · · ,m , y

SpanL.A.(D)(0) = Span bj, Abj, A2bj, · · · , An−1bj | j = 1, · · · ,m = Spancol(B AB A2B · · · An−1B ).

28

Page 38: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Es claro que Buj = bj ∈ 〈A | B〉 y Akbj ∈ 〈A | B〉, para todo j = 1, · · · ,m yk = 1, · · · , n − 1. Esto implica en particular que SpanL.A.(D)(0) ⊂ 〈A | B〉. Como laotra inclusion es tambien verdadera, SΣRn (0) = 〈A | B〉 = SpanL.A.(D)(0).

Despues de este analisis, podemos enunciar la condicion de Kalman para la contro-labilidad de los sistemas lineales clasicos sobre Rn, con controles no acotados, [32].

Teorema 2.3. (Kalman)Sea ΣRn un sistema lineal en Rn con Ω = Rm. Entonces,

ΣRn es controlable ⇐⇒ rank (B AB A2B · · · An−1B ) = n

Demostracion. En efecto, segun el Teorema 2.1 el subespacio 〈A | B〉 que es igual alconjunto accesible desde el origen, coincide con Rn.

Ejemplo 2.1. Consideremos las matrices A =

1 1 00 1 00 0 1

, B =

011

. El sistema

ΣR3 = (R3,D) no es controlable en R3. Para el calculo de SΣR3(0), se tiene,

γuT (x0, y0, z0) =

eT (x0 + 2ue−T + ue−TT − 2u+ Ty0 + Tu)−eT (−y0 + ue−TT + ue−T − u)−eT (−z0 + ue−TT + ue−T − u)

.

Como caso particular se tiene,

SΣR3(0) = SpancolB AB A2B

= Span

0 1 21 1 11 1 1

= plano y = z.

Ejemplo 2.2. Consideremos sobre R2 la familia de ecuaciones diferenciales x = y,y = u parametrizadas por u ∈ U . Esta familia define el sistema lineal ΣR2 sobre R2:(

xy

)=

(0 10 0

)(xy

)+

(01

)u,

ahora calculando la siguiente matriz, se obtiene

(B AB ) =

(0 11 0

).

Luego por el Teorema de Kalman, ΣR2 es controlable. Ası, ∀T > 0,SΣR2

(0) = EΣR2(0, T ) = R2. Es interesante observar que cada estado de R2 se alcanza

desde el origen considerando solo parabolas, esto es, a traves de los controles constantesµ = 1 y µ = −1. Esta situacion esta relacionada con la solucion optimal del siguienteproblema: detenga un tren, que se mueve en linea recta, en una estacion dada en untiempo mınimo.

29

Page 39: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Capıtulo 3

Sistemas de Control Lineales sobregrupos de Lie

En este capıtulo se desarrollara un breve estudio de los sistemas de control sobregrupos de Lie, definiendo el normalizador de un algebra de Lie, el cual esta relacionadocon el campo vectorial lineal, ademas de la relacion entre la derivacion asociada a estecampo y los conjuntos de accesibilidad de los sistemas de control lineales sobre gruposde Lie . Tambien se dara la definicion de la condicion del rango, para luego presentarun resumen de la controlabilidad en los grupos a trabajar.

La presentacion de este capıtulo esta basada en las referencias [29], [30] y el libro[21].

3.1. Normalizador de un algebra de Lie

Como en los capıtulos anteriores, denotemos por G el grupo de Lie y g su alge-bra de Lie asociada. Ademas X(G) denotara el conjunto de los campos de vectoresdiferenciables sobre G.

Definicion 3.1. El normalizador del algebra de Lie g en X(G) sera el siguiente con-junto

N = N ormX(G)

(g) = X ∈ X(G) / [X , Y ] ∈ g, ∀Y ∈ g.

Los elementos que pertenecen a N son llamados de campos afines.

Proposicion 3.1. N es una subalgebra de Lie del algebra de Lie X(G).

Demostracion. En efecto, sean β ∈ R, X , Y , Z,∈ N y Y ∈ g, luego por la identidadde Jacobi se tiene,

[[βX + Y ,Z], Y ] = [[βX + Y , Y ],Z] + [βX + Y , [Z, Y ]]

= [[βX , Y ] + [Y , Y ],Z] + [βX , [Z, Y ]] + [Y , [Z, Y ]]

= [β[X , Y ],Z] + [[Y , Y ],Z] + β[X , [Z, Y ]] + [Y , [Z, Y ]]

= β[[X , Y ],Z] + [[Y , Y ],Z] + β[X , [Z, Y ]] + [Y , [Z, Y ]]

Por hipotesis se tiene que [X , Y ], [Y , Y ], [Z, Y ] ∈ g, entonces

[[X , Y ],Z], [[Y , Y ],Z], [X , [Z, Y ]], [Y , [Z, Y ]] ∈ g.

30

Page 40: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Ademas, β[[X , Y ],Z]+[[Y , Y ],Z]+β[X , [Z, Y ]]+[Y , [Z, Y ]] ∈ g, pues g es una algebrade Lie. Ası, [βX + Y ,Z] ∈ N .

Definicion 3.2. Sea X ∈ X(G). Llamaremos a X lineal si X ∈ N y X (e) = 0. Dondee denota el elemento identidad de G.

Definamos a L(g) como el conjunto de los campos lineales, esto es,

L(g) = X ∈ X(G) | X ∈ N y X (e) = 0.

Proposicion 3.2. L(g) es una subalgebra de Lie del algebra de Lie N .

Demostracion. Dados X , Y ∈ L(g), entonces X , Y ∈ N .Luego se tiene que X + Y ∈ N , pues N es una algebra de Lie. Ademas se tiene que,

(X + Y)(e) = X (e) + Y(e) = 0.

Por lo tanto, X + Y ∈ L(g). Para probar que L(g) es cerrado bajo el corchete de Lie,haremos uso de que N es una subalgebra de Lie, luego se tiene que [X ,Y ] ∈ N .

Observemos que por hipotesis se tiene que X (e) y Y(e) son nulos, de modo que,

[X ,Y ](e) = X|e (Y)− Y|e (X ) = 0.

Por lo tanto, [X ,Y ] ∈ L(g). Ası, L(g) es una subalgebra de Lie.

Proposicion 3.3. La aplicacion definida como sigue

ν : N −→ Der(g)X 7−→ ν(X ) = ad(X ) =: adX

es un homomorfismo de algebras de Lie.

Demostracion. En efecto, sean X , Y ∈ N y Y ∈ g. Luego se tiene que,

ν([X ,Y ])(Y ) = ad[X ,Y](Y )

= [[X ,Y ], Y ]

= [[X , Y ],Y ] + [X , [Y , Y ]]

= [X , [Y , Y ]]− [Y , [X , Y ]]

= adX (adY(Y ))− adY(adX (Y ))

= adX adY(Y )− adY adX (Y )

= (adX adY − adY adX )(Y )

= [ adX , adY ](Y )

= [ ν(X ) , ν(Y) ](Y ).

Ası, ν([X ,Y ])(Y ) = [ν(X ), ν(Y)](Y ), ∀Y ∈ g. Por lo tanto ν es un homomorfismo.

31

Page 41: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Proposicion 3.4. Sea G un grupo de Lie conexo, entonces todo campo vectorial afınpuede ser descompuesto de manera unica como la suma

F = X + Z

donde X es un campo vectorial lineal y Z es un campo invariante a la izquierda, ver[14].

Demostracion. Para demostrar esta proposicion, solo basta mostrar queKer ν = DI(g).Dado F ∈ Ker ν, se tiene que

[F, Y ] = 0, ∀Y ∈ g.

Ahora sea zt el flujo asociado al campo F . Luego, se sigue que zt conmuta con exp(rY )para todo Y ∈ g y r ∈ R. Por lo tanto, la siguiente igualdad se cumple

zt(exp(rY ) · g) = zt(g · exp(rY )) = exp(rY ) · zt(g) ∀g ∈ G

para todo t, r ∈ R. Dado g ∈ G y por la conexidad del grupo, existen Y1, · · ·Yk ∈ g talque,

g = exp(Y1) · · · exp(Yk).

Por otro lado, evaluando zt en g se obtiene

zt(g) = zt(exp(Y1) · · · exp(Yk))= exp(Y1) · · · exp(Yk) · zt(e)= g · zt(e),

para t suficientemente pequeno se tiene

F (g) =d

dtzt(g)

∣∣∣∣t=0

=d

dtLg(zt(e))

∣∣∣∣t=0

= DLgF (e).

Por lo tanto, F ∈ DI(g). Ası, Ker ν ⊂ DI(g).

Para la segunda inclusion, sea Z ∈ DI(g), esto es, Z es un campo invariante a laizquierda. Por la conexidad del grupo, se tiene que, DI(g) = z(g), ası, Z ∈ z(g). Demodo que,

[Z, Y ] = 0, ∀Y ∈ g.

Luego, ν(Z)(Y ) = 0, por lo tanto Z ∈ Ker ν. Con lo que se concluye Ker ν = DI(g).

Para la segunda parte de la proposicion, dado Z un campo invariante a la izquierdadefinido por Z(e) = F (e). Entonces el campo vectorial X = F −Z es claramente lineal,pues F, Z ∈ N y X (e) = F (e)− Z(e) = F (e)− F (e) = 0.

32

Page 42: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Definicion 3.3. Sean G, H grupos de Lie y ϕ : G −→ H una aplicacion diferenciable.Dados X ∈ X(G) y Y ∈ X(H), se dice que X es ϕ− relacionado con Y si

dϕ X = Y ϕ.

Esto es,dϕg(X(g)) = Y (ϕ(g)), para cualquier g ∈ G.

Definicion 3.4. Denominamos de automorfismo a 1-parametro a la aplicacion dife-renciable ϕ : R×G×G −→ G tal que,

ϕt(g · h) = ϕt(g) · ϕt(h), ∀ t ∈ R y g, h ∈ G.

Definicion 3.5. Un campo X es llamado automorfismo infinitesimal, si su flujo esun grupo de automorfismos a 1-parametro de G. De la misma manera el campo X esllamado el automorfismo infinitesimal generador del automorfismo a 1-parametro.

Ejemplo 3.1. Invitamos al lector ver [34]. Sea G el grupo de Lie GL(n,R), estoes, el grupo de todas las transformaciones lineales invertibles sobre Rn y sea gl(n,R) sualgebra de Lie, esto es, el espacio vectorial de todas las matrices reales de orden n×n.Definamos el campo vectorial X por

X (Y ) = ZY − Y Z,

donde Z ∈ gl(n,R) y Y ∈ GL(n,R). Entonces X es el generador infinitesimal delgrupo a 1-parametro Xt de la forma

Xt(g) = etZ g e−tZ .

En efecto,

Xt(g · h) = etZ g · h e−tZ

= etZ g e−tZ · etZh e−tZ

= Xt(g) · Xt(h),

por lo tanto X es un automorfismo infinitesimal de G y claramente diferenciable.

Proposicion 3.5. Si X es un automorfismo infinitesimal. Entonces

(Xt(g))−1 = Xt(g−1), ∀ g ∈ G.

Demostracion. Por hipotesis se tiene que X es un automorfismo infinitesimal, luego

Xt(e) = Xt(e · e) = Xt(e) ·Xt(e)⇒ Xt(e) = e,

ası que,e = Xt(e) = Xt(g · g−1) = Xt(g) ·Xt(g

−1).

Por lo tanto, (Xt(g))−1 = Xt(g−1).

33

Page 43: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Teorema 3.1. Sea X un campo vectorial sobre un grupo de Lie conexo G. Las siguien-tes condiciones son equivalentes:

1. X es lineal.

2. El flujo xt de X es un grupo de automorfismo a 1-parametro de G, esto es, X esun automorfismo infinitesimal.

3. X cumple lo siguiente,

X (gh) = (DLg)h(X (h)) + (DRh)g(X (g)), ∀ g, h ∈ G.

Ademas, el segundo ıtem implica que un campo vectorial lineal sobre un grupo de Lieconexo es completo.

Demostracion. (1 ⇒ 3) Dado que X es lineal, entonces para todo X ∈ g, el corchetede Lie [X , X] es invariante a la izquierda. De modo que, tomando un g ∈ G, es verdadla siguiente igualdad

[X , X](g) = DLg[X , X](e).

Ya que Lg es un difeomorfismo, para todo g ∈ G y el “push-forward”de DLg esta biendefinido, ademas

(DLg[X , X])(e) = [DLg(X ), DLg(X)](e) = [DLg(X ), X Lg](e).

Tambien se tiene que, DLgX y X son Lg-relacionados pues

(DLgX )(g) = (DLgX ) Lg(e) = DLg|eX (e).

Luego se sigue que

[DLg(X ), X Lg](e) = [(DLgX ) Lg, X Lg](e) = [(DLgX ), X](g).

Esto prueba primeramente que [DLgX , X] es invariante a la izquierda para todo X ∈ g,por lo tanto el campo vectorial DLgX es afın. Ademas de la ultima igualdad se tieneque adX = ad

DLgX.

Luego por la proposicion 3.4, podemos descomponer el campo DLgX como

DLgX = X + Z, (3.1)

donde Z es invariante a la derecha. Evaluando en la identidad la igualdad anterior setiene

(DLg)g−1X (g−1) = (DLg)L−1g (e)X (L−1

g (e)) = (DLgX )(e) = X (e) + Z(e) = Z(e).

Ası, por la invarianza de Z, se obtiene

Z(h) = (DRh)eZ(e) = (DR

h)e(DLg)g−1X (g−1) = (DLg)g−1h

(DRh)g−1X (g−1), ∀h ∈ G,

luego evaluando DLgX en el punto h, sigue que

(DLgX )(h) = (DLgX )(gg−1h)

= (DLgX )(Lg(g−1h))

= (DLg)g−1hX (g−1h),

34

Page 44: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

reemplazando los calculos anteriores en (3.1), obtenemos

(DLg)g−1hX (g−1h) = X (h) + (DLg)g−1h(DR

h)g−1X (g−1).

Ahora aplicando (DLg−1)h

en la igualdad anterior, se tiene

X (g−1h) = (DLg−1)hX (h) + (DR

h)g−1X (g−1),

Sustituyendo g−1 por g se obtiene lo deseado, esto es,

X (gh) = (DLg)hX (h) + (DRh)gX (g).

(3 ⇒ 2) Sea xt el flujo asociado a X definido sobre un dominio contenido en R×G.Dados g, h ∈ G, definimos la curva β(t) = xt(g)xt(h) con t ∈ I, donde I ⊂ R es unintervalo abierto, el cual contiene a cero y β toma el valor de gh en t = 0. Luego porla regla de Leibnitz, se tiene

d

dtβ(t)

∣∣∣∣t=0

=d

dt

(xt(g)xt(h)

)∣∣∣∣t=0

= gd

dt

(xt(h)

)∣∣∣∣t=0

+d

dt

(xt(g)

)∣∣∣∣t=0

h

=d

dt

∣∣∣∣t=0

(g xt(h)

)+

d

dt

∣∣∣∣t=0

(xt(g)h

)=

d

dt

∣∣∣∣t=0

Lg(xt(h)) +d

dt

∣∣∣∣t=0

Rh(xt(g))

= DLg|h

(d

dt(xt(h))

)∣∣∣∣t=0

+ DRh|g

(d

dt(xt(g))

)∣∣∣∣t=0

= DLg|h

(X (xt(h)))|t=0 + DRh|g (X (xt(g)))|t=0

= DLg|h

(X (h)) + DRh|g (X (g))

= X (gh), por hipotesis.

Ademas se tiene que,

d

dtxt(gh) = X (xt(gh)) con x0(gh) = gh

Ası que, las dos curvas dadas son soluciones de la misma ecuacion diferencial con lamisma condicion inicial. Por lo tanto, por el Teorema de existencia y unicidad de lasEDO, se obtiene que

xt(gh) = xt(g)xt(h).

Para probar que X es completo, observemos primero que DLe = DRe = Id, donde Ides la aplicacion identidad de g en g. Por otro lado, por la hipotesis se tiene

2X (e) = X (e) + X (e) = (DLe)eX (e) + (DRe)eX (e) = X (e)

Ası, X (e) = 0.

35

Page 45: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Como X (e) = 0 se tiene que xt(e) = e para todo t ∈ R. Ademas xt esta definidasobre Ve una vecindad abierta de la identidad de G, para todo t real. Puesto que, Ges un grupo de Lie conexo, se sigue que G puede ser generado por Ve. Por lo tanto,existen g1, · · · , gn ∈ Ve tales que g = g1 · · · gn. Luego evaluando xt en g se tiene

xt(g) = xt(g1 · · · gn) = xt(g1) · · ·xt(gn),

pues xt es un automorfismo de G, para todo t ∈ R. Esto prueba que X es completo.

(2 ⇒ 1) Sea xt , t ∈ R un grupo de automorfismos a 1-parametro del grupo deLie G y X su generador infinitesimal. Puesto que, xt es un automorfismo, se sigue,

xt(e) = xt(e · e) = xt(e) · xt(e), ∀t ∈ R.

Entonces, xt(e) = e y X (e) = 0. Ahora, dado Y ∈ g, y por una caracterizacion para elcorchete de Lie en la identidad, se tiene

[X , Y ](e) =d

dt

(dx−t

∣∣∣∣xt (e)

(Yxt(e))

)∣∣∣∣∣t=0

=d

dt

(dx−t

∣∣∣∣e

(Ye)

)∣∣∣∣t=0

.

Decimos que,x−t Lxt(g) = Lg x−t. (3.2)

En efecto, sea h ∈ G, luego

x−t Lxt(g)(h) = x−t(Lxt(g)(h))

= x−t(xt(g)h)

= x−t(xt(g))x−t(h)

= x−t+t(g)x−t(h)

= g x−t(h)

= Lg(x−t(h))

= Lg x−t(h).

Derivando la igualdad (3.2) con respecto a t, se tiene

dx−t(dLxt(g)) = dLg(dx−t). (3.3)

Por la caracterizacion del corchete de Lie usada anteriormente, podemos escribir elcorchete de X y Y en el punto g como

[X , Y ](g) =d

dt

(dx−t

∣∣∣∣xt (g)

(Yxt(g))

)∣∣∣∣∣t=0

=d

dt

(dx−t

∣∣∣∣xt(g)

(Y Lxt(g)(e))

)∣∣∣∣∣t=0

=d

dt

(dx−t

∣∣∣∣xt(g)

(DLxt(g)

∣∣∣∣∣e

Y (e)

))∣∣∣∣∣t=0

=d

dt

(DLg

∣∣∣∣e

(dx−t

∣∣∣∣e

Y (e)

))∣∣∣∣t=0

por (3.3)

= DLg|ed

dt

(dx−t

∣∣∣∣e

Y (e)

)∣∣∣∣t=0

= DLg|e [X , Y ](e).

36

Page 46: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Concluimos que X es afın y como xt(e) = e para todo t ∈ R, por lo demostradoanteriormente, se tiene que, X es lineal.

Observacion 3.1. Notemos que, dado un campo vectorial lineal X , podemos asociarloa una derivacion D de g definido por

DY = −[X , Y ], ∀Y ∈ g,

esto es, D = −ad(X ). El signo menos en la definicion viene de la formula [Ax, b] =−Ab en Rn.

Del siguiente diagrama,

gexp

(dxt)e// gexp

G xt //Gse obtiene la relacion entre el flujo xt del campo vectorial lineal X y la derivacion

asociada D, definida en la observacion anterior, esto es

(dxt)e = etD, para todo t ∈ R.

En particular, se tiene que

xt(exp Y ) = exp(etDY ), para todo t ∈ R, Y ∈ g.

3.2. Sistema de Control

En esta seccion comenzaremos por la definicion de sistemas de control lineales sobregrupos de Lie, luego definiremos los conjuntos de accesibilidad del sistema de controlcon algunas propiedades. Tambien definiremos la condicion del rango, y para terminarharemos un pequeno resumen de controlabilidad para grupos de Lie de dimension 2 y3. Esta seccion se basada en [8], [13] y el libro [31].

Definicion 3.6. Un sistema de control lineal ΣG sobre un grupo de Lie conexo Gn-dimensional, es un sistema de control

ΣG : g = Xg +m∑j=1

ujYjg

donde X es un campo vectorial lineal y lo Y j’s son los campos invariantes a iz-quierda. El control u = (u1, · · · , um) toma sus valores en un subconjunto U de Rm.

Definicion 3.7. El conjunto de accesibilidad del sistema ΣG a partir de g, en el tiempot, es el conjunto de todos los puntos que son accesibles en el tiempo t a partir del puntog. El conjunto de accesibilidad del sistema ΣG a partir del punto g es la union de todoslos conjuntos de accesibilidad con tiempo positivo.

37

Page 47: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Denotaremos el conjunto de accesibilidad de ΣG a partir de g en tiempo t porA(g, t). De esta manera podemos escribir el conjunto de accesibilidad del sistema ΣG

como

A(g) =∞⋃T>0

A(g, t).

Proposicion 3.6. Sea ΣG un sistema lineal sobre el grupo de Lie G. Entonces

A(g0, t) = A(e, t)Xt(g0) = Xt(g0)A(e, t), ∀g0 ∈ G.Demostracion. Sea α(t) ∈ A(g0, t), esto es, α es una trayectoria de ΣG tal que α(0) = g0.Sea β(t) = Xt(g

−10 ) y definamos

θ(t) = α(t)(Xt(g0))−1,

con θ(0) = e. Luego por la proposicion 3.5 se tiene que

θ(t) = α(t)β(t),

derivando con respecto de t, nos da

θ(t) = α(t)β(t) + α(t)β(t)

= DRβ(t)(α(t))α(t) +DLα(t)(β(t))β(t).

Usando el hecho que α es una trayectoria de ΣG y que los vectores de control soninvariantes a la derecha, se sigue que

θ(t) = α(t)β(t) + α(t)β(t)

= DLα(t)(β(t))X (β(t)) +DRβ(t)(α(t))

[X (α(t)) +

n∑j=1

ujDRα(t)(e)Yj

]

= DLα(t)(β(t))X (β(t)) +DRβ(t)(α(t))X (α(t)) +n∑j=1

ujDRβ(t)(α(t))DRα(t)(e)Yj

= X (θ(t)) +n∑j=1

ujDR(α(t)β(t))(e)Yj

= X (θ(t)) +n∑j=1

ujYj(θ(t)).

Luego,

θ = X (θ) +n∑j=1

ujYj(θ),

por lo tanto, θ(t) es trayectoria de ΣG con θ(0) = e, ası que, θ(t) ∈ A(e, t). Por loanterior se tiene que α(t) ∈ A(e, t)Xt(g0). Ası, A(g0, t) ⊆ A(e, t)Xt(g0).

Para la otra inclusion A(e, t)Xt(g0) ⊆ A(g0, t), sea γ(t) la trayectoria de ΣG empe-zando en γ(0) = e y α(t) = γ(t)Xt(g0), ası, α(t) ∈ A(g0, t).

Para probar la segunda igualdad, la misma prueba funciona para

ω(t) = (Xt(g0))−1α(t).

38

Page 48: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

3.2.1. La condicion del rango

Sea h la subalgebra generada de g generada por Y 1, · · · , Y m del sistema ΣG,denotemos por Dh el menor subespacio D-invariante de g que contiene a h, es decir

Dh = genDkY : Y ∈ h y k ∈ N= genDkY : Y ∈ h y 0 ≤ k ≤ n− 1

y sea LA(Dh) la subalgebra de g generado por Dh (donde D = −ad(X )).

Proposicion 3.7. La subalgebra LA(Dh) es D-invariante. El sistema de algebra deLie es por lo tanto

L = RX ⊕ LA(Dh)

La condicion del rango del algebra de Lie (LARC) es satisfecha por ΣG si y solo si

LA(Dh) = g.

Observacion 3.2. La subalgebra LA(Dh) es en realidad el ideal de L, llamado el idealde tiempo cero y es denotado por L0.

3.3. Controlabilidad

A continuacion entregamos resultados de controlabilidad para sistemas lineales so-bre grupos de Lie de dimension 2 y 3. Esta informacion proviene de una serie de trabajospublicados y referidos en la bibliografıa presente en la Tesis.

Grupo de Lie Algebra de LieAff+(2)

Grupo Afın aff+(2) = Span

(1 00 0

),

(0 10 0

)H

Grupo de Hei-senberg

h = Span

0 1 0

0 0 00 0 0

,

0 0 00 0 10 0 0

,

0 0 10 0 00 0 0

.

SO(3,R)Grupo de Rota-ciones

so(3,R)

Es el conjunto de matrices antisimetricas reales de orden 3× 3.SL(2,R)Grupo LinealEspecial

sl(2,R)

Es el conjunto de matrices reales de traza cero de orden 2× 2.

39

Page 49: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Grupo de Lie Controlabilidad en Sistemas LinealesAff+(2)

Grupo Afın ΣAff+(2) :

x = uαxy = x− 1 + by con α 6= 0

.

El sistema lineal de control ΣAff+(2) es globalmente controlablesi y solo si b = 0, ver [22]

HGrupo de Hei-senberg

ΣH : g = Xg + uXg, u ∈ U y X viene

de la derivacion

a b 01 d 00 f d

, y X =

0 1 00 0 00 0 0

.

El sistema ΣH es controlable si y solo si

b < −d2

4⇔ d = 0, f 6= 0, ver [22].

SO(3,R)Grupo de Rota-ciones

Todo sistema lineal de control ΣSO(3,R) sobre SO(3,R) es

controlable si satisface el LARC, ver [13].SL(2,R)Grupo LinealEspecial

El sistema lineal sera controlable si este

conjunto es invariante positivo, ver [9] y [15].

40

Page 50: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Capıtulo 4

El Principio del Maximo dePontryagin

4.1. El Principio del Maximo de Pontryagin para

problemas de tiempo Optimal

El Principio del Maximo de Pontryagin (PMP), es un resultado bastante generalque impone condiciones necesarias a un sistema de control definida sobre una variedaddiferenciable con el objetivo de sintetizar un control optimal para un problema deoptimalidad sobre el sistema.

En esta tesis estamos interesados en el estudio del problema de tiempo mınimopara la clase de los sistemas lineales de control sobre grupos de Lie, que generalizanlos clasicos sistemas lineales sobre espacios vectoriales. Para mas detalles invitamos allector a ver [1], [31] y [37].

Consideremos el sistema de control

ΣM : x = f(x) +m∑j=1

ujgj(x),

donde f y los g′js son campos vectoriales diferenciables sobre una variedad M y elcontrol u = (u1, . . . , um) pertenece a algun subconjunto cerrado y convexo U de Rm

con cero en interior de U .Una propiedad fundamental de los sistemas de control que esta estrictamente re-

lacionada con el PMP es la controlabilidad y como caso particular la existencia deconjuntos de control, mas detalles podemos encontrar en [5, 6, 7, 8, 9, 13, 14, 15, 22].

Para que exista una trayectoria optimal del sistema conectando x(0) con x(t) entiempo mınimo es necesario que exista a priori una solucion del sistema conectandoel estado inicial con el estado deseado. De allı la relevancia de la propiedad de lacontrolabilidad que asegura esta existencia para dos estados arbitrarios de la variedad.Cuando no hay controlabilidad la existencia de un conjunto de control asegura lo mismoal interior de este conjunto, puesto que por definicion la propiedad de controlabilidades valida al interior de este conjunto.

A continuacion describimos un resumen de los resultados existentes para grupos deLie de dimension 2 y 3, invitamos al lector ver las referencias [4] y [11].

41

Page 51: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

El Hamiltoniano asociado es

H(λx, x, u) = 〈λx, f(x) +m∑j=1

ujgj(x)〉 donde λx ∈ T ∗xM.

Teorema (Del Principio del Maximo de Pontryagin, ver [11] y [12]) 4.1.Si u∗(t), t ∈ [0, T ], es un control tal que la solucion asociada x(t) de ΣM minimizael tiempo entre todas las curvas admisibles que conectan x(0) a x(T ), entonces existeuna curva Lipschitziana (λ(t), x(t)) en el espacio cotangente T ∗M de M (aquı λ(t) ∈T ∗x(t)M) tal que

1) λ(t) 6= 0 para todo t ∈ [0, T ].

2) H(λ(t), x(t), u∗(t)) = maxu∈UH(λ(t), x(t), u) para casi todo t ∈ [0, T ].

3) H(λ(t), x(t), u∗(t)) ≥ 0 para casi todo t ∈ [0, T ].

4) (λ(t), x(t)) satisfacen las ecuacionesd

dtx(t) =

∂λH(λ(t), x(t), u∗(t)) = f(x(t)) +

m∑j=1

u∗j(t)gj(x(t))

d

dtλ(t) = − ∂

∂xH(λ(t), x(t), u∗(t))

4.2. Resultados Generales

Consideremos el sistema lineal

ΣG : g = Xg +m∑j=1

ujYjg ,

sobre el grupo de Lie G conexo n-dimensional, donde U es el intervalo [−B,B]m con-tenido en Rm para algun B > 0 en el caso acotado y U = Rm en el caso no-acotado.

Para aplicar el Principio Maximo de Pontryagin, primero debemos escribir el Ha-miltoniano del sistema, es decir

H(λg, g, u) = 〈λg,Xg +m∑j=1

ujYjg 〉.

Como Y jg = DLgY

j, Xg = DLgFg y λg = λDLg−1 , podemos trasladarH al espaciotangente en la identidad, es decir,

H(λ, g, u) = 〈λ, F (g)〉+m∑j=1

uj〈λ, Y j〉, donde Fg = DLg−1Xg ∈ TeG y λ = λe ∈ T ∗eG.

42

Page 52: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Observe que H ya no se escribe en el espacio cotangente de G sino en g∗×G, puesT ∗G es difeomorfo a g∗ ×G, esto es, g∗ ×G ∼= T ∗G. Como se obtiene de la referencia[37], las ecuaciones Hamiltonianas dadas sobre el producto g∗ ×G, son:

g = Xg +m∑j=1

ujYj(g)

λ = (−D +m∑j=1

uj ad(Y j))∗λ

(4.1)

donde D es la derivacion de g asociada a X .

4.2.1. El caso No-acotado

En el caso no-acotado, la maximizacion de H implica

〈λ, Y i〉 = 0, para i = 1, · · · ,m. (4.2)

En efecto, si 〈λ, Y i〉 6= 0 para algun i, podemos tomar ui arbitrariamente grande yde esa manera H no tendrıa maximo.

Si (λ(t), g(t)) es un extremal, entonces se tiene 〈λ(t), Y i〉 = 0 para todo t para elcual se define el extremo, por tanto tambien 〈λ(t), Y i〉 = 0 en casi en todas partes(almost everywhere, (a.e.)). Por las ecuaciones Hamiltonianas, esta ultima igualdad esequivalente a

〈λ(t),−DY i +m∑j=1

uj(t)[Yj, Y i]〉 = 0 a.e., ∀i = 1, · · · ,m. (4.3)

Estos extremos se llaman singulares (ver [1] o [17] ).

4.2.2. Caso Acotado

Consideremos ahora el caso donde −B ≤ uj ≤ B para j = 1, · · · ,m. Gracias alTeorema de Filippov sabemos que existe una solucion en tiempo mınimo (ver [1]).

La maximizacion de H implica

1) uj = δjB, donde δj = sign〈λ, Y j〉, si 〈λ, Y j〉 6= 0.

2) uj no se determina si 〈λ, Y j〉 = 0.

Ası obtenemos 2m dinamicas diferentes, a las que posiblemente hay que anadir lasdinamicas relacionadas con 〈λ, Y j〉 = 0 para algunos j’s.

43

Page 53: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

4.3. Aplicacion del Principio del Maximo de Pontrya-

gin

A continuacion daremos las aplicaciones del PMP sobre grupos de Lie, de dimensiondos y tres.

4.3.1. El grupo Afın Aff+(2)

El grupo afın 2-dimensional es un grupo de Lie dado por

G = Aff+(2) =

(a b0 1

); a, b ∈ R con a > 0

.

Para facilitar los calculos en este grupo, tomaremos como

Aff+(2) = R∗+ × R, con e = (1, 0),

y la operacion del grupo G es dada por (x1, x2)× (y1, y2) = (x1y1, x1y2 + x2).

Su algebra de Lie g = aff+(2) es dada por

g = Span

(1 00 0

),

(0 10 0

),

cuyos elementos los denotaremos por X, Y respectivamente. Notemos que el cor-chete de [X, Y ] = XY − Y X = Y es el unico que no se anula.

Ahora calcularemos los campos invariantes a izquierda, para esto, definimos la tras-lacion a la izquierda por

L(x,y)(a, b) = (xa, xb+ y),

reescribiendo de manera mas compacta se tiene Lg(h) = g × h, donde g = (x, y) yh = (a, b). Luego la derivada de Lg sera,

DL(x,y)(a, b) =

(x 00 x

).

Notemos que DL(x,y)(a, b) = DL(x,y)(1, 0) pues DL(x,y) no depende del punto a evaluar.Luego evaluando DL(x,y)(1, 0) en la base coordenada, se obtiene lo siguiente:

(DLg)e

(∂

∂x

∣∣∣∣e

)= x

∂x

∣∣∣∣g

(DLg)e

(∂

∂y

∣∣∣∣e

)= x

∂y

∣∣∣∣g

Ası que, los campos invariantes a la izquierda estaran dados por,

Xg = x∂

∂x= gX =

(x 00 0

), Yg = x

∂y= gY =

(0 x0 0

), con g =

(x y0 1

),

cuyo elemento es identificado con (x, y).

44

Page 54: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Ahora hallaremos la matriz de la derivacion D : aff+(2) −→ aff+(2) la cual estaasociada al campo lineal X . Para esto, sea

D :=

(c da b

),

se sigue que, escribiendo D en la base de aff+(2), se obtiene

DX = cX + aY

DY = dX + bY. (4.4)

Luego calculando DY , se tiene

DY = D[X, Y ]

= [DX, Y ] + [X,DY ], pues D es una derivacion

= [cX + aY, Y ] + [X, dX + bY ]

= [cX, Y ] + [aY, Y ] + [X, dX] + [X, bY ], por la bilinealidad de [·, ·]= cY + bY

= (c+ b)Y.

De modo que,DY = (c+ b)Y.

Ahora igualando esta ultima ecuacion con la ecuacion (4.4), se tiene que d = 0 yc+ b = b. Ası que,

c = d = 0.

Ası, reemplazando estos valores en D, se obtiene lo siguiente

D :=

(0 0a b

)Por otro lado, evaluando X(x, y), Y (x, y) en e = (1, 0), se tiene,

X(e) =∂

∂x, y Y (e) =

∂y,

de ahı se tiene que

DX =

(0 0a b

)(10

)y DY =

(0 0a b

)(01

)=

(0a

)=

(0b

)= aY = bY

= a∂

∂y, = b

∂y.

Luego calcularemos el campo lineal, como sabemos cada D esta asociada a un unicocampo lineal X definido por

X (x, y) = a1(x, y)∂

∂x+ a2(x, y)

∂y.

45

Page 55: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Ahora denotemos los campos invariantes a izquierda por

F1(g) = (DX)g = ax∂

∂yy F2(g) = (DY )g = bx

∂ycon g = (x, y).

Notemos que,

F1(e) = a∂

∂y= DX y F2(e) = b

∂y= DY con e = (1, 0).

Ası, por unicidad se tiene que

F1(g) = −[X , X]g

= −[a1(x, y)

∂x+ a2(x, y)

∂y, x

∂x

]= −

[a1(x, y)

∂x, x

∂x

]−[a2(x, y)

∂y, x

∂x

]= −a1

∂x

(x∂

∂x

)+ x

∂x

(a1

∂x

)− a2

∂y

(x∂

∂x

)+ x

∂x

(a2∂

∂y

)= −a1

∂x− a1x

∂2

∂x2+ x

∂a1

∂x

∂x+ xa1

∂2

∂x2− a2x

∂2

∂y∂x+ x

∂a2

∂x

∂y+ xa2

∂2

∂x∂y

= −a1∂

∂x+ x

∂a1

∂x

∂x+ x

∂a2

∂x

∂y

=

(−a1 + x

∂a1

∂x

)∂

∂x+

(x∂a2

∂x

)∂

∂y.

F2(g) = −[X , Y ]g

= −[a1(x, y)

∂x+ a2(x, y)

∂y, x

∂y

]= −

[a1(x, y)

∂x, x

∂y

]−[a2(x, y)

∂y, x

∂y

]= −a1

∂x

(x∂

∂y

)+ x

∂y

(a1

∂x

)− a2

∂y

(x∂

∂y

)+ x

∂y

(a2∂

∂y

)= −a1

∂y− a1x

∂2

∂x∂y+ x

∂a1

∂y

∂x+ xa1

∂2

∂y∂x− a2x

∂2

∂y2+ x

∂a2

∂y

∂y+ xa2

∂2

∂y2

= −a1∂

∂y+ x

∂a1

∂y

∂x+ x

∂a2

∂y

∂y

=

(x∂a1

∂y

)∂

∂x+

(−a1 + x

∂a2

∂y

)∂

∂y.

46

Page 56: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Luego, igualando estas ultimas ecuaciones con F1(g) y F2(g) respectivamente, seobtiene

−a1 + x∂a1

∂x= 0 (4.5)

x∂a2

∂x= ax (4.6)

x∂a1

∂y= 0 (4.7)

−a1 + x∂a2

∂y= bx (4.8)

Luego derivando la ecuacion (4.5) con respecto a y, se tiene

−∂a1

∂y+ x

∂2a1

∂y∂x= 0 (4.9)

de la ecuacion (4.7) se tiene que ∂a1∂y

= 0 pues x > 0. Con esto se obtiene de (4.9)

∂2a1

∂y∂x= 0⇒ ∂a1

∂x= c1 pues a1 no depende de y

⇒ a1(x, y) = c1x+ c2 con c1, c2 constantes

se sigue de (4.6) que

a2(x, y) = ax+ h(y)⇒ ∂a2

∂y=

∂yh(y)

⇒ x∂

∂yh(y) = x

∂a2

∂y

⇒ x∂

∂yh(y) = x

∂a2

∂y= bx+ a1(x, y) por (4.8)

⇒ x∂

∂yh(y) = bx+ c1x+ c2.

De ahı que, al derivar con respecto a x se tiene

∂yh(y) = b+ c1 ⇒ h(y) = (b+ c1)y + c3, con c3 =constante.

Por lo tanto,a2(x, y) = ax+ (b+ c1)y + c3.

Se tiene que, F1(g) =(−a1 + x∂a1

∂x

)∂∂x

+(x∂a2∂x

)∂∂y

, entonces reemplazando los valores

obtenidos de a1(x, y) y a2(x, y) se tendra

F1(g) = −c2∂

∂x+ ax

∂y,

pero como F1(g) = ax ∂∂y

y por la ecuacion anterior se tendra c2 = 0.

Ademas, como X (e) = 0 se tiene que a1(e) = 0 y a2(e) = 0, esto implica que

c1 = 0 y c3 = −a.

47

Page 57: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Ası,

a1(x, y) = 0,

a2(x, y) = a(x− 1) + by.

Por lo tanto,

X (x, y) = (a(x− 1) + by)∂

∂y.

Reescribiendo en notacion matricial se tiene

X (x, y) =

(0 a(x− 1) + by0 0

).

Recordemos de [22] que un grupo de automorfismos a un sistema lineal en Aff+(2)que satisface la condicion del rango tiene la siguiente forma

g = Xg + uαXg, con α 6= 0 , (4.10)

y que este es globalmente controlable si y solo si b = 0. El ejemplo vine de la siguientereferencia [11].

Ası que nosotros tomaremos el sistema (4.10), donde el campo vectorial lineal estara

asociado a la derivacion D =

(0 01 0

)de las bases canonicas del algebra de Lie, y

el vector controlado sera αX. Luego escribiendo este nuevo sistema en coordenadas setiene

x = uαxy = x− 1 con α 6= 0

.

El Hamiltoniano dado es

H(λ, g, u) = 〈λ, Fg〉+ u〈λ, αX〉.

a) El caso No-acotado para Aff+(2)

Para este caso derivamos H con respecto a u e igualamos a cero, esto es

α〈λ,X〉 = 0 ,

como α 6= 0 se obtiene la condicion de maximizacion

〈λ,X〉 = 0.

Derivando con respecto a t esta ultima ecuacion se obtiene

0 = 〈λ(t), X〉= 〈(−D + uα ad(X))∗λ(t), X〉, por las ecuaciones Hamiltonianas

= 〈λ(t),−DX + uα[X,X]〉= 〈λ(t),−Y 〉,

luego se tiene que λ = 0. Por lo tanto, por el Principio del Maximo de Pontryaginno existe una trayectoria extremal.

48

Page 58: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

b) El caso acotado para Aff+(2)

Notemos que la ecuacion y = x − 1 y el hecho que x sea positivo implican queuna curva admisible no puede ir de (1, 0) a (1,−d) en tiempo menor que d.

Ahora calcularemos la curva de minimizacion del tiempo entre estos puntos paracontroles acotados, u ∈ [−B,B]. Sin perdida de generalidad asumamos que α > 0.Luego reescribiendo en coordenadas el Hamiltoniano, esto es (con λg = (p, q)):

H(λg, g, u) = 〈λg,Xg〉+ u〈λg, αXg〉 = upαx+ q(x− 1)

y sus ecuaciones Hamiltonianas sonx = uαxy = x− 1

p = −uαp− qq = 0

Supongamos que p(t0) = 0 y q(t0) = q0 para algun t0.

Veamos la solucion del sistemap = −uαp− qq = 0

i) Para esto supondremos que el control u 6= 0. Ası que, el factor integranteexiste y este es dado por euαt. Luego la solucion del sistema sera:

p(t) = − q0uα

+q0uα

euα(t0−t) q(t) = q0

Ademas supondremos que q = q0 6= 0 y ası el par (p(t), q(t) = q0) no seanula en ninguna parte. Esto implica que p(t0) = −q 6= 0, por lo tanto ppuede anularse como maximo una vez.

Como consecuencia, un control optimo toma el valor constante B o −B ycambia como maximo una vez. Ademas, la unica posibilidad de ir de (1, 0)a (1,−d) es primero u = −B para t ∈ [0, T

2] (a fin de que x(t) ≤ 1 y y ≤ 0),

y luego u = B para t ∈ [T2, T ] a fin de que x(T ) = 1. Un simple calculo nos

dax(t) = e−Bαt t ∈ [0, T2 ]

x(t) = e−BαT eBαt t ∈ [T2 , T ]y(t) = 1

Bα(1− e−Bαt)− t t ∈ [0, T2 ]

y(t) = 1Bαe

−BαT eBαt − 2Bαe

−BαT2 + 1

Bα − t t ∈ [T2 , T ]

Para terminar

−d = y(T ) =2

Bα(1− e−Bα

T2 )− T,

luego T = d+ 2Bα

(1−e−BαT2 ) > d. Observemos que TB 7−→+∞−−−−−→ d y el tiempo

mınimo para ir de (1, 0) a (1,−d) con controles no-acotados es en efecto dy este no se alcanza.

49

Page 59: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

ii) Para este caso tomemos el control u = 0. De modo que, el sistema queda dela siguiente manera

p = −qq = 0

Ası, la solucion de este sistema sera

p(t) = q0(t0 − t) q(t) = q0

Ademas supondremos que q = q0 6= 0 y ası el par (p(t), q(t) = q0) no seanula en ninguna parte. Esto implica que p(t0) = −q 6= 0, por lo tanto ppuede anularse como maximo una vez.

Luego resolviendo el siguiente sistema,x = 0y = x− 1

con las condiciones iniciales x(0) = x y y(0) = y, se obtiene

x(t) = x y(t) = (x− 1)t+ y

Como consecuencia, el control optimo para este caso toma el valor constanteu = 0. Ademas notemos que para valores x = 1, el flujo asociado al sistemaanterior es fijo. Ası que, no existe una curva para ir de (1, 0) a (1,−d).

4.3.2. El grupo de Heisenberg

El grupo de Heisenberg 3-dimensional es el grupo de matrices dado por

G =

1 x z

0 1 y0 0 1

|x, y, z ∈ R

,

y la operacion del grupo G es dada por (x1, x2, x3)× (y1, y2, y3) = (x1 +y1, x2 +y2, x3 +y3 + x1y2), con e = (0, 0, 0).

Su algebra de Lie g es dada por

g = Span

0 1 0

0 0 00 0 0

,

0 0 00 0 10 0 0

,

0 0 10 0 00 0 0

,

cuyos elementos los denotaremos por X, Y, Z respectivamente. Notemos que el corche-te de [X, Y ] = XY − Y X = Z es el unico que no se anula.

Ahora calcularemos los campos invariantes a izquierda, para esto, definimos la tras-lacion a la izquierda por

L(x,y,z)(a, b, c) = (x+ a, y + b, z + c+ xb),

50

Page 60: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

reescribiendo de manera mas compacta se tiene Lg(h) = g × h, donde g = (x, y, z) yh = (a, b, c). Luego la derivada de Lg sera,

DL(x,y,z)(a, b, c) =

1 0 00 1 00 x 1

.

Notemos que DL(x,y,z)(a, b, c) = DL(x,y,z)(0, 0, 0) pues DL(x,y,z) no depende del puntoa evaluar.

Luego evaluando DL(x,y,z)(0, 0, 0) en la base coordenada, se obtiene lo siguiente:

(DLg)e

(∂

∂x

∣∣∣∣e

)=

∂x

∣∣∣∣g

(DLg)e

(∂

∂y

∣∣∣∣e

)=

∂y

∣∣∣∣g

+ x∂

∂z

∣∣∣∣g

(DLg)e

(∂

∂x

∣∣∣∣e

)=

∂z

∣∣∣∣g

Ası que, los campos invariantes a la izquierda estaran dados por,

Xg =∂

∂x, Yg =

∂y+ x

∂z, Zg =

∂z, con g =

1 x z0 1 y0 0 1

,

cuyo elemento es identificado con (x, y, z).

Ahora hallaremos la matriz de la derivacion D : g −→ g la cual esta asociada alcampo lineal X . Para esto, sea

D :=

a b cd e fg h i

se sigue que, escribiendo D en la base de g, se obtiene

DX = aX + dY + gZ

DY = bX + eY + hZ

DZ = cX + fY + iZ. (4.11)

Luego calculando DZ, se tiene

DZ = D[X,Y ]

= [DX,Y ] + [X,DY ], pues D es una derivacion

= [aX + dY + gZ, Y ] + [X, bX + eY + hZ]

= [aX, Y ] + [dY, Y ] + [gZ, Y ] + [X, bX] + [X, eY ] + [X,hZ], por la bilinealidad de [ · , · ]= aZ + eZ

= (a+ e)Z

51

Page 61: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

De modo que,DZ = (a+ e)Z

Ahora igualando esta ultima ecuacion con la ecuacion (4.11), se tiene que

c = f = 0, y a+ e = i.

Ası, reemplazando estos valores en D, se obtiene lo siguiente

D =

a b 0d e 0g h a+ e

.

Por otro lado, evaluando X(x, y, z), Y (x, y, z), Z(x, y, z) en e = (0, 0, 0), se tiene,

X(e) =∂

∂x, Y (e) =

∂y, Z(e) =

∂z

de ahı se tiene que

DX =

a b 0d e 0g h a+ e

100

, DY =

a b 0d e 0g h a+ e

010

=

adg

=

beh

= aX + dY + gZ = bX + eY + hZ

= a∂

∂x+ d

∂y+ g

∂z, = b

∂x+ e

∂y+ h

∂z,

DZ =

a b 0d e 0g h a+ e

001

=

00

a+ e

= (a+ e)Z

= (a+ e)∂

∂z.

Luego calcularemos el campo lineal, pero como cada derivacion D esta asociada a ununico campo lineal X definido por

X (g) = a1(g)∂

∂x+ a2(g)

∂y+ a3(g)

∂z.

Ahora denotemos los campos invariantes a la izquierda por

F1(g) = (DX)g = a∂

∂x+d

∂y+(dx+g)

∂z, F2(g) = (DY )g = b

∂x+e

∂y+(ex+h)

∂z,

52

Page 62: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

F3(g) = (DZ)g = (a+ e)∂

∂zcon g = (x, y, z).

Notemos que,

F1(e) = a∂

∂x+ d

∂y+ g

∂z, F2(e) = b

∂x+ e

∂y+ h+

∂z

F3(e) = (a+ e)∂

∂zcon e = (0, 0, 0).

Ası por unicidad se tiene que

F1(g) = −[X , X]g

= −[a1(g)

∂x+ a2(g)

∂y+ a3(g)

∂z,∂

∂x

]= −

[a1(g)

∂x,∂

∂x

]−[a2(g)

∂y,∂

∂x

]−[a3(g)

∂z,∂

∂x

]= −a1

∂x

(∂

∂x

)+

∂x

(a1

∂x

)− a2

∂y

(∂

∂x

)+

∂x

(a2

∂y

)− a3

∂z

(∂

∂x

)+

∂x

(a3

∂z

)= −a1

∂2

∂x2+

∂a1∂x

∂x+ a1

∂2

∂x2− a2

∂2

∂y∂x+

∂a2∂x

∂y+ a2

∂2

∂x∂y− a3

∂2

∂z∂x+

∂a3∂x

∂z+ a3

∂2

∂x∂z

=

(∂a1∂x

)∂

∂x+

(∂a2∂x

)∂

∂y+

(∂a3∂x

)∂

∂z,

F2(g) = −[X , Y ]g

= −[a1(g)

∂x+ a2(g)

∂y+ a3(g)

∂z,∂

∂y+ x

∂z

]= −

[a1(g)

∂x,∂

∂y

]−[a1(g)

∂x, x

∂z

]−[a2(g)

∂y,∂

∂y

]−[a2(g)

∂y, x

∂z

]−[a3(g)

∂z,∂

∂y

]−[a3(g)

∂z, x

∂z

]= −a1

∂2

∂x∂y+

∂a1∂y

∂x+ a1

∂2

∂y∂x− a1

∂z− a1x

∂2

∂x∂z+ x

∂a1∂z

∂x+ xa1

∂2

∂z∂x

− a2∂2

∂y2+

∂a2∂y

∂y+ a2

∂2

∂y2− a2x

∂2

∂y∂z+ x

∂a2∂z

∂y+ xa2

∂2

∂z∂y− a3

∂2

∂z∂y+

∂a3∂y

∂z+ a3

∂2

∂y∂z

− a3x∂2

∂z2+ x

∂a3∂z

∂z+ xa3

∂2

∂z2

=∂a1∂y

∂x− a1

∂z+ x

∂a1∂z

∂x+

∂a2∂y

∂y+ x

∂a2∂z

∂y+

∂a3∂y

∂z+ x

∂a3∂z

∂z

=

(∂a1∂y

+ x∂a1∂z

)∂

∂x+

(∂a2∂y

+ x∂a2∂z

)∂

∂y+

(∂a3∂y

+ x∂a3∂z− a1

)∂

∂z,

53

Page 63: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

F3(g) = −[X , Z]g

= −[a1(g)

∂x+ a2(g)

∂y+ a3(g)

∂z,∂

∂z

]= −

[a1(g)

∂x,∂

∂z

]−[a2(g)

∂y,∂

∂z

]−[a3(g)

∂z,∂

∂z

]= −a1

∂2

∂x∂z+

∂a1∂z

∂x+ a1

∂2

∂z∂x− a2

∂2

∂y∂z+

∂a2∂z

∂y+ a2

∂2

∂z∂y− a3

∂2

∂z2+

∂a3∂z

∂z+ a3

∂2

∂z2

=

(∂a1∂z

)∂

∂x+

(∂a2∂z

)∂

∂y+

(∂a3∂z

)∂

∂z.

Igualando a las F1(g), F2(g), y F3(g) obtenidas anteriormente se tiene

∂a1

∂x= a (4.12)

∂a1

∂y+ x

∂a1

∂z= b (4.13)

∂a1

∂z= 0 (4.14)

∂a2

∂x= d (4.15)

∂a2

∂y+ x

∂a2

∂z= e (4.16)

∂a2

∂z= 0 (4.17)

∂a3

∂x= dx+ g (4.18)

∂a3

∂y+ x

∂a3

∂z− a1 = ex+ h (4.19)

∂a3

∂z= a+ e (4.20)

Resolviendo los sistemas de manera ordenada se obtiene las siguientes funciones,

a1(x, y, y) = ax+ by + c1, a2(x, y, z) = dx+ ey + c2,

a3(x, y, y) =1

2dx2 +

1

2by2 + gx+ (h+ c1)y + (a+ e)z + c3.

Como el campo X (e) = 0, se obtiene que c1 = c2 = c3 = 0. Ası se tiene que

X (x, y, z) = (ax+ by)∂

∂x+ (dx+ ey)

∂y+ (

1

2dx2 +

1

2by2 + gx+ hy + (a+ e)z)

∂z.

54

Page 64: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Se muestra en [22] que un sistema de entrada unica que satisface la condicion delrango del algebra de Lie depende de un automorfismo de grupo igual a:

ΣG : g = Xg + uXg donde D =

0 b 01 d 00 f d

,

es la derivacion asociada a X en la base X, Y, Z. Veamos el problema del tiempooptimo para entradas no-acotadas. El Hamiltoniano es

H(λ, g, u) = 〈λ, Fg〉+ u〈λ,X〉.

La condicion de maximizacion implica 〈λ(t), X〉 = 0, y luego

0 = 〈λ(t), X〉= 〈(−D + u ad(X))∗λ(t), X〉, por las ecuaciones Hamiltonianas

= 〈λ(t),−DX + u[X,X]〉= 〈λ(t),−Y 〉,

ya que DX = Y . La condicion 〈λ(t), Y 〉 = 0 implica a su vez

0 = 〈λ(t), Y 〉= 〈(−D + u ad(X))∗λ(t), Y 〉, por las ecuaciones Hamiltonianas

= 〈λ(t),−DY + u[X, Y ]〉= 〈λ(t),−(bX + dY + fZ) + uZ〉= 〈λ(t),−fZ + uZ〉.

Dado que 〈λ(t), X〉 = 〈λ(t), Y 〉 = 0 y λ(t) 6= 0 por la condicion del PMP, setiene que u = f . Este ejemplo ilustra el hecho de que algunas de las ecuaciones demaximizacion pueden proporcionar los valores de los controles optimos. Aquı la unicaposibilidad es que u sea constante e igual a f .

4.3.3. El caso compacto SO(3,R)

Sea G = SO(3,R) el grupo rotacional. Su algebra de Lie so(3,R) es dada por lasmatrices antisimetricas reales de orden 3× 3,

so(3,R) = span

X =

0 0 00 0 −10 1 0

, Y =

0 0 −10 0 01 0 0

, Z =

0 −1 01 0 00 0 0

,

donde, [X, Y ] = Z, [Z,X] = Y y [Y, Z] = X. Ademas, se muestra en [13] que lossistemas de control lineales sobre grupos de Lie compactos son controlables si y solo sisatisfacen la condicion del rango del algebra de Lie.

55

Page 65: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Veamos el siguiente sistema lineal no-acotado

ΣG : g = Xg + uYg, donde D = −ad(X) y U = R.

Luego, analicemos el problema de tiempo optimo para entradas no-acotadas. ElHamiltoniano es

H(λg, g, u) = 〈λg,Xg〉+ u〈λg, uYg〉,

y las ecuaciones Hamiltonianas seran:g = Xg + uYg

λ = (−D + u ad(Y ))∗λ.

Luego la condicion de maximizacion para el caso no-acotado implica que

〈λ(t), Y 〉 = 0, ∧ 〈λ(t), Y 〉 = 0. (4.21)

De la ecuacion (4.21) tenemos

0 = 〈λ(t), Y 〉 = 〈(−D + u ad(Y ))∗λ, Y 〉, por las ecuaciones Hamiltonianas= 〈λ(t),−DY + u ad(Y )(Y )〉= 〈λ(t),−Z〉 =⇒ 〈λ(t), Z〉 = 0

Por otro lado, si derivamos una vez mas la ultima ecuacion, se obtiene

0 = 〈λ(t), Z〉 = 〈(−D + u ad(Y ))∗λ, Z〉, por las ecuaciones Hamiltonianas= 〈λ(t),−DZ + u ad(Y )(Z)〉= 〈λ(t), Y + uX〉= 〈λ(t), Y 〉+ 〈λ(t), uX〉

=⇒ 〈λ(t), uX〉 = 0.

Dado que 〈λ(t), Y 〉 = 〈λ(t), Z〉 = 0 y no es posible que 〈λ(t), X〉 se anule, obtieneque u(t) = 0. Para concluir, los unicos minimizadores posibles son las proyecciones delas curvas extremales, y estas son las curvas integrales de

g = Xg.

4.3.4. El caso semi-simple no-compacto SL(2,R)

Sea G = SL(2,R) el grupo de matrices reales de orden 2×2 con determinante uno.Su algebra de Lie es dada por las matrices reales de traza cero de orden dos,

sl(2,R) = span

H =

(1 00 −1

), S =

(0 11 0

), A =

(0 1−1 0

),

donde, [H,S] = 2A, [H,A] = 2S y [S,A] = −2H.

Consideremos el sistema lineal no-acotado

ΣG : g = Xg + uHg, donde D = −ad(A)

56

Page 66: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

y U = R. El campo vectorial asociado a D = −ad(A) es dado por,

Xg = gA− Ag, donde g ∈ G.

Como antes, concluimos que una condicion necesaria para la existencia de un mini-mizador es u = 0. Por lo tanto, los unicos minimizadores posibles conectan puntos dela misma curva integral del campo vectorial lineal

g = Xg.

57

Page 67: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Conclusiones

Esta tesis esta dedicada al estudio de las aplicaciones del Principio del Maximode Pontryagin (PMP) de sistemas lineales en grupos de Lie. Las condiciones generalesnecesarias de existencia de minimizadores de tiempo se establecen cuando los controlesson no-acotados. A partir de este trabajo, llegamos a las siguientes conclusiones.

1. En la presente investigacion se ha considerado dos aspectos, un aspecto funda-mental que es la teorıa que se desarrolla a traves de espacios lineales clasicos paralos cuales consideramos el problemas de controlabilidad en Rn y para grupos deLie. El segundo aspecto considera que para aplicar el PMP se necesita la pro-piedad de controlabilidad para describir y poder calcular en caso que se requierapara los objetivos de optimizar una funcion, por ejemplo, en tiempo mınimo, peropara que exista el tiempo mınimo tenemos que tener la seguridad de que dada unacondicion inicial y una condicion final existe un control que transforma a travesde sus curvas solucion asociadas al sistema, la condicion inicial a la condicionfinal y de esta manera podemos asegurar que existe un mınimo.

El PMP lo que hace es poner una condicion necesaria al sistema controlable paraque exista este mınimo, en las referencias [11] y [12] se ha desarrollado en detallela formula del principio del PMP en Rn y para grupos de Lie en general, y lohemos aplicado a algunos grupos de dimension 2 y 3.

2. Al aplicar el PMP al grupo afın se encontro que para el caso no-acotado no existeninguna trayectoria extremal y para el caso acotado encontramos la curva optimalmediante dos controles dados por el PMP.

3. Para el grupo de Heisenberg, el PMP nos da una condicion para hallar la curvaoptimal para el caso no acotado, esto es, tomar un control u igual a una funcionconstante, pero igual a la entrada D32 de la matriz de derivacion.

4. Se analizo el PMP, para el grupo SL(2,R) y se encontro que la condicion necesariapara la existencia de un minimizador es tomar como control u = 0, quedandonossolo con la curva integral del campo vectorial lineal. Para el grupo compactoSO(3,R) el resultado es similar.

58

Page 68: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

Bibliografıa

[1] Agrachev A. and Sachkov Y. (2004). Control Theory from the Geometric View-point. Springer, New York.

[2] Agrachev A., Boscain U., Charlot G., Ghezzi R. and Sigalotti M. (2010). Two-dimensional almost-Riemannian structures with tangency points. Ann. Inst. H.Poincare Anal. Non Lineaire, 27, pp. 793 - 807.

[3] Aseev S. and Kryazhimskii A. (2007). The Pontryagin maximum principle andoptimal economic growth problems. Proc. Steklov Inst.Math.

[4] Ayala V. and Jouan P. (2016). Almost Riemannian Structures and Linear ControlSystems on Lie Groups. SIAM Journal on Control and Optimization. Vol. 54, No.5, pp. 2919-2947.

[5] Ayala V., Da Silva A., Jouan P. and Zsigmond G. (2020). Control sets of linearsystems on semi-simple Lie groups. Journal of Differential Equations. Vol. 269,No. 1, pp. 449-466.

[6] Ayala V. and Da Silva A. (2020). The control set of a linear control system onthe two dimensional Lie group, Journal of Differential Equations. Vol. 268, pp.6683-6701.

[7] Ayala V. and Da Silva A. (2019). On the characterization of the controllabilityproperty for linear control systems on nonnilpotent, solvable three-dimensional Liegroups. Journal of Differential Equations. Vol. 266, pp. 8233-8257.

[8] Ayala V. and Da Silva A. (2017). Controllability of Linear Control Systems on LieGroups with Semisimple Finite Center. SIAM Journal on Control and Optimiza-tion, Vol. 55, No. 2, pp. 1332-1343.

[9] Ayala V., Da Silva A. and Zsigmond G. (2017). Control sets of linear systems onLie groups. Non Differential Equations and Applications, Issue 24: 82, pp. 1-15.

[10] Ayala V. and Da Silva A. (2016). A Semigroup associated to a linear control systemon a Lie group. Systems and Control Letters, Vol 98, pp. 33-36.

[11] Ayala V., Juan P., Torreblanca M. and Zsigmond G. (2020). Time optimal controlfor Linear Systems on Lie Groups, Systems and Control Letters.

[12] Ayala V., Torreblanca M. and Valdivia W. (2021). Toward Applications of LinearControl Systems on the Real World and Theoretical Challenges, Symmetry MDPI.

59

Page 69: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

[13] Ayala V. and San Martın L. (2001). Controllability Properties of a Class of ControlSystems on Lie Groups, Lectures Notes in Control and Information Science.

[14] Ayala V. and Tirao J. (1999). Linear Control Systems on Lie Groups and Con-trollability, American Mathematical Society. Series: Symposia in Pure Maths, Vol.64, No. 1, pp. 47-64.

[15] Ayala V. and Torreblanca M. (2018). Boundedness of control sets of Linear controlsystems. Open Mathematics, Vol. 16, No. 1, pp. 370-379.

[16] Ayala V. and Zegarra R. (2001). Controllability of linear systems on group ofmatrices, Cubo Journal of Mathematics, Vol. 3, No. 2, 171-212.

[17] Bonnard B. and Chyba M. (2003). Singular trajectories and their role in controlstheory, Maths and applis 40, Springer.

[18] Boothby W. (1986). An Introduction to Differentiable Manifolds and RiemannianGeometry. Pure and Applied Mathematics. Second Edition, Academic Press: Bos-ton, FL, USA.

[19] Brockett R. (1970). Finite Dimensional Linear Systems, John Wiley and Sons:Hoboken, NJ, USA.

[20] Byrnes C. and Isidori A. (1991). On the Attitude Stabilization of Rigid Spacecraft.Automatica, EL SEVIER, Vol. 27, 87-95.

[21] Colonius F. and Kliemann W. (2000). The Dynamics of Control, Systems & Con-trol: Foundations & Applications, Birkhauser.

[22] Dath M. and Jouan P. (2016). Controllability of Linear Systems on low dimensio-nal Nilpotent and Solvable Lie Groups, Journal of Dynamical and Control Systems.Vol. 22, No. 2, 207-225.

[23] Do Carmo M. (2015). Geometria Riemanniana, 5ta ed., Projeto Euclides. IMPA,Brazil.

[24] Elliott D. (2009). Bilinear Control Systems: Matrices in Action; Springer: Ber-lin/Heidelberg, Germany.

[25] El-Osery A. and Prevost J. (2015). Control and Systems Engineering A Report onFour Decades of Contributions. Studies in Systems, Decision and Control, SpringerInternational Publishing: Cham, Switzerland.

[26] Helgason S. (1978). Differential Geometry, Lie Groups and Symmetric Spaces.Academic Press: Cambridge, MA, USA.

[27] Ioffe A., Malanowsky K. and Trolstzsch F. (2009). 50 Years of Optimal Control.Special Issue of Control and Cybernetics.

[28] Isidori A. (1989). Nonlinear Control Systems. Springer: London, UK.

[29] Jouan P. (2010). Equivalence of Control Systems with Linear Systems on LieGroups and Homogeneous Spaces. ESAIM Control Optim. Calc. Var. Vol. 16, pp.956-973.

60

Page 70: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA

[30] Jouan P. (2011). Controllability of Linear Systems on Lie Groups. Journal of Dy-namical and Control Systems, Vol. 17, pp. 591-616.

[31] Jurdjevic V. (1997). Geometric Control Theory. Cambridge University Press: Cam-bridge, UK.

[32] Kalman R., Ho I. and Narendra K. (1962). Controllability of Linear DynamicSystems. Contrib. to Diff. Equations. Vol. 1(2), pp. 189 - 213.

[33] Ledzewick U. and Shattler H. (2002). Optimal controls for a two compartmentmodel for cancer chemoterapy. Optim. Theory Appl. JOTA, Vol. 114, pp. 241-246.

[34] Markus L. (1981). Controllability of multitrajectories on Lie groups. Dynamicalsystems and turbulence. Warwich 1980 Lecture Notes in Mathematics, Vol. 898.Springer, Berlin, Heidelberg.

[35] Mittenhuber D. (1998). Dubin’s Problem in the Hyperbolic Space in GeometricControl and Non-Holonomic Mechanics. In CMS Conference Proceedings , Jurd-jevic, V., Sharpe, R.W., Eds. American Mathematical Society: Providence, RI,USA.

[36] Noether E. (1971). Invariant Variation Problems. Transp. Theory Stat. Phys. Vol.1, pp. 186-207.

[37] Pontryagin L. S., Boltyanskii V. G., Gamkrelidze R. V. and Mishchenko E. F.(1962). The mathematical theory of optimal processes. Interscience Publishers JohnWiley and Sons, Inc., New York, London.

[38] Onishchik A. and Vinberg E. (1994). Lie Groups and Lie Algebras III. Structureof Lie Groups and Lie Algebras. Springer: Berlin, Germany.

[39] Reeds J. and Sheep L. (1990). Optimal paths for a car that goes both forwards andbackwards. Pac. J. Math. Vol. 145, pp. 367-393.

[40] San Martin L. (2010). Algebras de Lie, 2nd ed., Ed. Unicamp: Campinas, Brazil.

[41] San Martin L. (2016). Grupos de Lie, Ed. Unicamp: Campinas, Brazil.

[42] Sussmann H. and Willems J. (1997). Three Centuries of Curves Minimization:From the Brachistochrone to the Maximum Principle. IEEE Control Syst. Mag.Vol. 17, pp. 32-44.

[43] Varadarajan V. (1984). Lie Groups, Lie Algebras, and Their Representations.Springer: New York, NY, USA.

[44] Whonam M. (1979). Linear Multivariable Control: A Geometric Approach. Sprin-ger: New York, NY, USA. Vol. 29, pp. 321-331.

[45] Zamardzija N. (1989). Qualitative and Control Behavior of a Class of Chemicaland Biological Systems. IFAC Proceeding Vol. 22, pp. 351-355.

61