Hamiltonians based Control

213
TESIS DOCTORAL Control de sistemas no lineales basado en la estructura hamiltoniana por Fabio G´ omez-Estern Aguilar Ingeniero de Telecomunicaci´ on por la Escuela Superior de Ingenieros de la Universidad de Sevilla Presentada en la Escuela Superior de Ingenieros de la Universidad de Sevilla para la obtenci´ on del Grado de Doctor Ingeniero de Telecomunicaci´ on Sevilla, Septiembre de 2002

description

It is a Hamiltonians based Control document

Transcript of Hamiltonians based Control

Page 1: Hamiltonians based Control

TESIS DOCTORAL

Control de sistemasno lineales basado en laestructura hamiltoniana

por

Fabio Gomez-Estern Aguilar

Ingeniero de Telecomunicacion por la Escuela Superior de Ingenieros

de la Universidad de Sevilla

Presentada en la

Escuela Superior de Ingenieros

de la

Universidad de Sevilla

para la obtencion del

Grado de Doctor Ingeniero de Telecomunicacion

Sevilla, Septiembre de 2002

Page 2: Hamiltonians based Control
Page 3: Hamiltonians based Control

TESIS DOCTORAL

Control de sistemasno lineales basado en laestructura hamiltoniana

Autor: Fabio Gomez-Estern Aguilar

Directores: Javier Aracil SantonjaFrancisco Gordillo Alvarez

Page 4: Hamiltonians based Control
Page 5: Hamiltonians based Control

Agradecimientos

Ante todo, expresar mi gratitud a mis padres cuyo carino y apoyo incondicional, hanresultado imprescindibles para llevar a termino esta ambiciosa tarea.

Estoy igualmente agradecido a Javier Aracil, mi primer director por sus muchas sug-erencias y apoyo constante durante esta investigacion. Su imaginacion, sabidurıa y dedi-cacion lo hacen indiscutible merecedor del prestigio del que disfruta.

Al codirector de esta tesis, Francisco Gordillo, le debo la dedicacion, su compromisocon la calidad y la puesta al servicio del trabajo comun de sus solidos conocimientos ennuestra area en la difıcil preparacion de los artıculos que contribuyeron a esta tesis.

El profesor Romeo Ortega manifesto su interes por nuestro trabajo y la posibilidad deabrir un lınea comun de investigacion entre su grupo frances de Supelec y el sevillano, queha dado sus frutos y continuara haciendolo en el futuro. Es un honor para mı el habersido coautor con el de una serie de artıculos.

Estoy igualmente agradecido al profesor Francisco Rodrıguez Rubio por su decisivacontribucion al inicio y desarrollo de esta tesis, ası como la ejemplar gestion de los proyec-tos en los que se enmarca el presente trabajo.

Por sus sugerencias y colaboracion, me siento en deuda con Enrique Ponce, Mark W.Spong, Antonio Barreiro, Hugo Rodrıguez, Carlos Perez, Darıo Becares, Ismael Alcala,Miguel Pena, Kurt Schlacher, Jose Angel Acosta, Guido Blankestein, Cesareo Raimundez,Manolo Lopez, Miguel Angel G. Cordones, Oscar Collazo, Gregory Potel, Jorge Chavez,Wolfgang Mitterbaur, y los anonimos revisores que intervinieron en las publicacionesrelacionadas con la tesis; todos ellos investigadores de primera lınea.

Por ultimo hare constar mi carino y gratitud por su apoyo y comprension a los sigu-ientes: Cesar Saiz, Pedro Montes, Agustın Martınez, Rafael Garcıa, Ivan Gonzalez, OlgaPuente, Javi Reig, Teresa Cruz, y los amigos injustamente omitidos, en recuerdo de losbuenos momentos compartidos.

El presente trabajo ha sido financiado parcialmente por el Ministerio de Ciencia yTecnologıa espanol bajo los programas FEDER y PICASSO. Igualmente ha recibido fi-nanciacion para las estancias del doctorando en el Laboratoire de Signaux et Systemes,Supelec, por parte del Centre National de la Recherche Scientifique frances.

Sevilla Fabio Gomez-Estern AguilarSeptiembre de 2002

Page 6: Hamiltonians based Control
Page 7: Hamiltonians based Control

Nocte dieque incubando(Dıa y noche dandole vueltas)

Sir Isaac Newton

Por supuesto, por siempre, a Paloma.

Page 8: Hamiltonians based Control
Page 9: Hamiltonians based Control

Indice General

Glosario 1

Resumen 5

1 Introduccion 7

1.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2 Motivacion y objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3 Control de plataformas giroestabilizadas . . . . . . . . . . . . . . . . . . . 7

1.4 Sistemas subactuados en control . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5 Control basado en la energıa . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.5.1 Evolucion del concepto de energıa . . . . . . . . . . . . . . . . . . . 9

1.5.2 Energıa en control: planteamiento del problema . . . . . . . . . . . 10

1.5.3 Estabilizacion mediante la energıa . . . . . . . . . . . . . . . . . . . 12

1.5.4 Comportamiento transitorio . . . . . . . . . . . . . . . . . . . . . . 15

1.5.5 Generalizacion de la energıa en el control . . . . . . . . . . . . . . . 16

1.6 Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2 Fundamentos teoricos y estado de la tecnica 19

2.1 Sistemas electromecanicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2 Sistemas de Euler–Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3 Sistemas hamiltonianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.3.1 Sistemas hamiltonianos generalizados. . . . . . . . . . . . . . . . . . 22

2.3.2 Hamiltoniano y energıa . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.4 Estabilidad en sistemas autonomos . . . . . . . . . . . . . . . . . . . . . . 25

2.5 Bifurcaciones en sistemas no lineales . . . . . . . . . . . . . . . . . . . . . 26

i

Page 10: Hamiltonians based Control

ii INDICE GENERAL

2.6 Pasividad y disipatividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.6.1 Estabilidad Lq . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.6.2 Pasividad y ganancia L2 . . . . . . . . . . . . . . . . . . . . . . . . 29

2.6.3 Interconexion de sistemas pasivos . . . . . . . . . . . . . . . . . . . 30

2.6.4 Atenuacion L2 de perturbaciones . . . . . . . . . . . . . . . . . . . 30

2.7 Sistemas subactuados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.7.1 Controlabilidad en sistemas subactuados . . . . . . . . . . . . . . . 33

2.7.2 Metodos de sıntesis que preservan la estructura hamiltoniana/lagrangianaen bucle cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.7.3 Inmersion e invariancia . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.7.4 Control de sistemas en cascada mediante backstepping . . . . . . . . 38

3 Control de una plataforma giroestabilizada de dos grados de libertad 41

3.1 Sensores empleados en control inercial . . . . . . . . . . . . . . . . . . . . 41

3.2 Descripcion de la plataforma inercial . . . . . . . . . . . . . . . . . . . . . 43

3.3 Modelo de la plataforma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4 Control hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.4.1 Eleccion de un punto de equilibrio arbitrario . . . . . . . . . . . . . 47

3.4.2 Estabilidad segun Lyapunov . . . . . . . . . . . . . . . . . . . . . . 49

3.5 Rechazo de perturbaciones L2 . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.6 Seguimiento de objetos moviles en superfices no inerciales . . . . . . . . . . 51

3.6.1 Seguimiento visual . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.6.2 Subsistema de estabilizacion de trayectorias . . . . . . . . . . . . . 53

3.7 Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.8 Aplicacion a una planta de laboratorio . . . . . . . . . . . . . . . . . . . . 56

3.8.1 Identificacion de los parametros . . . . . . . . . . . . . . . . . . . . 60

3.9 Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.9.1 Identificacion de la planta real . . . . . . . . . . . . . . . . . . . . . 61

3.9.2 Control hamiltoniano con prealimentacion de friccion . . . . . . . . 62

3.9.3 Atenuacion de perturbaciones en la planta real . . . . . . . . . . . . 63

3.9.4 Seguimiento de trayectorias en la planta real . . . . . . . . . . . . . 64

Page 11: Hamiltonians based Control

INDICE GENERAL iii

4 Control de sistemas subactuados mediante el metodo IDA-PBC 67

4.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.2 Estabilizacion de sistemas mecanicos subactuados . . . . . . . . . . . . . . 70

4.2.1 Dinamica objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.2.2 Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.2.3 Moldeo de energıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.2.4 Comparacion entre los enfoques lagrangiano y hamiltoniano . . . . 74

4.3 El pendulo de disco inercial . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.3.1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.3.2 Diseno del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 78

4.3.3 Resultados de simulacion . . . . . . . . . . . . . . . . . . . . . . . . 82

4.4 El sistema de la bola en la viga . . . . . . . . . . . . . . . . . . . . . . . . 83

4.4.1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.4.2 Diseno del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 85

4.4.3 Metodo aproximado de la elipse exterior . . . . . . . . . . . . . . . 94

4.4.4 Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5 Reduccion del metodo IDA-PBC para sistemas subactuados 99

5.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

5.2 Reduccion de las EDPs de ajuste en metodos lagrangianos . . . . . . . . . 100

5.2.1 Las ecuaciones λ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5.3 Reduccion de las ecuaciones de ajuste en IDA-PBC . . . . . . . . . . . . . 103

5.3.1 Definicion de la clase de sistemas . . . . . . . . . . . . . . . . . . . 103

5.4 Reduccion de las ecuaciones de moldeo de la energıa cinetica . . . . . . . . 104

5.4.1 Generalizacion de la parametrizacion de Md para sistemas dos gra-dos de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

5.5 Moldeo de la energıa potencial . . . . . . . . . . . . . . . . . . . . . . . . . 110

5.6 Calculo de la ley de control . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.7 Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.8 Comparacion de leyes de control . . . . . . . . . . . . . . . . . . . . . . . . 116

5.8.1 Control lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.8.2 Control por lagrangianos controlados . . . . . . . . . . . . . . . . . 119

Page 12: Hamiltonians based Control

iv INDICE GENERAL

5.9 Extension de la solucion a otros sistemas . . . . . . . . . . . . . . . . . . . 121

5.9.1 Sistemas de orden mayor . . . . . . . . . . . . . . . . . . . . . . . . 121

5.9.1.1 Moldeo de energıa cinetica del robot PPR . . . . . . . . . 121

5.9.1.2 Moldeo de la energıa potencial . . . . . . . . . . . . . . . 125

5.9.2 Efecto de la perdida de controlabilidad en IDA-PBC . . . . . . . . 125

6 Estabilizacion de oscilaciones en sistemas no lineales 129

6.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

6.2 Un sistema hamiltoniano generalizado oscilatorio de segundo orden . . . . 132

6.3 Estabilizacion de oscilaciones en sistemas de orden dos . . . . . . . . . . . 136

6.4 Backstepping para una clase de sistemas no afines . . . . . . . . . . . . . . 137

6.5 Un metodo para la estabilizacion de oscilaciones mediante backstepping . . 138

6.6 Sistemas de orden mayor . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

6.6.1 Caso mas general . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

6.7 Revision del metodo empleando linealizacion por realimentacion . . . . . . 146

6.8 Realizacion de una familia de sistemas oscilantes a partir de la linealizacionpor realimentacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

6.9 Aplicacion a sistemas subactuados . . . . . . . . . . . . . . . . . . . . . . . 155

6.9.1 Sistema de levitacion magnetica . . . . . . . . . . . . . . . . . . . 155

6.9.2 Implementacion en un sistema de laboratorio . . . . . . . . . . . . . 156

6.9.3 Modelo del sistema de laboratorio . . . . . . . . . . . . . . . . . . . 156

6.9.4 Identificacion de parametros . . . . . . . . . . . . . . . . . . . . . . 158

6.9.5 Diseno del controlador . . . . . . . . . . . . . . . . . . . . . . . . . 160

6.9.6 Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . 160

6.9.7 Oscilaciones en la bola en la viga . . . . . . . . . . . . . . . . . . . 161

6.9.8 Bifurcaciones en el sistema de la bola y la viga . . . . . . . . . . . . 164

6.9.9 Efecto de la aceleracion centrıfuga . . . . . . . . . . . . . . . . . . . 165

6.10 Estabilizacion de oscilaciones por Inmersion e Invariancia . . . . . . . . . . 167

6.10.1 Resultados de la simulacion . . . . . . . . . . . . . . . . . . . . . . 168

7 Conclusiones y desarrollos futuros 171

7.1 Conclusiones del capıtulo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

Page 13: Hamiltonians based Control

INDICE GENERAL v

7.2 Conclusiones del capıtulo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

7.3 Conclusiones del capıtulo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

7.4 Conclusiones del capıtulo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

7.5 Desarrollos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

7.5.1 Cinematica de la plataforma de sensores . . . . . . . . . . . . . . . 174

7.5.2 Sistemas subactuados . . . . . . . . . . . . . . . . . . . . . . . . . . 176

7.5.3 Estabilizacion de oscilaciones . . . . . . . . . . . . . . . . . . . . . 177

A Proyecto DORNA 181

A.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

A.2 Arquitectura hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

A.3 Arquitectura de la aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . 183

A.4 Simulador de la plataforma giroestabilizada . . . . . . . . . . . . . . . . . 184

A.5 Procesador de comunicaciones . . . . . . . . . . . . . . . . . . . . . . . . . 185

A.6 Maquina de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

A.7 Procesadores de lazos de control . . . . . . . . . . . . . . . . . . . . . . . . 188

A.8 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

B Codigo Maple para la ecuacion (6.8.1) 191

Bibliografıa 195

Page 14: Hamiltonians based Control

vi INDICE GENERAL

Page 15: Hamiltonians based Control

Glosario

Notacion matematica

IR+ Conjunto de numeros reales no negativos.

Cn Conjunto de funciones diferenciables n veces.

R > 0 Matriz simetrica definida positiva.

R ≥ 0 Matriz simetrica semidefinida positiva.

M(q) > εI (Matriz uniformemente definida positiva). Matriz de-pendiente del estado q donde los autovalores cumplenλi > ε,∀i,∀q para una cierta constante ε > 0.

G Matriz que multiplica al vector de control en sistemasdel tipo x = f(x) + Gu.

G⊥ Matriz cuyas filas son ortogonales a las columnas de G,tal que G⊥G = 0 y cuyo rango es r = n − rango(G).

u Ley de control (vector).

τ Par de control (vector).

g Aceleracion de la gravedad en la superficie terrestre devalor 9.8m/s2.

In Matriz identidad de orden n.

Mij Elemento de la fila i, columna j de la matriz M .

Mi· Fila i-esima de la matriz M .

M·j Columna j-esima de la matriz M .

q Vector de coordenadas articulares dado por q =[q1, q2, . . . , qn]T en un sistema mecanico de n grados delibertad.

p Vector de momentos generalizados dado por p =[p1, p2, . . . , pn]T en un sistema mecanico de n grados delibertad.

1

Page 16: Hamiltonians based Control

2 Glosario

∇qf Vector gradiente de la funcion escalar f :[∂f∂q1

, ∂f∂q2

, . . . , ∂f∂qn

]T

.

∇qkf Elemento k-esimo de ∇qf , es decir ∂f∂qk

gradf Equivalente a ∇qf .

y(r) Derivada r-esima con respecto al tiempo de la funciony(t).

Lq Vease la seccion 2.6.

L2 Vease la seccion 2.6.

H(q, q) Funcion de Hamilton de un sistema en bucle abierto.

M(q) Matriz de inercia en bucle abierto.

T (q, q) Energıa cinetica en bucle abierto.

V (q) Energıa potencial en bucle abierto.

Hd(q, q) Funcion de Hamilton de un sistema en bucle cerrado.

Md(q) Matriz de inercia en bucle cerrado.

Td(q, q) Energıa cinetica en bucle cerrado.

Vd(q) Energıa potencial en bucle cerrado.

q∗ Posicion de referencia que se desea estabilizar q.

arg min (V (q)) Valor del vector q que hace mınima localmente la funcionV (q).

q0 Valores de las coordenadas generalizadas en el instanteinicial.

p0 Valores de los momentos generalizados en el instanteinicial.

t Variable tiempo

ues Ley de control de moldeo de energıa (Energy Shaping).

udi Ley de control de inyeccion de amortiguamiento (Damp-ing Injection).

BIBO Estabilidad en terminos de entrada acotada ⇒ salidaacotada (Bounded Input Bounded Output).

Ixx, Iyy, Izz Momentos de inercia respecto a los ejes principales x,y,z,respectivamente.

rango(A) Rango de la matriz A.

Page 17: Hamiltonians based Control

Glosario 3

Terminos matematicos

Curva de nivel Lugar geometrico donde el valor de una funcionV (x) permanece constante.

Conjunto de nivel Lugar geometrico donde una funcion toma val-ores inferiores a una determinada constante.

Matriz acotada Matriz de autovalores acotados.

Trayectoria acotada Trayectoria donde la norma euclıdea del vectorq esta acotada.

Pasividad Vease la seccion 2.6.

Conjunto abierto Conjunto en el que para cada elemento x, existeuna bola de radio r contenida en el.

Conjunto cerrado Conjunto cuyo complemento es un conjuntoabierto.

Conjunto acotado Conjunto donde existe una cota M ∈ IRn talque ‖x‖ ≤ M para todo elemento x en el.

Conjunto compacto Conjunto cerrado y acotado.

Conjunto conexo Conjunto donde para cada par de puntos existeuna sucesion de segmentos que los une plena-mente contenida en el.

Funcion propia Funcion V (x) definida en χ tal que los conjuntosx ∈ χ|0 ≤ V (x) ≤ c son compactos para cadac ∈ IR+). Equivale al termino radialmente noacotada.

Clase K Un funcion continua α : [0, a) → [0,∞) es declase K si es estrictamente creciente y α(0) = 0.

Clase K∞ Un funcion continua α : [0,∞) → [0,∞) es declase K∞ si es de clase K y ademas α(r) → ∞cuando r → ∞.

Page 18: Hamiltonians based Control

4 Glosario

Abreviaturas y acronimos

Cont. Lınea continua en una grafica.

DHR Realizacion hamiltoniana directa (Direct HamiltonianRealization, equivalente a GHS).

Discont. Lınea a trazos en una grafica.

EDO Ecuacion diferencial ordinaria.

EDP Ecuacion diferencial en derivadas parciales.

EL Ecuaciones de Euler-Lagrange.

GAS Estabilidad asintotica global.

GHS Sistema hamiltoniano generalizado (GeneralizaedHamiltonian System).

GPS Sistema de posicionamiento global por satelite (GlobalPositioning System).

IDA-PBC PBC con inyeccion de amoriguamiento (Interconnectionand Damping Assigmnment-PBC).

INS Sistema de navegacion inercial (Inertial Navigation Sys-tem).

ISA Depto. de Ingenierıa de Sistemas y Automatica.

LSS Laboratoire des Signaux et Systemes.

PBC Control basado en pasividad (Passivity-Based Control).

PCH Sistema hamiltoniano controlado por puertos (Port-Controlled Hamiltonian System).

PCHD Sistema hamiltoniano controlado por puertos con disi-pacion.

US Universidad de Sevilla.

Page 19: Hamiltonians based Control

Resumen

Las tecnicas de control basadas en las estructuras lagrangiana y hamiltoniana de lossistemas electromecanicos han experimentado un reciente auge de notables proporciones.Los metodos a los que ha dado lugar esta lınea de investigacion permiten, por primeravez, abordar de manera sistematica un conjunto de problemas abiertos como el controlde sistemas subactuados y la obtencion de funciones de Lyapunov para controladores nolineales.

En esta tesis se han abordado tres problemas de diferente naturaleza que compartenun hilo comun en la exposicion: la explotacion de la estructura hamiltoniana de sistemaselectromecanicos tanto en bucle abierto como en bucle cerrado para dirigirlos de manerarobusta hacia equilibrios y orbitas periodicas basandose en consideraciones energeticas.

Al comienzo de esta tesis se presentan, de forma sucinta y ordenada, las definicionesy resultados mas importantes de la literatura afın que dan el soporte teorico para lacomprension del presente trabajo.

El primer sistema estudiado es una plataforma de sensores de dos grados de liber-tad inmersa en un sistema de referencia no inercial (mesa desestabilizadora) instaladaen el departamento de Ingenierıa de Sistemas y Automatica de la Universidad de Sevil-la. Este sistema esta motivado por una aplicacion naval, consistente en un sistema dedeteccion visual de obstaculos en navegacion. La sıntesis de controladores para este sis-tema plantea importantes retos; sirva de ejemplo la estabilizacion robusta frente a per-turbaciones, seguimiento visual de objetos moviles y estabilizacion giroscopica frente amovimientos del sistema de referencia en que se apoya.

La segunda lınea de investigacion se centra en el interesante y no trivial problema desıntesis de controladores para sistemas subactuados basados en pasividad. Se hace unestudio teorico con el fin de extender y sistematizar los metodos basados en pasividad, yse proponen soluciones para problemas que quedaban abiertos desde largo tiempo atras.Se ofrece una comparativa teorica y de simulacion con otros metodos actualmente en uso.

La tercera lınea aborda la estabilizacion de oscilaciones periodicas en sistemas no lin-eales y el analisis de bifurcaciones que aparecen en bucle cerrado. En esta seccion sepresentan una serie de resultados teoricos de gran utilidad para lograr los comportamien-tos oscilatorios en una amplia clase de sistemas, incluyendo buen numero de sistemas

5

Page 20: Hamiltonians based Control

6 Resumen

mecanicos subactuados. Los resultados son contrastados mediante simulacion y de formaexperimental en sistemas reales de laboratorio .

A continuacion se presenta una seccion de conclusiones resumiendo las pricipales con-tribuciones de esta tesis y propuestas de desarrollos futuro. El presente texto concluyecon un apendice en el que se muestran los detalles de una aplicacion de tiempo real quedesarrollo un equipo del departamento ISA al que pertenecıa el doctorando y que dio piea la primera lınea de investigacion de esta tesis.

Page 21: Hamiltonians based Control

Capıtulo 1

Introduccion

1.1 Generalidades

En esta tesis se presentaran distintas contribuciones en el contexto del control de sistemasmecanicos basado en la estructura hamiltoniana y el enfoque energetico.

El presente capıtulo se destina a la exposicion de las motivaciones practicas subya-centes en el control de plataformas de sensores giroestabilizadas, el control de sistemassubactuados, y las tecnicas de estabilizacion de orbitas periodicas, al ser estos tres losprincipales ambitos de aplicacion de los resultados de esta tesis.

Asimismo se realizara una breve introduccion, con referencias historicas, a los metodosde control basado en la energıa, en los que se asientan las tecnicas de pasividad y el controlhamiltoniano.

En la seccion 1.6 de este capıtulo se detallara la estructura del resto de los capıtulosde esta la, y se detallaran publicaciones a que ha dado lugar cada uno de los capıtulos.

1.2 Motivacion y objetivos

En este apartado se comentaran los motivos y aplicaciones reales que suscitan el interes delingeniero de control por la resolucion de los problemas tratados en esta tesis. Si bien existeuna lınea comun clara en el enfoque de la investigacion, consistente en la estabilizacionde sistemas no lineales empleando tecnicas de pasividad y la estructura hamiltoniana,podemos discernir tres lıneas de estudio tratadas de forma independiente

1.3 Control de plataformas giroestabilizadas

La primera parte de la tesis, con un caracter mas practico que el resto del texto, emergeen el marco de un proyecto de aplicacion en la industria naval que conlleva importantesingredientes de interes teorico. El sistema de control esta basado en procesadores digitalesde senales conectados en bus VME destinados a la estabilizacion inercial de una plataforma

7

Page 22: Hamiltonians based Control

8 1.4. Sistemas subactuados en control

de dos grados de libertad equipada con sensores de movimiento (giroscopos, resolvers yencoders) y otros tipos: radar, telemetro, comunicaciones, infrarrojos, etc. Este sistemase instala sobre la cubierta de un buque, de modo que la perturbacion en la medida de lossensores causada por el oleaje se ve compensada por la estabilizacion giroscopica de la lıneade mira. En esta tesis se desarrollan los fundamentos teoricos para la identificacion de laplataforma, el control hamiltoniano de la misma, la robustecimiento mediante un resultadoreciente de rechazo de perturbaciones y el seguimiento de trayectorias basado en pasividad.Los supuestos teoricos estan ampliamente avalados con resultados de simulacion y trabajosexperimentales.

1.4 Sistemas subactuados en control

La segunda parte de la tesis aborda uno de los problemas matematicos abiertos en teorıade control que mas interes ha despertado en la ultima decada: la sıntesis de controladorespara sistemas mecanicos subactuados.

Un sistema subactuado es aquel que posee menos entradas de control que grados delibertad. Mantener en equilibrio una varilla cilındrica sobre la palma de nuestra mano esun buen ejemplo de un sistema subactuado. Este sistema, como se muestra en la figura1.1, tiene cinco grados de libertad (tres para la posicion del punto de contacto de la manocon la varilla, y dos angulos para la ultima). Sin embargo solo podemos actuar en lostres grados de libertad de la mano. En la practica cualquier sistema que necesite nuestraatencion para mantenerse en equilibrio es un sistema subactuado. Otros ejemplos sonla bicicleta, y aunque menos evidente, un avion, con seis grados de libertad y cuatroactuadores.

1

2

3

5

4

Figura 1.1: Grados de libertad de un sistema subactuado.

Existe una extensa literatura de investigacion dedicada a este tipo de sistemas. Parauna introduccion al problema vease (Spong 1997). Una clasificacion interesante de prob-lemas de sistemas subactuados sencillos desde el punto de vista de las posibles estrategiaspara su resolucion puede verse en (Weibel 1997) y tambien en (Olfati-Saber 2001). Pesea los grandes avances teoricos y experimentales, los resultados distan de tener gran gen-eralidad, y en este momento del desarrollo de la tecnica cada ejemplo en particular esun problema abierto diferente de los ya resueltos y que debe ser abordado atendiendo a

Page 23: Hamiltonians based Control

Capıtulo 1. Introduccion 9

sus particularidades. En la practica existe un pequeno conjunto de sistemas subactuadossencillos que han cobrado gran popularidad por el desafıo que representan, para los cualesexiste una amplia gama de controladores en la literatura. Evidentemente, existe una in-finidad de ejemplos inexplorados, tantos como queramos idear, para los que las tecnicasexistentes se muestran impotentes.

El problema del control de sistemas subactuados esta motivado por numerosas apli-caciones practicas. En primer lugar se esgrime el solido argumento de la economıa dediseno. Si un aeronave es un sistema subactuado en el que se aplica el empuje en ladireccion del motor de reaccion y se controla la trayectoria del cuerpo (de seis grados delibertad) con la sola intervencion del timon de cola y la potencia del motor, podrıamosanadir actuadores, hasta seis, que apliquen la propulsion en las tres direcciones espacialesy que impriman cualquier momento de giro, hasta poder situar el avion en la posicion quequeramos, incluso detenido o invertido, garantizando estabilidad y trayectorias optimas.Posiblemente serıa un sistema mas facil de pilotar, sobre todo en despegue y aterriza-je, pero se tratarıa de una maquina costosısima y el consumo de combustible resultarıasumamente ineficiente.

Otras aplicaciones surgen por la propia disposicion fısica del sistema. Una lanzaderaespacial es un sistema subactuado inestable por naturaleza al aplicar el empuje del motorpor debajo de su centro de gravedad. Mantener la estabilidad de la lanzadera en laposicion vertical superior es un reto para el control que se ha reproducido en un popularsistema instalado en gran parte de los laboratorios de las universidades del mundo: elpendulo invertido, que se analizara en esta tesis.

Otras aplicaciones de sistemas subactuados aparecen en el diseno de vehıculos sub-marinos, misiles, satelites de comunicaciones, y robots bıpedos.

1.5 Control basado en la energıa

Una de las tecnicas que mayor interes ha despertado en la comunidad del control desistemas subactuados por sus multiples aplicaciones y por su retorno al uso de la intuicionfısica en la labor del ingeniero, es la pasividad. Para su entendimiento es preciso establecerel papel de la energıa en el control.

Si al analizar una ley de control que actua sobre un sistema, sabemos discernir queterminos mantienen la energıa constante, cuales tienen un efecto disipativo, y cualesinyectan energıa al sistema, se arrojara una luz necesaria para el problema de la estabi-lizacion, abriendo paso a las tareas subsiguientes de ajuste y refinamiento del compor-tamiento transitorio.

1.5.1 Evolucion del concepto de energıa

El concepto de energıa en control tiene un valor relativo, y requiere informacion adicionalpara cobrar significado. La energıa, causa eficiente de los movimientos, cobro un sentidoformal en el analisis de los sistemas mecanicos, gracias a los trabajos del siglo XVII,

Page 24: Hamiltonians based Control

10 1.5. Control basado en la energıa

realizados por los estudiosos de la entonces entonces llamada filosofıa natural1. En ellos,pronto se observo que las leyes de la mecanica admitıan la existencia de ciertas funcionesescalares del estado que contenıan suficiente informacion para determinar la evolucionfutura del sistema en forma diferencial gracias a un principio variacional de mınima accionelegantemente formulado. La busqueda de estas funciones generatrices del movimientofue objeto de una intensa investigacion iniciada por Maupertuis y culminada por Euler yLagrange. Posteriormente, resultados en gran medida equivalentes fueron trasladados asistemas electricos.

A estas funciones, que admiten la denominacion de integrales de movimiento, no sepodıa atribuir una existencia autonoma en la naturaleza. Hasta un cierto momento de lahistoria de la ciencia, la energıa solo existıa ligada a la configuracion o estado del cuerpo alque describe. El perspicaz avance en la descripcion de los fenomenos naturales que suponela teorıa electromagnetica de Maxwell y los resultados de Poynting, establecen por primeravez la existencia de una magnitud llamada energıa que es independiente de los cuerpos ypuede ser medida en un volumen en ausencia de masa. El teorema de Poynting permitecalcular la energıa del campo contenida en un volumen carente de materia radiante y elflujo a traves de su contorno, como si de un fluido se tratara. De ello se deduce que laenergıa no requiere la existencia de un substrato material para existir.

La coronacion a este proceso de enriquecimiento del entendimiento cientıfico llego conla aparicion de la teorıa de la relatividad restringida que en 1905 consagra a Albert Ein-stein estableciendo una equivalencia entre masa y energıa, otorgando a la segunda el statusde realidad fısica que hasta entonces solo ostentaba la primera. Desafortunadamente unarepresentacion no desdenable de la comunidad intelectual de principios del siglo XX en-contro en este hecho una razon para comenzar un amargo distanciamiento entre fısicay metafısica. Sobre los fısicos teoricos recaıa la acusacion de abusar de incomprensiblesartificios matematicos desligados de su natural objeto de estudio, y se hacıa imposibleconstatar experimentalmente sus predicciones. Esta actitud es mas paradojica aun si setiene en cuenta que las pesquisas que condujeron al enunciado del principio de relativi-dad surgieron de hechos tan empıricos como el experimento de Michelson y Morley. Lastecnicas experimentales de la fısica nuclear tardaron decadas en desarrollarse, pero ensu madurez corroboraron todas las predicciones de la teorıa de Einstein, con lo que seadmitio definitivamente que el nuevo concepto de energıa recogıa fielmente gran cantidadde fenomenos observables en la naturaleza, y es instrumento esencial para posterioresdesarrollos en todos las escalas, desde la fısica de partıculas hasta la astrofısica.

1.5.2 Energıa en control: planteamiento del problema

En control automatico es tendencia reciente la incorporacion del concepto de energıa co-mo un elemento matematico de ayuda al diseno de los controladores, ası como marcopara la incorporacion de la intuicion fısica en el control. En la descripcion de sistemaselectromecanicos en bucle abierto se emplea una funcion de energıa que se correspondecon el fenomeno natural, concretamente en el sentido de funcion asociada al estado o con-figuracion del mecanismo. En este caso se puede establecer una separacion entre energıaspotencial, cinetica, electrica y magnetica, cuya suma es invariante o decreciente en ausen-cia de una fuente externa que suministre energıa. Tambien podemos identificar en bucle

1Termino empleado en el tıtulo de la principal obra de Sir Isaac Newton Philosophae Naturalis Prin-cipia Mathematica.

Page 25: Hamiltonians based Control

Capıtulo 1. Introduccion 11

abierto el fenomeno de disipacion y sus causas. El segundo principio de la termodinamicaestablece el sentido de la disipacion de la energıa en sistemas aislados. Mas aun, laexpresion analıtica de una funcion de energıa de un sistema autonomo, el hamiltoniano,expresado en funcion de las coordenadas generalizadas, proporciona informacion suficientepara calcular trayectorias en ausencia de disipacion o inyeccion externa de energıa.

En la tarea de sıntesis de controladores, no basta con un conocimiento del sistema libre,se requieren objetos matematicos que reflejen el efecto energetico de la senal de control.Controlar implica la adicion de energıa al sistema en algunos instantes y absorcion enotros, de manera que se abandona la naturaleza conservativa o disipativa del sistemanatural porque este ya no se encuentra aislado. En este contexto, sin un principio deconservacion de la energıa o de la cantidad de movimiento, el ingeniero se ve desprovisto delas herramientas mas fundamentales para el calculo de trayectorias o analisis de estabilidadde los cuerpos. La alternativa natural que surge de estos planteamientos es encontrarfunciones de energıa que describan a los sistemas controlados, para que las trayectoriasde estos puedan ser calculadas y analizadas en virtud de dichas funciones. Se abre unproblema conceptual de dos incognitas para el ingeniero de control: la eleccion de lafuncion de energıa en bucle cerrado y el consiguiente calculo de senal de control.

Tratemos de formular la pregunta correctamente y habremos recorrido parte del caminohacia la solucion. Primera cuestion: dado un sistema controlado ¿como encontrar unanueva funcion de energıa que sirva de descripcion del sistema realimentado mediante deun principio de mınima accion? Este enfoque no es practico en control porque suponeel conocimiento previo de la solucion del problema de diseno. Aun ası sirve de basepara un campo de investigacion de enorme interes denominado problema analıtico inverso(Santilli 1978), en el que se parte de un sistema no lineal descrito en variables de estado:

x = f(x) (1.5.1)

y se pretende encontrar una funcion L(x, x) tal que las trayectorias x(t) solucion delsistema de ecuaciones de Euler-Lagrange

d

dt

(∂L∂x

)− ∂L

∂x= 0

sean tambien solucion del sistema no lineal autonomo (1.5.1). Tengase en cuenta que f(x)contiene tambien la ley de control bajo la suposicion de que esta sea funcion exclusiva delestado x. El problema formulado no siempre admite solucion pero se pueden establecerciertas relaciones que aquı no comentaremos por razones de espacio. La segunda razonpor la cual este enfoque no es practico en control reside en que la funcion de energıa, alcontener informacion sobre el comportamiento del lazo cerrado debe ser un objetivo dediseno.

De lo esgrimido anteriormente se desprende que en la fase de diseno de un controladorbasado en energıa, tanto la funcion de energıa como la senal de control son los parametrosa disenar. La eleccion de estos parametros se hara atendiendo a restricciones de distintanaturaleza, que aparecen por especificaciones de rendimiento del sistema o por simpleslimitaciones del equipamiento disponible:

• Restricciones en la senal de control, como sucede con las saturaciones, en la maximacomplejidad admisible en implementacion (por restricciones de tiempo o memo-ria para los calculos del microprocesador), restricciones de tipo matematico o ge-ometrico debidas a la subactuacion.

Page 26: Hamiltonians based Control

12 1.5. Control basado en la energıa

• Restricciones en la funcion de energıa en bucle cerrado. Como se vera mas adelanteen esta tesis, la forma funcion de energıa en bucle cerrado va a determinar laspropiedades de estabilidad del sistema al identificarse con la funcion de Lyapunovde control .

• Restricciones en las trayectorias. Dichas restricciones suelen plantear problemaspracticos de gran dificultad e interes, pues muchos sistemas se disenan para fun-cionar correctamente siempre que se garantice que ciertas variables permanezcan enun rango determinado. En la presente tesis se vera que estas restricciones puedentrasladarse al grupo anterior de restricciones en la funcion de energıa, proporcio-nando interesantes resultados practicos.

• Restricciones en el tiempo de establecimiento. Es de sumo interes practico limitar eltiempo en el que un sistema controlado alcanza el objetivo deseado. Desde el puntode vista teorico existen pocos resultados a este respecto para sistemas no lineales,por lo tanto permanece como problema abierto en el control.

Conocidas las restricciones y conocido el modelo del sistema en bucle abierto se puedeenunciar el problema del control basado en la energıa del siguiente modo: dado el sistemax = f(x, u), hallar una funcion de realimentacion del estado u ≡ u(x), tal que el sistemaresultante tenga, respecto a una funcion del estado H(x), denominada funcion de alma-cenamiento o energıa, un comportamiento disipativo (la energıa decrece con el tiempo).La forma de esta funcion debe acomodarse al conjunto de restricciones que se desprendende las especificaciones en bucle cerrado del sistema.

En el caso particular de no existir restricciones explıcitas sobre la senal de controlel proceso de diseno es secuencial: se obtiene una funcion de energıa adecuada a lasespecificaciones y se calcula por procedimientos puramente algebraicos la senal de controlque transforma el sistema en bucle abierto en otro que sea descrito por dicha funcion deenergıa.

1.5.3 Estabilizacion mediante la energıa

Al introducir el problema del control basado en la energıa, hemos comentado soterrada-mente la necesidad de trasladar las especificaciones de lazo cerrado a restricciones en lafuncion de energıa. ¿Que significado tiene esto en la practica? El procedimiento quese emplea en la literatura se denomina Energy Shaping (moldeo de energıa) ya que lasespecificaciones en bucle cerrado se satisfacen dando forma o moldeando la superficien-dimensional de la funcion de energıa.

¿Con que criterio hemos de “moldear” la funcion de energıa? Muy brevemente, lasespecificaciones de un sistema en bucle cerrado se dividen en dos aspectos: estabilidaddel regimen permanente y calidad del transitorio (velocidad, sobreoscilacion).

Para el regimen permanente sabemos que la herramienta fundamental del analisis deestabilidad de sistemas no lineales es el metodo directo de Lyapunov. La existencia deuna funcion definida positiva (salvo en el conjunto lımite deseado donde vale cero), queevaluada en las trayectorias solucion es monotona decreciente, implica la de estabilidad dedicho conjunto lımite. Bajo ciertas condiciones adicionales dadas en teoremas como los deLaSalle o Matrosov, se garantiza la estabilidad asintotica, es decir, la convergencia de lastrayectorias hacia el lımite deseado. Al analizar la estabilidad de un sistema controlado por

Page 27: Hamiltonians based Control

Capıtulo 1. Introduccion 13

O

Figura 1.2: Pendulo simple.

metodos energeticos en la energıa veremos en esta tesis que el concepto de disipatividad,unido al de moldeo de energıa, proporcionan una funcion de Lyapunov para el control,que es la energıa del sistema en bucle cerrado.

El proceso de diseno en este contexto serıa: dado un punto o conjunto de puntos que sedesee estabilizar, hallar una ley de control tal que la funcion de energıa en bucle cerradosea definida positiva en todo el rango de funcionamiento y cero en el objetivo. Si elsistema en bucle cerrado es conservativo con respecto a la energıa, esta sera la funcion deLyapunov y el sistema sera estable. Para ilustrar este procedimiento, observese el clasicosistema del pendulo simple de la figura 1.2.

En ausencia de accion externa, la funcion de energıa mecanica total (potencial mas

cinetica) es una superficie que atribuye un valor de energıa a cada punto en el plano (θ, θ)segun la expresion

H = cos θ + kθ2

A la izquierda de la figura 1.3 aparece la funcion de energıa de dicho sistema frente alangulo y su derivada. Es facil observar el un punto de silla en el origen de coordenadas(pendulo en posicion vertical superior). En efecto, si avanzamos hacia el origen en la

direccion perpendicular al papel (direccion del eje θ) nos encontramos un mınimo deenergıa (valle), mientras que si avanzamos en la direccion horizontal paralela al papel, alpasar por el origen atravesaremos el perfil de maximo de energıa (cresta).

Es bien sabido que un punto de silla de la energıa no representa un equilibrio establede un sistema dinamico. Un controlador basado en la energıa tratarıa de cambiar la formacompleta de la funcion de energıa de modo que apareciese un mınimo estricto en el puntoque se desea estabilizar. Para ello se podrıa anadir a la funcion de energıa natural, H, untermino de inyeccion de energıa Ha = −2 cos θ de modo que en bucle cerrado resultarıa.

H + Ha = − cos θ + kθ2

Esta funcion de energıa sı posee un mınimo en el origen y por tanto, si el sistema esdisipativo (de energıa decreciente), tendera asintoticamente a dicho equilibrio. Una vezelegida la funcion de energıa, se calcula la senal de control que logra que el sistemaen bucle cerrado posea una dinamica lagrangiana con respecto a dicha funcion. Dichocalculo involucra la resolucion de un sistema de ecuaciones generalmente algebraicas. Elprocedimiento expuesto se conoce como moldeo de energıa (energy shaping).

Este procedimiento, que pudiera parecer sencillo a primera vista, involucra ciertosmatices y complicaciones que no es posible evitar. En primer lugar, como se vera am-pliamente en esta tesis, no se trata de un metodo general aplicable a la totalidad de

Page 28: Hamiltonians based Control

14 1.5. Control basado en la energıa

sistemas no lineales de parametros conocidos, ni siquiera a los invariantes en el tiempo, niaun restringiendonos a los sistemas controlables. A lo sumo proporciona un fundamentomatematico estructurado para abordar problemas que anteriormente solo admitıan solu-ciones muy particulares. En segundo lugar, incluso en los casos para los que existensoluciones explıcitas, lo habitual es que el equilibrio estabilizado en bucle cerrado tengauna cuenca de atraccion limitada. Este fenomeno se observa a la derecha de la figura 1.3donde si el sistema comienza a cierta distancia del origen, en la direccion del eje θ, jamaspodra llegar al origen en una trayectoria de energıa decreciente.

Otro matiz interesante que se desprende de la tecnica del moldeo de energıa parasistemas en IR2, es el hecho de que en la region donde la funcion de energıa es convexa,las curvas de nivel2 son cerradas. De nuevo en la figura 1.3, observamos las lıneas de nivelproyectadas sobre el plano inferior (θ, θ) constante. Un hecho fundamental en el estudio

Figura 1.3: Energıa del pendulo en bucle abierto (izquierda), y bucle cerrado (derecha).

de sistemas mecanicos en IR2 afirma que los subconjuntos de nivel (areas encerradas bajolas curvas de nivel) son invariantes del sistema (Landau & Lifchitz 1964). Este resultadoes solo de aplicacion en sistemas disipativos, y debe interpretarse del siguiente modo: siuna curva de nivel de la energıa del sistema disipativo es cerrada, entonces las trayectoriasque comiencen dentro de esa curva de nivel, permaneceran dentro de ella indefinidamente.Visto en el espacio tridimensional (tomando la energıa como el tercer eje), y dado un

punto origen del movimiento en el plano (θ, θ), la energıa de ese punto establece un plano

horizontal paralelo al (θ, θ) tal que las trayectorias en el espacio tridimensional siempreestaran por debajo de dicho plano. En sistemas conservativos y disipativos sabemos que laenergıa mecanica no puede superar el valor inicial, por lo que dados la posicion y velocidadiniciales el sistema queda confinado a la region por debajo del corte.

Si todo lo anteriormente es valido para sistemas disipativos, hay que tener en cuentaque hemos llegado a la funcion de energıa H + Ha de forma artificial, y por tanto no esnatural esperar que la propia friccion del sistema lo haga disipativo con respecto a estafuncion. Por tanto todo metodo de control basado en el moldeo de energıa debe incluirun termino que “ayude” al sistema a disipar energıa adecuadamente.

2Curvas de nivel: lugar geometrico de dimension n − 1 en el espacio de estados donde la energıapermanece constante.

Page 29: Hamiltonians based Control

Capıtulo 1. Introduccion 15

1.5.4 Comportamiento transitorio

Una vez establecida la relacion entre energıa, disipacion, y trayectorias del sistema, de-scribiremos la conexion existente entre la forma de la funcion de energıa y el acotamientode coordenadas en el transitorio. Para explicarlo recurriremos a un curioso ejemplo: unapersona vigorosa golpea un martillo de feria para medir su energıa. Para ello observa lamaxima altura a la que llega una pesa empujada por el martillazo sobre un trampolın(figura 1.4). Inicialmente el martillo esta en la posicion P0 y posee una energıa mgh0 = 0.

Esta es la energıa inicial en bucle abierto. Si el concursante emplea sus manos exclusiva-mente como punto de apoyo para la caıda del martillo sin esfuerzo adicional, esta energıase transmite al peso que se eleva hasta una altura que sera una medida de la energıapotencial inicial del martillo elevado. En este caso se puede afirmar que la altura de lapesa en instantes futuros esta acotada superiormente por el valor de la energıa potencialinicial del martillo.

Al estudiar el sistema en bucle cerrado, el concursante se convierte en actuador yrealiza un esfuerzo para acelerar el martillo mas alla de la gravedad y por tanto inyectaenergıa al sistema. Si deseamos encontrar una cota superior para la altura de la pesatras el golpe nos encontramos con la siguiente pregunta: ¿cual es la maxima energıa queel forzudo puede transmitir al martillo y por consiguiente a la pesa? Ya no basta conconocer la energıa del sistema en bucle abierto, sino que es necesario tener un modelo deenergıa del conjunto concursante-martillo y en funcion de el se podra obtener la alturamaxima que puede alcanzar la pesa.

Figura 1.4: Variacion del estado en funcion de la energıa anadida .

El control basado en la energıa tal y como se desarrolla en esta tesis proporciona dichomodelo de energıa en bucle cerrado y una adicion de amortiguamiento tal que el equilibriodeseado pasa a ser estable. Si ademas empleamos el hecho de que las curvas de nivelde energıa representan regiones de confinamiento de las coordenadas, podemos deducirque el energy shaping puede ser una vıa para modular el comportamiento transitorio.En efecto, una curva cerrada en el espacio de las coordenadas representa un conjuntoacotado. Esto implica que existe un valor maximo para cada coordenada cuando lastrayectorias comienzan con una energıa inicial determinada. Mas aun, el valor de dichomaximo depende precisamente de la energıa inicial, con lo que estamos en una situacionsemejante a la figura 1.4 pero con interesantes consecuencias en el campo del control.

De hecho el interes del acotamiento de trayectorias en control es un problema fun-damental para determinar regiones de operacion de los sistemas reales. En los primeroscursos de Control Automatico se incide profundamente en el diseno de controladores con

Page 30: Hamiltonians based Control

16 1.5. Control basado en la energıa

determinadas especificaciones de sobreoscilacion para sistemas lineales. En esta tesis seabre la puerta a un ajuste analogo para sistemas mecanicos no lineales subactuados.

Por otra parte, el ritmo de disipacion de energıa en bucle cerrado es un parametrocrıtico para ajustar comportamientos como el tiempo empleado en alcanzar el equilibrio.El estudio del tiempo de establecimiento tiene tanta relevancia como la sobreoscilacion,esta bien asentado en la teorıa de sistemas lineales y se mantiene como problema abierto.De nuevo en esta tesis, con las tecnicas de control basado en la energıa se daran las basespara abordar este problema en situaciones de mayor generalidad.

1.5.5 Generalizacion de la energıa en el control

El concepto de energıa suministra una magnitud escalar cuya evolucion sintetiza, en algunsentido, la del propio sistema dinamico. Es decir, desde un punto de vista fısico estric-to, el sistema evoluciona de forma autonoma hacia el estado en que la energıa se hacemınima. El hecho de que una magnitud escalar resuma en su comportamiento la evolu-cion del estado (en general un vector) tiene consecuencias teoricas y practicas que resultadifıcil sobrevalorar. La evolucion del sistema hacia el estado de energıa mınima sirvio deinspiracion a Lyapunov para desarrollar su conocido metodo para el estudio de la esta-bilidad de los sistemas dinamicos no lineales. Por una parte, introdujo lo que luego seha conocido como funcion de Lyapunov, que no es sino una funcion V (x) que posee lasmismas propiedades matematicas que la energıa3, es decir:

• V (0) = 0 y V (x) > 0,∀x = 0

• V (x) < 0,∀x = 0.

Con el concurso de las funciones de Lyapunov V (x), el problema del control se puedeplantear, de forma abstracta, de manera extremadamente simple. Supongase que sedispone de una planta, o sistema en bucle abierto, a la que se asocia una representacionmatematica, en general no lineal, de la forma

x = f(x, u). (1.5.2)

Es sabido que el problema del control consiste en determinar una funcion u = k(x) talque el sistema resultante de llevar esta u a (1.5.2) de lugar a un sistema en bucle cerradode la forma

x = f(x, k(x)) = F (x), (1.5.3)

sistema autonomo que posee el comportamiento requerido. Este comportamiento com-prende la propiedad de estabilidad en el origen, lo que se traduce en que las trayectoriasde (1.5.3) tienden al mınimo de la funcion de Lyapunov V (x). Es decir,

V =∂V

∂xf(x, k(x)) < 0. (1.5.4)

Pues bien la gran aportacion de Lyapunov fue permitir generalizar los conceptos de com-portamiento de la energıa, que se han comentado en las secciones anteriores, a situacionesen las que exista esa funcion V (x) que posee las mismas propiedades matematicas que la

3Solo si nos restringimos a sistemas lagrangianos con equilibrios estables.

Page 31: Hamiltonians based Control

Capıtulo 1. Introduccion 17

energıa, aunque no tenga su mismo significado fısico. De este modo se puede generalizarconsiderablemente el control basado en la energıa al control basado en la existencia de lafuncion de Lyapunov.

Una generalizacion adicional, que esta teniendo lugar en nuestros dıas, es la de asociaruna estructura (o realizacion, en una terminologıa clasica de la teorıa del control) hamil-toniana al sistema considerado. La funcion de Hamilton de esta realizacion hamiltonianaposee las propiedades de una funcion del Lyapunov, por lo que se alcanza una notablesıntesis para el tratamiento de los sistemas dinamicos que admiten esa formalizacion.Es el caso, en principio, de los sistemas electromecanicos para los que la adopcion deuna estructura hamiltoniana es un hecho bien conocido y explotado desde hace tiempo.Para estos sistemas las tecnicas de proyecto de controladores mediante moldeo de energıaposeen un caracter natural. Sin embargo, mediante las formulaciones hamiltonianas, yel consecuente empleo de funciones de Lyapunov, se puede ampliar considerablemente elcampo de aplicacion de las tecnicas de moldeo de energıa, desarrolladas inicialmente parasistemas electromecanicos. En el capıtulo 6 de esta tesis se ilustra este hecho al propon-er como objetivo que el sistema realimentado posea una funcion del Lyapunov cuartica,sin ningun significado de energıa, pero cuyo comportamiento presenta unas oscilacionesperiodicas que constituyen el objetivo del proyecto.

1.6 Estructura de la tesis

Esta tesis consta de siete capıtulos complementados con dos apendices. En este primercapıtulo se ofrece una exposicion de motivos, ası como una perspectiva general de losconceptos involucrados en el desarrollo de los posteriores capıtulos.

En el segundo capıtulo se presentan formamente los fundamentos teoricos necesariospara la correcta comprension del texto subsiguiente, y se realiza una revision del estadoactual de las tecnicas de control dentro de las que se enmarcan las aportaciones de latesis.

El tercer capıtulo esta dedicado al control de un sistema completamente actuado quepresenta interesantes peculiaridades y dificultades en el control: una plataforma giroesta-bilizada de dos grados de libertad situada sobre una superficie movil como puede ser unvehıculo o buque. Para este sistema se desarrolla un control de la lınea de mira basadoen la estructura hamiltoniana con rechazo de perturbaciones. Los resultados se aplican auna planta real instalada en el laboratorio del departamento de Ingenierıa de Sistema yAutomatica de la Universidad de Sevilla. La mayor parte del contenido de este capıtuloha sido publicado en (Gomez-Estern, Aracil & Rubio 2000) y (Gomez-Estern, Cordones& Rubio 2002).

El cuarto capıtulo esta dedicado al control de sistemas mecanicos subactuados simplesbasado en pasividad, empleando el metodo IDA-PBC, recientemente desarrollado. Sepresenta el metodo con rigor teorico y se aplica a la resolucion de problemas abiertosampliamente conocidos en la comunidad del control como la bola y la viga. Se aportaun analisis de los transitorios del sistema en bucle cerrado, para el calculo de cotas enlas trayectorias del sistema. Lo expuesto en este capıtulo ha dado lugar a la publica-cion en la revista IEEE Transactions on Automatic Control del artıculo (Ortega, Spong,Gomez-Estern & Blankenstein 2002) y al artıculo de congreso (Gomez-Estern, Ortega &Spong 2001).

Page 32: Hamiltonians based Control

18 1.6. Estructura de la tesis

El objetivo del quinto capıtulo es la reduccion de las ecuaciones IDA-PBC para unaclase de sistemas subactuados en los que el sistema de ecuaciones diferenciales parcialespropio del metodo, admite una solucion trivial gracias a la reduccion obtenida. Ademasse presentan soluciones de razonable generalidad para los pasos de moldeo de energıacinetica y potencial para el caso de sistemas de dos grados de libertad, y se estudia laaplicacion de la reduccion a sistemas de orden mayor. Los resultados de este capıtulo hansido publicados en (Gomez-Estern, Ortega, Rubio & Aracil 2001).

El sexto capıtulo aborda el problema de la estabilizacion de orbitas periodicas ensistemas no lineales mediante realimentacion estatica del estado basadas en la energıay la estructura hamiltoniana. En el se parte de un sistema hamiltoniano oscilante deorden dos, que se propone como dinamica objetivo para el sistema a controlar, y sedesarrolla una teorıa para la extension del comportamiento oscilante en una amplia clasede sistemas de orden superior, incluyendo los sistemas con estructura triangular no afın,los linealizables por realimentacion y otros sistemas de forma aproximada. Dos resultadosfundamentales son la deteccion de una bifurcacion de Hopf que se mantiene al aumentarel orden del sistema y la posibilidad de representar el sistema en bucle cerrado en formahamiltoniana generalizada. Los resultados presentados en este capıtulo han dado lugara la serie de publicaciones (Aracil, Gordillo & Gomez-Estern 2002), (Gordillo, Gomez-Estern, Ortega & Aracil 2002), (Gomez-Estern, Aracil & Gordillo 2002), (Gordillo, Aracil& Gomez-Estern 2002) y (Aracil, Gomez-Estern & Gordillo 2002).

El septimo capıtulo contiene una exposicion de conclusiones referentes a los capıtuloscomprendidos entre el tres y el seis, y se expone una discusion detallada de las posibleslıneas futuras de investigacion posteriores a esta tesis, clasificadas en funcion de las trespartes fundamentales de la tesis.

El apendice A describe la labor desarrollada en el contexto del proyecto DORNA porel doctorando y el equipo de desarrollo formado a tal efecto, para el control de plataformasgiroestabilizadas. La aplicacion, de tiempo real, contiene elementos de interes desde elpunto de vista del modelado, el control, la programacion de procesadores de senales entiempo real, la sincronizacion de procesos y el diseno de protocolos de comunicaciones.Los resultados de este apendice dieron lugar a la publicacion (Gomez-Estern, Perez, Rubio& Gordillo 2000).

En el apendice B se detallan los procedimientos Maple desarollados para el calculoautomatizado de la ley de control para sistemas oscilantes de orden arbitrario, presentadaen la seccion 6.8. El principal interes de estos procedimientos reside en la dificultad delmanejo de sistemas de ecuaciones diferenciales cuando se desea trabajar con sistemas deorden variable. Este apendice tambien se ha incluido en publicacion (Aracil, Gomez-Estern & Gordillo 2002).

Page 33: Hamiltonians based Control

Capıtulo 2

Fundamentos teoricos y estado de latecnica

2.1 Sistemas electromecanicos

Esta tesis tiene por objeto estudiar y desarrollar metodos de estabilizacion, seguimientode trayectorias y robustificacion en una clase de sistemas, cuya propiedad fundamental esque poseen integrales de movimiento. Esto quiere decir que la evolucion de sus trayectoriaspuede ser descrita en terminos de las derivadas temporales y con respecto a las coordenadasgeneralizadas de una funcion escalar relacionada con la energıa. Esta propiedad es comunen sistemas mecanicos y sistemas electricos, y por tanto es una herramienta esencial enel analisis y control de sistemas roboticos y electromecanicos en general. La comunidaddel control ha dividido sus lıneas de trabajo en dos paradigmas con un alto grado deparalelismo: los sistemas lagrangianos o de Euler–Lagrange (EL) y los hamiltonianos.Pese existir una equivalencia entre ambos enfoques y poder expresar la modelo EL enforma hamiltoniana, las formulaciones han sido generalizadas hasta el punto en que no esevidente su equivalencia, y por tanto tampoco son intercambiables las tecnicas de controldesarrolladas en uno u otro enfoque.

2.2 Sistemas de Euler–Lagrange

Una interesante y compacta definicion de sistemas de Euler–Lagrange (indistintamenteEL) se enuncia en (Landau & Lifchitz 1964), mediante el principio de mınima accion (ode Hamilton) . En virtud de este principio, todo sistema mecanico esta caracterizado poruna funcion de las coordenadas generalizadas qi, i = 1, 2 . . . n, sus derivadas, y el tiempo t

L(q1, q2, . . . , qn, q1, q2, . . . , qn, t)

o mas brevemente L(q, q, t) tal que las trayectorias del sistema q(t) satisfacen la condicionsiguiente (Landau & Lifchitz 1964).

Supongamos que en los instantes t = t1 y t = t2, el sistema ocupa posiciones determi-nadas, caracterizadas por los conjuntos de coordenadas q1 y q2. Entre estas posiciones, el

19

Page 34: Hamiltonians based Control

20 2.2. Sistemas de Euler–Lagrange

sistema se mueve de forma que la integral

S =

∫ t2

t1

L(q, q, t)dt

tome el menor valor posible. La funcion L se conoce como funcion de Lagrange y laintegral S como integral de accion.

Sea, precisamente, q = q(t) la funcion (trayectoria) para la cual S se hace mınima,es decir, que S aumenta si el sistema sigue cualquier trayectoria alternativa a q(t) de laforma q(t) + δq(t), donde δq(t) es una funcion pequena en el intervalo de tiempo de t1 at2. La variacion infinitesimal en S debe anularse en el mınimo, por lo que

δS =

∫ t2

t1

L(q + δq, q + δq, t)dt −∫ t2

t1

L(q, q, t)dt = δ

∫ t2

t1

L(q, q, t)dt = 0

desarrollando la variacion de la integral se tiene∫ t2

t1

(∂L∂q

δq +∂L∂q

δq

)dt = 0

y no es difıcil probar (Ranada 1990) que la condicion necesaria y suficiente para queδS = 0 es

d

dt

(∂L∂qi

)− ∂L

∂qi

= 0

Tras anos de especulaciones (Maupertuis) en cuanto a la definicion de la funcion L, Eulery Lagrange la definieron correctamente en el caso general, tomando la forma

L = T (q, q, t) − V (q, t) i = 1, 2 . . . n

donde T (q, q, t) y V (q, t) representan, respectivamente, las energıa cinetica y potencial.Generalizando al caso de sistemas sometidos a fuerzas externas, las trayectorias q(t) seransoluciones al sistema de ecuaciones diferenciales de segundo orden

d

dt

(∂L∂qi

)− ∂L

∂qi

= fi i = 1 . . . n

donde fi representa el conjunto de fuerzas y momentos externos que no derivan de unpotencial, entre los que habitualmente incluiremos

• Los efectos de friccion que tienen como consecuencia una disipacion de energıa.

• Fuerzas y pares de control.

Estas ecuaciones, en el caso de solidos rıgidos (p. ej. sistemas roboticos), en ausencia defriccion pueden ser escritas del siguiente modo

M(q)q + C(q, q)q + g(q) = τ (2.2.1)

Donde M(q) es la matriz de inercia del sistema, g(q) = ∂V (q)∂q

y el termino C(q, q)q cor-

responde a los efectos centrıfugos y de coriolis, cumpliendose que M − 2C es una matrizantisimetrica.

El modelo de Euler–Lagrange ha dado lugar a una serie de metodos de sıntesis de con-troladores que ademas de perseguir la estabilidad asintotica de equilibrios y trayectorias,preservan la estructura de Euler–Lagrange en bucle cerrado. Con ello se logra

Page 35: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 21

• Una funcion de Lyapunov natural como es la funcion de energıa.

• Estructuras pasivas que permiten obtener resultados de robustez.

• Generalizar teorıas de sıntesis para el control de sistemas subactuados.

• Separacion entre energıas cinetica y potencial en bucle cerrado, lo que permite haceranalisis en espacios de dimension reducida.

2.3 Sistemas hamiltonianos

La dinamica de los sistemas de Euler Lagrange admite una descripcion alternativa conoci-da como ecuaciones canonicas de Hamilton. Su primera ventaja aparente es la estructura:un conjunto de ecuaciones diferenciales de primer orden, que se ajusta a la descripcionclasica en variables de estado x = f(x) empleada en control no lineal. A medida que anal-icemos la estructura y propiedades de esta descripcion apareceran interesantes ventajaspara el control, que hacen de ella una herramienta merecedora de su gran popularidad.Para obtener estas ecuaciones se define la funcion de Hamilton a partir de la transformadade Legendre de la funcion de Lagrange

H=∑

piqi − L

donde la variables p1, p2, . . . , pn se denominan momentos conjugados y se definen como

pk =∂L∂qk

Tomando derivadas parciales (Ranada 1990)

∂H

∂qk

=∑

i

pi∂qi

∂qk

−∑

i

∂L∂qi

∂qi

∂qk

− ∂L∂qk

= −pk

∂H

∂pk

= qk +∑

i

pi∂qi

∂pk

−∑

i

∂L∂qi

∂qi

∂pk

= qk

se llega a la siguiente descripcion en variables de estado[q

p

]=

[0n×n In

−In 0n×n

][∂H∂q∂H∂p

]= Γ∇H (2.3.1)

Donde In es la matriz identidad de orden n. La matriz Γ se denomina matriz simplectica.Si sobre el sistema actuan una serie de fuerzas externas y de control dadas por el vectorf = [f1, f2, . . . , fn]T , la dinamica se transforma en[

q

p

]= Γ∇H +

[0n×n

In

]f

Mucho mas que un sencillo cambio de variables, la formulacion hamiltoniana de la mecanicatiene gran elegancia y ofrece una vision profunda sobre la evolucion de los sistemas. Al

Page 36: Hamiltonians based Control

22 2.3. Sistemas hamiltonianos

representar la matriz simplectica una rotacion de angulo −π/2, el campo vectorial en elespacio de las fases (q, p) aparece girando el gradiente del hamiltoniano 90o en sentidohorario, por lo que se dice que H es el generador de las trayectorias, ya que sus derivadasdefinen y determinan el vector de las derivadas del estado, que a su vez determina ladireccion del movimiento en el espacio de las fases (vease la figura 2.3). En efecto, elhecho de que en las trayectorias del sistema se cumple que

H =∑

k

∂H

∂qk

qk +∑

k

∂H

∂pk

pk +∂H

∂t=

∂H

∂t,

implica que si H no depende explıcitamente del tiempo (el caso habitual que estudiaremosen esta tesis), las trayectorias son curvas de H(t) ≡ H(0).

grad(H)

q

p

(q,p)

(q,p) grad(H)

Figura 2.1: Campo vectorial de un sistema hamiltoniano.

2.3.1 Sistemas hamiltonianos generalizados.

En (Van der Schaft 2000) aparece una generalizacion de los sistemas hamiltonianos medi-ante la definicion de la estructura PCH (Port–Controlled Hamiltonian System), o sistemashamiltonianos controlados por puertos. Generalmente trataremos con sistemas PCH condisipacion (o PCHD) al incluir un termino disipativo en la dinamica. Los sistemas PCHcon disipacion admiten la siguiente descripcion en variables de estado

x = (J(x) − R(x))∂H

∂x+ Gu (2.3.2)

donde x ∈ IRn es el vector de estado, J(x) = −J(x)T es la matriz de interconexion,R(x) ≥ 0 es la matriz de disipacion, H es el hamiltoniano o funcion de Hamilton y G yu representan, respectivamente, la matriz y el vector de control. Ademas,

∇H =

[∂H

∂x1

,∂H

∂x2

, . . . ,∂H

∂xn

]T

Es facil de comprobar, por la propiedad antisimetrica de J(x), que en ausencia de accionde control la derivada del hamiltoniano viene dado por

H = −(∇H)T R(x)(∇H) ≤ 0

Page 37: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 23

De hecho, si R(x) = 0 desaparece el efecto disipativo y el hamiltoniano se conserva(sistema PCH). Gracias a este hecho fundamental, la funcion H puede ser empleada comofuncion de Lyapunov de control para sistemas con estructura PCHD en bucle cerrado.

Cambio de variable en sistemas hamiltonianos

Un resultado util para los propositos de esta tesis surge de la invariancia de las propiedadesde la estructura hamiltoniana generalizada frente a un cambio de coordenadas en el sis-tema. Sea el sistema PCHD definido en variables ξ ∈ IRn cuya dinamica esta descrita porlas ecuaciones

ξ = (Jξ(ξ) − Rξ(ξ))∇ξHξ

donde

∇ξHξ =

[∂Hξ

∂ξ1

,∂Hξ

∂ξ2

, . . . ,∂Hξ

∂ξn

]T

Supongamos que deseamos obtener las ecuaciones de estado en un nuevo conjunto devariables x ∈ IRn definido por el mapa diferenciable y difeomorfico ψ : ξ → x. Para ellose ha de calcular el jacobiano de la transformacion inversa x → ξ representado por ∂x

∂ξ.

Entonces se tiene

x =

[∂x

∂ξ

]ξ =

[∂x

∂ξ

](Jξ − Rξ)∇ξHξ =

[∂x

∂ξ

](Jξ − Rξ)

[∂x

∂ξ

]T

∇xHx.

Si definimos las matrices

Jx=

[∂x

∂ξ

]Jξ

[∂x

∂ξ

]T

Rx=

[∂x

∂ξ

]Rξ

[∂x

∂ξ

]T

es sencillo demostrar que Jx es una matriz antisimetrica. En efecto, para cualquier vec-

tor z ∈ IRn podemos definir otro vector y =[

∂x∂ξ

]z ∈ IRn tal que por la propiedad

antisimetrica de Jdξ se tiene

zT Jxz = zT

[∂x

∂ξ

]Jξ

[∂x

∂ξ

]T

z = yT Jξy = 0 ∀z

de lo que se deduce que Jx tambien es antisimetrica. El hecho de que Rx ≥ 0 se demuestrade una manera analoga. Tomense los mismos vectores z e y del parrafo anteriores y setiene

zT Rxz = zT

[∂x

∂ξ

]Rξ

[∂x

∂ξ

]T

z = yT Rξy ≥ (>)0 ∀z

Para lo cual es condicion suficiente y necesaria que Rx ≥ (>)0. Consecuentemente, elsistema expresado en variables x toma la forma

x = (Jx(x) − Rx(x))∇xHx

que es, precisamente, un sistema PCHD con matrices de interconexion Jx y disipacionRx. Este resultado permite, en determinadas situaciones, recurrir a unas variables en lasque sea sencillo encontrar una estructura hamiltoniana, para poder deshacer el cambiopreservando dicha estructura. Un caso particular es el de un sistema linealizado porrealimentacion, como se analizara en el capıtulo 6.

Page 38: Hamiltonians based Control

24 2.3. Sistemas hamiltonianos

2.3.2 Hamiltoniano y energıa

La siguiente discusion esta motivada por la confusion que a menudo induce el emplear losterminos energıa y funcion de Hamilton indistintamente. Como se vera a continuacion, ysegun se indica (Ranada 1990), en los sistemas mecanicos que no se asientan sobre sistemasde referencia inerciales, no existe la consabida equivalencia entre energıa y hamiltoniano.En el caso de sistemas autonomos no inerciales, la cantidad conservada es el hamiltoniano,ya que el movimiento del sistema de referencia en el que esta inmerso el sistema suele sueleprovocado por un intercambio de energıa con el exterior.

Para ilustrar esto observese el sistema de la figura (2.2). El sistema consiste en unamasa puntual m restringida a moverse sobre una circunferencia de radio a que gira en tornoa un eje vertical que pasa por su centro. Supongamos que este sistema esta accionado porun motor que lo mantiene girando en torno a un eje vertical que pasa por el centro delaro con velocidad constante ω.

q1

w

Figura 2.2: Sistema hamiltoniano en sistema de referencia no inercial.

El lagrangiano de este sistema toma la forma

L =1

2a2m(q2

1 + ω2sen2q1) − mga cos q1

donde g es la constante de gravedad. El hamiltoniano, que es la unica cantidad conservada,es

H =1

2a2m(q2

1 − ω2sen2q1) + mga cos q1

mientras que la energıa mecanica toma la forma

E = T + V =1

2a2m(q2

1 + ω2sen2q1) + mga cos q1

Derivando la energıa con respecto al tiempo se tiene

E = a2mω2q1sen2q1

lo que implica que siempre que haya variacion del angulo q1, habra un intercambio deenergıa con el exterior. ¿A que se debe esta discrepancia entre hamiltoniano y energıa?.

Page 39: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 25

¿Por que se conserva solo el primero? La razon subyace en que el sistema no esta aisladopues precisa del aporte de energıa de un motor externo para mantener la rotacion a veloci-dad constante (normalmente oscilarıa). En consecuencia existe un flujo de energıa entreel sistema y el exterior. La condicion para la conservacion del hamiltoniano es diferente.Para comprender lo que sucede con el hamiltoniano hay que puntualizar que cuando elsistema se encuentre en un sistema de referencia no inercial, la energıa cinetica puedeconstar, ademas de los terminos cuadraticos, de otros terminos lineales. La expresiongeneral de la energıa cinetica de un sistema de partıculas toma, pues, la expresion general

T =∑r,s

1

2Ars(q, t)qrqs +

∑r

B(q, t)rqr + C(q, t) = T2 + T1 + T0

Por otro lado, si definimos rj como la expresion en cartesianas respecto a un sistema dereferencia inercial de la partıcula j del sistema, esta se podra calcular siempre en funcionde las coordenadas articulares q por la relacion

rj = rj(q1, q2, . . . , qn, t).

Si en esta relacion no aparece explıcitamente el tiempo, entonces la energıa cinetica sereduce al termino T = T2 en cuyo caso diremos que se trata de un sistema natural. Siademas L (y por tanto H) no dependen explıcitamente del tiempo, se trata de un sistemaautonomo, por lo cual H es una constante de movimiento.

El ejemplo mencionado se trata de un sistema no natural y autonomo y por tantose conserva el hamiltoniano, pero no la energıa. Estas circunstancias son de especialrelevancia en el contexto de esta tesis pues se estudiara el control de un sistema instaladoen la cubierta de un buque, y por tanto sumergido en un sistema de referencia no inercial.

2.4 Estabilidad en sistemas autonomos

Los resultados presentados en esta seccion son ampliamente conocidos y empleados en laliteratura del control no lineal (Khalil 1996). Se incluiran con el proposito de crear untexto autocontenido, ya que son esenciales para los desarrollos de esta tesis.

Considerese el conjunto de ecuaciones diferenciales

x = f(x) (2.4.1)

donde x ∈ IRn. Mas generalmente, x denota un conjunto de coordenadas locales en unespacio m–dimensional χ. Supondremos que f es localmente continua en el sentido deLipschitz, implicando la existencia y unicidad de soluciones.

Definicion 2.4.1 (Estabilidad en sistemas no lineales). Sea x∗ un equilibrio de(2.4.1), es decir, f(x∗) = 0, y por tanto x(t; x∗) = x∗,∀t. El equilibrio x∗ es

(a) estable, si para cada ε > 0 existe δ = δ(ε) > 0 tal que

‖x(t0) − x∗‖ < δ ⇒ ‖x(t) − x∗‖ < ε, ∀t ≥ t0 (2.4.2)

(b) asintoticamente estable, si es estable y existe c > 0 tal que

‖x(t0) − x∗‖ < c ⇒ limt→∞

x(t; x(t0)) = x∗

Page 40: Hamiltonians based Control

26 2.5. Bifurcaciones en sistemas no lineales

(c) globalmente asintoticamente estable, si es estable y limt→∞ x(t, x0) = x∗ para todox0 ∈ χ.

Una herramienta fundamental para el analisis de estabilidad de los sistemas dinamicos esel metodo directo de Lyapunov:

Teorema 2.4.1 (Lyapunov). Sea x∗ un equilibrio de (2.4.1). Sea V : χ → IR+ unafuncion C1 que cumple

V (x∗) = 0, V (x) > 0, x = x∗

(es decir, definida positiva en x∗), tal que

V (x) = (∇xV (x))T f(x) ≤ 0,∀x ∈ χ

Entonces x∗ es un equilibrio estable. Si ademas

V (x) < 0, ∀x ∈ χ, x = x∗

entonces x∗ es un equilibrio asintoticamente estable, y lo es globalmente si V es propia.

Una herramienta muy potente para probar estabilidad asintotica en sistemas no linealeses el principio de invariancia de LaSalle.

Teorema 2.4.2 (Principio de invariancia de LaSalle). V : χ → IR+ una funcion C1

para la cual V (x) = (∇xV (x))T f(x) ≤ 0 para todo x ∈ χ. Sea x(t, x0), t ≥ 0 una solucionde x = f(x). suponga que existe un conjunto compacto B tal que x(t : x0) ∈ B,∀t ≥ 0.Entonces x(t : x0) converge al mayor subconjunto de x ∈ χ|V (x) = 0⋂B que esinvariante para el sistema x = f(x).

2.5 Bifurcaciones en sistemas no lineales

En el estudio de sistemas dinamicos no lineales es frecuente observar que la estructura delespacio de fases se ve drasticamente afectada por la variacion de uno o varios parametrosdel sistema. En el caso de que el numero o la naturaleza de los conjuntos lımite del sistemase vean modificados por la variacion de dicho parametro, decimos que se ha producido unbifurcacion. Un caso tıpico es el de un sistema del tipo

x = f(x, µ)

en el que existe un ciclo lımite estable para µ < 0 que colapsa en un punto de equilibrioestable cuando µ cambia de signo (vease la figura 2.3). Este tipo de bifurcaciones esconocido como bifurcacion de Hopf. La bifurcacion de Hopf, de interes en esta tesis, ysus aplicaciones ha sido estudiada en (Marsden & McCracken 1976). El siguiente teoremadescribe las condiciones para la existencia de dicha bifurcacion, y tiene especial interes ensistemas de alto orden donde la complejidad imposibilita hacer un analisis detallado delretrato de estados. Supongamos que el sistema dinamico x = f(x, µ) con f ∈ C3, x ∈ IRn

y µ ∈ IR tiene un punto de equilibrio en x∗, para algun µ = µc; esto es, f(x∗, µc) = 0.

Page 41: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 27

Parámetro de bifurcación

Estado

Tayectoria entrante

Trayectoria salienteEquilibrio estable

Figura 2.3: Representacion esquematica de las trayectorias en la bifurcacion de Hopf.

Sea A(µ) = Dxf(x∗(µ), µ) la matriz jacobiana del sistema en el punto de equilibrio. Elpolinomio caracterıstico para A es

∆(A) = sn + an−1sn−1 + · · · + a1s + a0

donde los ai dependen de µ.

Supongamos que A(µc) tiene un unico par de autovalores imaginarios λ(µc) = ±jωc, yningun otro autovalor con parte real nula; y adicionalmente,

dRe(λ(µ))

∣∣∣∣µ=µc

= 0

Esto ultimo se conoce como la condicion de transversalidad. Bajo estas condiciones, elteorema de la bifurcacion de Hopf (Marsden & McCracken 1976) sugiere la aparicion deun ciclo lımite en (x∗, µc)

1.

Las condiciones para la existencia de un par de autovalores puramente imaginarios dela matriz A(µ) pueden ser formulados para cualquier dimension del siguiente modo (Liu1994):

Hn−1(µ) = 0 (2.5.1)

Hn−2(µ) > 0, Hn−3 > 0, . . . , H1(µ) > 0, a0(µ) > 0 (2.5.2)

Donde Hi(µ) representa el i-esimo menor descendente de la matriz de Hurwitz de ∆(A).

2.6 Pasividad y disipatividad

Los conceptos que se describiran a continuacion pueden estudiarse con mayor detalleen: (Vidyasagar 1993) para estabilidad L2, (Van der Schaft 2000) para pasividad e in-terconexion de sistemas pasivos y (Ortega, Loria, Niklasson & Sira-Ramırez 1998) paracontrol basado en pasividad de sistemas EL.

1En rigor, esta condicion solo indica la existencia de oscilaciones bien a uno de los lados de la bifurcaciono precisamente en el punto µ = µc. Para determinar exactamente el lugar y si realmente se trata de unciclo lımite atractivo, son necesarias consideraciones adicionales basadas en la informacion no lineal delsistema. Una posibilidad es el recurso a la tecnica de la funcion descriptiva.

Page 42: Hamiltonians based Control

28 2.6. Pasividad y disipatividad

2.6.1 Estabilidad Lq

Definicion 2.6.1 (Espacios Lq). Para cada q ∈ 1, 2, . . . se define Lq[0,∞) = Lq comoel conjunto de funciones2 f : IR+ → IR que satisfagan∫ ∞

0

|f(t)|qdt < ∞

A su vez, L∞ consiste en el conjunto de funciones f : IR+ → IR acotadas, es decir

supt∈IR+

|f(t)| < ∞

En estos espacios es posible definir las siguientes normas

Definicion 2.6.2 (Norma Lq). Para toda funcion f : IR+ → IR contenida en Lq sedefinen la normas

‖f‖q =

(∫ ∞

0

|f(t)|qdt

) 1q

q = 1, 2, . . .

‖f‖∞ = supt∈IR+

|f(t)| < ∞

Asimismo, en L2 se define el producto interior de dos funciones f ,g contenidas en L2

< f, g >=

∫ ∞

0

f(t)g(t)dt

de donde se deduce que ‖f‖2 =< f, f >12 . Para las funciones no acotadas sin tiempo de

escape finito se define el espacio extendido Lqe

Definicion 2.6.3 (Espacios Lqe). Sea f : IR+ → IR. Entonces, para cualquier T ∈ IR+,la funcion fT : IR+ → IR se define como

fT (t) =

f(t) , 0 ≤ t < T

0 , t ≥ T

llamada la truncacion de f en el intervalo [0, T ]. Para cada q = 1, 2, . . .∞, el espacio Lqe

consiste de todas las funciones f : IR+ → IR tal que fT ∈ Lq para todo T con 0 ≤ T ≤ ∞.Lqe se denomina el espacio extendido de Lq.

Lo expuesto anteriormente se puede extender trivialmente a funciones f : IR+ → IRn

suponiendo la existencia de una norma definida en IRn. Los conceptos presentados sonelementales para las siguientes definiciones de estabilidad Lq entrada–salida. Para repre-sentar la dinamica de un sistema haremos uso del concepto mas general mapa de entrada–salida. Sea U un espacio lineal m-dimensional con norma ‖ ‖U , e Y otro espacio linealp-dimensional con norma ‖ ‖Y , junto a una aplicacion entrada–salida

G : Lqe(U) → Lqe(Y )

u → y = G(u)

2En adelante se supondra que estamos hablando en todo caso de funciones medibles. Un funcion esmedible si es el lımite punto por punto de una secuencia de funciones constantes a trozos, excepto unconjunto de medida cero.

Page 43: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 29

Definicion 2.6.4 (Estabilidad Lqe). Sea un sistema representado por el mapeo G :Lqe(U) → Lqe(Y ). Entonces se dice que G es Lq–estable si

u ∈ Lqe(U) → G(u) ∈ Lq(Y )

es decir, G aplica el subconjunto Lq(U) ⊂ Lqe(U) en el subconjunto Lq(Y ) ⊂ Lqe(Y ).

Evidentemente, la estabilidad L∞, equivale a estabilidad BIBO (Bounded Input BoundedOutput).

2.6.2 Pasividad y ganancia L2

Sea un sistema descrito en variables de estado de la forma

Σ :

x = f(x, u), u ∈ U

y = h(x, u) y ∈ Y

donde x = x1, x2, . . . , xn son las coordenadas locales en una variedad χ, U e Y sonespacios lineales, de dimensiones m y p, respectivamente. En el espacio de estados U ×Yde variables externas se define la funcion

s : U × Y → IR

denominada tasa de suministro.

Definicion 2.6.5 (Disipatividad). Un sistema en variables de estado Σ se dice quees disipativo con respecto a la tasa de suministro s si existe una funcion S : χ → IR+,denominada funcion de almacenamiento tal que para todo x ∈ χ y todas las funciones deentrada u

S(x(t1)) ≤ S(x(t0)) +

∫ t1

t0

s(u(t), y(t))dt (2.6.1)

La desigualdad (2.6.1) es conocida como la desigualdad de disipacion. Una eleccion ha-bitual de la tasa de suministro es

s(u, y) =< y|u > .

Definicion 2.6.6 (Pasividad). Un sistema en variables de estado Σ con u = y =IRm es pasivo si es disipativo con respecto a la tasa de suministro s(u, y) = uT y. Σ esestrictamente pasivo a la entrada si existe δ > 0 tal que Σ es disipativo con respecto as(u, y) = uT y − δ‖u‖2. Σ es estrictamente pasivo a la salida si existe ε > 0 tal que Σes disipativo con respecto a s(u, y) = uT y − ε‖y‖2. Finalmente, Σ es conservativo si secumple (2.6.1) con signo de igualdad con respecto a la funcion s(u, y) = uT y para todox0,t1 ≥ t0 y u(·).Definicion 2.6.7 (Ganancia L2). Un sistema en variables de estado Σ con U = IRm,Y = IRp, tiene ganancia L2 ≤ γ si es disipativo con respecto a la tasa de suministros(u, y) = 1

2γ2‖u‖2−‖y‖2. La ganancia L2 de Σ se define como γ(Σ) = infγ|Σ tiene ganancia L2.

Se dice que Σ tiene ganancia L2 < γ si existe γ < γ tal que Σ tenga ganancia L2 < γ

Un resultado fundamental es el que relaciona la pasividad con la ganancia L2:

Proposicion 2.6.1. Si el sistema Σ es pasivo estrictamente a la salida, entonces tieneganancia L2 finita.

Page 44: Hamiltonians based Control

30 2.6. Pasividad y disipatividad

2.6.3 Interconexion de sistemas pasivos

Considerese la interconexion por realimentacion de los sistemas Σ1 y Σ2 como se presentaen la figura 2.4. Un resultado instrumental resulta del hecho de que la interconexion desistemas pasivos es tambien pasiva. Mas aun, la condicion de una realimentacion pasivaestrictamente a la salida conduce a la propiedad de ganancia L2 finita en bucle cerrado.

S1e1

e2

y2

u1 y1

u2+

+

+

-

S2

Figura 2.4: Interconexion por realimentacion de sistemas pasivos.

Proposicion 2.6.2. (i) Supongamos que Σ1 y Σ2 son pasivos o estrictamente pasivos a

la salida. Entonces el sistema en bucle cerrado ΣfΣ2,Σ2

de la la figura (2.4) con entradas(e1, e2) y salidas (y1, y2) es pasivo, y estrictamente pasivos a la salida si ambos Σ1 y Σ2

son estrictamente pasivos a la salida.

(ii)Supongase que S1, S2, que satisfacen las desigualdades de disipacion

S1(x1(t1))) ≤ S1(x1(t0))) +

∫ t1

t0

(u1(t)y1(t) − ε1‖y1‖2)dt

S2(x2(t1))) ≤ S2(x2(t0))) +

∫ t1

t0

(u2(t)y2(t) − ε2‖y2‖2)dt

con ε1 > 0, ε2 > 0 son C1 y tienen mınimos locales estrictos en x∗1 y x∗

2 respectivamente.

Entonces (x∗1, x

∗2) es un equilibrio estable de Σf

Σ2,Σ2con e1 = e2 = 0.

(iii) Supongase que Σ1 y Σ2 son estrictamente pasivos a la salida y detectables en el estadocero, y que las S1, S2 que satisfacen (2.6.2) son C1 y tienen mınimos locales estrictos enx∗

1 = 0 y x∗2 = 0 respectivamente. Entonces, (0, 0) es un equilibrio asintoticamente estable

de ΣfΣ2,Σ2

con e1 = e2 = 0. Si adicionalmente S1 y S2 tienen mınimos globales en x∗1 = 0

y x∗2 = 0 respectivamente, y son propias, entonces (0, 0) es un equilibrio globalmente

asintoticamente estable.

2.6.4 Atenuacion L2 de perturbaciones

En esta tesis se empleara el concepto de ganancia L2 para analizar el rechazo de pertur-baciones en sistemas hamiltonianos. Este concepto se basa en las tecnicas de pasividadestudiadas por A. Van der Shaft (Van der Schaft 2000), y ha sido desarrollado posterior-mente por (Shen, Mei, Lu & Tamura 1999). Sea el sistema de control no lineal descritocomo

x = f(x) + g1(x)u + g2(x)w (2.6.2)

Page 45: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 31

donde x ∈ IRn es vector de estado, u ∈ IRm el vector de control y w ∈ IRp una perturbaciondesconocida de norma acotada. Se define el problema de rechazo de perturbaciones L2

del siguiente modo: Dada una senal de penalizacion z = q(x), un nivel de atenuacionde las perturbaciones γ > 0, y un equilibrio deseado x∗ ∈ IRn, se trata de hallar unarealimentacion del estado u = α(x) y una funcion de almacenamiento V (x) definidapositiva en un entorno de x∗ tal que la desigualdad de disipacion–γ

V + Q(x) ≤ 1

2γ2‖w‖2 − ‖z‖2,∀w (2.6.3)

se cumpla a lo largo de todas las trayectorias del sistema en lazo cerrado (2.6.2) con la leyde control u = α(x), donde Q(x) ≥ 0 es una funcion no negativa dada. Como puntualizanBesancon et al. (Besancon & Battiloti 1998), el cumplimiento de (2.6.3) puede asegurarlos siguientes comportamientos:

• La ganancia L2 de la perturbacion w a la senal de penalizacion z es menor que elnivel dado (Van der Schaft 2000).

• El sistema en bucle cerrado es estable en el sentido de Lyapunov cuando w sedesvanece (tomese V (x) como funcion de Lyapunov, y es facil de ver, atendiendo a(2.6.3) que V ≤ 0). Mas aun el sistema en bucle cerrado es asintoticamente establesi Q(x) > 0.

• Existe una funcion ρ(c) de clase K∞ tal que para cualquier c > 0 y cualquiercondicion inicial V (x(0)) ≤ c, se cumple que

V (x(t)) ≤ c,∀t,∀‖w(t)‖ ≤ ρ(c).

Ahora considerese el siguiente sistema hamiltoniano con disipacion:x = (J(x) − R(x))∇H + g1(x)u + g2(x)w

z = h(x)gT1 (x)∇H

(2.6.4)

donde x ∈ IRn, u ∈ IRm, J(x) = −J(x)T , R(x) ≥ 0, H(x) es definida positiva en laproximidades del equilibrio estable del sistema no perturbado, h(x) es una matriz deponderacion y ∇H = ( ∂H

∂x1, ∂H

∂x2, .., ∂H

∂xn)T .

Si fijamos un nivel de atenuacion de perturbaciones γ > 0, y tomamos z = h(x)gT1 (x)∇H

como la senal de penalizacion se tiene el siguiente teorema

Teorema 2.6.3. (Wang, Cheng, Li & Ge 2002) Dado el sistema (2.6.4) y un nivelde atenuacion de perturbaciones γ > 0, si

R(x) − 1

2γ2[g2(x)gT

2 (x) − g1(x)gT1 (x)] ≥ 0,

entonces el problema de atenuacion de perturbaciones L2 admite la solucion dada por laley de realimentacion

u = −[1

2hT (x)h(x) +

1

2γ2Im

]gT1 (x)∇H (2.6.5)

Page 46: Hamiltonians based Control

32 2.7. Sistemas subactuados

donde Im es la matriz identidad de orden m. Ademas, la desigualdad de disipacion

H + (∇H)T

[R(x) − 1

2γ2(g2(x)gT

2 (x) − g1(x)gT1 (x))

]∇H ≤ 1

2γ2‖w‖2 − ‖z‖2, (2.6.6)

se cumple a lo largo de las trayectorias del sistema en bucle cerrado consistente en (2.6.4)y (2.6.5)

Dado que en el momento de redaccion de esta tesis este teorema no ha sido aun publicado,se expondran los detalles de la breve demostracion.

Demostracion. A partir de (2.6.4) y (2.6.5), es facil observar que

dH

dt= −(∇H)T R(x)∇H + (∇H)Tg1u + (∇H)T g2w

= −(∇H)T R(x)∇H − 1

2‖γw − 1

γgT2 ∇H‖2 +

1

2(γ2‖w‖2 − ‖z‖2)

+1

2(∇H)T g1h

T hgT1 ∇H − (∇H)Tg1(

1

2hT h +

1

2γ2Im) +

1

2γ2(∇H)Tg2g

T2 ∇H

= −(∇H)T

[R(x) − 1

2γ2g2(x)gT

2 (x) +1

2γ2g1(x)gT

1 (x))

]∇H

+1

2(γ2‖w‖2 − ‖z‖2) − 1

2‖γw − 1

γgT2 ∇H‖2.

Entonces

dH

dt+ (∇H)T

[R(x) − 1

2γ2(g2(x)gT

2 (x) − g1(x)gT1 (x))

]∇H

=1

2(γ2‖w‖2 − ‖z‖2) − 1

2‖γw − 1

γgT2 ∇H‖2 ≤ 1

2(γ2‖w‖2 − ‖z‖2)

que tiene la forma (2.6.6), dado que R(x)− 12γ2 [g2(x)gT

2 (x)− g1(x)gT1 (x)] ≥ 0, y por tanto

Q(x)= (∇H)

[R(x) − 1

2γ2(g2(x)gT

2 (x) − g1(x)gT1 (x))

]T

∇H ≥ 0

Por tanto la ley de control (2.6.5) es una solucion al problema de atenuacion de pertur-baciones L2 con funcion de Hamilton H(x).

2.7 Sistemas subactuados

Tal y como se comento en la seccion 1.4, el diseno de leyes de control para sistemas sub-actuados es un area objeto de una intensa labor investigadora. En esta tesis se presentancontribuciones para la resolucion de este tipo de problemas, y se estudia una clase de sis-temas subactuados para los cuales el diseno de controladores se simplifica notablemente.En esta seccion se hara una revision de los conceptos fundamentales subyacentes a lateorıa del control de sistemas subactuados, donde se enmarcan las tecnicas basadas en

Page 47: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 33

la energıa y la estructura hamiltoniana, y se aportara un breve repaso de las tecnicasexistentes destinadas a resolver problemas de esta naturaleza.

Formalmente se dice que son subactuados los sistemas de n grados de libertad y r < nactuadores cuyas ecuaciones de Lagrange toman la forma

d

dt

(∂L∂qi

)− ∂L

∂qi

= ui, i = 1 . . . r

d

dt

(∂L∂qi

)− ∂L

∂qi

= 0, i = r + 1 . . . n

En la descripcion hamiltoniana generalizada presentada en (2.3.2), un sistema subactuadoes aquel en el que el rango de la matriz de control G es inferior al numero de grados delibertad.

Al no poder actuar sobre el espacio articular completo, aparecen limitaciones en cuantoal conjunto de comportamientos que se pueden alcanzar en bucle cerrado. La primeracuestion en este sentido es determinar si un sistema es controlable en una region delespacio de estados.

2.7.1 Controlabilidad en sistemas subactuados

Se ha comentado que el problema de diseno de controladores para sistemas subactuadospuede abordarse de una manera general analizando la controlabilidad de los mismos. Eneste apartado se resumen los resultados clasicos fundamentales relativos a la controlabil-idad de sistemas lineales y no lineales, a fin de vislumbrar sus ventajas e inconvenientesy justificar, en este contexto, el empleo de estructuras hamiltonianas de control en buclecerrado.

En el caso de sistemas lineales, con estructura x = Ax + Bu, siendo x ∈ IRn el vectorestado y u ∈ IRp el de control, para determinar si un sistema es controlable en el origense calcula la matriz de controlabilidad,

C = [B,AB,A2B, ..., An−1B]

Un resultado sobradamente conocido afirma que el sistema es controlable si y solo si elrango de C es igual a n, el orden del sistema. En el caso de sistemas no lineales elproblema se mantiene abierto y el resultado mas conocido es la condicion suficiente decontrolabilidad en el origen de Sussman (Rampazzo & Sussmann 2001), para determinarsi un sistema no lineal de la forma

x =m∑

i=1

uifi(x) +r∑

j=1

vjgj(x), i = 1 . . . m, j = 1 . . . r

con restricciones en el control, es controlable desde un conjunto de condiciones inicialesΩ en tiempo pequeno hacia el origen. Las condiciones enunciadas en (Rampazzo &Sussmann 2001) no son constructivas en el sentido de que aun cumpliendose, no pro-porcionan metodos para disenar la ley de control que lleve el sistema al origen. Tambienson de gran utilidad y generalidad para determinar la controlabilidad de sistemas subac-tuados los resultados de Isidori (Isidori 1989, Marino & Tomei 1995) que proporcionan

Page 48: Hamiltonians based Control

34 2.7. Sistemas subactuados

la condicion necesaria y suficiente para que un sistema no lineal con entrada unica, de laforma

x = f(x) + g(x)u, x ∈ IRn, u ∈ R (2.7.1)

admita una transformacion de coordenadas z = T (x), T (0) = 0 y una ley de control

u = k(x) + β(x)v, k(0) = 0, β(x) = 0,∀x ∈ IRn

que transformen el sistema en la forma canonica lineal de Brunovski,

z =

0 1 0 . . . 0

0 0 1 . . . 0...

......

. . ....

0 0 0 . . . 1

0 0 0 . . . 0

z +

0

0...

0

1

v = Acz + bcv, z ∈ IRn (2.7.2)

que es una forma lineal controlable. En este caso diremos que el estado del sistema eslinealizable por realimentacion. Si las condiciones se cumplen de forma global, entonces elestado del sistema es globalmente linealizable por realimentacion. En un caso de sistemassubactuados este resultado no proporciona explıcitamente la ley de control ni la trans-formacion z = T (x). Mas aun, la controlabilidad es posible en sistemas que no cumplenestas condiciones, como se estudiara en esta tesis.

Para evitar las estrictas condiciones de la linealizacion por realimentacion, ası comola inconveniencia de no proporcionar elementos constructivos para el diseno de la ley decontrol, se han desarrollado nuevas lıneas de investigacion entre las que podemos destacarel trabajo de (Spong 1997) consistente en la linealizacion parcial en sistemas mecanicossubactuados. El sistema (2.7.1) es linealizable parcialmente si existe una ley de controlu = k(x) + β(x)v y un cambio de coordenadas z = T (x) tal que es equivalente al sistemaparcialmente lineal

ξ = ϕ(ξ, z), ξ ∈ IRn−r

z =

0 1 0 . . . 0

0 0 1 . . . 0...

......

. . ....

0 0 0 . . . 1

0 0 0 . . . 0

z +

0

0...

0

1

v, z ∈ IRr

La estabilidad de los sistemas parcialmente linealizables depende del estudio asintoticodel subsistema ξ de orden n− r cuando z tiende a cero, conocido como dinamica cero. Sies estable, se dice que el sistema completo es de fase mınima.

Otra definicion importante desde el punto de vista entrada–salida es grado relativo delsistema. Este se define como el numero de veces que hay que derivar la salida con respectoal tiempo para que aparezca explıcitamente la ley de control. Por ejemplo

x1 = x2

x2 = u + x21 − x3

x3 = −x1

y = −x3

Page 49: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 35

Si derivamos dos veces la salida y se tiene

y = u + x21 − x3,

en cuyo caso la ley de control u = x21 − x3 + v produce la relacion entrada–salida lineal

y = u y el sistema es controlable. En general todo sistema de grado relativo r bien definidoen un conjunto en torno al origen es linealizable en sentido entrada–salida mediante unaley de realimentacion del tipo u = k(x) + β(x)v dando lugar al sistema lineal controlable

y(r) = v

Todas las condiciones para los resultados anteriores pueden ser consultadas en detalleen (Marino & Tomei 1995).

2.7.2 Metodos de sıntesis que preservan la estructura hamiltoniana/lagrangianaen bucle cerrado

Existen en la literatura del control un gran numero de ejemplos de sistemas subactuadosque sin ser candidatos a la linealizacion por realimentacion ni verificar las condiciones deSussman, pueden ser estabilizados en tiempo pequeno mediante leyes de control disenadaspor procedimientos relativamente sistematicos. Para abordar este tipo de problemas sehan desarrollado tecnicas de control como las basadas en la estructura hamiltoniana ylagrangiana en bucle cerrado que se comentaran a continuacion y seran objeto de estudiodetallado en esta tesis.

Metodo IDA-PBC

El metodo basado en pasividad conocido como Interconnection and Damping Assignment–Passivity Based Control o IDA-PBC fue introducido en (Ortega & Spong 2000). Esencial-mente consiste en partir de una estructura PCH en bucle abierto y obtener otra en buclecerrado con las propiedades de estabilidad deseadas. Igualando las ecuaciones de bucleabierto y del sistema deseado se obtiene la ley de control. En el capıtulo 4 se estudiaraen detalle la aplicacion del metodo a sistemas mecanicos subactuados. Sin embargo, lafilosofıa del mismo no es mas que la busqueda de una funcion de energıa y una estructurahamiltoniana para el sistema en bucle cerrado tal y como se describio en el capıtulointroductorio.

El metodo IDA-PBC persigue una dinamica en bucle cerrado con funcion de HamiltonHd(q, p) y una matriz antisimetrica tambien llamada de interconexion generalizada de laforma Jd(q, p) = −Jd(q, p)T que permite aumentar los grados de libertad en el diseno. Lasecuaciones de estado en lazo abierto y cerrado se deben ajustar exactamente. Esto quieredecir que la ley de control u debe calcularse de modo que[

q

p

]= (Jd − Rd)

[∂Hd

∂q∂Hd

∂p

]=

[0 I2

−I2 0

][∂H∂q∂H∂p

]+ Gu. (2.7.3)

donde Rd(q) ≥ 0 la matriz de disipacion en bucle cerrado. Las principales dificultadesde este metodo aparecen en en el caso de sistemas subactuados, donde el conjunto de

Page 50: Hamiltonians based Control

36 2.7. Sistemas subactuados

funciones de Hamilton Hd alcanzables en bucle cerrado es limitado, y depende de laresolubilidad de un sistema de ecuaciones diferenciales parciales. En efecto, en el casosubactuado existe una matriz G⊥ de rango r < n siendo n el numero de grados de libertad,que represente las direcciones en las que la ley de control no tiene efecto, cumpliendoseque

G⊥G = 0,

es decir, si G es una matriz constante, las filas de G⊥ forman el nucleo de G. Si premul-tiplicamos (2.7.3) por G⊥ se obtiene

G⊥(Jd − Rd)

[∂Hd

∂q∂Hd

∂p

]= G⊥

[0 I2

−I2 0

][∂H∂q∂H∂p

]. (2.7.4)

Esta ecuacion ha de cumplirse para cualquier valor de la ley de control, y por lo tantorepresenta una restriccion en el conjunto de sistemas hamiltonianos alcanzables en buclecerrado definidos por las matrices (Hd, Jd, Rd). Una correcta eleccion de los parametros(Hd, Jd, Rd) debe ser compatible con estas ecuaciones de ajuste y al mismo tiempo rep-resentar una dinamica en bucle cerrado con las propiedades deseadas en terminos deestabilidad. Proporcionar metodos de calculo de las (Hd, Jd, Rd) adecuadas y de leyesde control para el ajuste bucle abierto-bucle cerrado es la esencia del metodo IDA-PBC.En esta tesis se haran aportaciones esenciales al metodo y se aplicara a la resolucion deproblemas clasicos de control subactuado.

Metodo de los lagrangianos controlados

Paralelamente a la publicacion del metodo IDA-PBC, el grupo de Bloch, Leonard y Mars-den ha desarrollado en una serie de artıculos el metodo de “Lagrangianos Controlados”,del que se expondran sus fundamentos. Dado un sistema mecanico, descrito por las ecua-ciones

d

dt

(∂L∂qi

)− ∂L

∂qi

= ui, i = 1 . . . n (2.7.5)

donde, eventualmente, algunos de los terminos de control ui pueden ser nulos, se proponeun conjunto alcanzable de Lagrangianos controlados Lc y una ley de control tales que lassoluciones q(t) de las trayectorias en bucle cerrado sean tambien las trayectorias de

d

dt

(∂Lc

∂qi

)− ∂Lc

∂qi

= 0, i = 1 . . . n (2.7.6)

En (Bloch, Leonard & Marsden 2000) se enuncia un teorema que establece las condicionesque debe cumplir dicho conjunto de lagrangianos controlados. Este resultado, conocidocomo matching theorem o teorema de ajuste se resumira a continuacion. En la notacion de(Bloch et al. 2000), los lagrangianos en bucle abierto y cerrado toman, respectivamente,la forma

L(q, q) =1

2gij(q)q

iqj − V (q)

Lc(q, q) =1

2gij(q)q

iqj − V (q)

donde gij Y gij representan los elementos de la matriz de inercia en bucle abierto y cerrado,respectivamente. El hecho de que (2.7.5) sea subactuado implica la existencia de una

Page 51: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 37

variedad no nula denominada subespacio de las direcciones no actuadas. La proyeccionen este espacio se representa por Λi

Aui = 0 (A = 1 . . . m). Empleando los sımbolos de

Christoffel Γijk y ˜Gamma

i

jk de las matrices gij y gij, y se define

T ijk = Γi

jk − Γijk

hji = gikg

jk

hji = gikg

jk

Tijk = hpi h

qjh

rkgpnT

nqr

donde gij y gij representan las inversas de gij y gij, respectivamente. Entonces el teoremade ajuste afirma que Lc cumple (2.7.6) sı y solo si las siguientes condiciones se satisfacen(Hamberg 1999)

ΛiAgilT

ljk ≡ 0

ΛiAhj

i

∂V

∂qj≡ Λi

A

∂V

∂qi

En este caso la ley de control para lograr (2.7.6) en bucle cerrado es

ui =∂V

∂qi− hj

i

∂V

∂qj− gilT

ljkq

j qk

Este metodo tambien comprende la adicion de un termino de amortiguamiento para lograrla estabilidad asintotica de sus equilibrios.

2.7.3 Inmersion e invariancia

Los metodos de control de sistemas subactuados mediante el ajuste (matching) de unadinamica hamiltoniana (lagrangiana) en bucle abierto con otra dinamica, tambien hamil-toniana (lagrangiana) en bucle cerrado con las deseadas propiedades de estabilidad, tienenla ventaja de abordar el problema de forma relativamente sistematica. Sin embargo en-contrar leyes de ajuste exactas a menudo es una tarea difıcil, y suele implicar la resolucionde ecuaciones diferenciales parciales para las cuales, segun la complejidad de cada caso,puede no existir una solucion explıcita.

Un metodo para relajar las estrictas condiciones de ajuste, que introduce apreciablesgrados de libertad en el diseno, consiste en determinar una dinamica objetivo y hallaruna ley de control tal que la dinamica en bucle cerrado se ajuste asintoticamente a dichosistema objetivo. En la practica la dinamica objetivo es de dimension inferior a la delsistema en bucle abierto. Esta idea se subsume en el metodo de Inmersion e Invarian-cia introducido por (Astolfi & Ortega 2001) y cuyo resultado fundamental se enuncia acontinuacion

Proposicion 2.7.1. Considerese el sistema

x = f(x) + g(x)u, (2.7.7)

con variables de estado x ∈ IRn y senal de control u ∈ IRm, con un punto de equilibrio x∗ ∈IRn para ser estabilizado. Sea p < n y supongamos que podemos encontrar aplicacionesα : IRp → IRp,π : IRp → IRn,c : IRp → IRm, φ : IRn → IRn−p, ψ : IRn×(n−p) → IRm talesque:

Page 52: Hamiltonians based Control

38 2.7. Sistemas subactuados

(H1) (Sistema objetivo) El sistema

ξ = α(ξ), (2.7.8)

con ξ ∈ IRp, tienen un equilibrio globalmente asintoticamente estable en ξ∗ ∈ IRp yx∗ = π(ξ∗).

(H2) (Condicion de inmersion ) Para todo ξ ∈ IRp

f(π(ξ)) + g(π(ξ))c(ξ) =∂π

∂ξα(ξ) (2.7.9)

(H3) (Variedad implıcita) Se cumpla la identidad de conjuntos

x ∈ IRn | φ(x) = 0 = x ∈ IRn | x = π(ξ), ξ ∈ IRp (2.7.10)

(H4) (Atractividad de la variedad y acotamiento de las trayectorias ) El sistema

z =∂φ

∂x(f(x) + g(x)ψ(x, z)) (2.7.11)

con variables de estado z, tiene un equilibrio globalmente asintoticamente estable encero, uniformemente en x. Ademas, las trayectorias del sistema

x = f(x) + g(x)ψ(x, z) (2.7.12)

estan acotadas para todo t ∈ [0,∞).

Entonces, x∗ es un equilibrio globalmente asintoticamente estable del sistema en buclecerrado x = f(x) + g(x)ψ(x, φ(x)).

2.7.4 Control de sistemas en cascada mediante backstepping

Una tecnica de gran utilidad en una clase de sistemas subactuados y en general en sis-temas con estructura triangular es la conocida como backstepping, (Khalil 1996, Krstic,Kanellakopoulos & Kokotovic 1995, Sepulchre, Jankovic & Kokotovic 1997). Para ilustrarsus fundamentos, considerese la siguiente clase de sistemas de orden n

η1 = f(η) + g(η)ξ (2.7.13)

ξ = u, (2.7.14)

donde η = (η1, η2 . . . ηn−1) ∈ IRn−1 y ξ ∈ IR. Supongamos que existe una ley de controlξ = u0(η) que estabiliza al subsistema (2.7.13) en el origen de modo que el sistema

η = f(η) + g(η)u0(η)

es estable en el origen con funcion de Lyapunov V0 tal que

V0 = ∇ηV0(f(η) + g(η)u0(η)) ≤ 0.

Page 53: Hamiltonians based Control

Capıtulo 2. Fundamentos teoricos y estado de la tecnica 39

siendo W (η) una funcion definida positiva excepto en el origen. Si sumamos y restamosg(η)u0(η) al segundo miembro de la ecuacion (2.7.13) se tiene

η = f(η) + g(η)u0(η) + g(η)ξ − g(η)u0(η)

= f(η) + g(η)u0(η) + g(η)(ξ − u0(η))

= f(η) + g(η)u0(η) + g(η)z,

donde se ha introducido la variable de error z= ξ − u0(η). Derivando respecto al tiempo

z = ξ −∇ηu0(η)η.

Si definimos v = z y recordamos que u = ξ entonces

u = ∇ηu0(η)η + v. (2.7.15)

Empleando la variable z, las ecuaciones anteriores pueden escribir como

η = f(η) + g(η)u0(η) + g(η)z (2.7.16)

z = v (2.7.17)

Proponiendo para este sistema la funcion de Lyapunov

V1 = V0 +1

2z2 (2.7.18)

se obtiene

V1 = ∇ηV0η + zz

= ∇ηV0(f(η) + g(η)u0(η)) + ∇ηV0g(η)z + zv

≤ −W (η) + ∇ηV0g(η)z + zv.

Con el fin de lograr que V1 sea una funcion de Lyapunov del sistema completo se hara laeleccion

v = −(∇ηV0g(η) + kz),

lo que equivale a

u = ∇ηu0(η)η − (∇ηV0g(η) + kz)

= ∇ηu0(η)(f(η) + g(η)ξ) −∇ηV0g(η) − k(ξ − u0(η)) (2.7.19)

que es la ley de realimentacion para el sistema (2.7.13)-(2.7.14). Con esta ley

V1 = ∇ηV0(f(η) + g(η)u0(η)) − kz2 ≤ −W (x) − kz2 ≤ 0. (2.7.20)

Esta tecnica se puede extender trivialmente a sistemas de orden mayor.

El metodo backstepping, inicialmente formulado para resolver problemas de estabi-lizacion de equilibrios, se extendera en esta tesis a la estabilizacion de orbitas periodicas.

Page 54: Hamiltonians based Control

40 2.7. Sistemas subactuados

Page 55: Hamiltonians based Control

Capıtulo 3

Control de una plataformagiroestabilizada de dos grados delibertad

En este capıtulo se abordara el problema de control basado en pasividad para sistemashamiltonianos completamente actuados y se planteara el problema de la implementacionde un controlador realizado mediante estas tecnicas en una plataforma de dos grados delibertad sobre base movil. Este tipo de plataformas se emplea en aplicaciones de roboticamovil y muchas otras en las que se desea incorporar antenas, camaras o sensores externosdel tipo sonar, radar, telemetro, infrarrojos y similares donde la lınea de mira del sensorha de mantenerse estable frente a los movimientos del vehıculo donde se asienta. Ensistemas de navegacion tienen su aplicacion en los equipos que han de mantener contactovisual estable con elementos externos al buque, como pueden ser los receptores GPS,antenas parabolicas para comunicaciones vıa satelite (por ejemplo, inmarsat), deteccionde obstaculos, faros, puntos de referencia en la costa y por ultimo en aplicaciones militarescomo sistemas de defensa antiaerea.

En todos estos casos la medida del sensor puede verse degradada por el movimientoaleatorio de la superficie sobre la que se asienta. En la superficie del buque el oleaje,relativamente lento, provoca unas velocidades angulares en todas las direcciones del triedrode referencia, siendo posible compensarlos con actuadores lentos (motores electricos ohidraulicos) mediante la correcta realimentacion de la velocidad angular. En el casode plataformas de sensores instaladas sobre vehıculos terrestres, como es el caso de lascamaras montadas sobre vehıculos autoguiados, la perturbacion que obliga al vehıculo y laplataforma de sensores montada sobre el a a abandonar el movimiento inercial, varıa conmas celeridad y por tanto es necesario contar con actuadores veloces como pueden ser losde tipo neumatico y leyes de realimentacion rapidas que deben ser disenadas con mayorrefinamiento para mantener margenes de fase aceptables evitando posibles situaciones deinestabilidad y oscilaciones.

3.1 Sensores empleados en control inercial

Una gran variedad de robots moviles, vehıculos autonomos y otros sistemas realizan unanavegacion basada en la percepcion interna de las velocidades angulares y aceleraciones

41

Page 56: Hamiltonians based Control

42 3.1. Sensores empleados en control inercial

a las que estan sometidos. Se dice que son medidas internas por no basarse en ningunainteraccion con el exterior como serıa el caso de los de sonares, que pueden proporcionarmedidas fiables del vector velocidad y aceleracion pero siempre basandose en una inter-accion (en este caso reflexion) con el entorno.

Los sensores que se aplican en este tipo de sistemas son los denominados inerciales.Estos sensores se destinan a medir las derivadas de las variables de posicion del robot.Uno de los primeros usos de sensores inerciales pueden encontrarse en el trabajo delgrupo aleman Peenemunde. El Vergeltungswaffe V1 (arma de venganza) era una aeronaveautonoma que se basaba en el guiado inercial. Con un rango operacional de 200 km, el V1se asentaba en multiples sensores inerciales para guiar el arma hacia el objetivo. El V1debıa viajar en una direccion determinada, a una altitud especıfica, durante una tiempoy distancia determinados. La realimentacion de los sensores inerciales de este dispositivopermitıan evaluar las pequenas desviaciones respeto a la trayectoria prevista y actuar enconsecuencia.

Por el principio de relatividad de los sistemas inerciales, la velocidad lineal no es unparametro fısico directamente medible sin que medie interaccion alguna con el entorno(una astronave no debe experimentar ningun cambio fısico relacionado con su velocidadrespecto a la tierra). Por esta razon los sensores inerciales estan destinados a la medidade fenomenos de aceleracion, entre los que estan la velocidad angular del solido y laaceleracion lineal. Generalmente nos encontramos dos tipos de sensores.

M

Muelles

Masa

Sensor dedesplazamiento

Dirección deaceleración

Figura 3.1: Funcionamiento de un acelerometro lineal.

• Acelerometros Proporcionan una medida de la aceleracion en lineal proyectadaen una direccion del movimiento como se describe en la figura 3.1.

• Giroscopos Son empleados para medir velocidades angulares, en torno a un ejefijo. Pueden ser opticos, relacionados con la fısica del la luz sometida a aceleracion,y mecanicos en los que un disco sometido a un giro constante, sufre una torsioncuando el sistema de referencia en el que se sustenta posee cierta velocidad angular.

El principio de funcionamiento del giroscopo mecanico admite una sencilla interpretacionausente de toda terminologıa matematica. Este instrumento se representa esquematicamentela figura 3.2 mediante cuatro masas puntuales A,B,C,D en lugar del disco completo que seemplea habitualmente. Estas masas representan las areas del disco que mas importantesa la hora de visualizar el funcionamiento del giroscopo.

Page 57: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 43

El punto inferior del eje se mantiene estacionario pero puede pivotar en todas di-recciones. Cuando una fuerza de torsion se aplica al eje superior, el punto A sube y Cdesciende (figura a). Al estar el giroscopo en rotacion en sentido horario, el punto ocuparael lugar del B tras un giro de π/2 rads. Lo mismo sucede para los puntos C y D. El puntoA esta aun desplazandose hacia arriba cuando se encuentra a π/2 rads en la (figura b), yel punto C viajara hacia abajo. El movimiento combinado de A y C hace que el eje roteen el plano de precesion hacia la derecha (figura b). Este fenomeno recibe el nombre deprecesion.

Figura 3.2: Funcionamiento de un giroscopo mecanico.

El eje de un giroscopo se moverıa en angulo recto respecto del movimiento de rotacion,en este caso a la derecha. Si el giroscopo rotara en sentido antihorario, el eje se moverıaen el plano de precesion hacia la izquierda. Si en el ejemplo de giro horario la fuerzade torsion tirara en lugar de empujar, la precesion serıa hacia la izquierda. Cuando elgiroscopo ha rotado otros π/2 rads (figura c), el punto C se encontrara donde estaba Aen el momento inicial de aplicacion de la fuerza de torsion. El movimiento hacia abajode C es ahora contrario a la fuerza de torsion y el eje no rota en el plano de la fuerza detorsion .

Mientras mayor sea la fuerza de torsion sobre el eje, mas empujara el disco en el ladoopuesto al eje hacia su posicion inicial. De hecho, el eje rotara en el plano de torsion eneste ejemplo. El eje rotara porque parte de la energıa en los mivimientos arriba y abajode A y C se emplea en cusar que los ejes roten en el plano de precesion. Entonces cuandolos puntos A y C finalmente dan la vuelta hasta el lado contrario, la fuerza de torsion(constante) es mayor que las fuerzas de reaccion verticales. La propiedad de precesion deun giroscopo se emplea para mantener los trenes monorrail verticales al tomar las curvas.Un cilindro hidraulico empuja y tira, segu se necesite, en un eje de un pesado giroscopo.

3.2 Descripcion de la plataforma inercial

El sistema que se desea controlar es la plataforma de dos grados de libertad representadaen la figura 3.3. Se compone de dos cuerpos principales: La base, que contiene dos motoresde corriente continua sin escobillas y esta sometida al movimiento de acimut. Su posicionviene dada por el angulo de acimut ϕ. La cabeza de sensores, montada sobre la base,gira solidaria con esta, y posee ademas un movimiento en elevacion en torno a un ejehorizontal que corta al eje de acimut. El angulo que determina la posicion de la cabezaes θ, la elevacion.

La cabeza del pedestal posee los sensores inerciales. Dos giroscopos opticos orienta-dos perpendicularmente proporcionan las siguientes medidas (suponiendo que la base se

Page 58: Hamiltonians based Control

44 3.3. Modelo de la plataforma

asienta sobre un sistema de referencia inercial):

• La velocidad angular de elevacion: θ

• La velocidad angular de acimut proyectada sobre la lınea de mira, es decir ϕ cos θ.La velocidad angular de orientacion se obtendra dividiendo la medida del giroscopode elevacion por el coseno de la elevacion. Esto se debe a que ambos giroscoposestan montados sobre la cabeza, es decir, el cuerpo de elevacion, y por tanto estansometidos a sus movimientos.

Este montaje con los dos giroscopos en el cuerpo de elevacion habitual en la practicapor dos razones: a menudo los fabricantes proveen dos estaciones giroscopicas integradascapaces de medir dos ejes y por tanto ambos deben estar en uno de los dos cuerpos; porotro lado, si la intencion es la de estabilizar la lınea de mira de la elevacion (para lacorrecta operacion de una antena o camara), cuando se alcance el objetivo mediante estemontaje ambos sensores daran una medida nula.

A menudo, a fin de reducir el consumo de los motores, se equilibra la cabeza delpedestal mediante resortes, de modo que cualquier posicion de elevacion es una posicion deequilibrio, quedando anulados los efectos gravitatorios. De este modo la energıa potenciales invariante y por tanto desaparece de las ecuaciones de movimiento. Esta tecnica tienecomo contrapartida la inexactitud en el modelado.

El origen del angulo de acimut es arbitrario. La variable de elevacion toma el valorcero cuando la lınea de mira de la cabeza es perpendicular al eje de rotacion de la base.

z

x

y

x

y z

θ

φ

Figura 3.3: Plataforma de dos grados de libertad.

3.3 Modelo de la plataforma

Las ecuaciones de movimiento se obtienen facilmente tanto en forma hamiltoniana comolagrangiana. Bajo las suposiciones expresadas previamente, y situada en un sistema de

Page 59: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 45

referencia inercial, la energıa mecanica de la planta se ve reducida al termino de energıacinetica:

T =1

2[ϕ θ]

[Γ(θ) 0

0 Iyy2

][ϕ

θ

](3.3.1)

que coincide con las funciones de Lagrange y de Hamilton al mismo tiempo. EL terminoΓ(θ) representa la expresion

Γ(θ)= Izz1 + Ixx2sen

2θ + Izz2 cos2 θ, (3.3.2)

donde Izz1 es el momento de inercia de la base con respecto al eje z; mientras que Ixx2 , Iyy2

y Izz2 representan los momentos de inercia con respecto a los ejes x,y y z respectivamente.

3.4 Control hamiltoniano

Al ser un sistema completamente actuado, podemos imponer cualquier estructura deseadaen bucle cerrado, optando la estructura lineal con matriz de inercia constante donde losdos grados de libertad aparecen desacoplados. Al imponer estructura hamiltoniana linealen bucle cerrado, se obtendra una ley de realimentacion que cancele las no linealidades,los terminos de acoplamiento y la friccion existente.

A continuacion se anadira un termino de amortiguamiento para que la funcion deHamilton tienda asintoticamente hacia una posicion estable con velocidad cero. Losterminos de friccion anadidos pueden verse como la disipacion controlada que evita que elsistema permanezca indefinidamente en una orbita donde el hamiltoniano permanecieraconstante (se obtendrıa un sistema conservativo respecto a Hd). Por tanto, las configu-raciones de mınima energıa Hd seran las configuraciones en regimen permanente para laplataforma. Posteriormente estudiaremos como es posible seleccionar el equilibrio objeti-vo arbitrariamente y disenar la funcion de Hamilton de modo que el mımimo de energıacoincida con el punto de referencia deseado.

De lo anterior se desprende que la manera de especificar el comportamiento deseadoconsiste en dar forma a la funcion de Hamilton en bucle cerrado, de manera que estapresente un mınimo absoluto en el equilibrio que se desea estabilizar con velocidad cero,y ausencia de otros mınimos locales. Al anadir al sistema amortiguamiento mediante untermino de friccion viscosa, el sistema perdera gradualmente su energıa y convergera almınimo donde se encuentra el objetivo.

La tecnica conocida como moldeo de energıa consiste en calcular una accion de con-trol que modifique la dinamica del sistema de modo que en bucle cerrado se obtenga ladinamica hamiltoniana deseada, y anadir un efecto disipativo respecto a la funcion deHamilton moldeada. De este modo la energıa en bucle cerrado puede ser consideradacomo funcion de Lyapunov del equilibrio estabilizado. Para obtener la ley de control,basta con despejarla del ajuste entre las ecuaciones de bucle abierto y cerrado. En el casode sistemas completamente actuados, esto no representa ningun problema y no existenrestricciones en cuanto a la dinamica objetivo (manteniendo del orden del sistema). Sinembargo, como se vera a continuacion, el ajuste ha de realizarse en el sistema de coorde-nadas adecuado, si se desea especificar con libertad la matriz de inercia de la estructurahamiltoniana en bucle cerrado.

Page 60: Hamiltonians based Control

46 3.4. Control hamiltoniano

Recordando la ecuacion (3.3.1), la energıa mecanica total del sistema vendra dada por

H =1

2

[p2

1

m1(q)+

p22

m2(q)

]=

1

2

[p2

1

Γ(θ)+

p22

Iyy2

](3.4.1)

donde m1 y m2 representan las constantes de inercia efectivas asociadas a cada movimientode rotacion. La ecuacion (3.4.1) expresada en la base (q, q) se convierte en

H =1

2

[m1(q)q

21 + m2(q)q

22

]=

1

2

[Γ(θ)ϕ2 + Iyy2 θ

2]

Definiendo q = [q1 q2]T y p = [p1 p2]

T , la formulacion hamiltoniana del sistema en bucleabierto en la base (q, p) resulta[

q

p

]=

[0 I2

−I2 −K

][∂H∂q∂H∂p

]+

[O2

I2

][uϕ

](3.4.2)

donde I2 es la matriz identidad de segundo orden, y K = diagk1, k2 es la matrizconstante de friccion viscosa.

Dado que q = [q1 q2]T , introducimos el cambio de base φ : (q, p) → (q, q) de modo que

el jacobiano de la transformacion ∂φ∂x

resulta

∂φ

∂x=

1 0 0 0

0 1 0 0

0 −p1

Γ(θ)2Γ′(θ) Γ−1(θ) 0

0 0 0 I−1yy2

(3.4.3)

Con estos elementos la formulacion hamiltoniana en la nueva base se obtiene directamente:

d

dt

[q

q

]=

(∂φ

∂x

)[0 I2

−I2 −K

](∂φ

∂x

)T[

∂H∂q∂H∂p

]+

(∂φ

∂x

)[O2

I2

][uϕ

](3.4.4)

lo cual, aplicado a la plataforma, conduce a:

d

dt

ϕ

θ

ϕ

θ

=

0 0 Γ−1(θ) 0

0 0 0 I−1yy2

−Γ−1(θ) 0 − k1

Γ2(θ)−βϕ

0 −I−1yy2

βϕ − k2

I2yy2

∂H∂ϕ∂H∂θ∂H∂ϕ∂H∂θ

+

0 0

0 0

Γ−1(θ) 0

0 I−1yy2

[

]

(3.4.5)donde el termino β se ha definido del siguiente modo

β(θ)=

I−1yy2

Γ(θ)Γ′(θ) (3.4.6)

Con el fin de expresar el sistema deseado en bucle cerrado como un par de sistemaslineales desacoplados, deberıamos en primer lugar proponer la funcion de energıa deseadaHd como aquella en la que el termino de acoplamiento Γ(θ) es reemplazado por una ΓC

constante

Hd =1

2

[Γcϕ

2 + Iyy2 θ2]

(3.4.7)

Page 61: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 47

y a continuacion se expresaran las correspondientes ecuaciones de Hamilton como un parde sistemas lineales de segundo orden independientes con disipacion. A fin de lograrque el sistema lineal transformado siga una referencia en posicion o velocidad, la friccionexistente en las articulaciones seran compensadas por el controlador y se anadira untermino de friccion viscosa para lograr un descenso con el tiempo de la energıa Hd y portanto la estabilidad asintotica del equilibrio deseado.

La formulacion en bucle cerrado se convierte en:

d

dt

ϕ

θ

ϕ

θ

=

0 0 Γ−1c 0

0 0 0 I−1yy2

−Γ−1c 0 −Kc1

Γ2c

0

0 −I−1yy2

0 −Kc2

I2yy2

∂Hd

∂ϕ∂Hd

∂θ∂Hd

∂ϕ∂Hd

∂θ

(3.4.8)

Las derivadas parciales de Hd se obtienen de la ecuacion (3.4.7). La ley de control secalcula igualando la dinamica en bucle abierto (3.4.5) y la de bucle cerrado (3.4.8). Enestas circunstancias las primeras dos filas resultan

Γ−1(θ)∂H

∂ϕ= Γc

∂Hd

∂ϕ⇒ ϕ = ϕ

I−1yy2

∂H

∂θ= I−1

yy2

∂Hd

∂θ⇒ θ = θ (3.4.9)

mientras que de las dos ultimas se obtiene

Γ−1(θ)(−k1ϕ − Γ′(θ)θϕ + uϕ

)= −Kc1

Γc

ϕ (3.4.10)

I−1yy2

(1

2Γ′(θ)ϕ2 − k2θ + uθ

)= −Kc2

Iyy2

θ (3.4.11)

A partir de las ecuaciones (3.4.10),(3.4.11) se deducen las leyes de control:

uϕ = Γ′(θ)ϕθ + k1ϕ − Kc1Γ(θ)Γ−1c ϕ︸ ︷︷ ︸

uθ = −1

2Γ′(θ)ϕ2 + k2θ − Kc2θ︸︷︷︸ (3.4.12)

En esta expresion los terminos subrayados representan la accion de control que ha deanadirse para crear al efecto de friccion deseado en el sistema linealizado.

3.4.1 Eleccion de un punto de equilibrio arbitrario

Si el punto de equilibrio viene especificado como (ϕd, θd), propondremos una funcion deHamilton en bucle cerrado con un mınimo en dicho punto. Una opcion evidente sera unafuncion cuadratica del error y la velocidad

Hd =1

2(Γcϕ

2 + Iyy2 θ2) +

1

2(Kd1(ϕ − ϕd)

2 + Kd2(θ − θd)2)︸ ︷︷ ︸

Ha

(3.4.13)

Page 62: Hamiltonians based Control

48 3.4. Control hamiltoniano

Donde el termino denotado por Ha, representa la energıa anadida al sistema con respectoal de la ecuacion Eq.(3.4.7). Esta funcion es tal que:

∂Ha

∂qi

= 0 i = 1, 2, (3.4.14)

siempre que la referencia sea puntual, y dado que

∂Ha

∂ϕ= Kd1(ϕ − ϕd)

∂Ha

∂θ= Kd2(θ − θd). (3.4.15)

Procediendo de manera equivalente a la obtencion de la ecuacion (3.4.12) se llega a

uϕ = Γ′(θ)ϕθ︸ ︷︷ ︸A

+ k1ϕ︸︷︷︸B

−ΓΓ−1c Kc1ϕ︸ ︷︷ ︸

C

−ΓΓ−1c Kd1(ϕ − ϕd)︸ ︷︷ ︸

D

uθ = − 1

2Γ′(θ)ϕ2︸ ︷︷ ︸

A

+ k2θ︸︷︷︸B

−Kc2θ︸︷︷︸C

−Kd2(θ − θd)︸ ︷︷ ︸D

(3.4.16)

Donde los terminos de la ley de control no lineal pueden ser agrupados en funcion de susignificado fısico:

• (A) Moldeo de la energıa cinetica para eliminar los efectos de acoplamiento entrearticulaciones

• (B) Compensacion de la friccion real del sistema

• (C) Introduccion de friccion en el sistema hamiltoniano objetivo

• (D) Control proporcional del error, derivado del moldeo de energıa potencial

Si definimos el error de seguimiento como e = [eϕ eθ]T donde eϕ = (ϕ − ϕd) and

eθ = (θ − θd) y suponemos que la referencia se mantiene constante se obtiene:

uϕ = Γ′(θ)ϕθ + k1ϕ − ΓΓ−1c (Kc1eϕ − Kd1eϕ)︸ ︷︷ ︸

PD−acimut

uθ = −1

2Γ′(θ)ϕ2 + k2θ − Kc2eθ − Kd2eθ︸ ︷︷ ︸

PD−elevacion

(3.4.17)

Esta es la ley de control que se implementara.

Cabe senalar que los ultimos dos terminos de la senal de control pueden interpretarsecomo un controlador PD al ser una realimentacion el error en posicion y su derivada, pro-porcionando ganancias de ajuste independientes (Kc1, Kc2, Kd1, Kd2) que permiten obtenerun transitorio optimo. El termino Γ(θ) multiplicando al PD en acimut hace que se tratede un PD no lineal, que permite un ajuste del transitorio homogeneo en todas las regionesde trabajo.

Page 63: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 49

3.4.2 Estabilidad segun Lyapunov

De lo visto anteriormente es facil comprobar que la funcion de energıa es una funcion deLyapunov del sistema en bucle cerrado. En efecto, la derivada con respecto al tiempo deHd es

Hd = (∇H)T x = −(Γcϕ)2Kc1 − (Iyy2 θ)2Kc2 ≤ 0 (3.4.18)

Proposicion 3.4.1. El sistema (3.4.2) realimentado con la ley de control (3.4.16) poseeun equilibrio globalmente asintoticamente estable en (ϕd, θd, 0, 0)

Demostracion. Dada la desigualdad estricta en (3.4.18) y el hecho de que Hd es propia, elprincipio de invariancia de LaSalle garantiza la estabilidad asintotica del maximo conjuntoinvariante contenido en (ϕ = 0, θ = 0). Sin embargo, observando la ley de control, el unicoconjunto invariante con velocidades nulas es, precisamente (ϕd = 0, θd = 0), con lo que seprueba la estabilidad asintotica global.

3.5 Rechazo de perturbaciones L2

Pudiera argumentarse que los resultados obtenidos previamente obedecen a una finalidadpuramente estetica. De hecho el dotar al sistema de lazo cerrado con una estructurahamiltoniana desacoplada con el unico fin de lograr controles independientes en orientaciony elevacion puede ser obviado. En su lugar se podrıa recurrir a la tecnica del par calculado,una version sencilla de la linealizacion por realimentacion aplicable a sistemas roboticoscompletamente actuados.

Sin embargo, la virtud de la expresion del sistema en bucle cerrado en forma hamil-toniana subyace en los resultados relativos a la robustez y al rechazo de perturbacionesoriginalmente presentados en (Van der Schaft 2000) y que se complementan con el teoremafundamental 2.6.3.

El problema de rechazo de perturbaciones con ganancia L2 se ha definido el la sec-cion 3.5. Haremos uso del teorema 2.6.3 allı presentado. El sistema en bucle cerradoperturbado tiene la estructura

x = (J(x) − R(x))∇H + g1(x)v + g2(x)w

z = h(x)gT1 (x)∇H

(3.5.1)

donde v = [0 0 vϕ vθ]T es el vector de control que se anadira a los pares uϕ y uθ calculados

en (3.4.16). La matriz J(x) de interconexion en bucle cerrado y la de disipacion R(x)vienen dadas por

J(x) =

0 0 Γ−1c 0

0 0 0 I−1yy2

−Γ−1c 0 0 0

0 −I−1yy2

0 0

R(x) =

0 0 0 0

0 0 0 0

0 0 Kc1

Γ2c

0

0 0 0 Kc2

I2yy2

es facil ver que J(x) = −J(x)T y que R(x) es globalmente semidefinida positiva. Los paresde control que se anadan actuaran sobre la aceleracion, es decir, sobre las dos ultimas filas

Page 64: Hamiltonians based Control

50 3.5. Rechazo de perturbaciones L2

de las ecuaciones de estado (3.4.8). Lo mismo sucedera con los pares de perturbacion w,de modo que se tienen las matrices de ganancias de control y perturbacion como

g1(x) = g2(x) =

0 0 0 0

0 0 0 0

0 0 1 0

0 0 0 1

= g1(x)gT

1 (x) = g2(x)gT2 (x),

de lo que se deduce que

g1(x)gT1 (x) − g2(x)gT

2 (x) = 0,

por lo que la hipotesis del teorema 2.6.3 se cumple trivialmente para cualquier nivel deatenuacion γ ya que

R − 1

2γ2[g2(x)gT

2 (x) − g1(x)gT1 (x)] = R ≥ 0.

Para la eleccion de la senal de control, tomese la matriz de ponderacion de la forma

h(x) =

[0 0 1 0

0 0 0 1

]

de donde se tiene la senal de penalizacion

z =

[∂Hd

∂ϕ∂Hd

∂θ

]=

[Γcϕ

Iyy2 θ

]

con lo que se calcula la ley de realimentacion (2.6.5)

u = −[1

2hT (x)h(x) +

1

2γ2I4

]gT1 (x)∇H =

0 0 0 0

0 0 0 0

0 0 1 + 12γ2 0

0 0 0 1 + 12γ2 .

0

0

Γcϕ

Iyy2 θ

(3.5.2)Con esta ley se garantiza el cumplimiento de la desigualdad de disipacion–γ a lo largo delas trayectorias del sistema en bucle cerrado, dada por

H + (Γcϕ)2Kc1 + (Iyy2 θ)2Kc2 ≤ 1

2γ2‖w‖2 − ‖z‖2

con lo que son aplicables las tres implicaciones del problema de rechazo de perturbacionesdescrito en la seccion 3.5. Concretamente la tercera de ellas determina la posibilidad deencontrar, para cualquier constante c > 0, un valor ρ(c) tal que si ‖w(t)‖ ≤ ρ entoncesHd(t) ≤ c. En nuestro problema es un hecho esencial, ya que si la funcion Hd(t) tal ycomo se definio en (3.4.13) esta acotada, se deduce que la norma del error en posiciontambien esta acotada (estabilidad entrada-estado).

Page 65: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 51

3.6 Seguimiento de objetos moviles en superfices no inerciales

Lo presentado hasta el momento parte de la suposicion de que se desea estabilizar un puntodel espacio de configuraciones frente a posibles perturbaciones externas. Esto es deseablesi sobre la plataforma se instalan antenas orientadas a emisores fijos y la plataforma ensı se encuentra en un soporte fijo.

El problema se enriquece en gran medida cuando el objetivo de control es el seguimientovisual de un objeto movil. El movimiento del objetivo respecto a la plataforma puededarse en una o ambas de las siguientes situaciones:

• Seguimiento de objetos moviles desde una plataforma apoyada en tierra. La soluciona este problema, al ser un caso particular, esta contenida en el siguiente supuesto.

• Seguimiento de objetos fijos o moviles desde una plataforma apoyada en la cubiertade un buque u otra base movil. En este caso el objeto a seguir tendra un vectorde velocidad no nulo con respecto al sistema de referencia ligado a la cabeza delpedestal, tanto si el objeto esta en movimiento como si no. Esta velocidad sera lacomposicion del movimiento del propio objeto con el movimiento de la plataformadebido a las oscilaciones provocadas en el buque por el oleaje.

Siendo el segundo caso el mas general, sera el que abordaremos a continuacion. Seplanteara el control como un seguimiento de trayectorias basado en pasividad con rec-hazo de perturbaciones. Las trayectorias de referencia seran aquellas que hagan nulaslas coordenadas del objeto en la imagen captada por la camara y sus derivadas. Paraello se incluira un modulo de precalculo de la trayectoria de referencia en virtud de losmovimientos del objetivo en la imagen de la camara. El esquema de control propuestoaparece en la figura 3.4.

Radar

Video

Encoder/gyro

Seguimiento detrayectoria basado en

pasividad

Cálculo visual de latrayectoria de referencia

D(t)

x(t),y(t)

q(t),q'(t)

qd(t),q'd(t)

Perturbación (oleaje)

+

+

u

Plataforma de sensores

Figura 3.4: Esquema de control para seguimiento visual.

3.6.1 Seguimiento visual

El diseno del primer bloque consiste en calcular la trayectoria deseada para las coorde-nadas de la plataforma, qd(t) = (ϕd(t), θd(t)) de modo que la imagen del objeto movil

Page 66: Hamiltonians based Control

52 3.6. Seguimiento de objetos moviles en superfices no inerciales

se estabilice en el centro de la pantalla de la imagen capturada por la camara CCD. Laentrada de este bloque esta formada por la posicion 2D del objeto en la imagen, referidaal centro de la pantalla. Denotaremos estas coordenadas (x(t), y(t)). Supongamos queexiste una trayectoria qd(t) ∈ C2 unica en las coordenadas articulares de la plataforma,tal que

q(t) = qd(t) ⇒ (x(t), y(t)) = (0, 0),∀t

Esta trayectoria es, evidentemente desconocida, pues depende de los movimientos delbuque y del objeto movil. Sin embargo, como se vera a continuacion, bastara con conocerlas trayectorias de las coordenadas del objeto en la imagen capturada por la camara,para estimar qd(t) y sus derivadas en cada instante t. Conocidas estas, se disenara uncontrolador basado en pasividad para lograr estabilidad asintotica de la trayectoria, yconsecuentemente

limt→∞

(x(t), y(t)) = (0, 0)

Es admisible afirmar que las coordenadas en pantalla (x,y), ası como las coordenadastridimensionales en el sistema de referencia de la camara, (X,Y ,Z), son medidas del erroren seguimiento. Sin embargo, es necesario expresar dicho error en coordenadas articulares(ϕ, θ), y ası se obtendra a continuacion. La posicion 2D del objetivo en la imagen captura-da se supone estimada por un algoritmo de vision por computador estandar. El calculode las coordenadas (X,Y, Z) del objeto referidas al sistema de referencia de la camara sederiva de las propiedades geometricas ilustradas en de la figura 3.5. Por semejanza de

Y

Z

d

Vista lateral

Vista superior

Z

d

X

y

x

Plano de la Imagen

Plano de la Imagen

Figura 3.5: Coordenadas en pantalla y coordenadas reales.

triangulos, se tiene

x

d=

X

Zy

d=

Y

Z

Page 67: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 53

siendo d la distancia focal al plano de la imagen, un parametro caracterıstico (y a menudoajustable) de la camara. Tras algunas manipulaciones se despejan las coordenadas 3D

X =xD√

d2 + r2

Y =yD√

d2 + r2

donde r2 = x2 + y2. El error de orientacion de la camara en funcion de x e y viene dadopor

eϕ = arctan(X

Z) = arctan

(x

d

)= ϕd − ϕ

eθ = arctan(Y

Z) = arctan

(y

d

)= θd − θ

Si derivamos esta expresion, se tiene

eϕ =d

dt

(arctan

X

Z

)=

d

dt

(arctan

x

d

)=

xd

d2 + x2= ϕd − ϕ

eθ =d

dt

(arctan

Y

Z

)=

d

dt

(arctan

y

d

)=

yd

d2 + y2= θd − θ,

De donde obtenemos trayectoria articular deseada y sus derivadas en el instante t

qd(t) =

[ϕ(t)

θ(t)

]+

[eϕ(t)

eθ(t)

](3.6.1)

qd(t) =

[ϕ(t)

θ(t)

]+

[eϕ(t)

eθ(t)

](3.6.2)

Esta trayectoria objetivo calculada en tiempo real sera la referencia del bloque de estabi-lizacion de trayectorias que se disenara a continuacion con metodos basados en pasividad.

3.6.2 Subsistema de estabilizacion de trayectorias

Para lograr el seguimiento de trayectorias partiremos de las ecuaciones de Euler–Lagrange,y emplearemos los resultados de (Van der Schaft 2000). Dada la matriz de inercia delpedestal

M =

[Γ(θ) 0

0 Iyy2

](3.6.3)

y la formulacion de Euler–Lagrange estandar en sistemas roboticos

M(q)q + C(q, q)q = τ (3.6.4)

en la que se han omitido los terminos derivados de la energıa potencial por razones anteri-ormente esgrimidas, y donde la matriz C(q, q) viene expresada en terminos de los sımbolosde Christoffel de primera especie como

cijk(q) =1

2∂mkj

∂qi

+∂mki

∂qj

− ∂mij

∂qk

Page 68: Hamiltonians based Control

54 3.6. Seguimiento de objetos moviles en superfices no inerciales

siendo mab los terminos de la matriz de inercia en bucle abierto M(q). Para estabilizar laorbita qd(t) aplicaremos la ley de control (Van der Schaft 2000)

τ = M(q)ξ + C(q, q)ξ + ν (3.6.5)

dondeξ = qd − Λ(q − qd) (3.6.6)

y Λ = ΛT > 0. Esta variable fue introducida por primera vez en el celebrado controladorde Slotine y Li (Slotine & Li 1987). Sustituyendo (3.6.5) en (3.6.4) resulta

M(q)s + C(q, q)s = ν, (3.6.7)

donde se ha introducido la variable s= q − ξ. Definiendo la funcion de energıa H(s, q) =

12sT M(q)s, se tiene que a lo largo de las trayectorias (3.6.7)

d

dtH = sT M(q)s +

1

2sT M(q)s

= −sT Cs +1

2sT Ms + sT ν

= sT ν

Esto ultimo se debe a que la matriz M−2C es antisimetrica. Del hecho H ≥ 0 se desprendeque el sistema (3.6.7) define un sistema disipativo con respecto a la tasa de suministrosT ν, y un mapa pasivo ν → s para toda condicion inicial. Si definimos adicionalmente

ν= Ks (3.6.8)

donde K = KT > 0 es una matriz definida positiva, y se realimenta segun aparece enla estructura de control de la figura 3.6, se estabilizara la trayectoria de referencia comoindica la siguiente proposicion.

n=Ks

M(q)s+C(q,q)s=ntttte

nnnn

s

s

+-

nnnn

~

~

. .

Figura 3.6: Estructura de realimentacion para seguimiento de trayectorias.

Proposicion 3.6.1. La ley de control

τ = M(q)[qd − Λ(q − qd)] + C(q, q)(qd − Λ(q − qd)) + K[q − qd + Λ(q − qd)]

donde K = KT > 0 y Λ = ΛT > 0 son parametros de ajuste, y qd(t) es la trayectoriacalculada en (3.6.1), estabiliza asintoticamente en el punto (0, 0) la posicion (x, y) de laimagen en pantalla del objetivo movil en el sistema de la plataforma de sensores.

Page 69: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 55

Demostracion. La ecuacion 3.6.8 define un mapa estrictamente pasivo a la entrada s → ν.Entonces, en virtud de la Proposicion 2.6.2, apartado (ii), para todo τe ∈ Ln

2 tal que s (ypor tanto ν) esten en τe ∈ Ln

2 (vease la figura (3.6), la senal de error estara en Ln2 . Este

hecho es relevante, pues en virtud de 3.6.6 y s = q − χ, el error e = q − qd satisface

e = −Λe + s (3.6.9)

De la positividad de Λ se deduce, segun la teorıa de sistemas lineales, que e ∈ Ln2 y por

tanto, por (3.6.9), e ∈ Ln2 . Se probara a continuacion que esto implica que e(t) → 0 para

t → ∞. En efecto, si hacemos

d

dte2(t) = 2e(t)e(t) ⇒ e2(t2) − e2(t1)

= 2

∫ t2

t1

e(t)e(t) ≤∫ t2

t1

[e2(t) + e2(t)]dt → 0 para t1, t2 → ∞

Por tanto, e2(t), t ≥ 0 es una secuencia de Cauchy, que como tal ha de converger a unvalor finito para t → ∞. El hecho de que e ∈ L2 y consecuentemente la integral en tiempoinfinito de e2(t) este acotada, implica necesariamente que este valor lımite es cero.

3.7 Simulaciones

Los razonamientos expuestos en este capıtulo se ilustran con mayor claridad mediante unconjunto de simulaciones implementadas en SIMULINK. En sistemas no lineales, valorescomo el tiempo de subida dependen del punto de operacion. Para ilustrar las capacidadesdel controlador, se mostrara que la respuesta transitoria del sistema controlado no dependedel estado inicial, comportamiento usual en sistemas lineales. Al situar inicialmente laplataforma con acimut cero e introduciendo un escalon en la referencia, de amplitud180 grados, se hara una medida del tiempo de establecimiento. El sistema no linealoriginal, controlado con una ley lineal, alcanzarıa el regimen permanente en un tiempoque serıa funcion de la configuracion de inicio del sistema, e intervendrıan en tal medidael acoplamiento de ambos cuerpos.

Este fenomeno se entiende a la luz del momento de inercia rotacional. Como con-secuencia de lo afirmado previamente, la respuesta a una entrada en escalon en el parde orientacion del sistema original, tendrıa un tiempo de subida diferente para distintasposiciones iniciales del cuerpo de elevacion. La figura 3.7 muestra el comportamiento delsistema sin compensacion de los terminos de acoplamiento de la matriz de inercia. En estecaso se ha controlado el eje de acimut con un simple control PD, mientras que el eje deelevacion se ha dejado libre de actuacion. Se han lanzado las simulaciones a partir de doscondiciones iniciales (0 y π/2 grados en elevacion) por ser puntos de equilibrio relativosdel sistema (en estas posiciones, θ no se ve modificada por la velocidad de orientacion).La curva superior de la figura 3.7 corresponde al caso en el que θ0 = π

2, con una menor

inercia efectiva γ(θ) en la rotacion acimutal y un perıodo transitorio mas breve de 487milisegundos. La curva inferior ilustra el caso en el que θ = 0, con una mayor inercia en elmovimiento de orientacion, y por tanto un tiempo de subida mayor, de 882 milisegundos.

Finalmente conectamos el controlador a la entrada de los motores para realizar medidasdel tiempo de subida del sistema linealizado por realimentacion en dos simulaciones quecomienzan en sendas posiciones de equilibrio de la plataforma (θ0 = 0 y θ0 = π

2). Como se

Page 70: Hamiltonians based Control

56 3.8. Aplicacion a una planta de laboratorio

200 400 600 800 1000 1200 1400 1600 1800 20000

20

40

60

80

100

120

140

160

180

200

Acim

ut (g

rado

s)

Comparacion de tiempos de subida en orientacion, para elevaciones iniciales de 0 y 90 g

Figura 3.7: Tiempos de subida diferentes para ϕ bajo diferentes condiciones iniciales, θ = π/2y θ = 0.

aprecia en la figura 3.8 ambas curvas estan superpuestas dado que el periodo transitoriodel seguimiento en orientacion ϕ ya no depende de la condicion inicial θ0. El tiempo desubida del sistema lineal desacoplado es 641 ms en todos los casos. Este valor puede serajustado a traves de los parametros Kc, Kd del controlador Γc.

200 400 600 800 1000 1200 1400 1600 1800 20000

20

40

60

80

100

120

140

160

180

200

Acim

ut (g

rado

s)

Comparacion de tiempos de subida en orientacion, para elevaciones iniciales de 0 y 90 g

Figura 3.8: Seguimiento de la referencia en el eje de acimut para valores iniciales diferentes deθ, con compensacion de pares de acoplamiento.

3.8 Aplicacion a una planta de laboratorio

A continuacion se pondran en practica los resultados anteriores sobre una plataforma desensores construida en el laboratorio del Dpto. de Ingenierıa de Sistemas y Automaticade la Universidad de Sevilla, que se muestra en la figura 3.9. Los resultados que sepresentaran han sido publicados en (Gomez-Estern, Aracil & Rubio 2000). La plataformaha sido desarrollada por los becarios y profesores del departamento ISA, estando dotadadel siguiente equipamiento:

• Mesa desestabilizadora apoyada en rotula.

• Dos motores DC lineales controlados por variadores para el movimiento de la mesa.

• Dos motores DC sin escobillas con sus respectivos servoamplificadores de potencia.

• Reductoras con factor de reduccion 800:1 en acimut y 400:1 en elevacion.

• Dos giroscopos situados perpendicularmente.

Page 71: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 57

Figura 3.9: Plataforma de laboratorio de dos grados de libertad.

• Un encoder en el eje de cada motor.

• Un encoder de alta precision (10000 pulsos por vuelta) en la carga de cada eje.

• Dos inclinometros para medir la inclinacion de la mesa.

• Camara de vıdeo CCD.

• Circuitos de adaptacion de senales, tarjetas A/D de adquisicion y PC.

• Fuentes de alimentacion y dispositivo de parada de emergencia.

Como se comento previamente, a fin de implementar el controlador hamiltoniano basadoen el modelo, es necesario un conocimiento preciso en tiempo real de la inercia efectiva ysu derivada

Γ(θ) = Izz1 + Ixx2sen2θ + Izz2 cos2 θ (3.8.1)

Γ′(θ) =dΓ

dθ= (Ixx2 − Izz2)sen2θ, (3.8.2)

ası como los coeficientes Iyy2 , bϕ, y bθ (los ultimos dos representan las constantes de friccionviscosa medidas en el sistema real).

La funcion Γ(θ) puede obtenerse de las constantes inerciales. Si estas no estan disponibles,

se empleara la nueva variable α= sen2(θ) de modo que Γ es una funcion lineal de la nueva

variable α:Γ(θ) = Izz1 + Izz2 + α(Ixx2 − Izz2) (3.8.3)

Tomando dos observaciones en θ = 0 y en θ = π2, se determinan las constantes Γ0 y Γπ

2.

Sus valores se relacionan con el momento de inercia del siguiente modo:

Γ0= Izz1 + Izz2 (3.8.4)

Γπ/2= Izz1 + Ixx2 (3.8.5)

Page 72: Hamiltonians based Control

58 3.8. Aplicacion a una planta de laboratorio

Susituyendo las ecuaciones (3.8.4) y (3.8.5) en Eq.(3.8.3) se obtiene

Γ(θ) = Γ0 + α(Γπ/2 − Γ0) (3.8.6)

por tanto bastara con encontrar las constantes Γ0 y Γπ2

de forma experimental a fin de

poder calcular analıticamente las funciones Γ(θ) y Γ′(θ) = dΓ(θ)dθ

. La obtencion estosvalores se explicaran a continuacion. La dinamica de la planta, modelando la friccion conlos terminos basicos de Coulomb y friccion viscosa, viene dada por

τϕ − F = Γ(θ)ϕ + ϕθ(Γπ/2 − Γ0)sen2θ (3.8.7)

donde F = bϕϕ+ τcoϕ es la fuerza de friccion y τcoϕ es la constante de friccion de Coulombpara el movimiento en el eje ϕ . El par de control es proporcional a la tension de entradaal servoamplificador1

τϕ = KtϕVϕ

A menudo no se dispone de un valor fiable y estable de la constante de par Kt, que dependedel servo y del motor de corriente continua. Este problema se solventa dividiendo ambosterminos de la ecuacion (3.8.7) por Kt y empleando el cambio de variable

Γ(θ)=

Γ(θ)

Ktϕ

, Ixx2=

Ixx2

Ktϕ

, Izz2=

Izz2

Ktϕ

bϕ=

Ktϕ

, τco=

τco

Ktϕ

, τp=

τp

Ktϕ

,

de modo que el sistema a identificar se transforma en

ϕ =1

Γ(θ)

(Vin + ϕθ(Γπ/2 − Γ0)sen2θ − F

)(3.8.8)

donde el voltaje aplicado al servoamplificador aparece de forma explıcita en ası comouna serie de parametros relacionados con sus equivalente fısicos por la constante Kt, noapareciendo esta explıcitamente.

La ecuacion (3.8.7) se simplifica para una entrada en escalon de tal modo que lamaxima velocidad en orientacion no supera el siguiente valor:

ϕmax ≤√

2τcoθ

Γ′(θ), (3.8.9)

Que se puede considerar como la condicion de arranque del movimiento del cuerpo deelevacion cuando este se origina exclusivamente por efecto del acoplamiento. Bajo estahipotesis, (la cabeza de la plataforma se mantiene estatica), la respuesta a una entradaen escalon en el eje de acimut viene descrita por la ecuacion

ϕ =1

Γ(θ)(Vin + −bϕϕ − τcoϕ) (3.8.10)

La ausencia de derivadas de orden cero en la variable ϕ, al tratarse esta de una variablecıclica, permite la reduccion de la ecuacion diferencial a una de primer orden, nmediante

1Precisamente esta es la funcion del servoamplificador: lograr que la corriente y por tanto el paraplicado sigan a la referencia proporcionada por la tension de entrada, convirtiendo la dinamica deprimer orden del motor DC en una relacion de proporcionalidad

Page 73: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 59

el cambio de variable z = ϕ. La ultima ecuacion expresada en terminos de la velocidad zse transforma en

z + k1z = k2 (3.8.11)

k1=

Γ(θ), k2

= Vin−τcoϕ

Γ(θ)(3.8.12)

La condicion de movimiento implica necesariamente que k1 > 0 y k2 > 0, manteniendoseambos valores constantes dentro del horizonte temporal del experimento. La solucion de(3.8.11) da lugar a:

z(t) = z∞(1 − e−k1t

)(3.8.13)

A traves de la experimentacion se determinaran el tiempo de subida tr y la velocidad enregimen permanente z∞.

k1 =1

tr(3.8.14)

k2 = z∞ · k1 (3.8.15)

En la figura 3.10 se ha obtenido la respuesta del sistema a un par de entrada en escalon. La

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2−5

0

5

10

15

20

25

30

35

40

45Angulo de acimut (verde), velocidad de acimut (azul) y tension de entrada (rojo)

Figura 3.10: Respuesta de la velocidad en acimut (en grados/segundo) al escalon de entradaen bucle abierto, frente al tiempo (mseg) .

tabla 3.1 muestra los diferentes valores de la velocidad maxima alcanzada y los tiempos desubida para elevacion nula, a medida que se incrementa el tamano del escalon de entrada.La tabla 3.2 muestra los mismos resultados cuando el movimiento parte con una elevacioninicial de 45 grados.

A primera vista, las tablas 3.1 y 3.2 revelan una saturacion abrupta en la entrada.Esta no linealidad se puede apreciar con mayor claridad en la figura 3.11 donde se trazala maxima velocidad de rotacion frente a la amplitud del voltaje de entrada. La funcionde saturacion es simetrica respecto a la tension de entrada nula. Por tanto la senal decontrol esta acotada en el intervalo [−0.6, 0.6]

Page 74: Hamiltonians based Control

60 3.8. Aplicacion a una planta de laboratorio

Tabla 3.1: Maxima velocidad de rotacion y tiempo de subida para θ = 0.

Voltaje de entrada (V) Vel. max. (grad/s) Tiempo de subida (s)

0.2 10.3912 0.116

0.4 26.6888 0.105

0.6 45.0227 0.102

0.8 44.8184 0.061

1 44.832 0.056

Tabla 3.2: Maxima velocidad de rotacion y tiempo de subida para θ = 45.

Voltaje de entrada (V) Vel. max. (grad/s) Tiempo de subida (s)

0.2 11.0424 0.113

0.4 27.0524 0.102

0.6 44.5196 0.1

0.8 44.9311 0.69

1 44.8316 0.62

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

5

10

15

20

25

30

35

40

45

50Max. rotation speed vs. input voltage

Figura 3.11: Efecto de la saturacion de la velocidad maxima frente a la tension de entrada.

3.8.1 Identificacion de los parametros

El valor de Γ(θ) sera obtenido experimentalmente a diferentes angulos empleando, a travesde (3.8.12), la relacion lineal entre k2 y Γ(θ)−1. La pendiente de la funcion lineal esestimada mediante la obtencion de dos valores de k2 bajo diferentes tensiones de entradaVin

∂k2

∂Vin

=k2

Vin

=1

Γ(θ)(3.8.16)

Repitiendo el experimento en dos angulos de elevacion estaticos, concretamente θ = 0y θ = π/2, se puede obtener la expresion analıtica de la funcion Γ(θ) en terminos de la

Page 75: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 61

ecuacion (3.8.3) para cualquier valor de θ. Sı los lımites mecanicos no permiten angulos deelevacion tan altos como θ = π/2, como es el caso de nuestra plataforma de laboratorio, elmismo procedimiento se llevarıa a cabo, haciendo los experimentos en θ = π/4, y usandola relacion

Γ(θ) = Γ0 + 2(Γπ/4 − Γ0)sen2θ (3.8.17)

Consecuentemente, a fin de determinar analıticamente la funcion de inercia efectiva Γ(θ),se deben llevar a cabo cuatro experimentos:

• dos de ellos con elevacion nula a diferentes amplitudes del escalon de entrada enacimut,

• y los otros dos con el angulo de elevacion fijo a π/4 o π/2 radianes (solo uno de ellosa elegir).

En todos los experimentos se mantiene el sentido de rotacion constante para no interferircon los fenomenos de friccion estatica2. El parametro de friccion viscosa resulta

τcoϕ = Vin − k2 · Γ(θ) (3.8.18)

siendo k2 y Γ(θ) los obtenidos en el ultimo paso, siempre que θ permanezca constante.Esto es cierto a causa de la relacion bϕ = k1 · Γ(θ).

Se han realizado calculos analogos para identificar la dinamica del eje de elevacion.Dado que su inercia Iyy2 no se ve afectada por el valor de ϕ, solo deben obtenerse losvalores de z∞ y tr.

3.9 Resultados experimentales

3.9.1 Identificacion de la planta real

Se aplicara el procedimiento de identificacion a la planta de laboratorio y se analizaran losresultados de la identificacion. En primer lugar, se muestra la saturacion en la velocidadde regimen permanente (debido a la saturacion del par de entrada) en la figura 3.11.Claramente, esta limitacion ha de ser tenida en cuenta a la hora de disenar controladores.

En la figura 3.12, se ha trazado el valor de Γ(0) para diferentes tensiones de entrada.A velocidades bajas, este parametro cambia drasticamente. Esto se debe a los fenomenosde friccion y holgura de los engranajes que sugiere la inclusion de un precompensadorde friccion para aumentar la precision (Canudas de Wit et al. 1995). Sin embargo, avelocidades mayores, el comportamiento de la plataforma se ajusta con gran exactitud almodelo aquı desarrollado. Desde un valor de la entrada cercano a 0.2 voltios, la medida deΓ se mantiene constante hasta que alcanzamos el punto de saturacion, donde la relacion(3.8.16) deja de ser valida. El valor medio obtenido para la inercia efectiva normalizadaΓ(0) (con elevacion cero) es 0.000596, y la relativa a la posicion del cabezal elevado aπ/4 resulto Γπ/4 = 0.0006. Se observa, por tanto, que los altos ratios de las reductoras

2Para una correcta identificacion de los fenomenos asociados a los cambios de signo de velocidad(efecto de Stribeck etc.), habrıa de emplear los metodos desarrollados por el grupo de LuGre (Canudasde Wit, Olsson, Astrom & Lischinscky 1995).

Page 76: Hamiltonians based Control

62 3.9. Resultados experimentales

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.5

1

1.5

2

2.5

3

3.5

4x 10

−3

Figura 3.12: Inercia efectiva Γ frente a la tension de entrada para una elevacion nula.

(400 y 800) hacen difıcil de apreciar, en nuestro caso, los efectos de acoplamiento. Se hanrealizado experimentos similares para el eje de elevacion y se obtuvo un valor medio delmomento de inercia Iyy2 en torno al eje y de 0.001.

3.9.2 Control hamiltoniano con prealimentacion de friccion

La precision de los resultados aumenta considerablemente cuando se una estrategia deprealimentacion de la friccion basada en el modelo de LuGre (Canudas de Wit et al. 1995).Los detalles del compensador de friccion seran omitidos al no ser un objetivo central deesta tesis. La figura 3.13 se ha obtenido tras la implementacion de un control en posicionbasado en la ley hamiltoniana (3.4.16). Los resultados son plenamente satisfactorios parasenales de referencia de tipo escalon o variaciones lentas en la referencia. Sin embargo,a medida que aumentamos la frecuencia de la senal a seguir, como sucede en el caso deseguimiento de trayectorias, el rendimiento del controlador se degrada considerablemente(figuras 3.14 y 3.15), al aparecer atenuacion y desfase entre la referencia y la salida. Enestos casos es preciso cambiar la estrategia de control por la del seguimiento de trayectoriasbasado en pasividad presentado en la seccion 3.6.

0 5 10 15−6

−4

−2

0

2

4

6

Tiempo(s)

grad

os

Posición Referencia

Figura 3.13: Seguimiento en posicion con perturbaciones. Referencia en escalon.

Page 77: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 63

0 5 10 15−10

−8

−6

−4

−2

0

2

4

6

8

10

Tiempo(s)

grad

os

Posición Referencia

Figura 3.14: Seguimiento en posicion con perturbaciones. Referencia senoidal, baja frecuencia.

0 5 10 15−10

−8

−6

−4

−2

0

2

4

6

8

10

Tiempo(s)

grad

os

Posición Referencia

Figura 3.15: Seguimiento en posicion con perturbaciones. Referencia senoidal de alta frecuen-cia.

3.9.3 Atenuacion de perturbaciones en la planta real

Se ha tratado de medir el efecto de las perturbaciones en los pares de control debido ala composicion de velocidades angulares producida por el movimiento de la mesa deses-tabilizadora. Sin embargo se ha observado que las velocidades de esta ultima son bajasy los altos ratios de reduccion de los motores (1:400 y 1:800) impiden que este efectose manifieste de forma apreciable como perturbacion. Por tanto, con el fin de ilustrarlas propiedades de atenuacion de perturbaciones se ha anadido a la propia senal de con-trol un ruido generado por el ordenador, con dos envolventes distintas: ruido blando yoscilaciones senoidales lentas (el escenario esperado en la cubierta de un buque).

En las distintas experiencias de laboratorio se hizo variar el valor de γ de la ley,obteniendose, segun lo previsto, un mejor rechazo de las perturbaciones en la salida, paravalores menores de este parametros. En la figura 3.16 se representa la referencia, la saliday la senal de perturbacion de gran amplitud superpuesta. Con un valor de γ = 0.2 seobtiene un rechazo de perturbaciones muy satisfactorio, especialmente en el caso de ruidoblanco. Se observo, sin embargo, que esta mejora no se podıa aumentar indefinidamente alestar γ relacionada con el termino derivativo del control, de modo que para γ muy pequenola dinamica del controlador es demasiado rapida y presenta vibraciones probablementerelacionadas con las imprecisiones en los modelos de holgura y friccion.

Page 78: Hamiltonians based Control

64 3.9. Resultados experimentales

0 5 10 15−6

−4

−2

0

2

4

6

Tiempo(s)

grad

os

Posición Referencia

Figura 3.16: Rechazo de perturbaciones para el seguimiento en posicion.

3.9.4 Seguimiento de trayectorias en la planta real

La estructura de control presentada en la seccion 3.6 comprende un subsistema de seguimien-to visual para el calculo de la trayectoria de referencia que excede los lımites de esta tesis.El rendimiento del controlador, sin embargo, esta mas relacionado con la capacidad deseguir una referencia cambiante y rechazar las perturbaciones que con la manera de obten-er la senal qd(t). Por tanto el comportamiento del controlador se ha estudiado bajo senalesde referencia generadas por ordenador con forma senoidal a distintas frecuencias. Comose observa en las figura 3.17 y 3.18, el seguimiento de trayectorias basado en pasividadpresenta un comportamiento optimo incluso a frecuencias altas, salvando el problema dedesfase detectado en el control hamiltoniano en posicion.

0 5 10 15−6

−4

−2

0

2

4

6

Tiempo(s)

grad

os

Posición Referencia

Figura 3.17: Seguimiento de trayectoria senoidal con perturbacion senoidal.

Page 79: Hamiltonians based Control

Capıtulo 3. Control de una plataforma giroestabilizada de dos grados de libertad 65

0 5 10 15−6

−4

−2

0

2

4

6

Tiempo(s)

grad

os

Posición Referencia

Figura 3.18: Seguimiento de trayectoria senoidal con perturbacion en forma de ruido blanco.

Page 80: Hamiltonians based Control

66 3.9. Resultados experimentales

Page 81: Hamiltonians based Control

Capıtulo 4

Control de sistemas subactuadosmediante el metodo IDA-PBC

Lo mayor parte de lo que se expondra en este capıtulo aparece publicado en el artıculo(Ortega, Spong, Gomez-Estern & Blankenstein 2002). En el estudiaremos la aplicacionde una nueva formulacion del problema del control, basada en pasividad, conocida comointerconexion y asignacion de amortiguamiento (IDA-PBC), al problema de estabilizacionde sistemas mecanicos subactuados. Este metodo, introducido inicialmente en (Ortega &Spong 2000) anade a la modificacion de la energıa potencial que se ha venido haciendohabitualmente, el moldeo de la energıa cinetica como vıa imprescindible para salvar los ob-staculos relacionados con la subactuacion. La principal contribucion es la caracterizacionde una clase de sistemas para la cual el IDA-PBC proporciona un controlador suave conestabilizacion asintotica en un dominio de atraccion garantizado, la resolucion de algunosproblemas de control subactuado mediante esta tecnica, y el analisis transitorio de lassoluciones.

La clase en la que es aplicable esta tecnica se define en terminos resolubilidad deun conjunto de ecuaciones diferenciales parciales. Una ventaja importante del metododebida a su formulacion hamiltoniana (en oposicion al mas clasico metodo lagrangiano)es la introduccion de nuevos grados de libertad para la solucion de estas ecuaciones, comolos elementos de la matriz de interconexion. Usando este grado de libertad adicional,se puede probar que el metodo de Lagrangianos controlados en su formulacion originalpuede verse como un caso particular del enfoque IDA-PBC. Con el fin de ilustrar latecnica se disenaran controladores asintoticamente estables para el clasico problema de labola en la viga, y para un sistema subactuado recientemente presentado (Spong, Corke& Lozano 2001), el pendulo de disco inercial. En el primer ejemplo se probara que paracualquier condicion inicial (excepto un conjunto de medida cero), el controlador es capazde conducir al sistema de la bola en la viga hacia la orientacion correcta. Asimismo,definiremos un dominio de atraccion del equilibrio en el origen que garantiza que todaslas trayectorias permanecen acotadas dentro de los lımites de la viga. Para el pendulo dedisco inercial se probara que es posible levantar (swing–up) y estabilizar el pendulo en laposicion vertical superior sin conmutacion entre la ley de swing–up y la de estabilizacion,y sin necesidad alguna de sensores de velocidad.

67

Page 82: Hamiltonians based Control

68 4.1. Introduccion

4.1 Introduccion

El control basado en pasividad (PBC) es una metodologıa de diseno para el control desistemas no lineales ampliamente conocido en aplicaciones mecanicas. En algunos prob-lemas de regulacion, proporciona un procedimiento natural para moldear la energıa po-tencial preservando, en bucle cerrado, la estructura de Euler-Lagrange del sistema. Enun profundo analisis en (Ortega et al. 1998), se extiende la aplicacion del PBC a unaamplia clase de sistemas descritos mediante ecuaciones de Euler–Lagrange, incluidos sis-temas electricos y electromecanicos. En (Ortega, Loria, Kelly & Praly 1995) se propone eluso de controladores dinamicos, conectados con la planta a traves de interconexiones quepreservan la potencia (y por tanto conservan estructura de Euler-Lagrange), para moldearla energıa potencial de una clase de sistemas de Euler–Lagrange subactuados empleandomedidas parciales del estado. Sin embargo, para estabilizar algunos sistemas mecanicossubactuados, ademas de la mayorıa de sistemas electricos y electromecanicos, es necesariomodificar la funcion de energıa total (potencial mas cinetica). Desafortunadamente, elmoldeo de energıa total por el procedimiento clasico PBC, donde en primer lugar se se-lecciona la funcion de energıa y despues se disena el control que fuerza la desigualdad dela disipacion, destruye la estructura Euler–Lagrange. Esto acarrea en estos casos que elsistema en bucle cerrado —aun definiendo un operador pasivo— deje de ser un sistema deEuler–Lagrange, y la funcion de almacenamiento del mapa pasivo (que es normalmenteuna funcion cuadratica del error) carece de significado fısico, lo cual dificulta el analisisposterior del sistema controlado. Anadido a esto, el metodo IDA-PBC incorpora la ven-taja de resolver ciertos problemas de forma totalmente sistematica, como se vera en estetexto.

Tal y como se explica en la Seccion 10.3.1 del libro (Ortega et al. 1998), esta situacionproviene del hecho de que esto disenos involucran una inversion del sistema a lo largode las trayectorias de referencia, heredando las pobres propiedades de robustez de losdisenos de linealizacion por realimentacion e imponiendo al sistema el artificial requisitode la invertibilidad.

Para solventar esta dificultad se desarrollo en (Ortega, Van der Schaft, Maschke &Escobar 2002) (vease tambien (Ortega, Van der Schaft, Mareels & Maschke 2001, Vander Schaft 2000)), un metodo de sıntesis basado en pasividad denominado Interconexion yAsignacion de Amortiguamiento, o IDA-PBC. Las principales caracterısticas del metodoIDA-PBC son:

1 Esta formulado para la clase de sistemas PCH, que es una clase que contiene estric-tamente los sistemas de Euler-Lagrange, y

2 la funcion de energıa en bucle cerrado se obtiene – tras resolver un sistema deecuaciones diferenciales parciales – como resultado de nuestra eleccion libre de in-terconexiones deseadas entre subsistemas y del amortiguamiento. Es bien sabido quela resolucion de sistemas de ecuaciones diferenciales parciales (EDPs) es una tareadifıcil. Sin embargo, la EDP particular que aparece en IDA-PBC esta parametrizadaen terminos de las matrices de interconexion y amortiguamiento, las cuales puedenser elegidas cuidadosamente invocando consideraciones fısicas para resolverla. Estepunto ha sido ilustrado en varias aplicaciones practicas incluyendo sistemas de bal-ance de masas, motores electricos, sistemas de levitacion magnetica, sistemas depotencia, control de satelite y vehıculos subacuaticos.

Page 83: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 69

En este capıtulo, nos centraremos en la aplicacion del IDA-PBC al problema de estabi-lizacion de sistemas subactuados1.

La principales contribuciones de este capıtulo son: la caracterizacion de una clasede sistemas para la cual el metodo IDA-PBC proporciona una ley de control suave, laaplicacion a dos problemas de control subactuado, el estudio de la estabilidad de loscontroladores, y el analisis del comportamiento transitorio del clasico sistema de la bolay la viga en bucle cerrado. La clase de sistemas de aplicacion del metodo esta definidaen terminos de resolubilidad de dos EDPs que corresponden a sendas etapas de moldeode la energıa potencial y cinetica. A modo de ilustracion disenaremos controladores IDA-PBC asintoticamente estables para los clasicos sistemas de la bola en la viga y para unpendulo invertido de reciente aparicion (Spong et al. 2001), el pendulo de disco inercial.Para el sistema bola y viga se probara que para cualquier condicion inicial (excepto unconjunto de medida cero) el controlador lleva la viga a la posicion horizontal con la bolaal centro de la viga. Mas aun, definiremos un dominio de atraccion que garantice que labola permanece dentro de los lımites de longitud de la viga. Para el pendulo de disco deinercia se presentara una realimentacion dinamica de la salida para la cual, de nuevo para“casi” todas las condiciones iniciales se logra estabilizar el sistema en la posicion verticalsuperior. Esto quiere decir que es posible levantar el pendulo desde su posicion estable enbucle abierto y estabilizar arriba sin necesidad de conmutacion. Ademas, no es necesariotomar medidas directas de la velocidad.

Otro tema de interes tratado en este capıtulo es situar el nuevo enfoque hamiltonianoen perspectiva con el de los “Lagrangianos Controlados” para estabilizacion de sistemasmecanicos simples subactuados, desarrollados en una serie de artıculos de Bloch et al.(vease (Bloch et al. 2000, Chang, Bloch, Leonard, Marsden & Woolsey 2002)), y continu-ados con el trabajo de (Auckly, Kapitanski & White 2002, Andreev, Auckly, Kapitanski,Gosavi, Kelkar & White 2000). 2

Como se comento en el capıtulo 2, los metodos IDA-PBC y Lagrangianos Controladoscomparten objetivos y en cierta medida su fundamento teorico. Una diferencia centralentre ambos metodos recae en que mientras la dinamica EL objetivo en el metodo deLagrangianos Controlados se obtiene modificando exclusivamente la matriz de inerciageneralizada y la funcion de energıa potencial, en IDA-PBC tenemos tambien la posibili-dad de cambiar la matriz de interconexion, es decir, la estructura de Poisson del sistema.A este respecto, se plantean las siguientes cuestiones:

1. ¿Cual es la eleccion especıfica de este parametro libre que proporciona los mismoscontroladores para ambos metodos?. Para responder a esta cuestion usaremos losrecientes resultados de (Blankenstein, Ortega & Van der Schaft 2001).

2. ¿Podemos usar este grado de libertad adicional para simplificar la busqueda desoluciones para las EDPs mencionadas? Para responder a esta pregunta escribiremoslas EDPs en una forma tal que los parametros libres aparezcan explıcitamente como“entradas de control” y trabajaremos con dos ejemplos clasicos para ilustrar comose seleccionarıan dichas entradas.

1Cabe puntualizar que, tal y como se presentado, el metodo IDA-PBC se aplica solo a sistemasestabilizables mediante leyes suaves, excluyendo una amplia clase considerada en (M. Reyhanoglu &Kolmanovsky 2001). Sin embargo, la version de IDA-PBC de (Fujimoto & Sugie 2001), se aplica tam-bien a problemas que involucren hamiltonianos variantes en el tiempo, permitiendo la estabilizacion concontroladores variantes en el tiempo.

2En (Hamberg 1999) aparece una extension a los sistemas Lagrangianos en general.

Page 84: Hamiltonians based Control

70 4.2. Estabilizacion de sistemas mecanicos subactuados

3. ¿Es el conjunto de modelos EL en bucle cerrado alcanzable por medio de IDA-PBC “mayor” que el que se obtiene mediante metodos Lagrangianos? Si fuera ası,¿podrıamos caracterizar la diferencia? Proporcionaremos una respuesta a ambascuestiones, mostrando que con IDA-PBC podemos aun preservando la estructuraEL, anadir terminos giroscopicos al sistema en bucle cerrado, una caracterıstica queno aparece en la literatura del enfoque lagrangiano. 3

Para clarificar mas aun las conexiones entre IDA-PBC y Lagrangianos Controlados—denuevo invocando(Blankenstein et al. 2001)—probaremos que las condiciones de ajuste(matching conditions) de (Bloch et al. 2000) caracterizan una clase de sistemas mecanicostales que sus funciones de energıa cinetica puede ser moldeada sin resolver las mencionadasEDPs. Obviando la necesidad de resolver dichas ecuaciones, principal obstaculo en ambosenfoques, claramente aumenta la aplicabilidad de estos metodos de diseno.

El resto del capıtulo se organizara del siguiente modo. En la seccion 4.2 presentamosla aplicacion de IDA-PBC a sistemas mecanicos subactuados. Las secciones 4.3 y 4.4contienen las derivaciones de IDA-PBC para los sistemas pendulo de disco inercial y labola en la viga, respectivamente. Por ultimo, se presentara un analisis novedoso de loscomportamientos transitorios del sistema de la bola y la viga en bucle cerrado controladomediante IDA–PBC.

4.2 Estabilizacion de sistemas mecanicos subactuados

En esta seccion aplicaremos el enfoque IDA-PBC para regular la posicion de sistemasmecanicos subactuados cuya energıa total viene dada por

H(q, p) =1

2pM−1(q)p + V (q) (4.2.1)

donde q ∈ IRn, p ∈ IRn son los momentos y coordenadas generalizados, respectivamente,M(q) = M(q) > 0 es la matriz de inercia, y V (q) es la energıa potencial. Si suponemosque el sistema no tiene amortiguamiento natural, entonces las ecuaciones de movimientopueden escribirse del siguiente modo[

q

p

]=

[0 In

−In 0

][∇qH

∇pH

]+

[0

G(q)

]u (4.2.2)

La matriz G ∈ IRn×m es determinada por el modo en que el controlador u ∈ IRm actuasobre el sistema y es invertible en el caso de que el sistema sea completamente actuado,i.e. m = n. Consideraremos aquı el caso mas difıcil en el que el sistema es subactuado, ypor tanto lka matriz de control es tal que rango(G) = m < n.

En el metodo IDA-PBC se siguen dos pasos basicos del control basado en pasividado PBC (Ortega & Spong 2000): 1) moldeo de energıa, donde modificamos la funcion deenergıa total del sistema para asignar el punto de equilibrio deseado (q∗, 0); y 2) inyeccionde amortiguamiento para lograr estabilidad asintotica. Como se explico previamente, paramantener la interpretacion del mecanismo de estabilizacion necesitaremos, ademas, queel sistema en bucle cerrado este en forma hamiltoniana (Van der Schaft 2000).

3Recientemente, Bloch et al. (Chang et al. 2002) han extendido el metodo de Lagrangianos controladospara obtener un metodo equivalente al IDA-PBC.

Page 85: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 71

4.2.1 Dinamica objetivo

Motivado por (4.2.1) propondremos a siguiente forma para la funcion de energıa (en buclecerrado)

Hd(q, p) =1

2pM−1

d (q)p + Vd(q) (4.2.3)

donde Md = Md > 0 y Vd representan respectivamente la matriz de inercia y funcion de

energıa potencial (ambas por definir). Se requerira que Vd tenga un mınimo local aisladoen q∗, es decir,

q∗ = arg min Vd(q) (4.2.4)

En PBC la senal de control se descompone de forma natural en4

u = ues(q, p) + udi(q, p) (4.2.5)

donde el primer termino se disena para lograr el moldeo de energıa y el segundo es respon-sable de la inyeccion de amortiguamiento. La dinamica hamiltoniana deseada se toma enla forma5 [

q

p

]= [Jd(q, p) − Rd(q, p)]

[∇qHd

∇pHd

](4.2.6)

donde los terminos

Jd = −Jd =

[0 M−1Md

−MdM−1 J2(q, p)

]Rd = R

d =

[0 0

0 GKvG

]≥ 0 (4.2.7)

representan las estructuras deseadas de interconexion y amortiguamiento.

De lo previamente dicho se desprenden las siguientes observaciones

– De (4.2.1), (4.2.2) se tiene que q = M−1p. Al ser esta una coordenada no actuadala relacion debe ser valida en bucle cerrado. Fijando (4.2.3) y (4.2.6) se determinael bloque (1, 2) de Jd.

– la matriz Rd se incluye para introducir amortiguamiento en el sistema. Como essabido, esto se logra mediante realimentacion negativa de la (nueva) salida pasiva(esta tecnica tambien se conoce como control LgV ), que en este caso toma la formaG∇pHd. Esto quiere decir que seleccionaremos el segundo termino de (4.2.5) como

udi = −KvG∇pHd (4.2.8)

donde tomamos Kv = Kv > 0. Esto justifica el bloque (2, 2) de Rd.

– Se mostrara que la matriz antisimetrica J2 (y algunos de los elementos de Md)pueden ser usados como parametros libres para lograr el moldeo de energıa cinetica.Proporcionar estos grados de libertad adicionales es la esencia del metodo IDA-PBC6.

4Los subındices “es” y “di” hacen referencia, respectivamente, a las palabras energy shaping (moldeode energıa) y damping injection (inyeccion de amortiguamiento).

5Vease (Ortega, Van der Schaft, Maschke & Escobar 2002, Van der Schaft 2000) para una justificacionfısica de esta eleccion.

6En el apartado 4.2.4 se mostrara que, para una eleccion particular de J2 antisimetrica , IDA-PBCse reduce al esquema de lagrangianos controlados de (Auckly et al. 2002, Hamberg 1999, Chang et al.2002). Es razonable esperar que la posibilidad de elegir entre la clase completa de matrices antisimetricasaumenta la clase de sistemas estabilizables.

Page 86: Hamiltonians based Control

72 4.2. Estabilizacion de sistemas mecanicos subactuados

4.2.2 Estabilidad

Para la dinamica deseada en bucle cerrado se tiene la siguiente proposicion, la cual revelalas propiedades de estabilizacion del enfoque IDA-PBC:

Proposicion 4.2.1. El sistema (4.2.6), con (4.2.3) y (4.2.4), tiene un punto de equilibrioestable en (q∗, 0). Este equilibrio es asintoticamente estable si es localmente detectabledesde la salida7 G(q)∇pHd(q, p). Una estimacion del dominio de atraccion esta dado

por Ωc donde Ωc= (q, p) ∈ IR2n | Hd(q, p) < c y

c= supc > Hd(q∗, 0) | Ωc esta acotado (4.2.9)

Demostracion. De (4.2.3) y (4.2.4) tenemos que Hd es una funcion definida positiva enun entorno de (q∗, 0). Un calculo sencillo muestra que a lo largo de las trayectorias de(4.2.6), Hd satisface

Hd = (∇qHd)q + (∇pHd)

p

= −(∇pHd)GKvG

∇pHd

≤ −λminKv|(∇pHd)G|2 ≤ 0

al ser Jd antisimetrica y Kv definida positiva. Consecuentemente, (q∗, 0) es un equilibrioestable. Adicionalmente, al ser Hd propia (por definicion) en su subconjunto de nivelΩc, todas las trayectorias comenzando en Ωc estan acotadas are bounded. La estabilidadasintotica, bajo la suposicion de detectabilidad, se establece invocando el teorema deBarbashin–Krasovskii y los argumentos usados en la prueba del Teorema 3.2 de (Byrnes,Isidori & Willems 1991). Finalmente, la estimacion del dominio de atraccion proviene delhecho de que Ωc es el mayor subconjunto de nivel acotado de Hd.

4.2.3 Moldeo de energıa

Para obtener el termino de moldeo de energıa, ues, del controlador, sustituiremos (4.2.5)y (4.2.8) en (4.2.2) y lo igualaremos a (4.2.6)[

0 In

−In 0

][∇qH

∇pH

]+

[0

G

]ues =

[0 M−1Md

−MdM−1 J2(q, p)

][∇qHd

∇pHd

]

Mientras que las primeras n ecuaciones son claramente satisfechas, el segundo conjuntopuede ser expresado como

Gues = ∇qH − MdM−1∇qHd + J2M

−1d p

Ahora bien, esta claro que si G es invertible, es decir, si el sistema es completamenteactuado, entonces podemos resolver de forma unica para la senal de control ues dado

7Es decir, que para cualquier solucion (q(t), p(t)) del sistema en bucle cerrado perteneciente a algunentorno abierto del equilibrio, la siguiente implicacion sea cierta.

G(q(t))∇pHd(q(t), p(t)) ≡ 0,∀t ≥ 0 ⇒ limt→∞(q(t), p(t)) = (q∗, 0).

Page 87: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 73

cualquier Hd y J2. En el caso subactuado, G no es invertible sino solamente de rangocompleto por columnas, y ues puede solo influenciar a los terminos dentro del espacioimagen de G. Esto lleva al siguiente juego de ecuaciones de restriccion el cual debe sersatisfecho para cualquier eleccion de ues,

G⊥∇qH − MdM−1∇qHd + J2M

−1d p = 0 (4.2.10)

donde G⊥ es un anulador por la izquierda de rango completo de G8, es decir, G⊥G = 0.La ecuacion (4.2.10), con Hd dado por (4.2.3), es un conjunto de EDPs no lineales cuyasincognitas son Md y Vd. Se tomara J2 como parametro libre, y p es una coordenadaindependiente. Si se obtiene una solucion para esta EDP, la ley de control resultante ues

vendra dada por

ues = (GG)−1G(∇qH − MdM−1∇qHd + J2M

−1d p) (4.2.11)

Las EDPs (4.2.10) pueden separarse de forma natural en los terminos que dependenen p y terminos que son independientes de p, es decir, aquellos que corresponden a lasenergıas cinetica y potencial, respectivamente. Por tanto, el sistema de ecuaciones de(4.2.10) puede reescribirse como

G⊥ ∇q(pM−1p) − MdM

−1∇q(pM−1

d p) + 2J2M−1d p

= 0 (4.2.12)

G⊥∇qV − MdM−1∇qVd = 0 (4.2.13)

La primera ecuacion es una EDP no lineal que ha de resolverse para los elementos de-sconocidos de la matriz de inercia en bucle cerrado Md. Dado Md, la ecuacion (4.2.13)es una simple EDP lineal cuya incognita es Vd, y por tanto la principal dificultad sehalla en la resolucion de (4.2.12). La ecuacion (4.2.12) puede expresarse en una for-ma mas explıcita con las siguientes derivaciones. En primer lugar usemos el hecho deque ∇q(z

P (q)z) = [∇q(P (q)z)]z, para toda z ∈ IRn y cualquier matriz simetricaP (q) ∈ IRn×n, para escribir (4.2.12) como

G⊥ [[∇q(M−1p)] − MdM

−1[∇q(M−1d p)] + 2J2M

−1d

]p

= 0.

Entonces, aplicando la identidad

∇q(P (q)z) =n∑

k=1

∇q(P(·,k))zk,

valida para todo z ∈ IRn y todo P ∈ IRn×n, donde P(·,k) denota la columna k–esima dela matriz P , reparametrizando J2 en terminos de las matrices Uk(q) = −U

k (q) ∈ IRn×n

como

2J2 =n∑

k=1

Ukpk (4.2.14)

e igualando los terminos pk se obtienen n EDPs, expresadas solo en terminos de la variableindependiente q, de la forma

G⊥[

∇q(M−1(·,k))

]− MdM

−1[∇q(M

−1d )(·,k)

]+ UkM

−1d

= 0 (4.2.15)

8Se entiende por anulador por la izquierda de una matriz A, otra matriz B cuyas filas estan en el espacionucleo de A. Dicho anulador es de rango completo si el espacio generado por las filas de B coincide conel nucleo de A.

Page 88: Hamiltonians based Control

74 4.2. Estabilizacion de sistemas mecanicos subactuados

donde Uk son las matrices elegidas por el disenador. La idea fundamental es elegir entonceslos parametros libres Uk que definen J2 de tal manera que (4.2.15) admita una solucioncon Md simetrica y definida positiva. A continuacion, la sustituiremos en (4.2.13), que esuna EDP lineal, y buscaremos una solucion Vd que satisfaga (4.2.4). El grado de libertadadicional proporcionado por Uk es la principal caracterıstica que distingue al metodo IDA-PBC de los metodos lagrangianos que revisaremos en la siguiente seccion. De lo anteriorse desprenden los siguientes comentarios

– Los desarrollos previos caracterizan una clase de sistemas subactuados para loscuales el metodo diseno IDA-PBC proporciona estabilizacion suave. La clase vienedada en terminos de resolubilidad de la EDP no lineal (4.2.12), (o de la mas explıcita(4.2.15)), y la EDP lineal (4.2.13). Aunque es bien sabido que resolver EDPs es unatarea en general difıcil, tenemos la ventaja de que el grado de libertad anadido —lamatriz de interconexion en bucle cerrado J2 (equivalentemente, Uk)—simplifica estetrabajo. Este punto se desarrollara con mas detalle en los ejemplos del capıtulo.

– Hay dos casos particulares “extremos” en el procedimiento. En primer lugar, si nomodificamos la matriz de interconexion entonces recuperaremos el clasico proced-imiento de moldeo de energıa potencial de PBC. Ciertamente, si Md = M y J2 = 0,entonces la ecuacion del controlador (4.2.11) se reduce a

ues = (GG)−1G(∇qV −∇qVd)

que es el conocido control de moldeo de energıa potencial. En el extremo opuesto,si no modificamos la energıa potencial, sino solo la cinetica, entonces, como severa en el siguiente apartado, para una eleccion particular de J2, es decir, (4.2.20),se recupera el metodo de Lagrangianos Controlados de (Bloch et al. 2000). Porotro lado si moldeamos tanto la energıa cinetica como la potencial, pero fijamosJ2 a (4.2.20), entonces IDA-PBC coincide con el metodo propuesto en (Aucklyet al. 2002, Hamberg 1999).

4.2.4 Comparacion entre los enfoques lagrangiano y hamiltoniano

El metodo IDA-PBC puede ser interpretado como un procedimiento para generar contro-ladores de realimentacion del estado que transforman un sistema hamiltoniano controladopor puertos (PCH) en otro sistema hamiltoniano PCH con ciertas propiedades de estabil-idad deseadas, por ejemplo en el caso de sistemas mecanicos, transformar (4.2.1), (4.2.2)en (4.2.3), (4.2.6) para una matriz de inercia definida positiva Md, una funcion de energıapotencial Vd que satisfaga (4.2.4), y una matriz antisimetrica arbitraria J2. Visto desdeesta perspectiva, las ecuaciones diferenciales parciales del metodo IDA-PBC (ver capıtulo4) constituyen en cierto modo las conocidas condiciones de ajuste (matching conditions)introducidas en (Bloch et al. 2000) que aseguran que las soluciones (q(t), p(t)) de ambossistemas son las mismas). Un enfoque similar puede tomarse a partir de un perspectivalagrangiana. Es decir, partiendo de un sistema de Euler–Lagrange

d

dt∇qL(q, q) −∇qL(q, q) = G(q)u

donde L es el lagrangiano, definido como la diferencia entre las energıas cinetica y poten-cial, se desea encontrar una realimentacion estatica del estado tal que el comportamiento

Page 89: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 75

en bucle cerrado sea descrito por el sistema lagrangiano controlado

d

dt∇qLc(q, q) −∇qLc(q, q) = 0 (4.2.16)

donde Lc es el lagrangiano deseado. Este problema ha sido estudiado con gran generalidaden (Hamberg 1999), vease tambien (Blankenstein et al. 2001). Para el caso que nosinteresa, restringido a Lagrangianos de la forma

L =1

2qM(q)q − V (q), Lc =

1

2qMc(q)q − Vc(q), (4.2.17)

se ha mostrado en (Auckly et al. 2002, Hamberg 1999) que el conjunto de LagrangianosLc alcanzables en bucle cerrado se caracteriza por la resolubilidad de las EDPs9

G⊥

[∇q(Mq) − MM−1c ∇q(Mcq)]q − 1

2

[∇q(qMq) − MM−1

c ∇q(qMcq)

]= 0(4.2.18)

G⊥∇qV − MM−1c ∇qVc = 0(4.2.19)

lo cual, de forma similar a (4.2.12), (4.2.13) del IDA-PBC, ajustan los terminos de energıacinetica y potencial10. Recordando que p = Mq y definiendo una matriz

Mc(q)= MM−1

d M,

la cual es, claramente simetrica y definida positiva, vemos que (4.2.19) coincide exacta-mente con (4.2.13)—haciendo Vc = Vd. Mas aun, la ecuacion (4.2.12) se reduce a (4.2.18)si y solo si

J2(q, p) = MdM−1[∇q(MM−1

d p)] −∇q(MM−1d p)

M−1Md (4.2.20)

Aunque la expresion de arriba puede ser comprobada mediante sustitucion directa, unaprueba mas elegante aparece en (Blankenstein et al. 2001) comprobando que la parte con-servadora de energıa del sistema PCH (4.2.3), (4.2.6) es equivalente al sistema mecanicoEL [

q

pc

]=

[0 In

−In 0

][∇qHc

∇pcHc

]

donde pc = Mcq and Hc(q, pc) = 12pc M−1

c (q)pc + Vc(q). Una forma alternativa para J2

puede obtenerse como

(J2)(i,j) = −pM−1d M

[(M−1Md)(·,i), (M−1Md)(·,j)

]siendo [·, ·] los corchetes de Lie y (·)(i,j) representa el termino (i, j) de una matriz.

Tambien se ha mostrado en (Blankenstein et al. 2001) que podemos anadir a (4.2.20)una matriz antisimetrica de la forma MdM

−1[∇qQ(q)] − ∇qQ(q)M−1Md, siendo Q

9En las referencias citadas (4.2.18) se expresan usando los sımbolos de Christoffel de segunda especie,lo cual lleva a una notacion mas elegante y compacta. Para evitar notaciones adicionales se usarapreferentemente la forma expresada hasta ahora.

10En (Ortega et al. 1995), vease tambien (Ortega, Van der Schaft, Maschke & Escobar 2002), sedesarrollan las condiciones de ajuste —expresadas en terminos de restricciones algebraicas—para moldeode energıa potencial de sistemas EL en bucle cerrado con controladores EL dinamicos.

Page 90: Hamiltonians based Control

76 4.3. El pendulo de disco inercial

una funcion arbitraria de q, aun preservando la estructura EL en bucle cerrado (4.2.16).Esto corresponde al lagrangiano en bucle cerrado

Lc =1

2qMcq + qQ − Vc

que incluye los terminos giroscopicos qQ, que resultan ser intrınsecos—o dicho manerasencilla, que no pueden ser eliminados mediante un cambio de coordenadas. En otraspalabras IDA-PBC general naturalmente una clase mas ‘rica’ de sistemas EL ajustablesde la forma (4.2.16), los cuales no han sido considerados en la literatura del enfoquelagrangiano.

Recientemente (Chang et al. 2002) han mostrado que un pequeno ajuste en el metodode los Lagrangianos Controlados da lugar a un metodo que es completamente equivalenteal IDA-PBC descrito en el capıtulo 4. Esencialmente, en lugar de restringir los sistemasa la forma (4.2.16), tambien permiten incluir fuerzas externas en el sistema de EulerLagrange en bucle cerrado (por esto se entiende que el segundo miembro de (4.2.16) nosea necesariamente igual a cero, sino cualquier fuerza externa). De este modo, es posibleescribir cualquier sistema mecanico hamiltoniano en un formato Euler-Lagrange incluyen-do la parte no integrable del sistema hamiltoniano como un fuerza externa (giroscopica)del sistema de Euler-Lagrange. Notese que este metodo solo funciona para la clase desistemas mecanicos simples, como los que se presentaran en este capıtulo. Considerandoesta clase mas amplia de sistemas Euler–Lagrange en bucle cerrado (Chang et al. 2002)establece que el metodo de Lagrangianos Controlados es equivalente al metodo IDA-PBC.

4.3 El pendulo de disco inercial

En esta seccion aplicaremos la metodologıa de diseno precedente al problema de estabi-lizacion de la posicion invertida del pendulo de disco inercial mostrado en la figura 4.1.Este sistema, que ha sido definido recientemente en (Spong et al. 2001), consiste en unpendulo fısico con un rotor equilibrado situado el extremo. El par motor produce unaaceleracion angular de la masa del extremo lo cual genera un par de acoplamiento en el ejedel pendulo. Mostraremos el IDA-PBC proporciona una respuesta afirmativa a la cuestionde la existencia de una ley de control continua que, para todas las condiciones inicialesexcepto un conjunto de medida cero, levanta el pendulo desde su posicion naturalmenteestable abajo, y lo estabiliza en la posicion vertical superior11. Tambien mostramos que,como es usual en PBC (Ortega, Van der Schaft, Maschke & Escobar 2002), la propiedadde pasividad nos permite reemplazar la ley de realimentacion de estado por una reali-mentacion dinamica de la salida que no requiere la medida de velocidades.

11Esto significa que la cuenca de atraccion de nuestro controlador es un conjunto abierto denso en elespacio de estados, lo cual es lo mejor que se puede esperar al usar una realimentacion continua (Shiriaev& et al. 2000).

Page 91: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 77

2

1

u

θ

θ

Figura 4.1: Pendulo de disco inercial.

4.3.1 Modelo

Las ecuaciones dinamicas del dispositivo pueden ser escritas de una forma estandar usandola formulacion EL (Spong & Vidyasagar 1989) como[

I1 + I2 I2

I2 I2

][θ1

θ2

]+

[−mgLsenθ1

0

]=

[0

1

]u

donde θ1, θ2 y I1, I2 son los angulos respectivos y momentos de inercia de pendulo y disco,m es la masa del pendulo, L es su longitud, g es la constante de gravedad, y u es el parde control de entrada actuando entre el disco y el pendulo. El cambio de coordenadas[

q1

q2

]=

[θ1

θ1 + θ2

]

lleva a la descripcion simplificada[I1 0

0 I2

][q1

q2

]+

[−m3senq1

0

]=

[−1

1

]u (4.3.1)

donde m3= mgL. El sistema puede ser escrito en forma hamiltoniana (4.2.2) con p =

[I1q1, I2q2], la funcion de energıa total (4.2.1) y

M =

[I1 0

0 I2

], G =

[−1

1

], V (q1) = m3(cos q1 − 1)

El equilibrio a estabilizar es la posicion vertical con el disco inercial alineado, lo cual secorresponde con q∗1 = q∗2 = 012.

Comentario 4.3.1. El modelo del pendulo inercial de disco puede verse de dos maneras:como un sistema definido en IR4, o tomando q1 modulo 2π, over S × IR3, siendo S elcırculo unidad. Para permitir leyes de realimentacion que no sean necesariamente 2π–periodicas en q1 adoptaremos la primera para el diseno del controlador. Sin embargo paradeterminar el dominio de atraccion observaremos el sistema en el cilindro.

12al ser simetrica la distribucion de masas del disco inercial, puede argumentarse que no hay razonparticular para alinearlo. A pesar de ello impondremos este objetivo para ilustrar la generalidad delenfoque.

Page 92: Hamiltonians based Control

78 4.3. El pendulo de disco inercial

4.3.2 Diseno del controlador

Se disenara el controlador IDA-PBC en tres pasos. En primer lugar se obtendra unarealimentacion del estado que moldeara la energıa en bucle cerrado funcion de energıapara estabilizar globalmente la posicion vertical superior, y a continuacion se inyectara elamortiguamiento necesario para lograr estabilidad asintotica mediante la realimentacionnegativa de la salida pasiva. Finalmente, se mostrara que es posible reemplazar la real-imentacion de la velocidad por su derivada “sucia”, manteniendose el resultado de esta-bilidad asintotica.

A. Moldeo de energıa

Observese, en primer lugar, que los elementos de la matriz de inercia M no dependen deq (sistema plano, del ingles flat), y por tanto podemos hacer J2 = 0 y elegir Md como unamatriz constante, cuyos elementos seran:

Md =

[a1 a2

a2 a3

](4.3.2)

a1 > 0, a1a3 > a22 (4.3.3)

Las desigualdad que se imponen a estos coeficientes tienen como finalidad asegurar quela matriz Md es globalmente definida positiva. La unica EDP que habra que resolver, portanto, es la de la energıa potencial, que viene dada por la ecuacion (4.2.13), es decir(

a1 + a2

I1

)∂Vd

∂q1

+

(a2 + a3

I2

)∂Vd

∂q2

= −m3senq1

Esta es una EDP lineal trivial cuya solucion general es de la forma

Vd(q) =I1m3

a1 + a2

cos(q1) + Φ (z(q)) (4.3.4)

z(q) = q2 + γ2q1 (4.3.5)

donde Φ es una funcion diferenciable arbitraria que debemos escoger para satisfacer la

condicion (4.2.4) para q∗ = 0. Asimismo se ha definido la constante γ2= −I1(a2 +

a3)/(I2(a1 + a2)). Tras algunos calculos sencillos se prueba que la condicion necesaria deestabilidad ∇qVd(0) = 0 se satisface si y solo si ∇Φ(z(0)) = 0, mientras que la condicionsuficiente de mınimo (suponiendo que es cierta la anterior) ∇2

qVd(0) > 0 se cumplira si lamatriz hessiana de Φ en el origen es definida positiva, y

a2 < −a1 (4.3.6)

La positividad del hessiano se satisface con la eleccion13 Φ(z) = k1

2z2, donde k1 > 0

representa una ganancia ajustable.

13Para simplicidad hemos tomado una funcion cuadratica de Φ. Claramente otras opciones, que puedenser seleccionadas para mejorar el rendimiento transitorio, son posibles; por ejemplo una funcion de satu-racion.

Page 93: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 79

El termino de moldeo de energıa de la entrada de control (4.2.11) viene dado por

ues = (GG)−1G(∇qV − MdM−1∇qVd)

=1

2

[(a1 − a2

I1

)∂Vd

∂q1

+

(a2 − a3

I2

)∂Vd

∂q2

+ m3senq1

]= γ1senq1 + kp(q2 + γ2q1) (4.3.7)

donde hemos definido

γ1=

a2

a1 + a2

m3 kp= −k1

[a1a3 − a2

2

I2(a1 + a2)

]

Recuerdese que a1, a2, a3 deberıa satisfacer las desigualdades (4.3.3) y (4.3.6). Algunoscalculos simples muestran que estas condiciones se traducen en

γ1 > m3 γ2 >I1

I2

γ1

γ1 − m3

(4.3.8)

lo cual, unido a kp > 0, define la region admisible para el ajuste de las ganancias (figura4.2).

−2 0 2 4 6 8 10−3

−2

−1

0

1

2

3

4

5

6

7

8

γ1

γ 2

γ1= m

3

I1

I2

γ2=

m3

Región permitida para γ

1 y γ

2

Figura 4.2: Region admisible para el ajuste de las constantes γ1 y γ2.

B. Inyeccion de amortiguamiento y analisis de estabilidad

La ley de control u = ues + udi produce el sistema[q

p

]=

[0 M−1Md

−MdM−1 0

][∇qHd

∇pHd

]+

[0

G

]udi

para el cual tenemos Hd = ∇pHdGudi. Claramente, sin inyeccion de amortiguamiento el

origen es un equilibrio estable. Para lograr que este equilibrio sea asintoticamente estable

Page 94: Hamiltonians based Control

80 4.3. El pendulo de disco inercial

proponemos anadir amortiguamiento realimentando la nueva salida pasiva ∇pHdG, la

cual puede ser calculada como

G∇pHd =1

a1a3 − a22

[−(a2 + a3)p1 + (a1 + a2)p2]

= k2(q2 + γ2q1) (4.3.9)

donde hemos definido k2= − I2(a1+a2)

a1a3−a22

> 0, con positividad derivada de (4.3.3) y (4.3.6).

Estamos en posicion de presentar el primer resultado de estabilizacion, que estableceque para toda condicion inicial —excepto un conjunto de medida cero—el IDA-PBC llevael pendulo a su posicion vertical superior con el disco alineado.

Proposicion 4.3.1. El pendulo de disco inercial (4.3.1) en bucle cerrado con la reali-mentacion estatica del estado IDA-PBC

u = γ1sen(q1) + kp(q2 + γ2q1) − kv(q2 + γ2q1) (4.3.10)

donde γ1, γ2 satisfacen (4.3.8), kp > 0 es una ganancia proporcional, y kv > 0 es unaganancia de inyeccion de amortiguamiento, tiene un equilibrio asintoticamente estable encero, siendo el dominio de atraccion el completo espacio de estados menos un conjunto demedida cero Lebesgue.

Demostracion. Primero observaremos que el sistema en bucle cerrado tiene los equilibrios(q, 0), donde q = (jπ, kπ), j, k ∈ IN , son las soluciones de ∇qVd(q) = 0. Recuerdese dela figura 4.1 que los puntos q1 con k par corresponden a la posicion deseada vertical,mientras aquiellos con k impar corresponden al pendulo colgando

De la Proposicion 1 y los anteriores desarrollos sabemos que los equilibrios corre-spondientes a la posicion vertical superior son estables. Mas aun, con algun controlbasico de las senales, es posible mostrar que—en una vecindad del cero—las trayec-torias del sistema en bucle cerrado satisfacen las condicion (fuerte) de observabilidad:Hd ≡ 0 ⇒ (q(t), p(t)) ≡ 0. Por tanto, la Proposicion 1 asegura que el equilibrio deseado esasintoticamente estable. Aunque la Proposicion 1 proporciona tambien una estimacion desu dominio de atraccion, se mostrara mas adelante que la estabilidad asintotica es “casi”global—en el sentido de la Proposicion 2.

A este fin, haremos la importante observacion de que la introduccion en el control(4.3.10) de una funcion no periodica de q1 obliga a considerar el sistema en IR4 en lugarde en S × IR3, y entonces Hd no serıa una funcion propia de (q, p) y no se podrıa asegurarel acotamiento de trayectorias (empezando fuera de Ωc.) Sin embargo, en las coordenadas(q1, q2, p1, p2), con q2 = q2 + γ2q1, el sistema en bucle cerrado esta en realidad definido enS × IR3, y la funcion de energıa

Hd(q1, q2, p1, p2) =1

2pM−1

d p +I1m3

a1 + a2

[cos(q1) − 1] +k1

2q22

es definida positiva y por tanto propia an lo largo de S × IR3. Entonces, dado que˙Hd = −kvk2q

22 ≤ 0, se tiene que todas las soluciones estan acotadas en S × IR3. Del

analisis previo sabemos que el equilibrio en cero es asintoticamente estable. Mostraremosahora que los otros equilibrios son inestables. De hecho, la linealizacion del sistema enbucle cerrado en estos equilibrios tiene autovalores con parte real estrictamente positiva

Page 95: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 81

y al menos un autovalor con parte real estrictamente negativa. Asociado al ultimo hayuna variedad estable, y las trayectorias que comienzan en el convergeran en la posicionde abajo. Sin embargo, como es bien sabido una variedad invariante s–dimensional deun sistema n–dimensional tiene medida cero Lebesgue si s < n; vease, a este respecto,(Krstic, Sepulchre & Praly 1995). Consecuentemente el conjunto condiciones iniciales queconvergen al equilibrio “indeseable” tiene medida cero.

Para completar la prueba estableceremos ahora que las trayectorias tambien estanacotadas en IR4. Hemos visto que los desarrollos previos demuestran que, en S×IR3, todaslas trayectorias estan acotadas y tienden a uno de los equilibrios (0, 0, 0, 0) o (π, 0, 0, 0).El primer equilibrio es asintoticamente estable y el segundo es hiperbolico. Ademas seha mostrado que casi cualquier solucion converge al equilibrio estable, siendo atrapadoen tiempo finito en un entorno suficientemente pequeno del mismo, llamese N0. Si ahorasumergimos el cilindro en el espacio Euclıdeo IR4, y consideramos los conjuntos de IR4

los cuales corresponden a N0 sobre el cilindro. Si N0 se escoge suficientemente pequeno,entonces estos conjuntos en IR4 no se intersectan. Como las soluciones en el cilindro noabandonan N0 la inmersion de las trayectorias no abandonara el entorno correspondienteen IR4. Esto completa la prueba.

C. Realimentacion de la salida

Es bien conocido en disenos basados en pasividad que a veces es posible obviar la medidade la velocidad realimentando en su lugar la derivada sucia de las posiciones (Kelly 1993).Esta caracterıstica proviene del hecho de que para la interconexion de mapas pasivospodemos reemplazar una realimentacion constante por otra realimentacion a traves decualquier funcion de transferencia real positiva preservando la estabilidad. En particular,para implementar la inyeccion de amortiguamiento podemos usar la realimentacion

udi = − kvD

τD + 1(q2 + γ2q1),

siendo D= d

dt, y kv, τ > 0 algunos parametros del filtro. La idea relevante es que udi es

implementable sin realimentacion de la velocidad. Esta consideracion nos lleva a nuestroresultado final contenido en la proposicion abajo. La prueba resulta a lo largo de laslıneas en la siguiente proposicion.

Proposicion 4.3.2. Considerese el pendulo de disco inercial (4.3.1) en bucle cerrado conla realimentacion dinamica de la salida IDA-PBC

u = −γ1sen(q1) + kp(q2 + γ2q1) + udi

donde γ1, γ2 satisfacen (4.3.8), kp > 0 es una ganancia proporcional; udi es un terminode inyeccion de amortiguamiento generado a partir de la derivada sucia de las posicionescomo

ϑ = −1

τϑ +

kv

τ 2(q2 + γ2q1)

udi = ϑ − kv

τ(q2 + γ2q1) (4.3.11)

con τ, kv > 0. Entonces, para toda condicion inicial —excepto un conjunto de medidacero—el pendulo converge hacia su posicion vertical superior con todas las senales internasacotadas uniformemente.

Page 96: Hamiltonians based Control

82 4.3. El pendulo de disco inercial

Demostracion. En primer lugar, notese que de (4.3.9) y (4.3.11) se obtiene

udi = −1

τudi − kv

k2τG∇pHd

Consecuentemente, si definimos la nueva funcion de energıa W (q, p, udi)= Hd + k2τ

2kvu2

di,podemos escribir el sistema en bucle cerrado en forma PCH como

q

p

udi

=

[

0 M−1Md

−MdM−1 0

] [0

kv

k2τG

][

0 − kv

k2τG

]− kv

k2τ2

∇qW

∇pW

∇udiW

Tenemos W = − k2

kv(udi)

2. La prueba se completa procediendo como en la Proposicion2@@@.

4.3.3 Resultados de simulacion

Se ha simulado la respuesta del pendulo de disco inercial usando los parametros I1 =0.1, I2 = 0.2,m3 = 10 y el controlador completo de realimentacion de estado con gananciasde ajuste γ1 = 30, γ2 = 0.2. Las siguientes graficas muestran la respuesta del sistemacomenzando en reposo con configuracion inicial q(0) = (3, 0). Por tanto el pendulo cuelgacasi en posicion vertical inferior.

Con el fin de ilustrar la influencia de la eleccion de kp y kv en el comportamientotransitorio, se han mostrado juntos varias graficas de q1(t) y q2(t), primero cambiandosolamente kp dejando kv constante en un valor de 10 como se muestra en la figura 4.3.Una simple observacion muestra que valores mayores de kp ralentizan la convergenciahacia el equilibrio. Si dejamos kp constante y cambiamos kv de 10 a 100, se obtienen lasgraficas de figura 4.4. Estas graficas muestran que, contra toda intuicion pero de forma nototalmente inesperada, las oscilaciones se atenuan mas rapidamente para valores menoresde kv! Finalmente, la figura 4.5 muestra el par de control aplicado cuando kp = 0.1 ykv = 10.

0 5 10 15 20 25 30 35 40−1.5

−1

−0.5

0

0.5

1

1.5

2

tiempo (segundos)

q1 (

rad)

Kp=1 Kp=0.1

0 10 20 30 40 50 60−3

−2

−1

0

1

2

3

tiempo (segundos)

q2 (

rad)

Kp=1 Kp=0.1

Figura 4.3: Evolucion de q1(t) (izquierda) and q2(t) (derecha) para valores diferentes de kp,dejando kv = 10.

Page 97: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 83

0 2 4 6 8 10 12 14 16 18 20−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

tiempo (segundos)

q1 (

rad)

Kv=50

Kv=100 Kv=10

0 5 10 15 20 25 30

−3

−2

−1

0

1

2

3

4

5

6

tiempo (segundos)

q2 (

rad)

Kv=10

Kv=50

Kv=100

Figura 4.4: Evolucion de q1(t) (izquierda) y q2(t) (derecha) para valores diferentes de kv, ykp = 0.1.

0 5 10 15 20 25−15

−10

−5

0

5

10

15

tiempo (segundos)

Con

trol

Tor

que

(Nm

)

Figura 4.5: Senal de control para kv = 10, y kp = 0.1.

4.4 El sistema de la bola en la viga

En esta seccion se disenara un controlador IDA-PBC para el conocido sistema de la bolaen la viga mostrado en la figura 4.6. En primer lugar, se demostrara que para todacondicion inicial (excepto un conjunto de medida cero) el controlador IDA-PBC llevara laviga a la orientacion correcta. A continuacion definiremos un dominio de atraccion parael equilibrio en el origen que garantiza que la bola se mantiene dentro de los lımites fısicosde la viga.

4.4.1 Modelo

Este sistema es un clasico que ocupa un lugar en los laboratorios de control de las univer-sidades de todo el mundo. Existen configuraciones alternativas y las ligeras variacionesen la construccion pueden dar lugar modelos con estructuras muy diferentes.

En general, para el modelado se desprecia la inercia rotacional de la bola. Este hecho esaun mas razonable cuando en lugar de la bola tenemos un pequeno carro sobre railes comoel construido recientemente en la universidad de Linz (figura 4.7). Esta configuracion tiene

Page 98: Hamiltonians based Control

84 4.4. El sistema de la bola en la viga

q2

q1

u

Figura 4.6: Sistema de la bola en la viga.

Figura 4.7: Sistema de la bola en la viga. Universidad de Linz, Austria.

una caracterıstica peculiar, consistente en que la lınea de avance del carro no intersecta conel eje de giro de la viga o rail. El carro esta levemente desplazado hacia arriba. La principalconsecuencia de este desplazamiento es que en el modelo aparecen elementos no diagonalesen la matriz de inercia en bucle abierto, a diferencia del modelo que emplearemos ennuestro desarrollo. En cualquier caso, este ultimo sirve como aproximacion bona fide ysera descrito a continuacion.

El modelo que emplearemos, el mas aludido en la literatura, fue presentado por Hauseret al. (Hauser, Sastry & Kokotovic 1992), donde se proponen las siguientes ecuaciones deEuler–Lagrange

(Jb

R2+ m

)q1 + mgsenθ − mq1θ

2 = 0(mq2

1 + J + Jb

)θ + 2mq1q1θ + mgq1 cos θ = τ (4.4.1)

donde q1, q2 son la posicion de la bola y el angulo de la viga, respectivamente. Las con-stantes J y Jb representan los momentos de inercia de la viga y la bola, respectivamente,mientras que m es la masa de la bola, R su radio y g la aceleracion de la gravedad devalor 9.8m/s. Finalmente, τ es el par de control aplicado a la viga.

Para traer al primer plano los parametros relevantes de nuestro desarrollo, haremosunas leves modificaciones. Si se desprecia la inercia rotacional de la bola frente a la de

la viga, dividimos ambas ecuaciones entre la masa de la bola m, y definimos u= τ/m

Page 99: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 85

tendremos

q1 + gsenθ − q1θ2 = 0(

q21 +

J

m

)θ + 2q1q1θ + grq1 cos θ = u (4.4.2)

ahora bien, dado que el momento de inercia de un barra de longitud L y masa M esML2/12, tendremos J/m = ML2/(12m). Si el sistema se construyera tal que la masa dela barra sea exactamente 12 veces la de la bola14, una medida razonable, la constante Laparecera de forma aislada en las ecuaciones Euler–Lagrange15, hecho que se explotara enel resto del desarrollo para asegurar que la bola permanece dentro de la viga.

q1 + gsen(q2) − q1q22 = 0

(L2 + q21)q2 + 2q1q1q2 + gq1 cos(q2) = u (4.4.3)

donde L es la longitud de la viga. Como estamos interesados en que las trayectorias de labola no superen esta longitud, hemos incluido explıcitamente L en el modelo. El modelohamiltoniano (4.2.1), (4.2.2) se obtiene definiendo las matrices

M(q1) =

[1 0

0 L2 + q21

], G =

[0

1

]

y la funcion de energıa potencial V (q) = gq1sen(q2). El objetivo del control es estabilizarla bola y la viga en su posicion de reposo con q1∗ = q2∗ = 0.

4.4.2 Diseno del controlador

Por razones pedagogicas, se separara el diseno del IDA-PBC en moldeo de energıa cinetica,moldeo de energıa potencial, estabilidad asintotica por inyeccion de amortiguamiento, yanalisis del transitorio.

A. Moldeo de energıa cinetica

Notese en primer lugar que M es funcion exclusivamente de q1, y por tanto lo razonablees proponer Md de la forma (4.3.2), siendo los coeficientes a1, a2, a3 funciones (a definir)tambien de q1. Definiremos la matriz

J2(q, p) =

[0 j(q, p)

−j(q, p) 0

]

14No es imprescindible para el desarrollo, es conveniente para la claridad de la exposicion.15De nuevo, el modelo puede verse tanto como un sistema definido en IR4 como en IR × S × IR2.

Page 100: Hamiltonians based Control

86 4.4. El sistema de la bola en la viga

con la funcion j tambien a definir. La ecuacion de moldeo de la energıa cinetica, trasdesarrollar sus componentes, toma la forma

0 =−2 p2

2q1

(L2+q12)2

− 2 ja2(q1)p1

∆+ 2 ja1(q1)p2

−a1 (q1)

((p1

ddq1

a3(q1)

∆− p1 a3(q1)

((d

dq1a1(q1)

)a3(q1)+a1(q1) d

dq1a3(q1)−2 a2(q1) d

dq1a2(q1)

)∆2

−p2d

dq1a2(q1)

∆+

p2 a2(q1)((

ddq1

a1(q1))a3(q1)+a1(q1) d

dq1a3(q1)−2 a2(q1) d

dq1a2(q1)

)∆2

)p1+(

−p1d

dq1a2(q1)

∆+

p1 a2(q1)((

ddq1

a1(q1))a3(q1)+a1(q1) d

dq1a3(q1)−2 a2(q1) d

dq1a2(q1)

)∆2

+p2

ddq1

a1(q1)

∆− p2 a1(q1)

((d

dq1a1(q1)

)a3(q1)+a1(q1) d

dq1a3(q1)−2 a2(q1) d

dq1a2(q1)

)∆2

)p2

)Para enfrentarnos a la complejidad de estas ecuaciones, realizaremos una transformacionmotivada por la siguiente descomposicion matricial

∇q1M−1d = −M−1

d (∇q1Md)M−1d

en la ecuacion original de moldeo de energıa cinetica (4.2.12). Tras una serie de manipula-ciones que seran estudiadas con la maxima generalidad en el capıtulo 5, y basandose en lopublicado en (Gomez-Estern, Ortega, Rubio & Aracil 2001), las ecuaciones diferencialesparciales del metodo IDA-PBC, se transforman en un sistema de ecuaciones diferencialesordinarias en los elementos de Md.

d

dq1

a1(q1) =2q1

(L2 + q21)

2

a22

a1

d

dq1

a2(q1) =2q1

(L2 + q21)

2

a2a3

a1

que ha de ser resuelto para a1, a2, de modo que observaremos a3 como un parametro“libre”. Para obtener dos ecuaciones con dos incognitas, fijaremos a3 = a2a1. Por tantopodremos facilmente obtener soluciones explıcitas del sistema de ecuaciones como

a1 =√

2(κ + q21), a2 = L2 + q2

1 (4.4.4)

siendo κ una constante de integracion libre que ha de ser escogida para asegurar que Md

sea definida positiva. Es evidente que a1 > 0 para todo κ > 0, y el determinante de Md

resultaa3a1 − a2

2 =(L2 + q2

1

) (q21 + 2κ − L2

)que es globalmente definido positivo, como se deseaba, para todo κ > L2

2. Por simplicidad,

se tomara κ = L2 en adelante. La matriz Md resultante es entonces

Md = (L2 + q21)

2(L2 + q21)

−1/2 1

1√

2(L2 + q21)

(4.4.5)

El moldeo de energıa cinetica es completado evaluando j en (4.2.12) y la Md calculadaarriba

j = q1

[p1 −

√2(L2 + q2

1)−1/2p2

](4.4.6)

Page 101: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 87

B. Moldeo de energıa potencial

Una vez determinadas la matrices de inercia e interconexion deseadas se procedera adefinir la energıa potencial en bucle cerrado de la solucion de (4.2.13), que en este caso seexpresa del siguiente modo

a1(q1)∂Vd

∂q1

(q) +a2(q1)

L2 + q21

∂Vd

∂q2

(q) = gsen(q2) (4.4.7)

Substituyendo las soluciones obtenidas para a1 y a2 en (4.4.4) se obtiene√2(L2 + q2

1)∂Vd

∂q1

+∂Vd

∂q2

= gsen(q2)

Se resolvera esta EDP empleando el programa de calculo simbolico Maple. Para ayudara Maple a encontrar una solucion adecuada introduciremos el cambio de coordenadasx1 = 1

Lq1, x2 = q2, y la EDP puede ser entonces reescrita como sigue

a√

1 + x21

∂Vd

∂x1

(x) + b∂Vd

∂x2

(x) = sen(x2)

donde hemos definido a=

√2Lg

and b= 1

g. Los comandos de Maple requeridos son

>equ:=a*diff(Vd(x1,x2),x1)*sqrt(1+x1\^2)+b*diff(Vd(x1,x2),x2)=sin(x2);

>sol:=pdsolve(equ);

lo cual produce (tras deshacer el cambio de variables) el siguiente resultado16

Vd(q) = −g cos(q2) + Φ (z(q))

z(q)= q2 − 1√

2arcsenh

(q1

L

)En esta ecuacion, Φ una funcion arbitraria diferenciable de z. Esta funcion debe serescogida para asegurar la asignacion del punto de equilibrio, es decir, para satisfacer(4.2.4) con q∗ = 0. A este fin, evaluaremos el gradiente

∇qVd(q) =

[ −1√2(L2+q2

1)∇zΦ(z(q))

gsen(q2) + ∇zΦ(z(q))

]

Evidentemente, una condicion necesaria para asignar el equilibrio en cero es ∇zΦ(z(0)) =0. Cabe comentar que, independientemente de la eleccion de Φ, (o la constante de inte-gracion κ), el bucle cerrado tiene otros puntos de equilibrio. Ciertamente, al ser z(0) = 0y senh(·) una funcion monotona creciente de primer y tercer cuadrante, ∇qVd(q) = 0 tiene

un numero contable de raıces dados por q = (Lsenh(√

2iπ), iπ), con i ∈ IN . Por otro lado,se tiene que solo el equilibrio donde, |q1| ≤ L es el equilibrio en cero. Por supuesto, estapropiedad es significativa a efectos practicos solo si somos capaces de mostrar que en lastrayectorias se cumple |q1(t)| ≤ L para todo t ≥ 0, tarea que se emprendera mas adelante.

Es importante recordar que, los equilibrios q2 = iπ con i par corresponden a la vigaen su orientacion original, mientras que para i impar la viga aparece rotada 180. Se

16Independientemente de la forma de obtener la solucion, su validez se puede verificar por sustitucion.

Page 102: Hamiltonians based Control

88 4.4. El sistema de la bola en la viga

demostrara a continuacion que, para una eleccion adecuada de Φ, podremos hacer losprimeros equilibrios estables y los ultimos inestables.

Para estudiar la estabilidad de los equilibrios comprobaremos la positividad del Hes-siano de Vd, evaluado en q, que toma la forma

∇2qVd(q) =

1

2(L2+q21)∇2

zΦ(z(q)) − 1√2(L2+q2

1)∇2

zΦ(z(q))

− 1√2(L2+q2

1)∇2

zΦ(z(q)) g cos(q2) + ∇2zΦ(z(q))

−0.6−0.4

−0.20

0.20.4

0.6−4

−3

−2

−1

0

1

2

3

4

0

2

4

6

8

Figura 4.8: Energıa potencial Vd en bucle cerrado.

Teniendo en cuenta que cos(q2) = ±1, dependiendo de si la viga esta en su posi-cion original o rotada 180, el determinante de esta matriz es ± g

2(L2+q21)∇2Φ(z(q)), y la

estabilidad (inestabilidad) del equilibrio queda determinada por el signo de ∇2Φ(z(q)).

Elegiremos entonces Φ(z) = kp

2z2, con kp > 0. De este modo, los equilibrios correspon-

dientes a la orientacion original de la barra seran estables, mientras que aquellos con labarra rotada son inestables. La nueva energıa potencial (vease la figura 4.8), toma laforma

Vd = g[1 − cos(q2)] +kp

2

[q2 − 1√

2arcsenh

(q1

L

)]2

(4.4.8)

donde hemos anadido una constante para trasladar el mınimo a cero. Observense laslıneas de nivel de la energıa potencial en bucle cerrado en las figuras 4.9 y 4.10. Alcompararlas se aprecia que las curvas de nivel de Vd sufren una especie de escalado en eleje q1 al aumentar el valor de kp. Este hecho, utilizado concienzudamente, puede servirpara moldear los subconjuntos de nivel de la funcion de Lyapunov a fin de mejorar elcomportamiento transitorio, como se vera mas adelante en este capıtulo.

C. Analisis de estabilidad asintotica

Para calcular la ley de control final determinaremos en primer lugar el termino de moldeode energıa ues a partir de (4.2.11), que en este caso toma la forma

ues = ∇q2H− (MdM−1)(2,1)∇q1Hd− (MdM

−1)(2,2)∇q2Hd +(J2M−1d )(2,1)p1 +(J2M

−1d )(2,2)p2

Page 103: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 89

Figura 4.9: Curvas de nivel de Vd(q) alrededor del origen para kp = 0.05.

Figura 4.10: Curvas de nivel de Vd(q) alrededor del origen para kp = 0.01.

Reemplazando las funciones obtenidas para Md y j, y tras algunos calculos directos seobtiene la expresion

ues =q1√

2(L2 + q21)

[−√

L2 + q21p

21 +

√2p1p2 +

1√L2 + q2

1

p22

]+ ξ(q) (4.4.9)

donde

ξ(q)= gq1 cos q2 − g

√2(L2 + q2

1)senq2 − kp

√L2 + q2

1

2

(q2 − 1√

2arcsenh

(q1

L

))

La fase de diseno del controlador se culmina con el termino de inyeccion de amortiguamien-to (4.2.8), que resulta

udi =kv

L2 + q21

(p1 −

√2

L2 + q21

p2

)(4.4.11)

Es importante subrayar que, a pesar de su aparente complejidad, el controlador estadefinido globalmente y en su exponente maximo es cuadratico. Esta es una propiedadmuy importante para el control, ya que la saturacion debe ser evitada en aplicacionespracticas, ası como la complejidad del calculo. Ademas, el papel de los parametros deajuste admite un sencillo analisis: kp es un ganancia proporcional bona fide en posicion,ya que multiplica terminos que crecen linealmente en q, y kv inyecta amortiguamientoa lo largo de una direccion especificada de las velocidades. El ajuste del controlador sesimplificara por esta caracterıstica, tal y como se ilustra en el apartado de simulaciones.

Page 104: Hamiltonians based Control

90 4.4. El sistema de la bola en la viga

Daremos en este momento un primer resultado de estabilidad asintotica similar a aquelobtenido para el pendulo de disco inercial, pero con la diferencia fundamental de que laconvergencia a cero de la bola solo es local. Un resultado mas practico, que toma enconsideracion la longitud finita de la viga, se desarrollara en el proximo apartado.

Proposicion 4.4.1. Considerese el modelo de la bola en la viga (4.4.3) en bucle cerradocon la realimentacion estatica del estado IDA-PBC u = ues + udi, con (4.4.9)–(4.4.11),y kp, kv > 0. Entonces, el origen es un equilibrio asintoticamente estable con dominio de

atraccion Ωc donde Ωc= (q, p) ∈ IR4 | Hd(q, p) ≤ c, donde Hd toma la forma (4.2.3),

Md viene dada por (4.4.5), y Vd y c definidas segun (4.4.8), (4.2.9), respectivamente.Adicionalmente, para todas las condiciones iniciales, excepto un conjunto de medida cero,la bola convergera asintoticamente al origen con inclinacion nula cd la viga, es decir, para“casi” todas las trayectorias se tiene que limt→∞ q2(t) = 0.

Demostracion. La estabilidad del equilibrio en cero se desprende de verificar las condi-ciones de la Proposicion 4.2.1. Sin embargo, para establecer la estabilidad asintotica, enlugar de comprobar la detectabilidad se invocara el teorema de Matrosov17. Para ello setomara una funcion auxiliar W (q) = q1 + q2 cuya derivada a lo largo de las trayectoriasdel sistema en bucle cerrado es

W = p1 +1

L2 + q21

p2

Ahora, Hd = 0 si y solo si

p1 =

√2

L2 + q21

p2

vease (4.4.11), el cual (dado que el rango de q1 comprende (−∞,∞)) define un sectortriangular dentro del primer y tercer cuadrante del plano p1 − p2. Por otro lado, el sectordonde W = 0 vive en el los cuadrantes dos y cuatro. Consecuentemente se obtiene que Wes una funcion no desvaneciente definida en el conjunto (q, p)|Hd = 0, y las condicionesdel teorema se satisfacen (en un entorno de cero) siendo Hd la funcion de Lyapunovrequerida.

De forma similar a la prueba de la Proposicion 4.3.1, para probar la propiedad de“cuasi” convergencia establecida previamente observaremos al sistema en IR × S × IR2

para establecer el acotamiento de todas las trayectorias. Para sumergir el sistema en estecilindro cambiaremos la primera coordenada por

q1 = q2 − 1√2arcsenh

(q1

L

)(4.4.12)

y definiremos coherentemente la funcion de energıa

Hd(q1, q2, p)=

1

2pM−1

d (q1, q2)p + Vd(q1, q2) (4.4.13)

Vd(q1, q2)= g(1 − cos q2) +

kp

2q21 (4.4.14)

que es propia y definida positiva en IR × S × IR2, y con derivada semidefinida negativa.Esto prueba la acotacion de todas trayectorias en IR × S × IR2. El resto de la prueba

17Vease, por ejemplo, el teorema 5.5 de (Rouche & Mawhin 1980).

Page 105: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 91

es similar a la presentada para el pendulo de disco inercial, recordando que para todoesquilibrio estable tendremos el comportamiento asintotico deseado en q2, mientras quelos otros equilibrios son inestables.

Antes de cerrar este apartado cabe destacar que en este ejemplo no es posible reem-plazar medidas de velocidades por las derivadas sucias de la posicion. Esto se debe a que enel controlador de la bola en la viga, ademas del termino de inyeccion de amortiguamiento,el termino de moldeo de energıa depende explıcitamente de p.

D. Comportamiento transitorio

Se ha establecido en la Proposicion 4.4.1 que en bucle cerrado el origen es un equilibrioasintoticamente estable con la energıa total como funcion de Lyapunov.

En este apartado se refinara este analisis, estudiando el efecto del parametro de ajustekp en el tamano del dominio de atraccion, y cuantificando explıcitamente un conjunto decondiciones iniciales tales que la bola permanece todo el tiempo dentro de los lımites dela viga es decir, |q1(t)| ≤ L para todo t ≥ 0.

En primer lugar, cabe destacar que a medida que Hd decrece y siempre que la energıacinetica sea no negativa, tendremos que Vd(q(t)) ≤ Hd(q(0), p(0)), y por tanto los subcon-juntos de nivel Vd (definidos por Vd ≤ c para cada constante c) son conjuntos invariantespara q(t). Adicionalmente, si podemos demostrar que la energıa cinetica esta acotada,entonces los conjuntos acotados proporcionan una estimacion del dominio de atraccion.

Antes de continuar cabe puntualizar que en un campo potencial como el de Vd, de-bido a la existencia de funciones periodicas, algunos conjuntos de nivel definidos comox ∈ IRn|Vd(x) < c pueden descomponerse en una serie infinita discreta de componentesconexas, desconectadas entre sı. Si este es el caso, nos interesaremos por la componenteque contiene al origen, al ser este el equilibrio a estabilizar (vease la figura 4.11).

Componentes del conjunto de nivelVd<c

q1

q2

Subconjunto conexo de Vd<cconteniendo al origen

Figura 4.11: Componentes desconectadas del conjunto de nivel Vd(x) < c.

Para estudiar estos conjuntos es conveniente trabajar en las nuevas coordenadas (q1, q2, p1, p2),donde q1 se introdujo en (4.4.12)18. En estas coordenadas la funcion de energıa po-

18Notese que el mapeo de coordenadas (q1, q2) → (q1, q2) define un difeomorfismo global, y recuerdese

Page 106: Hamiltonians based Control

92 4.4. El sistema de la bola en la viga

tencial se convierte en (4.4.14)—que tiene la misma expresion analıtica que la funcionde energıa total del pendulo simple—y los asociados subconjuntos de nivel, es decir,(q1, q2) | Vd(q1, q2) ≤ c, toman la forma mostrada en la figura 4.12. En este apartadoestamos interesados en la particion conexa que contiene al origen, y que denotaremos porΞc.

El siguiente lema basico sera instrumental en adelante.

Lema 4.4.2. El conjunto Ξc esta acotado si y solo si c < 2g.

Demostracion. El hecho de que todos los elementos q1 en Ξc estan acotados para cualquierc finita es obvio, al ser kp

2q21 ≤ c − g(1 − cos q2). Por tanto nos concentraremos exclusiva-

mente en la acotacion de q2.

(⇐) Se tiene la siguiente implicacion

V (q1, q2) < c ⇒ cos(q2) > 1 − c

g> −1

donde se ha usado la positividad de kp en la primera desigualdad y c < 2g para obtener lasegunda. Cabe destacar que la desigualdad estricta excluye un intervalo en torno a q2 = πy q2 = −π de Ξc. Esto demuestra que Ξc ⊂ (q1, q2) | q2 ∈ (−π, π), y consecuentementeq2 esta acotada.

(⇒) La necesidad se demostrara por contradiccion. Para ello, supondremos que c ≥ 2g.Entonces esta claro que Ξc ⊃ (q1, q2) | q1 = 0, que es un conjunto no acotado, yconsecuentemente q2 es no acotada.

10 20 30 40 50 60 70

2

4

6

8

10

12

14

16

18

20

q2

q1 Ξc

Figura 4.12: Curvas de nivel de V (q1, q2).

Nos encontramos en situacion de presentar el principal resultado de esta seccion. Parasimplificar la notacion usaremos (·)o para designar el valor de las funciones en el instanteinicial t = 0.

Proposicion 4.4.3. Considerese el modelo de la bola en la viga (4.4.3) en bucle cerradocon la realimentacion estatica del estado IDA-PBC u = ues + udi, con (4.4.9)–(4.4.11), ykv > 0.

que la acotacion de los subconjuntos de nivel es invariante bajo la accion de difeomorfismos.

Page 107: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 93

(i) Siempre es posible calcular una constante kMp > 0, funcion de las condiciones ini-

ciales (qo, po), tales que para todo kp ≤ kMp , el conjunto

(q, p) | 1

2pM−1

d (q)p + g(1 − cos q2) < 2g (4.4.15)

es una estimacion del dominio de atraccion del equilibrio en el origen. En particular,todas las trayectorias que comiencen con velocidad cero y qo

2 ∈ (−π, π) convergeranasintoticamente al origen.

(ii) Fijemos kp ≤ kMp y supongamos que |qo

1| < L. Entonces,(q, p) | 1

2pM−1

d (q)p + g(1 − cos q2) +kp

2

(q2 − 1√

2arcsenh

(q1

L

))<

1

8

kpg

2kp + g

(4.4.16)

es un dominio de atraccion del equilibrio en cero, tal que todas las trayectoriascomenzando en este conjunto satisfacen |q1(t)| < L para todo t ≥ 0.

Demostracion. Se ha mostrado previamente que los subconjuntos de nivel de Vd(q) sonconjuntos invariantes para q(t). Adicionalmente, el Lema 4.4.2 establece que la particionconexa de los subconjuntos de nivel de Vd(q) que contenga el origen esta acotada si y solosi c < 2g. Por tanto, haciendo c = Ho

d en el Lema 4.4.2 se desprende que este conjuntoestara acotado si y solo si

Hod =

1

2(po)M−1

d (qo)po + g(1 − cos(qo2)) +

kp

2q21 < 2g

Claro esta que, si los dos primeros terminos son estrictamente menores que g, podremossiempre encontrar una cota superior para kp tal que la desigualdad se mantenga. Paracompletar la prueba del punto (i) de la proposicion cabe comentar que, para todas lastrayectorias comenzando en el conjunto (4.4.15), q(t) esta acotado. Por tanto, de (5.9.11),concluimos que en este conjunto M−1

d (q(t)) > εI para cierta constante ε > 019. Esto, unidoal hecho de que 1

2p(t)M−1

d (q(t))p(t) < Hod , establece que la correspondiente p(t) tambien

esta acotada y el conjunto (4.4.15) es una estimacion del dominio de atraccion.

La prueba de (ii) procede a continuacion. De (4.4.12) se tiene que

|q1| ≤ L ⇔ |q2 − q1| ≤ 1√2arcsenh(1) (4.4.17)

donde hemos usado el hecho de que arcsenh(·) es impar y monotona. La region definidapor (4.4.17) aparece en la figura 4.13 junto a los dos conjuntos Ξc. Nuestro problema esentonces calcular el mayor valor de c tal que el conjunto Ξc no intersecte las lıneas q1 = q2±1√2arcsenh(1). Para simplificar las expresiones usaremos la desigualdad 1√

2arcsenh(1) > 1

2,

y comprobaremos la interseccion con las lıneas mas “cercanas” q1 = q2 ± 12

en la bandaq2 ∈ [−1

2, 1

2]. A continuacion, substituiremos q1 = q2 + 1

2en la ecuacion del contorno de

Ξc, y emplearemos la cota cos q2 < 1 − q22

4, que es valida en la mencionada banda, para

obtener la primera de las siguientes desigualdades

g(1 − cos q2) +kp

2

(q2 +

1

2

)> g

q22

4+

kp

2

(q2 +

1

2

)> c

19En estas circunstancias se dice que la matriz de inercia es uniformemente definida positiva.

Page 108: Hamiltonians based Control

94 4.4. El sistema de la bola en la viga

La segunda desigualdad se cumple para todo c < 18

kpg

2kp+gy todo q2 en la banda. Esto

demuestra que el contorno de Ξc no intersecta las lıneas lımite dentro de la banda. Porotra parte no pueden intersectar fuera del intervalo porque c > g(1− cos(1

2)) implica que

en Ξc, |q2| < 12, y esta cota en c es menos estricta que c < 1

8

kpg

2kp+g. Esto completa la

demostracion.

10 20 30 40 50 60 70

2

4

6

8

10

12

14

16

18

20

q2

q1

Vd<c

2⇒ |q

1|<L

q1=q

2+m

q1=q

2−m

Vd>c

2≠ |q

1|<L

Vdc

2≠ |q

1|<L

Figura 4.13: Interpretacion grafica de |q1| < L, con m= 1√

2arcsenh(1).

4.4.3 Metodo aproximado de la elipse exterior

Pese a haber determinado de forma exacta el maximo conjunto de nivel acotado de lafuncion de energıa potencial en el sistema bola y viga controlado mediante IDA-PBC,esta es una solucion afortunada que deriva de la similitud entre la funcion de energıapotencial tras el cambio de variable q1 ⇒ q1 y la energıa mecanica del pendulo simple.

Bajo la suposicion de que no siempre nos encontraremos en tales circunstancias, semostrara a continuacion un metodo alternativo que inicialmente sirvio para abordar elmismo problema de la bola y la viga de manera aproximada y que presenta la ventajade admitir formas mas generales para la funcion Vd obtenida como solucion en el metodoIDA-PBC. Se basa en una aproximacion de tercer orden del desarrollo en serie de Taylorque permite determinar si una elipse contiene ıntegramente a una determinada curva denivel de Vd, en cuyo caso se concluye que esta es cerrada.

Sea una trayectoria comienza en cierta posicion inicial (q, p) = (q(0), p(0)) con energıainicial Hd(0) ≡ Hd(q(0), p(0)). Como se ha comentado previamente la ecuacion

Vd(t) ≤ Hd(0)

establece una cota superior para la energıa potencial, y lo que nos proponemos es de-terminar si todos los subconjuntos de nivel de Vd por debajo de esa cota son conjuntoscerrados y acotados. En caso afirmativo, tendremos que la energıa inicial determina que

Page 109: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 95

las trayectorias estan contenidas en curvas de nivel cerradas que permiten calcular co-tas para las trayectorias. Evidentemente, Hd(0) depende de las condiciones iniciales delsistema.

Al igual que se hizo en la seccion anterior, emplearemos un cambio de coordenadas

(z, q2, p1, p2), z = q2− 1√2arcsenh

(q1√κ

), recordando que dicho cambio representa un difeo-

morfismo global. La funcion de energıa en las nuevas variables Hd(z, q2, p1, p2) = Hd(q, p)toma la forma

Hd=

γ

2pT M−1

d p + V (z, q2) (4.4.18)

V (z, q2)= −γg(1 − cos q2) +

kp

2z2 (4.4.19)

donde la matriz Md(z, q2) = γMd(q1, q2) ha sido tambien introducida para recalcar ladependencia lineal de Md con 1

γ. Para encontrar una estimacion de la region de atraccion

con trayectorias acotadas emplearemos un hecho matematico elemental

1 − cos q2 >q22

4∀q2 ∈

[−2π

3,2π

3

](4.4.20)

Para demostrarlo solo hay que observar el termino indeterminado de cuarto orden enforma diferencial (lagrangiana) del desarrollo en serie de Taylor de la funcion cos(x) entorno a x = 0. Esto nos lleva al siguiente lema:

Lema 4.4.4. Sea Ωc= (z, q2) | V (z, q2) ≤ c, para cierto valor c > 0, un subcon-

junto de nivel de la funcion V (z, q2) definida en (4.4.19). Sea Ω0c el mayor subconjun-

to conectado de Ωc que incluya al origen (vease la figura 4.11) y defınase el conjunto

Sc= (z, q2) | γg

4q22 + kp

2z2 ≤ c que esta delimitado por una elipse para cualesquiera

valores γ > 0, kp > 0.

Para todo c que satisfaga c < γg π2

9se tiene Ω0

c ⊂ Sc

Demostracion. Sea D = (z, q2) | q2 ∈ [−2π

3, 2π

3

]. Si c > γg π2

9, entonces ∃ z ∈ IR tal

que γg4q22 + kp

2z2 = c, y por tanto Sc ⊂ D.

En virtud de (4.4.20) se tiene ∀ (z, q2) ∈ D, V (z, q2) > γg4q22 + kp

2z2 ⇒ (Ωc ∩ D) ⊂

(Sc ∩ D) = Sc

Pero al ser Ωc ∩D un conjunto conexo que contiene al origen, entonces Ωc ∩D = Ω0c ∩D,

y probaremos que Ω0c ∩ D = Ω0

c (⇔ Ω0c ⊂ D) por contradiccion:

Ω0c ⊂ D ⇔

i) Ωc ∩ D = ∅ lo cual es imposible, ya que 0 ∈ Ωc ∩ Dii) Ωc ∩ (R2\D) = ∅ y (i) ⇒ ∂Ω0

c ∩ ∂Sc = ∅ (porque Ω0c es conexo)

donde ∂Ω0c y ∂Sc son las lıneas de contorno de Ω0

c y Sc respectivamente. Sin embargo estasno intersectan dentro de D porque en este conjunto una solucion (z, q1) de V (z, q2) = c

no puede satisfacer la ecuacion γg4q22 + kp

2z2 = c. Por tanto se deduce de (i) y (ii) que

Ω0c ⊂ D y necesariamente Ω0

c ⊂ Sc.

Page 110: Hamiltonians based Control

96 4.4. El sistema de la bola en la viga

Este lema demuestra la existencia de un subconjunto conexo de V (q2, z) < c dentrode Sc en torno al origen para un rango de valores de c. Este conjunto Ω0

c es unico en elintervalo q2 ∈ [−π, π], y en el siguiente lema se mostrara que, bajo ciertas condiciones,contendra todas las trayectorias del sistema.

Lema 4.4.5. Sea (z0, q02, p0) el estado del sistema de la bola y la viga en el instante t = 0.

Sea h(z0, q02, p0)

= 1

2pT

0 M−1d (z0, q

02)p0 + g(1 − cos q0

2). Entonces, ∀(z0, q02, p0) ∈ h < π2

9,

∀ kp

γ< 2

z20

(π2

9− h

)las trayectorias (z(t), q2(t)) caen en Ω0

c ⊂ Sc, y p(t) ∈ L∞.

Demostracion. Partiendo del hecho de la disipatividad con respecto a Hd en bucle cerradohemos mostrado que todas las trayectorias estan confinadas en el conjunto V (z, q2) <Hd(0). Si ahora hacemos c = Hd(0) en el lema 4.4.4 se tiene que Ω0

c = (V (z, q2) <

Hd(0)) ∩ D esta acotado por la elipse Sc si Hd(0) = γh + kp

2z20 < γg π2

9lo cual es cierto

si y solo si h < π2

9, y kp

γ< 2

z20

(π2

9− h

).

Al ser Ω0c un subconjunto conexo completo de Ωc = q|V (q) < c, se trata de un invariante,

y por tanto (z(t), q2(t)) ⊂ Ω0c si (z0, q

02, p0) ∈ Ωc, lo cual es cierto para todas las condiciones

iniciales que cumplan q02 ∈ [−π, π] y tengan una energıa menor que Hd(0).

Mas aun, dado que (z(t), q2(t)) ∈ L∞ ⇒ ∃α > 0 | α < λmin(M−1d (z(t), q2(t))) ∀t. En-

tonces 12pT M−1

d p > α||p||2 y empleando el hecho de que Vd(t) ≥ 0 ⇒ 12pT M−1

d p < Hd(0)se deduce que α||p||2 < Hd(0) para concluir que p ∈ L∞.

Este resultado caracteriza la region de atraccion del origen como una condicion sobrela energıa inicial Hd(0) y define un rango valido para kp

γ. Un caso interesante es el sistema

arrancando con velocidad nula, para que la pertenencia de (z0, q02, p0) al conjunto Sc se

reduzca a

cos(q2) > 1 − π2

9≈ −0.01 (4.4.21)

condicion que se satisface para todo q02 ∈ [−π

2, π

2

]. Esto puede interpretarse como una

condicion suficiente para la existencia de un par de valores kp, γ tal que en bucle cerrado elestado inicial (z0, q

02, 0, 0) se encuentra dentro del dominio de atraccion del origen. Notese

que esta condicion no depende de z y por tanto tampoco de q1, pero la eleccion de kp

γsı lo

hace. Notese tambien que para velocidades iniciales distintas de cero la energıa cineticaes un termino positivo anadido al segundo miembro de (4.4.21), y se convierte en unacondicion necesaria pero no suficiente.

Otro hecho importante es que la construccion de curvas de nivel acotadas que satisfaganV (z, q2) = c al aumentar el valor de c termina por encontrar un lımite superior absoluto.Esto sucede porque si las curvas de nivel de V han de ser cerradas, estas deben caerenteramente dentro del intervalo q2 ∈ [−π, π] (debido a la periodicidad de q2, si no secierran en este intervalo, no se cierran nunca). Por tanto la mayor curva de nivel contenidaen este intervalo es aquella que intersecta el eje q2 en q2 = π. Sustituyendo este punto enla ecuacion V (z, q2) = c se obtiene

max

c > 0 | V (z, q2) ≤ c esta acotado

= 2γ

El resto del analisis (garantıa de permanencia de la bola dentro de los lımites de laviga) es equivalente a lo presentado en la seccion anterior. Si embargo vamos a observar

Page 111: Hamiltonians based Control

Capıtulo 4. Control de sistemas subactuados mediante el metodo IDA-PBC 97

el efecto de la constante κ (que antes se hizo igual a 1) sobre la posicion de los equilibrios.En las coordenadas (z, q2), una trayectoria dentro de los lımites de la barra satisface elhecho

|q1| ≤ L ⇔|q2 − z| ≤ 1√

2arcsenh

(L√κ

)= m

(4.4.22)

Esto se debe a que

|q1| ≤ L ⇔∣∣∣senh

(√2(q2 − z)

)∣∣∣ <L√κ⇔ arcsenh

(−L√κ

)≤

√2(q2 − z) ≤ arcsenh

(L√κ

)

donde se ha empleado el hecho de que arcsenh(x) es monotona impar (de clase K∞).La ecuacion (4.4.22) define dos lıneas paralelas z = q2 ± m sobre el plano (z, q2) dependiente 1 (ver figura 4.13). Consecuentemente, el conjunto Ω0

c = (z, q2)|V (z, q2) < cesta completamente contenido en |q1| < L si y solo si el contorno ∂Ω0

c no intersecta lalınea z = q2 ± m.

El valor de m es, por tanto, fundamental para diseno con especificaciones de sobre-oscilacion y puede ser alejado de la curvas de nivel de interes reduciendo el valor de κhasta su mınimo permitido, que se encuentra en L2

2+ ε para cierto valor ε > 0 pequeno

pero no nulo. Esto proporciona un maximo absoluto para m en 1√2arcsenh(2).

4.4.4 Simulaciones

Se ha realizado un conjunto de simulaciones del sistema de la bola en la viga tomandog = 9.8, kp = 1 . Los resultados aparecen en la figura 4.14. Las graficas en la fila superiorrepresentan la posicion de la bola q1 y el angulo de la viga q2 para una velocidad inicialnula y diferentes posiciones iniciales y valores de los parametros. Al pie de cada unade ellas se muestran las graficas correspondientes con el hamiltoniano deseado Hd y lafuncion de energıa potencial Vd. Cada columna en la grafica corresponde a una simulacionaislada. En las dos primeras simulaciones se puede observar el efecto de aumentar laconstante de amortiguamiento kv comenzando con la bola en posicion vertical. Noteseque la convergencia no es siempre acelerada para valores mayores de kv, al entrar enescena nuevas oscilaciones. La tercera simulacion comienza en reposo con la viga enposicion horizontal y la bola en el extremo de la viga. En sucesivas simulaciones, se haobservado que el controlador funciona mejor comenzando en q2(0) = 0 y cualquier valorde q1(0). Para asegurar que la condicion inicial se halla en el dominio de atraccion, kp seha escogido por debajo de kM

p de acuerdo con la Proposicion 4.4.3. La figura 4.14 tambienilustra la naturaleza monotona de Hd junto al hecho de que Vd(t) < Hd(t) < Hd(0) paratodo t.

El efecto de la viga de longitud finita y el uso de la ultima parte de la Proposicion 4.4.3se ilustra mediante simulacion en la figura 4.15. Los valores asignados a los parametrosson g = 9.8, kp = 1, kv = 50, y L = 10. Se ha calculado que la condicion para mantener labola dentro de los lımites de la viga es Hd(0) < 0.1038. La primera simulacion comienzaen el estado (q0, p0) = (8, 0, 1, 1) con Hd(0) = 0.1837. Debido a la velocidad inicial,el controlador es incapaz de atrapar la bola antes de abandonar el lımite de la barra(L = 10). En la segunda simulacion el sistema parte del estado (q0, p0) = (6, 0, 0.5, 1)y Hd(0) = 0.0928. Por tanto, la cota |q1| < L esta garantizada por el diseno y ası loscorroboran los resultados de la simulacion.

Page 112: Hamiltonians based Control

98 4.4. El sistema de la bola en la viga

0 50 100-150

-100

-50

0

50q1(0)=0.0, q2(0)=1.6, Kv=20, L=0.5

q1(c

ont.)

, q2(

disc

ont.)

Posicion frente al tiempo(s)0 50 100

-150

-100

-50

0

50q1(0)=0.0, q2(0)=1.6, Kv=1, L=0.5

q1(c

ont.)

, q2(

disc

ont.)

Posicion frente al tiempo(s)0 100 200 300

-10

-5

0

5

10q1(0)=10.0, q2(0)=0.0, Kv=50, L=10.0

q1(c

ont.)

, q2(

disc

ont.)

Posicion frente al tiempo(s)

0 50 1000

5

10

15q1(0)=0.0, q2(0)=1.6, Kv=20, L=0.5

Hd(

cont

.), V

d(di

scon

t.)

Energia frente al tiempo(s)0 50 100

0

5

10

15q1(0)=0.0, q2(0)=1.6, Kv=1, L=0.5

Hd(

cont

.), V

d(di

scon

t.)

Energia frente al tiempo(s)0 100 200 300

0

0.05

0.1

0.15

0.2q1(0)=10.0, q2(0)=0.0, Kv=50, L=10.0

Hd(

cont

.), V

d(di

scon

t.)

Energia frente al tiempo(s)

Figura 4.14: Simulaciones de la bola en la viga comenzando en reposo.

0 50 100 150 200 250 300-8

-6

-4

-2

0

2

4

6

8

10

12La bola sobrepasa el extremo de la barra

q1(c

ont.)

, q2(

disc

ont.)

tiempo(s) 0 50 100 150 200 250 300-6

-4

-2

0

2

4

6

8La posición de la bola es siempre inferior a L

q1(c

ont.)

, q2(

disc

ont.)

tiempo(s)

Figura 4.15: sistema de la bola en la viga comenzando con velocidad inicial no nula.

Page 113: Hamiltonians based Control

Capıtulo 5

Reduccion del metodo IDA-PBCpara sistemas subactuados

5.1 Introduccion

Se observo en el capıtulo anterior que la principal virtud del metodo IDA-PBC resideen que la funcion de energıa total en bucle cerrado se obtiene –mediante la solucion deuna ecuacion diferencial parcial (EDP)– como un resultado de nuestra eleccion de lainterconexion de subsistemas y el amortiguamiento. Tal y como ilustran los ejemplosanalizados, este sistema es en general de difıcil solucion.

La principal aportacion de este capıtulo es la definicion de una clase de sistemasmediante un conjunto de condiciones facilmente satisfechas, que admiten ciertas manip-ulaciones algebraicas de las EDPs dadas por el metodo IDA-PBC para dar lugar a unsistema reducido equivalente de ecuaciones diferenciales ordinarias (EDOs).

Estas ecuaciones son faciles de resolver, especialmente en sistemas de dos grados delibertad. Las soluciones obtenidas mediante esta tecnica se aplican al moldeo de energıaen problemas de estabilizacion de sistemas subactuados con cierto grado de generalidad.Dichas soluciones proporcionan la matriz de inercia Md (moldeo energıa cinetica) y lafuncion de energıa potencial Vd, ambos en bucle cerrado. Para disenar la ley de controlel resto del procedimiento presentado en el capıtulo anterior es de directa aplicacion.

Mediante la nueva formulacion, se obtiene un controlador suave con una amplia cuencade atraccion para los sistemas de la bola en la viga y el pendulo invertido en carro. Masaun, para sistemas de dos grados de libertad y un actuador, comprendidos en esta clase,las EDOs admiten una reparametrizacion de los elementos de la matriz de inercia en buclecerrado que conducen a una solucion algebraica directa del sistema de ecuaciones. Esteprocedimiento completo se ilustra con el ejemplo del pendulo invertido.

Ademas, analizando las ecuaciones reducidas , se arroja una luz sobre problemas comola perdida de controlabilidad en ciertos puntos, como es el caso del pendulo en su posicionhorizontal.

La exposicion se desarrollara en el siguiente orden. En primer lugar, se presentaranlos antecedentes existentes en cuanto a metodos de reduccion y resolucion de ecuacionesde ajuste (matching conditions) para metodos de control basados en la estructura la-

99

Page 114: Hamiltonians based Control

100 5.2. Reduccion de las EDPs de ajuste en metodos lagrangianos

grangiana. A continuacion se dara una definicion de la clase de sistemas hamiltonianospara los que es valida la reduccion aquı propuesta. En las secciones siguientes se detallanlos desarrollos que conducen a las reducciones de las ecuaciones de moldeo de energıacinetica y potencial, ilustrando su aplicacion de forma paralela mediante conocidos ejem-plos de sistemas subactuados. Se ampliara el estudio a un sistema de orden mayor quedos contenido en la clase reducible y a un sistema no controlable. El capıtulo se concluyecon la presentacion de resultados de simulacion de dichos sistemas. Los resultados delcapıtulo dieron lugar a la publicacion (Gomez-Estern, Ortega, Rubio & Aracil 2001).

5.2 Reduccion de las EDPs de ajuste en metodos lagrangianos

Se ha puntualizado repetidamente que en los metodos de control lagrangiano o hamil-toniano, es necesario resolver ciertas EDPs de ajuste—una tarea casi siempre difıcil.Recordaremos algunos resultados publicados en la literatura que permiten simplificar esteproblema.

En una serie de interesantes artıculos, entre ellos (Bloch et al. 2000, Chang et al.2002), se ha demostrado que en algunas casos que incluyen conocidos ejemplos, la solucionde estas EDPs puede ser obviada. En (Blankenstein et al. 2001) se han interpretadoestas condiciones usando la notacion empleada en este capıtulo. Ahora resumiremosbrevemente estos resultados. Con este fin, resulta conveniente particionar las coordenadasgeneralizadas como q = [x, θ], con x ∈ IRr, θ ∈ IRn−r. Esto induce una particionnatural de la matriz de inercia como

M =

[Mxx Mxθ

M θx M θθ

]

Como en (Bloch et al. 2000), introduciremos las siguientes suposiciones:

(i) El lagrangiano es independiente de las coordenadas θ, es decir, son variables cıclicas.En este caso el lagrangiano toma la forma L(x, q) = 1

2qM(x)q − V (x).

(ii) Las coordenadas θ–son completamente actuadas, es decir, G = [0 I].

(iii) La matriz M tiene el bloque M θθ constante, y satisface1

∇xjMxiθk = ∇xi

Mxjθk , i, j = 1, . . . , r; k = 1, . . . , n − r

A continuacion tomemos el lagrangiano como Lc(x, q) = 12qMc(x)q−V (x). (Notese que,

al igual que en (Bloch et al. 2000), solo aspiramos al moldeo de la energıa cinetica.) Unaprimera observacion que se desprende es que en este caso, bajo las suposiciones (i), (ii),la condicion de ajuste (4.2.19) se reduce a una ecuacion algebraica

[I 0](I − MM−1c )

[I

0

]∇xV = 0 (5.2.1)

1Estos son las condiciones de ajuste 2 y 4 simplificadas de (Bloch et al. 2000), respectivamente.

Page 115: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 101

Una contribucion fundamental de (Bloch et al. 2000) es la demostracion de que, parasiguiente clase particular de Mc, satisfaciendo las llamadas condiciones de ajuste simpli-ficadas,

Mc = M +

[κ(κ + 1)Mxθ(M θθ)−1M θx κMxθ

κM θx 0

],

con κ ∈ IR, las EDPs (4.2.19), (4.2.18) son satisfechas automaticamente.

En (Blankenstein et al. 2001) se muestra que, para la clase de Mc considereda en(Bloch et al. 2000), su primera condicion de ajuste M-1 es equivalente a la acondicionalgebraica

[I 0](I − MM−1c )

[I

0

]= 0,

la cual a la luz de (5.2.1), claramente obvia la EDP de energıa potencial (4.2.19). Mas aun,tambien esta establecido que las condiciones de ajuste M-2 y M-3 de (Bloch et al. 2000)coinciden exactamente con la EDP (4.2.18).

Deberıamos recordar que resolver las EDPs (4.2.18), (4.2.19) es solo el primer paso enel procedimiento de diseno. De hecho para establecer la estabilidad usando la Proposicion4.2.1 la matriz Md deberıa ser definida positiva (al menos en un entorno del equilibrio q∗),y ademas, Vd deberıa tener un mınimo local aislado en q∗. En el teorema 3.4 de (Bloch

et al. 2000) se ha mostrado que los equilibrios relativos, de la forma (x = x, x = 0, θ = 0),de sistemas conservativos son estables si el Hessiano de la energıa total es de signo definido(positivo o negativo). Para ello la solucion de las EDPs proporciona ciertos grados delibertad en el diseno. Aunque es de difıcil justificacion desde un punto de vista fısico,podemos de este modo usar estos metodos para estabilizar localmente los (equilibriosrelativos de) sistemas mecanicos conservativos con una matriz de inercia en bucle cerradodefinida negativa. Esta caracterıstica es esencial en (Bloch et al. 2000) donde la energıapotencial no se modifica por el control y tendra tıpicamente un maximo en el equilibriodeseado, por tanto la energıa cinetica deberıa tambien tener un maximo en este punto.

5.2.1 Las ecuaciones λ

En una serie de artıculos, Auckly y Kapitanski (Auckly & Kapitanski 2001) realizan unade las principales contribuciones en la lınea iniciada por (Bloch et al. 2000) con el fin detransformar las ecuaciones de ajuste para el control de sistemas subactuados preservandola estructura lagrangiana.

La contribucion mas importante de (Auckly et al. 2002), vease tambien (Andreevet al. 2000), (Auckly & Kapitanski 2001), es la prueba de que todas las soluciones deesta ecuacion pueden ser obtenidas secuencialmente resolviendo un conjunto de tres EDPslineales. Como se muestra en (Blankenstein et al. 2001) las tecnicas empleadas en (Aucklyet al. 2002) pueden ser extendidas al estudio de la EDP (4.2.12), los cuales incorporanel parametro libre Uk. De hecho, esto da lugar a un juego de una ecuacion cuadraticoy dos EDPs lineales de primer orden. La primera EDP es cuadratica en el sentido deque contiene terminos cuadraticos de las variables a despejar, aunque las derivadas siguenapareciendo de forma lineal en la ecuacion.

Los desarrollos de (Auckly et al. 2002), basados en consideraciones geometricas danlugar a las llamadas ecuaciones–λ. Para su interpretacion conviene notar que en geometrıa

Page 116: Hamiltonians based Control

102 5.2. Reduccion de las EDPs de ajuste en metodos lagrangianos

Riemanniana es posible dotar al espacio de configuracion de un tensor metrico distintode la identidad expresado como gij en coordenadas covariantes y gij en coordenadascontravariantes. En este contexto es un hecho que

gikgkj = δij (5.2.2)

Este concepto puede ser utilizado para el control de sistemas mecanicos, si elegimos lamatriz de inercia como tensor metrico denotando gij a los elementos de dicha matriz enbucle abierto y gij en bucle cerrado. En virtud de (5.2.2) se deduce que gij (gij) denotalos elementos de la inversa de la matriz de inercia en bucle abierto (cerrado). Ademas sise define el sımbolo de Christoffel de segunda especie como:

[i j, k] =1

2

(∂gjk

∂xi+

∂gik

∂xj− ∂gij

∂xk

)y definimos las variables λ como sigue

λra = gaig

ir

se llega a que todo lagrangiano controlado en bucle cerrado con matriz de inercia gij y

energıa potencial V debe satisfacer las ecuaciones

λra

ˆ[j k, r] = [j k, a]

λjaCr = Ca

λja

∂V

∂xr=

∂V

∂xa

siendo Cri y Ca los terminos disipativos en bucle abierto y cerrado, respectivamente. Estasecuaciones permitirıan obtener, implıcitamente, las variables de la matriz de inercia gij yla funcion de energıa potencial V en bucle cerrado. Una vez halladas las incognitas gij

gij, Cr y V , la ley de control viene dada directamente por

ul = ([jk, l] − gligir ˆ[jk, r])xjxk + (Cl − glig

ijCj) + (∂V

∂xl− glig

ij ∂V

∂xj)

Estas ecuaciones han dado unos resultados interesantes con algunos sistemas subactuados,pero en casos como la bola en la viga, la solucion propuesta por Auckly y Kapitanski, segunadmiten los propios autores en (Andreev et al. 2000), no obtiene siquiera el rendimientoalcanzado con un controlador lineal.

En el marco de esta tesis, el control basado en la estructura hamiltoniana, no se conoceun enfoque similar, aunque podrıan derivarse unas ecuaciones–λ equivalentes a partir delas de Auckly basandose en la equivalencia entre las ecuaciones de Lagrange y las deHamilton. En este capıtulo se aborda el problema de manera diferente: se partira delas ecuaciones generales del metodo IDA-PBC introducido en el capıtulo anterior y sedefinira una clase de sistemas que abarca buena parte de los subactuados mas estudiadosen control, en los que dichas ecuaciones se transforman en otro sistema de ecuacionesdiferenciales ordinarias que admiten una solucion general para el moldeo de la energıacinetica y potencial.

Estas ecuaciones reducidas, en algunos casos se resuelven de manera tan simple comola obtencion de la integral indefinida de una funcion de variable unica. Por el contrario,si dicha integral no tuviera primitiva conocida, existen grados de libertad suficientes parabuscar otras integrales “mejores candidatas”.

Page 117: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 103

5.3 Reduccion de las ecuaciones de ajuste en IDA-PBC

Cabe senalar, en primer lugar, que al realizar la comparacion entre los enfoques la-grangiano y hamiltoniano del capıtulo anterior, se comento que si fijamos J2 en el metodoIDA-PBC como (4.2.20), se asegura que el sistema en bucle cerrado admite una repre-sentacion EL de la forma (4.2.16), (4.2.17). Entonces la EDP no lineal (4.2.12) se reducea (4.2.18).

Paralelamente a los avances de presentados en el ajuste de ecuaciones para los metodosbasados en la estructura lagrangiana, se presentara a continuacion un nuevo metodo parala resolucion de ecuaciones de ajuste del metodo IDA-PBC en una clase de sistemasmecanicos subactuados.

5.3.1 Definicion de la clase de sistemas

Gran parte de los sistemas subactuados propuestos como “retos” (benchmarks) de controlen congresos y revistas de investigacion (vease la convocatoria del American ControlConference de 1998), comparten ciertas propiedades. El bien conocido sistema de la bolaen la viga (Hauser et al. 1992), el pendulo invertido lineal (Bloch et al. 2000), y el pendulorotatorio de Furuta (Astrom & Furuta 1996) pertenecen a una amplia clase de sistemasde n grados de libertad y n − 1 actuadores (codimension 1), donde se pueden hacer lassiguientes hipotesis

G⊥ = eTk (5.3.1)

∇qMij = ekdMij

dqk

(5.3.2)

∇q(Md)ij = ekd(Md)ij

dqk

(5.3.3)

Estas condiciones se interpretan del siguiente modo. Sea k el ındice de la coordenada noactuada. Llamamos ek al vector columna de dimension n cuyos elementos son todos nulosexcepto el que ocupa la posicion k cuyo valor es 1. Las filas de la matriz G⊥, al igual queen el capıtulo 4, forman el nucleo de la matriz de control G. Por ultimo, en virtud de(5.3.1), se asume que la matriz G⊥ coincide con la transpuesta del vector ek. Si no fueraeste el caso siempre se puede realizar una transformacion de coordenadas de modo que elsubespacio subactuado aparezca de forma aislada (Isidori 1989). Un escenario tıpico seraaquel en el que q1 represente la coordenada no actuada y q2...n el resto. en este caso setiene:

G =

[0 0

0 In−1

]n×n

G⊥ = eTk = [1 . . . 0]1×n

donde In−1 es la matriz identidad de orden n − 1.

A su vez, la condicion (5.3.2) expresa el hecho de que los elementos de la matriz deinercia en bucle abierto M(q) solo dependen de qk, la coordenada no actuada2. Aunquepueda resultar extrana, esta es una caracterıstica muy comun para sistemas mecanicos

2Algunos autores (Weibel 1997) emplean el termino variables de forma (shape variables) para designaraquellas que aparecen en la matriz de inercia. Con este termino, la hipotesis citada equivale a decir quelas unicas variables de forma son las no actuadas.

Page 118: Hamiltonians based Control

104 5.4. Reduccion de las ecuaciones de moldeo de la energıa cinetica

subactuados. Como consecuencia, las derivadas de los elementos de dicha matriz conrespecto al vector de posicion q = [q1, . . . , qn]T se reducen a una unica derivada conrespecto a qk.

En virtud de la hipotesis (5.3.3) la propiedad (5.3.2) se extiende a la matriz de inerciaen bucle cerrado. Es natural proponer la matriz de inercia Md(q) como solo dependientede la coordenada no actuada qk.

5.4 Reduccion de las ecuaciones de moldeo de la energıa cinetica

Estas ecuaciones son las mas difıciles de resolver y por tanto se considera la contribu-cion principal de este capıtulo. En los calculos que aparecen a continuacion el operadorderivada d

dqk(·) sera reemplazado por ∇qk

.

En virtud de (5.3.3), los elementos de la matriz de inercia propuesta para el sistemaen bucle cerrado solo dependeran de qk. De (5.3.2) y (5.3.3) se obtiene

eTk ∇q(p

T M−1p) = pT∇qkM−1p (5.4.1)

eTk ∇q(p

T M−1d p) = pT∇qk

M−1d p (5.4.2)

Esto permite reescribir la ecuacion (4.2.10) del siguiente modo

1

2

[pT (∇qk

M−1)p − eTk MdM

−1∇q(pT M−1

d p)]+ eT

k (J2 − R2)M−1d p = 0 (5.4.3)

Usando la hipotesis (5.3.3) transformamos el termino

∇q(pT M−1

d p) = ekpT (∇qk

M−1d )p (5.4.4)

lo que sirve para transformar la ecuacion (5.4.3) en

1

2

[pT (∇qk

M−1)p − eTk MdM

−1ekpT (∇qk

M−1d )p

]+ eT

k (J2 − R2)M−1d p = 0 (5.4.5)

Esta ultima expresion puede verse como

1

2pT Qp + eT

k (J2 − R2)M−1d p = 0 (5.4.6)

Q= ∇qk

M−1 − eTk MdM

−1ek∇qkM−1

d (5.4.7)

Comentario 5.4.1. Q es simetrica al ser la suma de dos matrices simetricas: ∇qkM−1 (por

la simetrıa de M−1) y la matriz ∇qkM−1

d multiplicada por el escalar −eTk MdM

−1ek. Esteescalar aparecera en la forma [MdM

−1]kk en adelante.

Definamos la matriz de interconexion deseada tal y como aparece en (4.2.7), que hade ser antisimetrica. La submatriz de disipacion R2 es definida positiva, y se supone quetoma la forma

R2 = diagr1, ..., rn ri ≥ 0 (5.4.8)

La ecuacion (5.4.6) debe cumplirse para cualquier valor del factor de los momentos gen-eralizados, p, y por tanto

1

2pT Q + eT

k (J2 − R2)M−1d = 0 (5.4.9)

Page 119: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 105

Al ser Q una matriz simetrica como se demostro, podemos transponer la ultima expresiony multiplicarla por la derecha por Md para llegar a

1

2MdQp = ek(J2 − R2) (5.4.10)

El elemento k-esimo de la diagonal de R2 resulta ser cero. De hecho, multiplicando porla izquierda la ecuacion (5.4.10) por el vector eT

k se obtiene

eTk

1

2MdQp = rk

que es una funcion lineal con respecto a p y no admite una solucion para rk globalmentepositivo (lo cual es necesario por ser un termino de disipacion). Esto conduce a la con-clusion de que no se puede inyectar amortiguamiento en la direccion de la coordenada noactuada.

En el caso de un sistema de dos grados de libertad J2 serıa el unico parametro librerestante para el moldeo de la energıa cinetica en la variable no actuada. Este resultadoconvierte la ecuacion matricial (5.4.10) en el sistema formado por de las n ecuacionesdiferenciales ordinarias no lineales.

eTk MdQ = 0

Comentario 5.4.2. La derivacion del producto (MdM−1d ) con respecto a qk proporciona la

siguiente descomposicion

∇qkM−1

d = −M−1d (∇qk

Md)M−1d (5.4.11)

Sustituyendo (5.4.11) en el termino apropiado de la matriz Q en (5.4.10) se obtiene

eTk MdQ = eT

k [Md(∇qkM−1) + (∇qk

Md)M−1d [MdM

−1]kk] = 0

Si hacemos uso de la relacion

eTk ∇qk

Md = ∇qkeT

k Md

podremos finalmente aislar las derivadas de los elementos de la fila k de la matriz Md conrespecto a qk

∇qk[eT

k Md] = − [Md(∇qkM−1)Md]k ·

[MdM−1]kk

(5.4.12)

siempre que el escalar [MdM−1]kk sea distinto de cero. Este resultado simplifica notable-

mente la tarea de resolver la ecuacion (4.2.10) dando lugar a n ecuaciones diferencialesordinarias separadas con los elementos de Md como incognitas, con las derivadas aisladasen el primer miembro.

En el caso de sistemas de dos grados de libertad, al haber una eleccion de tresparametros en Md, se deduce que un elemento de la matriz de inercia es un parametrolibre, y mediante restricciones adicionales impuestas a dicho termino podremos garantizarque la matriz Md es definida positiva.

En sistemas con mas de dos grados de libertad, la matriz de inercia consta de n2

elementos de los cuales los (n2 − n)/2 por debajo de la diagonal quedan determinadospor la simetrıa, con lo que se obtiene un sistema de n ecuaciones y n2 − (n2 − n)/2 =n2/2+n/2 > n incognitas. De ello se deduce que aumenta considerablemente el numero degrados de libertad con el orden del sistema, manteniendo su validez la sencilla formulacion(5.4.12).

Page 120: Hamiltonians based Control

106 5.4. Reduccion de las ecuaciones de moldeo de la energıa cinetica

Ejemplo 1. Aplicacion de las ecuaciones reducidas al moldeo de energıa cineticade la bola en la viga

Con la nueva formulacion estamos en disposicion de resolver el problema del moldeo deenergıa cinetica en el sistema de la bola en la viga del capıtulo anterior de una formamucho mas elegante.

El conocido sistema a controlar se presento en el capıtulo 4, figura 4.6. Los detalles demodelado deben ser consultados en dicho capıtulo. Por facilidad de lectura recordaremosque la dinamica hamiltoniana (4.2.2) de este sistema viene descrita por la funcion deenergıa potencial V (q) = gq1sen(q2) y las matrices

M(q1) =

[m2 0

0 1 + m1q21

], G =

[0

1

]

donde m1 y m2 son constantes del modelo, y q1, q2 son la posicion de la bola y el angulode la barra, respectivamente. Denotaremos tambien

∆= det(M)

La coordenada no actuada es q1. Por tanto, k = 1 0 y G⊥ = eTk = [1 0]. De acuerdo

con las hipotesis dadas en la seccion 5.3.1, los terminos de M(q) solo dependen de lacoordenada no actuada. Por tanto es razonable proponer una matriz de inercia en buclecerrado de la forma

Md =

[a1(q1) a2(q1)

a2(q1) a3(q1)

]

siendo las ai funciones a definir. Entonces podremos aplicar directamente la ecuacion(5.4.12) calculando los diversos terminos que en ella aparecen

∇qkeT

k Md =

[da1

dq1

da2

dq1

]

[Md(∇qkM−1)Md]k · = [a1 a2]

[0 0

0 −2m1q1

(1+m1q21)2

][a1 a2

a2 a3

]= − 2m1m2q1a1

(1 + m1q21)

2[a2 a3]

[MdM−1]kk = [a1 a2]

[1

m2

0

]=

a1

m2

Con todo ello obtenemos el conjunto de ecuaciones diferenciales ordinarias

d

dq1

a1(q1) =2m1m2q1

(1 + m1q21)

2

a22

a1

(5.4.13)

d

dq1

a2(q1) =2m1m2q1

(1 + m1q21)

2

a2a3

a1

(5.4.14)

Anadiendo a estas ecuaciones la eleccion a3 = γa1a2 con la constante γ > 0 lleva ala solucion con Md globalmente definida positiva que ha sido presentada en el capıtuloanterior.

Page 121: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 107

q2

q1

u

Figura 5.1: Pendulo invertido en carro.

Ejemplo 2. Moldeo de energıa cinetica en el pendulo invertido en carro

Los mismos resultados se pueden aplicar a un problema clasico en control no lineal sub-actuado. El sistema del pendulo invertido sobre carro aparece esquematicamente en lafigura 5.1.

De nuevo, se trata de un sistema de dos grados de libertad (n = 2) descrito por lasecuaciones de Hamilton dadas en (4.2.2) con las matrices

M(q1) =

[a c cos q2

c cos q2 b

], G =

[1

0

]

En este caso q2 es la coordenada no actuada y consecuentemente k = 2 y G⊥ = eTk = [0 1].

Ademas ∆= det(M) y M solo depende de q2. Por tanto la matriz de inercia deseada se

propondra de la forma

Md =

[a1(q2) a2(q2)

a2(q2) a3(q2)

]

De nuevo, se calcularan todos los terminos de las formulas (5.4.12). Por simplicidad se

denotara en adelante c2= cos q2 y s2

= senq2.

∇qkeT

k Md =

[da2

dq2

da3

dq2

][Md(∇qk

M−1)Md]k1 = −cs2

(−a1a2(2bcc2) + a1a3(ab + c2c22) + a2

2(ab + c2c22) − a2a3(2acc2)

)[Md(∇qk

M−1)Md]k2 = −cs2

(−a22(2bcc2) + 2a2a3(ab + c2c2

2) − a23(2acc2)

)[MdM

−1]kk =−a2cc2 + a3a

Y finalmente sustituyendo en (5.4.12) llegamos a un par de ecuaciones diferenciales no

Page 122: Hamiltonians based Control

108 5.4. Reduccion de las ecuaciones de moldeo de la energıa cinetica

lineales. Suponiendo que los elementos ai son todos funciones de q2, se obtiene el sistema

da2

dq2

= − cs2

−a2cc2 + a3a

(−a1a2(2bcc2) + a1a3(ab + c2c22) + a2

2(ab + c2c22) − a2a3(2acc2)

)da3

dq2

= − cs2

−a2cc2 + a3a

(−a22(2bcc

22) + 2a2a3(ab + c2c2

2) − a23(2acc2)

)(5.4.15)

Ahora bien, es posible deshacerse de todas las funciones trigonometricas, de modo que lossegundos miembros del sistema (5.4.15) se conviertan en funciones racionales de cos q2.

Esto es cierto ya que si definimos x= cos q2 se tiene

d

dq2

(·) = −senq2d

dx(·)

debido al factor comun s2 a la derecha del sistema (5.4.15).

Comentario 5.4.3. El cambio de variable x= cos(q2) no implica una perdida de gener-

alidad, dado que debido a la simetrıa del sistema con respecto a q2, las soluciones a lasecuaciones deben ser pares y por tanto podran siempre ser expresadas en funcion delcoseno de q2

Las EDOs no lineales expresadas en funcion de x se transforman en

da2

dx= α(x) (5.4.16)

da3

dx= β(x) (5.4.17)

α(x)=

c

−a2cx + a3a

(−a1a2(2bcx) + a1a3(ab + c2x2) + a22(ab + c2x2) − a2a3(2acx)

)β(x)

=

c

−a2cx + a3a

(−a22(2bcx) + 2a2a3(ab + c2x2) − a2

3(2acx))

Nos centraremos en la solucion de (5.4.17) ya que en ella aparecen solo dos de los elementosde la matriz Md. Es facil probar que siempre y cuando el termino [MdM

−1]kk no se anule,β(x) es una funcion integrable y por tanto la ecuacion (5.4.15) admite una solucion de laforma

a3(x) = γe∫

F (x)dx (5.4.18)

Siendo γ una constante positiva ajustable. Con el fin de obtener la funcion F (x) propon-dremos una nueva parametrizacion de los elementos de Md

a2 = f23(q2)a3 (5.4.19)

a1 = f13(q2)a3 (5.4.20)

Comentario 5.4.4. Notese que esta parametrizacion esta bien definida, ya que la unicacondicion que podrıa invalidar (5.4.19) o (5.4.20) es a3 = 0. Pero esto no puede suceder,ya que a3 es un termino diagonal de una matriz que es definida positiva en el dominio dedefinicion del controlador, por tanto a3 > 0.

Comentario 5.4.5. Las funciones f23 y f13 son incognitas con un grado de libertad, porejemplo, una vez elegida f23 arbitrariamente, f12 quedara determinada por la solucionde(5.4.15).

Page 123: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 109

Si se observa detalladamente la funcion β(x), resulta ser un polinomio de grado dosen las variables a2 y a3, dividido por una funcion lineal en ambos terminos. Sustituyendotodas las apariciones de a2 por la reparametrizacion del segundo miembro de (5.4.19) seobtiene a2

3 como factor comun del numerador, y a3 del denominator.

β(x) = a3F (x) (5.4.21)

F (x)=

c

−f23cx + a

(−f 223(2bcx

2) + 2f23(ab + c2c22) − (2acx)

)(5.4.22)

Eligiendo f23(q2) tal que

det(Md) = a23(f13 − f 2

23) (5.4.23)

sea positiva para cualquier valor de q2 se garantiza que Md es una matriz definida positivade la forma

Md = a3(q2)

[f13(q2) f23(q2)

f23(q2) 1

](5.4.24)

Con la eleccion de Md se concluye la fase de moldeo de energıa cinetica del metodoIDA–PBC reducido. Sin embargo los elementos de dicha matriz han sido parametrizadosen terminos de una funcion f23(q), que debe ser una eleccion del disenador y siempre esposible conservar este grado de libertad para la fase de moldeo de energıa potencial, dondese dispondra de mas argumentos para la eleccion.

5.4.1 Generalizacion de la parametrizacion de Md para sistemas dos gradosde libertad

El paso clave para la validez de la parametrizacion (5.4.19)–(5.4.19) surge del hecho de queen la segunda de las ecuaciones (5.4.16)– (5.4.17) solo aparecen dos de los elementos dela matriz Md: a2 y a3. Esta caracterıstica tambien se presenta en la ecuacion (5.4.14) delsistema de la bola y la viga. Se mostrara a continuacion que esta propiedad es extensiblea todos los sistemas de dos grados de libertad de la clase estudiada en este capıtulo. Enefecto, en la ecuacion (5.4.12) los terminos

[Md(∇qkM−1)Md]kj j = 1, 2 (5.4.25)

son cuadraticos en los elementos de Md y pueden contener dos o tres elementos de dichamatriz. Si los reescribimos en la forma

eTk Md(∇qk

M−1)Mdej j = 1, 2

y tenemos en cuenta que eTk Md representa la fila k de Md y Mdej es la columna j (la fila

j traspuesta), concluimos que en el termino de (5.4.25) donde k = j, solo apareceran losdos elementos de la fila k de Md. Si j = k entonces (5.4.25) contiene los tres elementos(a1, a2, a3) de Md.

Por tanto el sistema de ecuaciones completo (5.4.12) de moldeo de la energıa cineticapara n = 2 posee una ecuacion donde solo aparecen dos terminos de Md. Entre ellos,escogeremos akk al ser diagonal y por tanto siempre positivo (consecuencia de Md > 0),para parametrizar el resto de Md en funcion de el.

Page 124: Hamiltonians based Control

110 5.5. Moldeo de la energıa potencial

5.5 Moldeo de la energıa potencial

El objetivo del moldeo de la energıa potencial es asignar libremente puntos de equilibrioen la funcion de energıa potencial en bucle cerrado. Una vez obtenida la matriz de inerciaMd aplicando la reduccion introducida previamente, podemos calcular la solucion de laecuacion de moldeo de energıa potencial para el caso n = 2, mediante unos pasos sencillos.

La funcion Vd se obtiene como solucion a la ecuacion

G⊥∇qV − MdM−1∇qVd = 0 (5.5.1)

Suponiendo que se cumplen todas las condiciones descritas en (5.3.1), y anadiendo lasiguiente

∂V

∂qk

= f(qi) i ∈ 1...n (5.5.2)

que se interpreta del siguiente modo: la derivada de la energıa potencial del sistemaen bucle abierto con respecto a la coordenada no actuada, es funcion de una sola delas coordenadas3. Esto es cierto para todos los ejemplos presentados anteriormente. Sesupondra que i = k sin perdida de generalidad4.

Para sistemas de dos grados de libertad, obtendremos una reduccion de la ecuacionen derivadas parciales a la integral indefinida de una funcion monovariable. En efecto,cuando n = 2, la ecuacion (5.5.1) admite la siguiente expansion

[MdM

−1]k1

∂Vd

∂q1

+[MdM

−1]k2

∂Vd

∂q2

= ∆∂V

∂qk

(5.5.3)

M−1 = ∆M−1 (5.5.4)

Por simplicidad se supondra que k = 2 sin perdida de generalidad5. Bajo la conocidasuposicion de que [MdM

−1]kk = 0 en el dominio de definicion del controlador, podemosexpresar la solucion general de la ecuacion homogenea como

V(1)d = Φ

(q1 −

∫ q2[MdM

−1]k1[

MdM−1]k2

dq2

)(5.5.5)

donde Φ es una funcion arbitraria que se empleara para asignar el equilibrio. La solucionparticular de la ecuacion completa resulta

V(2)d =

∫ q2 ∆[MdM−1

]k2

∂V

∂qk

dq2 (5.5.6)

En consecuencia, todas las soluciones de (5.5.1) estan contenidas en la expresion

Vd = V(1)d + V

(2)d (5.5.7)

3Lo cual no es incompatible con que V (q) dependa tambien de variables actuadas, como sucede en elcaso de la bola en la viga.

4La derivada mencionada es funcion de la variable no actuada, concretamente. Esto no es cierto en elsistema de la bola en la viga, pero como se demostrara en el siguiente ejemplo, es un obstaculo salvable.

5Si este no es el caso, las coordenadas pueden ser reordenadas de modo que la no actuada aparezcaen segundo lugar.

Page 125: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 111

Si hemos de asignar un punto de equilibrio estable en q = q∗, entonces Vd debe ser tal que

∇qVd(q∗) = 0

∂2Vd(q∗)

∂x2> 0

Como regla general, estas condiciones se traducen en

∇qΦ(q∗) = 0 (5.5.8)

∂2Φ(q∗)∂x2

> 0 (5.5.9)

∂2V(2)d (q∗)∂x2

> 0 (5.5.10)

Ejemplo 3. Reduccion de las ecuaciones de moldeo de energıa potencial en labola y la viga

La funcion de energıa potencial del sistema en bucle abierto viene dada por

V = m3q1 cos q2 (5.5.11)

donde m3 es una constante positiva del modelo. La aplicacion de la ecuacion (5.5.1)conduce a √

1 + mlq12

m1

∂Vd

∂q1

(q) +1

γm2√

m1

∂Vd

∂q2

(q) = m3senq2

la cual se resuelve empleando las ecuaciones (5.5.5), (5.5.6) y (5.5.7) para dar lugar a

Vd = −γ√

m1m2m3 cos(q2) + Φ

[q2 − γ

√m2√

2√

m1

arcsenh(√

m1q1)

]

Una eleccion apropiada que verifica las condiciones (5.5.8), (5.5.9) y (5.5.10) en q∗ = 0 es

Φ(z) =kp

2z2 (5.5.12)

Siendo kp > 0 una ganancia ajustable

Vd = −γ√

m1m2m3 cos(q2) +kp

2

[q2 − γ

√m2√

2√

m1

arcsenh(√

m1q1)

]2

Ejemplo 4. Reduccion de las ecuaciones del moldeo de energıa potencial en elpendulo simple

La funcion de energıa potencial en bucle abierto toma la forma

V = mgl cos q2 (5.5.13)

Page 126: Hamiltonians based Control

112 5.5. Moldeo de la energıa potencial

Su derivada con respecto a qk es, como de costumbre, dependiente de una sola de lascoordenadas, q2. En este caso i = k = 2. Haciendo uso de la factorizacion introducida en(5.4.19) y (5.4.20) y el cambio de variable (5.4.16) podremos calcular cada termino de laecuacion de moldeo de energıa potencial.

a3(bf23 − cx)∂Vd

∂q1

+ a3(−cf23x + a)∂Vd

∂q2

= −∆mglsenq2 (5.5.14)

donde se define ∆= ab−c2x2, el determinante de M(q). La solucion de la parte homogenea

toma la forma

V(1)d = Φ

(q1 −

∫ q2 bf23 − c cos(q2)

−cf23 cos(q2) + adq2

)(5.5.15)

la cual es integrable dado que −cf23 cos(q2) + a = 0. Las condiciones (5.5.8) y (5.5.9) se

cumplen mediante la eleccion de la funcion libre Φ = kp

2z2.

En lo que respecta a la segunda parte de la solucion, V(2)d , la funcion f23 debe ser tal

que (5.5.10) se cumple en q∗ = 0. Esto impone una condicion en f23 que restringe lasposibles soluciones de las ecuaciones de moldeo de la energıa cinetica. De hecho, en q∗ = 0

obtenemos x = 1 y el termino∂V

(2)d (q∗)

∂x2 se convierte en

∂2

∂q22

(∫ q2 ∆[MdM−1

]k2

∂V

∂qk

dq2

)=

∂q2

(∆

a3(−cxf23(q) + a)

∂V

∂qk

)=

=∆

a3(−cf23(q∗) + a)

∂2V (q∗)∂q2

k

+∂V (q∗)

∂qk

∂q2

(∆

a3(−cxf23(q) + a)

)El ultimo termino es cero ya que al contiene el factor ∂V (q∗)

∂qk= mglsenq∗ = 0, y por tanto

solo queda

a3(−cf23(q∗) + a)

∂2V (q∗)∂q2

k

> 0

para lo cual es necesario que

a3(−cf23(q∗) + a) < 0 (5.5.16)

La condicion (5.5.16) unida a al hecho de que [MdM−1]kk = 0 se extiende a todo el rango

de x, lo cual significa que

a3(−cf23(x)x + a) < 0 ∀x ∈ [−1, 1] (5.5.17)

Esta restriccion para f23 presenta una singularidad en x = 0 (o equivalentemente q2 = ±π2)

como ha sido representado en la figura 5.2. En esta figura las regiones permitidas paraf23 son los lados de las curvas apartados del origen en el primer y tercer cuadrante. Estasregiones, obviamente, son inconexas. Para que la condicion (5.5.17) se siga cumpliendoal aproximarse la variable q2 a ±π

2, f23 deberıa tender a infinito. De esto se concluye que

no es posible disenar un controlador valido IDA-PBC sin conmutacion en el espacio deestados completo6. Este efecto se relaciona por tanto con una perdida de controlabilidaddel pendulo en q2 = ±π

2. La siguiente seccion restringira el problema de la estabilizacion

a un intervalo de la forma q2 ∈ (−π/2 + ε, π/2 − ε), siendo ε una constante positiva todolo pequena que se desee teniendo en cuenta que afectara a la forma de la funcion f23.

6Observese que hasta el momento no se ha tomado partido por ninguna forma concreta de f23 conlo cual el resultado es general salvo por la condicion [MdM

−1]kk = 0. Se ha estudiado, sin embargo, laposibilidad de que este termino se anule en q2 = ±π/2, y se concluyo que no era compatible con ningunasolucion global para la energıa cinetica.

Page 127: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 113

Figura 5.2: Regiones prohibidas (en gris) para f23.

5.6 Calculo de la ley de control

Las secciones previas proporcionan un metodo de resolucion de las ecuaciones de moldeo deenergıa en el metodo IDA-PBC. Mediante los sucesivos ejemplos se ha ilustrado la potenciay sencillez del metodo. En este apartado se resumiran los calculos finales necesarios parala obtencion de la ley de control. Nos centraremos al caso de dos grados de libertad ycomplementaremos los resultados con el ejemplo del pendulo invertido, puesto que parael sistema de la bola y la viga no representa ninguna novedad.

Para el calculo de ues (moldeo de energıa sin amortiguamiento), en primer lugar seobtiene la matriz de interconexion J a partir del conocimiento de Md mediante la ecuacion(4.2.7), donde la submatriz J2 se calcula en virtud de la ecuacion (5.4.10) (recuerdese queG⊥ = eT

k )1

2MdQp = G⊥(J2 − R2)

la cual, en el caso de dos grados de libertad, se premultiplica por la matriz de control Gpara dar

j(q, p) =1

2GMdQp

siendo j(q, p) un escalar, y por tanto la matriz J2 en estos casos (n = 2) toma la forma

J2 =

[0 j(q, p)

−j(q, p) 0

]

Una vez obtenidos Md y Vd y J , se calcula el termino ues de la ley de control que pro-duce un sistema conservativo en bucle cerrado mediante la aplicacion directa de (4.2.11).Mediante ues se transforma la funcion de energıa de modo que en bucle cerrado tenga laforma deseada con el mınimo en el punto de equilibrio objetivo. Si no se anade amor-tiguamiento, el sistema permanecerıa en orbitas de valor constante de Hd y no se lograrıaestabilidad asintotica (aunque sı estabilidad en el sentido de Lyapunov siendo Hd la fun-cion de Lyapunov). El termino de amortiguamiento que ha de ser anadido a al senal decontrol para lograr un decrecimiento de Hd hacia el mınimo consiste en realimentar lasalida pasiva con una ganancia ajustable Kv, segun la ecuacion (4.2.8). Para el caso dela bola en la viga, sabemos que toma la forma (4.4.11). El termino de amortiguamiento

Page 128: Hamiltonians based Control

114 5.6. Calculo de la ley de control

del pendulo invertido, debido a su complejidad, queda mejor expresado en terminos de lanueva parametrizacion de Md:

udi = −kvp1 − f23p2

f13 − f 223

(5.6.1)

Ejemplo 5: Ley de control en el pendulo invertido

La ley de control en cualquiera de los casos se obtiene sumando los terminos de moldeode energıa e inyeccion de amortiguamiento,

u = ues + udi

En el caso del pendulo invertido lineal, se ha visto que cualquier ley de control IDA-PBCesta limitada a un intervalo del tipo (−π/2+ ε, π/2− ε) se debe actuar en conjuncion conuna ley de swing up que levante el pendulo hasta la region de atraccion del controladorIDA-PBC y realizar una conmutacion entre ambos.

Para el calculo de la ley de control hemos observado que la solucion de las EDPs quedareducida a encontrar una funcion monovariable f23(q2) sujeta a las siguientes condicionesdentro del intervalo q2 ∈ (−π/2 + ε, π/2 − ε):

1. De la ecuacion (5.5.17), f23 > ac cos q2

2. Para lograr que Md sea definida positiva, f23 debe ser monotona creciente con re-specto a x. Esto se puede demostrar sustituyendo f23 y el valor de a1 como unasolucion de (5.4.16) en det(Md) = a1a3−a2

2, dando lugar a que el determinante tieneel signo de df23

dx.

3. f23 debe ser par con respecto a q2, para que las ecuaciones en bucle cerrado seanpares y puedan expresarse en funcion de x.

La ultima condicion permite expresar f23 en terminos de la nueva variable x. Notesetambien que la primera condicion es tambien suficiente para la integrabilidad de F (x).Ademas, f23 debe ser elegida juiciosamente de modo que todas las integrales de unavariable que aparecen en el procedimiento posean una primitiva conocida7. Este es elcaso de una funcion que tome la forma

f23(x) =1

f0 + δx

Si δ < 0, f0 > 0 y f0 > |δ|, las dos primeras condiciones son satisfechas, mientras que latercera implica que

1

f0 + δxε

>a

cxε

7Este es un aspecto crıtico, que sugiere una ejecucion del metodo un iterativamente hasta satisfaceresta condicion.

Page 129: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 115

donde se ha definido xε= cos(−π

2+ ε) como el lımite inferior del intervalo de validez del

controlador en terminos de x, es decir, x ∈ [xε, 1]. Para cualquier valor especıfico de f0,la constante δ debe ser tal que

|δ| >f0

− c

a

Para nuestra solucion particular, la funcion F (x) toma la forma

F (x) =

(−2 bc2x

f0+δ x+ 2 ab + 2 c2x2 − 2 ac2x

)∆ (af0 + (aδ − c) x)

(5.6.2)

Bajo las condiciones expresadas anteriormente esta funcion no presenta singularidadesdentro del intervalo de interes, y por lo tanto puede ser integrada. A pesar de la compleji-dad aparente, se trata de una funcion racional de x cuya primitiva se ha obtenido usandola aplicacion de calculo simbolico Maple. Entonces los terminos de Md se calculan como

a3(x) = γe∫

F (x)dx

a2(x) = f23a3(x)

a1(x) =∆ (−a2 cx + a3 a) da2

dx− a2

2 (ab + c2x2) + 2 a2 a3 acx

−2 a2 bcx + a3 (ab + c2x2)

donde γ es una ganancia ajustable positiva que no tiene efecto alguno en el signo dedet(Md). En cuanto a los terminos de energıa potencial, de la ecuacion (4.2.11) se deduceclaramente que solo se requiere el conocimiento de las derivadas Vd para implementar elcontrolador, y por tanto no se requiere el calculo de la integral indefinida (excepto paraalgunas elecciones de la funcion libre φ(z) de la solucion de la ecuacion homogenea).

Proposicion 5.6.1. Considerese el modelo del pendulo invertido lineal (5.1) en buclecerrado con la realimentacion estatica del estado IDA-PBC u = ues + udi obtenida en lassecciones anteriores y kv > 0. Entonces, el origen es un equilibrio asintoticamente estable

con dominio de atraccion Ωc donde Ωc= (q, p) ∈ IR4 | Hd(q, p) ≤ c, donde Hd toma la

forma (4.2.3), Md viene dada por (5.4.24), Vd = V(1)d + V

(2)d y c definida segun (4.2.9).

Demostracion. Se refiere al lector a la prueba de la proposicion (4.4.2) esbozada para elcontrol de la bola en la viga en el capıtulo 4.

5.7 Simulaciones

En esta seccion se muestra el comportamiento simulado de los sistemas controlados de labola en la viga y pendulo invertido lineal cuando se emplea el metodo descrito previamente.

La bola en la viga se simulo con las constantes m1 = m2 = kp = 1 y g = 9.8. Se observauna gran cuenca de atraccion. Por ejemplo, un caso de simulacion comenzando en q2 = π(viga boca abajo) puede ser conducido a la posicion (0, 0) mediante el controlador disenadopara un conjunto de valores iniciales positivos de q1.

La grafica de la izquierda en la figura 5.3 representa el angulo de la viga comenzandoen (1, 1.5), con una constante de amortiguamiento kv = 10. La grafica de la derechamuestra la trayectoria de la bola comenzando en (1, 0) para distintos valores de kv.

Page 130: Hamiltonians based Control

116 5.8. Comparacion de leyes de control

0 2 4 6 8 10 12 14 16 18 20−0.5

0

0.5

1

1.5

Tiempo (s)

Ang

ulo

de la

vig

a (r

ad)

0 5 10 15 20 25 30 35 40 45 50−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Tiempo (s)

Pos

icio

n de

la b

ola

(m)

Kv=10

Kv=1

Figura 5.3: Resultados de la simulacion de la bola en la viga.

En la simulacion del pendulo invertido, los parametros del modelo son los propuestosen el artıculo de (Bloch et al. 2000), concretamente m = 0.14 kg, M = 0.44 kg, y l=0.215m. Las constates de nuestro modelo se obtienen indirectamente a partir derivan de ellas:a = ml2 = 0.0064715 b = M + m = 0.58 y c = ml = 0.0301. Los valores empleados enel diseno del controlador son f0 = 1, δ = −0.8 y γ = 1014 (este ultimo con el criteriode minimizar el rango de variacion de a3 en el dominio de definicion). La posicion yvelocidad deseada del carro es 0 m/s. El pendulo comienza en una posicion practicamentehorizontal q2(0) = π/2 − 0.3 rad, mostrando la amplia cuenca de atraccion del equilibriocon el pendulo levantado. La figura (5.4) muestra los resultados de la simulacion. Elcomportamiento es el deseado incluso partiendo de puntos cercanos al lımite del dominiode atraccion. El rendimiento del controlador es muy satisfactorio como se puede apreciarpor el transitorio de tipo deadbeat que aparece en las graficas.

0 50 100 150 200 250 300 350 400 450 500

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

Velocidad del pendulo

tiempo (s)

Angulo del pendulo

Velocidad del carro

−0.2 0 0.2 0.4 0.6 0.8 1−0.1

−0.08

−0.06

−0.04

−0.02

0

0.02

0.04

Angulo del pendulo (rad)

Vel

ocid

ad a

ngul

ar (

rad/

s)

Figura 5.4: Resultados de la simulacion del pendulo invertido comenzando en q2 = 1.2 rad.

5.8 Comparacion de leyes de control

Existe en la literatura un creciente numero de controladores para el conocido sistemade la bola en la viga. Continuamente aparecen nuevos trabajos en este sentido, que

Page 131: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 117

reivindican una mejora en las propiedades de estabilidad en bucle cerrado o amplian elgrado de detalle del modelo empleado. A fin de contrastar los el controlador basadoen pasividad desarrollado en esta tesis con otros trabajos afines, se realizara un estudiosimulado comparativo con otros dos controladores: uno lineal basado en una estructurade control anidada y otro basado en la teorıa de lagrangianos controlados presentado en(Hamberg 1999). El primero se ha elegido por su sencillez y por ser uno de los masimplementados en los laboratorios con finalidades academicas. El segundo cobra interesen el marco de las comparaciones de caracter teorico que se han llevado a cabo entre losmetodos basados en pasividad y la teorıa de lagrangianos controlados.

El primer aspecto que merece la pena destacar es la desafortunada disparidad entrelos modelos empleados en las distintas publicaciones. La razon de este hecho se ilustraobservando la figura 5.5. En ella se representa un carro en lugar de una bola, que esuna configuracion bastante habitual que presenta una peculiaridad: el centro de masasdel carro esta desplazado hacia arriba y por tanto nunca pasa por el eje de giro de laviga. Esta separacion, hc en la figura 5.5 es responsable de la aparicion de elementos nodiagonales en la matriz de inercia del modelo de la bola en la viga.

Figura 5.5: Carro en viga con centro de masas desplazado.

El modelo del sistema con hc > 0 posee el lagrangiano:

L =1

2[ϕ z]

[1 + α + β + z2 −1 − β

−1 − β 1 + β

][ϕ

z

]− (zsenϕ + cos ϕ) (5.8.1)

donde α, β son constantes positivas derivadas de los parametros fısicos. Este modelo esempleado en los controladores basados en el metodo de los lagrangianos controlados ysu reduccion mediante las ecuaciones λ. En adelante se haran simulaciones a efectos decomparacion de los transitorios y las cuencas de atraccion, aunque es preciso recordar quebajo estos paradigmas de control no se han descrito tecnicas para acotar las trayectoriasen los transitorios de manera analoga a la expuesta en el capıtulo 4.

5.8.1 Control lineal

Para el control lineal emplearemos el modelo del capıtulo anterior, ecuacion (4.4.1). Parala linealizacion en el origen se partira de la descripcion en variables de estado que se

Page 132: Hamiltonians based Control

118 5.8. Comparacion de leyes de control

desprende de la descripcion Hamiltoniana.

q1 = p1

q2 =p2

L2 + q21

p1 =p2

2 ∗ q1

(L2 + q12)2− gsenq2

p2 = −gq1 cos q2 + τ

La linealizacion jacobiana del sistema en el origen resulta

x =

0 0 1 0

0 0 0 1L2

0 −g 0 0

−g 0 0 0

x +

0

0

0

τ

,

donde x = [q1, q2, p1, p2]T . Es facil observar que el sistema lineal es controlable y observ-

able en el origen. Por tanto, la tecnica de asignacion de polos es de directa aplicacion.Sin embargo, una estructura tıpica empleada en el aplicaciones practicas comprende laanidacion de dos subsistemas control (figura 5.6): un subsistema rapido que lleva la vigaa una posicion deseada, y un sistema lento que toma la posicion de la viga como entradade un subsistema de control de la posicion de la bola. En este caso el subsistema de la

PID Q(s) Ball & BeamPD

Gear angle loop

Ball position loop

rd rQd Qtorque

Figura 5.6: Estructura anidada para el control lineal de la bola y la viga.

posicion de la bola es

q1 = p1

p1 = −gq2,

donde q2 se considera la entrada. Este sistema equivale a

q1 = −gq2

Una estructura de control PD para la estabilizacion de la bola en el origen darıa

−gqd2 = −kp1q1 − kd1q1 ⇒ qd2 =1

g(kp1q1 + kd1q1)

Page 133: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 119

0 5 10 15 20 25 30 35 40−2

−1.5

−1

−0.5

0

0.5

1

q1(0)=0.00, q

2(0)=0.30

q 1(con

t.), q

2(dis

c.)

tiempo(s)0 5 10 15 20 25 30 35 40

−150

−100

−50

0

50

100

Señ

al d

e C

ontr

ol

tiempo(s)

Figura 5.7: Resultados de simulacion del control lineal de la bola en la viga, q2(0) = 0.3 rad.

donde kp1 y kd1 son ganancias ajustables, y qd2 representa el angulo de la viga deseado.Ahora bien, este angulo tiene su dinamica propia, que debe ser controlada mediante unlazo PD interno rapido (respecto al cual la referencia q2d sea cuasi-constante). La dinamicalinealizada de la viga viene dada por

q2 =p2

L2

p2 = −gq1 cos q2 + τ

haciendo τ = gq1 cos q2 + vL2 se transforma el sistema en

q2 = v,

que se estabiliza en la referencia dada por el subsistema lento q2d mediante una nueva leyde control PD:

v = kp2(qd2 − q2) + kd2(qd2 − q2)

de donde se obtiene la ley para el sistema completo:

τ = gq1 cos q2 + L2(kp2(1

g(kp1q1 + kd1q1) − q2) + kd2(

1

g(kp1q1 + kd1q1) − q2))

Este controlador se ha simulado aplicado al modelo no lineal con constantes L = 10m yg = 9.8m/s2. Los parametros del controlador son kp1 = 1, kd1 = 0.5, kp2 = 4 y kd2 = 2.Los resultados de simulacion de este son satisfactorios para un amplio rango de valoresiniciales de q1. Sin embargo se observa una limitacion: el controlador se desestabilizapara angulos iniciales de la viga superiores a 1 rad. Esto contrasta con el controladorIDA–PBC del capıtulo anterior en el que se lograba estabilizar desde condiciones inicialesmuy proximas a π/2.

Los resultados se muestran en las graficas de las figuras 5.8.1, 5.8.1 y 5.8.1 donde seha hecho aumentar progresivamente el angulo inicial de la viga, q2(0).

5.8.2 Control por lagrangianos controlados

En el artıculo (Hamberg 1999) se ha presentado un controlador de la bola en la vigabasado en esta tecnica de control de subactuados. El modelo empleado en este caso es el

Page 134: Hamiltonians based Control

120 5.8. Comparacion de leyes de control

0 5 10 15 20 25 30 35 40−6

−5

−4

−3

−2

−1

0

1

q1(0)=0.00, q

2(0)=0.70

q 1(con

t.), q

2(dis

c.)

tiempo(s)0 5 10 15 20 25 30 35 40

−350

−300

−250

−200

−150

−100

−50

0

50

100

150

Señ

al d

e C

ontr

ol

tiempo(s)

Figura 5.8: Control lineal de la bola en la viga, q2(0) = 0.7 rad.

0 5 10 15 20 25 30 35 40−20000

−15000

−10000

−5000

0

5000

q1(0)=0.00, q

2(0)=1.00

q 1(con

t.), q

2(dis

c.)

tiempo(s)0 5 10 15 20 25 30 35 40

−12

−10

−8

−6

−4

−2

0x 10

5

Señ

al d

e C

ontr

ol

tiempo(s)

Figura 5.9: Control lineal de la bola en la viga, q2(0) = 1 rad. Comportamiento inestable.

Page 135: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 121

descrito por las ecuaciones (5.8.1). La resolucion de las ecuaciones de ajuste proporcionael lagrangiano controlado dado por la metrica (matriz de inercia en bucle cerrado)

g = e−q2

16+6β

[5 −2

−2 1

]

y la funcion de energıa potencial

V (q1, q2) = V0(q1, q2) − V0(0, q1 − 3q2) +γ

2(q1 − 3q2)

2

donde

V0(q1, q2) = −e−(1+β)

6

√π

6 + 6βRe

(ei(

q13−q2)Erfi

(1 + β − iq1√

6 + 6β

))Los resultados de simulacion de este controlador han sido publicados en el conocidoartıculo (Hamberg 1999) y a la luz de las graficas allı presentadas, las propiedades transi-torias son poco satisfactorias, a lo que cabe anadir el argumento de la inexistencia de unadecuado analisis del comportamiento transitorio. En la simulacion de Hamberg, se hamostrado una trayectoria comenzando en (q1 = 1.0m, q2 = 0.5rad). Tras varios intentosde simulacion el autor de esta tesis no ha logrado, con este mismo controlador, estabi-lizar trayectorias comenzando con angulos superiores a 1 rad, mientras que el controladorIDA–PBC, como hemos mostrado, puede estabilizar posiciones iniciales tan proximas aπ/2 como se quiera.

5.9 Extension de la solucion a otros sistemas

5.9.1 Sistemas de orden mayor

Las formulas obtenidas en (5.4.12) se aplican sin dificultad en sistemas subactuados deorden mayor. Sin embargo las ecuaciones que se desprenden de dichas formulas puedenser difıciles de resolver. Se ha estudiado un caso en el que se consigue satisfactoriamenteel moldeo de energıa cinetica gracias a dicha formulacion, sin embargo queda abierta laresolucion de la ecuacion de energıa potencial en la que las reducciones anteriores no sonefectivas.

5.9.1.1 Moldeo de energıa cinetica del robot PPR

El robot movil PPR, representado esquematicamente en la figura 5.10, es un sistemade cuatro grados de libertad y tres actuadores. Ha sido estudiado en (Espinosa-Perez,Sira-Ramırez & Rıos-Bolivar 2000) desde un punto de vista hıbrido entre la pasividady la platitud (flatness). El lector debe referirse a este artıculo para mas detalles sobreel modelado. Para el moldeo de la energıa cinetica emplearemos la formula reducida deIDA-PBC presentada anteriormente

∇qk[eT

k Md] = − [Md(∇qkM−1)Md]k ·

[MdM−1]kk

(5.9.1)

que en este caso comprende un sistema de cuatro ecuaciones con k = 4 y M es la matrizde inercia en bucle abierto, dada por

Page 136: Hamiltonians based Control

122 5.9. Extension de la solucion a otros sistemas

T

F2F1x

y

z

ψ

θ

Figura 5.10: Robot movil PPR.

M =

M + m 0 0 −mlsenθ

0 M + m 0 ml cos θ

0 0 J 0

−mlsenθ ml cos θ 0 ml2

(5.9.2)

Este es un problema con gran cantidad de grados de libertad. La matriz de inercia en buclecerrado consta de diez elementos libres si se quiere preservar la simetrıa. Sin embargo elanalisis del signo de la matriz puede tornarse bastante complejo, de modo que vamos aprescindir de buena parte de estos elementos. Propondremos la siguiente matriz de inerciaen bucle cerrado

Md =

a1 0 0 0

0 a2 0 a4

0 0 a3 0

0 a4 0 a5

(5.9.3)

cuyo determinante es det(Md) = a1 (a2 a3 a5 − a42a3) , que debe ser positivo siguiendo las

directrices del metodo.

Tras el cambio de variable x= cos θ, el sistema de ecuaciones diferenciales obtenido

con las formulas reducidas es

d

dxa4(x) = −ml2M

(−(−2

a4 mx

δ M+

a5

lM

)a2 − a4

2

lM

)(a4 xml − a5 δ)−1 (5.9.4)

0 = −ml (−2 a4 mlx2 + a4 ml + a5 xδ) a1

(−a4 xml + a5 δ) δ(5.9.5)

Page 137: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 123

d

dxa5(x) = −ml2M

(−(−2

a4 mx

δ M+

a5

lM

)a4 − a4 a5

lM

)(a4 xml − a5 δ)−1 (5.9.6)

Analisis de las posibles soluciones

Debido a la riqueza en grados de libertad del problema, incluso despues de haber anuladodiez de los elementos de Md, restan numerosas opciones en la tarea de diseno. Paraenmarcar el problema, analizaremos las posibles soluciones y las restricciones que aparecenen el moldeo de energıa cinetica.

1. M , m, l, y δ son constantes positivas.

2. Md es definida positiva si y solo si a1, a2, a3, a5 y el determinante son positivos.

3. La ecuacion (5.9.5) es algebraica y establece una relacion entre a4 y a5, ya que a1

no se puede anular (por estar en la diagonal de Md). Esto permite expresar a4 enfuncion de a5.

4. Para resolver la ecuacion (5.9.4) se emplea el grado de libertad a2, con la restricciona2 > 0.

5. Lo mas interesante en este paso es el hecho de que a1 y a3 no intervienen en lasecuaciones de energıa cinetica, con lo cual basta con seleccionarlos garantizando elsigno del determinante de Md.

6. Para simplificar las ecuaciones se recurre al cambio x= senθ lo cual implica que los

elementos de Md van a ser simetricos respecto a θ, (como sucede en la matriz deinercia en bucle abierto M).

Para hallar la solucion se despeja, del numerador de (5.9.5) a4 en funcion de a5:

a4 =a5 xδ

ml (2 x2 − 1)(5.9.7)

Sustituyendo en (5.9.5) resulta

a5 = C1

√2 x2 − 1 (5.9.8)

siendo C1 una constante real a elegir. Conocido a5, obtendremos a4 directamente de(5.9.7)

a4 =C1 xδ√

2 x2 − 1ml(5.9.9)

quedando aun por ajustar la ecuacion 5.9.4, que se transforma en una ecuacion algebraicade la que despejamos a2:

a2 =(2 x4 − 1) C1 δ2

(2 x2 − 1)3/2 l2m2, (5.9.10)

Page 138: Hamiltonians based Control

124 5.9. Extension de la solucion a otros sistemas

con lo que la matriz de inercia en bucle cerrado queda

Md =

a1 0 0 0

0(2 x4−1)C1 δ2

(2 x2−1)3/2l2m20 C1 xδ√

2 x2−1ml

0 0 a3 0

0 C1 xδ√2 x2−1ml

0 C1

√2 x2 − 1

(5.9.11)

siendo a1 y a3 funciones positivas a escoger segun conveniencia, que emplearemos en elajuste de energıa potencial. Estudiaremos la positividad de Md en torno al origen θ = 0o equivalentemente x = 1.

Md(θ = 0) =

a1 0 0 0

0(2 x4−1)C1 δ2

(2 x2−1)3/2l2m20 C1 xδ√

2 x2−1ml

0 0 a3 0

0 C1 xδ√2 x2−1ml

0 C1

√2 x2 − 1

(5.9.12)

Esta matriz sera definida positiva si los menores descendentes de la matriz Md son posi-tivos, es decir

(2 x4 − 1) C1 δ2

(2 x2 − 1)3/2 l2m2> 0

a1 > 0

a3 > 0

al igual que el determinante

det(Md) =a1 C1

2δ2a3 (2 x4 − 1 − x2)

(2 x2 − 1) l2m2> 0

Para garantizar la positividad de la matriz Md se debe escoger la constante C1 en elsiguiente intervalo

C1 ∈(

a4ml

δ,2a4ml

δ

)(5.9.13)

En cuanto al dominio de definicion del controlador, Los elementos de la matriz Md debenser reales, para lo cual debe cumplirse

0 < 1 − 2 x2 ⇒ sen2(θ) <1

2(5.9.14)

⇒ |θ| ∈ (−π

4,π

4) (5.9.15)

Page 139: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 125

5.9.1.2 Moldeo de la energıa potencial

En este caso la ecuacion a resolver es

G⊥∇qV − MdM−1∇qVd = 0 (5.9.16)

Particularizando los terminos de la solucion del balance de energıa cinetica se llega ala ecuacion

0 = −x3 k + x4 k

− C1 sen(x4)(−1 + (cos(x4))

2) ∂∂x1

V d(x1, x2, x3, x4)√2 (cos(x4))

2 − 1lM

+C1 cos(x4)

(−M − m + m (cos(x4))2) ∂

∂x2V d(x1, x2, x3, x4)√

2 (cos(x4))2 − 1mlM

− C1 δ(−1 + (cos(x4))

2) ∂∂x4

V d(x1, x2, x3, x4)√2 (cos(x4))

2 − 1ml2M

Sin embargo, no se ha llegado a ninguna solucion satisfactoria para esta solucion. Lasobtenidas mediante Maple presentan singularidades difıcilmente salvables.

5.9.2 Efecto de la perdida de controlabilidad en IDA-PBC

Se ha observado que el pendulo invertido presenta un problema intrınseco de continuidadde las soluciones obtenidas mediante el metodo IDA-PBC en los puntos q2 = ±π/2.Mediante la linealizacion del sistema en estos puntos se puede comprobar sencillamenteque esto se debe a que el sistema deja de ser controlable. Existe un caso mas patologicoaun, el sistema subactuado conocido como pendulo esferico de Rice o simplemente sistemade la “perla giratoria”. Este sistema fue introducido en el capıtulo 2. El sistema consisteen una masa puntual restringida a moverse sobre una circunferencia que gira en torno aun eje vertical que pasa por su centro. Como se represento esquematicamente en la figura2.2, la masa esta “ensartada” en la circunferencia como una perla en la guıa del collar.

La peculiaridad de este sistema consiste en que si aplicamos el metodo IDA-PBC paraestabilizar la perla en cualquier posicion en la mitad de la superior de la circunferencia (locual se consigue con momentos generalizados no nulos, obviamente), las ecuaciones llevana una contradiccion.

Por supuesto, esta limitacion es previsible desde el punto de vista fısico, ya que estandola perla en la semicircunferencia superior, la suma vectorial de fuerzas (gravitatoria ycentrıfuga) proyectadas en la direccion tangente al aro8, solo puede apuntar en sentidodescendente. Sin embargo, sirve de ejemplo ilustrativo para explicar como se manifiestaesta imposibilidad en la nueva formulacion.

Para aplicar IDA-PBC, emplearemos el modelo descrito por las ecuaciones de Hamilton

8La perpendicular es cancelada por las fuerzas de reaccion de la ligadura.

Page 140: Hamiltonians based Control

126 5.9. Extension de la solucion a otros sistemas

(4.2.1)–(4.2.2), tomando en particular los valores

M(q1) =

[α 0

0 β + αsen2q1

], G =

[0

1

], V = mg cos q1 (5.9.17)

Para el moldeo de energıa cinetica debemos encontrar una matriz Md definida positivaque cumpla las conocidas EDOs reducidas (5.4.12) con k = 1. Sustituyendo todos losterminos esta ecuacion se traduce en

d

dq1

a1(q1) =2α2senq1 cos q1

(β + αsen2(q1))2

a22

a1

d

dq1

a2(q1) =2α2sen(q1) cos(q1)

(β + αsen2(q1))2

a2a3

a1

lo cual admite el cambio de variable x = sen(q1) dando lugar por tanto a

d

dxa1(x) = − 2α2x

β + αx2

a22

a1

d

dxa2(x) = − 2α2x

β + αx2

a2a3

a1

Al igual que en el ejemplo de la bola en la viga, que posee muchas analogıas con este, seencontrara una solucion a este sistema de ecuaciones mediante la eleccion

a3 = ka2a1 (5.9.18)

para cierto valor positivo de la constante k. En este caso, con una eleccion apropiada delas constantes de integracion, se llega a una matriz Md definida positiva para cualquiervalor de q1. Los elementos de Md resultan

a1 =

√2

k(β + αsen2q1)

a2 =1

αk(β + αsen2q1)

a3 =

√2

αk32

(β + αsen2q1)32

Sin embargo, independiente de que la eleccion de a3 sea diferente (5.9.18), se demostraraen adelante que si a1 ha de ser positivo (lo cual es necesario para la positividad de Md), laecuacion de energıa potencial no admite ninguna solucion con un mınimo local en q∗1 = 0(perla vertical superior).

Proposicion 5.9.1. Considerese el sistema descrito por (5.9.17). El sistema de ecua-ciones (5.9.18) del metodo IDA-PBC no admite ninguna solucion con Md definida positivaen un entorno de q∗1 = 0 (perla en el cenit de la circunferencia), compatible con la exis-tencia de un mınimo de Vd en dicho punto.

Demostracion. De hecho, la siguiente igualdad debe ser cierta para la funcion de energıapotencial deseada Vd:

G⊥∇qV − MdM−1∇qVd = 0

Page 141: Hamiltonians based Control

Capıtulo 5. Reduccion del metodo IDA-PBC para sistemas subactuados 127

lo cual en nuestro sistema se convierte en

a1

α

∂Vd

∂q1

+a2

β + αsen2q1

∂Vd

∂q2

=∂V

∂qk

(5.9.19)

Suponiendo que a1 es distinto de cero, la solucion de esta EDP se expresa como la sumade una solucion general de la ecuacion homogenea mas la particular de la completa:

Vd = Φ

(q2 −

∫ q1 a2α

a1(β + αsen2q1)dq1

)−∫ q1 αmgsenq1

a1

dq1 (5.9.20)

donde Φ = Φ(z) es la funcion arbitraria de la solucion homogenea y z servira para designarel argumento de la funcion libre Φ (z es funcion de q1 y q2). La solucion Vd tendra unmınimo en q∗1 = 0 si y solo si

∂Vd

∂q(q∗) = 0 (5.9.21)

∂2Vd

∂q2(q∗) > 0 (5.9.22)

A fin de que la ecuacion (5.9.21) sea cierta es necesario que ∇zΦ = 0. La matriz Hessianade (5.9.22) es

∇2qVd(q

∗) =

[( ∂z

∂q1)2∇2

zΦ|q=q∗∂z∂q1

∂z∂q2

∇2zΦ|q=q∗

∂z∂q1

∂z∂q2

∇2zΦ|q=q∗ ( ∂z

∂q2)2∇2

zΦ|q=q∗

]+

[− ∂

∂qαmgsenq1

a10

0 0

]. (5.9.23)

Notese que la segunda matriz de esta expresion corresponde a la solucion no homogenea.La primera matriz es singular al ser el Hessiano de una funcion escalar Φ. Observandolos elementos diagonales y el determinante podemos concluir que esta matriz es definidapositiva si y solo si

∇2zΦ|q=q∗ >= 0 (5.9.24)

−∇2zΦ|q=q∗

∂q

αmgsenq1

a1

> 0. (5.9.25)

La primera condicion se cumple mediante una apropiada eleccion de Φ, mientras que laultima depende unicamente del signo del factor derivativo, que se calcula derivando porpartes

− ∂

∂q

αmgsenq1

a1

∣∣∣∣q=q∗

= −αmg

a1

∣∣∣∣q=q∗

> 0. (5.9.26)

Esta condicion no puede ser cierta si a1 > 0, que es una suposicion natural que se de-sprende de la exigencia de que el sistema en bucle cerrado posea estructura hamiltoniana,con matriz de inercia definida positiva.

Continuando con el razonamiento, se obtendra el conjunto de posiciones q∗ donde lafuncion de energıa potencial (5.9.20) presenta un mınimo. Dado que

∂2Vd

∂q2|q=q∗ = − ∂2

∂q2

[αmgsenq∗1

a1

]q∗

= −αmg

a1

[cos(q∗1) +

sen(q∗1)a1

da1

dq1

], (5.9.27)

Page 142: Hamiltonians based Control

128 5.9. Extension de la solucion a otros sistemas

El termino da1

dq1se calcula por medio de

d

dq1

a1(q1) = − 2α2senq1

(β + αsen2q1)2

a22

a1

Sustituyendo esta ultima expresion en (5.9.27) y reordenando los elementos se llega a

∂2Vd

∂q2|q=q∗ = −cos q∗1

a1

(1 +

2α2sen2q∗1(β + αsen2q∗1)2

a22

a1

)(5.9.29)

La unica manera de lograr que (5.9.29) sea mayor que cero es haciendo cos q∗1 < 0, locual limita los posibles puntos de equilibrio del sistema hamiltoniano en bucle cerrado alintervalo q1∗ ∈ [π

2, 3π

2], la mitad inferior de la circunferencia.

Este es un resultado previsible que se desprende de las consideraciones fısicas apun-tadas al comienzo de este apartado, pero con el se ha pretendido ilustrar como se manifi-estan estos fenomenos al aplicar el metodo IDA-PBC. El problema surge del hecho de queel metodo obvia las consideraciones de controlabilidad previas al diseno de un controlador.

Page 143: Hamiltonians based Control

Capıtulo 6

Estabilizacion de oscilaciones ensistemas no lineales

6.1 Introduccion

La mayor parte de las tecnicas de control desarrolladas en las ultimas decadas abordanlos problemas de estabilizacion asintotica de puntos de equilibrio y el seguimiento detrayectorias. Ası sucede, por ejemplo, con el metodo IDA-PBC estudiado en capıtulosprevios de esta tesis. Sin embargo, en algunos sistemas—incluyendo conversores de alternay robots caminantes—el objetivo consiste en obtener oscilaciones estables y robustas.La estabilizacion de oscilaciones es un problema que se ha considerado en la literatura(Fradkov & Pogromsky 1998, Leonard, Bloch & Marsden 1998) empleando diferentesmetodologıas.

Se presentara en este capıtulo un metodo para la generacion de oscilaciones establespor realimentacion del estado en una clase de sistemas de control no lineales. El objetivopropuesto es la estabilizacion basada en la energıa de oscilaciones en sistemas mecanicos nolineales en cascada. Las oscilaciones estan asociadas a un ciclo lımite que surge a traves deuna bifurcacion de Hopf supercrıtica. El metodo que se introduce a continuacion consisteen dos pasos. En primer lugar, un sistema de segundo orden sera controlado para darlugar a uno nuevo que experimenta una bifurcacion de Hopf allı donde emerge un ciclolımite. En el segundo paso, el controlador se extiende a sistemas de orden mayor mediantebackstepping. A fin de ilustrar el metodo descrito se ha realizado una implementacion sobreun sistema de levitacıon magnetica y se ha simulado el funcionamiento sobre un clasicosistema mecanico subactuado: la bola y la viga.

En la parte final del capıtulo se presentara otra tecnica alternativa para la estabi-lizacion de oscilaciones por realimentacion del estado. Para ello definiremos un sistemade dimension dos que exhibe oscilaciones periodicas estables y robustas y lo sumergimosen el espacio de estados de orden mayor del sistema a controlar, empleando la tecnicade Inmersion e Invariancia de (Astolfi & Ortega 2001). Con este fin, extenderemos elresultado principal de esta tecnica que en su origen se aplica a la estabilizacion de equi-librios. Con pequenas modificaciones el resultado se traslada tambien a la estabilizacionde orbitas periodicas como se pretende aquı.

La ventaja principal de una ley de estabilizacion de oscilaciones mediante una reali-

129

Page 144: Hamiltonians based Control

130 6.1. Introduccion

mentacion pura del estado frente a la posibilidad alternativa de seguimiento de trayectoriassinusoidales de referencia es, ademas de no depender de senales variantes en el tiempo, locual dificulta tanto la implementacion como las pruebas de estabilidad y robustez, estaen el hecho de que mediante la tecnica que se presentara no se persigue una trayectoriacon informacion de fase, con lo cual el sistema puede entrar en oscilacion desde cualquierpunto de la orbita, y por tanto el error en seguimiento es una medida de la distancia alpunto mas cercano de la orbita. En el caso tradicional de seguimiento de trayectorias, lareferencia posee una informacion de fase que obliga al sistema a incorporarse a la orbitaen punto exacto, lo cual puede dar lugar a una variable de medida del error mayor yretrasar el transitorio hasta la convergencia en el lımite. Este efecto se ilustra en la figura6.1.

Trayectoria dela garra del robot

Orbita objetivosin información de fase

Trayectoria dela garra del robot

Trayectoria dereferenciacon informaciónde fase

Posición inicial de laórbita de referencia

erroren t=0

erroren t=0

Posición de laórbita de referencia

en el punto de alcance

Figura 6.1: Comparacion entre el seguimiento de trayectorias dependientes del tiempo (izquier-da) y la estabilizacion de orbitas periodicas sin informacion de fase (derecha).

En este capıtulo tambien estudiaremos la bifurcacion de Hopf (Hale & Kocak 1991,Kuznetsov 1995) que aparece asociada a un parametro del controlador que propondremos.La bifurcacion de Hopf es uno de los escasos metodos que permiten para determinarla existencia de ciclos lımite en sistemas de dimension alta. Este hecho se emplea eneste capıtulo para generar de oscilaciones estables y robustas mediante el diseno de uncontrolador capaz de lograr que los sistemas pertenecientes a una clase no lineal, queincluye una variedad de sistemas subactuados, experimenten una bifurcacion de este tipo.

El metodo introducido en este capıtulo para disenar el controlador comprende dospasos principales. En el primero se considera un sistema de segundo orden en bucle abierto.Con la ley de realimentacion apropiada, este subsistema es transformado en otro con unabifurcacion de Hopf y, consiguientemente, un comportamiento oscilante (Aracil, Gordillo& Acosta. 2002). Entonces, en un segundo paso, la tecnica denominada backstepping(Khalil 1996, Krstic, Kanellakopoulos & Kokotovic 1995, Sepulchre et al. 1997) se aplicapara extender la ley de control al sistema completo de orden mayor de tal manera que labifurcacion de Hopf se mantiene y, entonces, el comportamiento oscilante del subsistemade segundo orden se propaga hacia todas la variables.

El metodo empleado para obtener la ley de realimentacion para el subsistema delprimera fase de diseno pertenece a la familia de controladores no lineales relacionados conmetodos de moldeo de energıa (Ortega et al. 1998). Tal y como se ha publicado recien-temente la mayorıa de estos metodos proporcionan leyes de realimentacion que dirigen alsistema controlado hacia un punto de equilibrio aislado (el punto de trabajo). Sin embar-go, nuestro objetivo se ha transformado en la consecucion de un ciclo limite en regimen

Page 145: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 131

permanente, que nace en una bifurcacion de Hopf. Conviene notar que el nacimientodel ciclo lımite asociado a una bifurcacion de Hopf tiene lugar en un espacio de dos di-mensiones. Este es el espacio natural en el que se define el subsistema de segundo ordenen bucle abierto considerado en la primera fase del metodo. De hecho, el metodo quese presenta en estas paginas comienza con la bifuracion de Hopf (y por tanto del ciclolımite) en este subespacio, y entonces se extiende al espacio de estados completo. Este he-cho subraya la relevancia de la bifurcacion de Hopf como fundamento teorico del enfoquepresentado.

Igualmente cabe destacar que un sistema que presente una bifurcacion de Hopf es talque para ciertos valores del parametro de bifurcacion µ el sistema tiene un punto atractor,que es el caso normalmente considerado en sistemas control no lineales convencionales;sin embargo para otros valores de µ el conjunto lımite del sistema dinamico se transformaen un ciclo lımite y el sistema oscila de un modo estable y robusto.

Una vez concluido el diseno del controlador para el sistema de segundo orden, el prob-lema consiste en la extension del comportamiento oscilante a todas las variables de estado.La solucion viene de la mano de un procedimiento recursivo basado en el backstepping.En la segunda fase de diseno comenzaremos con el controlador y la funcion de Lyapunovobtenidos en la primera fase, para obtener, seguidamente, mediante backstepping un con-trolador y una funcion de Lyapunov de control para un subsistema de tercer orden. Elproceso se repite para pasar a cuarto orden, quinto, y ası sucesivamente. La clase desistemas considerada en los ejemplos de este capıtulo no excede el cuarto orden, pero lametodologıa no se restringe a ellos. Uno de los resultados clave del capıtulo se centraen el hecho de que la bifurcacion de Hopf detectada en el sistema de segundo orden semantiene gracias a la tecnica de backstepping en los sistemas completos de orden mayoraquı considerados.

Una implicacion muy interesante reside en el hecho de que el sistema bucle cerradoobtenido tras aplicar la tecnica basada en backstepping a la clase de sistemas aquı con-siderada tiene estructura hamiltoniana generalizada. De este modo, se ha detectado unasorprendente interrelacion entre backstepping y la estructura hamiltoniana generalizada.Las consecuencias de este hecho son exploradas de manera superficial, quedando abiertauna interesante lınea de investigacion.

El metodo propuesto en este capıtulo funciona debidamente para sistemas completa-mente actuados, en cuyo caso la solucion es trivial, y para una clase de subactuados que esla que se tratara en detalle. A fin de ilustrar el metodo se han seleccionado como ejemplosdos sistemas mecanicos subactuados bien conocidos en la literatura y en el desarrollo deesta tesis: el sistema de levitacion magnetica y la bola en la viga.

El resto del capıtulo se organiza como sigue. En la seccion 6.2, se presenta una funcionde Lyapunov de control apropiada para la obtencion del comportamiento oscilante en elsistema de segundo orden en bucle cerrado. Empleando dicha funcion como hamiltonianodel sistema, se obtiene un sistema en bucle cerrado que presenta una bifurcacion de Hopf.Este sistema es considerado como la dinamica objetivo para un sistema de bucle abiertode segundo orden. En la seccion 6.3, se introduce una ley sencilla para la estabilizacion deoscilaciones en sistemas de segundo orden que sirve de base a los desarrollos posteriores.Las secciones 6.4 y 6.5 describen una tecnica inspirada en el backstepping que se empleararecursivamente para calcular una ley de control para sistemas de tercer orden. En laseccion 6.6 se presentan los resultados teoricos destinados a extender el metodo de disenoa sistemas subactuados de cualquier orden que posean estructura en cascada. Se probaraque la bifurcacion de Hopf se mantiene a lo largo de cada iteracion del procedimiento de

Page 146: Hamiltonians based Control

132 6.2. Un sistema hamiltoniano generalizado oscilatorio de segundo orden

backstepping.

La seccion 6.7 discute, en virtud de los teoremas de linealizacion por realimentacion,la posibilidad de extender los resultados del capıtulo a sistemas con estructuras masgenerales, no estrictamente en cascada. El apartado 6.8 presenta una expresion cerradapara ley de control de estabilizacion de oscilaciones que se aplica a la clase de sistemasdescrita en 6.7.

En el apartado 6.9 el metodo se aplicara a dos conocidos sistemas subactuados: elsistema de levitacion magnetica (tercer orden) y la bola en la viga (cuarto orden). En elprimero de ellos se verificaran los resultados teoricos en un sistema real de laboratorio. Enel caso de la bola en la viga se analizaran las cuencas de atraccion limitadas al emplear uncontrolador basado en un modelo aproximado. Adicionalmente se demostrara la existenciade una bifurcacion de Hopf en el sistema controlado. La seccion 6.10 trata el problemade estabilizacion de oscilaciones mediante una tecnica alternativa de reciente desarrollo,el metodo de Inmersion e Invariancia(Astolfi & Ortega 2001).

6.2 Un sistema hamiltoniano generalizado oscilatorio de segundoorden

El objetivo de este apartado es definir sistema bidimensional no lineal de la forma x =f(x), x = (x1, x2) ∈ IR2, que presente un ciclo lımite. Mas adelante se disenara la ley decontrol que ajuste este sistema con el de bucle abierto. A este fin, considerese la funcion

V0(x1, x2)=

1

4(ω2

cx21 + x2

2)2 − µ

2(ω2

cx21 + x2

2) +µ2

4, (6.2.1)

donde ωc ∈ IR and µ ∈ IR seran los parametros de diseno. Definiendo P (x1, x2)=

ω2cx

21 + x2

2 − µ, se tiene

V0 =1

4P 2 (6.2.2)

El mınimo de V0 se alcanza en P = 0. Dependiendo de los valores del parametro µ lafuncion V0 adopta dos formas geometricas muy diferentes. Para µ < 0 poseera un mınimounico en el origen del plano (x1, x2), como se muestra en la figura 6.2; sin embargo paraµ > 0 los mınimos de V0 se alcanzan en la curva cerrada ω2

cx21 + x2

2 = µ (figura 6.3).

La forma de la funcion V0 invita a considerar los sistemas para los cuales V0 es unafuncion de Lyapunov (Mees & Chua 1979). Se espera que los conjuntos lımite sean puntosde equilibrio para µ < 0, y para µ > 0 ciclos lımite. Un modo de lograr un sistea dinamicocon V0 como funcion de Lyapunov es definir el sistema hamiltoniano generalizado (Vander Schaft 2000) [

x1

x2

]=

[0 1

ω2cx2

1+x22−µ

− 1ω2

cx21+x2

2−µ0

][Dx1V0

Dx2V0

]. (6.2.3)

donde V0 es la funcion de Hamilton. La aparicion del denominador ω2cx

21 + x2

2 − µ en loselementos de la matriz simplectica no debe sorprender pues estan destinados a cancelarel factor comun P que aparece en las derivadas de V0. De hecho lo que se persigue es que

Page 147: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 133

Figura 6.2: V0 para µ < 0, con un unico mınimo.

Figura 6.3: V0 para µ > 0 con un conjunto mınimo formado por una curva cerrada.

Page 148: Hamiltonians based Control

134 6.2. Un sistema hamiltoniano generalizado oscilatorio de segundo orden

en ausencia de amortiguamiento la segunda ecuacion de estado coincida con la del clasicomovimiento armonico simple u oscilador armonico

x1 = −ω2cx1, (6.2.4)

o equivalementemente [x1

x2

]=

[x2

−ω2cx1

]. (6.2.5)

La derivada con respecto al tiempo de la funcion V0 es

V0 =

(∂V0

∂x

)T

x = [ ω2cx1P x2P ]

[x1

x2

]. (6.2.6)

Empleando la ecuacion (6.2.5) se obtiene V0 = 0 a lo largo de las trayectorias deeste sistema, el cual, por tanto, es un sistema conservativo con respecto a la funcion dealmacenamiento V0.

Para obtener un sistema dinamico tal que V0 < 0, debemos anadir amortiguamien-to. Con esta finalidad, se ha de realizar una ligera modificacion en la ecuacion (6.2.3),anadiendo un termino de amortiguamiento con el que se obtiene[

x1

x2

]=

[0 1

ω2cx2

1+x22−µ

− 1ω2

cx21+x2

2−µ−ka

][Dx1V0

Dx2V0

], (6.2.7)

siendo ka > 0 un coeficiente de amortiguamiento1. El sistema (6.2.7) puede escribirsecomo

x1 = x2 (6.2.8)

x2 = −ω2cx1 − kaPx2. (6.2.9)

No siempre sera necesario incluir de forma explıcita un termino de amortiguamiento paralograr la desigualdad en sentido estricto en la derivada de la funcion de Lyapunov. Esto sedebe al hecho de que el termino de amortiguamiento de la ecuacion (6.2.9) tiene la formaPx2. Por tanto, si un termino de este tipo aparece en algun punto del desarrollo, inclusosin haber introducido explıcitamente el amortiguamiento, el efecto sera el mismo. Comose vera mas adelante, esto es exactamente lo que ocurre cuando aplicamos backsteppingen sistemas de orden mayor que dos.

El sistema (6.2.8)–(6.2.9) tiene la muy interesante propiedad de exhibir una bifurcacionde Hopf para µ = 0. Este hecho se puede apreciar de forma intuitiva en las graficas 6.2 y6.3, donde se hace visible que para µ = 0 la geometrıa de V0 sufre un cambio radical. Apartir de este punto, el mınimo aislado que existıa originalmente para valores negativosde µ > 0 se transforma en una elipse en torno al origen (figura 6.3) descrita por laecuacion con P (x1, x2) = 0. Estas formas proporcionan una intuicion geometrica sobrelos comportamientos esperados del sistema.

1Se podrıa argumentar que la disipacion puede igualmente introducirse en la primera lınea de (6.2.7).En la practica esto no es viable porque esta primera fila toma la forma x1 = x2 invariablemente ensistemas mecanicos.

Page 149: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 135

Proposicion 6.2.1. El sistema (6.2.8)–(6.2.9) atraviesa una bifurcacion de Hopf asoci-ada al equilibrio x1 = x2 = 0 cuando µ = 0.

Demostracion. Es palpable que el origen representa un punto de equilibrio para cualquiervalor del parametro µ. La linealizacion en este punto viene dada por[

x1

x2

]=

[0 1

−ω2c kaµ

][x1

x2

], (6.2.10)

cuyo polinomio caracterıstico es λ2 − kaµλ + ω2c y los correspondientes autovalores son, a

su vez,

λ1,2 =kaµ ±√

(kaµ)2 − 4ω2c

2. (6.2.11)

Entonces, para µ < 0, se tiene Re(λ) < 0 y el origen es estable; para µ = 0, λ = ±jωc yel origen es un equilibrio no hiperbolico; y para µ > 0, Re(λ) > 0 y el origen es inestable.Consecuentemente el sistema (6.2.8)–(6.2.9) tiene un equilibrio unico en el origen paraµ < 0, y para µ > 0 este equilibrio se torna inestable. La condicion de transversalidad sesatisface dado que

dRe[λ(µ0)]

∣∣∣∣µ=0

=ka

2= 0

Comentario 6.2.1. Resulta de interes considerar que para ka = 0, el sistema (6.2.8)–(6.2.9)se reduce a x = −ω2

cx, un sistema cuyo retrato de estados lo forma un continuo de orbitascerradas que llena densamente el espacio de estados. Sin embargo estos comportamientososcilatorios no son estructuralmente estables. El efecto del amortiguamiento no es masque seleccionar entre todos las orbitas periodicas una en particular a la que se le asignaraun estado de “mınima energıa”. El sistema alcanzara y se mantendra en dicha orbita deforma estable y robusta.

Comentario 6.2.2. El perıodo inicial (de la oscilacion de amplitud nula) es

T0 =2π

ωc

ya que ±jωc son los autovalores de (6.2.10) para µ = 0 en el punto de equilibrio. Cuandoµ > 0 los efectos de la no linealidad se manifiestan en la aparicion del ciclo lımite (queno es un fenomeno reproducible en sistemas lineales). T0 es una estimacion del periodoesperado de las oscilaciones. De este modo, ωc es un parametro que se puede emplearpara obtener la frecuencia deseada en las oscilaciones. En principio, esta aproximacion esrazonablemente buena para pequenos valores de µ. Sin embargo, la siguiente proposicionextiende la validez de la aproximacion y mas aun, ayuda a comprender el comportamientodel sistema lejos del punto de bifuracion.

Proposicion 6.2.2. Considerese el sistema (6.2.8)-(6.2.9). Si µ < 0 el origen es global-mente asintoticamente estable. Si µ > 0, para cualquier condicion inicial salvo el origen,las trayectorias tienden al ciclo lımite P = 0 con periodo 2π/ωc.

Demostracion. Es facil de comprobar que la funcion radialmente no acotada V0 satisfaceV0 = −kaP

2x22 ≤ 0. Procedamos a calcular los conjuntos invariantes para los cuales

V0 = 0.

Page 150: Hamiltonians based Control

136 6.3. Estabilizacion de oscilaciones en sistemas de orden dos

• Una primera posibilidad esta asociada a x2(t) ≡ 0, lo cual implica que x1 = 0 (de(6.2.8)) y x2 = 0 (del signo de identidad). Empleando (6.2.9) esto significa queωcx

21 = 0 ⇒ x1 = 0. En consecuencia, este caso corresponde al punto (x1, x2) =

(0, 0). Por linealizacion se puede ver que este punto es localmente estable para µ < 0y localmente inestable para µ > 0.

• La segunda posibilidad es la de P = 0. Este conjunto no existe para µ < 0.

En consecuencia con la aplicacion del principio de invariancia de LaSalle (Khalil 1996)se prueba la primera parte de la proposicion. Para la segunda, aun hemos de demostrarque la curva P = 0 es realmente un ciclo lımite, o dicho de otro modo, demostraremos laausencia de puntos de equilibrio sobre P = 0. Procederemos por contradiccion: supongaseque existe dicho equilibrio en P = 0. De (6.2.8), se tiene x2 = 0 y de (6.2.9) con P = 0se tiene x1 = 0. Pero x1 = x2 = P = 0 solo es posible si µ = 0.

Finalmente para P = 0, el sistema (6.2.8)–(6.2.9) se reduce a (6.2.4) para el cual elperiodo de las oscilaciones es 2π/ωc.

Al ser el ciclo lımite estable y, para µ > 0, existe cuando el equilibrio es localmenteestable, se desprende el siguiente corolario.

Corolario 6.2.3. La bifurcacion de Hopf de la proposicion 6.2.1 es supercrıtica.

6.3 Estabilizacion de oscilaciones en sistemas de orden dos

Para un sistema de segundo orden de la forma2

x1 = x2 (6.3.1)

x2 = g(u), (6.3.2)

donde g−1(·) existe sobre el dominio de interes, los resultados de las secciones previaspermiten tratar con el problema de diseno de un controlador que haga que el sistemaoscile. Es claro que el sistema en bucle abierto (6.3.1)-(6.3.2) puede ser ajustado paraobtener el comportamiento en bucle cerrado (6.2.5) mediante la ley de control

u = g−1(−ω2cx1 − kaPx2). (6.3.3)

Adicionalmente, V0 es una funcion de Lyapunov de control del sistema. Esto significa quelos conjuntos lımite del sistema (6.3.1)-(6.3.2) tras la aplicacion de (6.3.3) son los mınimosde V0; es decir, una curva cerrada para µ > 0 y un punto aislado para µ < 0. Entonces elcomportamiento del sistema en bucle cerrado sera oscilatorio o asintoticamente estable,

2Esta estructura se puede extender trivialmente a la forma

x1 = x2

x2 = f(x1, x2) + g(u)

.

Page 151: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 137

dependiendo del signo del parametro µ. Esto puede ser enunciado alternativamente indi-cado que el sistema atraviesa una bifurcacion de Hopf cuando µ = 0.

Con estos resultados, el diseno de un controlador para un sistema de segundo orden conun actuador de la forma (6.3.1)–(6.3.2) puede lograrse si las condiciones apropiadas sonsatisfechas. Este resultado admite una generalizacion a sistemas con muchos actuadorese incluso a una clase mas amplia. Por ejemplo, si el sistema a controlar es un robot conactuadores en todas sus articulaciones, entonces se podrıa aplicar a cada una de ellas unaley del tipo (6.3.3). De este modo cada una de las diferentes articulaciones puede entraren oscilacion de forma independiente.

6.4 Backstepping para una clase de sistemas no afines

La estabilizacion de oscilaciones tal y como se ha presentado en sistemas de orden dos estrivial. Sin embargo sirve de base para la extension a una clase de sistemas subactuados deorden ilimitado, que sera objeto de interes en este capıtulo. La segunda herramienta quese precisa para la extension a orden mayor esta basada en el metodo backstepping (Khalil1996, Krstic, Kanellakopoulos & Kokotovic 1995, Sepulchre et al. 1997) introducido en laseccion 2.7.4.

En esta seccion, se desarrollara la aplicacion del metodo backstepping para sistemasque no son afines en las variables que se emplearan como control virtual. Considerese elsistema

η = f(η) + g(ξ) (6.4.1)

ξ = u, (6.4.2)

g(ξ) =

[0

1

]h(ξ) = bh(ξ),

donde η ∈ IR2, ξ ∈ IR. Suponga que este sistema tiene un punto de equilibrio en (0, 0, ξ∗),es decir f(0) = 0 y h(ξ∗) = 0, y adicionalmente h′(ξ∗) = 0.

Con el fin de aplicar backstepping, considerese en primer lugar el sistema (6.4.1) con ξcomo control virtual. Supongase que existe una ley de realimentacion ξ = u0(η) tal queel sistema (6.4.1) tiene las propiedades de estabilidad deseadas. Dicho de otro modo, elsistema

η = f(η) + g(u0(η)) (6.4.3)

es estable, o al menos sus trayectorias estan acotadas. Adicionalmente, supondremos queexiste una funcion de Lyapunov V0 tal que

∇ηV0(f(η) + g(u0(η))) ≤ 0.

Sumando y restando g(u0(η)) al segundo miembro de la ecuacion (6.4.3) se tiene

η = f(η) + g(u0(η)) + g(ξ) − g(u0(η))

= f(η) + g(u0(η)) + b(h(ξ) − h(u0(η)))

= f(η) + g(u0(η)) + bz,

Page 152: Hamiltonians based Control

138 6.5. Un metodo para la estabilizacion de oscilaciones mediante backstepping

donde hemos introducido z= h(ξ) − h(u0(η)). De acuerdo con esta ultima definicion de

z se tienez = h′ξ − h′∇ηu0η.

Si definimos v = z y recordamos que u = ξ entonces

u = ∇ηu0η +v

h′ . (6.4.4)

Las ecuaciones (6.4.1)-(6.4.2) se pueden escribir como sigue

η = f(η) + g(u0(η)) + bz (6.4.5)

z = v (6.4.6)

Proponiendo para este sistema la funcion de Lyapunov

V1 = V0 +1

2z2 (6.4.7)

se obtiene

V1 = ∇ηV0η + zz

= ∇ηV0(f(η) + g(u0(η))) + ∇ηV0bz + zv.

Entonces para lograr que V1 ≤ 0 una eleccion razonable es

v = −(∇ηV0b + kz),

es decir

u = ∇ηu0η − ∇ηV0b + kz

h′

= ∇ηu0(f(η) + g(ξ)) − 1

h′∇ηV0b − k

h′(ξ)(h(ξ) − h(u0(η))) (6.4.8)

que es la ley de realimentacion para el sistema (6.4.1)-(6.4.2). Con esta ley

V1 = ∇ηV0(f(η) + g(u0(η))) − kz2, (6.4.9)

que es menor o igual que cero.

6.5 Un metodo para la estabilizacion de oscilaciones mediante back-stepping

El metodo presentado en la seccion 6.3 puede ser extendido a sistemas en cascada cuyadimension es superior a dos, incluyendo una amplia clase de subactuados. Con este obje-tivo, emplearemos la tecnica backstepping para sistemas no afines de la seccion anterior.Para un comienzo motivador, considerese la siguiente clase de sistemas de tercer orden

η1 = η2

η2 = h(ξ) (6.5.1)

ξ = u,

Page 153: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 139

donde η = (η1, η2) ∈ IR2 y ξ ∈ IR. Supongamos que h(ξ) es invertible y h′(ξ) = 0 entodo el dominio de interes Ω ⊂ IR3. Asimismo, supongamos que el sistema, en ausenciade accion de control, posee un punto de equilibrio en (0, 0, ξ∗); es decir h(ξ∗) = 0. Sea

P (η)= ω2

cη21 + η2

2 − µ = 0 el conjunto lımite deseado.

Las dos primeras ecuaciones dan un subsistema de segundo orden con ξ como variablede control virtual, que puede ser transformada en la forma (6.2.5) haciendo h(ξ) = −ω2

cη1,es decir, con la ley de control virtual

ξ = u0(η1)= h−1(−ω2

cη1). (6.5.2)

Pese a que la construccion del subsistema oscilante de segundo orden ası lo sugerıa, elamortiguamiento aun no ha sido introducido en esta fase de diseno. Las razones seaportaran mas adelante. De este modo, la funcion V0(η1, η2) = P 2/4 satisface V0 = 0.

A fin de trasladar la accion de control desde la tercera ecuacion de (6.5.1) a la segunda,podemos hacer uso del procedimiento de backstepping (vease la seccion 6.4). Empleandola ecuacion (6.4.8) con la V0 definida (6.2.1) se obtiene la siguiente ley de control:

u = u1(η1, η2, ξ) = u′0(η1)η2 − 1

h′(ξ)

(η2P + k1(h(ξ) + ω2

cη1)). (6.5.3)

Comentario 6.5.1. Notese que para la eleccion de V0 dada en (6.2.1), obtendremos ∇ηV0b =x2P , que tomara el papel de kaPx2 en (6.2.9). Esto significa que la ley de realimentacion(6.5.3) esta dotada de un termino de amortiguamiento. Esta es la razon para no introduciramortiguamiento en (6.5.2).

Proposicion 6.5.1. Si µ > 0, para cualquier condicion inicial en Ω, excepto el punto(0, 0, ξ∗), el sistema (6.5.1) con la ley de control (6.5.3) se aproximara al ciclo lımiteP (η) = 0 cuando t → ∞. Si µ < 0, para cualquier condicion inicial en Ω, el sistema(6.5.1) con la ley de control (6.5.3) se tendera al punto (0, 0, ξ∗) cuando t → ∞.

Demostracion. el control mediante backstepping (6.5.3) asegura que la funcion

V1 = V0 +1

2z21 , (6.5.4)

con z1 = h(ξ) + ω2cη1, satisface V1 = −k1z

21 ≤ 0 (vease (6.4.9) en la seccion 6.4). A

continuacion procederemos a calcular los conjuntos invariantes donde V1 = 0:

V1 ≡ 0 ⇒ z1(t) ≡ 0 ⇒ h(ξ) + ω2cη1 ≡ 0.

Al ser la funcion h(·) invertible y u0(η1) = h−1(−ω2cη1), V1 ≡ 0 ⇒ ξ − u0(η1) ≡ 0 y por

tanto3

V1 ≡ 0 ⇒ ξ − u′0(η1)η1 ≡ 0 ⇒ u − u′

0(η1)η2 ≡ 0.

Empleando la expresion (6.5.3)

V1 ≡ 0 ⇒ − 1

h′(ξ)

(η2P + k1(h(ξ) + ω2

cη1)) ≡ 0.

El factor multiplicado por k1 es igual a z1, que estamos asumiendo igual a cero, y portanto

V1 ≡ 0 ⇒ −η2P ≡ 0.

Esta ultima expresion puede ser satisfecha en dos casos:

3Tengase en cuenta el signo de identidad mantenido a lo largo del tiempo.

Page 154: Hamiltonians based Control

140 6.5. Un metodo para la estabilizacion de oscilaciones mediante backstepping

• P ≡ 0. Este conjunto no existe para µ < 0.

• η2 ≡ 0 ⇒ h(ξ) = 0 ⇒ ω2cη1 = 0 ⇒ η1 = 0. Esta situacion corresponde al equilibrio

(0, 0, ξ∗). Por linealizacion puede comprobarse que el equilibrio es inestable cuandoµ > 0 y estable cuando µ < 0.

Por tanto, aplicando el principio de LaSalle y siguiendo el mismo razonamiento que altermino de la prueba de la Proposicion 6.2.2, el enunciado de la Proposicion 6.5.1 quedademostrado.

Comentario 6.5.2. En regimen permanente, la variable ξ tambien oscila ya que z1 → 0 ⇒h(ξ) → −ω2

cη1 ⇒ ξ → h−1(−ω2cη1).

Corolario 6.5.2. Si el sistema (6.5.1) es reemplazado por

η1 = η2

η2 = h(η3)

η3 = η4 (6.5.5)

η4 = η5

...

ηn−1 = ξ

ξ = u,

y continuando con el procedimiento basado en backstepping, se obtiene el mismo resultado.

En la seccion 6.9.7 se presenta un ejemplo de la aplicacion del Corolario 6.5.2.

Proposicion 6.5.3. Considerese el sistema (6.5.1) tras aplicar la ley de realimentacion(6.5.3). El sistema experimenta una bifurcacion de Hopf para µ = 0.

Demostracion. Tras la aplicacion de la ley de realimentacion (6.5.3), el sistema en buclecerrado es

x1 = x2

x2 = h(x3) (6.5.6)

x3 = u′0(x1)x2 − 1

h′(x3)(k1ω

2cx1 + x2P + k1h(x3)).

A fin de obtener la linealizacion de este sistema en torno al origen debe hacerse notar queu′

0(0) = −ω2c/h

′(x∗3) y por tanto

∂u

∂x3

∣∣∣∣(0,0,x∗

3)

= −k1

((h′)2 − h′′h

(h′)2

)∣∣∣∣(0,0,x∗

3)

pero al ser h(x∗3) = 0 este termino es igual a −k1, y el resto de la matriz jacobiana toma

la forma x1

x2

x3

=

0 1 0

0 0 κ

−k1ω2c

κ−ω2

c−µκ

−k1

(6.5.7)

Page 155: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 141

donde κ = h′(x∗3). El polinomio caracterıstico del jacobiano viene dado por

s3 + k1s2 + (ω2

c − µ)s + ω2ck1

que es un polinomio Hurwitz si son satisfechas las siguientes condiciones: 1) k1 > 0 y(ω2

c − µ) > 0; y 2) k1(ω2c − µ) > k1ω

2c , es decir µ < 0. Recordando (2.5.1)-(2.5.2) las

condiciones de existencia de un par de autovalores imaginarios para n = 3 son

a0 > 0 , a2 > 0 , a1a2 = a0.

La ultima condicion conduce a k1ω2c = k1(ω

2c − µ), lo cual implica que µ = 0. La

condicion de transversalidad es satisfecha al cambiar el signo a1a2 − a3 = µ cuandocambia el signo de µ. Por consiguiente, el sistema es estable para µ < 0, y la estabilidadse pierde para µ = 0 cuando se produce la bifurcacion de Hopf. Para este ultimo valorcrıtico de µ el polinomio caracterıstico de la matriz Jacobiana se transforma en

s3 + k1s2 + ω2

cs + ω2ck1 ≡ (s2 + ω2

c )(s + k1)

donde la existencia de dos raıces puramente imaginarias para µ = 0 se hace patente.

A continuacion se demostrara que mediante un sencillo cambio de variable el sistemaen bucle cerrado admite una descripcion hamiltoniana generalizada. Tras la aplicacion dela ley de realimentacion (6.5.3) a (6.5.1) se obtiene

η1 = η2

η2 = h(ξ) (6.5.8)

ξ = −ω20

h′ η2 − 1

h′ (η2P + k1z1),

donde z1 = h(ξ) + ω2cη1. Escribiendo la ecuacion (6.5.8) en el espacio (η1, η2, z1) obten-

dremos

η1 = η2

η2 = −ω2cη1 + z1 (6.5.9)

z1 = −η2P − k1z1,

que puede ser reescrito como η1

η2

z1

=

0 1

P0

− 1P

0 1

0 −1 −k1

η1P

η2P

z1

, (6.5.10)

donde la ultima columna es ∇xV1, siendo x = [η1 η2 z1]T . Notese que el sistema (6.5.10) es

la version en dimension tres de (6.2.7). La matriz del sistema tiene una deseable propiedadestructural: admite la descomposicion en la suma de una diagonal negativa y una anti-simetrica. Esto permite interpretar el sistema (6.5.10) como un sistema hamiltonianogeneralizado (Van der Schaft 2000). Tambien puede ser reescrito como

η1

η2

z1

=

0 1

P0

− 1P

0 1

0 −1 0

∇xV1 +

0 0 0

0 0 0

0 0 −k1

∇xV1, (6.5.11)

Page 156: Hamiltonians based Control

142 6.6. Sistemas de orden mayor

donde el sistema ha sido disociado en partes conservativa y disipativa. De este modoel comportamiento del sistema puede comprenderse como la union de un movimientoconservativo al que se superpone un efecto de amortiguamiento para alcanzar el com-portamiento oscilatorio, modelado por la parte disipativa del comportamiento en buclecerrado. El subsistema conservativo es tal que la cantidad conservada es precisamenteV1. Por tanto, la funcion de Lyapunov obtenida mediante backstepping proporciona unacantidad conservativa para el sistema en bucle cerrado.

6.6 Sistemas de orden mayor

A continuacion se extenderan los resultados previos a sistemas no lineales no afines conestructura en cascada de la forma

x1 = x2

x2 = h3(x3)

x3 = h4(x4)

x4 = h5(x5) (6.6.1)...

xn−1 = hn(xn)

xn = u,

Para el calculo de la ley de control no se presentara una formula explıcita, sino que serealizara un calculo recursivo que facilitara su comprension. Para ello comenzaremos conel subsistema de segundo orden (x1, x2).

x1 = x2

x2 = u2

Donde u2 es la ley de control que estabiliza el sistema en la oscilacion deseada con funcionde Lyapunov V2 = P 2/4. Concretamente

u2 = −ω2cx1 − k2Px2

siendo k2 > 0 un parametro libre. Si extendemos el sistema a tercer orden

x1 = x2

x2 = h3(x3)

x3 = u3

y definimos

u2= h−1

3 (u2)

z3= h3(x3) − h3(u2) = h3(x3) − u2

V3 = V2 +1

2z23

tendremos, en virtud de lo expuesto anteriormente, que la ley

u3 =1

h′3(x3)

[h′

3(u2)u2 − ∂V2

∂x2

− k3z3

]

Page 157: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 143

estabiliza asintoticamente el conjunto P = 0 en el sistema de tercer orden, con funcionde Lyapunov V3. Para llegar a identificar el termino general de control para un sistemade mayor dimension, es preciso repetir el proceso para un sistema de orden cuatro

x1 = x2

x2 = h3(x3)

x3 = h4(x4)

x4 = u4

y definamos, de nuevo

u3= h−1

4 (u3)

z4= h4(x4) − h4(u3) = h4(x4) − u3

V4 = V3 +1

2z24

entonces la ley de control calculada recursivamente

u4 =1

h′4(x4)

[h′

4(u3)u3 − ∂V3

∂x3

− k4z4

]estabiliza asintoticamente el sistema de cuarto orden en la orbita P = 0 con funcion deLyapunov V4. A partir de aquı es de facil deduccion la ley de control generica, como seafirma en la siguiente proposicion

Proposicion 6.6.1. Sea el sistema de orden n con la estructura en cascada (6.6.1).Supongase que el subsistema de orden k > 2 formado por las k − 1 primeras ecuacionesde estado mas la ecuacion

xk = u

se estabiliza asintoticamente en la orbita P = 0 con la ley u = uk. Entonces la ley un

calculada recursivamente segun la formula

ui+1 =1

h′i+1(xi+1)

[h′

i+1(ui)ui − ∂Vi

∂xi

− ki+1zi+1

], i = k . . . n (6.6.2)

donde

ui= h−1

i+1(ui)

zi= hi(xi) − hi(ui−1) = hi(xi) − ui−1

Vi = Vi−1 +1

2z2

i

estabiliza asintoticamente el sistema de orden n en la orbita P = 0.

Demostracion. Tomese Vn como funcion de Lyapunov para comprobar que

Vn = −k2Px22 − k3z

23 − k4z

24 ... − knz2

n

Que es nula si y solo si zi = 0 y P = 0. Por el principio de invariancia de LaSalle sededuce que al ser el unico conjunto invariante con funcion de Lyapunov cero la orbitaperiodica P = 0, el sistema convergera asintoticamente a dicho conjunto.

Page 158: Hamiltonians based Control

144 6.6. Sistemas de orden mayor

Tomando la derivada temporal de la variable de error generica zi:

zi = h′i(xi)zi+1 − ∂Vi−1

∂xi−1

− kizi, i > 2

y dado que∂Vi

∂xi

=∂Vi

∂zi

∂zi

∂xi

= zih′i(xi), i = 3 . . . n

se llega a la expresion

zi = h′i(xi)zi+1 − h′

i−1(xi−1)zi−1 − kizi, i3 . . . n

de la que se desprende el siguiente corolario

Corolario 6.6.2. El sistema de orden n con la estructura en cascada (6.6.1) realimentadocon la ley u = un obtenida recursivamente segun (6.6.2) y el cambio de variables

z1= x1

z2= x2

z3= h3(x3) − h3(u2)

...

zn= hn(xn) − hn(un−1)

posee la estructura PCH con disipacion

z = (J(z) − R(z))∇zVn

con funcion de energıa Vn, siendo la matriz de interconexion

J(z) =

0 1P

0 0 0 · · · 0 0

− 1P

0 1 0 0 · · · 0 0

0 −1 0 h′3(x3) 0 · · · 0 0

0 0 −h′3(x3) 0 h′

4(x4) · · · 0 0

0 0 0 −h′4(x4) 0 · · · 0 0

......

......

.... . .

... h′n−1(xn−1)

0 0 0 0 0 · · · −h′n−1(xn−1) 0

(6.6.3)que cumple J(z) = −J(zT ) y la de disipacion

R(z) =

0 0 0 · · · 0

0 k2 0 · · · 0

0 0 k3 · · · 0...

. . ....

0 0 0 · · · kn

≥ 0 (6.6.4)

Page 159: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 145

6.6.1 Caso mas general

Un caso mas general al que podemos aplicar este procedimiento de forma sistematica esel de la estructura triangular

x1 = x2

x2 = f2(η2) + g2(η2)h3(x3)

x3 = f3(η3) + g3(η3)h4(x4)

x4 = f4(η4) + g4(η4)h5(x5) (6.6.5)...

xn−1 = fn−1(ηn−1) + gn−1(ηn−1)hn(xn)

xn = u,

donde fi(·), gi(·) : IRi → IR son funciones no lineales de sus argumentos, con gi = 0 yh′

i(·) = 0 en todo el dominio de interes. Ademas se han definido los vectores de dimensionk

ηk = [x1, x2 . . . xk]T , k = 1 . . . n − 1.

Proposicion 6.6.3. Si el subsistema de (6.6.5) de orden k formado por las k−1 primerasecuaciones mas xk = u, es decir

x1 = x2

x2 = f2(η2) + g2(η2)h3(x3)...

xk−1 = fk−1(ηk−1) + gk−1(ηk−1)hk(xk)

xn = u,

se estabiliza con la ley u = uk(ηk) y funcion de Lyapunov Vk, y definimos

uk= h−1

k+1

(−fk(ηk) + uk

gk(ηk)

)zk+1

= hk+1(xk+1) − hk+1(uk)

Vk+1= Vk +

1

2z2

k+1

entonces la ley de control

u = uk+1 =1

h′k+1(xk+1)

[h′

k+1(uk)uk − ∂Vk

∂xk

gk(ηk) − kk+1zk+1

]estabiliza el sistema de orden k + 1

x1 = x2

x2 = f2(η2) + g2(η2)h3(x3)...

xk = fk(ηk) + gk(ηk)hk+1(xk+1)

xk+1 = u,

con funcion de Lyapunov Vk+1.

Page 160: Hamiltonians based Control

146 6.7. Revision del metodo empleando linealizacion por realimentacion

Hemos construido un metodo recursivo directo para el calculo de la ley de control. Sinembargo por la inclusion del termino gk ha resulta inviable la obtencion de una formulacionen forma PCH de las ecuaciones de estado.

6.7 Revision del metodo empleando linealizacion por realimentacion

Alternativamente al empleo de la extension de backstepping para sistemas no afines, ilus-traremos un metodo de estabilizacion de oscilaciones que explota un cambio de variableprevio para obtener un sistema lineal en cascada sobre el que aplicar la version clasica debackstepping. El controlador obtenido difiere ligeramente de los proporcionados por losmetodos anteriores al ser las variables de la funcion de Lyapunov diferentes. Sin embargoa efectos practicos los resultados son muy similares, las condiciones de realizabilidad sonpracticamente las mismas y la estructura hamiltoniana generalizada se recupera con lamisma facilidad. Inicialmente se partira de una estructura semejante al sistema de labola en la viga, pero generalizado a orden mayor, para finalmente enunciar un resulta-do basandose en la linealizacion por realimentacion que permite extender el metodo asistemas de estructura no triangular.

Considerese un sistema generico de la forma

x1

x2

x3

...

xn

=

x2

h(x3)

x4

...

0

+

0

0

0...

1

u. (6.7.1)

Se define el cambio

ξ3 = h(x3)

ξ4 = h′(x3)x4 = ξ3

ξ5 = h′′(x3)x24 + h′(x3)x5 = ξ4

...

ξn =dn−3

dtn−3ξ3

Pero esta ultima derivada se puede descomponer en dos terminos,

dn

dtn(h(x3)) = h′(x3)x

(n)3 + ψ(h′′(x3), h

(3)(x3), ...hn(x3), x

′3, x

′′3...x

(n−1)3 )

= h′(x3)x(n)3 + ψ(x3, x4, x5...xn+2) = ψ(x) + h′(x3)u

Este sistema posee un grado relativo bien definido si h(x3)′ = 0. donde se deduce que la

condicion h(x3)′ = 0 es suficiente para que la realimentacion

u =ψ + v

h′(x3)

Page 161: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 147

unida al cambio de variable x → ξ linealice por realimentacıon el sistema (3), dando lugara

x1 = x2

x2 = ξ3

ξ3 = ξ4

ξ4 = ξ5

...

ξ4 = v

(6.7.2)

Comentario 6.7.1. Notese que el cambio de coordenadas x → ξ es invertible si y solo sih(·) es invertible (para lo que es necesario que h′(x3) = 0), dado que

x3 = h−1(ξ3)

x4 =ξ4

h′(x3)...

xi =ξi − fi(x3, ..., xi−1)

h′(x3)

El nuevo sistema linealizado admite la estabilizacion de orbitas periodicas mediante laimplementacion recursiva del backstepping y la obtencion de las sucesivas leyes de controlen cascada, que ahora expresaremos del siguiente modo

u1 = u0 − ∂V0

∂x2

− k1(ξ3 + u0)

u2 = u1 − ∂V1

∂x3

− k2(ξ4 − u1)

...

ui = ui−1 − ∂Vi−1

∂ξi+1

− k2(ξ4 − u1) (6.7.3)

Las funciones de Lyapunov de cada paso seran

V0 =1

4P 2

V1 =1

4P 2 +

1

2(ξ3 − u0)

2

V2 =1

4P 2 +

1

2(ξ3 − u0)

2 +1

2(ξ4 − u1)

2 ,

...

y ası sucesivamente. Definiendo un nuevo cambio de variable

z3 = ξ3 − u0

z4 = ξ4 − u1

...

Page 162: Hamiltonians based Control

148 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizacion por realimentacion

Se recupera la estructura PCH dada por

x1

x2

z1

z2

=

0 1P

0 0

− 1P

0 1 0

0 −1 0 1

0 0 −1 0

∇zV2 −

0 0 0 0

0 k0 0 0

0 0 k1 0

0 0 0 k2

∇zV2. (6.7.4)

Cabe destacar que al ser la estructura simplectica invariante con respecto al sistema de co-ordenadas (vease la seccion 2.3.1), se deduce que la estructura hamiltoniana generalizadano es una caracterıstica particular que solo se manifieste en estas coordenadas. De hecho,deshaciendo el cambio de variable volverıamos a una estructura semejante con matricesde interconexion y disipacion expresadas en funcion de x.

Si observamos que el sistema (6.7.2) esta expresado en la forma canonica de Brunovski(2.7.2), se deduce que el desarrollo previo es aplicable a cualquier sistema en esta forma.Sin embargo el teorema de linealizacion por realimentacion (Marino & Tomei 1995) afirmaque un sistema de entrada unica del tipo

x = f(x) + g(x)u, x ∈ IRn, u ∈ IR

es transformable mediante linealizacion por realimentacion y cambio de variables a laforma canonica de Brunovski en una region U0 proxima al origen si y solo si, en dicharegion, las distribuciones

Gi = spang, . . . , adifg, 0 ≤ i ≤ n − 1

Son involutivas y de rango constante i + 1.

Esto implica que en los sistemas que cumplen las condiciones del teorema de lineal-izacion por realimentacion es aplicable el metodo presentado de estabilizacion de oscila-ciones basado en backstepping. Una consecuencia importante es que se abre una vıa parasalvar la exigencia de la estructura en cascada.

6.8 Realizacion de una familia de sistemas oscilantes a partir de lalinealizacion por realimentacion

Segun se comenta en el apartado anterior, en un sistema linealizado por realimentacion,el procedimiento recursivo expresado en la ecuacion (6.7.3) resuelve el problema de esta-bilizacion de orbitas periodicas en sistemas linealizables por realimentacion.

La ley recursiva es susceptible de obtenerse como una funcion explıcita del estado.El deshacernos de la recursividad del metodo pretende generar una familia de sistemasde cualquier orden con una dinamica explıcita que simplifica el analisis posterior. Losresultados que se expondran se han publicado en (Aracil, Gomez-Estern & Gordillo 2002).El punto de partida del presente estudio es un sistema de orden n en la forma canonicade Brunovski,

x1 = x2

x2 = x3

...

xn = um (m= n − 2)

Page 163: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 149

que supuestamente resulta de la linealizacion por realimentacion del sistema en lazo abier-to. El objetivo es encontrar una ley de realimentacion del estado para cualquier valor den, evitando la forma recursiva (6.7.3). Recordemos que el procedimiento backsteppingestandar para sistemas en la forma canonica de Brunovski, produce la siguiente ley

• Sistema de segundo orden:u0 = −x1 − k0Px2

• Sistemas de orden n mayor que 2. Se aplica la siguiente formula recursiva

ui = ui−1 − ∂Vi−1

∂xi+1g(xi+1) − kizi i = 1 . . . m

donde se han empleado las definiciones

xi = [x1, x2, ..., xi]T i = 1 . . . n

V0 =P 2

4

Vi =P 2

4+

z21

2+

z22

2+ ... +

z2i

2i = 1 . . . m

zi = xi+2 − ui−1 i = 1 . . . m

Ademas, el vector de control gi(xi) tiene i filas y toma la forma

g(xi) =

0

0...

1

de donde se obtiene que

∂Vi−1

∂xi+1g(xi+1) =

∂Vi−1

∂xi+1

= zi−1∂zi−1

∂xi+1

= xi+1 − ui−2 i = 2 . . . m

∂V0

∂x2g(x2) = Px2

Por tanto estamos en posicion de deshacernos de derivada de la funcion de Lyapunov enla formulacion recursiva

u0 = −x1 − k0Px2

u1 = u0 − x2P − k1(x3 − u0)

ui = ui−1 + ui−2 + kiui−1︸ ︷︷ ︸parterecursiva

−xi+1 − kixi+2︸ ︷︷ ︸partenorecursiva

i = 2 . . . m

En esta expresion se han diferenciado dos partes: la recursiva y la no recursiva a efectosde los calculos posteriores. La parte no recursiva de ui se denominara fi en adelante, ysu forma general viene dada por

f0 = 0

f1 = −Px2 − k1x3

fi = xi+1 − kixi+2 i = 2 . . . m

Page 164: Hamiltonians based Control

150 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizacion por realimentacion

Si definimos el operador lineal

γi= ki +

d

dtse obtiene la siguiente sucesion

u0 = −x1 − k0Px2

u1 = γ1u0 − x2P − k1x3

ui = γiui−1 + ui−2 + fi i = 2 . . . m

que nos permite usar la notacion matricial

ui ≡

ui

ui−1

...

u0

=

γi 1 0 · · · 0

0 γi−1 1 · · · 0

0 0 · · · . . ....

0 0 · · · γ2 1

0 0 · · · 0 γ1

0 0 · · · 0 1

ui−1

ui−2

...

u0

+ f i = Γiu

i−1 + f i i = 1 . . . m

donde se han definido los siguientes vectores y matrices

ui = [ui, ui−1, ..., u0]

T i = 1, 2 . . . m

f i = [fi, fi−1, ..., f0]

T i = 1, 2 . . . m

Γi=

γi 1 0 · · · 0

0 γi−1 1 · · · 0

0 0 · · · . . ....

0 0 · · · γ2 1

0 0 · · · 0 γ1

0 0 · · · 0 1

i = 1, 2 . . . m

Para la multiplicacion de matrices conviene tener en cuenta el siguiente comentario.

Comentario 6.8.1. Notese que la matriz Γi posee i + 1 filas e i columnas, por los cual elproducto ΓiΓi−1 es el producto de una matriz de i columnas por otra de i filas. Conse-cuentemente, el producto esta bien definido.

La descomposicion sucesiva del vector ui en terminos de la matriz Γi, la funcion fi yel vector ui−1 da lugar a

ui = eT1 ui

= eT1 (Γiu

i−1 + f i)

= eT1 (Γi(Γi−1u

i−2 + f i−1) + f i)...

donde se emplea el vector e1 = [1 0 . . . 0]T con la dimension apropiada. Como resultadofundamental, hemos obtenido la forma general del termino n-esimo:

un = eT1

(1∏

i=m

Γi

)u0 + eT

1

m−1∑j=1

(j+1∏k=m

Γk

)f j (6.8.1)

Page 165: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 151

donde el sımbolo del producto debe ser entendido en orden decreciente de los ındices deizquierda a derecha4, es decir

j∏i=k

Γi = ΓkΓk−1 . . . Γj k > j (6.8.2)

Proposicion 6.8.1. En la familia de sistemas de orden n

x1 = x2

x2 = x3

...

xn = eT1

(1∏

i=m

Γi

)u0 + eT

1

m−1∑j=1

(j+1∏k=m

Γk

)f j (6.8.3)

las trayectorias convergen asintoticamente a la orbita oscilatoria donde P = 0 y zi = 0 ∀icon funcion de Lyapunov

V =P 2

4+

z21

2+

z22

2+ ... +

z2m

2

Demostracion. Haremos uso del principio de induccion matematica. Para n = 2, la leyde control u0 = −x1 −k0Px2 estabiliza el sistema de segundo orden en P = 0 con funcionde Lyapunov V0 = P 2/4. Si n > 2, supondremos que el sistema de orden n con estructura(6.8.3) es GAS con respecto a la orbita P = 0 y zi = 0 ∀i con funcion de Lyapunov

Vn−2 =P 2

4+

z21

2+

z22

2+ ...

z2n−2

2

y probaremos que el sistema de orden n + 1 con estructure (6.8.3) es GAS con respectoP = 0, zi = 0 ∀i y funcion de Lyapunov

Vn−1 =P 2

4+

z21

2+

z22

2+ ...

z2n−1

2= Vn−2 +

z2n−1

2

Efectivamente, si en el sistema

Σn : xn =

0 1 0 · · · 0

0 0 1 · · · 0

0 0 · · · . . ....

0 0 · · · 0 1

0 0 · · · 0 0

xn + g(xn)un−2

se cumple que

Vm =

(∂Vm

∂xn

)T

xn ≤ 0

4The only possible way according to matrix dimensions.

Page 166: Hamiltonians based Control

152 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizacion por realimentacion

entonces, en el sistema Σn+1 tenemos

Vm+1 =

(∂Vm+1

∂xn+1

)T

xn+1 =

(∂Vm

∂xn+1

)T

xn+1 +1

2

(∂z2

m+1

∂xn+1

)T

xn+1

=

(∂Vm

∂xn

)T

xn +1

2

(∂z2

m+1

∂xn+1

)T

xn+1 ≤ zm+1

(∂zm+1

∂xn+1

)T

xn+1

= zm+1

(xn+1 −

(∂un−2

∂xn+1

)T

xn+1

)= zm+1(xn+1 − un−2)

= zm+1(un−1 − un−2) = zm+1(−(xn − un−3) − kn−1(xn+1 − un−2))

= −kn−1z2m+1 < 0

La estabilidad asintotica se demuestra analizando los conjuntos invariantes donde Vi = 0.A partir de los calculos previos es facil comprobar que that

Vi = Vi−1 − kiz2i i = 1 . . . m

V0 = −k0Px22

lo cual produce

Vi = −k0Px22 − k1z

21 − k2z

22 − kiz

2i i = 1 . . . m

Entonces los unicos conjuntos invariantes donde Vi = 0 son x|P (x) = 0, zi = 0 ∀i yx(t) ≡ 0 ∀t. Este ultima es un punto de equilibrio, y concluimos del principio de LaSalleprincipio que el sistema Σn es GAS con respecto a la orbita x|P (x) = 0, zi = 0 ∀i confuncion de Lyapunov Vn−1 para todo n, excepto la condicion inicial (xi = 0,∀i).

Page 167: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 153

Ejemplos

Sistema de dimension 3

A fin de ilustrar el empleo de la ecuacion (6.8.1), se obtendra a continuacion la ley decontrol para n = 3. En este caso m = 1, la ley de control es u1 y las unicas matrices yvectores involucrados son

Γ1 =

γ1

1

f 1 =

[−Px2 − k1x3

0

]f 0 = 0.

tras simples calculos se llega a

u1 = [1 0](Γ1u0 + f 1)

= (−x1 − k0 Px2)k1 − Px2 − k1 x3 − x2

− k0 (2 x1 x2 + 2 x2 x3)x2 − k0 Px3

Es facil comprobar que con esta ley de control el sistema en bucle cerrado puede ser escritoen forma hamiltoniana:

x1

x2

x3

=

0 P−1 βP

−P−1 0 −α−PP

− βP

α−PP

0

∇V1 +

0 0 0

0 −k0 −β k0

0 −β k0 −β2k0 − k1

∇V1

α= −1 − 2k0x1x2

β= −2k0x

22 − k0P

donde la parte conservativa (matriz antisimetrica a la izquierda) y la disipativa ( ma-triz semidefinida negativa a la derecha) han sido separadas para visualizar la estructurahamiltoniana. Notese tambien que el hamiltoniano en este caso es la funcion de Lyapunovque se obtendrıa con el procedimiento de backstepping, es decir

V1 =P 2

4+

(x3 + x1 + x0x2P )2

2

Sistema de dimension 5

A medida que aumenta el orden del sistema el calculo gana en complejidad, aunqueconceptualmente no presenta dificultad alguna. A partir de orden 4 es preferible recurrira una herramienta software de calculo simbolico. Calcularemos la ley de control para unsistema de orden n = 5 y por tanto m = 2 en forma canonica de Brunovski, . Para ellose emplearan las matrices

Γ3 =

k3 + ddt

1 0

0 k2 + ddt

1

0 0 k1 + ddt

0 0 1

Γ2 =

k2 + ddt

1

0 k1 + ddt

0 1

Γ1 =

k1 + d

dt

1

Page 168: Hamiltonians based Control

154 6.8. Realizacion de una familia de sistemas oscilantes a partir de la linealizacion por realimentacion

y los vectores

f 3 =

x4 − k3x5

x3 − k2x4

−Px2 − k1x3

0

, f 2 =

x3 − k2x4

−Px2 − k1x3

0

, f 1 =

[−Px2 − k1x3

0

], f 0 = 0.

Mediante calculo simbolico, empleando las rutinas presentadas en el apendice B, se obtienela formula (6.8.1) para n = 5:

u3 = [1 0 0 0 ](Γ3Γ2Γ1u0 + Γ3Γ2f

1 + Γ3f2 + f 3

)= −k0 x5 P − 3 k0 x4 (2 x1 x2 + 2 x2 x3) − 3 k0 x3

(2 x2

2 + 2 x1 x3 + 2 x32 + 2 x2 x4

)− k0 x2 (6 x2 x3 + 2 x1 x4 + 6 x3 x4 + 2 x2 x5) − k0 x4 P (k3 + k2 + k1)

− 2 k0 x3 (2 x1 x2 + 2 x2 x3) (k3 + k2 + k1)

− k0 x2

(2 x2

2 + 2 x1 x3 + 2 x32 + 2 x2 x4

)(k3 + k2 + k1)

− (2 x2

2 + 2 x1 x3 + 2 x32 + 2 x2 x4

)x2 − 2 (2 x1 x2 + 2 x2 x3) x3 − Px4

− k1 x5 + x4 − k2 x5 − k0 x3 P (k3 k2 + (k3 + k2) k1 + 2)

− k0 x2 (2 x1 x2 + 2 x2 x3) (k3 k2 + (k3 + k2) k1 + 2)

+ (k3 + k2) (− (2 x1 x2 + 2 x2 x3) x2 − Px3 − k1 x4) − k0 x2 P (k3 k2 k1 + k1 + k3)

+ k3 (x3 − k2 x4)

+ k3 k2 (−Px2 − k1 x3) + x4 − k3x5 − Px2 − k1 x3

Si bien es cierto que esta ley es bastante compleja, cabe resaltar que el procedimiento decalculo es completamente sistematico, que su validez es totalmente general para sistemaslinealizables por realimentacion de quinto orden, y que en virtud de la proposicion 6.8.1estabiliza asintoticamente al sistema en el conjunto deseado.

Page 169: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 155

6.9 Aplicacion a sistemas subactuados

Se ha presentado en las secciones anteriores anterior un metodo para la generacion deoscilaciones estables por realimentacion en una clase de sistemas de control no lineales.El metodo propuesto en el para la estabilizacion de oscilaciones funciona debidamentepara sistemas completamente actuados, en cuyo caso la solucion es trivial, y para unaclase de subactuados que es la que se tratara en los ejemplos a continuacion. A fin deilustrar el metodo se han seleccionado como ejemplos dos sistemas mecanicos subactuadosbien conocidos en la literatura y en el desarrollo de esta tesis: el sistema de levitacionmagnetica y la bola en la viga.

6.9.1 Sistema de levitacion magnetica

Para ilustrar la aplicacion del metodo a un sistema de tercer orden se ha escogido elsistema de levitacion magnetica. Este sistema aparece representado esquematicamente enla figura 6.4, y consiste en una esfera metalica homogenea inmersa en un campo magneticovertical creado por un electroiman sencillo. La posicion vertical de la bola es la variablex1, estando el eje x1 orientado hacia arriba. El flujo magnetico en la bobina es la variablex3.

u

g

x1

m

i

x3

Figura 6.4: Sistema de levitacion magnetica.

Las ecuaciones en bucle abierto del sistema de levitacion magnetica vienen dadas por(Ortega et al. 1998)

x1 = x2

x2 =1

2kx2

3 − mg (6.9.1)

x3 = −R

k(1 − x1)x3 + u

donde x2 = mx1, siendo m la masa de la esfera. Aplicando un primer lazo de reali-mentacion interna

−R

k(1 − x1)x3 + u = v (6.9.2)

Page 170: Hamiltonians based Control

156 6.9. Aplicacion a sistemas subactuados

al sistema (6.9.1) se obtiene el siguiente sistema en cascada

x1 = x2

x2 =1

2kx2

3 − mg (6.9.3)

x3 = v.

El sistema (6.9.3) pertenece a la clase de sistemas (6.5.1) y consecuentemente es apropi-ada para el backstepping. En este caso, h(x3) = 1

2kx2

3 − mg y u0(x1) = h−1(−ω2cx1) =√

2k(mg − ω2cx1) y, por consiguiente, la ecuacion (6.5.3) conduce a

u = − −ω2ckx2√

2k(mg − ω2cx1)

− kx2P

x3

− k1k

x3

(1

2kx2

3 − mg + ω2cx1

)(6.9.4)

que es la ley de realimentacion deseada. Esta ley a sido comprobada por simulaciondado el comportamiento deseado tanto para µ > 0 (oscilaciones) y para µ < 0 (equilibrioestable). Los resultados se ilustran en la figura 6.5. Se muestran en ella tres simulaciones,las dos primeras de las cuales tienen constantes k = 1, k1 = 0.5, ωc = 0.1 y µ = 0.1, y enla tercera µ se ha hecho igual a −0.1 para lograr un comportamiento de estabilizacion.

Cada grafica contenida en la fila superior de la figura representa las variables de estadooscilantes, x1 y x2 con respecto al tiempo en tres escenarios de simulacion diferentes. Bajocada uno de estos escenarios, se muestra la funcion de Lyapunov obtenida en cada pasodel procedimiento de backstepping, para las mismas simulaciones.

El metodo de diseno propuesto admite una interesante interpretacion fısica en el casodel levitador magnetico. Si nuestro objetivo es hacer oscilar una bola metalica inmersaen un campo magnetico, el flujo magnetico seguira una cierta forma de onda, pero esto eslogrado a su vez excitando un circuito de induccion con una ley de control aplicada comovoltaje de entrada. Esto sugiere una estrategia de diseno de un controlador en cascada,como es el caso del metodo backstepping.

6.9.2 Implementacion en un sistema de laboratorio

Los resultados anteriores pueden ser trasladados a un sistema real de laboratorio con pocoesfuerzo adicional. El equipamiento usado se muestra en la figura (6.9.2). El sistema delevitacion esta conectado a un ordenador mediante una tarjeta conversora con canalesanalogico/digital y digital/analogico. El ordenador ejecuta una rutina de tiempo real quese comunica con MATLAB mediante una librerıa de enlace dinamico (DLL). El algoritmode control se ejecuta periodicamente con una frecuencia de muestreo de 500Hz. DesdeSIMULINK se registra la informacion generada por la rutina a una velocidad de diez vecesinferior para evitar sobrecargar el algoritmo de control.

6.9.3 Modelo del sistema de laboratorio

Aunque el sistema real esta compuesto de los mismos elementos descritos en la seccion6.9.1, el modelo difiere de manera significante del allı descrito. Esto es debido a la existen-cia a un lazo interior que compensa la dinamica de la que relaciona la tension de entrada

Page 171: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 157

0 20 40−4

−2

0

2

4

x1(0)=0.10, x

2(0)=0.00, mu=0.1

x 1(con

t.), x

2(disc

ont.)

tiempo(s)

0 20 40−10

0

10

20

30

40

50

60

Func

ión d

e Ly

apun

ov

tiempo(s)

0 20 40−4

−2

0

2

4

x1(0)=1.00, x

2(0)=−3.00, mu=0.1

x 1(con

t.), x

2(disc

ont.)

tiempo(s)

0 20 40

0

20

40

60

80

Func

ión d

e Ly

apun

ov

tiempo(s)

0 20 40 60−4

−2

0

2

4

x1(0)=1.00, x

2(0)=−3.00, mu=−0.1

x 1(con

t.), x

2(disc

ont.)

tiempo(s)

0 20 40 60

0

20

40

60

80

Func

ión d

e Ly

apun

ov

tiempo(s)

Figura 6.5: Resultados de simulacion en el levitador magnetico.

Figura 6.6: Sistema de levitacion magnetica de laboratorio.

Page 172: Hamiltonians based Control

158 6.9. Aplicacion a sistemas subactuados

con la corriente de la bobina y por tanto con el campo magnetico. A efectos practicos lacorriente viene dado por

I = 0.15(u + u0)

donde u0 es una constante. El hecho de que esta relacion sea puramente algebraicaconvierte a la ecuacion (6.9.1) en un modelo de segundo orden. Esto hace innecesaria laaplicacion de la extension del metodo backstepping como se hizo en la seccion anterior.La distancia vertical hacia abajo entre el electroiman y la bola, x1, se mide mediante unemisor y receptor de infrarrojos, cada uno a un lado de la bola. La dinamica en bucleabierto esta descrita por las ecuaciones en variables de estado de son:

x1 = x2 (6.9.5)

x2 = g − k

(I

X

)2

= g − k

(u + u0

x1 + x0

)2

(6.9.6)

donde k, u0 y x0 son constantes del modelo que deben ser identificadas, k = k/0.15.

6.9.4 Identificacion de parametros

El controlador propuesto en (6.3.3), como es habitual en control basado en pasividad, sebasa en el ajuste de las ecuaciones de bucle abierto y cerrado, mediante la cancelaciondirecta de terminos inestables. Esto significa que el rendimiento depende en gran medidade un conocimiento preciso del modelo. Los parametros a identificar son k,u0 y x0. Elsistema (6.9.5)–(6.9.6) es, si se permite la incorreccion, altamente no lineal, e inestable.Por tanto la unica manera de identificarlo experimentalmente es mediante la identificacionen bucle cerrado. A este fin se ha empleado una red lineal de avance–retraso analogicacapaz de estabilizar la bola con una pequena region de atraccion. Las senales de entrada(u) y salida (y = x1) son registradas desde el PC con una tarjeta A/D a una frecuenciade 500 Hz.

En nuestro procedimiento de identificacion la referencia del control se incrementa deforma escalonada con un periodo lo suficientemente largo para lograr la estabilizacion.Un posicion de la bola estable corresponde a una corriente (y tension de entrada) con-stantes. En este caso el campo magnetico compensa con exactitud la fuerza constante dela gravedad. Con este experimento se obtienen una serie de puntos de equilibrio estabi-lizados que forman pares entrada-salida (u∗, x∗

1) (vease la figura 6.9.4).

Estos puntos deben ajustarse a la caracterıstica de regimen permanente dada por laecuacion de equilibrio

0 = g − k

(u∗ + u0

x∗1 + x0

)2

la cual a traves del apropiado convenio de signos representa una relacion lineal estaticau∗ → x∗

1.

x∗1 = −x0 +

√k

g(u∗ + u0)

Incluso si la informacion obtenida del regimen permanente es lo suficientemente precisapara continuar, de la ecuacion de la recta solo podemos extraer dos parametros, ya quela ecuacion general es:

x∗1 = b1u

∗ + b0

Page 173: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 159

0 10 20 30−2

−1.5

−1

−0.5

0

0.5

1Respuesta a la secuencia de escalones

tiempo (s)

entr

ada

(V)

y po

sici

ón (

mm

)

−0.5 0 0.5 1−2.5

−2

−1.5

−1

−0.5

0

0.5Grafico x−y de regimen permanente

Pos

ició

n en

reg

imen

per

man

ente

Tensión de entrada en régimen permanente

Figura 6.7: Identificacion de la recta de regimen permanente.

donde b1 =√

kg

es la pendiente identificada y b0 = −x0 + b1u0 es la interseccion con el

eje u∗ de la recta que se ha identificado. De b1 derivamos el valor k = 11.86. Por tantohemos de obtener una tercera ecuacion para identificar los tres parametros (u0, x0, k) eidentificar completamente el modelo.

La informacion adicional necesaria no puede obtenerse del comportamiento en regimenpermanente. Para caracterizar la respuesta transitoria con la mayor cantidad de informa-cion posible se ha hecho variar la referencia siguiendo una secuencia aleatoria de escalones,dentro del rango de validez del controlador no lineal. Los escalones deben sucederse a unafrecuencia suficientemente alta para que la bola no alcance a estabilizarse. De nuevo semuestrean la entrada y la salida a una frecuencia de 500Hz y se registran en MATLAB.

Para emplear la informacion recabada las ecuaciones del modelo pueden reescribirsedel siguiente modo √

x − g =√

ku + u0

x + x0

,

las cuales pueden ser reordenadas para dar lugar a la ecuacion vectorial

√x − g

kx − u =

[−√

x − g

k1

][x0

u0

].

donde las incognitas x0 y u0 aparecen de linealmente. De este modo el problema seha transformado en la identificacion no lineal de un sistema linealmente parametrizado,para el cual la aplicacion directa de la formulacion de mınimos cuadrados proporciona losvalores x0 = 6.73 V y u0 = 4.9 V. La principal dificultad detectada en este enfoque es laobtencion de un vector de aceleracion limpio a partir de las muestras de la posicion, parael cual las senales, han sido prefiltradas con un filtro digital de Butterworth con frecuenciade corte digital wn = 0.8 rad/s.

Page 174: Hamiltonians based Control

160 6.9. Aplicacion a sistemas subactuados

5 5.5 6 6.5 7 7.5 8 8.5 9 9.5 10−2.5

−2

−1.5

−1

−0.5

0

0.5

1P

osic

ion

(mm

)

Tiempo (s)20 20.5 21 21.5 22 22.5 23 23.5 24 24.5 25

−2.5

−2

−1.5

−1

−0.5

0

0.5

1

Pos

icio

n (m

m)

Tiempo (s)46 46.5 47 47.5 48 48.5 49 49.5 50

−2.5

−2

−1.5

−1

−0.5

0

0.5

1

Pos

icio

n (m

m)

Tiempo (s)

Figura 6.8: Respuesta transitoria al variar µ entre los valores 0, 10, 20, 10, y 0.

6.9.5 Diseno del controlador

Si se cuenta con un conocimiento preciso de los parametros del sistema, la ecuacion (6.9.7)se linealiza por realimentacion aplicando la ley

u = −u0 + v1(x1 + x0)

v1=

√g − v2

k.

Y en consecuencia el sistema se transforma en

x1 = x2

x2 = v2. (6.9.7)

Si ahora escogemos v2 = −ωcx21 − kaP (x)x2 tal y como se explico en la seccion 6.3

tendremos la siguiente ley de control

u =

√g + ωcx2

1 + kaP (x)x2

k(x1 + x0) − u0. (6.9.8)

Esta ley se aplica a traves del convertidor sample and hold digital–analogico. Para la fre-cuencia de muestreo especificada, 500 Hz, no ha sido considerado necesario hacer ningunatransformacion para operar en tiempo discreto, mas alla del calculo de la velocidad de labola, x2, por medio de la aproximacion de Euler hacia atras de la derivada.

6.9.6 Resultados experimentales

Analizaremos los resultados obtenidos al aplicar la ley de control (6.9.8) al sistema de lev-itacion magnetica real. En el primer experimento, la constante ka se fija a 0.0005, el valorde ωc, la frecuencia deseada de la oscilacion se ha fijado a 20 rad/s, mientras que la con-stante µ, responsable de la amplitud de las oscilaciones toma los valores 0.0,10.0,20.0,10.0y de vuelta a 0.0. Los resultados aparecen en la figura 6. Allı se puede apreciar en detalleel comportamiento transitorio al variar µ escalonadamente de 0 a 10, despues a 20, a 10y de nuevo a 0.

A la constante ka se le ha dado el valor 0.0005, habiendo observado que es convenientepara un mejor rendimiento reducir su valor a medida que se hace crecer la amplitud delas oscilaciones.

Page 175: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 161

A continuacion se enumeraran las ventajas de el empleo de este controlador frente atecnicas mas sencillas como el control lineal o el de trayectorias

1. El controlador no lineal funciona uniformemente en todo el rango del sensor de posi-cion, sin presentar distorsiones en la forma de la oscilacion al aumentar la amplitud.Esto no sucederıa en un control lineal.

2. En la practica la region de atraccion del controlador presentado coincide con el rangode funcionamiento de dicho sensor.

3. El ancho de banda del controlador es mayor que el de un controlador lineal. Uncontrol por PID o una red de avance, con anchos de banda limitados, podrıa seguirtrayectorias de referencia senoidal hasta una determinada frecuencia maxima. Afrecuencias superiores la amplitud de las oscilaciones decrecerıa. El enfoque aquıpropuesto esta teoricamente ilimitado en la frecuencia de oscilacion, aunque en lapractica encontrara sus lımites en la frecuencia de Nyquist y en la dinamica del lazointerno de corriente que se supuso ideal.

4. El controlador propuesto no emplea senales dependientes del tiempo como trayec-torias de referencia.

5. Como se apunto en la introduccion, la trayectoria objetivo del sistema no poseeinformacion de fase, lo cual es en general ventajoso para la calidad de los transitorios,ya que en nuestro caso el sistema puede entrar en la orbita periodica en cualquierpunto de esta.

6.9.7 Oscilaciones en la bola en la viga

Esta seccion presenta un ejemplo de aplicacion de los resultados previos a un sistemade cuarto orden, para finalmente demostrar la recursividad y sencillez del metodo. Em-plearemos el resultado del corolario 6.5.2. El sistema que se tratara, de nuevo, es la bolaen la viga que fue representado en la figura 4.6. Para escribir el modelo en una for-ma en la que se pueda aplicar facilmente el metodo descrito reescribiremos el modelo deEuler–Lagrange (4.4.1) en variables de estado, segun se aparece en (Hauser et al. 1992).Definiendo el vector de estado como [x1, x2, x3, x4] = [q1, q1, q2, q2] y aplicando la ley delinealizacion parcial τ = (−2q1q1q2 − gq1 cos(q2))/(L

2 + q21) +u para cancelar los terminos

de la cuarta fila, el sistema admite la descripcion alternativa

x1

x2

x3

x4

=

x2

B(x1x24 − Gsenx3)

x4

0

+

0

0

0

1

u. (6.9.9)

La variable x1 denota la posicion de la bola, y x3 el angulo de la barra (q1 y q2 respecti-vamente en la figura 4.6). Con la intencion de escribir el sistema en la forma (6.6.1), seempleara una aproximacion frecuentemente utilizada (Hauser et al. 1992) obtenida al igno-rar el termino de aceleracion centrıfuga x1x

24, suponiendo una velocidad angular pequena

de la bola. Mas aun, el sistema (6.9.9) puede ser normalizado haciendo B = G = 1.

Page 176: Hamiltonians based Control

162 6.9. Aplicacion a sistemas subactuados

Entonces se tiene

x1

x2

x3

x4

=

x2

−senx3

x4

0

+

0

0

0

1

u. (6.9.10)

Este sistema tiene la forma (6.6.1) para m = 2. Consecuentemente, el metodo introducidoen las secciones previas le es de aplicacion. En primer lugar, considerese el sistema desegundo orden formado por las dos primeras ecuaciones de (6.3.1), es decir

[x1

x2

]=

[x2

−senx3

]. (6.9.11)

Este sistema, unido a la ecuacion x3 = x4 posee la misma estructura que las ecuaciones(6.5.1) (tomando x4 como una variable de control virtual) y, por consiguiente, en el primerpaso, la realimentacion (6.5.3) puede aplicarse dando lugar a

x3 = u0(x1, x2) = sen−1(ω2cx1 + k0x2P ). (6.9.12)

Entonces, la aplicacion recursiva del procedimiento de backstepping para sistemas de ordenmayor dada en la ecuacion (6.6.2), proporciona las siguientes leyes de control:

u1 =1

h′(x3)

(h′(u0)u0 − ∂V0

∂x2

− k1(−senx3 + senu0)

)(6.9.13)

u2 = u1 − ∂V1

∂x3

− k2(x4 − u1) (6.9.14)

Las funciones de Lyapunov obtenidas en cada paso son

V0 =1

4P 2

V1 =1

4P 2 +

1

2(−senx3 + senu0)

2 =1

4P 2 +

1

2z21

V2 =1

4P 2 +

1

2(−senx3 + senu0)

2 +1

2(x4 − u1)

2 =1

4P 2 +

1

2z21 +

1

2z22

donde las variables de error zi se definen como

z1= h(x3) − h(u0) = −senx3 + ω2

cx1 + k0x2P (6.9.15)

z2= x4 − u1,

(6.9.16)

Page 177: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 163

Desarrollando (6.9.13)-(6.9.14), se obtiene

u1 =k1 z1 + ωc

2x2 + 2 k0 x22ωc

2x1 − k0 P senx3 − 2 k0 x22senx3 + Px2

cos x3

(6.9.17)

u2 = z1 cos x3 +(−k1 − k0 P − 2 k0 x2

2)x4 − k2 z2

+6 k0 (senx3)

2 x2 − ((P + 2 x22) k0 k1 + 6 k0 x2 ωc

2x1 + ωc2 + 2 x2

2 + P ) senx3

cos x3

+(2 k0 x2

2ωc2 + 2 x2 ωc

2x1 + k1 ωc2 + 2 k1 k0 x2 ωc

2x1) x2

cos x3

+((k1 k0 x2 + x2) x4 P + (ωc

2x2 + 2 k0 x22ωc

2x1 + k1 ωc2x1) x4) senx3

(cos x3)2

− (k0 x4 P +

(k1 + 2 k0 x2

2)x4

)(tan x3)

2 (6.9.18)

donde u = u2 es la ley de control que ha de aplicarse a (6.9.10) y la cuarta ecuacion deestado se convierte en x4 = u2. Con esta ley, las ecuaciones en bucle cerrado toman laforma

x1 = x2 (6.9.19)

x2 = −senx3

x3 = x4

x4 = z1 cos x3 +(−k1 − k0 P − 2 k0 x2

2)x4 − k2 z2

+6 k0 (senx3)

2 x2 − ((P + 2 x22) k0 k1 + 6 k0 x2 ωc

2x1 + ωc2 + 2 x2

2 + P ) senx3

cos x3

+(2 k0 x2

2ωc2 + 2 x2 ωc

2x1 + k1 ωc2 + 2 k1 k0 x2 ωc

2x1) x2

cos x3

+((k1 k0 x2 + x2) x4 P + (ωc

2x2 + 2 k0 x22ωc

2x1 + k1 ωc2x1) x4) senx3

(cos x3)2

− (k0 x4 P +

(k1 + 2 k0 x2

2)x4

)(tan x3)

2

Comentario 6.9.1. Recuerdese que este sistema, a pesar de su complejidad, esta descrito enforma hamiltoniana generalizada disipativa con funcion de Hamilton V2. Para comprobareste hecho basta observar, en virtud del corolario 6.6.2 que el cambio

x1 = x2

x2 = z1 − ω2cx1 − k0x2P

z1 = h′(x3)z2 − x2P − k1z1

z2 = −h′(x3)z1 − k2z2

conduce a la descripcion en variables de estado

z = (J(z) − R(z))∇zV2(z)

z= [x1 x2; z1 z2]

T

donde J(z) y R(z) poseen la forma (6.6.3) y (6.6.4), respectivamente. Para completarla afirmacion basta probar que esta propiedad tambien es cierta cuando el sistema estaexpresado en variables x, segun (6.9.19). Pero este hecho se desprende de la invariabilidadde la estructura hamiltoniana frente al cambio de variables, que se demostro en la seccion2.3.1.

Page 178: Hamiltonians based Control

164 6.9. Aplicacion a sistemas subactuados

6.9.8 Bifurcaciones en el sistema de la bola y la viga

En este apartado detectaremos la aparicion de una bifurcacion de Hopf asociada alparametro µ en el sistema (6.9.19). Aunque la proposicion 6.5.3 se ha demostrado parael caso de dimension tres, este es un sistema de cuarto orden que experimenta una bifur-cacion de Hopf en virtud de la siguiente proposicion.

Proposicion 6.9.1. Considerese el sistema (6.9.19) en bucle cerrado. Este sistema pre-senta una bifurcacion de Hopf para µ = 0.

Demostracion. A fin de verificar que las condiciones para la ocurrencia de una bifurcacion,calcularemos la matriz jacobiana evaluada en el origen del sistema de cuarto orden en buclecerrado .

0 1 0 0

0 0 −1 0

0 0 0 1

ωc2 + ωc

2k1 k2 k1 ωc2 + k2 ωc

2 − k2 µ −1 − ωc2 + µ − k2 k1 −k1 − k2

,

cuyo polinomio caracterıstico es

s4 + (k1 + k2) s3 +(1 + ωc

2 − µ + k2 k1

)s2 +

((k1 + k2) ωc

2 − k2 µ)s + (1 + k2 k1) ωc

2.

La condicion para la existencia de raıces puramente imaginarias (recuerdese las ecuaciones(2.5.1)–(2.5.2)) son

k1 + k2 > 0,

k1 − k1 µ + k2 k12 + k2 + k2

2k1 > 0,

k1k2µ2 − (k1 + k2)

(k1 ωc

2 + k22k1 + k2

)µ = 0. (6.9.20)

Las dos primeras condiciones son satisfechas para

µ <(k1 + k2) (1 + k2 k1)

k1

= µmax,

mientras que la ultima tiene dos raıces reales para µ, a saber

µ1 = 0 µ2 =(k1 + k2)

(k1 ωc

2 + k22k1 + k2

)k2 k1

Observando que µ2 > µmax concluiremos que el unico valor del parametro µ tal queexista un par de raıces puramente imaginarias es µ = 0. Entonces el polinomio puede serfactorizado como (

ωc2 + s2

) (s2 + sk1 + sk2 + 1 + k2 k1

)= 0.

Esta ecuacion tiene dos de sus raıces en s = ±jωc mientras que las otras tienen parte realnegativa siempre que k1 > 0 y k2 > 0.

La transversalidad sera satisfecha si el primer miembro de (6.9.20) cambia de signo alhacerlo µ. Esto es cierto cuando k1 > 0 y k2 > 0.

Page 179: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 165

6.9.9 Efecto de la aceleracion centrıfuga

La ley de realimentacion (6.9.18) logra el comportamiento deseado al aplicarse al sistema(6.9.10), pero el sistema de la bola y la viga se modela con mas precision mediantelas ecuaciones (6.9.9). Sin embargo, si la ley de realimentacion (6.9.18) se aplica almodelo (6.9.9) en lugar del aproximado (6.9.10), el comportamiento deseado (oscilatorioo estabilidad asintotica) sigue obteniendose, al menos de forma local en torno al equilibrio.Esto se debe al hecho de que el termino ignorado x1x

24 no afecta a la matriz de linealizacion

Jacobiana de (6.9.9) y (6.9.10), y por consiguiente la bifurcacion de Hopf se produce enel mismo punto ya se trate del sistema completo o el aproximado.

El termino x1x24 afectara a la forma y tamano de la cuenca de atraccion del ciclo lımite,

pero no la produccion de la bifurcacion misma. Podrıa afectar a la naturaleza (subcrıticao supercrıtica) de la bifurcacion de Hopf. Pero, en este caso, la bifurcacion mantiene sunaturaleza supercrıtica, como se ha comprobado en las simulaciones. La figura 6.9 muestralos resultados de simulacion del sistema de la bola en la viga empleando la ley de control(6.9.18). Las tres graficas superiores corresponden a valores positivos de µ, obteniendoun comportamiento oscilatorio, mientras que las tres ultimas se obtienen con µ < 0 ypor tanto estabilizando el sistema en el origen. El resto de los parametros son B = 1,G = 1, k1 = 0, k2 = 10, ωc = 0.5. Las condiciones iniciales varıan de una simulacion a lasiguiente, dentro de la cuenta de atraccion. Finalmente, la figura 6.10 muestra la cuencade atraccion del ciclo lımite obtenida por simulacion al hacer µ = 0.1. Las zonas oscurasindican condiciones iniciales de velocidad nula para las cuales las trayectorias convergen alconjunto lımite deseado. Esta region es notablemente menor que la obtenida en el sistemade levitacion magnetica. Esto se debe al uso de un modelo simplificado de la bola en laviga en el procedimiento de diseno del controlador.

Ademas de la existencia de una region de atraccion limitada, otra consecuencia deignorar el termino x1x

24 en (6.9.9) es la distorsion de oscilaciones que aparecen al crecer

µ. Esto se ilustra en la figura 6.11, donde el sistema en bucle cerrado se ha simuladocon los valores B = 1, G = 3, k1 = 0, k2 = ωc = 0.1 (se ha incrementado el valor de Gpara subrayar dicho termino de distorsion). La primera grafica ilustra un comportamientocuasi-armonico puro para valores pequenos de µ (en la simulacion µ=0.4), pero al crecerµ (4.0 en la simulacion) la forma de la oscilacion lımite en x2 se aleja progresivamente delperfil senoidal.

Page 180: Hamiltonians based Control

166 6.9. Aplicacion a sistemas subactuados

0 100 200 300−1.5

−1

−0.5

0

0.5

1

x1(0)=0.00, x

3(0)=0.30, µ=0.1

x 1(con

t.), x

2(traz

os)

tiempo(s)0 200 400

−1

0

1

2

3

4

x1(0)=3.90, x

3(0)=0.01, µ=0.1

x 1(con

t.), x

2(traz

os)

tiempo(s)0 100 200 300

−1

−0.5

0

0.5

1

1.5

2

x1(0)=2.00, x

3(0)=0.80, µ=0.1

x 1(con

t.), x

2(traz

os)

tiempo(s)

0 100 200 300−1.5

−1

−0.5

0

0.5

x1(0)=0.00, x

3(0)=0.30, µ=−0.1

x 1(con

t.), x

2(traz

os)

tiempo(s)0 100 200 300

−1

0

1

2

3

4

x1(0)=3.90, x

3(0)=0.01, µ=−0.1

x 1(con

t.), x

2(traz

os)

tiempo(s)0 100 200 300

−0.5

0

0.5

1

1.5

2

x1(0)=2.00, x

3(0)=0.80, µ=−0.1

x 1(con

t.), x

2(traz

os)

tiempo(s)

Figura 6.9: Resultados de simulacion del sistema de la bola en la viga.

−6 −4 −2 0 2 4 6

−1.5

−1

−0.5

0

0.5

1

1.5

x1(0)

x3(0

)

Puntos dentro del dominio de atraccion (area punteada)

Puntos fuera del dominio de atraccion (area en blanco)

Figura 6.10: Estimacion numerica de la cuenca de atraccion.

Page 181: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 167

Figura 6.11: Distorsion para grandes amplitudes.

6.10 Estabilizacion de oscilaciones por Inmersion e Invariancia

En esta seccion,cuyos resultados se han publicado en (Gordillo, Gomez-Estern, Ortega &Aracil 2002), se abordara el problema de la estabilizacion de orbitas periodicas desde unaperspectiva diferente. Se pretende servira para ilustrar una tecnica de reciente desarrolloy extenderla al dominio de las oscilaciones. De nuevo se evitara tratar el problema de lasoscilaciones como un seguimiento de trayectorias sinusoidales la inconveniencia de tratarcon senales dependientes del tiempo. Para ello se hara una inmersion de la dinamicaobjetivo del sistema oscilante definido en (6.2.7) y V0 = P 2/4, en un espacio de ordencuatro que es el espacio de estados del sistema original. En este espacio se definira unavariedad atractiva en la que las trayectorias siguen una oscilacion sinusoidal pura.

La novedad de este enfoque reside en la extension del metodo de Inmersion e In-variancia (vease la proposicion 2.7.1), inicialmente concebido para la estabilizacion deequilibrios, a el caso de estabilizacion de conjuntos lımite de mayor dimension como esel caso de orbitas periodicas. Asimismo supone una alternativa viable para el caso desistemas no lineales de orden mayor que dos que no posean estructura en cascada.

Como se indica en (Gordillo, Gomez-Estern, Ortega & Aracil 2002), aplicaremos laproposicion 2.7.1 del metodo de Inmersion e Invariancia de (Astolfi & Ortega 2001) almodelo simplificado normalizado (6.9.10) del sistema de la bola en la viga (figura 4.6) condinamica objetivo (6.2.3).

El metodo de Inmersion e Invariancia esta disenado con la idea de convertir unadinamica objetivo estable de orden n en una variedad diferenciable inmersa en un espaciode orden m > n, de modo que esta variedad sea invariante y atractiva en el espaciom-dimensional. En nuestro caso la variedad de orden mayor, representada por (2.7.7)en la proposicion (2.7.1), viene dada por el sistema de la bola en la viga. El sistema deorden menor correspondiente a la dinamica objetivo (ecuacion (2.7.8)en la proposicion deInmersion e Invariancia) sera el sistema hamiltoniano oscilatorio de segundo orden (6.2.3).

Page 182: Hamiltonians based Control

168 6.10. Estabilizacion de oscilaciones por Inmersion e Invariancia

El primer paso del metodo es la determinacion del mapeo π(ξ). Para forzar las oscila-ciones en la coordenada de la bola escogeremos π1 = ξ1 y π2 = ξ2. Las funciones π3 y π4

pueden determinarse imponiendo la condicion de invariancia, que resulta

π3(ξ) = sen−1(ξ1 + kaξ2P (ξ)) (6.10.1)

π4(ξ) =∂π3

∂ξ1

ξ2 +∂π3

∂ξ2

(−ξ1 − kaξ2P (ξ)) (6.10.2)

La eleccion obvia para el primer elemento de la variedad implıcita (6.2.7), φ1, es φ1(x) =x3 − sen−1(x1 + kax2P (x1, x2)). Sea φ2

φ2(x) = x4 − ∂π3|x∂x1

x2 − ∂π3|x∂x2

(−senx3)

Notese que la identidad de la variedad implıcita (6.2.7) es cierta, dado que

φ1 = 0, φ2 = 0 ⇒ x4 =∂π3

∂ξ1

ξ2 +∂π3

∂ξ2

(−ξ1 − kaξ2P (ξ))

Con esta eleccion, es obvio que φ1 = φ2. Entonces, definiendo

S(x1, x2, x3)= −∂π3|x

∂x1

x2 +∂π3|x∂x2

senx3

se obtendra el sistema exterior a la variedad (donde z = 0 implica estar en ella) (2.7.11)como sigue

z1 = z2 (6.10.3)

z2 = v +∂S

∂x1

x2 − ∂S

∂x2

senx3 +∂S

∂x3

x4 (6.10.4)

Entonces, una posible ley de control estabilizante es

v = − ∂S

∂x1

x2 +∂S

∂x2

senx3 − ∂S

∂x3

x4 − k1φ1(x) − k2φ2(x)

con k1, k2 > 0.

6.10.1 Resultados de la simulacion

A fin de mostrar el comportamiento de la ley de control obtenida se presenta una sim-ulacion para µ = 0.1, ka = 1, k1 = 1 y k2 = 1. Las condiciones iniciales son x(0) =[0.9, 0.1, 0, 0]. La figura 6.12 muestra las trayectorias de las coordenadas fuera de la var-iedad z1 y z2 tendiendo a cero, mientras que la figura 6.13 muestra que, tras un periodotransitorio, las variables x1 y x2 de hecho exhiben oscilaciones sinusoidales con la ampli-tud deseada

õ. Finalmente, la figura 6.14 muestra el retrato de estados proyectado en

el plano (x1 − x2).

Page 183: Hamiltonians based Control

Capıtulo 6. Estabilizacion de oscilaciones en sistemas no lineales 169

0 5 10 15 20 25 30−1.5

−1

−0.5

0

0.5

1

Tiempo (s)

φ 1 (co

nt.)

φ2 (

disc

ont.)

Figura 6.12: Evolucion de z1 y z2.

0 5 10 15 20 25 30−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Tiempo

x 1 (co

nt.)

x2 (

disc

ont.)

Figura 6.13: Evolucion de x1 y x2.

−0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

x1

x 2

Figura 6.14: Retrato de estados proyectado en (x1 − x2).

Page 184: Hamiltonians based Control

170 6.10. Estabilizacion de oscilaciones por Inmersion e Invariancia

Page 185: Hamiltonians based Control

Capıtulo 7

Conclusiones y desarrollos futuros

Este capıtulo se dedica a la exposicion resumida de las aportaciones de esta tesis comen-zando por el capıtulo 3. Al final del capıtulo se propondran una serie de trabajos dedesarrollos futuros a modo de continuacion de la investigacion desarrollada en esta tesis.

7.1 Conclusiones del capıtulo 3

En el capıtulo 3 se ha presentado el desarrollo teorico y la implementacion practica de unmetodo de control no lineal que tiene su utilidad tanto para linealizar y desacoplar lasarticulaciones de un sistema multivariable, como para estabilizar puntos de equilibrio. Elmetodo se basa en la modificacion de la funcion de energıa del sistema y su formulacionhamiltoniana. La ley de control se obtuvo imponiendo ciertas condiciones a las ecua-ciones de lazo cerrado. El hecho de obtener un sistema en bucle cerrado con estructurahamiltoniana ha sido explotado para resolver el problema de rechazo de perturbacionescon ganancia L2. Posteriormente se ha desarrollado un controlador basado en pasividadpara el seguimiento visual de objetivos moviles.

Se ha resuelto el caso particular de una plataforma de sensores de dos grados delibertad construida en el laboratorio del Depto. de Ingenierıa de sistemas y Automaticade la Universidad de Sevilla, para la que se ha disenado un controlador basado en estastecnicas. Las dificultades detectadas durante la implementacion real del sistema hansido descritas, ası como el metodo empleado para la identificacion de los parametrosdel sistema. Se ha realizado una serie de experimentos de identificacion, de los que seobtuvo un juego de parametros del modelo fiables con los que ajustar el controlador paraestabilidad asintotica global. Finalmente se han presentado los resultados experimentalesen bucle cerrado.

7.2 Conclusiones del capıtulo 4

En el capıtulo 4 se ha caracterizado un clase de sistemas mecanicos subactuados para loscuales la recientemente desarrollada metodologıa IDA-PBC proporciona una estabilizacionsuave. La clase viene dada en terminos de resolubilidad de dos sistemas de ecuacionesdiferenciales parciales (4.2.12), (4.2.13). Aunque es bien sabido que resolver EDPs es

171

Page 186: Hamiltonians based Control

172 7.3. Conclusiones del capıtulo 5

en general difıcil, se han anadido algunos grados de libertad—la matriz de interconexionen bucle cerrado J2—para simplificar la tarea, ademas de dar algunas claves para suresolucion.

Para ilustrar la tecnica, se ha presentado una realimentacion no lineal de la salida IDA-PBC que estabiliza para cualquier condicion inicial (excepto un conjunto de medida cero)la posicion vertical superior de un pendulo invertido recientemente presentado (Sponget al. 2001). En opinion del autor de esta tesis, se trata del primer resultado de swing-up y estabilizacion de un pendulo subactuado sin el empleo de conmutacion ni haciendomedida alguna de la velocidad. Vease tambien (Praly, Ortega & Kaliora 2001) para unasolucion alternativa, con realimentacion del estado completo, usando un variacion delforwarding. Tambien hemos derivado una ley de realimentacion estatica del estado IDA-PBC para el conocido sistema de la bola en la viga, capaz de estabilizar asintoticamenteel equilibrio en cero para un conjunto bien definido de condiciones iniciales, manteniendola bola dentro de la longitud de la viga. De nuevo, en opinion del autor de esta tesis, noexiste en la literatura ningun resultado semejante relativo a la calidad del transitorio deeste sistema.

Hay muchos posibles extensiones para el trabajo de este capıtulo. En primer lugar sepuede tratar de evitar resolver las (infames) ecuaciones diferenciales parciales, planteandoel problema dual, fijando la funcion de energıa Hd a cierta forma deseada, y tratando deresolver la ecuacion algebraica para Jd. Esto es, en esencia, el enfoque adoptado en elreciente artıculo de (Fujimoto & Sugie 2001), vease tambien (Rodrıguez & Ortega 2002).En segundo lugar, ya discutimos en la seccion 4.2.4 que el IDA-PBC permite la consid-eracion de fuerzas giroscopicas en la funcion de energıa. Aunque no es claro a estas alturascomo pueden ser aprovechadas en aplicaciones mecanicas, se sabe que juegan un papelfundamental en aplicaciones electromecanicas, donde el equilibrio deseado no ocurre parauna energıa cinetica nula. Algunos resultados preliminares a lo largo de estas lıneas parasistemas de levitacion magnetica y motores electricos son muy prometedores (Rodrıguez &Ortega 2002). En tercer lugar serıa deseable, por supuesto, tener un mejor entendimientode las EDPs que aparecen en IDA-PBC, por un lado, para obtener un procedimiento dediseno mas sistematico, y por otro, para llevar a termino las limitaciones intrınsecas dela metodologıa (por ejemplo, desarrollando condiciones para la no resolubilidad de lasEDPs.) Un aspecto particularmente importante es que a efectos de estabilidad, no bastacon encontrar cualquier solucion Md y Vd de las PDE’s, sino una que satisfaga cierta clasede “condiciones de contorno”. El estudio de esta restriccion adicional esta esencialmenteabierto.

7.3 Conclusiones del capıtulo 5

En el capıtulo 5 se ha obtenido una descripcion mas sencilla y practica del metodo IDA-PBC, mediante transformaciones algebraicas de las ecuaciones de moldeo de energıa. Estareduccion se aplica a una amplia clase de sistemas subactuados, que comprende algunosde los mas estudiados en la literatura.

Las formulas resultantes tienen una estructura que permite en el caso de dos gradosde libertad, la construccion de una solucion por medio de la integracion de una funcionmonovariable. Para ello se ha propuesto nueva parametrizacion de los de los elementos

Page 187: Hamiltonians based Control

Capıtulo 7. Conclusiones y desarrollos futuros 173

de Md, la matriz de inercia en bucle cerrado1.

La principal dificultad estriba en garantizar que Md sea globalmente definida positiva,y simultanear este resultado con la asignacion del mınimo de energıa potencial. Estoes mas complicado aun en sistemas de mas de dos grados de libertad. Sin embargo,la reduccion propuesta no pierde generalidad con respecto al metodo general IDA-PBCdescrito en el capıtulo anterior y por tanto en muchos casos se dispone de grados delibertad suficientes para resolver el problema.

Con este metodo se han obtenido leyes de control suaves con una amplia cuenca deatraccion para problemas clasicos de control de sistemas subactuados. El rendimientode los controladores no lineales es muy satisfactorio incluso lejos de la region donde elmodelo puede ser linealizado y controlado por tecnicas lineales, como se aprecia en lassimulaciones. La respuesta transitoria y la cuenca de atraccion del control PBC de labola en la viga y el pendulo invertido, ası como las posibilidades de ajuste de constantescon significado fısico ilustra las ventajas del metodo. Sin embargo, cabe recalcar que lasdificultades computacionales aumentan considerablemente cuando se trata de sistemas demas de dos grados de libertad.

7.4 Conclusiones del capıtulo 6

En este capıtulo se ha presentado una tecnica para la obtencion de oscilaciones estables yrobustas en una clase de sistemas no lineales, inclusive algunos sistemas mecanicos subac-tuados. Para lograr esto se ha presentado una ley de realimentacion capaz de conducir aun sistema mecanico de segundo orden hacia un ciclo lımite estable. Esta realimentacionpertenece a la familia de metodos de diseno basados en el moldeo de energıa. El ciclolımite esta asociado a la aparicion de una bifurcacion de Hopf en un sistema hamilto-niano generalizado. A continuacion, mediante backstepping la ley de control se obtienerecursivamente para el sistema completo, sin limitacion en el orden de este. Un resul-tado interesante recae en el hecho de que la bifurcacion de Hopf se mantiene a medidaque aumenta el orden del sistema gracias a la tecnica basada en backstepping. El se-gundo resultado que se desprende de esta tecnica, en cierta medida sorprendente, es queindependientemente del orden del sistema, en bucle cerrado se obtiene una estructurahamiltoniana generalizada con disipacion con respecto a la funcion de Lyapunov constru-ida en la fase de backstepping. Este es un hecho a explorar por las posibilidades que abreen cuanto a robustez y rechazo de perturbaciones L2.

El metodo de diseno ha sido ilustrado mediante su aplicacion a dos sistemas clasicossubactuados: el levitador magnetico y la bola en la viga. La metodologıa se extiendea orden mayor, sin un lımite teorico. Finalmente se ha abordado el problema de la os-cilacion con dinamica objetivo el sistema hamiltoniano generalizado empleando un metodonovedoso, la Inmersion e Invariancia, obteniendo resultados similares. Finalmente se haabordado el problema de la oscilacion con dinamica objetivo el sistema hamiltonianogeneralizado empleando un metodo novedoso, la Inmersion e Invariancia, obteniendo re-sultados similares en el caso de la bola y la viga

1Las incognitas de la fase de moldeo de energıa potencial.

Page 188: Hamiltonians based Control

174 7.5. Desarrollos futuros

7.5 Desarrollos futuros

Los problemas que se abordan en esta tesis abren las puertas a una serie de lıneas deinvestigacion futuras destinadas basicamente a extender el ambito de aplicacion de losrazonamientos teoricos aquı expuestos y a refinar los resultados.

7.5.1 Cinematica de la plataforma de sensores

En primer lugar se tratara el tema del control inercial. En el estudio de la dinamicadel pedestal de sensores se ha empleado un modelo hamiltoniano basado en la hipotesisde un sistema inmerso en un sistema de referencia inercial. Esto implica ignorar lospares centrıfugos y de coriolis que aparecen debido a giros y aceleraciones del sistema dereferencia sobre el que se instala la plataforma, como es el caso de la cubierta de un buque.En aplicaciones de este tipo (navales), las oscilaciones de cubierta debidas al oleaje son depequena velocidad angular, hasta tal punto que los pares centrıfugos y de coriolis puedenser ignorados, o como se hace en el capıtulo (3), subsumidos en un termino acotado deperturbaciones cuyo efecto en el vector de estado sera rechazado mediante un controlbasado en la atenuacion de perturbaciones con ganancia L2. Si estamos interesados enplataformas de sensores sometidas a dinamicas mas rapidas del sistema de referencia quelas soporta, como puede suceder en vehıculos terrestres o aplicaciones aeroespaciales, esteenfoque pierde su validez.

Un estudio mas exhaustivo involucrarıa un conocimiento explıcito de la cinematica ydinamica del sistema completo soporte–plataforma. Es evidente que el sistema que dasoporte a la plataforma esta sometido a movimientos y perturbaciones aleatorias, peroa diferencia de el tratamiento presentado, estas perturbaciones pueden ser medibles. Unsencillo sistema de inclinometros, acelerometros y giroscopos en la superficie del buque,proporcionarıa una medida en tiempo real de la velocidad del origen y los angulos deEuler del sistema de referencia de la plataforma, con respecto a unos ejes fijos en tierra.A partir de estas medidas, definiendo los sistemas de referencia (vease figura 7.1)

• S.R.0 Sistema de referencia inercial fijo en tierra.

• S.R.1 Sistema de solidario al vehıculo o buque, asociado al soporte inmovil de laplataforma de sensores.

Denominaremos R10 a la matriz unitaria de rotacion desde el sistema de referencia 0 al 1,

formada por los senos y cosenos de los angulos de Euler, y P 1 al vector director unitariode la lınea de mira de la plataforma expresado en las coordenadas del sistema (1), se tiene

P 1 = [cos θ cos ϕ senϕ cos θ senϕ]T

siendo ϕ θ y los angulos de acimut y elevacion de la plataforma, respectivamente segun elcriterio empleado en el capıtulo (3). Supongamos que el objetivo de control es mantenerestable la lınea de mira de la plataforma hacia un satelite geostacionario de comunica-ciones. Dado que la distancia desde la superficie terrestre de la orbita fija (35900 km),el apuntamiento (ϕc, θc) se puede expresar como una funcion de la latitud y la longitudterrestre. Este objetivo de control puede ser expresado como mantener constantes las

Page 189: Hamiltonians based Control

Capıtulo 7. Conclusiones y desarrollos futuros 175

x0 y0Sistema de referenciafijo en tierra

Sistema de referenciadel vehículo

x1

z0y1

z1

P

acimutplataforma

elevaciónplataforma

Rotacón: R01Traslación T01

Figura 7.1: Composicion de sistemas coordenados en la plataforma de sensores.

coordenadas del vector P 0 expresadas en el sistema de referencia fijo en tierra (0) inde-pendientemente de las perturbaciones y los movimientos realizados por el vehıculo quesoporta la antena. En este caso se tiene que la salida del sistema es

y = P 0 = R10P

1.

y el equilibrio a estabilizar sera

y∞ = (ϕc, θc)

El problema se enunciarıa del siguiente modo: conocido P 1 disenar un sistema de sensoresde precision para obtener R1

0 y sus derivadas, y una ley de control robusta que estabilicela salida del sistema en y∞.

Tengase en cuenta que en este problema no es necesario conocer las velocidades detraslacion del origen del sistema (1) respecto a tierra.

Un problema anadido es determinar una ley de control que logre este objetivo, almenos de forma aproximada, a partir de las medidas de dos giroscopos montados sobre lacabeza de la plataforma. El diseno de esta ley plantea la dificultad anadida de realimentarla velocidad en lugar de la posicion, por lo que se desea estabilizar es una integral de lamedida de los sensores, ya que no se dispone de una estimacion de R1

0. La estabilizacion dela integral puede acumular errores en regimen permanente irrecuperables debido al efectode perturbaciones. Sin embargo, es posible obtener una realimentacion periodica del errorde seguimiento mediante un subsistema de vision externo, de mucha menor frecuencia,que permita al sistema corregir la deriva acumulada. Este es el principio del sistemaDORNA que se describira en el apendice de esta tesis, para el que aun no se ha propuestoun marco teorico completo de analisis de estabilidad y rendimiento.

Los posibles resultados en esta lınea tendrıan la ventaja de reducir la complejidady el tiempo de computo asociados a la introduccion de un modulo de interpretacion deimagenes de vıdeo en el sistema.

Page 190: Hamiltonians based Control

176 7.5. Desarrollos futuros

7.5.2 Sistemas subactuados

Esta lınea es una fuente continua de problemas abiertos y objeto de una intensa actividadinvestigadora por parte de matematicos e ingenieros de control. Dentro del contexto de lapasividad y de los desarrollos presentados en esta tesis basados en el metodo IDA-PBC,se proponen las siguientes lıneas como trabajo futuro.

• Como es sabido, la sobreoscilacion y el tiempo de establecimiento son dos parametrosdel control de notable importancia en el diseno. Paralelamente a los resultadosrelacionados con el analisis transitorio de sistemas controlados mediante pasividadpresentados en el capıtulo 4, que establecen un marco para el computo aproximadode la maxima sobreoscilacion, hallar un metodo exacto o numerico aproximado paraestimar el cotas superiores del tiempo de establecimiento del sistema. Para ello debe-mos explotar el hecho intuitivo de que kv, la tasa de disipacion, es una medida de lorapido que se perdera energıa y se convergera al equilibrio. Sin embargo, debido alcaracter fuertemente no lineal del sistema de la bola en la viga, ni siquiera podemosafirmar que en todo caso un crecimiento de kv implica un tiempo de establecimien-to menor. Y de ningun modo disponemos, de momento, de una relacion siquieraaproximada entre kv y tiempo de establecimiento.

• Extender las ecuaciones reducidas del metodo IDA-PBC al caso de sistemas conmas de un grado de subactuacion2.

• Estudiar las posibles soluciones proporcionadas por el metodo del capıtulo 5 en otrossistemas subactuados de interes en la comunidad investigadora: pendulos rotatorios,Acrobot, Pendubot, etc.

• Definir de una manera practica el conjunto posible de hamiltonianos controlados, esdecir, el conjunto de funciones de hamilton en bucle cerrado alcanzable en el casode un problema de control subactuado. Esta lınea ha comenzado de la mano delos trabajos de (Blankenstein, Ortega & Van der Schaft 2002), y resta proporcionarsoluciones automaticas3,

• Introduccion de restricciones no holonomas en el metodo IDA-PBC. El marco teoricode esta lınea ha sido introducido en (Blankenstein 2002), sin embargo la compleji-dad que involucra requiere un tratamiento simplificador similar al presentado en elcapıtulo 5.

• Incorporacion de terminos de friccion realistas en los modelos en bucle de abiertodel metodo IDA-PBC y Lagrangianos controlados. Pese a los recientes avances enmodelado y compensacion de friccion (Canudas de Wit et al. 1995), la manera decompensar sus efectos en el caso de sistemas subactuados representa un terrenodifıcil e inexplorado. Concretamente en el caso del IDA-PBC, un modelo simplede friccion viscosa romperıa la division energıa potencial–cinetica de las ecuaciones,debido a la introduccion de terminos no cuadraticos de la velocidad.

El area del control de sistemas subactuados en toda su generalidad, se mantiene comoun problema abierto para el que solo se han encontrado soluciones en el caso de sistemas

2Nos referimos los grados de subactuacion como la diferencia entre el numero de grados de libertad yde subactuadores.

3que no involucren la resolucion de un sistema de EDPs

Page 191: Hamiltonians based Control

Capıtulo 7. Conclusiones y desarrollos futuros 177

subactuados simples. Las distintas tecnicas de control presentadas en esta tesis allananel camino hacia las soluciones de tipo GAS de cierto sistema pero al mismo tiempo,el imponer estructuras en bucle cerrado de tipo lagrangiano o hamiltoniano, podrıanobstaculizar el descubrimiento de otras leyes mas generales.

Una metodologıa constructiva (mas alla de los importantes pero poco practicos enun-ciados de existencia) de sıntesis para sistemas no lineales controlables de la forma x =f(x, u) sigue siendo uno de los objetivos mas codiciados y al mismo tiempo inalcanzablesdentro de la literatura del control.

7.5.3 Estabilizacion de oscilaciones

Como se ha mencionado recientemente en (Bullo 2002) la estabilizacion de oscilaciones ensistemas no lineales tiene un enorme interes en el area de robots caminantes. Los robotscaminantes son sistemas hıbridos ya que su dinamica tiene una parte continua que admitela clasica descripcion en variables de estado y una parte conmutada, donde las variablespueden tomar un valor dentro de un conjunto discreto.

En nuestro caso, cada articulacion o robot caminante debe conmutar entre una dinamicadonde el pie esta apoyado en el suelo, y otra donde este realizando una trayectoria deavance en el aire. En (Bullo 2002) se propone una orbita periodica de referencia para elsistema hıbrido que permita el avance del robot caminante. La principal aportacion dela ley de control resultante esta en el hecho de que no maneja senales dependientes deltiempo y en su caracter hıbrido.

Con el fin de enlazar los procedimientos expuestos en esta tesis de estabilizacion deorbitas mediante consideraciones energeticas, con la lınea de Bullo por su evidente interespractico, una propuesta de desarrollo futuro consiste en extender los desarrollos a orbitashıbridas, donde la funcion de energıa, por si misma, admita discontinuidades cuando elestado conmute de una region a otra. En este caso habrıa que estudiar el metodo paragarantizar un decrecimiento de la funcion de energıa a lo largo de las trayectorias enausencia de conmutacion, ası como la continuidad de dicha funcion en el cambio de regionde fucionamiento. Las ventajas de trasladar el enfoque hamiltoniano a estos contextosson, fundamentalmente,

• Posibilitar un estudio de robustez basado en pasividad y ganancia L2.

• Proporcionar un metodo de deteccion de bifurcaciones en sistemas como robotscaminantes.

• Aproximacion a las orbitas objetivo por la vıa mas proxima posible. En el casode robots caminantes esto es un elemento esencial, dado que la aproximacion auna orbita fija con senales dependientes del tiempo, podrıa introducir al sistema enestados transitorios inestables y provocar una perdida de equilibrio del robot.

• Evitar la incomodidad en la fase de desarrollo software de trabajar con senalesdependientes del tiempo como referencia de las trayectorias.

El segundo campo de aplicacion en el que se abre una lınea de investigacion de sumointeres es el diseno de sistemas electronicos de potencia, donde las senales de corrientealterna producida por circuitos eventualmente conmutados, deben estabilizarse en una

Page 192: Hamiltonians based Control

178 7.5. Desarrollos futuros

orbita periodica correspondiente a un armonico puro y una serie de senales con desfaseconstante. De especial interes es el caso de los sistemas de alimentacion ininterrumpida(SAI).

Recordemos que los resultados presentados en esta tesis, concretamente la formulacionhamiltoniana generalizada es solo de directa aplicacion en sistemas mecanicos completa-mente actuados y una amplia clase de subactuados. De hecho la ecuacion (6.2.7) estadisenada para ajustarse a la de los sistemas mecanicos donde la primera ecuacion de es-tado es x1 = x2 relacionando posicion y velocidad dado que las fuerzas solo tienen efectoen la derivada de la velocidad. El ajuste de un sistema no lineal sin estructura mecanica,como es el caso de los sistemas electronicos de potencia, puede presentar dificultades ala hora de encontrar una ley de ajuste tal que en bucle cerrado se obtenga la estructuradisipativa oscilatoria (6.2.7). De hecho, posiblemente esta estructura puede no ser la ideal,dependiendo del sistema que se trate, y posiblemente sea necesario disenar estructurashamiltonianas generalizadas ad hoc que cumplan la condicion de disipatividad con respectoa la funcion de energıa oscilatoria presentada en el capitulo 6, y que faciliten la busquedade leyes de control para el ajuste de las dinamicas en bucle abierto y cerrado.

A continuacion se daran unas indicaciones basicas para el procedimiento de diseno.En el caso de que el modelo del sistema de potencia sea linealizable por realimentacion,es de directa aplicacion la tecnica de sıntesis ilustrada en la seccion 6.7 del capıtulo 6. Elprocedimiento en el caso mas general implica un proceso iterativo de diseno a dos niveles:la eleccion de una funcion de Hamilton Hd con un conjunto mınimo en una orbita periodicadeseada, lo cual puede ser objeto de una secuencia de ensayo y error, y el diseno de unadinamica hamiltoniana para un subsistema de segundo orden, con funcion de HamiltonHd. Si no se encuentra una ley de ajuste adecuada a partir del modelo en bucle abierto,se puede optar redisenar tanto la funcion de energıa, como la dinamica objetivo oscilante.Los detalles de este procedimiento se ilustran en el diagrama de flujo de la figura 7.2.

Page 193: Hamiltonians based Control

Capıtulo 7. Conclusiones y desarrollos futuros 179

¿Estuctura triangular?

Elección de la función de energíaHd con un conjunto mínimo en la

orbita periódica

¿Existe ley de ajuste parasubsistema de orden 2?

Elección de la dinámica en buclecerrado disipativa respecto a Hd

considerando laspeculiaridades del modelo

¿Modelo linealizablepor realimentación?

Emplear Hd y la estructura GHSdel Capítulo 6

Inicio

Cálculo de la ley de control(Cap. 6)

SI

NO

SI

Backstepping

SI

NO

Inmersión e Invarianciau otras técnicas de ajuste

NO

Fin

¿Agotadabúsqueda?

NO

SI

Rediseño a Nivel 1

Rediseño a Nivel 2

Figura 7.2: Procedimiento de diseno de un controlador para estabilizacion de oscilacionesbasado en pasividad en sistemas sin estructura mecanica.

Page 194: Hamiltonians based Control

180 7.5. Desarrollos futuros

Page 195: Hamiltonians based Control

Apendice A

Proyecto DORNA

A.1 Introduccion

En este apendice se presenta una aplicacion para el control de una plataforma giroesta-bilizada inicialmente publicado en (Gomez-Estern, Perez, Rubio & Gordillo 2000). Elobjetivo de la aplicacion es controlar las velocidades de la plataforma medidas respecto aejes inerciales independientemente de las perturbaciones a las que se ve sometida. Dichaaplicacion se implementa en un hardware basado en bus VME, en la que se usa una arqui-tectura distribuida mediante tres procesadores DSP. Para el desarrollo de la aplicacion seha implementado a su vez un simulador de la plataforma giroestabilizada con una interfazhardware con el controlador.

Inicialmente se explicara lo que se entiende en este apendice por plataforma. Unaplataforma consiste en un mecanismo de dos grados de libertad de tipo rotacional. Ladisposicion fısica de los ejes permite al elemento terminal posicionarse con distintas ori-entaciones y elevaciones, dentro de los limites fısicos del mecanismo, un esquema completode la plataforma se puede ver en la figura A.1. Normalmente el movimiento se limitaunicamente en elevacion, por lo que la transmision de senales se realiza a traves de anilloscolectores situados en la parte inferior.

El control de plataformas giroestabilizadas presenta un gran interes en el ambito deaplicaciones de tipo aeronautico o de navegacion. Normalmente este tipo de plataformasse ubican en un movil que posee una determinada orientacion variable respecto a tierra.Estas variaciones de orientacion del movil que soporta la plataforma son detectadas porsensores de tipo giroscopico ubicados en el extremo de la plataforma. Por lo que lasmedidas proporcionadas por el giroscopo dependen de la posicion en la que se encuentrenlos dos grados de libertad de la plataforma. El sensor giroscopico usado mide velocidadesen dos de sus ejes.

A.2 Arquitectura hardware

La arquitectura hardware del controlador del posicionador esta basada en bus VME.Sobre dicho bus se dispone de un sistema multiprocesador que cuenta con entradas ysalidas de diversos tipos, ası como interfases Ethernet para la comunicacion con otros

181

Page 196: Hamiltonians based Control

182 A.2. Arquitectura hardware

θ

y z

x

yz

x

ϕ, ϕ

.

.

Figura A.1: Esquema de la plataforma giroestabilizada.

equipos. En concreto las distintas tarjetas de las que dispone el sistema y que conformanla arquitectura de la figura A.2 son:

• Una tarjeta basada en un procesador Motorola 68040 que se encarga de gestionarlas interfases Ethernet.

• Una tarjeta basada en un DSP TMS320C40 (Texas Instruments 1999) que interpretalos mensajes recibidos de por la red Ethernet. A su vez envıa respuestas a traves dela red y gestiona una maquina de estados que gobierna las distintas modalidades decomportamiento del pedestal.

• Dos tarjetas basadas en un DSP TMS320C40 que implementan lazos de controlpara los dos grados de libertad de la plataforma. Cada tarjeta posee un modulode entradas y salidas analogicas que permite a cada eje la lectura de tacometro ygiroscopo. Este modulo tambien dispone de salidas analogicas para controlar el paraplicado a lo motores. Los modulos de E/S analogicas no son accesibles desde el busVME, sino desde el bus interno de las tarjetas DSP. Todos los canales analogicos,tanto los de entrada como los de salida tienen una resolucion de 12 bits.

• Una tarjeta de E/S digital para tener informacion de mecanismos de seguridad yactivar y desactivar dispositivos auxiliares. Esta tarjeta se gestiona desde el proce-sador de comunicaciones y maquina de estados.

• Una tarjeta para permitir la lectura de los resolver que proporcionan la posicion delpedestal. Los resolver usados son de doble precision ×1 y ×16 usando convertidoresRD de 14 bits.

El intercambio de informacion entre los distintos procesadores se realiza mediantememorias del tipo DPR (dual port RAM ) que incorporan las tarjetas DSP.

Page 197: Hamiltonians based Control

Apendice A. Proyecto DORNA 183

Lazo orientación

Lazo elevación

Plataforma Giroestabilizada

Subsistema deOperación

Registro deDatos

•Consignas

•Modo de operación

•Ordenes

•Datos Pedestal

•Diagnósticos

Gestión deComunicaciones

y Estado.Gestión deEthernet

M68040

θ, θ, θi

φ, φ, φi

Figura A.2: Arquitectura hardware del sistema.

A.3 Arquitectura de la aplicacion

En el soporte fısico descrito se ejecuta una aplicacion en tiempo real multitarea y multi-procesador dividida en cuatro procesos:

• Proceso para el envıo y recepcion de datagramas UDP del protocolo de comunica-ciones con el sistema de operacion. Las tramas recibidas se insertan en un buffer dememoria compartida para su acceso desde el proceso de gestion del sistema. Esteproceso no realiza ninguna interpretacion ni creacion de datagramas, solo sirve depuente de comunicacion hacia el interfaz Ethernet. Esta tarea tiene lugar en latarjeta CPU basada en el procesador 68040.

• Proceso de gestion del protocolo y la maquina de estados. Tiene lugar en una delas tarjetas basada en el DSP TMS320C40 y su fin es coordinar la actividad de loscontroladores con las ordenes de protocolo recibidas en datagramas, responder adichas ordenes, gestionar los estados del sistema y detectar errores en los equipos.En una seccion posterior se describe su funcionamiento con mayor detalle.

• Proceso de control del eje de orientacion Tiene lugar en una de las DSP con tarjeta deexpansion conversora A/D-D/A. Controla la dinamica del eje en el modo requeridopor el sistema de operacion y la sincronizacion de los periodos de muestreo de amboslazos. Intercambia informacion con el proceso de gestion y variables dinamicas conel controlador de orientacion para hacer posible el control multivariable.

• Proceso de control del eje de elevacion. Actua de manera similar al anterior salvopor tener los instantes de muestreo determinados por el controlador de orientacion,por lo que funciona como esclavo de este. Ambos procesos seran descritos con masdetalle en los apartados subsiguientes.

El acceso de tales procesos a zonas de memoria compartida para el intercambio de datosconlleva la necesidad de arbitrar mecanismos de sincronizacion que eviten condiciones decarrera. Para ellos se han implementado semaforos basados en el clasico algoritmo dePeterson (Tanenbaum 2001), con la particularidad de que no se debe esperar mas de un

Page 198: Hamiltonians based Control

184 A.4. Simulador de la plataforma giroestabilizada

HABILITACION_PEDESTAL

PETICION_TSO

ORDENES_VELOCIDAD_INERCIAL

ORDENES_VELOCIDAD_CUBIERTA

ORDENES_VEL_INERCIAL_EM_GYRO

ORDENES_POSICION

DATOS_PLATAFORMA

DATOS_PEDESTAL

TABLA_SITUACION_OPERATIVA

RESULTADOS_DIAGNOSTICO

ORDENES_DIAGNOSTICOGESTION

DECOMUNICACIONES

SELECCION_MODO

SELECCION_MODO

REFERENCIA_ELEV

REFERENCIA_ELEV

SINCRONIZACION

SINCRONIZACION

VARIABLES_ELEVACION

FRENOS_PEDESTAL

TOPES_PEDESTAL

VARIABLES_ELEVACION

VARIABLES_ORIENTACION

BOCINA_PEDESTAL

LAZO_CONTROL_ELEVACION

LAZO_CONTROL_ORIENTACION

VARIABLES_ORIENTACION

GIROSCOPO_ORIENTACION

RESOLVER_ORIENTACION

GIROSCOPO_ELEVACION

RESOLVER_ELEVACION

TACOMETRO_ELEVACION

TACOMETRO_ORIENTACION

PAR_ELEVACION

PAR_ORIENTACION

Figura A.3: Arquitectura software del sistema.

plazo determinado a la espera del desbloqueo de una region crıtica por parte de otroproceso. Si se supera dicho plazo, se enviara un mensaje notificando la inactividad delproceso bloqueante.

La arquitectura software descrita aparece reflejada en el diagrama de la figura A.3

A.4 Simulador de la plataforma giroestabilizada

Para el desarrollo del sistema de control de la plataforma se ha contado con la importanteayuda de un simulador de una plataforma. Dicho simulador se encuentra dotado de unainterfaz electrica conectable al controlador. El hardware del simulador consta de dospartes:

• Un rack con bus VME en el que se alojan tarjetas E/S para emular la presencia detodos los sensores de la plataforma. En concreto se cuenta con entradas y salidasanalogicas y digitales, ademas de tarjetas para la emulacion de los resolvers.

• Un ordenador PC en el que se ejecuta el programa simulador de la plataforma. Lainterfase entre el ordenador y el bus VME se realiza mediante una tarjeta adaptadorade bus VME a PCI.

El software del simulador se ha realizado en lenguaje C++ orientado a objetos, y realizacomo funciones mas importantes:

• Integrar un modelo completo de la plataforma mediante el algoritmo Runge-Kuttade orden 4 con un periodo de 1 ms.

• Emular el movimiento de la base de la plataforma con senales conocidas.

Page 199: Hamiltonians based Control

Apendice A. Proyecto DORNA 185

• Mantener una base de datos de juegos de parametros y opciones de simulacion dela plataforma.

• Realizar registros de las variables del sistema para su posterior analisis.

El modelo de la plataforma usado en el simulador ha tratado de recoger las no linealidadesmas importantes que se presentan en este tipo de sistemas. Se han incluido distintosmodelos de friccion como son los modelos estaticos y de LuGre (Canudas de Wit et al.1995). El modelo a usar en cada simulacion es seleccionable por el usuario de entre losexistentes en la base de datos. En el simulador tambien se incorpora un modelo de laholgura que se presenta en los engranajes que conectan el eje motor con el eje de la carga.El conjunto de ecuaciones que se integran en cada periodo de muestreo es:

ηokmoiao = ψ(Izz1 + s2

θIxx2 + c2θIzz2 + η2

oImo

)+

+ ψθs2θ (Ixx2 − Izz2) + τfo(ψ) + η2obmo

ηekmeiae = θ(Iyy2 + η2

eIme

)−− 1

2ψ2s2θ (Ixx2 − Izz2) + τfe(θ) + η2

ebme

donde i son las corrientes de los estator de los motores, km constantes de par de los mo-tores, η relaciones de las cajas de engranajes, Im inercias de los actuadores y los elementosIij las componentes de los tensores de inercia de las partes moviles. Las funciones τf secorresponden con los pares de friccion, en el caso de que este venga dado por el modeloLuGre, se usan las expresiones:

τf = σ0z + σ1z (A.4.1)

z = v +abs(v)

f(v)z (A.4.2)

f(v) =1

σ0

[τC1 + τV 1abs(v)+

+ (τS1 − τC1) e−B1abs(v)]sgn1(v)−

−[τC2 + τV 2abs(v)+

+ (τS2 − τC2) e−B2abs(v)]sgn2(v)

sgn1(·) =

1 si(·) > 0

0 si(·) ≤ 0

sgn2(·) =

0 si(·) > 0

−1 si(·) ≤ 0(A.4.3)

El simulador incorpora un modulo para la visualizacion en tiempo real del movimientode la plataforma, tal y como se ve en la figura A.4. Tambien se incluyen herramientaspara la visualizacion y analisis de los datos generados por la simulacion.

A.5 Procesador de comunicaciones

Una tarjeta DSP se destina a gestionar la comunicacion con el sistema de operacion delbuque mediante un protocolo basado en datagramas UDP. Las funciones de esta tarjeta

Page 200: Hamiltonians based Control

186 A.5. Procesador de comunicaciones

Figura A.4: Modelo 3D del simulador de la plataforma.

son diversas:

• Captura de informacion relativa a la dinamica de los lazos de orientacion y elevacion.Para ello se establece una zona de memoria compartida con los procesadores de lazosde control y sus correspondientes semaforos de acceso concurrente.

• Construccion de mensajes de protocolo que seran enviados mediante UDP/Ethernetal sistema de operacion del buque. Dichos mensajes se almacenaran en una zona dememoria compartida con la CPU Motorola, arbitrandose los mecanismos oportunospara el acceso concurrente y la notificacion de llegada de nuevos mensajes. El envıode las tramas por red es tarea de la CPU de acceso a la red.

• Recepcion de las referencias de control y modo de seguimiento desde el sistema deoperacion mediante el mismo protocolo. Si las ordenes solicitadas son viables segunel estado de la maquina, se notificara debidamente a los lazos de control.

• Realizacion de todos los chequeos de inicializacion y rutinarios de los elementoshardware del sistema. (Tarjetas de entrada/salida, procesadores y memorias).

• Habilitacion de temporizadores y disparo de eventos para la gestion de la actividadsıncrona de la maquina. Entre los procesos que se ejecutan de forma sıncrona seencuentra el envıo de datos periodicos para los equipos de registro de datos delbuque, activable a distintas frecuencias.

• Monitorizacion del funcionamiento de las DSP de los lazos de control. Se hace usode un mecanismo de tipo watchdog para detectar si alguno de los controladoresinterrumpio su actividad al cabo de un periodo determinado.

• Implementacion de una maquina de estados sıncrona para la coordinacion de modos,estados, entradas y salidas digitales como frenos y alarmas. La maquina de estadosse describe de forma somera en el siguiente apartado.

Page 201: Hamiltonians based Control

Apendice A. Proyecto DORNA 187

PérdidaCOMUNICACION

ARRANQUE

ENCENDIDO_1

ENCENDIDO_2

EMERGENCIA OPERACION

Fallo gyro ANDmodo=velocidad_inercial

OR FALLO_BITE

PérdidaCOMUNICACION

Fallo gyro ANDmodo=velocidad_inercial OR Fallo BITE OR DESHABILITA_ PEDESTAL

BITE OKOR IGNORA_BIT

ANDPROTECCIONES_OFF

Fallo gyro ANDmodo=velocidad_inercialOR Fallo BITE

Petición TSO

FINTEMPORIZADORBOCINA

FINTEMPORIZADORBOCINA

HABILITA_PEDESTALANDEMERGENCIA

ENCENDIDO_3

Figura A.5: Diagrama de estados del sistema.

A.6 Maquina de estados

Mencion aparte merece la funcion de coordinacion del sistema o maquina de estados. LaDSP de comunicaciones ejecuta un bucle infinito con la estructura de automata logicoprogramable para coordinar las entradas, estados y salidas del sistema. El algoritmode la maquina de estados se descompone en adquisicion de las entradas (provenientesdel sistema de operacion, lazos, chequeos rutinarios, eventos del temporizacion y senalesdigitales), determinacion del estado y modo de seguimiento futuros, determinacion de lassalidas correspondientes al estado y aplicacion de dichas salidas.

El bucle principal de operacion queda especificado en el pseudocodigo a continuacion:

1. Lectura de mensajes de protocolo provenientes del sistema de operacion.

2. Lectura de las coordenadas medidas por los lazos de control.

3. Lectura entradas digitales. Lectura a traves de la tarjeta I/O paralelo VME de lassenales binarias que dan cuenta del estado de operacion de los sistemas fısicos dela maquina: topes superior e inferior, hombre arriba (para evitar el movimiento enpresencia de operarios), estado del giroscopo y perdida de la referencia del resolver.

4. Realizacion de chequeos internos periodicos. En el caso de existencia de fallos enel Hardware, se determina si estos bloquean la operatividad de la maquina o si porel contrario admiten un funcionamiento degradado. En funcion de este resultadoy del modo de funcionamiento se decidira si se debe operar de forma degradada odeshabilitar el control.

Page 202: Hamiltonians based Control

188 A.7. Procesadores de lazos de control

5. Comprobacion de protecciones activas. El operario habilitara las protecciones alaproximarse al pedestal para su manipulacion en condiciones de seguridad.

6. Actualizacion de los temporizadores. Los eventos sıncronos generados por esteprocesador funcionan mediante la cuenta atras de una serie de variables. Cuandouna de ellas llega a cero se dispara el evento correspondiente que sera posteriormenteprocesado por la maquina de estados. La actualizacion de dichas variables se realizaen virtud del tiempo transcurrido desde la ultima iteracion.

7. Obtencion del estado y modo seguimiento futuros en funcion de la informacionrecogida en los apartados anteriores.

8. Determinacion de salidas digitales correspondientes al estado actual. El conjuntode salidas digitales activables son: frenos en cada eje, alimentacion del giroscopo,bocina de emergencia y habilitacion de los servoamplificadores de los motores.

9. Aplicacion de los nuevos valores de las salidas digitales a traves de la tarjeta I/Oparalelo VME.

10. Envıo de referencias y modos de seguimiento nuevos a las DSP de los lazos decontrol. El modo de seguimiento dependerıa de la orden recibida desde el sistemade operacion y la posibilidad de llevarla a cabo segun el estado y los errores que sehayan detectado en los pasos anteriores.

11. Escritura en la memoria compartida de una tabla indicando el estado interno delsistema y las modificaciones que se hayan producido para ser enviada hacia el sistemade operacion. Asimismo se enviaran los mensajes periodicos pendientes al equipode registro de datos y las tramas de respuesta del protocolo que sean oportunas.

La figura (A.5) se refleja el diagrama de estados del controlador del pedestal de sen-sores:

A.7 Procesadores de lazos de control

Cada DSP que controla un lazo de control ejecuta un algoritmo de control en tiempo real(Benett 1988). El programa en cada periodo de muestreo obtiene muestras de todos lossensores y si la plataforma se encuentra en estado de operacion, el controlador calcula lassenales de control apropiadas. Los lazos de control pueden funcionar en distintos modos,en cada modo la variable a controlar es distinta. Dichos modos son:

• Modo de posicion, en el que se controla la posicion de los dos servomotores leıdapor los resolver.

• Modo de velocidad, en el que se controla la velocidad de los dos servomotores.

• Modo de velocidad inercial, en el que se controla la velocidad inercial proporcionadapor el giroscopo.

• Modo de velocidad de emulacion giroscopica, en este modo auxiliar se tiene utilidaden caso de fallo del giroscopo. Externamente por medio de la conexion Ethernet aotros sistemas se le puede proporcionar al los controladores la posicion en la que se

Page 203: Hamiltonians based Control

Apendice A. Proyecto DORNA 189

encuentra la base que soporta la plataforma, de este modo se pueden estimar lasvelocidades inerciales.

Los procesadores de lazo de control disponen de mecanismos de autodiagnostico por mediode los cuales se puede comunicar fallos hardware o desajustes de los controladores. Losresultados de estos test se transmiten al procesador de comunicaciones. Las principalesfunciones del modo de diagnosticos son:

• Comprobacion de la respuesta al escalon de posicion.

• Comprobacion de la respuesta al escalon de velocidad.

• Ajuste manual y/o automatico de derivas.

A.8 Conclusiones

En este apendice se ha presentado un sistema en tiempo real para el control de unaplataforma con dos grados de libertad acoplados. El sistema mecanico es una plataformade sensores de navegacion marıtima de grandes dimensiones y estrictas especificacionesde funcionamiento.

El texto pone de relieve aquellos aspectos de la implementacion que por su comple-jidad y originalidad resultan de interes en campos teoricos como el modelado y controlde sistemas dinamicos no lineales y en areas mas tecnicas como el desarrollo de aplica-ciones con restricciones de tiempo real en sistemas multiprocesadores con elementos desincronizacion y memoria compartida basados en DSPs.

La filosofıa de la aplicacion informatica obedece a la estructura de programacion deautomatas programables al existir en la literatura metodos compactos de especificaciony modelado de maquinas de estados para estos sistemas. El procedimiento de diseno ydocumentacion de la aplicacion obedece a normas de calidad en ingenierıa del software.

Page 204: Hamiltonians based Control

190 A.8. Conclusiones

Page 205: Hamiltonians based Control

Apendice B

Codigo Maple para la ecuacion(6.8.1)

El computo de cada termino de la ecuacion (6.8.1) puede ser tarea ardua, lo cual hamotivado el desarrollo de unas rutinas Maple para el calculo automatico simbolico de laley de control para un orden arbitrario.

En primer lugar se crean los vectores cuyos elementos son los ki, γi xi y fi de la seccion6.8. Para ello se definira el siguiente procedimiento Maple

init := proc (n) local m, i;global gam,x,f,vectk,P,u0;m:=n-2; u0:=-x1-k0*P*x2; m := n-2;vectk := [evaln(k || (1 .. m))];gam := [evaln(gamma || (1 .. m))];x := [evaln(x || (1 .. n))];f := matrix(m+1,1,0);f[m,1] := -P*x2-k1*x3;for i from 2 to m do

f[m+1-i,1]:=-x[i+1]-vectk[i]*x[i+2]od;evalm(f)

end proc;

Esta funcion ha de invocarse con un argumento indicando el orden del sistema lineal-izado. (5 en el ultimo ejemplo). Por tanto si escribimos

init(5);

todos los vectores son inicializados para n = 5, m = 3, y se muestra en pantalla f 3 dandocomo resultado

−x4 − k3 x5

−x3 − k2 x4

−Px2 − k1 x3

0

191

Page 206: Hamiltonians based Control

192 Apendice B. Codigo Maple para la ecuacion (6.8.1)

El segundo paso consiste en calcular la matriz Γk para cualquier valor de k. Con esteproposito emplearemos el siguiente procedimiento Maple:

mat:=proc(k) local m,i;if (k = 1)then m:=matrix(2,1,[gam[1],1])elsem:=matrix(k+1,k,0);for i from 1 to k-1 do

m[i,i]:=gam(k-i+1);m[i,i+1]:=1;

od;m[k,k]:=gam(1); m[k+1,k]:=1;

end if;evalm(m);

end;

para el cual una tıpica llamada serıa

m1:=mat(4);

que dara como resultado la matriz 5 × 4

m1 :=

γ4 1 0 0

0 γ3 1 0

0 0 γ2 1

0 0 0 γ1

0 0 0 1

Ahora bien, para obtener series de multiplicaciones del tipo Γ4Γ3Γ2 definiremos un sencilloprocedimiento

matprod:=proc(k,l) local m,i;m:=matgamma(l);for i from l+1 to k do

m:=evalm(matgamma(i)&*m);od;evalm(m);

end;

La llamada a esta funcion para calcular en particular Γ4Γ3Γ2 serıa

m2:=matprod(4,2);

lo cual da como resultado el vector

γ4 (γ3 (γ2 γ1 + 1) + γ1) + γ2 γ1 + 1

γ3 (γ2 γ1 + 1) + γ1

γ2 γ1 + 1

γ1

1

Page 207: Hamiltonians based Control

Apendice B. Codigo Maple para la ecuacion (6.8.1) 193

El siguiente paso es obtener la formula (6.8.1) por medio de los procedimientos previos,para lo cual definiremos la funcion

control1:=proc(n) local m,i,u;global u0,vectk;m:=n-2; init(n);u:=matprod(m,1)*u0+sum(’evalm(matprod(m,h+1)&*submatrix(f,m+1-h..m+1,1..1))’,’h’=1..m-1)+f; evalm(u)[1,1];

end;

Para su uso, en el caso hipotetico en que n = 6,m = 4 escribirıamos

u4:=control1(6);

para dar lugar a

u4 := (−x1 − k0 Px2)(γ4 (γ3 (γ2 γ1 + 1) + γ1) + γ2 γ1 + 1) + γ4 γ3 γ2 (−Px2 − k1 x3)

+ γ4 γ3 (x3 − k2 x4) + (γ4 + γ2)(−Px2 − k1 x3)

+ γ4 (x4 − k3 x5) + x3 − k2 x4 + x5 − k4 x6

A fin de transformar todos los γi en los correspondientes operadores derivativos definire-mos el siguiente procedimiento:

derproc:=proc(u,n) local i,v; v:=u;for i from 1 to n-2 do

v:=subs(gam[i]=vectk[i]+s,v);od;v;

end;

Se invocara esta funcion con el resultado de la ultima llamada a control1 y el orden delsistema n, que en el anterior ejemplo tomaran la forma

u4:=derproc(u4,6);

dando como resultado la ley de control en el dominio de Laplace, donde s representa laderivada temporal:

u4 := (−x1 − k0 Px2)((k4 + s)((k3 + s)((k2 + s) · (k1 + s) + 1) + k1 + s)

+ (k2 + s)(k1 + s) + 1) + (k4 + s)(k3 + s)(k2 + s)(−Px2 − k1 x3)

+ (k4 + s)(k3 + s)(x3 − k2 x4) + (k4 + 2 s + k2)(−Px2 − k1 x3)

+ (k4 + s)(x4 − k3 x5) + x3 − k2 x4 + x5 − k4 x6

A continuacion necesitamos convertir esta expresion en una funcion del estado. El sigu-iente procedimiento Maple toma los coeficientes del polinomio en s y toma sus derivadastemporales

derproc2:=proc(u,n) local i,v,w,m; m:=n-2;v:=subs(P=x1^2+x2^2-mu,u);

for i from 1 to n dov:=subs(x[i]=x[i](t),v);

od;w:=coeff(v,s,0);

Page 208: Hamiltonians based Control

194 Apendice B. Codigo Maple para la ecuacion (6.8.1)

for i from 1 to m dow:=w+diff(coeff(v,s,i),t$i);

od;w;

end;

La salida de derproc deberıa pasarse como argumento de derproc2, mientras que su salidaa su vez es pasada a una funcion que realiza la sustitucion general xi = xi+1:

derproc3:=proc(u,n) local i,h,m,v;m:=n-2; v:=u;for h from 1 to n-1 do

for i from n-h by -1 to 1 dov:=subs(diff(x[h](t),t$i)=x[h+i](t),v);

od;od;for h from 1 to n do

v:=subs(x[h](t)=x[h],v);od;v;end;

con la implementacion de esta funcion el calculo completo queda automatizado. De hecho,para obtener la ley de control completa solo hay que proporcionar el orden del sistema n,como sucede en el siguiente metodo que aglutina los pasos anteriores.

fullproc:=proc(ord) local m,v,i;m:=ord-2; v:=control1(ord);v:=derproc(v,ord);v:=derproc2(v,ord);v:=derproc3(v,ord);v:=subs(x1(t)^2+x2(t)^2-mu=P,v);for i from 1 to ord do

v:=subs(x[i](t)=x[i],v)od;v;

end:

Como puede observarse, esta funcion tambien realiza tareas de “limpieza”. Para obtenerla ley u3 para un sistema de quinto orden como se realizo en la seccion 6.8 anterior,simplemente escribiremos

u3:=fullproc(5);

Page 209: Hamiltonians based Control

Bibliografıa

Andreev, F., Auckly, D., Kapitanski, L., Gosavi, S., Kelkar, A. & White, W. (2000),Matching control laws for a ball and beam system, in ‘Proc. 1st IFAC Workshop onLagrangian and Hamiltonian Methods for nonlinear control’, Princeton, NJ, USA,pp. 161–162.

Aracil, J., Gomez-Estern, F. & Gordillo, F. (2002), A family of hamiltonian oscillating sys-tems, in ‘Lagrangian and Hamiltonian methods in nonlinear control 2003 (pendientede aceptacion)’, Sevilla, Espana.

Aracil, J., Gordillo, F. & Acosta., J. (2002), Stabilization of oscillations in the invertedpendulum, in ‘Proc. XV IFAC World Congress’, Barcelona, Espana.

Aracil, J., Gordillo, F. & Gomez-Estern, F. (2002), ‘Generation of stable oscillations incascade nonlinear systems and the hopf bifurcation’, Int. Journal of Control (enrevision) .

Astolfi, A. & Ortega, R. (2001), Immersion and invariance: a new tool for stabilization andadaptive control of nonlinear systems, in ‘Proc. 5th IFAC Symp. Nonlinear ControlSystems, NOLCOS’01’, St Petersburg, Russia.

Astrom, K. & Furuta, K. (1996), Swinging up a pendulum by energy control, in ‘13thIFAC World Congress’, Academic Press, San Francisco, USA, pp. 37–42.

Auckly, D. & Kapitanski, L. (2001), On the λ–equations for matching control laws, in‘Preprint’.

Auckly, D., Kapitanski, L. & White, W. (2002), ‘Control of nonlinear underactuatedsystems’, Comm. Pure Appl. Math. 3, 354–369.

Benett, S. (1988), Real-time Computer Control: An Introduction, Prentice Hall Interna-tional.

Besancon, G. & Battiloti, S. (1998), On output feedback tracking control with disturbanceattenuation for euler-lagrange systems, in ‘Proceedings of the 37th IEEE Conferenceon Decision and Control’, Tampa, FL, USA, pp. 3139–3143.

Blankenstein, G. (2002), Matching and stabilization of constrained systems, in ‘15th Inter-national Symposium on Mathematical Theory of Networks and Systems,MTNS’02’,University of Notre Dame, August 12-16.

Blankenstein, G., Ortega, R. & Van der Schaft, A. (2001), ‘The matching conditions ofcontrolled lagrangians and interconnection assigment passivity based control’, Int J.of Control 75, No. 9, 645–665.

195

Page 210: Hamiltonians based Control

196 BIBLIOGRAFIA

Blankenstein, G., Ortega, R. & Van der Schaft, A. (2002), Matching of euler-lagrange andhamiltonian systems, in ‘Proc. XV IFAC World Congress’, Barcelona, Espana.

Bloch, A., Leonard, N. & Marsden, J. (2000), ‘Controlled lagrangians and the stabilizationof mechanical systems’, IEEE Tr. on Automatic Control 45, No. 12.

Bullo, F. (2002), Control of hybrid systems along limit cycles, in ‘15th Symposium onMathematical Theory of Networks and Systems MTNS. University of Notre Dame,August 12-16,’.

Byrnes, C., Isidori, A. & Willems, J. (1991), ‘Passivity, feedback equivalence, and theglobal stabilization of minimum phase nonlinear systems’, IEEE Tr. on AutomaticControl 36, No. 11, 1228–1240.

Canudas de Wit, C., Olsson, H., Astrom, K. J. & Lischinscky, P. (1995), ‘A new modelfor control on systems with friction’, IEEE Transactions of Automatic Control 40,No. 3.

Chang, D. E., Bloch, A. M., Leonard, N. E., Marsden, J. E. & Woolsey, C. A. (2002), ‘Theequivalence of controlled lagrangian and controlled hamiltonian systems’, ESAIM:Control, Optimisation, and Calculus of Variations (en revision) .

Espinosa-Perez, G., Sira-Ramırez, H. & Rıos-Bolivar, M. (2000), Regulation of the pprmobile robot with a flexible joint: a combined passivity and flatness approach, in‘Proceedings of the 39th Conference on Decision and Control Systems’, Vol. 4, Or-lando, FL, USA, pp. 4036–4041.

Fradkov, A. & Pogromsky, A. (1998), Introduction to Control of Oscillations and Chaos,World Scientific.

Fujimoto, K. & Sugie, T. (2001), ‘Stabilization of hamiltonian systems with nonholonomiccontraints based on time–varying generalized canonical transformations’, Systemsand Control Letters 44, No. 15, 309–320.

Gomez-Estern, F., Aracil, J. & Gordillo, F. (2002), The hopf bifurcation and controlledoscillations in electromechanical systems, in ‘Proc. 10th Mediterranean Conferenceon Control and Automation’, Inst. Superior Tecnico, Lisbon, Portugal.

Gomez-Estern, F., Aracil, J. & Rubio, F. R. (2000), Practical implementation of ahamiltonian–based 2–DOF platform, in ‘Proc. IFAC Symposium on Robot Control’,Vienna, AU.

Gomez-Estern, F., Cordones, M. & Rubio, F. (2002), Passivity-based control and distur-bance rejection on a 2-dof platform, in ‘European Control Conference 2003 (pendientede aceptacion)’, Cambridge, UK.

Gomez-Estern, F., Ortega, R., Rubio, F. & Aracil, J. (2001), Stabilization of a classof underactuated mechanical systems via total energy shaping, in ‘Proc. 40th IEEEConf on Decision and Control’, Orlando, FL, USA.

Gomez-Estern, F., Ortega, R. & Spong, M. (2001), Total energy shaping for underac-tuated mechanical systems, in ‘Proc. 5th IFAC Symp. Nonlinear Control Systems,NOLCOS’01’, St Petersburg, Russia.

Page 211: Hamiltonians based Control

BIBLIOGRAFIA 197

Gomez-Estern, F., Perez, C., Rubio, F. & Gordillo, F. (2000), Aplicacion en tiemporeal para el control de una plataforma giroestabilizada, in ‘Proc. XXI Jornadas deAutomatica’, Sevilla, Espana.

Gordillo, F., Aracil, J. & Gomez-Estern, F. (2002), Stabilization of autonomous oscilla-tions and the Hopf bifurcation in the ball and beam, Las Vegas, USA. Proceedingsof the CDC’02.

Gordillo, F., Gomez-Estern, F., Ortega, R. & Aracil, J. (2002), On the ball and beamproblem: regulation with guaranteed transient performance and tracking periodicorbits, in ‘15th International Symposium on Mathematical Theory of Networks andSystems,MTNS’02’, University of Notre Dame, August 12-16.

Hale, J. & Kocak, H. (1991), Dynamics and Bifurcations, Springer-Verlag.

Hamberg, J. (1999), General matching conditions in the theory of controlled lagrangians,in ‘Proc. of the 38th IEEE Conference on Decision and Control’, Phoenix, AZ, USA.

Hauser, J., Sastry, S. & Kokotovic, P. (1992), ‘Nonlinear control via approximate input-output linearization: The ball and beam example’, IEEE Trans. on AC 37, No.3, 392–398.

Isidori, A. (1989), Nonlinear Control Systems, Springer-Verlag, Berlin, DE.

Kelly, R. (1993), A simple set point robot controller by using only position measurements,in ‘Proc. 12th IFAC World Conf.’, Vol. 6, Sydney, Australia, pp. 173–176.

Khalil, H. (1996), Nonlinear Systems, Prentice Hall.

Krstic, M., Kanellakopoulos, I. & Kokotovic, P. (1995), Nonlinear and Adaptive ControlDesign, Wiley.

Krstic, M., Sepulchre, R. & Praly, L. (1995), On the measure of global invariant manifoldfor fixed points, in ‘Technical Report CCEC 95-0228’, University of California, SantaBarbara.

Kuznetsov, Y. (1995), Elements of Applied Bifurcation Theory, Springer-Verlag.

Landau, L. & Lifchitz, E. (1964), Curso de fısica teorica, Tomo I: Mecanica, EdicionesMIR, Moscu.

Leonard, N., Bloch, A. & Marsden, J. (1998), Mechanical feedback control systems, inM. Vidyasagar, V. Blondel, E. Sontag & J. Willems, eds, ‘Open Problems in Math-ematical Systems and Control Theory’, Springer-Verlag, pp. 39–44.

Liu, W. (1994), ‘Criterion of Hopf bifurcations without using eigenvalues’, Journal ofMathematics Analysis and Applications 182, 250–256.

M. Reyhanoglu, A.J. Van der Schaft, N. M. & Kolmanovsky, I. (2001), ‘Dynamics and con-trol of underactuated mechanical systems’, IEEE Transactions on Automatic Control44, No. 9, 1663–1671.

Marino, R. & Tomei, P. (1995), Nonlinear Control Design, Prentice Hall.

Marsden, J. & McCracken, M. (1976), The Hopf Bifurcation and Its Applications,Springer-Verlag.

Page 212: Hamiltonians based Control

198 BIBLIOGRAFIA

Mees, A. & Chua, L. (1979), ‘The Hopf bifurcation theorem and its applications to non-linear oscillations in circuits and systems’, IEEE Trans. on CAS 26, No. 4, 235–254.

Olfati-Saber, R. (2001), PhD thesis: Nonlinear Control of Underactuated MechanicalSystems with Application to Robotics and Aerospace Vehicles, PhD thesis, Mas-sachusetts Institute of Technology.

Ortega, R., Loria, A., Kelly, R. & Praly, L. (1995), ‘On output feedback global stabiliza-tion of euler-lagrange systems’, Int. J. of Robust and Nonlinear Cont. Special Issueon Mechanical Systems 5, No. 4, 313–324.

Ortega, R., Loria, A., Niklasson, P. & Sira-Ramırez, H. (1998), Passivity-based Controlof Euler-Lagrange Systems, Springer-Verlag.

Ortega, R. & Spong, M. (2000), Stabilization of underactuated mechanical systems viainterconnection and damping assignment, in ‘Proceedings of the 1st IFAC Workshopon Lagrangian and Hamiltonian methods in nonlinear systems’, Princeton, NJ, USA.

Ortega, R., Spong, M., Gomez-Estern, F. & Blankenstein, G. (2002), ‘Stabilization ofunderactuated mechanical systems via interconnection and damping assignment’,IEEE Tr. on Automatic Control 47, No. 8, 1218–1233.

Ortega, R., Van der Schaft, A., Mareels, I. & Maschke, B. (2001), ‘Putting energy backin control’, IEEE Control Syst. Magazine 9, No. 4, 637–644.

Ortega, R., Van der Schaft, A., Maschke, B. & Escobar, G. (2002), ‘Interconnection anddamping assignment passivity-based control of port-controlled hamiltonian systems’,Automatica 38, No. 10, 585–596.

Praly, L., Ortega, R. & Kaliora, G. (2001), ‘Stabilization of nonlinear systems via for-warding modLgV ’, IEEE Transactions on Automatic Control 46, No.9.

Ranada, A. (1990), Dinamica Clasica, Alianza Universidad Textos, Madrid.

Rampazzo, F. & Sussmann, H. (2001), Set-valued differentials and a nonsmooth versionof chow’s theorem, in ‘Proceedings of the 40th IEEE Conference on Decision andControl’, Orlando, FL, USA, pp. 2613–2618.

Rodrıguez, H. & Ortega, R. (2002), Interconnection and damping assignment control ofelectromechanical systems, in ‘Proc. XV IFAC World Congress’, Barcelona, Espana.

Rouche, N. & Mawhin, J. (1980), Ordinary Differential Equations: Vol II, Pitman Publ.,London.

Santilli, R. M. (1978), Foundations of Theoretical Mechanics I, Springer–Verlag.

Sepulchre, R., Jankovic, M. & Kokotovic, P. (1997), Constructive Nonlinear Control,Springer-Verlag.

Shen, T., Mei, S., Lu, Q. & Tamura, K. (1999), Robust nonlinear excitation control withL2-disturbance attenuation for power systems, in ‘Proc. of the 38th IEEE Conferenceon Decision and Control’, Phoenix, AZ, USA.

Shiriaev, A. & et al. (2000), ‘On global properties of passivity-based control of the invertedpendulum’, Int Journal of Robust and Nonlinear Control 10, No.4, 283–300.

Page 213: Hamiltonians based Control

BIBLIOGRAFIA 199

Slotine, J. & Li, W. (1987), ‘On the adaptive control of robot manipulators’, Int. J.Robotics Research 6, 49–59.

Spong, M. (1997), Underactuated mechanical systems, in ‘International Workshop onControl Problems in Robotics and Automation: Future Directions’, Hyatt Regency,San Diego, California, pp. 2613–2618.

Spong, M., Corke, P. & Lozano, R. (2001), ‘Nonlinear control of the inertia wheel pendu-lum’, Automatica 37, 1845–1851.

Spong, M. & Vidyasagar, M. (1989), Robot Dynamics and Control, John Wiley & Sons,Inc., New York, USA.

Tanenbaum, A. S. (2001), Modern Operating Systems, Prentice Hall.

Texas Instruments (1999), Texas Instruments TMS320C4x User Guide.

Van der Schaft, A. (2000), L2-Gain and Passivity Techniques in Nonlinear Control,Springer-Verlag.

Vidyasagar, M. (1993), Nonlinear system analysis (2nd edition), Prentice Hall, London,UK.

Wang, Y., Cheng, D., Li, C. & Ge, Y. (2002), ‘Dissipative hamiltonian realization andenergy-based L2-disturbance attenuation control of multimachine power systems’,Preprint, 2002 .

Weibel, S. (1997), Applications of qualitative methods in the nonlinear control of superar-ticulated mechanical systems, PhD thesis, Boston University, Boston, Massachusetts,USA.