Modelado y control de masas acopladas. Aplicación a dispositivos ...

216
Modelado y control de masas acopladas. Aplicaci´ on a dispositivos de almacenamiento micro-electromec´ anicos. D. Francisco Javier Gil Chica Tesis Doctoral dirigida por el Dr. D. Manuel F. P´ erez Polo. Departamento de F´ ısica, Ingenier´ ıa de Sistemas y Teor´ ıa de la Se˜ nal. Escuela Polit´ ecnica Superior. Universidad de Alicante 1

Transcript of Modelado y control de masas acopladas. Aplicación a dispositivos ...

Page 1: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Modelado y control de masasacopladas. Aplicacion a dispositivos

de almacenamientomicro-electromecanicos.

D. Francisco Javier Gil Chica

Tesis Doctoral

dirigida por el Dr. D. Manuel F. Perez Polo.

Departamento de Fısica, Ingenierıa de Sistemas y Teorıa

de la Senal.

Escuela Politecnica Superior.

Universidad de Alicante

1

Page 2: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2

Para mis padresy hermanos

Page 3: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Indice general

1. Objetivos y alcance de esta tesis 91.1. Interes del modelo objeto de esta tesis . . . . . . . . . . . . . 91.2. Oportunidad de la Tesis . . . . . . . . . . . . . . . . . . . . . 131.3. Naturaleza y contenidos de esta Tesis . . . . . . . . . . . . . . 151.4. Aportaciones novedosas . . . . . . . . . . . . . . . . . . . . . . 20

2. Modelo fısico para el actuador 232.1. El modelo fısico . . . . . . . . . . . . . . . . . . . . . . . . . . 232.2. El porque del control optimo . . . . . . . . . . . . . . . . . . . 242.3. Modelo y ecuaciones basicas . . . . . . . . . . . . . . . . . . . 262.4. Regulador de energıa mınima . . . . . . . . . . . . . . . . . . 322.5. Simulaciones y discusion . . . . . . . . . . . . . . . . . . . . . 332.6. Control Bang-Bang . . . . . . . . . . . . . . . . . . . . . . . . 35

3. Regulacion y servocontrol 413.1. Tiempo y estado final fijos . . . . . . . . . . . . . . . . . . . . 413.2. Tiempo libre y estado final fijo . . . . . . . . . . . . . . . . . . 463.3. Tiempo fijo y estado final libre . . . . . . . . . . . . . . . . . . 463.4. Tiempo y estado final libres . . . . . . . . . . . . . . . . . . . 47

3.4.1. Coste tiempo-energıa con termino de Mayer . . . . . . 483.5. Servomecanismo con coste tiempo-energıa . . . . . . . . . . . 513.6. Servomecanismo LQR . . . . . . . . . . . . . . . . . . . . . . 52

3.6.1. Tiempo fijo y estado final libre. Ecuacion de Ricatti . . 523.6.2. Tiempo libre y estado final fijo . . . . . . . . . . . . . 54

3.7. Programacion dinamica . . . . . . . . . . . . . . . . . . . . . . 58

4. Modelo con acoplamiento no lineal 654.1. Modelo fısico . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.2. Regulador de energıa mınima . . . . . . . . . . . . . . . . . . 664.3. Inclusion de un termino de Mayer . . . . . . . . . . . . . . . . 704.4. Efecto de una perturbacion acimutal . . . . . . . . . . . . . . 72

3

Page 4: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4 INDICE GENERAL

4.5. Dinamica no lineal con funcion de coste LQR . . . . . . . . . 814.5.1. Tiempo y estado final fijos . . . . . . . . . . . . . . . . 814.5.2. Tiempo fijo y estado final libre . . . . . . . . . . . . . 83

5. Acoplamiento a un dispositivo movil 855.1. El modelo fısico . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.1.1. Regulador tiempo-energıa con estado final conocido . . 895.2. Estado final libre y termino de Mayer . . . . . . . . . . . . . . 935.3. Efecto de un campo de aceleracion . . . . . . . . . . . . . . . 955.4. LQR con tiempo y estado final fijos . . . . . . . . . . . . . . . 975.5. LQR con tiempo final fijo y estado final libre . . . . . . . . . . 995.6. LQR con estado final fijo y tiempo final libre . . . . . . . . . . 1005.7. LQR con tiempo y estado final libres . . . . . . . . . . . . . . 100

6. Dinamica no lineal e impulsiva 1016.1. Dispositivos micro-electromecanicos . . . . . . . . . . . . . . . 1016.2. Aspectos mecanicos comparativos . . . . . . . . . . . . . . . . 1046.3. Modelo fısico . . . . . . . . . . . . . . . . . . . . . . . . . . . 1066.4. Puntos de equilibrio . . . . . . . . . . . . . . . . . . . . . . . . 107

6.4.1. Puntos de equilibrio para el muelle duro . . . . . . . . 1076.4.2. Puntos de equilibrio para el muelle blando . . . . . . . 108

6.5. Analisis del sistema con muelle duro . . . . . . . . . . . . . . 1096.6. Analisis del sistema con muelle blando . . . . . . . . . . . . . 1146.7. Muelle duro con realimentacion del estado . . . . . . . . . . . 1146.8. Analisis del comportamiento caotico . . . . . . . . . . . . . . . 1186.9. Analisis de valores numericos . . . . . . . . . . . . . . . . . . 1216.10. Dinamica impulsiva . . . . . . . . . . . . . . . . . . . . . . . . 128

6.10.1. Motivacion . . . . . . . . . . . . . . . . . . . . . . . . 1286.10.2. Ecuacion fundamental . . . . . . . . . . . . . . . . . . 1306.10.3. Implantacion de ligaduras no holonomas . . . . . . . . 1326.10.4. Ligaduras no persistentes . . . . . . . . . . . . . . . . . 1336.10.5. Sistema de dos masas acopladas . . . . . . . . . . . . . 134

7. Sistema completamente actuado 1397.1. Modelo y ecuaciones de control . . . . . . . . . . . . . . . . . 1397.2. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1517.3. Realimentacion integral . . . . . . . . . . . . . . . . . . . . . . 158

8. Modelo de actuador bidimensional 1638.1. Modelo fısico . . . . . . . . . . . . . . . . . . . . . . . . . . . 1638.2. Servomecanismo LQR . . . . . . . . . . . . . . . . . . . . . . 166

Page 5: Modelado y control de masas acopladas. Aplicación a dispositivos ...

INDICE GENERAL 5

9. Conclusiones y perspectivas 1719.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1719.2. Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

A. Notas historicas 177A.1. Orıgenes del almacenamiento magnetico . . . . . . . . . . . . 177A.2. La crisis de las memorias masivas . . . . . . . . . . . . . . . . 179A.3. Almacenamiento magneto-optico . . . . . . . . . . . . . . . . . 181A.4. Almacenamiento optico y holografico . . . . . . . . . . . . . . 182A.5. Almacenamiento con resolucion atomica . . . . . . . . . . . . 183

B. Ecuaciones basicas del control optimo 185B.1. Planteamiento y ecuaciones basicas . . . . . . . . . . . . . . . 185B.2. Reguladores y servomecanismos . . . . . . . . . . . . . . . . . 187

C. Ecuaciones de la Mecanica analıtica 193C.1. Mecanica vectorial y mecanica analıtica . . . . . . . . . . . . . 193C.2. Coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . 194C.3. El principio de D’Alembert . . . . . . . . . . . . . . . . . . . . 195C.4. Ligaduras holonomas y no holonomas . . . . . . . . . . . . . . 198C.5. Sistemas con funcion potencial . . . . . . . . . . . . . . . . . . 201C.6. Fuerzas disipativas . . . . . . . . . . . . . . . . . . . . . . . . 202

D. Dinamica general del actuador 205D.1. Energıa cinetica . . . . . . . . . . . . . . . . . . . . . . . . . . 205D.2. Energıa potencial y funcion de Rayleigh . . . . . . . . . . . . 206D.3. Ecuaciones del movimiento . . . . . . . . . . . . . . . . . . . . 206D.4. Fuerzas generalizadas . . . . . . . . . . . . . . . . . . . . . . . 208

Page 6: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6 INDICE GENERAL

Page 7: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Indice de tablas

3.1. t1 para distintos α y n . . . . . . . . . . . . . . . . . . . . . . 50

9.1. Familia de problemas investigados . . . . . . . . . . . . . . . . 172

7

Page 8: Modelado y control de masas acopladas. Aplicación a dispositivos ...

8 INDICE DE TABLAS

Page 9: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 1

Objetivos y alcance de estatesis

1.1. Interes del modelo objeto de esta tesis

El pendulo debe su ubicuidad en la Fısica al hecho de que es una re-presentacion simple del estado de muchos sistemas en las proximidades delequilibrio. No es de extranar que pueda encontrarsele desde los textos deMecanica elementales hasta trabajos mas avanzados sobre simulacion y con-trol de pendulos acoplados con comportamiento caotico. De igual forma, lasdistintas variantes de pendulos se utilizan para la demostracion de tecnicasintermedias y avanzadas, en mecanica y control de sistemas hamiltonianos.

De igual forma, los sistemas de masas acopladas ilustran la posibilidadde modelar distintos dispositivos que aparecen en la tecnica y la ingenierıamodernas. Esta tesis se centra precisamente en el modelado analisis y controlde sistemas de masas acopladas, incluyendo la posibilidad de no linealidadesen el acoplamiento elastico de las masas. A continuacion se exponen algunossistemas que se han modelado utilizando masas acopladas.

El modelo de la Figura 1.1 ha sido discutido en [26] y [27] en relacion conla respuesta dinamica de edificios sometidos a seısmos. El edificio se modelacomo un conjunto de masas con acoplamiento elastico-viscoso, y se estudia elcontrol de las sacudidas sısmicas acoplando edificios con frecuencias propiasdiferentes.

En otro contexto, el de la ingenierıa minera, en [20] se propone un modelodinamico a partir de dos masas acopladas para estudiar y tratar de controlar

9

Page 10: Modelado y control de masas acopladas. Aplicación a dispositivos ...

10 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

Figura 1.1 Modelo para edificio sometido a sacudida sısmica.

las vibraciones de la dinamica torsional de una sarta de perforacion, pro-blema que tambien se trata, entre otros, en [21], [22], [23] y [24]. La Figura1.2 representa dicho modelo, que incluye friccion torsional y friccion viscosaen los extremos de la sarta, a su vez modelados como discos homogeneoscon momentos de inercia Ia e Ib. Un modelo similar sirve para modelar elcomportamiento de un disco duro de altas prestaciones, como se discute en[13].

Un caso particularmente interesante lo provee la biomecanica, que se ocu-pa desde hace tiempo del modelado del cuerpo humano, de forma que sepueda simular de forma realista su comportamiento, por ejemplo durante lamarcha o su respuesta frente a impactos. En [25] se discute el modelo quereproducimos en la Figura 1.3.

Muchos ejemplos pueden obtenerse de la tecnica de automocion. Los vehıcu-los pueden modelarse como un conjunto de solidos acoplados mediante fuerzasrestauradoras y disipativas. Considerese por ejemplo la relacion dinamica

Page 11: Modelado y control de masas acopladas. Aplicación a dispositivos ...

1.1. INTERES DEL MODELO OBJETO DE ESTA TESIS 11

Ia

Ib

β1

β2

k1

k2

Figura 1.2 Modelo para una sarta de perforacion.

entre una carrocerıa autoportante y el chasis sobre el que se apoya. Partesmecanicas esenciales tambien se modelan mediante acoplamiento de masas,bien con dinamica lineal en el caso de los sistemas de amortiguacion, o condinamica torsional, como ocurre con los arboles de transmision.

La robotica provee sistemas con dinamica similar, como cuando se modelauna articulacion mediante un par restaurador que depende del angulo relativoentre las secciones que une y una disipacion que depende de la velocidadangular entre dichas secciones. Vease por ejemplo [28].

La Fısica Teorica se ha ocupado desde hace mucho de la respuesta deestructuras periodicas, que se modelan adecuadamente mediante retıculas demasas unidas por elementos elasticos, modelos que han sido consideradostanto desde el punto de vista clasico, como en [29], como desde el punto devista cuantico, vease [30]. No obstante, estos modelos suelen tratarse comosistemas autonomos, mientras que a nosotros nos interesa el control que puedeejercerse sobre ellos.

Page 12: Modelado y control de masas acopladas. Aplicación a dispositivos ...

12 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

Cabeza

Torso

AbdomenBrazos

Figura 1.3 Modelo para el cuerpo humano.

Nuevas oportunidades de analisis aparecen continuamente. En [31] se dis-cute el control que puede ejercerse sobre una cadena lineal de masas acopladas,y se aplica una tecnica novedosa. En este caso, como en otros muchos rela-cionados con el movimiento pendular, es interesante disponer de modelosmecanicos sencillos que no obstante exhiban una dinamica rica y capturenel comportamiento de una amplia variedad de dispositivos de la tecnica y laingenierıa de la forma mas precisa posible.

En [6], [10], [18] y [19] se discuten modelos para sistemas de almacenamien-to micro-electromecanicos. Mas adelante se dara una descripcion mas detalla-da de estos sistemas, en el contexto de los dispositivos para almacenamientode informacion, pero ahora nos interesa solo resaltar el hecho de que unmodelo fısico tan sencillo como el de una sola masa sometida a una fuerza

Page 13: Modelado y control de masas acopladas. Aplicación a dispositivos ...

1.2. OPORTUNIDAD DE LA TESIS 13

restauradora y otra disipativa es suficiente para capturar la dinamica rele-vante.

1.2. Oportunidad de la Tesis

La oportunidad de esta Tesis se centra en dos vertientes:

1. Los problemas planteados de modelado simulacion y control de dis-positivos formados por masas acopladas utilizando tecnicas de controloptimo y utilizacion del posible comportamiento caotico para disenarsistemas de control eficientes cuando las masas involucradas son muypequenas, tal como sucede en los dispositivos micro electromecanicosde almacenamiento masivo.

2. El inicio de una nueva lınea de investigacion en control optimo y controlno lineal en la Universidad de Alicante.

Ya se presentaron en la seccion anterior un muestrario de sistemas que hansido objeto de interes en sus respectivos campos: desde las vibraciones de unasarta de perforacion hasta un modelo biometrico para cuantificar el impactode un puno cerrado contra un bloque. Es oportuno por tanto este trabajo enel sentido de que establece una plataforma analıtica comun para el estudiode esta heterogeneidad de sistemas, extrayendo en cada campo en particularla parte dinamica esencial y dando a todas ellas un tratamiento unificado,con una notacion coherente y un mismo metodo.

Partiendo de la plataforma analıtica que se va a construir, se explora untipo particular de sistemas que atraen la atencion de centros de investigaciony empresas desde hace tiempo. A saber, los sistemas de almacenamientobasados en dispositivos micro-electromecanicos. Se vera mas adelante que elmismo esquema general que permite modelar y analizar el control de sis-temas heterogeneos, permite tambien profundizar en el comportamiento deestos dispositivos, y ası se analizara la influencia que sobre la dinamica y elcontrol tiene la integracion de estos dispositivos en aparatos portatiles, comotelefonos moviles.

A la vista de los problemas planteados, el control optimo es lo suficiente-mente flexible para acomodarse a los propositos de la siguiente investigacion,ya que:

Page 14: Modelado y control de masas acopladas. Aplicación a dispositivos ...

14 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

1. Enlaza a traves del calculo de variaciones con ramas de la Fısica quese apoyan en esta misma rama del Analisis, como la Mecanica.

2. Se adapta igualmente bien a sistemas de una entrada y una salida y asistemas con multiples entradas y salidas.

3. Permite al menos plantear de forma consistente tanto los problemaslineales como los no lineales, y se adapta bien en aquellos casos en quese quieran obtener soluciones analıticas o semi-analıticas de sistemasno lineales a partir de sistemas lineales mas simples.

4. Permite integrar en la fase de diseno, pero sin condicionar el desarrolloposterior, requerimientos propios de fases mas avanzadas, como costede la implementacion o grado de precision requerida en el control, y esosimplemente eligiendo distintas formas de la funcion de coste y distintascondiciones de contorno.

Se tiene por tanto una familia de problemas que abarca distintas condi-ciones de contorno y funciones de coste. Esta familia no es exhaustiva, peroconsideramos que suficientemente representativa, como se comprobara a par-tir de la Tabla 9.1. No obstante, hay un rasgo comun compartido por casitodos los problemas tratados aquı, y es el hecho de que son sistemas subac-tuados. En efecto, a diferencia de otras muchas descripciones teoricas, en estatesis se presentan los sistemas de masas acopladas sometidas a un esfuerzode control.

Ademas del control optimo, en esta tesis se presenta un metodo novedosopara controlar sistemas de masas acopladas con muelle no lineal utilizandocomo modelo de referencia el oscilador de Duffing. A partir de este sistemase estudia el comportamiento caotico, el cual se utiliza de forma ventajosapara posicionar dispositivos MEM.

Por consiguiente, este trabajo:

1. Extrae la dinamica comun a una amplia variedad de modelos usados enmuchos lugares de la tecnica y la ingenierıa, y provee un marco generaldonde considerar a todos ellos.

2. Estudia el control de estos sistemas, y para ello considera idoneo el con-trol optimo y el posible comportamiento caotico de masas con acopla-miento no lineal.

Page 15: Modelado y control de masas acopladas. Aplicación a dispositivos ...

1.3. NATURALEZA Y CONTENIDOS DE ESTA TESIS 15

1.3. Naturaleza y contenidos de esta Tesis

A continuacion se describe el plan y contenidos del trabajo realizado capıtu-lo por capıtulo a partir del segundo.

Capıtulo segundo. En este capıtulo se presenta un primer modelo paraun actuador formado por dos masas acopladas elasticamente y con disipacionviscosa. Existen en la bibliografıa dos tendencias extremas. Por una parte, en[6] podemos encontrar un modelo extremadamente sencillo para un actuador,y de una sola masa y por tanto completamente actuado, lo que quiere decircompletamente rıgido, mientras que en [18] se sigue el camino de modelar me-diante elementos finitos uno de estos dispositivos, simular su comportamientoy a partir de los datos de las simulaciones extraer los parametros fısicos paraajustar modelos mas sencillos. Por el contrario en esta tesis se propone unmodelo que siendo sencillo puede representar bien la dinamica que nos intere-sa. Al considerar dos masas acopladas y subactuadas estamos extendiendo elintervalo de aplicacion de un modelo que en caso lımite coincidira con el deuna sola masa.

En la seccion 2.2 se vuelve a justificar el uso del control optimo, con ar-gumentos distintos a los usados anteriormente, y se concluye que se trata desentar las bases de diseno para una variedad de requerimientos: autonomıa,velocidad de respuesta, precision, coste.

Enseguida se pasa a exponer el modelo analıtico: de las ecuaciones de La-grange a la introduccion de variables de estado, y de ahı al calculo, tan engor-roso como necesario, de la matriz de transicion de estados. Inmediatamentese plantea y se resuelve el problema del control optimo para una funcionde coste energetica y se obtiene una solucion analıtica para el control u(t).De las simulaciones se desprende la posibilidad de realizar un control bang-bang, que en determinados dispositivos podrıa resultar una opcion economicay suficiente, por el abaratamiento en los actuadores y en el propio sistemade control. Investigando este punto llegamos al primer resultado relevante:es imposible la existencia de un control de este tipo, afirmacion que se de-muestra en la seccion 2.6. La afirmacion de esta imposibilidad conduce a lapregunta natural de cuanto es posible acercarse al punto de consigna me-diante un control bang-bang. Esta discusion cierra el capıtulo segundo. Porotra parte, en las mismas simulaciones se observa la dependencia acusadaentre la energıa consumida en el proceso y la rigidez del sistema, haciendovisible la dependencia analıtica con la rigidez k que se encierra en la expre-

Page 16: Modelado y control de masas acopladas. Aplicación a dispositivos ...

16 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

sion hallada para u(t) a traves de la matriz de transicion de estados, lo quejustifica el calculo que ocupa la primera parte del capıtulo.

Capıtulo tercero. Es natural despues del capıtulo anterior ampliar lafuncion de coste con un termino cuadratico en el vector de estado, y este esel trabajo acometido en este tercero, que sin duda es mas denso. Los puntosde interes del capıtulo se resumen a continuacion:

1. Se consideran tanto los reguladores como los servomecanismos.

2. La discusion se completa comparando los resultados obtenidos, al menosparte de ellos, con la implementacion discreta que proporciona la pro-gramacion dinamica.

3. Se considera una serie de condiciones de contorno, cada una de ellasapropiada para circunstancias especıficas.

4. Para llevar algo mas alla el objeto del capıtulo ( ampliar la funcion decoste con un termino cuadratico en el estado ) consideramos la funcionde coste tiempo-energıa.

5. Se considera la influencia en el control de la adicion de un terminode Mayer, pensando en aquellas implementaciones con requerimientosestrictos sobre el estado final del sistema.

Respecto al trabajo computacional, hay que destacar:

1. Con condiciones de contorno estrictas, cuando disminuye el factor quepondera el control, lo que conlleva valores mayores para este, aumentaun intervalo de tiempo en el que el esfuerzo de control toma valoresmuy pequenos, mientras que los mayores esfuerzos se concentran enlos extremos del intervalo. Esta tendencia se agudiza, acercandose alcontrol que se obtiene mediante programacion dinamica. Sin embargo,el control continuo conduce bruscamente a oscilaciones crecientes delsistema cerca del punto de consigna.

2. Cuando el tiempo final se deja libre, no ası el estado final, el controloptimo con funcion de coste LQR no puede conducir al sistema, comose justifica al final de la seccion 3.2. La discusion que aquı aparecejustifica el ensayo de una funcion de coste tiempo-energıa con condicionde Mayer. Los calculos y simulaciones de la seccion 3.4.1 conduce alhecho significativo de que existe una relacion muy definida entre el

Page 17: Modelado y control de masas acopladas. Aplicación a dispositivos ...

1.3. NATURALEZA Y CONTENIDOS DE ESTA TESIS 17

tiempo en que se puede alcanzar el punto de consigna y el factor quepondera el esfuerzo de control en la funcion de coste. La seccion 3.5extiende la discusion de la 3.4.1 al caso del servocontrol.

3. El analisis del servocontrol con funcion de coste LQR y condiciones decontorno que dejan libres tanto el estado final como el tiempo en quese alcanza demuestra que:

La ecuacion diferencial de Ricatti no puede sustituirse por su ver-sion algebraica.

La norma de la matriz P y el esfuerzo de control u(t) varıan deforma aproximadamente lineal.

El error en el extremo del servo tiene un comportamiento muysatisfactorio.

Capıtulo cuarto. Este es el capıtulo donde se introduce un acoplamientono lineal entre las masas. El planteamiento de las ecuaciones del movimientoy la introduccion de variables de estado conduce a la ecuacion (4.5), queresume la no linealidad en la aparicion de un vector dependiente del estado. Elprimer problema de control que planteamos aquı es el del regulador de energıamınima con condiciones de contorno completas, y nuestro plan consiste enencontrar un procedimiento iterativo que permita, a partir de la solucion parael sistema lineal, encontrar tanto el estado como el control para el sistemano lineal con la precision que se desee. Es elocuente en este sentido la Figura4.1, que demuestra la rapida convergencia del metodo que se propone.

Podrıamos preguntarnos si esta convergencia es debida a las particularescondiciones de contorno que se han elegido, y esta es la razon por la que enla seccion siguiente nos ocupamos de relajarlas parcialmente, dejando libreel estado final pero obligatoriamente entonces introduciendo un termino deMayer. Llegados a este punto, es importante darse cuenta de la extensibilidaddel metodo de aproximaciones sucesivas que acabamos de desarrollar, y ası elcapıtulo termina con una discusion del regulador con dinamica no lineal yfuncion de coste LQR.

El otro punto significativo en el desarrollo de este capıtulo es el estudio delefecto de una perturbacion acimutal sobre el sistema que desea controlarse.Formalmente, el sistema viene descrito por una ecuacion no homogenea, nolineal, como la citada (4.5), con la diferencia de que ahora la matriz del sis-tema A es una funcion del tiempo, invalidando la herramienta que hemos

Page 18: Modelado y control de masas acopladas. Aplicación a dispositivos ...

18 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

usado en el resto del trabajo. Por consiguiente se realiza en primer lugarun estudio analıtico que parte de las ecuaciones (4.55), (4.59) Y (4.60) yen segundo la implementacion de los algoritmos computacionales que nosconduzcan al control deseado. La Figura 4.4 representa el control que es pre-ciso aplicar, pero la consecucion de esta grafica ha requerido el diseno deun algoritmo basado en el metodo del gradiente pero con un paso variabledinamicamente que se ha mostrado especialmente robusto, pues puede recu-perarse de ciclos divergentes, autocorrigiendose y conduciendo finalmente alresultado deseado.

Capıtulo quinto. En este capıtulo se amplıa el rango de aplicabilidaddel modelo estudiado en el capıtulo tercero. En efecto, se trata de acoplar elactuador a un dispositivo contenedor y estudiar el control que puede ejercersesobre el actuador cuando sobre el contenedor actuan perturbaciones generic-as, que nosotros pronto particularizamos a dos posibles: entradas en escalony perturbaciones armonicas de diferentes frecuencias. Los resultados que seobtienen aquı son de aplicacion directa a los DMEM. Tras plantear las ecua-ciones del movimiento e introducir las variables de estado, estudiamos lasfunciones de coste tiempo-energıa y LQR con distintas condiciones de con-torno. Los dos puntos mas interesantes en este capıtulo son:

1. La resolucion numerica de la condicion de contorno H(t)=0 para el regu-lador con funcion de coste tiempo-energıa, donde se ve la dependenciaacusada y peculiar entre el tiempo en que puede alcanzarse el punto deconsigna y la frecuencia de la perturbacion que afecta al contenedor.

2. La discusion de como un campo de aceleracion que afecte tanto alcontenedor como al actuador no modifica formalmente el problema.

Capıtulo sexto. Este capıtulo se centra en los DMEM. Se hace una in-troduccion detallada a estos dispositivos y se comparan con los dispositivosconvencionales antes de entrar en el trabajo analıtico, que comienza por laformulacion de las ecuaciones del movimiento. El plan que nos proponemosa partir de aquı abarca este capıtulo y el siguiente. Este tratara sobre aspec-tos de la dinamica, especialmente de los puntos de equilibrio, que requierenuna larga discusion que dara paso despues al analisis del control por reali-mentacion de estado. Siguiendo los resultados obtenidos en sistemas termicos,modelados a traves de balances de materia y energıa [77], ası como en dis-positivos electromecanicos [78], se estudia las condiciones bajo las cuales esde esperar comportamiento caotico del sistema de masas acopladas, a travesdel metodo de Melnikov, unico que permite encontrar condiciones necesarias

Page 19: Modelado y control de masas acopladas. Aplicación a dispositivos ...

1.3. NATURALEZA Y CONTENIDOS DE ESTA TESIS 19

para la aparicion de caos. Se completa la exposicion con un analisis, en laseccion 6.9, de los valores numericos propios de los DMEM.

Puesto que este capıtulo trata esencialmente de la dinamica de los DMEM,se ha completado con un estudio de la dinamica impulsiva. El metodo de lafuncion de transferencia permite encontrar la respuesta de sistemas de unaentrada y una salida ante entradas impulsivas, pero no puede extendersede forma natural para sistemas de muchas entradas y muchas salidas. Ladinamica analıtica nos provee de las herramientas precisas para estudiar larespuesta impulsiva del sistema. Son frecuentes discusiones sobre dinamicaimpulsiva que se basan en estimaciones de las deformaciones y a partir deahı de las aceleraciones y los impulsos. Lo cierto es que la mecanica analıticatrata el problema de forma mucho mas general y elegante, eliminando lanecesidad de hacer estimaciones. Estas ventajas se discuten en la seccion 6.10,donde asimismo se presentan las ecuaciones basicas de la dinamica impulsiva,aplicandolas finalmente a nuestro sistema y obteniendo como resultado unsistema lineal de seis ecuaciones que relaciona las coordenadas y velocidadesgeneralizadas antes y despues del impulso, cuando el movimiento es bidi-mensional. Siendo como es esta seccion una simple aplicacion, tiene un dobleinteres. Primero, porque es extremadamente infrecuente en la bibliografıa en-contrar resueltos problemas de dinamica impulsiva; segundo, porque de estaforma completamos nuestra vision sobre el sistema de masas acopladas.

Capıtulo septimo. Este capıtulo puede considerarse la extension del an-terior, centrado en aspectos dinamicos, para tratar del control. Aquı se pro-pone un esquema de control basado precisamente en que el sistema puedealcanzar un regimen caotico. La idea es sencilla: puesto que en el sistemapuede instaurarse un regimen caotico, y puesto que una orbita caotica cubredensamente el espacio de fases, una estrategia posible consiste en simplementeesperar a que el sistema quede lo suficientemente cerca del punto de consignay entonces aplicar un control que saque al sistema del regimen caotico y loconduzca al estado final deseado con poco esfuerzo.

Conseguimos este proposito actuando completamente el sistema, pero noqueremos excluir el control subactuado, pues este refleja bien la flexibilidadpresente en sistemas reales, y por eso se termina este capıtulo estudiandoel control subactuado con realimentacion integral. En nuestro deseo de es-tablecer la plataforma analıtica para los DMEM, hemos tratado con masas,distancias y velocidades correspondientes a sistemas microscopicos.

Page 20: Modelado y control de masas acopladas. Aplicación a dispositivos ...

20 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

Capıtulo octavo. Termina este trabajo con una extension del modeloque se viene considerando a dos dimensiones. Esencialmente solo se encon-trara aquı un punto de interes, y es la formulacion explıcita del modelo quese hace en la primera seccion. La segunda seccion usa este para calcularel servocontrol. Es evidente que podrıan reproducirse todos los calculos decapıtulos anteriores con el nuevo modelo. Queda pues este capıtulo como in-dicando una posible vıa de expansion para el futuro, si decidiesemos tomarcomo objeto de estudio alguna de las implementaciones de sistemas MEMque las empresas punteros en este campo barajan en este momento.

Apendices. Finalmente, y tras el capıtulo de conclusiones, nos ha parecidooportuna la inclusion de unos pocos apendices. El primero pone a los DMEMen su contexto respecto a los medios de almacenamiento a los que pretendesustituir o al menos servir de alternativa, y para ello desarrolla a modo depequeno ensayo su historia durante el ultimo siglo, completandolo con unasbreves resenas sobre otras tecnologıas emergentes, como el almacenamientoholografico o de resolucion atomica.

Dos apendices adicionales tratan sobre las ecuaciones basicas del con-trol optimo y la mecanica analıtica. Hemos buscado en ellos concision ygeneralidad, como cuadra a las pocas paginas de un apendice. El ultimoapendice esta dedicado a deducir las ecuaciones mas generales de un sistemade dos masas acopladas que puede moverse en tres dimensiones. De hecho,demostramos como las ecuaciones que hemos usado son casos particulares deestas mas generales.

1.4. Aportaciones novedosas

Sin perjuicio de los puntos que se han presentado en la seccion anteriorcomo relevantes para cada capıtulo, ni de la exposicion mas detallada que seencuentra en la presente memoria de dichos capıtulos, quisieramos destacarunas pocas aportaciones relevantes y novedosas de esta tesis, que puedencalificarse ası tras la correspondiente revision bibliografica y con la relativareserva sobre los lımites hasta donde nos es dado conocer sobre un tema quese encuentra disperso en una variedad de campos.

1. Demostracion de la imposibilidad de que un control bang-bang conduz-ca al sistema que consideramos hasta el punto de consigna.

Page 21: Modelado y control de masas acopladas. Aplicación a dispositivos ...

1.4. APORTACIONES NOVEDOSAS 21

2. Desarrollo de algoritmos iterativos para encontrar la evolucion temporaly el control necesario para distintas condiciones de contorno cuandoexiste acoplamiento no lineal entre las masas.

3. Desarrollo de un algoritmo robusto derivado del metodo del gradientepara encontrar el control optimo para un sistema no lineal. Este algo-ritmo puede de hecho recuperarse de ciclos divergentes, conduciendo alresultado deseado.

4. Analisis e implementacion de un algoritmo de control que aprovecha laaparicion de caos en el sistema, y que constituye una ampliacion respec-to a los resultados obtenidos en los trabajos [77] y [78] anteriormenteresenados.

Page 22: Modelado y control de masas acopladas. Aplicación a dispositivos ...

22 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

Page 23: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 2

Modelo fısico para el actuador

2.1. El modelo fısico

En [6] puede encontrarse una descripcion del diseno propuesto por laCarnegie Mellon University, y un analisis del modelo propuesto por la Uni-vesity of California Santa Cruz. Este ultimo es un modelo sencillo monodi-mensional que incluye la fuerza de control, la fuerza elastica restauradoray el rozamiento. No obstante, este es un modelo para una sola masa. Eneste trabajo, nosotros hemos considerado el problema mas general del con-trol a traves de un actuador flexible, que hemos modelado mediante dosmasas unidas por un resorte amortiguado. Realizaremos un estudio particu-lar tanto del regulador como del servomecanismo que use un actuador flexiblemonodimensional constituido por dos y por tres masas acopladas, tanto conacoplamiento lineal como con acoplamiento no lineal. Tambien presentaremosun modelo bidimensional servoactuado.

Los modelos que se propondran aquı son modelos dinamicos obtenidos apartir de consideraciones fısicas sobre idealizaciones de DMEM. Sin embargo,es preciso indicar que otros investigadores, vease [18] han seguido un caminoinverso: modelando mediante elementos finitos uno de estos dispositivos yefectuando simulaciones de las cuales extraer los parametros que permitanajustar los datos a modelos dinamicos mucho mas sencillos, como los quepropongo aquı.

Por otra parte, los modelos que aquı se propondran tratan del aspectopuramente mecanico del problema. Existe en marcha sin embargo una lıneade investigacion sobre el modelado del acoplamiento entre las partes mecanicay electronica de DMEM, como se discute por ejemplo en [19].

23

Page 24: Modelado y control de masas acopladas. Aplicación a dispositivos ...

24 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

2.2. El porque del control optimo

Como se ha indicado arriba, los DMEM de almacenamiento estan en losinicios de su andadura, por lo que existen multitud de parametros abiertos.Es de suponer que desde la meseta actual, y conducido por consideracionesde todo tipo, incluidas las economicas, el diseno se ramifique tratando deproducir dispositivos adaptados a usos particulares.

Autonomıa, precision, coste, respuesta dinamica y resistencia a las per-turbaciones externas son algunos factores que incidiran directamente en eldiseno. El control optimo es la herramienta que permite formalizar estosobjetivos de diseno mediante la eleccion de la adecuada funcion de costey condiciones de contorno, vease [3]. Otra ventaja consiste en la adopcionde una notacion matricial compacta, apta tanto para sistemas monodimen-sionales como el descrito en [7] como para sistemas bidimensionales comola arquitectura propuesta por CMU y, en general, para sistemas tanto SISOcomo MIMO 1. Desde el punto de vista practico, esta formulacion matricialde los problemas de control optimo se beneficia de la existencia de softwarede calculo numerico y de control de contrastada eficacia, como Octave 2.

En definitiva, el presente trabajo no se ocupa de la resolucion de un unicoproblema de control, formulado mediante la tecnica del control optimo, sinoque utiliza esta para plantear y resolver un conjunto de problemas, cada unode los cuales incide en unas especiales caracterısticas de diseno.

Ası, en referencia al modelo simple de actuador formado por dos masasunidas por un elemento elastico y un disipador, si se considera preponderanteel coste se ha de estudiar el control bang-bang, mas facil de implementar. Sise considera primordial el consumo energetico del dispositivo, lo que mejo-rara la autonomıa del sistema completo, sera preciso considerar el control confuncion de coste energıa, lo que efectivamente se hace tanto con dinamica li-neal como con dinamica no lineal. Si se busca un balance entre la autonomıay la rapidez de respuesta, una funcion de coste que pondere el tiempo y laenergıa consumida ha de ser estudiada. Cuando se desea una ponderacionentre respuesta adecuada y consumo energetico suele considerarse una fun-cion de coste LQR, que aquı se considera tanto con dinamica lineal como condinamica no lineal.

1En el apendice B se presentan los resultados fundamentales del control optimo, tal ycomo, con algo mas de extension se encuentran en [3] y [49], entre otros

2Version libre del conocido programa Matlab

Page 25: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.2. EL PORQUE DEL CONTROL OPTIMO 25

En cuanto al servomecanismo para el mismo sistema al que nos estamos re-firiendo, consideramos una funcion de coste energıa-tiempo con ponderaciondel estado final y un servo con funcion de coste LQR.

Ademas, es preciso considerar distintas combinaciones de condiciones decontorno, segun el grado de laxitud permitido para el estado final y el tiempoen que se alcanza.

En cuanto al actuador conectado a un sistema fısico que lo contiene, lomodelamos como un conjunto de tres masas. La primera, a la que en el textonos referiremos como md, representa el dispositivo contenedor, y se encuentraunida por un elemento elastico y un elemento disipativo a la masam1, sobre laque se efectua el esfuerzo de control, y a su vez esta ultima se haya unida porotro elemento elastico y un segundo disipador a una masa m2, cuya posicion yvelocidad son las que se quieren controlar. En las secciones correspondientesconsideramos el diseno del regulador con funcion de coste energıa-tiempo,adecuado cuando es preponderante la relacion autonomıa/prestaciones, elregulador con funcion de coste energıa-tiempo, bajo las mismas considera-ciones pero con un termino de Mayer que incremente la precision del estadofinal, y finalmente la funcion de coste LQR, con la que suele alcanzarse unbuen compromiso.

Respecto al modelo bidimensional, tratamos directamente el problema masgeneral del servomecanismo con funcion de coste LQR.

En definitiva, en este trabajo se consideran una veintena de problemas, sen-tando las bases de diseno para una variedad de requerimientos: autonomıa,velocidad de respuesta, precision, coste. Evidentemente, una exploracion ex-haustiva con media docena de funciones de coste distintas, cuatro conjuntosde condiciones de contorno y al menos tres modelos lineales y dos no lineales,mas las perturbaciones que pueden sufrir todos ellos, esta fuera de lugar. Enefecto, el diseno primero puede ramificarse, pero por imperativo economicono se consolidaran mas que unas pocas opciones. Por tanto, hay que tomaresta investigacion como una aproximacion razonable al modelado y control delos DMEM, a la espera de nuevos elementos de juicio que permitan dirigir conprecision el esfuerzo de modelado y diseno de estos sistemas. Pero ademas,como queda dicho arriba, los modelos que aquı presentamos son adecuadospara muchos sistemas, no necesariamente dispositivos MEMS, por lo que noparece necesario cenirse a estos ultimos.

Page 26: Modelado y control de masas acopladas. Aplicación a dispositivos ...

26 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

Una ultima consideracion es pertinente, y es que este trabajo se centra enuna de las fases del proceso completo del diseno de un sistema de control, asabiendas de que consideraciones ajenas a esta fase tienen en ella influencia.Por ejemplo, la ingenierıa de produccion puede introducir restricciones so-bre los actuadores y la electronica de control. El sistema de proteccion antegolpes y vibraciones de los dispositivos que contengan DMEM puede tambiencondicionar fuertemente esta fase de diseno.

En la Tabla 9.1 presentamos un resumen de la familia de problemas quevamos a tratar a lo largo de esta tesis. A ella nos remitimos para presentar elplan que nos disponemos a desarrollar; plan que si no exhaustivo si conside-ramos como una plataforma solida desde donde, segun las circunstancias, lossistemas a considerar y las consideraciones de diseno y operacion pertinentes,orientar futuros esfuerzos.

2.3. Modelo y ecuaciones basicas

Consideraremos un modelo monodimensional, donde el actuador se muevea lo largo del eje y. Introducimos la flexibilidad dividiendo el actuador en dosmasas m1 y m2 separadas mediante un muelle de constante elastica k y unamortiguador de constante β. En el equilibrio, las dos masas se encuentran auna distancia L. Despreciaremos el rozamiento que se produce al desplazarseambas masas y consideraremos solo el efecto del amortiguador, que introduceuna fuerza proporcional a la diferencia de velocidades entre m1 y m2. Elactuador se opera aplicando a m1 una fuerza u dirigida a lo largo del eje y.La masa m2 se mueve por la accion indirecta del muelle y el amortiguador,y por tanto nuestro sistema es subactuado. Si y1 e y2 son las coordenadas dem1 y m2, la energıa cinetica, la energıa potencial y la funcion de Rayleighvienen dadas por

T =1

2m1y

21 +

1

2m2y

22 (2.1)

U =1

2k(y2 − y1 − L)2 (2.2)

F =1

2β(y2 − y1)2 (2.3)

Page 27: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.3. MODELO Y ECUACIONES BASICAS 27

u1

m2

km

O Yy

y2

1

β

Figura 2.1 Sistema de dos masas acopladas.

Como coordenadas generalizadas, tomaremos

q1 = y1

q2 = y2 − y1 − L (2.4)

Sustituyendo:

T =1

2m1q

21 +

1

2m2(q1 + q2)2 (2.5)

U =1

2kq2

2 (2.6)

F =1

2βq2

2 (2.7)

Las ecuaciones del movimiento se siguen de (C.39), considerando que,ademas de fuerzas que derivan de un potencial, existen otras que no:

Page 28: Modelado y control de masas acopladas. Aplicación a dispositivos ...

28 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

d

dt

(∂L

∂q

)− ∂L

∂q+∂F∂q

= Q (2.8)

donde Q es la fuerza generalizada correspondiente a la coordenada gene-ralizada q. Obtenemos:

(m1 +m2)q1 +m2q2 = u

m2(q2 + q1) + kq2 + βq2 = 0 (2.9)

Introduzcamos las variables de estado siguientes:

x1 = q1

x2 = q1

x3 = q2

x4 = q2 (2.10)

con lo que (2.9) puede sustituirse por

˙x =

0 1 0 00 0 k/m1 β/m1

0 0 0 10 0 −Mk/m1m2 −Mβ/m1m2

x+

01/m1

0−1/m1

u = Ax+ bu

(2.11)

donde M = m1 +m2. Introduciendo las cantidades p = k/m1, q = β/m1 yr = M/m2, la matriz A puede ponerse como

A =

0 1 0 00 0 p q0 0 0 10 0 −rp −rq

(2.12)

A partir de aquı, es posible calcular la matriz de transicion de estados. Enprimer lugar, veamos que

Page 29: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.3. MODELO Y ECUACIONES BASICAS 29

(sI−A)−1 =

1/s 1/s2 p/s∆ (p+ qs)/s2∆0 1/s p/∆ (p+ qs)/s∆0 0 (qr + s)/∆ 1/∆0 0 −pr/∆ s/∆

(2.13)

donde

∆ = s2 + qrs+ pr (2.14)

Llamemos β ′ = qr y k′ = pr, y escribamos:

∆ = s2 + β ′s+ k′ = (s+ β ′/2)2 + (k′ − β ′2/4) (2.15)

Nos limitaremos al caso subamortiguado. Es decir, al caso en que

k′ − β ′/4 > 0 (2.16)

o lo que es igual

k >1

4

Mβ2

m1m2(2.17)

Buscamos la matriz de transicion de estados, que es la transformada inversade Laplace de (sI−A)−1. En el calculo de esta transformada inversa aparecenterminos de las formas:

C1(s) =1

s2∆(2.18)

C2(s) =1

s∆(2.19)

C3(s) =1

∆(2.20)

C4(s) =s

∆(2.21)

Page 30: Modelado y control de masas acopladas. Aplicación a dispositivos ...

30 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

Si llamamos γ = β ′/2 y ω2 = k′−β ′2/4, las correspondientes transformadasinversas para las funciones Ci(s) vienen dadas por

C1(t) =1

k′

(t− β ′

k′

)+β ′

k′2C4(t) +

1

k′

(β ′2

k′− 1

)C3(t) (2.22)

C2(t) =1

k′

(1− e−γt cos(ωt)− γ

ωe−γt sen(ωt)

)(2.23)

C3(t) =1

ω

(e−γt sen(ωt)

)(2.24)

C4(t) = e−γt(

cos(ωt)− γ

ωsen(ωt)

)(2.25)

Y ahora pueden escribirse explıcitamente las componentes de la matriz detransicion de estados:

eAt11 = 1

eAt12 = t

eAt13 = pC2(t)

eAt14 = pC1(t) + qC2(t)

eAt21 = 0

eAt22 = 1

eAt23 = pC3(t)

eAt24 = pC2(t) + qC3(t)

eAt31 = 0

eAt32 = 0

eAt33 = qrC3(t) + C4(t)

eAt34 = C3(t)

eAt41 = 0

eAt42 = 0

eAt43 = −prC3(t)

eAt44 = C4(t) (2.26)

De la misma forma, sera preciso tener en cuenta la matriz

Page 31: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.3. MODELO Y ECUACIONES BASICAS 31

−AT =

0 0 0 0−1 0 0 00 −p 0 rp0 −q 1 rq

(2.27)

La matriz (sI− (−AT ))−1 contiene terminos de la forma

D1(s) =1

s2∆(2.28)

D2(s) =1

s∆(2.29)

D3(s) =1

∆(2.30)

D4(s) =s

∆(2.31)

donde ahora

∆ = s2 − qrs+ pr = (s− β ′/2)2 + (k′ − β ′2/4) (2.32)

En funcion de la constantes

a = 2γ/(γ2 + ω2)2

b = 1/(γ2 + ω2)

c = −ad = 4γ2/(γ2 + ω2)2 − 1/(γ2 + ω2) (2.33)

las correspondientes transformadas inversas Di(t) son:

D1(t) = a+ bt + c(eγt cos(ωt) +

γ

ωeγt sen(ωt)

)+d

ωeγt sen(ωt) (2.34)

D2(t) =1

γ2 + ω2

(1− eγt(cos(ωt) +

γ

ωsen(ωt) +

ωeγt sen(ωt)

)(2.35)

D3(t) =1

ωeγt sen(ωt) (2.36)

Page 32: Modelado y control de masas acopladas. Aplicación a dispositivos ...

32 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

D4(t) = eγt cos(ωt) +γ

ωeγt sen(ωt) (2.37)

Ahora podemos escribir explıcitamente los elementos de la matriz de tran-sicion para −AT :

e−AT t11 = 1

e−AT t12 = 0

e−AT t13 = 0

e−AT t14 = 0

e−AT t21 = −te−AT t

22 = 1

e−AT t23 = 0

e−AT t24 = 0

e−AT t31 = pD2(t)

e−AT t32 = −pD3(t)

e−AT t33 = D4(t)− qrD3(t)

e−AT t34 = prD3(t)

e−AT t41 = −pD1(t) + qD2(t)

e−AT t42 = pD2(t)− qD3(t)

e−AT t43 = −D3(t)

e−AT t44 = D4(t) (2.38)

2.4. Regulador de energıa mınima

Consideraremos el control optimo de energıa mınima y tiempo fijo. Elobjetivo es conducir al sistema desde un vector de estado inicial al origen enun tiempo fijo y con un gasto mınimo de energıa. La funcion Hamiltonianapara este problema, tal y como se define en (B.5) es

H = u2 + pT (Ax+ bu) (2.39)

y las ecuaciones del control, como es sabido y se recoge en (B.9) y (B.8)son:

Page 33: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.5. SIMULACIONES Y DISCUSION 33

∂H

∂u= 0 = 2u+ bT p (2.40)

˙p = −∂H∂x

= −AT p (2.41)

De (2.40)

u = −1

2bT p (2.42)

y de (2.41)

p(t) = e−AT tp(0) (2.43)

Pero de la dinamica del sistema

x(t) = eAtx(0)− 1

2

[∫ t

0eA(t−τ) bbT e−AT τdτ

]p(0) (2.44)

Llamando E(t) a la matriz entre corchetes, y particularizando (2.44) parat1:

p(0) = −2E−1(t1)[x(t1)− eAt1 x(0)

](2.45)

de donde

u(t) = bT e−AT tE−1(t1)[x(t1)− eAt1 x(0)

](2.46)

2.5. Simulaciones y discusion

Consideremos el control necesario para conducir al sistema desde el estado

x(0) =

−1000

(2.47)

Page 34: Modelado y control de masas acopladas. Aplicación a dispositivos ...

34 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

hasta

x(1) =

0000

(2.48)

donde las constantes fısicas del problema se han elegido como m1 = m2 =1 Kg, k = 100 N/m, β = 2 Ns/m y L = 1 m. Efectuando una integracionnumerica que proporcione los elementos de la matriz E(t1) y su inversa obte-nemos:

E−1(t1) =

54,8660 −28,5276 −86,0751 −14,393026,3008 −9,5155 −25,0317 −4,640223,0136 −11,6523 27,3983 −21,408912,0240 −4,0136 5,4011 −1,9289

(2.49)

y a partir de aquı

u(t) = 26,3008− 54,8660t+ 54,8660(pD1(t)− qD2(t))

+26,3008(qD3(t)− pD2(t))

+23,0136D3(t)− 12,0240D4(t) (2.50)

En las Figuras 2.2-2.5 no se representan los valores para las variables deestado, sino para las coordenadas y1 e y2 y sus correspondientes velocidades.Las dos primeras representan la posicion y velocidad de m1, y las dos si-guientes la posicion y velocidad de m2. La Figura 2.6 representa el control u(t)y finalmente mostramos la integral para el cuadrado de la energıa en funcionde la constante elastica, en la Figura 2.7. Interesa comparar las Figuras 2.2y 2.4, que representan los desplazamientos de m1 y m2. Vemos como m2

tiene una primera fase de aceleracion y una ultima fase de deceleracion,mientras que durante la mayor parte del tiempo se mueve con velocidad casiconstante. Las oscilaciones inevitables son absorbidas mayormente por m1.La Figura 2.6, que representa el esfuerzo de control, demuestra como estees positivo durante la primera mitad del recorrido, y negativo en la segundaparte. Basicamente pues el control acelera al sistema durante la primeramitad del intervalo de simulacion, y lo frena durante la segunda parte. Estees el mismo comportamiento cualitativo que el que se obtiene si se resuelveel problema de la regulacion de energıa mınima de una sola masa, que es

Page 35: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.6. CONTROL BANG-BANG 35

una funcion lineal que se anula justo en el punto medio del intervalo. Perosobre este mismo comportamiento cualitativo, encontramos logicamente lascorrecciones necesarias para conseguir que la velocidad de m2 se anule a ladistancia de consigna, como puede verse en la Figura 2.5. Tambien merececomentario la Figura 2.7, donde se representa el esfuerzo de control necesarioen funcion de la constante elastica k. Como puede verse, la dependencia delcontrol con este parametro es muy acusada, y crece bruscamente cuandok se hace pequena. La razon es obvia: cuando k es muy pequena la unicaforma de ejercer control sobre m2 es a traves del termino de Rayleigh, quedepende de las velocidades relativas; entonces, es preciso un esfuerzo extrade aceleracion sobre m1 para alcanzar el punto de consigna, en donde deberespetarse la distancia L de equilibrio entre m1 y m2.

2.6. Control Bang-Bang

A la vista del grafico u(t), Figura 2.6, y a tenor de la discusion del mismoen la seccion 2.5, podrıa pensarse en la implementacion de un control bang-bang. Puesto que el control es positivo durante la primera mitad del tiempo ynegativo durante la segunda, parece razonable buscar la regulacion mediantela aplicacion de un control constante y positivo u1 durante la primera mitaddel tiempo y de un control −u1 durante la segunda mitad. Sin embargo, de-mostraremos la imposibilidad de realizar un regulador optimo que conduzcaal sistema al estado final x(t1) = 0. Para ello, demostraremos que no es posi-ble conducir al sistema, bajo ningun criterio de optimalidad, hasta el estadofinal deseado. Sea un instante 0 <= σ <= t1. Durante el intervalo (0, σ)apliquemos el control constante u1, y durante (σ, t1) el control −u1. Sabemosque

x(σ) = eAσx(0) + u1

∫ σ

0eA(σ−τ) bdτ (2.51)

y que

x(t1) = eA(t1−σ)x(σ)− u1

∫ t1−σ

0eA(t1−σ−τ)bdτ (2.52)

Llamando

E(x) =∫ x

0eA(x−τ)bdτ (2.53)

Page 36: Modelado y control de masas acopladas. Aplicación a dispositivos ...

36 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

0 200 400 600 800 1000−1

−0.9

−0.8

−0.7

−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0

Tiempo (milisegundos)

Des

plaz

amie

nto

(met

ros)

Figura 2.2 Posicion de m1 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100;β = 2.

0 200 400 600 800 10000

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Tiempo (milisegundos)

Vel

ocid

ad (m

etro

s/se

gund

o)

Figura 2.3 Velocidad de m1 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100;β = 2.

Page 37: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.6. CONTROL BANG-BANG 37

0 200 400 600 800 10000

0.2

0.4

0.6

0.8

1

1.2

1.4

Tiempo (milisegundos)

Des

plaz

amie

nto

(met

ros)

Figura 2.4 Posicion de m2 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100;β = 2.

0 200 400 600 800 1000−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

Tiempo (milisegundos)

Vel

ocid

ad (m

etro

s/se

gund

o)

Figura 2.5 Velocidad de m2 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100;β = 2.

Page 38: Modelado y control de masas acopladas. Aplicación a dispositivos ...

38 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

0 200 400 600 800 1000−15

−10

−5

0

5

10

15

Tiempo (milisegundos)

Fuer

za (N

ewto

ns)

Figura 2.6 Esfuerzo de control en funcion del tiempo.m1 = m2 = 1 Kg; k = 100;β = 2.

0 50 100 150 2000

0.5

1

1.5

2

2.5

3x 10

4

Constante k (Newtons/metro)

Inte

gral

en

[0,1

] del

con

trol (

New

tons

*seg

undo

)

Figura 2.7∫ 10 u

2(t)dt para un rango de k.m1 = m2 = 1 Kg;β = 2.

Page 39: Modelado y control de masas acopladas. Aplicación a dispositivos ...

2.6. CONTROL BANG-BANG 39

y sustituyendo (2.51) en (2.52) tenemos:

x(t1) = eAt1 x(0) + u1

[eA(t1−σ)E(σ)− E(t1 − σ)

](2.54)

que podemos escribir abreviadamente como

x(t1) = α + u1β(σ) (2.55)

Ahora, la pregunta es si existe una pareja (u1, σ) que hace ||x(t1)|| = 0.Para que se cumpla esta condicion, es preciso que

α2 + 2u1(α.β(σ)) + u21β

2(σ) = 0 (2.56)

Se comprueba inmediatamente que el discriminante de esta ecuacion desegundo grado es mayor o igual que cero solo si

(α.β(σ))2 >= α2β2(σ) (2.57)

Ahora bien, para cualquier valor de σ,

(α.β(σ))2 <= α2β2(σ) (2.58)

Lo cual demuestra la imposibilidad de, dado un σ, encontrar el u1(σ) queconduce al sistema al estado final deseado. Pero, ¿cuanto es posible acercarseal estado final deseado?. Para investigar este punto, escribamos explıcita-mente (2.54) en la forma

x(t1) = eAt1 x(0) + u∫ σ

0eA(t1−τ)bdτ − u

∫ t1−σ

0eA(t1−σ−τ)bdτ (2.59)

con los cambios de variable η = t1−τ en la primera integral, y η = t1−σ−τen la segunda, podemos escribir:

x(t1) = eAt1 x(0)− u[∫ t1−σ

0eAη bdη −

∫ t1

t1−σeAη bdη

](2.60)

y finalmente, efectuando las integrales

x(t1) = eAt1 x(0)− uA−1[2eA(t1−σ) − eAt1 − I

]b (2.61)

Page 40: Modelado y control de masas acopladas. Aplicación a dispositivos ...

40 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

La grafica (2.7) muestra la norma de x(t1) en funcion de σ para u = 2,0N .Puede comprobarse como se alcanza un estado muy proximo al deseado, ycomo el tiempo de conmutacion σ se encuentra, para t1 = 2,0s, ligeramentedespues de t = 1,0s. Hay que senalar tambien que el calculo se ha realizadoperturbando ligeramente la matriz A, que es singular, sustituyendola por

A′ = A +

0 0 0 00 0 0 00 0 0 0ε 0 0 0

(2.62)

donde ε es una cantidad pequena. A′ no es singular, y existe un lımite parax(t1) cuando ε→ 0.

0 50 100 150 2000

0.5

1

1.5

2

2.5

3

3.5

4

Tiempo (segundos*0.01)

Nor

ma

del e

stad

o fin

al

Figura 2.8 ||x(t1, σ)|| en funcion de σ, el instante en que conmuta elcontrol.

Page 41: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 3

Regulacion y servocontrol

3.1. Tiempo y estado final fijos

En este apartado y sucesivos se estudia el modelo monodimensional repre-sentado en la Figura 2.1 cuando se desea controlarlo optimizando diversasfunciones de coste y usando distintas condiciones de contorno.

Consideremos la Hamiltoniana

H = xTQx+ αu2 + pT (Ax+ bu) (3.1)

donde la constante α pondera el esfuerzo de control y la matriz Q laseparacion entre el estado y el origen.

Sabemos, como se muestra en (B.9) y (B.8), que

∂H

∂u= 0 = 2αu+ bT p (3.2)

y que

˙p = −∂H∂x

= −2Qx−AT p (3.3)

que junto con la dinamica del sistema puede formar un estado ampliadode dinamica lineal:

[˙x˙p

]=

[A − 1

2αbbT

−2Q −AT

] [xp

](3.4)

41

Page 42: Modelado y control de masas acopladas. Aplicación a dispositivos ...

42 CAPITULO 3. REGULACION Y SERVOCONTROL

que en forma abreviada escribimos como

˙ξ = Fξ (3.5)

de solucion conocida

ξ(t) = eFtξ(0) (3.6)

Puesto que x y p tienen la misma dimension, dividimos la matriz de tran-sicion en cuatro submatrices cuadradas iguales, y en notacion obvia:

x(t) = eFt11x(0) + eFt

12p(0)

p(t) = eFt21x(0) + eFt

22p(0) (3.7)

Particularizando para t = t1, y conocido el estado final, que es el vectornulo, se encuentra de la primera de (3.7) que

p(0) = −(eFt1

12

)−1eFt1

11x(0) (3.8)

y sustituyendo (3.8) en la segunda de (3.7)

p(t) =[eFt

21 − eFt22

(eFt1

12

)−1eFt1

11

]x(0) (3.9)

y finalmente, de (3.2) y (3.9):

u = − 1

2αbT[eFt

21 − eFt22

(eFt1

12

)−1eFt1

11

]x(0) (3.10)

Notese que hemos obtenido un control en lazo abierto, pero que nada impi-de en la primera de (3.7) tomar p(0) en funcion de x(t) y obtener ası p(x(t))y por tanto el control en lazo cerrado.

Hemos representado el control para tres valores distintos de α, en las Fi-guras (3.1)-(3.3) y como puede apreciarse es bastante insensible respecto aeste parametro. Ası, la primera grafica esta calculada con α = 10, es decir,penalizando relativamente mucho la energıa consumida. La segunda graficase calcula con α = 1, y finalmente la tercera con α = 0,01.

Page 43: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.1. TIEMPO Y ESTADO FINAL FIJOS 43

0 200 400 600 800 1000−30

−20

−10

0

10

20

30

Tiempo (milisegundos)

Fuer

za (N

ewto

ns)

Figura 3.1 Esfuerzo de control cuando α = 10. Parametros:m1 = m2 = 1 Kg; k = 25 N/m;β = 2 Ns/m; Q=I

0 200 400 600 800 1000−30

−20

−10

0

10

20

30

Tiempo (milisegundos)

Fuer

za (N

ewto

ns)

Figura 3.2 Esfuerzo de control cuando α = 1. Parametros:m1 = m2 = 1 Kg; k = 25 N/m;β = 2 Ns/m; Q=I

Page 44: Modelado y control de masas acopladas. Aplicación a dispositivos ...

44 CAPITULO 3. REGULACION Y SERVOCONTROL

0 200 400 600 800 1000−50

−40

−30

−20

−10

0

10

20

30

40

50

Tiempo (milisegundos)

Fuer

za (N

ewto

ns)

Figura 3.3 Esfuerzo de control cuando α = 0,01. Parametros:m1 = m2 = 1 Kg; k = 25 N/m;β = 2 Ns/m; Q=I

Es interesante estudiar el efecto de valores decrecientes de α en el control.Cualitativamente, valores menores de este parametro en la funcion de costeautorizan esfuerzos de control mas elevados. Pero a medida que el esfuerzo decontrol se hace en terminos absolutos mas grande, ocurre que se incremen-ta el intervalo donde el control es practicamente nulo. Este efecto se ponede manifiesto de forma mas clara cuando el sistema es rıgido. Por ejemplo,las graficas (3.4)-(3.5) corresponde a m1 = m2 = 0,4 Kg, k = 2500N/m yα = 0,0040 para la primera y α = 0,0036 para la segunda. La explicacionfısica es sencilla: el sistema ha de ser empujado durante la primera fase yfrenado durante la segunda, y si el control es suficientemente intenso en laprimera parte del recorrido el sistema puede desplazarse por mera inerciadurante parte del mismo, antes de ser frenado. Ahora bien, observamos unaamplitud creciente en las oscilaciones del ultimo tramo del recorrido a me-dida que α decrece. Aparentemente, la accion de control excita al sistema, ycuando la frecuencia de esta excitacion es suficientemente alta se aproximaa la frecuencia natural de oscilacion de las masas acopladas. La resonanciaconduce a desplazamientos mayores de los deseados, que han de compensarsecon esfuerzos de control mayores, y ası sucesivamente.

Page 45: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.1. TIEMPO Y ESTADO FINAL FIJOS 45

0 200 400 600 800 1000−20

−15

−10

−5

0

5

10

15

20

25

Tiempo (milisegundos)

Fuer

za (N

ewto

ns)

Figura 3.4 Esfuerzo de control cuando α = 0,0040. Parametros:m1 = m2 = 0,4 Kg; k = 2500 N/m;β = 2 Ns/m; Q=I

0 200 400 600 800 1000−80

−60

−40

−20

0

20

40

60

80

100

120

Tiempo (milisegundos)

Fuer

za (N

ewto

ns)

Figura 3.5 Esfuerzo de control cuando α = 0,0036. Parametros:m1 = m2 = 0,4 Kg; k = 2500 N/m;β = 2 Ns/m; Q=I

Page 46: Modelado y control de masas acopladas. Aplicación a dispositivos ...

46 CAPITULO 3. REGULACION Y SERVOCONTROL

3.2. Tiempo libre y estado final fijo

Junto con (3.2) y (3.3) ahora tenemos, tal y como se muestra en (B.11)

H(t1) = 0 (3.11)

Pero x(t1) = 0, de manera que (3.11) conduce a p(t1) = 0. Esto a su vez im-plica que el determinante de la matriz de coeficientes en (3.7) ha de ser nulo,lo que constituye una ecuacion en t1. Ahora bien, esta ecuacion esta numeri-camente extremadamente mal condicionada, puesto que el determinante sehace menor que 10−6 en pocas centesimas, del orden de 10−62 al cabo desolo dos segundos y del orden de 10−96 al cabo de diez segundos, y continuabajando monotonamente hasta el lımite en que el computador puede repre-sentar numeros distintos de cero, que se alcanza al cabo de unos 70 segundos.Interpretamos que el objetivo del control de acuerdo con la funcion de costeelegida no puede alcanzarse con estas condiciones de contorno en tiempo fini-to. La razon de este comportamiento es que independientemente del valor deα, puede alcanzarse un estado en el cual el termino xTQx sea despreciablefrente al termino que pondera el gasto energetico. Entonces, puesto que eltiempo final queda libre, la optimizacion del coste se consigue reduciendoel esfuerzo de control. Expresado en terminos llanos: la mejor forma de noconsumir energıa consiste en no producir movimiento, puesto que se disponede un tiempo ilimitado para alcanzar el punto de consigna.

¿ Como podemos interpretar fısicamente este resultado ?. Si la funcion decoste no penaliza directamente el tiempo que el sistema permanece alejadodel punto de consigna, puede suceder que la optimizacion de la funcion decoste se base en el ahorro energetico. Ası, el sistema comienza a moversehacia el punto de consigna, pero cuando la norma del vector de estado essuficientemente pequena, el termino cuadratico en el estado es menor que eltermino energetico, por lo que se reduce el esfuerzo de control y se llega aque el sistema evoluciona muy lentamente hacia el punto de consigna, lo queexplica que no se encuentre un t1 que haga nulo el determinante de la matrizde coeficientes de (3.7), sino valores monotonamente decrecientes con t, perosin llegar a hacerse cero.

3.3. Tiempo fijo y estado final libre

Las mismas ecuaciones basicas conducen a (3.7), con la condicion de con-torno (B.10)

Page 47: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.4. TIEMPO Y ESTADO FINAL LIBRES 47

p(t1) = 0 = eFt121x(0) + eFt1

22p(0) (3.12)

de donde obtenemos p(0) en funcion de x(0) y por tanto x(t) en funcion dex(0), que podemos particularizar para t1 y obtener el estado final. Por otraparte, conocido p(t) tenemos el control:

u = − 1

2αbbT

[eFt

21 − eFt22

(eFt1

22

)−1eFt1

21

]x(0) (3.13)

Ahora bien, notese como el control obtenido en este caso es intrınsecamenteen lazo abierto. Una vez fijado p(t1) = 0, la segunda de (3.7) determina ap(0) en funcion del estado inicial, y por tanto el estado en funcion solo delestado inicial.

3.4. Tiempo y estado final libres

Es facil comprobar como, con la funcion de coste que estamos considerando,

J =∫ t

0

(xTQx + αu2

)dt (3.14)

en este caso recaemos en situaciones anteriores. En particular, vemos quecon condiciones de contorno

p(t1) = 0

H(t1) = 0 (3.15)

obtenemos la condicion x(t1) = 0. Esto es ası incluso ampliando la fun-cion de coste con un termino de Mayer (nomenclatura que se introduce enla primera seccion del Apendice B; el termino de Mayer pondera explıcita-mente el estado final del sistema mediante una matriz M que tiene el mismosignificado que la matriz Q):

φ = xT (t1)Mx(t1) (3.16)

En este caso,

p(t1) = 2Mx(t1) (3.17)

Page 48: Modelado y control de masas acopladas. Aplicación a dispositivos ...

48 CAPITULO 3. REGULACION Y SERVOCONTROL

que sustituida en la segunda de (3.15) conduce a

xT (t1)[Q +

1

αMT bbTM + 2MTA− 2

αMT bbTM

]x(t1) = 0 (3.18)

y recaemos en x(t1) = 0, ya que, en general, la matriz entre corchetes esdistinta de cero.

3.4.1. Coste tiempo-energıa con termino de Mayer

La discusion anterior, y en particular los razonamientos que cierran laseccion 3.2, motiva el ensayo de una funcion de coste de la forma

J =∫ t1

0(1 + αu2)dt+ xT (t1)Mx(t1) (3.19)

con tiempo y estado final libres. Aquı el termino de Mayer es esencial,puesto que de estar ausente, el problema de control carece de sentido: con-sumir la mınima cantidad de energıa sin importar el estado ni el tiempo quese emplee. En estas circunstancias, la solucion optima consiste en no realizaresfuerzo de control alguno. De ahı la necesidad de ponderar de alguna formael estado final. El mismo efecto correctivo se puede conseguir ponderando eltiempo total durante el que se realiza la accion de control, y por eso, en lafuncion de coste propuesta, se incluyen ambos. La Hamiltoniana es

H = 1 + αu2 + pT(Ax+ bu

)(3.20)

y las ecuaciones basicas del control (B.9) y (B.8) tienen las solucionesobvias:

u = − 1

2αbT p (3.21)

p(t) = e−AT tp(0) (3.22)

con condiciones de contorno

p(t1) = 2Mx(t1)

H(t1) = 1 + αu2(t1) + pT (t1)[Ax(t1) + bu(t1)

]= 0 (3.23)

Page 49: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.4. TIEMPO Y ESTADO FINAL LIBRES 49

Sustituyendo la primera de (3.23) en la segunda y teniendo asımismo encuenta (3.21), tras una pequena manipulacion encontramos:

1 + xT (t1)[(

1

α− 2

)MT bbTM + 2MTA

]x(t1) = 0 (3.24)

Pero al mismo tiempo,

x(t1) = eAt1 x(0)− 1

[∫ t1

0eA(t1−τ)bbT e−AT τdτ

]p(0) (3.25)

Escribiendo p(0) en funcion de p(t1) de acuerdo con (3.22) y sustituyendoeste de acuerdo con la primera de (3.23) obtenemos una ecuacion en x(t1),de forma que

x(t1) = F−1(t1)eAt1 x(0) (3.26)

donde

F(t1) = I− 1

αE(t1)

(e−AT t1

)−1M (3.27)

y

E(t) =∫ t

0eA(t1−τ)bbT e−AT τdτ (3.28)

Sustituyendo en H(t1) = 0 obtenemos una ecuacion escalar en t1

1 + xT (0)Jx(0) = 0 (3.29)

con

J =(eAt1

)T (F−1(t1)

)T [( 1

α− 2

)MT bbTM + 2MTA

]F−1(t1)eAt1 (3.30)

La Tabla (3.1) da idea de la forma en que t1 depende de α. Hemos elegidoM = nI y damos algunos valores de t1 para distintos α y dos valores den. Por su parte, la grafica (3.6) representa el primer miembro de (3.29) enfuncion de t.

Page 50: Modelado y control de masas acopladas. Aplicación a dispositivos ...

50 CAPITULO 3. REGULACION Y SERVOCONTROL

Tabla 3.1: t1 para distintos α y n

α = 0,6 0.8 1.0

n = 20 2.649 4.146 4.990

n = 100 3.536 4.986 5.950

0 20 40 60 80 100 120−80

−70

−60

−50

−40

−30

−20

−10

0

10

Tiempo (segundos*0.05)

H(t)

Figura 3.6 H(t) en unidades de 0.05 segundos. Parametros:t = [0, 5];m1 = m2 = 1 Kg;α = 0,8;β = 2 Ns/m; k = 25 N/m; M=20I

Una vez conocido t1 obtenemos x(t1) de (3.26) y de aquı de la primerade (3.23) p(t1) y por tanto p(0) y p(t). Finalmente, conocido este ultimoobtenemos el control u(t) de (3.21).

Una mejor aproximacion al origen se obtiene obviamente cuando la normade M es mayor, puesto que comparativamente pequenas desviaciones delestado final respecto al punto de consigna tienen mayor influencia sobre lafuncion de coste. Por ejemplo, con M = 500I se obtiene, para α = 0,8,t1 = 5,2 y un estado final

Page 51: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.5. SERVOMECANISMO CON COSTE TIEMPO-ENERGIA 51

x(t1) =

0,00060,00460,00030,0023

(3.31)

con una norma ||x(t1)|| = 0,005. Al efectuar la secuencia de calculo comple-ta ( x(t1)→ p(t1)→ p(t0)→ p(t)→ u(t) ), se encuentra el hecho significativode que u(t) es una funcion lineal del tiempo. Pero sabemos que un controllineal es el que puede esperarse del movimiento de una unica masa cuandoquiere llevarse al origen minimizando la energıa, de donde interpretamos queen el caso que estamos estudiando la estrategia optima consiste en actuarsobre el sistema como si de un solido rıgido se tratase, ya que, al quedar libreel estado final y actuar durante todo el proceso el termino de Rayleigh, quedisipa energıa y por tanto atenua el movimiento relativo de las dos masas,prevalece el menor gasto de energıa frente a la desviacion del estado finalrespecto al punto de consigna.

3.5. Servomecanismo con coste tiempo-energıa

Consideremos el servomecanismo de tiempo-energıa mınimo con una fun-cion de coste caracterizada por un termino de Mayer que mide la separaciondel estado final respecto a cierto estado de referencia. En este caso, la Hamil-toniana adopta la forma

H = 1 + αu2 + pT (Ax+ bu) (3.32)

donde α es un factor de ponderacion y la condicion de contorno sobre elmultiplicador de Lagrange se expresa como

p(t1) = 2M(x(t1)− r(t1)) (3.33)

que es la particularizacion al caso que nos ocupa de la ecuacion (B.10).

Supondremos que el estado final es libre, no ası el instante final t1. En-tonces, las ecuaciones del control conducen a

u(t) = − 1

2αbT p(t) (3.34)

Page 52: Modelado y control de masas acopladas. Aplicación a dispositivos ...

52 CAPITULO 3. REGULACION Y SERVOCONTROL

y

p(t) = e−AT tp(0) (3.35)

De (3.33) y (3.35):

p(t1) = e−AT t1 p(0) = 2M(x(t1)− r(t1)) (3.36)

Particularizando (3.35) para t = t1, sustituyendo en esta p(t1) dado por(3.36) tenemos una ecuacion que proporciona p(0); Por otro lado, sustituyen-do p(t) en u(t), y esta en la ecuacion dinamica del sistema y resolviendo elsistema lineal no homogeneo resultante, obtenemos, tras una pequena ma-nipulacion, una expresion para x(t) en funcion de x(t1).

x(t) = eAtx(0)−E(t)(e−AT t1)−1M(x(t1)− r(t1)) (3.37)

con

E(t) =∫ t

0eA(t−τ) bbT e−AT τdτ (3.38)

No queda mas que particularizar la ecuacion anterior para t1 y resolverel estado final x(t1), lo que permite encontrar, sucesivamente, p(0), p(t) yfinalmente u(t).

3.6. Servomecanismo LQR

3.6.1. Tiempo fijo y estado final libre. Ecuacion de Ri-catti

Una funcion de coste lineal cuadratica, con termino de Mayer, conduce auna Hamiltoniana de la forma

H = (x− r)TQ(x− r) + αu2 + pT (Ax+ bu) (3.39)

con condiciones de contorno sobre el co-estado, de acuerdo con (B.10):

p(t1) = 2M(x(t1)− r(t1)) (3.40)

Page 53: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.6. SERVOMECANISMO LQR 53

de donde se siguen las ecuaciones de control y co-estado. Como es sabido:

u = − 1

2αbT p (3.41)

y

˙p = −∂H∂x

= −2Qx + 2Qr −AT p (3.42)

Esta ultima, junto con la ecuacion dinamica, constituyen un sistema linealno homogeneo del que sin embargo se tiene un conocimiento solo parcial delas condiciones de contorno, pues si bien es conocido el estado inicial x(0) sedesconoce p(0). Para soslayar esta dificultad, se suele introducir una relacionlineal entre el estado y el co-estado, de la forma

p = Px+ s (3.43)

Tomando la derivada respecto al tiempo de esta ultima, sustituyendo laecuacion dinamica y el control ( proporcionado por la ecuacion (3.41) ) eigualando a (3.42), se obtiene el sistema de dos ecuaciones diferenciales or-dinarias, no lineales

P + PA− 1

2αPbbTP + 2Q + ATP = 0 (3.44)

y

˙s+(AT − 1

2αPbbT

)s− 2Qr = 0 (3.45)

Ahora bien, de (3.40) se sigue

P(t1) = 2M (3.46)

s(t1) = −2Mr(t1) (3.47)

que permiten integrar (3.44) desde t1 hasta 0, y despues (3.45). Una vezobtenida la secuencia de matrices P y vectores s las ecuacion de la dinamicase reduce a una ecuacion lineal no homogenea con condiciones de contornoen t = 0, de solucion conocida. Finalmente, obtenemos el control u(t).

Page 54: Modelado y control de masas acopladas. Aplicación a dispositivos ...

54 CAPITULO 3. REGULACION Y SERVOCONTROL

0 50 100 150 200 250 300 350 400−3.5

−3

−2.5

−2

−1.5

−1

−0.5

0x 10

−3

Tiempo (segundos*0.05)

Err

or e

n el

ext

rem

o de

l ser

vo (m

etro

s)

Figura 3.7 Error en el extremo del servo. Parametros: m1 = m2 = 1 Kg;α = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

intervalo de 2 segundos.

Se ha elegido como senal de referencia del servo un desplazamiento rıgi-do de las masas m1 y m2, a velocidad constante, hasta alcanzar el origen.Las graficas (3.7)-(3.10) muestran respectivamente el error en el extremo delactuador respecto a la senal del servo, el control aplicado y las normas deP y s. La integracion se ha realizado en un intervalo de 2 s., discretizadoen subintervalos de 0.005 s. y con los valores para los parametros fısicos quese usaron en la seccion 3. Como era de esperar en un sistema de dinamicarapida, la ecuacion diferencial de Ricatti no puede sustituirse por su contra-partida algebraica, como otras veces sucede. Esto puede verse por la acusadavariacion en la norma de la matriz P y del vector s. A su vez, este hechopuede tener implicaciones sobre la implementacion, ya que sera preciso elalmacenaje en el microcontrolador encargado de implementar el control detoda la secuencia de matrices y vectores.

3.6.2. Tiempo libre y estado final fijo

Al considerar el problema del servomecanismo con funcion de coste linealcuadratica, la Hamiltoniana toma la forma conocida:

H = (x− r)TQ(x− r) + αu2 + pT (Ax+ bu) (3.48)

Page 55: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.6. SERVOMECANISMO LQR 55

0 50 100 150 200 250 300 350 400−0.02

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

Tiempo (segundos*0.005)

Fuer

za (N

ewto

ns)

Figura 3.8 Esfuerzo de control u(t). Parametros: m1 = m2 = 1 Kg;α = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

intervalo de 2 segundos.

0 50 100 150 200 250 300 350 4000

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2x 10

5

Tiempo (segundos*0.005)

Nor

ma

de P

Figura 3.9 Norma de la matriz P. Parametros: m1 = m2 = 1 Kg;α = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

intervalo de 2 segundos.

Page 56: Modelado y control de masas acopladas. Aplicación a dispositivos ...

56 CAPITULO 3. REGULACION Y SERVOCONTROL

50 100 150 200 250 300 350 4000

0.2

0.4

0.6

0.8

1

1.2

Tiempo (segundos*0.005)

Nor

ma

de s

Figura 3.10 Norma del vector s. Parametros: m1 = m2 = 1 Kg;α = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

intervalo de 2 segundos.

Las dos ecuaciones del control, junto con la ecuacion dinamica, conducenal sistema

u = − 1

2αbT p (3.49)

˙p = −AT p− 2Qx+ 2Qr (3.50)

˙x = Ax− 1

2αbbT p (3.51)

donde r es la senal de referencia. Las dos ultimas pueden escribirse comouna sola en la forma

˙ζ = Cζ + Ds (3.52)

donde

ζ =

[px

](3.53)

C =

[−AT −2Q− 1

2αbbT p A

](3.54)

Page 57: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.6. SERVOMECANISMO LQR 57

D =

[2Q0

](3.55)

y

s =

[r0

](3.56)

La ecuacion (3.52) tiene la solucion

ζ(t) = eCtζ(0) +∫ t

0eC(t−τ)Ds(τ)dτ (3.57)

Llamando e(t) al vector que resulta de la integral, usando subındices paraindicar las mitades superior e inferior del mismo y las submatrices de lamatriz de transicion de estados y descomponiendo (3.57) en dos ecuacionesvectoriales para el co-estado y el estado:

p(t) = eCt11 p(0) + eCt

12 x(0) + e1(t) (3.58)

x(t) = eCt21 p(0) + eCt

22 x(0) + e2(t) (3.59)

De (3.59) obtenemos

p(0) = (eCt21 )−1

[x(t)− eCt

22 x(0)− e2(t)]

(3.60)

y sustituyendo en (3.58)

p(t) = eCt11

[(eCt

21 )−1[x(t)− eCt

22 x(0)− e2(t)]]

+ eCt12 x(0) + e1(t) (3.61)

Como condiciones de contorno, conocemos el estado final x(t1), aunque elmismo t1 sea desconocido. Pero aun disponemos de la condicion de contorno(B.11), H(t1) = 0 en nuestro caso, que adopta la forma

(x− r)Q(x− r)− 1

4αpT bbT p+ pTAx|t1 = 0 (3.62)

Page 58: Modelado y control de masas acopladas. Aplicación a dispositivos ...

58 CAPITULO 3. REGULACION Y SERVOCONTROL

El punto clave en el algoritmo de resolucion consiste entonces en encontrarel tiempo t1 que satisface la ecuacion anterior. La implementacion obviacomienza entonces eligiendo un t a partir del cual calcular p(0) y por tantop(t), sustituyendo esta ultima en (3.62) y usando algun criterio propio delalgoritmo en particular que se use para hallar la raız se seleccionara un nuevo ty se iterara el proceso, hasta el punto en que H(t) sea menor que una cantidadpequena predeterminada. Una vez conocido t1 la secuencia de calculo consisteen encontrar, sucesivamente p(0), p(t) y u(t).

3.7. Programacion dinamica

Discutiremos en esta seccion la implementacion discreta del sistema decontrol. La tecnica se encuentra descrita en [13] y [14]. Aquı mostraremosen primer lugar el modelo discreto que se deriva de la formulacion continuaque motiva toda la discusion precedente, para a continuacion mostrar laimplementacion discreta basada en programacion dinamica, una tecnica quepara sistemas lineales se revela mas compacta y sencilla de aplicar que laversion discreta de la ecuacion diferencial de Ricatti, tal y como se discuteen [13].

Sabido es que para el sistema lineal

˙x = Ax+ Bu (3.63)

existe la solucion

x(t) = eAtx(t0) +∫ t1

t0eA(t−τ)Bu(τ)dτ (3.64)

y que el mismo sistema, con la notacion habitual, adquiere la forma discreta

xk+1 = Φxk + Γuk (3.65)

donde

Φ = eAT (3.66)

Page 59: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.7. PROGRAMACION DINAMICA 59

y

Γ =∫ T

0eAηBdη (3.67)

donde T es el periodo de muestreo, que aquı tomaremos convencionalmentecomo 10−4s.

Siguiendo a [12] aplicaremos el principio de optimalidad para encontrar elcontrol optimo de un sistema discreto que desea conducirse durante N etapasde forma que se minimize la funcion de coste

J = xTNHxN +N−1∑

k=0

xTkQxk + uTkRuk (3.68)

Elijamos la notacion

JNN = xTNHxN = xTNP0xN (3.69)

y busquemos el control uN−1 que conduce al sistema de la mejor formaposible desde xN−1 hasta xN . El coste en esta operacion es

JN−1,N = xTNP0xN + xTN−1QxN−1 + uTN−1RuN−1 (3.70)

Si usamos la dinamica para escribir xN en funcion de xN−1 y uN−1, desa-rrollamos la expresion resultante y aplicamos el hecho de que uN−1 minimizaa JN−1,N cuando

∂JN−1,N

∂uN−1= 0 (3.71)

encontraremos que

uN−1 = FN−1xN−1 (3.72)

con

FN−1 = −(R + BTP0B

)−1BTP0A (3.73)

Page 60: Modelado y control de masas acopladas. Aplicación a dispositivos ...

60 CAPITULO 3. REGULACION Y SERVOCONTROL

0 50 100 150 2000

0.2

0.4

0.6

0.8

1

1.2

1.4

Tiempo (segundos*0.005)

Des

plaz

amie

nto

(met

ros)

Figura 3.11 Posicion de m2. Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=I;R = 0,0001. La integracion se ha efectuado durante un

intervalo de 1 segundo.

Con este valor para el control, podemos volver al coste JN−1,N y recalcu-larlo. Obtendremos entonces

JN−1,N = xTN−1P1xN−1 (3.74)

con

P1 = ATP0A + ATP0BFN−1 + FTN−1B

TP0A

+FTN−1B

TP0BFN−1 + Q + FTN−1RFN−1 (3.75)

Lo importante aquı es que JN−1,N tiene exactamente la misma forma queJNN , lo que muestra el procedimiento iterativo que hay que seguir para en-contrar sucesivamente JN−2,N , JN−3,N y en general JN−k,N . Conocido P0, lafuncion de coste y la dinamica del sistema, podemos calcular FN−1 . En elsiguiente paso, a partir de P0 y FN−1, calculamos P1 y FN−2 y ası sucesi-vamente. Una vez que dispongamos de las secuencias de matrices Pi y Fi,sustituyendo los ui = Fixi en la ecuacion dinamica obtenemos la secuenciade vectores de estado, y finalmente la secuencia de control.

Page 61: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.7. PROGRAMACION DINAMICA 61

0 50 100 150 200−0.5

0

0.5

1

1.5

2

2.5

Tiempo (segundos*0.005)

Vel

ocid

ad (m

etro

s/se

gund

o)

Figura 3.12 Velocidad de m2. Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=I;R = 0,0001. La integracion se ha efectuado durante un

intervalo de 1 segundo.

0 50 100 150 200−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

Tiempo (segundos*0.005)

Fuer

za (N

ewto

ns)

Figura 3.13 Esfuerzo de control u(t). Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=I;R = 0,0001. La integracion se ha efectuado durante un

intervalo de 1 segundo.

Page 62: Modelado y control de masas acopladas. Aplicación a dispositivos ...

62 CAPITULO 3. REGULACION Y SERVOCONTROL

0 50 100 150 2000

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Tiempo (segundos*0.005)

Des

plaz

amie

nto

(met

ros)

Figura 3.14 Posicion de m2. Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=H=103I;R = 0,0001. La integracion se ha efectuado

durante un intervalo de 1 segundo.

La grafica (3.11) muestra el desplazamiento de m2 frente al tiempo, lagrafica (3.12) muestra la velocidad de m2 frente al tiempo, la grafica (3.13)el esfuerzo de control. Estas graficas se han obtenido con Q = I, R = 0,0001y H = 105I. Finalmente, la grafica (3.14) muestra la posicion de m2 frente altiempo cuando H = 103I y Q = 103I, lo que sugiere que un comportamien-to aceptable mediante este metodo se obtiene cuando el problema se trataesencialmente como un control sobre el estado terminal.

Es interesante observar, por otro lado, como la grafica para el esfuerzo decontrol se asemeja mucho a la que en su momento obtuvimos para el reguladorLQR con condiciones de contorno completas ( tiempo y estado final fijos ),especialmente cuando se toman para el parametro α valores pequenos. Sinembargo, y a pesar de que aquı el factor que pondera el esfuerzo de control,R, es mas pequeno, no observamos la inestabilidad que se producıa allı enlos instantes finales. La diferencia esencial esta en que aquı hemos relajadola condicion de que se alcance exactamente el estado final 0. Ası que, si esposible, ponderando el estado final, conducir al sistema dentro de un entornoarbitrariamente pequeno del punto de consigna, como ocurre cuando se deseaaccionar un DMEM de almacenamiento, esta puede ser una tecnica adecuada.

Page 63: Modelado y control de masas acopladas. Aplicación a dispositivos ...

3.7. PROGRAMACION DINAMICA 63

Observese que, a pesar de los valores macroscopicos elegidos para las masasy la pequenez de R ( para valores mas pequenos de este parametro se autori-zan esfuerzos de control mayores ), los valores que se obtienen para el controlse mantienen en valores muy bajos aun en los entornos de los instantes inicialy final.

Page 64: Modelado y control de masas acopladas. Aplicación a dispositivos ...

64 CAPITULO 3. REGULACION Y SERVOCONTROL

Page 65: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 4

Modelo con acoplamiento nolineal

4.1. Modelo fısico

Consideremos el efecto sobre el control de un termino no lineal en el ele-mento elastico. Este termino modifica a la energıa potencial, de forma queahora

U =1

2k(y2 − y1 − L)2 + µ(y2 − y1 − L)4 (4.1)

donde µ es un parametro pequeno y positivo, es decir, se trata de unmuelle duro. Por su parte, la energıa cinetica y la funcion de Rayleigh no semodifican, de forma que obtenemos las ecuaciones del movimiento:

(m1 +m2)q1 +m2q2 = u

m2(q1 + q2) + kq2 + 4µq32 + βq2 = 0 (4.2)

Introduciendo variables de estado

x1 = q1

x2 = q1

x3 = q2

x4 = q2 (4.3)

65

Page 66: Modelado y control de masas acopladas. Aplicación a dispositivos ...

66 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

tenemos:

x1 = x2

x2 =k

m1x3 +

m1x3

3 +β

m1+

1

m1u

x3 = x4

x4 = − Mk

m1m2x3 −

4M

m1m2µx3

3 −Mβ

m1m2x4 −

1

m1u (4.4)

que en formato vectorial se expresa como:

˙x = Ax+ bu+ d (4.5)

con

A =

0 1 0 0

0 0 km1

βm1

0 0 0 1

0 0 − Mkm1m2

− Mβm1m2

(4.6)

b =

01m1

0− 1m1

(4.7)

d =

04µm1x3

3

0

− 4Mµm1m2

x33

(4.8)

4.2. Regulador de energıa mınima

Estudiaremos la forma en que el termino no lineal d afecta al control, ypara ello consideraremos en primer lugar el regulador de energıa mınima, esdecir, el que resulta de aquella funcion de coste que pondera exclusivamente laenergıa consumida. Como se discutio arriba, este problema carece de sentidosi no se pondera de algun modo el estado final, o si, como es el caso que ahoravamos a discutir, no se dan condiciones de contorno completas. En fin, de ladefinicion de Hamiltoniana (B.5) y la dinamica (4.5):

Page 67: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.2. REGULADOR DE ENERGIA MINIMA 67

H = u2 + pT (Ax + bu+ d) (4.9)

y las ecuaciones del control (Apendice B)

∂H

∂u= 0 = 2u+ bT p (4.10)

˙p = −∂H∂x

= −AT p− ∂

∂x(pT d) (4.11)

Procederemos a resolver estas ecuaciones mediante aproximaciones sucesi-vas, cuando tanto el tiempo final como el estado final se encuentran determi-nados. En la aproximacion de orden cero, µ = 0, y recaemos en el caso linealya estudiado, con d(x) = 0. En particular:

x(t) = eAtx(0)− 1

2E(t)p(0) (4.12)

donde E fue definida en la seccion 2.4 como

E(t) =∫ t

0eA(t−τ) bbT e−AT τdτ (4.13)

Para t = t1, x(t1) = 0, de donde, en la aproximacion de orden cero:

p(0)(0) = 2E−1(t1)eAt1 x(0) (4.14)

x(0)(t) =[eAt − E(t)E−1(t1)eAt1

]x(0) (4.15)

Usaremos la solucion de orden cero para obtener una mejor aproximacion.Partiendo del estado conocido, que suponemos proximo al real, el vector d(x)se transforma en una funcion conocida del tiempo f (0)(t), y se puede escribir:

˙x = Ax+ bu+ f (0)(t) (4.16)

y

H = u2 + pT (Ax+ bu+ f (0)(t)) (4.17)

Page 68: Modelado y control de masas acopladas. Aplicación a dispositivos ...

68 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

Las ecuaciones del control no se modifican, pero sı la solucion de la ecuaciondinamica, que ahora adopta la forma:

x(1)(t) = eAtx(0)− 1

2E(t)p(0) + F (t) (4.18)

con

F (t) =∫ t

0eA(t−τ)f (0)(τ)dτ (4.19)

De nuevo imponiendo que x(1)(t1) = 0:

p(1)(0) = 2E−1(t1)[eAt1 x(0) + F (0)(t1)

](4.20)

y de aquı

u(1)(t) = −1

2bT e−AT tp(1)(0) (4.21)

La generalizacion para una aproximacion arbitraria de orden (n) procedeconocido el estado en aproximacion (n − 1). Entonces, d(x) es una funcionconocida del tiempo que llamaremos f (n−1)(t). La solucion de la ecuacion delmovimiento es

x(n)(t) = eAtx(0)− 1

2E(t)p(0) + F (n−1)(t) (4.22)

Ahora con

F (n−1)(t) =∫ t

0eA(t−τ)f (n−1)(τ)dτ (4.23)

de donde se siguen

p(n)(0) = 2E−1(t1)[eAt1 x(0) + F (n−1)(t1)

](4.24)

p(n) = e−AT tp(n)(0) (4.25)

y

u(n)(t) = −1

2bT e−AT tp(n)(0) (4.26)

Page 69: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.2. REGULADOR DE ENERGIA MINIMA 69

0 200 400 600 800 1000−1

−0.5

0

0.5

1

1.5

2

Tiempo (milisegundos)

Dife

renc

ia 1

2

3 4

Figura 4.1 Convergencia de la iteracion. La curva etiquetada como ’1’muestra la diferencia u(1) − u(0). La curva etiquetada como ’2’ u(2) − u(1). La

curva ’3’ muestra u(3) − u(2) y finalmente la curva ’4’ muestra u(4) − u(3).Parametros: m1 = m2 = 1 Kg; α = 0,01; k = 25 N/m;β = 2 Ns/m;µ = 4 y

Q= I

0 200 400 600 800 10000

0.2

0.4

0.6

0.8

1

1.2

1.4

Tiempo (milisegundos)

Des

plaz

amie

nto

(met

ros)

1

4

Figura 4.2 Elongacion de la masa m2, en orden 1 y en orden 4, comomuestran las etiquetas. Parametros: m1 = m2 = 1 Kg;α = 0,01; k = 25 N/m;β = 2 Ns/m;µ = 4 y Q=I

Page 70: Modelado y control de masas acopladas. Aplicación a dispositivos ...

70 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

Observese que el vector p(0) se calcula cada vez a partir de la condicionx(n)(t1) = 0. La grafica (4.1) da una idea de la convergencia del procedimien-to, mostrando las diferencias u(1) − u(0), u(2) − u(1) y u(3) − u(2) y u(4) − u(3).La grafica (4.2) muestra la elongacion de m2 en aproximaciones de orden (0)y de orden (4).

4.3. Inclusion de un termino de Mayer

Una funcion de coste basada unicamente en la energıa carece de sentido si elinstante final o el estado final quedan libres. En ese caso, es preciso ponderarbien el estado final, bien la historia del sistema mediante un termino quehabitualmente sera una funcion cuadratica del estado.

Consideremos la funcion de coste

J =∫ t1

0αu2dt+ xT (t1)Mx(t1) (4.27)

cuando el instante final t1 es fijo pero no ası el estado final. Sea tambienla dinamica

˙x = Ax+ bu+ d(x) (4.28)

En la aproximacion de orden cero, d = 0 y las ecuaciones del controlconducen a

u(0) = − 1

2αbT p (4.29)

y

p(0)(t) = e−AT

p(0) (4.30)

Se sigue inmediatamente la solucion

x(t) = eAtx(0)− 1

[∫ t

0eA(t−τ) bbT e−AT τdτ

]p(0) (4.31)

Page 71: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.3. INCLUSION DE UN TERMINO DE MAYER 71

Como venimos haciendo, llamaremos E(t) a la matriz entre corchetes enla ecuacion anterior. Que el estado final sea libre, implica la condicion

(p− ∂φ

∂x

)

t1

δx = 0 (4.32)

donde φ es la funcion que pondera el estado final. Se sigue que

p(t1) = 2Mx(t1) = e−AT t1 p(0) (4.33)

y combinando esta ecuacion con la solucion de la ecuacion dinamica:

p(0) =(

1

2M−1e−AT t1 +

1

2αE(t1)

)−1

eAt1 x(0) (4.34)

Conocido el vector p(0) ya es posible conocer p(t), mientras que la fun-cion d(x) se transforma en una funcion conocida del tiempo que llamaremosf (0)(t), que usaremos para buscar la aproximacion de primer orden para elestado. En efecto, sustituyendo f (0)(t) en la ecuacion dinamica:

x(t) = eAtx(0)− 1

2αE(t)p(0) + F (t) (4.35)

con

F (t) =∫ t

0eA(t−τ)f (0)(τ)dτ (4.36)

Particularizando para t1 y teniendo en cuenta que

x(t1) =1

2M−1e−AT t1 p(0) (4.37)

obtenemos

p(0) =(

1

2M−1e−AT t1 +

1

2αE(t1)

)−1 (eAt1 x(0) + F (t1)

)(4.38)

Conocido p(0), obtenemos p(1)(t), y de ahı el control en primer orden, quea su vez permite encontrar el estado. Esta nueva aproximacion puede usarsede nuevo poniendo d(x) = f (1)(t), e iterar el proceso.

Page 72: Modelado y control de masas acopladas. Aplicación a dispositivos ...

72 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

4.4. Efecto de una perturbacion acimutal

En esta seccion consideraremos la dinamica y control del sistema de dosmasas colineales cuando la lınea donde se efectua el movimiento forma unangulo variable con una direccion inercial fija. Pasamos por tanto de unmovimiento unidimensional a uno bidimensional, donde las coordenadas dem1, sobre la que se aplica el control, son x1 e y1 y las de m2, cuya posiciony velocidad quiere controlarse, son x2 e y2. Llamando q1 y q2 a la distanciaentre cada una de estas masas y el origen, existen las relaciones

x1 = q1 cos(θ(t))

y1 = q1 sen(θ(t))

x2 = q2 cos(θ(t))

y2 = q2 sen(θ(t)) (4.39)

1m

2

km

β

θ

q1

q2

Figura 4.3 Actuador sometido a una perturbacion acimutal.

La energıa cinetica es, en el sistema inercial:

T =1

2m1(x2

1 + y21) +

1

2m2(x2

2 + y22) (4.40)

Page 73: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.4. EFECTO DE UNA PERTURBACION ACIMUTAL 73

y a partir de las relaciones (4.39) puede escribirse como

T =1

2m1(q2

1 θ2 + q2

1) +1

2m2(q2

2 θ2 + q2

2) (4.41)

Ahora bien, tanto la energıa potencial como la funcion de disipacion deRayleigh dependen de las coordenadas y velocidades relativas de m1 y m2,por lo que conviene introducir las nuevas coordenadas generalizadas

p1 = q1

p2 = q2 − q1 − L (4.42)

donde L es la distancia de equilibrio de m1 y m2. Con esta ultima transfor-macion de coordenadas, las energıas cinetica, potencial y funcion de Rayleighse escriben como

T =1

2m1(p2

1θ2 + p2

1) +1

2m2((p2 + p1 + L)θ2 + (p1 + p2)2) (4.43)

U =1

2kp2

2 + µp42 (4.44)

F =1

2βp2

2 (4.45)

donde se ha introducido un termino cuartico en la energıa potencial quese traduce en una no linealidad cubica en la fuerza del resorte. Se siguenentonces de (2.8) las ecuaciones del movimiento:

(m1 +m2)p1 +m2p2 −m1θ2p1 −m2θ

2(p2 + p1 + L) = u (4.46)

y

m2p1 +m2p2 −m2θ2(p1 + p2) + kp2 + βp2 = −4µp3

2 +m2Lθ2 (4.47)

Pueden reunirse (4.46) y (4.47) en una unica ecuacion vectorial de la forma

M¨p = l ˙p + k(t)p+ bu+ d(t, x) (4.48)

Page 74: Modelado y control de masas acopladas. Aplicación a dispositivos ...

74 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

donde:

M =

[M m2

m2 m2

](4.49)

l =

[0 00 −β

](4.50)

k(t) =

[Mθ2 m2θ

2

m2θ2 m2θ

2 − k

](4.51)

b =

[10

](4.52)

y finalmente

d =

[m2Lθ

2

m2Lθ2 − 4µp3

2

](4.53)

Si introducimos variables de estado definidas por

x1 = p1

x2 = p2

x1 = p1

x2 = p2 (4.54)

la dinamica puede escribirse como un conjunto de cuatro ecuaciones dife-renciales no lineales con coeficientes dependientes del tiempo:

˙x = A(t)x + bu+ d (4.55)

donde

A(t) =

0 | I−− −−

M−1k(t) | M−1l

(4.56)

Page 75: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.4. EFECTO DE UNA PERTURBACION ACIMUTAL 75

y b y d son ahora los vectores ampliados

b =

[0

M−1b

](4.57)

y

d =

[0

M−1d(t, x)

](4.58)

Observese que la dinamica del sistema es no homogenea debido al terminocentrıfugo, independientemente de que, ademas, existe un termino no lineal.En lo que sigue, investigaremos la dependencia del esfuerzo de control con lafrecuencia de la perturbacion acimutal. Para ello, consideraremos el problemadel regulador LQR con estado final libre y tiempo final fijo, para el que laHamiltoniana se escribe como

H = xTQx+ αu2 + pT (A(t)x+ bu+ d(x, t)) (4.59)

Asımismo, consideraremos un termino de Mayer lineal cuadratico, con ma-triz N, que pondere el estado final. Sea este termino

ϕ(x(t1)) = xT (t1)Nx(t1) (4.60)

Debido a la dependencia temporal de A, no son aplicables los metodosanalıticos conocidos y empleados ya a lo largo de este trabajo, por lo quesera necesario recurrir a metodos numericos. Por su simplicidad conceptualconsideraremos las soluciones a que conduce el metodo del gradiente. Paraaplicarlo, se precisa no obstante una primera aproximacion en el control, quellamaremos u(0)(t). En la busqueda de esta primera aproximacion funcionalpara el control puede usarse una solucion obtenida a partir de una dinamicaaproximada, suficientemente sencilla, o usar cualquier conocimiento de lafısica basica del problema. En nuestro caso, partiremos de unas condicionesiniciales dadas por

x(0) =

1000

(4.61)

Page 76: Modelado y control de masas acopladas. Aplicación a dispositivos ...

76 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

Esencialmente, el conjunto de las dos masas que forman el actuador debeser empujado en direccion al origen durante un cierto intervalo de tiempo, ydespues debe ser frenado. Es facil calcular el control optimo que conduce auna masa de un punto a otro en tiempo fijo y con gasto mınimo de energıa, yeste control es una funcion lineal del tiempo que empuja durante la primeramitad y frena durante la segunda. Con esta simple perspectiva tomemos

u(0)(t) = −12(1− 2t) (4.62)

Una vez fija la funcion para el control, podemos integrar la dinamica delsistema y obtener su historia. De la misma forma, conocida la condicion decontorno p1(t) = ∂ϕ(x(t1))/∂x es posible integrar la ecuacion para ˙p(t) paraobtener la historia p(t). Conocidos el estado y co-estado, que satisfacen susrespectivas ecuaciones, es posible calcular la funcion H en todo instante. SiJ es el coste, sera en general

δJ =∫ t

0

∂H

∂uδudt 6= 0 (4.63)

vease [12]. Entonces, corrigiendo u(t) mediante un δu elegido de la forma

δu = −ε∂H∂u

(4.64)

, donde ε es un numero positivo pequeno, se asegura que δJ <= 0. Elalgoritmo puede iterarse hasta alcanzar un mınimo local para J . Este es elprocedimiento que seguiremos aquı. Por otro lado, la ecuacion del co-estadoqueda, como puede comprobarse:

˙p = −∂H∂x

= −2Qx−AT p− JT p (4.65)

donde la matriz J tiene elementos

Jij =∂di∂xj

(4.66)

Esta es una matriz nula, salvo los elementos

J32 =12µx2

2

m1

(4.67)

Page 77: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.4. EFECTO DE UNA PERTURBACION ACIMUTAL 77

y

J42 = −12µ(m1 +m2)x22

m1m2(4.68)

Para los parametros que intervienen en el problema tomamos los valoresL = 1 m, m1 = m2 = 1 Kg, k = 20 N/m, β = 2 Ns/m, µ = 0,2 N/m3,Q = 10× I, N = I, excepto N11 = 2, α = 1, θ0 = 0,1 y f = 2. Las graficasmuestran respectivamente el esfuerzo de control, la posicion de la masa sobrela que este actua y la posicion del extremo del actuador

0 200 400 600 800 1000−7

−6

−5

−4

−3

−2

−1

0

1

2

Tiempo (milisegundos)

Fuer

za (N

ewto

ns)

Figura 4.4 Control u(t). Parametros: m1 = m2 = 1 Kg;k = 20 N/m;β = 2 Ns/m;µ = 0,2; θ0 = 0,1; f = 2

Es preciso hacer algunas indicaciones sobre el proceso de obtencion deestas graficas. En primer lugar, existen muy pocos metodos numericos lo su-ficientemente robustos como para funcionar bien en cualquier circunstancia,de ahı la existencia de docenas de alternativas. En el caso que nos ocupa,el metodo del gradiente es conceptualmente sencillo de entender, pero re-quiere ajustes manuales para funcionar en cada problema en particular. Ası,comprobamos como la convergencia del metodo depende fuertemente de losfactores siguientes:

La eleccion de la funcion u(0)(t) ha de ser plausible, es decir, bien pro-ceder de la resolucion exacta de una dinamica aproximada, bien tener

Page 78: Modelado y control de masas acopladas. Aplicación a dispositivos ...

78 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

0 200 400 600 800 1000−0.2

0

0.2

0.4

0.6

0.8

1

1.2

Tiempo (milisegundos)

Des

plaz

amie

nto

(met

ros)

Figura 4.5 Posicion de la masa m1. Parametros: m1 = m2 = 1 Kg;k = 20 N/m;β = 2 Ns/m;µ = 0,2; θ0 = 0,1; f = 2

0 200 400 600 800 1000−0.05

0

0.05

0.1

0.15

0.2

Tiempo (milisegundos)

Des

plaz

amie

nto

(met

ros)

Figura 4.6 Posicion de la masa m2. Parametros: m1 = m2 = 1 Kg;k = 20 N/m;β = 2 Ns/m;µ = 0,2; θ0 = 0,1; f = 2

Page 79: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.4. EFECTO DE UNA PERTURBACION ACIMUTAL 79

sentido fısico. Aun cuando nuestra eleccion esta justificada desde elpunto de vista fısico, es preciso ajustar manualmente la pendiente dela recta elegida.

La eleccion de las matrices de peso es crıtica. Las elecciones sencillasQ = nI y N = mI conducen a una convergencia extremadamente lentay a un resultado final inaceptable si no se conjugan con una eleccionadecuada del parametro α.

Encontrar un control que conduzca al sistema hasta un estado finalaceptable requiere tambien de numerosas pruebas, pues existen valorescrıticos en los factores m y n introducidos en el punto anterior porencima de los cuales el algoritmo diverge.

Es preciso algun mecanismo de ajuste dinamico del parametro ε. Si estees muy grande, suele resultar una divergencia del algoritmo. Si es muypequeno, la convergencia, caso de haberla, es extremadamente lenta.En nuestra implementacion, el codigo de ajuste de ε es el siguiente:

% actualizar epsilon

if (bandera==0)

bandera=1;

else

if (ng<ng0)

if (epsilon<0.1)

epsilon=1.2*epsilon;

endif

else

if (epsilon>0.01)

epsilon=0.5*epsilon;

endif

endif

endif

ng0=ng;

% decidir si salgo o no

if (ng<0.1)

break;

endif

En primer lugar, el metodo empleado es un metodo iterativo, quese repite en tanto en cuanto no se de una condicion de parada. La

Page 80: Modelado y control de masas acopladas. Aplicación a dispositivos ...

80 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

condicion elegida es que la integral a lo largo del intervalo de integraciondel gradiente de la Hamiltoniana respecto al control sea menor que unvalor pequeno predefinido. Concretamente:

η =∫ 1

0|∂H∂u|2dt < 0,1 (4.69)

¿Como se alcanza ese valor mınimo ?. Suponemos que el entorno dedicho mınimo es concavo, y actualizamos la funcion u(t) en cada caso enla direccion descendente marcada por el gradiente de la Hamiltoniana.En cada iteracion, se comprueba el valor de η y se compara con elvalor anterior. En el codigo fuente, el valor de la iteracion actual sellama ng, y el de la iteracion anterior ng0. Si resulta que ng < ng0 seprocede a incrementar el valor de ε, nombrado epsilon en el codigofuente, en un 20 %; de esta forma se acelera la convergencia. Pero sila correccion llega a ser muy grande, se dara el caso en que sea ng >ng0, y entonces se procede a reducir ε a la mitad. En cualquier caso,se procura mantener este parametro dentro de margenes razonables.Implementado de esta forma, el algoritmo se muestra relativamenterobusto, pues es capaz de recuperarse de ciclos divergentes y conducira un resultado final aceptable. No obstante, pueden ser precisas cientosde iteraciones. Por ejemplo, las graficas que presentamos en esta seccionrequirieron 197 iteraciones, y cada una de ellas una integracion delestado, en intervalos de 0,001, y otra integracion para el co-estado, conel mismo paso. Como ultimo comentario al codigo fuente, el programaha de saber si se encuentra en la primera iteracion, en cuyo caso carecede sentido la comparacion, o si no es ası: de ahı el uso de un testigollamado bandera.

Evidentemente, este costo computacional aleja el procedimiento decualquier aplicacion en tiempo real, pero no le resta valor al resultadocomo expresion de la cota de optimizacion que podrıa obtenerse porcualquier otro metodo para el mismo conjunto de parametros.

La casuıstica en la obtencion del control optimo para este sistema es tanrica que deja pendiente un estudio numerico exhaustivo que acote, enun espacio de parametros, las regiones desde las que el origen es accesi-ble o no, y esto para conjuntos representativos de condiciones iniciales.Este estudio excede la capacidad computacional de que disponemos enestos momentos, y los lımites autoimpuestos a esta tesis. No obstante,

Page 81: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.5. DINAMICA NO LINEAL CON FUNCION DE COSTE LQR 81

como breve galerıa de comportamientos, citaremos que puede obten-erse convergencia en unas pocas iteraciones, o ser necesarias cientos deellas; que el proceso de convergencia puede ser monotono u oscilante,con intervalos de divergencia, y que esta puede a su vez ser monotonau oscilante. Asımismo, existen valores crıticos para los parametros porencima de los cuales la convergencia es imposible, intervalos para es-tos parametros en que la eleccion de u(0)(t) carece de importancia eintervalos en que esta eleccion es crucial.

4.5. Dinamica no lineal con funcion de coste

LQR

4.5.1. Tiempo y estado final fijos

Consideremos la funcion de coste de la forma

J =∫ t

0

(αu2 + xTQx

)dt (4.70)

En la dinamica de orden cero, es decir, con el termino no lineal nulo, lasecuaciones del control conducen a

[˙x˙p

]=

[A − 1

2αbbT

−2Q −AT

] [xp

](4.71)

como se muestra en (B.19) y (B.20).

Llamando H a la matriz de transicion:

x = H11x(0) + H12p(0)

p = H21x(0) + H22p(0) (4.72)

de x(t1) = 0 se sigue que

p(0) = −H−112 (t1)H11(t1)x(0) (4.73)

y

p(t) =[H21(t)−H22(t)H−1

12 (t1)H11(t1)]x(0) (4.74)

Page 82: Modelado y control de masas acopladas. Aplicación a dispositivos ...

82 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

Entonces es conocido el control u(t),

u(t) = − 1

2αbT p(t) (4.75)

que puede sustituirse en la ecuacion dinamica para obtener la solucion deorden cero, o bien puede usarse la primera de (4.72). En cualquier caso, recae-mos en d(x) = f (0)(t). Podemos ahora emplear la dinamica no homogenea:

[˙x˙p

]=

[A − 1

2αbbT

−2Q −AT

] [xp

]+

[f 0(t)

0

](4.76)

Llamando H a la matriz de transicion y g(0)(t) al termino no homogeneorecaemos en el sistema

x = H11x(0) + H12p(0) + L1(t)

p = H21x(0) + H22p(0) + L2(t) (4.77)

con

L(t) =∫ t

0H(t− τ)g(0)(τ)dτ (4.78)

De nuevo particularizando la primera de (4.77) para el estado y el instantefinales:

p(0) = −H−112 (t1)

[H11(t1)x(0) + L1(t)

](4.79)

y por tanto

p(1)(t) = H21(t)x(0)−H22(t)H−112 (t1)

[H11(t1)x(0) + L1(t1)

]+ L2(t) (4.80)

que proporciona el control u(1)(t). La primera de (4.77) por su parte da elestado en aproximacion de orden 1. El procedimiento puede iterarse sin masque sustituir f 0(t) por f (1)(t), y en general f (n−1) por f (n).

Page 83: Modelado y control de masas acopladas. Aplicación a dispositivos ...

4.5. DINAMICA NO LINEAL CON FUNCION DE COSTE LQR 83

4.5.2. Tiempo fijo y estado final libre

En aproximacion de orden cero, siguen siendo validas las ecuaciones (3.29),pero ahora la condicion de contorno se expresa como

p(t1) = 0 (4.81)

lo que conduce a

p(0) = −H−122 (t1)H21(t1)x(0) (4.82)

y

x(0)(t) =[H11(t)−H12(t)H−1

22 (t1)H21(t1)]x(0) (4.83)

donde hemos indicado explıcitamente que esta es la aproximacion de ordencero. En este mismo orden:

p(0)(t) =[H21(t)−H22(t)H−1

22 (t1)H21(t1)]x(0) (4.84)

y de aquı obtenemos el control. De nuevo, usamos la aproximacion de ordencero para calcular un resultado mejor. Con x(0)(t), d = f (0)(t), y la ecuaciondinamica nos da:

x(1)(t) = eAtx(0)− 1

∫ t

0eA(t−τ) bbT p(0)(τ)dτ +

∫ t

0eA(t−τ)f (0)(τ)dτ (4.85)

mientras que la segunda ecuacion de control tiene la solucion

p(1)(t) = e−AT tp(0)− 2∫ t

0e−AT (t−τ)Qx(1)(τ)dτ (4.86)

Particularizando para t = t1 extraemos el valor de p(1)(0) y por tantotenemos p(1)(t) y de ahı el control en primer orden. El procedimiento puedeiterarse. En general, partiendo de

˙x = Ax− 1

2αbbT p(n−1)(t) + f (n−1)(t) (4.87)

Page 84: Modelado y control de masas acopladas. Aplicación a dispositivos ...

84 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

obtenemos una solucion x(n−1)(t). Entonces:

p(n)(t) = e−AT tp(0)− 2∫ t

0e−AT (t−τ)Qx(n−1)(τ)dτ (4.88)

Imponiendo p(n)(t1) = 0 obtenemos p(n)(0), y de ahı p(n)(t) y u(n)(t).

Concluyendo, en este capıtulo hemos estudiado dos tipos de variantes sobrela dinamica lineal homogenea: el efecto de un termino no lineal en la fuerzadel resorte y el efecto de una perturbacion acimutal. En el primer caso,presentamos un procedimiento iterativo convergente que permite obtener lasolucion para distintas funciones de coste y condiciones de contorno. En elsegundo, aplicamos un metodo numerico para obtener una cota superior alcontrol optimo, y discutimos los problemas numericos y computacionalesasociados.

Page 85: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 5

Acoplamiento a un dispositivomovil

5.1. El modelo fısico

Uno de los destinos mas probables para los DMEM son sistemas moviles,como camaras fotograficas, reproductores de musica, telefonos moviles, etc.En este caso, es de esperar que el funcionamiento de reguladores y servome-canismos que conduzcan a los DMEM se vera fuertemente perturbado poraceleraciones impredecibles. En esta seccion, modelaremos el comportamien-to de reguladores y servomecanismos bajo la accion de estas perturbaciones,acoplando el modelo fısico sencillo presentado en la seccion 2.3 a un marcomovil sometido a aceleracion.

El modelo que proponemos consiste en tres masas colineales md, m1 y m2.La primera representa el anclaje del actuador, y sobre ella se produce unaperturbacion w(t). El acoplamiento entre el anclaje y el actuador viene dadopor una union elastica con disipacion por friccion de constantes kd y βd entremd y m1, que es el extremo del actuador sobre el que se efectua la accion decontrol u(t). El otro extremo del actuador viene representado por m2, a suvez acoplada con m1 mediante una constante elastica k y una constante dedisipacion β. El modelo es por tanto lineal.

Respecto a un sistema de referencia inercial, las coordenadas de las tresmasas son respectivamente yd, y1 e y2, de forma que la energıa cinetica delsistema viene dada por

T =1

2mdyd

2 +1

2m1y1

2 +1

2m2y2

2 (5.1)

85

Page 86: Modelado y control de masas acopladas. Aplicación a dispositivos ...

86 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

mm

k

β

d

d

k

β

md

yd

Y

w u

1 2

y2

1y

Figura 5.1 Actuador acoplado a un bastidor, representado mediante lamasa md.

La energıa potencial es

U =1

2kd(y1 − yd − Ld)2 +

1

2k(y2 − y1 − L)2 (5.2)

donde Ld es la separacion de equilibrio entre md y m1 y L es la separacionde equilibrio entre m1 y m2. Por su parte, la funcion de disipacion de Rayleighes:

F =1

2βd(y1 − yd)2 +

1

2β(y2 − y1)2 (5.3)

Introduzcamos coordenadas generalizadas

qd = yd

q1 = y1 − yd − Ldq2 = y2 − y1 − L (5.4)

Page 87: Modelado y control de masas acopladas. Aplicación a dispositivos ...

5.1. EL MODELO FISICO 87

Escribiendo las coordenadas y en funcion de estas y sustituyendo en (5.1),(5.2) y (5.3), obtenemos

T =1

2(md +m1 +m2)qd

2 +1

2(m1 +m2)q2

2

+(m1 +m2)q1qd +m2(q1q2 + q2qd)

U =1

2kdq

21 +

1

2kq2

2

F =1

2βdq1

2 +1

2βq2

2 (5.5)

Las ecuaciones del movimiento se siguen de (2.8):

Mqd +mq1 +m2q2 = w

mqd +mq1 +m2q2 + kdq1 + βdq1 = u

m2qd +m2q1 +m2q2 + kq2 + βq2 = 0 (5.6)

donde M = md + m1 + m2 y m = m1 + m2. Reescribimos las ecuacionesanteriores en formato matricial:

M¨q + l ˙q + kq = u (5.7)

donde

q =

qdq1

q2

(5.8)

M =

M m m2

m m m2

m2 m2 m2

(5.9)

l =

0 0 00 βd 00 0 β

(5.10)

k =

0 0 00 kd 00 0 k

(5.11)

Page 88: Modelado y control de masas acopladas. Aplicación a dispositivos ...

88 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

y

u =

wu0

(5.12)

Escribiendo (5.7) en la forma

¨q + M−1l ˙q + M−1kq = M−1u (5.13)

e introduciendo variables de estado

x1 = qd

x2 = q1

x3 = q2

x4 = qd

x5 = q1

x6 = q2 (5.14)

es posible escribir

˙x =

0 | I−− −−−M−1k | −M−1l

x +

0−−M−1

u (5.15)

Conviene no obstante separar explıcitamente el control u de la perturbacionw. Como se comprueba facilmente:

˙x =

0 | I−− −−−M−1k | −M−1l

x+

0−−M−1

:2

u+

0−−M−1

:1

w (5.16)

donde X:i indica la columna i de la matriz X. Una vez que hemos escritola dinamica en la forma adecuada a nuestros propositos, es decir, separandolas perturbaciones del control, estudiaremos el regulador con funcion de costetiempo-energıa, y distintas condiciones de contorno.

Page 89: Modelado y control de masas acopladas. Aplicación a dispositivos ...

5.1. EL MODELO FISICO 89

5.1.1. Regulador tiempo-energıa con estado final cono-

cido

Escribamos la ecuacion (5.16) en la forma

˙x = Ax+ bu+ dw (5.17)

y consideremos la Hamiltoniana

H = 1 + αu2 + pT (Ax+ bu+ dw) (5.18)

Las dos ecuaciones del control tienen las soluciones ya conocidas:

u(t) = − 1

2αbT p(t) (5.19)

y

p(t) = e−AT tp(0) (5.20)

La condicion de contorno es

H(t1) = 0 (5.21)

donde t1 es el instante final. Sabemos que la ecuacion dinamica tiene solu-cion de la forma

x(t) = eAtx(0)− 1

∫ t

0eA(t−τ) bbT e−AT τdτ p(0) +

∫ t

0eA(t−τ)dw(τ)dτ (5.22)

Particularizando al caso en que w(t) es un escalon de magnitud w0, yllamando

E(t) =1

∫ t

0eA(t−τ) bbT e−AT τdτ (5.23)

y

g(t) =∫ t

0eA(t−τ)ddτ (5.24)

Page 90: Modelado y control de masas acopladas. Aplicación a dispositivos ...

90 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

tenemos para el instante final t1:

p(0) = −E−1(t1)[x(t1)− w0g(t1)− eAt1 x(0)

](5.25)

Entonces, la resolucion de este problema exige la de la ecuacion H(t1) = 0,que ahora puede escribirse como una funcion de t1. Conocido t1 es posiblecalcular, por este orden, p(0), p(t), u(t) y finalmente x(t).

Hemos resuelto numericamente este problema para perturbaciones de variasfrecuencias. Los parametros utilizados han sido md = 100 Kg, m1 = m2 =1 Kg, kd = 1 N/m, βd = 1 Ns/m, k = 20 N/m, β = 2 Ns/m y α = 0,1. Hemostomado como estados inicial y final

x(0) = 0 (5.26)

x(t1) =

010000

(5.27)

La grafica (5.2) muestra la solucion de la ecuacion H(t1) = 0 para fre-cuencias que abarcan desde f = 50s−1 hasta f = 2000s−1, en unidades de50s−1.

Por otra parte, las graficas (5.3)-(5.5) muestran respectivamente los es-fuerzos de control cuando la perturbacion consiste en un escalon unitarioy cuando consiste en una senal senoidal con f = 200, t1 = 6,1593, y conf = 700, t1 = 5,3793.

Page 91: Modelado y control de masas acopladas. Aplicación a dispositivos ...

5.1. EL MODELO FISICO 91

0 5 10 15 20 25 30 35 405.2

5.4

5.6

5.8

6

6.2

6.4

6.6

Frecuencia (Hz*50)

Rai

z de

H(t)

=0

Figura 5.2 Raices de la ecuacion H(t) = 0 en funcion de f , para valores deeste parametro entre 50s−1 y 2000s−1. Parametros:

m1 = m2 = 1 Kg;md = 100 Kg; kd = 1 N/m;βd = 1 Ns/m; k = 20 N/m;β = 2 Ns/m;α = 0,1.

0 50 100 150 200−80

−70

−60

−50

−40

−30

−20

−10

0

10

20

Tiempo (segundos*2.978/200)

Fuer

za (N

ewto

ns)

Figura 5.3 Control u(t) cuando sobre md se aplica un escalon unitario.Parametros: m1 = m2 = 1 Kg;md = 100 Kg; kd = 1 N/m;

βd = 1 Ns/m; k = 20 N/m;β = 2 Ns/m;α = 0,1.

Page 92: Modelado y control de masas acopladas. Aplicación a dispositivos ...

92 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

0 50 100 150 200−5

0

5

10

15

20

25

Tiempo (segundos*2.505/200)

Fuer

za (N

ewto

ns)

Figura 5.4 Control u(t) cuando sobre md se aplica una perturbacionarmonica con una frecuencia de 200s−1. t1 = 6,1593 segundos. Parametros:

m1 = m2 = 1 Kg;md = 100 Kg; kd = 1 N/m;βd = 1 Ns/m; k = 20 N/m;β = 2 Ns/m;α = 0,1.

0 50 100 150 2002

4

6

8

10

12

14

16

18

20

22

Tiempo (segundos*2.505/200)

Fuer

za (N

ewto

ns)

Figura 5.5 Control u(t) cuando sobre md se aplica una perturbacionarmonica con una frecuencia de 700s−1. t1 = 5,3793. Parametros:

m1 = m2 = 1 Kg;md = 100 Kg; kd = 1 N/m;βd = 1 Ns/m; k = 20 N/m;β = 2 Ns/m;α = 0,1.

Page 93: Modelado y control de masas acopladas. Aplicación a dispositivos ...

5.2. ESTADO FINAL LIBRE Y TERMINO DE MAYER 93

5.2. Estado final libre y termino de Mayer

Consideremos la misma funcion de coste que en la seccion anterior, con untermino de Mayer de la forma

φ(t1) = xT (t1)Mx(t1) (5.28)

Ahora, a la condicion de contorno H(t1) = 0 se une la ecuacion adicional

p(t1) = 2Mx(t1) = e−AT t1 p(0) (5.29)

de donde

p(0) = 2(e−AT t1)−1Mx(t1) (5.30)

Sustituyendo (5.60) en la solucion de la ecuacion dinamica encontramos

x(t1) = F−1(t1)[g(t1)w0 + eAt1 x0

](5.31)

donde

F(t1) =[I + 2E(t1)(e−AT t1)−1M

]−1(5.32)

El procedimiento consiste entonces en resolver H(t1) = 0, y conocido t1,calcular por este orden E(t1), F(t1), x(t1), p(t1), p(t0), p(t) y de aquı, final-mente, u(t) y x(t).

Otra opcion consiste en sustituir en la solucion de la ecuacion dinamicax(t1) en funcion de p(0), y despejar este para obtener

p(0) = F−1(t1)[eAt1 x(0) + g(t1)

](5.33)

donde

F(t1) = E(t1) +1

2M−1e−AT t1 (5.34)

E(t) = − 1

∫ t1

0eA(t1−τ)bbT e−AT τdτ (5.35)

Page 94: Modelado y control de masas acopladas. Aplicación a dispositivos ...

94 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

y

g(t1) =∫ t1

0eA(t1−τ)dw(τ)dτ (5.36)

Este es el procedimiento que hemos seguido en este punto. Para ello, usa-mos los mismos valores para los parametros que en la seccion anterior, y elvalor de la primera raız de la ecuacion H(t1) = 0 cuando la perturbaciones w(τ) = w0 cos(fτ), con w0 = 0,1 y f = 1000. En cuanto al termino deMayer, usamos M = 103 I. La grafica (5.6) muestra el esfuerzo de control,que conduce al sistema desde un estado inicial con norma ||x(0)|| = 1 a unestado final de norma ||x(t1)|| = 0,017.

0 50 100 150 200−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

Tiempo (segundos*6.2195/200)

Fuer

za (N

ewto

ns)

Figura 5.6 Control u(t) para un regulador tiempo-energıa con termino deMayer. Parametros: m1 = m2 = 1 Kg;md = 100 Kg; kd = 1 N/m;

βd = 1 Ns/m; k = 20 N/m;β = 2 Ns/m;α = 0,1; ω0 = 0,1 m; f = 1000 s−1

Como comentarios finales a esta seccion, notese la forma caracterıstica dela grafica de la Figura 5.2, donde se representan las raices de H(t) = 0 para unrango de valores de la frecuencia de perturbacion. Es notable la dependenciaacusada de dichas raices con la frecuencia. Por ejemplo, alrededor de los13s−1 el tiempo final en que se consigue el control pasa algo menos de 6,4sa algo menos de 5,4s. Respecto a la Figura 5.3, se obtiene, como era deesperar, un control esencialmente negativo, ya que ha de oponerse a unaperturbacion de magnitud constante que tiende a alejar al sistema del punto

Page 95: Modelado y control de masas acopladas. Aplicación a dispositivos ...

5.3. EFECTO DE UN CAMPO DE ACELERACION 95

de consigna. Sin embargo, cuando la perturbacion es armonica, el control esesencialmente positivo, y observamos como las graficas de las Figuras 5.4 y5.5 son esencialmente iguales, a pesar de que la frecuencia de la perturbaciones muy distinta en ambos casos.

5.3. Efecto de un campo de aceleracion

En la seccion 5.2 estudiamos el efecto de una perturbacion sobre el dispo-sitivo fısico que contiene al regulador. Podrıa arguirse que dicha perturbacion,en general, afectara por igual al propio actuador. Ası es, pero demostraremosen este punto que ambos problemas son formalmente identicos.

Consideremos una referencia inercial, monodimensional, donde las masasm1 y m2 tienen coordenadas x1 y x2. Consideremos tambien una referenciano inercial, solidaria con el dispositivo contenedor del actuador. Respecto aesta referencia no inercial, sean y1 e y2 las coordenadas de m1 y m2. A suvez, sea z(t) la posicion del sistema no inercial respecto al sistema inercial.

La energıa cinetica del actuador es simplemente

T =1

2m1x

21 +

1

2m2x

22 (5.37)

cumpliendose las relaciones cinematicas

y1 = x1 − z(t)y2 = x2 − z(t) (5.38)

Si ahora introducimos las coordenadas generalizadas

q1 = y1

q2 = y2 − y1 − L (5.39)

donde L es la distancia en el equilibrio entre m1 y m2, y sustituimos en laenergıa cinetica, encontramos

T =1

2m1(q2

1 + z2 + 2q1z) +1

2m2(q2

1 + q22 + z2 + 2q1q2 + 2q1z + 2q2z) (5.40)

Page 96: Modelado y control de masas acopladas. Aplicación a dispositivos ...

96 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

Tambien en funcion de las coordenas generalizadas que hemos introducidoes posible escribir la energıa potencial:

U =1

2k(y2 − y1 − L)2 =

1

2kq2

2 (5.41)

y la funcion de Rayleigh:

F =1

2β(y2 − y1)2 =

1

2βq2

2 (5.42)

Si llamamos ζ ≡ z, las ecuaciones (2.8) conducen a

M

[q1

q2

]+ l

[q1

q2

]+ k

[q1

q2

]=

[10

]u−

[m1 +m2

m2

]ζ (5.43)

donde

M =

[m1 +m2 m2

m2 m2

](5.44)

l =

[0 00 β

](5.45)

y

k =

[0 00 k

](5.46)

Introduzcamos ahora variables de estado en la forma acostumbrada:

x1 = q1

x2 = q2

x3 = q1

x4 = q2 (5.47)

Entonces, definiendo los vectores

e =

0010

(5.48)

Page 97: Modelado y control de masas acopladas. Aplicación a dispositivos ...

5.4. LQR CON TIEMPO Y ESTADO FINAL FIJOS 97

y

f =

00

m1 +m2

m2

(5.49)

recaemos en

˙x = Ax+ bu+ dζ (5.50)

donde ahora

A =

0 | I−− −−−M−1k | −M−1l

(5.51)

y

b = M−1e (5.52)

d = M−1f (5.53)

Esta claro, por tanto, que vale la misma discusion tanto cuando la per-turbacion se aplica al anclaje del actuador como cuando anclaje y actuadorse encuentra en un campo de aceleracion que los afecta por igual, como seve comparando las ecuaciones (5.16) y (5.50), formalmente identicas, aunquenaturalmente obtendremos como resultado formas funcionales distintas parael control dependiendo de la eleccion de ζ(t).

5.4. LQR con tiempo y estado final fijos

Consideremos la dinamica dada por (5.17), con Hamiltoniana

H = xTQx + αu2 + pT (Ax+ bu+ dw) (5.54)

Introduciendo el vector de estado ampliado

ξ =

[xp

](5.55)

Page 98: Modelado y control de masas acopladas. Aplicación a dispositivos ...

98 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

es posible reunir en una unica ecuacion la dinamica de los vectores deestado y co-estado. En efecto, de

∂H

∂u= 0 = 2αu+ bT p (5.56)

y

˙p = −∂H∂x

= −2Qx−AT p (5.57)

junto con (5.17), tenemos

˙ξ =

A | − 12αbbT

−− −−−2Q | −AT

ξ +

[d0

]w(t) (5.58)

Llamando F a la matriz de bloques que acompana al estado ampliado, lasolucion de la ecuacion anterior es conocida:

ξ(t) = eFtξ(0) +∫ t

0eF(t−τ)

[d0

]w(τ)dτ (5.59)

La matriz de transicion es ahora una matriz de 12 × 12, que dividimosen cuatro sub-bloques de 6 × 6. Refiriendonos a cada sub-bloque medianteun ındice fila y un ındice columna, llamando g(t) al vector resultante de laintegral y descomponiendo la solucion en una componente vectorial para elestado y otra para el co-estado:

x(t) = eFt11 x(0) + eFt

12 p(0) + g1(t)

p(t) = eFt21 x(0) + eFt

22 p(0) + g2(t) (5.60)

Puesto que son conocidos tanto el estado final como el tiempo final, de laecuacion anterior:

p(0) =(eFt1

12

)−1 [x(t1)− g1(t1)− eFt1

11 x(0)]

(5.61)

Page 99: Modelado y control de masas acopladas. Aplicación a dispositivos ...

5.5. LQR CON TIEMPO FINAL FIJO Y ESTADO FINAL LIBRE 99

Sustituyendo (5.61) en la primera de (5.60) obtenemos x(t), que puede asu vez usarse para integrar la ecuacion del co-estado, de solucion:

p(t) = e−AT tp(0)−∫ t

02e−AT (t−τ)Qx(τ)dτ (5.62)

Finalmente, p(t) proporciona ya u(t), y el problema queda resuelto.

5.5. LQR con tiempo final fijo y estado final

libre

En esta seccion, y en las siguientes que se ocupan del control optimo delregulador LQR con distintas condiciones de contorno, mantenemos la no-tacion introducida en la seccion 5.4 anterior.

Consideremos en primer lugar el problema cuando la funcion de coste noincluye termino de Mayer. La condicion de contorno es ahora

p(t1) = 0 (5.63)

es decir,

0 = p(t1) = eFt121 x(0) + eFt1

22 p(0) + g2(t1) (5.64)

de donde se sigue que

p(0) = −(eFt1

22

)−1 (eFt1

22 x(0) + g2(t1))

(5.65)

Conocido p(0), se obtiene p(t), y de aquı u(t), lo que resuelve el problema.

Si existe un termino de Mayer en la funcion de coste que pondera el estadofinal mediante una funcion lineal cuadratica de la forma xT (t1)Mx(t1), lacondicion de contorno es ahora

p(t1) = 2Mx(t1) (5.66)

De la segunda de (5.60):

eFt122 p(0) = 2Mx(t1)− eFt1

21 x(0)− g2(t1) (5.67)

Page 100: Modelado y control de masas acopladas. Aplicación a dispositivos ...

100 CAPITULO 5. ACOPLAMIENTO A UN DISPOSITIVO MOVIL

Sustituyendo ahora p(0) en la primera obtenemos la condicion sobre elestado final:

[I− 2eFt1

12

(eFt1

22

)−1M]x(t1) = −eFt1

12

(eFt1

22

)−1 [eFt1

21 x(0) + g2(t1)]

+eFt111 x(0) + g1(t1) (5.68)

de donde puede obtenerse este como funcion del estado inicial, y usando(5.67) el co-estado inicial y, finalmente, el co-estado y el control.

5.6. LQR con estado final fijo y tiempo final

libre

De la primera de (5.60) podemos escribir p(0) en funcion de x(t1), y portanto, usando la segunda, p(t1) tambien en funcion del estado final, conoci-do. Ahora, es preciso sustituir los valores del estado y co-estado finales en laHamiltoniana, y aplicar algun procedimiento numerico que permita corregirel valor t1 en que se ha basado el calculo de la Hamiltoniana. Como resul-tado de este procedimiento, se obtendra una raız de H(t1) = 0. Finalmente,sera posible, a partir de este t1 y repitiendo el proceso descrito, calcular p(0),p(t) y u(t).

5.7. LQR con tiempo y estado final libres

Consideraremos solo el caso en que la funcion de coste incluya un terminode Mayer, lineal cuadratico, de la forma ya establecida anteriormente. Esteproblema se resuelve de forma parecida al anterior. Ahora, la libertad sobreel estado final se traduce en una condicion de contorno para el co-estado, dela forma

p(t1) = 2Mx(t1) = f(x(0), p(0), g2(t1)) (5.69)

Esta ecuacion puede invertirse para obtener p(0) en funcion de t1 y x(t1),y permite escribir la Hamiltoniana en funcion del estado final. Algun proce-dimiento numerico apropiado permitira encontrar la raız de H(t1, x(t1)) = 0,y una vez obtenida dicha raız podremos calcular por este orden p(0), p(t) yu(t).

Page 101: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 6

Dinamica no lineal e impulsiva

6.1. Dispositivos micro-electromecanicos

Los dispositivos de almacenamiento micro-electromecanicos (DMEM) seentienden en el contexto general de los medios de almacenamiento, princi-palmente magneticos. No obstante, el enfoque adecuado que los situa en sujusta perspectiva requiere una discusion historica que en este punto intro-ducirıa una discontinuidad en nuestra lınea argumental. Por este motivo,hemos trasladado la exposicion de este extremo al primer apendice.

Los DMEM se encuentran actualmente en fase de desarrollo, y abarcan unavariedad de aplicaciones: valvulas, sensores, actuadores, etc., aunque nosotrosaquı nos interesaremos en los DMEM como sistemas rapidos y economicosde almacenamiento de informacion, en competencia directa con los mediosmagneticos convencionales. En la Figura 1.4 mostramos uno de estos dispo-sitivos, ilustrando elocuentemente sus dimensiones y factura.

Los DMEM son dispositivos con tamanos que oscilan entre los 10 y los 100µm, fabricados mediante las mismas tecnicas fotolitograficas usadas en la pro-duccion de memorias y procesadores. Esto sugiere la posibilidad de integraren el mismo chip los dispositivos de calculo y almacenamiento ([10],[11]),reduciendo el cuello de botella clasico que existe entre los procesadores ylas memorias convencionales, que se alivia incrementando el tamano de lasmemorias rapidas de cache. En esta lınea, hay que citar el almacenamientode alta capacidad y prestaciones que se alcanza actualmente mediante con-juntos de discos RAID y memorias cache no volatiles del tipo DRAM. Lalatencia de los discos es seis ordenes de magnitud superior a la de la memoriaDRAM, pero esta tiene un costo tres ordenes de magnitud superior. En [16]

101

Page 102: Modelado y control de masas acopladas. Aplicación a dispositivos ...

102 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

Figura 6.1 Dimensiones de un DMEM y un acaro.

se discute como sistemas hıbridos formados a partir de discos convencionalesy memorias MEMS pueden mejorar sustancialmente las prestaciones de losdispositivos RAID, con un coste favorable.

El almacenamiento basado en DMEM promete capacidades de entre 1 y 10GB, con anchos de banda del orden de los 100 MB/s, a coste reducido, conbajo consumo y baja disipacion de energıa, lo que los hace ideales para su usoen sistemas moviles o como eficientes mecanismos de apoyo para aumentarel ancho de banda y disminuir la latencia en sistemas con requerimientosestrictos en este sentido, como se discute en [17].

Un DMEM tıpico como el milpies [7], en fase de preproduccion por IBM afinales de 2004, consta de un conjunto muy grande de nano-agujas alineadasque se mueven perpendicularmente a su direccion de alineamiento. Pequenas

Page 103: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.1. DISPOSITIVOS MICRO-ELECTROMECANICOS 103

corrientes que circulan por las mismas causan cambios notables de tempe-ratura en sus extremos, suficientes para generar pequenas muescas sobre elsustrato de polımero sobre el que se deslizan. La presencia o ausencia de unade estas muescas codifica un 0 o 1 binario. Un incremento cuidadoso de latemperatura de una de estas muescas es suficiente para hacerla desaparecerpor efecto de la tension superficial del polımero, pudiendo ası disponer dememorias de lectura/escritura. En cuanto a la lectura, se basa en la variacionbrusca de la resistencia electrica de una aguja por la que circula una pequenacorriente cuando cae en una de las muescas, incrementando bruscamente susuperficie de contacto con el polımero y por tanto reduciendo de igual formasu temperatura. La Figura 1.5 muestra el primer prototipo de milpies, y laFigura 1.6 un detalle de las nanoagujas en uno de los ultimos dispositivos.

Figura 6.2 Matriz de 5x5 nanoagujas en el primer dispositivo milpies deIBM.

Page 104: Modelado y control de masas acopladas. Aplicación a dispositivos ...

104 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

Figura 6.3 Detalle de las nanoagujas en uno de los ultimos prototipos demilpies.

En otro de los disenos en fase de estudio, el sustrato es de naturalezamagnetica, y los sensores se mueven en el plano XY para leer o escribir, obien el sustrato se mueve bajo una rejilla de sensores, cada uno de los cualespuede entonces acceder a una superficie rectangular.

Por diseno, los DMEM de almacenamiento pueden efectuar lecturas y es-crituras en paralelo, de forma que pudiendo competir con los medios magneti-cos convencionales en coste, pueden hacerlo tambien en ancho de banda, sim-plemente aumentando el numero de sensores de lectura/escritura. El recientedescubrimiento de los efectos magnetorresistivos extraordinario y balıstico([8],[9]) pondra de nuevo los discos duros convencionales entre uno y tresordenes de magnitud por delante de sus competidores en cuanto a capacidady velocidad de acceso, pero no hay nada que impida que los mismos efectossean la base para la construccion de DMEM de almacenamiento.

6.2. Aspectos mecanicos comparativos

En una unidad de disco duro convencional, existen tres parametros dinami-cos que determinan las prestaciones del dispositivo. Estos son los tiempos debusqueda, latencia y transferencia. El tiempo de busqueda es el tiempo nece-

Page 105: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.2. ASPECTOS MECANICOS COMPARATIVOS 105

sario para que el cabezal de lectura/escritura se situe sobre la pista adecuada.Este tiempo depende de la potencia del servomecanismo de posicionamientoy de su tiempo de estabilizacion, determinado por su diseno, uno de cuyosparametros basicos es el momento de inercia del brazo, que a su vez depende,entre otras cosas, del tamano del disco. Actualmente, este tiempo es de unospocos milisegundos.

El segundo parametro dinamico es el tiempo de latencia. Este es el tiempomedio que ha de esperar el cabezal antes de poder acceder al sector adecuadodentro de la pista sobre la que se ha colocado previamente. El tiempo delatencia es entonces la mitad del periodo de rotacion, y puede disminuirseaumentando la velocidad de rotacion del disco. Ahora bien, esto implica que,partiendo del reposo, el disco tardara mas tiempo en alcanzar su velocidad deoperacion, consumiendo mas energıa. Por este motivo, se intenta reducir eltamano del disco, y por tanto su momento de inercia, lo que a su vez aumentalas exigencias de precision sobre el servomecanismo de posicionamiento delbrazo.

Finalmente, una vez que el cabezal se encuentra sobre el sector adecuado,se procede a la lectura o escritura de la informacion, proceso que es secuencial,por la propia naturaleza del dispositivo.

Hay algunas particularidades de los DMEM de almacenamiento que con-tribuyen a disminuir la energıa necesaria para su funcionamiento. En primerlugar, el sustrato que contiene los datos puede ser estatico, al contrario queun disco duro convencional, que ha de girar a velocidades en torno a las 6000rpm.. En segundo lugar, los sensores de un DMEM son notablemente masligeros que el brazo de lectura/escritura de un disco y han de moverse dis-tancias mucho menores, entre uno y tres ordenes de magnitud inferiores. Portanto, el tiempo necesario para pasar del estado de espera al estado operativose reduce considerablemente.

No obstante, es preciso indicar que los DMEM se encuentran aun en suinfancia, por lo que muchas de sus caracterısticas son inciertas. Por ejemplo,en una de las arquitecturas propuestas los cabezales permanecen fijos, y esel sustrato el que se desplaza bajo una rejilla de sensores, mientras que elcitado milpies dispone de una lınea de nano-agujas que se desplazan sobre elsustrato.

Page 106: Modelado y control de masas acopladas. Aplicación a dispositivos ...

106 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

6.3. Modelo fısico

El objeto del presente captıtulo es el estudio de la dinamica del sistemade dos masas acopladas, y la aplicacion de los resultados que se obtenganal control de DMEM. Esencialmente, seguiremos aquı el modelo fısico pre-sentado en la seccion 4.4, cuando se discutio el efecto de una perturbacionacimutal sobre el sistema. Ası pues, el punto de partida en este capıtulolo constituyen las ecuaciones (4.46) y (4.47), con la salvedad de que ahoraθ = 0. Con la intencion de considerar los casos en que el resorte sea duro oblando introducimos tambien el ligero cambio de notacion para el parametroque acompana al termino no lineal, llamandolo ±a en lugar de 4µ. Con todoesto, las ecuaciones de partida son:

m1p1 +m2(p1 + p2) = u(t)

m2(p1 + p2) + k(p2 ± ap32) + bp2 = 0 (6.1)

Con objeto de simplificar el analisis de (6.1) se elimina la variable p1, conlo que obtenemos la ecuacion diferencial no lineal de segundo orden

p2 +b(m1 +m2)

m1m2p2 +

k(m1 +m2)

m1m2(p2 ± ap3

2) = − 1

m1u(t) (6.2)

La ecuacion (6.2) se puede considerar como la vibracion de una unica masaequivalente

me =m1m2

m1 +m2(6.3)

es decir

p2 +b

mep2 +

k

me(p2 ± ap3

2) = − 1

m1u(t) (6.4)

Introducimos la nomenclatura

ω20 =

k

me

β =b

me

(6.5)

Page 107: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.4. PUNTOS DE EQUILIBRIO 107

siendo ω0 la frecuencia natural a la que oscilarıa me si fuese a = 0 yu(t) = 0, es decir, sin rozamiento y con un resorte lineal. De (6.4) y con lanomenclatura introducida pasamos a variables de estado

x1 = p2

x2 = p2

(6.6)

y escribimos

x1 = x2

x2 = −ω20(x1 ± ax3

1)− βx2 −1

m1u(t) (6.7)

Las ecuaciones (6.4) y (6.7) son una variante de la llamada ecuacion deDuffing. Esta ecuacion se caracteriza por interesantes propiedades cuandou(t) es una perturbacion armonica debil y el amortiguamiento viscoso espequeno. Analizaremos a continuacion los puntos de equilibrio de (6.7) delsistema no perturbado en los casos de muelle duro y blando.

6.4. Puntos de equilibrio

6.4.1. Puntos de equilibrio para el muelle duro

En este caso, en las ecuaciones (6.7) ha de tomarse el signo positivo. En elequilibrio, con u(t) = 0 se verifica que

x2 = 0

−ω20(x1 + ax3

1) = 0 (6.8)

De la segunda se sigue que ha de ser x1 = 0. En este caso, el sistematiene un unico punto de equilibrio, que llamaremos p0(0, 0). El jacobiano delsistema es

J =

[0 1

−ω20(1 + 3ax2

1) −β

](6.9)

Page 108: Modelado y control de masas acopladas. Aplicación a dispositivos ...

108 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

Los autovalores en p0 se obtienen de

|λI− J| = 0 (6.10)

y resultan ser

λ1,2 =−β ±

√β2 − 4ω2

0

2(6.11)

Dependiendo de los valores relativos de β y ω0 pueden darse varios casos

a.1. Si β2 > 4ω20, p0 es un punto silla. Al ser el unico punto de equilibrio

inestable, el sistema quedara oscilando en torno a el con un ciclo lımitede amplitud muy pequena, dependiendo de los valores relativos de β yω0. Desde un punto de vista fısico, este caso es poco probable, ya quenormalmente las fuerzas viscosas son mucho menores que las fuerzaselasticas en el caso de un muelle duro.

a.2. Si β2 = 4ω20, λ1,2 = −β/2 y el punto p0 es un nodo estable.

a.3. Si β2 < 4ω20, los autorvalores de p0 son complejos conjugados, y el

origen pasa a ser un foco estable.

a.4. Si β = 0, es decir, en el caso en que las fuerzas viscosas puedanconsiderarse despreciables frente a las elasticas, los autovalores son com-plejos conjugados puros: λ1,2 = ±iω0 y nada puede afirmarse respecto ala estabilidad de p0. Cuando β → 0 una bifurcacion del tipo Andronov-Poincare-Hopf aparece, siendo necesario determinar el primer valor deLyapunov L1 para saber si el punto de equilibrio es estable o no, esdecir, para saber si aparece un foco debil estable o inestable.

6.4.2. Puntos de equilibrio para el muelle blando

En este caso, es preciso tomar el signo negativo en (6.7). En el equilibrio,con u(t) = 0, tenemos

x2 = 0

−ω20(x1 − ax3

1) = 0 (6.12)

Page 109: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.5. ANALISIS DEL SISTEMA CON MUELLE DURO 109

Es claro que en este caso el sistema tiene tres puntos de equilibrio, que

llamaremos p1(0, 0), p2(√

1/a, 0) y p3(−√

1/a, 0). El jacobiano del sistema esen este caso

J =

[0 1

−ω20(1− 3ax2

1) −β

](6.13)

Para p1(0, 0) se sigue el mismo analisis que se hizo en la sub-seccion ante-rior.

Para p2, el jacobiano se reduce a

J =

[0 1

2ω20 −β

](6.14)

y de |λI− J| = 0 se siguen los autovalores

λ1,2 =−β ±

√β2 + 8ω2

0

2(6.15)

Por consiguiente, p2 es una silla para todos los valores de β >= 0. El mismoresultado se obtiene para p3. En resumen, p2 y p3 son sillas, y p1 puede serbien un foco estable, bien un centro.

A continuacion vamos a estudiar los casos no triviales. El objetivo es com-prender en profundidad el comportamiento dinamico del sistema para a con-tinuacion disenar el sistema de control.

6.5. Analisis del sistema con muelle duro

En este caso solo existe el punto de equilibrio p0(0, 0). Las ecuaciones delsistema son

x1 = x2

x2 = −ω20(x1 + ax3

1)− βx2 −1

m1

u(t) (6.16)

Page 110: Modelado y control de masas acopladas. Aplicación a dispositivos ...

110 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

El caso mas interesante ocurre cuando β = 0, con lo que las ecuaciones delsistema quedan, en forma matricial:

˙x =

[0 1−ω2

0 0

]x +

[0

−ω20ax

31

]+

[0− 1m1

]u(t) (6.17)

Los autovalores de la parte lineal son complejos conjugados puros: λ1,2 =±iω0. A efectos de estudiar la bifurcacion de Andronov-Poincare-Hopf, vamosa considerar que β es un parametro muy pequeno que tiende a cero: β →µ → 0. En tal caso, el jacobiano correspondiente a (6.16), particularizadopara el punto de equilibrio viene dado por

J =

[0 1−ω2

0 −µ

](6.18)

de donde se siguen los autovalores:

λ1,2 = −µ2± i

√ω2

0 − (µ

2)2 = α(µ)± iω(µ) (6.19)

de (6.19) se deduce

α(0) = 0

ω(0) 6= 0

dα(µ)

dµ= −1

2< 0 (6.20)

Estas ecuaciones son muy importantes en el analisis de la bifurcacionAndronov-Poincare-Hopf. Para realizar este analisis, escribimos las ecua-ciones (6.16) como

˙x =

[0 1−ω2

0 −µ

]x +

[0

−ω20ax

31

]= Ax+ b(x) (6.21)

Teniendo en cuenta que los autovalores de la parte lineal de (6.21) vienendados por (6.19), se busca la matriz de transformacion P que pasa al sistemaa la forma canonica de Jordan:

J =

[−α(µ) −ω(µ)ω(µ) α(µ)

](6.22)

Page 111: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.5. ANALISIS DEL SISTEMA CON MUELLE DURO 111

es decir, buscamos

[x1

x2

]= P

[xy

](6.23)

y tal que

J = P−1AP (6.24)

Se sigue que

x12 = [α(µ) + iω(µ)]x11

−ω20x11 − µx12 = [α(µ) + iω(µ)]x12 (6.25)

Eliminando x12:

(−ω20 − µ[α(µ) + iω(µ)])x11 = [α(µ) + iω(µ)]2x11 (6.26)

Se comprueba que la igualdad (6.31) se cumple teniendo en cuenta losvalores de α(µ) y ω(µ) de (6.19). Tomando x11 = 1, se tiene que x12 =α(µ) + iω(µ). Por consiguiente, el vector propio xT1 = [x11, x12]T es

x1 =

[1

α(µ)

]+ i

[0

ω(µ)

](6.27)

y se sigue

P =

[0 1

ω(µ) α(µ)

](6.28)

P−1 = − 1

ω(µ)

[α(µ) −1−ω(µ) 0

](6.29)

Se comprueba facilmente que PP−1 = I. El cambio de coordenadas es

[x1

x2

]=

[0 1

ω(µ) α(µ)

] [xy

](6.30)

Page 112: Modelado y control de masas acopladas. Aplicación a dispositivos ...

112 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

o

x1 = y

x2 = ω(µ)x+ α(µ)y (6.31)

Tambien es facil comprobar que J = P−1AP. Con los cambios anteriores,las ecuaciones del sistema quedan de la forma

[xy

]=

[α(µ) −ω(µ)ω(µ) α(µ)

] [xy

]+ P−1

[0

−ω20ay

3

]

=

[α(µ) −ω(µ)ω(µ) α(µ)

] [xy

]+

1

ω(µ)

[−ω2

0ay3

α(µ)ω20ay

3

](6.32)

Las ecuaciones (6.32) son las ecuaciones del sistema en forma normal, lascuales se utilizan para calcular el primer valor de Lyapunov L1. La estabilidaddel punto de equilibrio (0, 0) de (6.32) se establece de acuerdo con el teoremafundamental de la bifurcacion de Andronov-Poincare-Hopf. Pero, antes deestablecer el teorema, la formula para calcular L1 es la siguiente. Dado unsistema general escrito en la forma normal

x = ax + by + P2(x, y) + P3(x, y) + · · ·y = cx + dy +Q2(x, y) +Q3(x, y) + · · · (6.33)

siendo

ad− bc = 0

P2(x, y) = a20x2 + a11xy + a02y

2

Q2(x, y) = b20x2 + b11xy + b02y

2

P3(x, y) = a30x3 + a21x

2y + a12xy2 + a03y

3

Q3(x, y) = b30x3 + b21x

2y + b12xy2 + b03y

3 (6.34)

si definimos ω2 = ad− bc, entonces L1 viene dado por

L1 =π

4bω3(l1 + l2 + l3 + l4) (6.35)

Page 113: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.5. ANALISIS DEL SISTEMA CON MUELLE DURO 113

con

l1 = ac(a211 + a11b02 + a02b11) + ab(b2

11 + a20b11 + a11b20)

l2 = c2(a11a02 + 2a02b02)− 2ac(b202 − a20a02)− 2ab(a2

20 − b20b02)

l3 = −b2(2a20b20 + b11b20) + (bc− 2a2)(b11b02 − a11a20)

l4 = −(a2 + bc) [3(cb03 − ba30) + 2a(a21 + b12) + (ca12 − bb21)] (6.36)

Observese que para aplicar la formula (6.36) se requiere que a + d = 0,pero tambien se puede aplicar cuando a + d→ 0 y entonces L1 sera funcionde un parametro pequeno (en nuestro caso µ). Esto es ası porque en realidadno nos interesa el valor de L1, sino solo su signo. Con las ideas anteriores, seestablece el siguiente teorema:

Teorema: Si el primer valor de Lyapunov del sistema generico enla forma normal (6.33) es negativo, entonces para µ→ 0 y µ <= 0el origen es un punto de equilibrio estable. Si µ > 0 el punto deequilibrio es inestable y un ciclo lımite de diametro

õ aparece

alrededor del origen. Si L1 > 0 y µ→ 0 con µ >= 0 el origen es unpunto de equilibrio inestable. En caso de inestabilidad (µ >= 0),la cuenca de atraccion esta limitada por un ciclo lımite inestablede radio

õ

Aplicando las formulas (6.33)-(6.34)-(6.36) al sistema (6.32) se obtiene

L1 = − π

4bω3(−3(a2 + bc)(cb03 − ba30)) (6.37)

En (6.41) se tiene

a2 = α(µ)

b = −ω(µ)

c = ω(µ)

d = α(µ)

ω2 = ad− bc = α2(µ) + ω2(µ) = ω20

ω = ω0

b03 = α(µ)ω20a

a30 = 0 (6.38)

Page 114: Modelado y control de masas acopladas. Aplicación a dispositivos ...

114 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

con todo lo cual

L1 = −1

43πα(µ)ω0a (6.39)

Como α(µ) = −µ/2 < 0 (el coeficiente de amortiguamiento β no es nega-tivo) y L1 < 0 el punto de equilibrio es estable. Observese que cuando µ→ 0L1 → 0, pero siempre negativo. Un ciclo lımite de radio

õ aparece.

6.6. Analisis del sistema con muelle blando

El analisis es similar al del muelle duro. Las ecuaciones del sistema son dela forma

x1 = x2

x2 = −ω20(x1 − ax3

1)− βx2 −1

m1u(t) (6.40)

Es facil comprobar que en este caso L1 > 0 y al ser β → µ → 0 > 0el punto p1(0, 0) es inestable. Por consiguiente, dependiendo de la energıainicial del sistema, con β = 0 se obtienen ciclos lımite alrededor de p1(0, 0).

6.7. Muelle duro con realimentacion del es-

tado

Recordemos que las ecuaciones con muelle duro venıan dadas por

x1 = x2

x2 = −ω20x1 − ω2

0ax31 − βx2 −

1

m1u(t) (6.41)

siendo ω20 = k/me y β = b/me.

Supongamos que definimos una ley de realimentacion de la forma

u(t) = −kpp2(t)− u1(t) = −kpx1(t)− u1(t) (6.42)

Page 115: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.7. MUELLE DURO CON REALIMENTACION DEL ESTADO 115

o sea, hacemos u(t) = u(p2(t), t). Sustituyendo en (6.41) se obtiene

x1 = x2

x2 = (ω21 − ω2

0)x1 − ω20ax

31 − βx2 +

1

m1u1(t) (6.43)

siendo ω21 = kp/m1. Si suponemos que ω2

1 > ω20, el sistema (6.43) tiene

importantes propiedades cuando la senal u1(t) es una senal periodica. Enparticular, representa una version de la ecuacion de Duffing para la cualpueden estudiarse las condiciones bajo las cuales aparece comportamientocaotico. Para simplificar, emplearemos la siguiente nomenclatura:

α = ω21 − ω2

0 > 0

u1 = A1 cos(ωt) (6.44)

Se tiene

x1 = x2

x2 = αx1 − ω20ax

31 − βx2 +

A1

m1cos(ωt) (6.45)

Un aspecto interesante de las ecuaciones (6.45) es que si se supone que elcoeficiente de amortiguamiento es pequeno, ası como la perturbacion exterior,podemos escribir

x1 = x2

x2 = αx1 − ω20ax

31 + ε(γ cos(ωt)− β ′x2) (6.46)

siendo εβ ′ = β, εγ = A1/m1 y ε << 1.

Observamos que en el lımite cuando ε → 0 el sistema (6.46) se aproximaa un sistema Hamiltoniano. Ademas, los puntos de equilibrio en ausencia deperturbacion periodica coinciden con los del sistema Hamiltoniano con ε = 0.Analizamos a continuacion estos puntos de equilibrio y la naturaleza de losmismos.

Page 116: Modelado y control de masas acopladas. Aplicación a dispositivos ...

116 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

Con ε = 0 se deduce

αx1 − ω20ax

31 = 0 (6.47)

o

x1(α− ω20ax

21) = 0 (6.48)

Por tanto, existen los tres puntos de equilibrio

pT0 = [0, 0]

pT1 = [

√α

ω20a, 0]

pT2 = [−√

α

ω20a, 0] (6.49)

El Jacobiano del sistema Hamiltoniano es

J =

[0 1

α− 3ω20ax

21 0

](6.50)

Para el punto p0

Jp0 =

[0 1α 0

](6.51)

con valores propios λ1,2 = ±√α, de donde se sigue que p0 es un punto desilla. Por otro lado

Jp1 =

[0 1−2α 0

](6.52)

con valores propios λ1,2 = ±i√

2α que corresponden a dos centros. Si-guiendo un procedimiento similar al expuestos anteriormente, se encuentradel calculo del primer valor de Lyapunov que los centros son inestables cuandoβ → 0.

Page 117: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.7. MUELLE DURO CON REALIMENTACION DEL ESTADO 117

Las ecuaciones del sistema con ε = 0 son

x1 = x2

x2 = αx1 − ω20ax

31 (6.53)

cuyo Hamiltoniano viene dado por

x1 =∂H(x1, x2)

∂x2

x2 =∂H(x1, x2)

∂x1(6.54)

De

∂H(x1, x2)

∂x2= x2 (6.55)

se sigue que

H(x1, x2) =1

2x2

2 + U(x1) (6.56)

Y de

∂H(x1, x2)

∂x1=∂U(x1)

∂x1(6.57)

que

U(x1) = −1

2αx2

1 +1

4ω2

0ax41 (6.58)

luego

H(x1, x2) =1

2x2

2 −1

2αx2

1 +1

4ω2

0ax41 (6.59)

Como la orbita homoclınica pasa por el origen, de H(0, 0) = 0 se sigue,para cualquier otro punto

x22 = αx2

1 −1

2ω2

0ax41 (6.60)

Page 118: Modelado y control de masas acopladas. Aplicación a dispositivos ...

118 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

De la primera ecuacion del sistema (6.66):

x1 =√αx1

√√√√1− ω20a

2√αx2

1 (6.61)

Separando variables

∫ x1

0

dx1

x1

√1− b2x2

1

=√αt (6.62)

con b2 =ω2

0a

2α. La integral (6.62) es de la forma

1

2ln

1−√

1− b2x21

1 +√

1− b2x21

=√αt (6.63)

Despejando x1(t) y operando:

x1(t) = ±√

ω20a

cosh−1(√αt) (6.64)

Teniendo en cuenta que x1 = x2,

x2(t) = ∓√

2α2

aω20

cosh−1(√αt) tanh(

√αt) (6.65)

Las ecuaciones (6.64)-(6.65) son las ecuaciones parametricas de la orbitahomoclınica.

6.8. Analisis del comportamiento caotico

Cuando un sistema dinamico tiene una orbita homoclınica y se dispone desus ecuaciones parametricas, se puede aplicar el llamado metodo de Melnikovpara obtener condiciones necesarias para que el sistema, con ε 6= 0 peropequeno, tenga comportamiento caotico. La idea del mismo es la siguiente:si el sistema Hamiltoniano (6.66) se perturba levemente segun las ecuaciones(6.46), el espacio de fases del primero se deforma, y para ciertos valores delos parametros es posible que la orbita homoclınica se rompa, de forma quelas variedades estable e inestable de la orbita ya no coincidan. Graficamente,lo anterior se expresa en la Figura (6.4)

Page 119: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.8. ANALISIS DEL COMPORTAMIENTO CAOTICO 119

x (t,t )s0

x (t,t )u0O O’

ω s

ωu

ω

ω s

u

Figura 6.4 Idea del metodo de Melnikov. Ruptura de las variedadesestable e inestable de la orbita homoclınica.

donde ωs etiqueta a la variedad estable del sistema sin perturbar, ωu ala variedad inestable del sistema sin perturbar, ω

′s la variedad estable delsistema perturbado y ω

′u la variedad inestable del sistema perturbado. Sila perturbacion rompe la orbita homoclınica, sea t0 un instante de tiempoarbitrario y t el instante para el cual la distancia entre las variedades establee inestable es d(t, t0). Se puede demostrar que dicha distancia, llamada vectorde Melnikov, viene dada por (veanse las referencias [40], [41], [42], [44], [59]y [70])

M(t0) =∫ +∞

−∞f(γ0(t)) ∧ g(γ0(t), t+ t0)dt (6.66)

o

M(t0) = −∫ +∞

−∞f(γ0(t)) ∧ g(γ0(t), t− t0)dt (6.67)

f es el vector campo sin perturbar, y g el vector campo de la perturbacion,definidos a lo largo de la trayectoria homoclınica. En nuestro caso

Page 120: Modelado y control de masas acopladas. Aplicación a dispositivos ...

120 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

f =

[x2

αx1 − ω20ax

31

](6.68)

g =

[0

γ cos(ωt)− β ′x2

](6.69)

de acuerdo con la ecuacion (6.46). Observese que al realizar las integrales(6.66)-(6.83), M(t0) para un t0 arbitrario puede ser positivo o negativo. Enrealidad, el signo carece de importancia. Pero si M(t0) cambia de signo,significa que las variedades estable e inestable se cortan. Ahora bien, al serla perturbacion de tipo periodico, los cortes entre ω

′s y ω′u tambien son

periodicos, pero con la particularidad de que estos cortes se dan de forma cadavez mas enrevesada. Ademas, es posible demostrar que estos cortes formanun conjunto homeomorfico con la aplicacion herradura de Smale, la cual elmismo Smale demostro que tiene comportamiento caotico (Medalla Fields).Por consiguiente, si M(t0) cambia de signo para algun valor de t0, entoncesel sistema (6.46) tiene movimiento caotico. Observese que este movimientocaotico no se puede generalizar a todo el espacio de fases, sino que se restringea movimientos proximos a la orbita homoclınica.

Conviene insistir en que el criterio de que M(t0) cambie de signo es solo unacondicion necesaria para que se produzca movimiento caotico, pero puede noser suficiente. Por otro lado, este criterio es el unico que existe para sabera priori si un sistema tiene comportamiento caotico o no. De hecho, parasistemas dinamicos que no tienen orbita homoclınica no existe actualmenteningun procedimiento analıtico para saber si son caoticos o no.

Para el sistema que estamos estudiando, el valor de M(t0) viene dado por

M(t0) =∫ +∞

−∞x2(t)[γ cos(ω(t+ t0)− β ′x2(t)]dt (6.70)

siendo x2(t) la ecuacion (6.65) correspondiente a la orbita homoclınica, osea:

M(t0) =

√2α2

aω20

∫ +∞

−∞[cosh−1(

√αt) tanh(

√αt)γ cos(ω(t+ t0))

−β ′ cosh−2(√αt) tanh2(

√αt)]dt

Page 121: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.9. ANALISIS DE VALORES NUMERICOS 121

= −√

2α2

aω20

∫ +∞

−∞cosh−1(

√αt) tanh(

√αt)γ cos(ω(t− t0))dt

−2α2

aω20

β ′∫ +∞

−∞cosh−2(

√αt)dt (6.71)

La segunda de estas integrales es inmediata, mientras que la primera puedecalcularse mediante residuos (veanse las referencias [40], [41], [42], [44], [59]y [70]) . El valor resultante es

M(t0) = γπω

√2

ω20a

cosh−1(πω

2√α

) sen(ωt0)− 4β ′α32

3ω20a

(6.72)

Observese que M(t0) es una funcion periodica y tiene ceros y por tantocaos si M(t0) > 0, es decir si

γ

β ′>

4

3πω

√α3

2ω20a

cosh(πω

2√α

) (6.73)

para unos determinados valores de los parametros.

6.9. Analisis de valores numericos

Con objeto de llevar a cabo simulaciones numericas es necesario asignarvalores a los parametros del sistema no perturbado, de forma que en funcionde los valores de la perturbacion ω, γ y β ′ se pueda estudiar como varıan losceros de la funcion de Melnikov.

Los valores para las masas m1 y m2 son del orden de 10−4 Kg.

De acuerdo con la bibliografıa, si se fija la aceleracion de la masa equi-valente me = m1m2/(m1 + m2) se puede obtener una relacion entre k y elparametro a del muelle:

ma = k(y + ay3) (6.74)

El desplazamiento y es del orden de 50µm y la aceleracion del orden de800m/s2, con lo cual

k =ma

y + ay3∼ 16000

1 + 1,25× 10−8a(6.75)

Page 122: Modelado y control de masas acopladas. Aplicación a dispositivos ...

122 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

o

a =16000− k

k × 1,25× 10−8(6.76)

Como a > 0, existe un valor lımite para la constante elastica k. Llamandoyc al desplazamiento y am a la aceleracion maximos de la masa equivalentese tiene

k =meamyc + ay3

c

(6.77)

o

a =meam − kyc

ky3c

(6.78)

Fijando me, am e yc se puede definir un intervalo de valores admisibles dek, (kmin, kmax) y obtener los correspondientes valores de a. Observese quedebe ser meam > kyc. Para los valores anteriores:

k <10−4 × 800

5× 10−5= 1600N/m (6.79)

La alta aceleracion, de 800m/s2, no esta asociada a la variable p2 = y2 −y1 − L, sino a la masa m2, o sea, a y2.

Con objeto de obtener un significado fısico mas claro, consideremos elmodelo lineal con a = 0:

m1y1 = u(t) + k(y2 − y1) + β(y2 − y1)

m2y2 = −k(y2 − y1)− β(y2 − y1) (6.80)

donde se ha tomado L = 0 por simplicidad. Se trata de determinar lafuncion de transferencia

G(s) =Y2(s)

U(s)(6.81)

Page 123: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.9. ANALISIS DE VALORES NUMERICOS 123

Tomando transformada de Laplace con condiciones iniciales nulas:

m1s2Y1(s) + βsY1(s) + kY1(s)− βsY2(s)− kY2(s) = U(s)

−βsY1(s)− kY1(s) +m2s2Y2(s) + βsY2(s) + kY2(s) = 0 (6.82)

Reordenando y eliminando Y1(s) llegamos a

Y2(s) =1

m1m2(βs+ k)

s2(s2 + βmes+ k

me)U(s) (6.83)

con

me =m1m2

m1 +m2(6.84)

La ecuacion (6.83) se utiliza para estimar los parametros del sistema β yk. De la bibliografıa se conoce que m1 = m2 = 2 × 10−4Kg y por tantome = 10−4 Kg. El termino cuadratico de (6.83) se escribe como

s2 +β

me

s+k

me

= s2 + 2δωn + ω2n (6.85)

por tanto, wn =√k/me y 2δωn = β/me. La frecuencia de resonancia del

dispositivo es de 739Hz = 46,6,57 rad/s. Tomamos ωn igual a ese valor ytenemos k = ω2

nm3 = 2,156 × 103 N/m. Si especificamos un coeficiente deamortiguamiento δ = 0,1, se obtiene para β

β = 2δωnme = 0,09286Kg/s (6.86)

Con todo esto, escribimos la funcion de transferencia:

G(s) =Y2(s)

U(s)=

1

4

108(0,09286s+ 2156)

s2(s2 + 928,6s+ 2,156× 107)(6.87)

La Figura (6.5) representa el diagrama de Bode para la funcion de trans-ferencia anterior, sin tener en cuenta el factor 1/4.

La frecuencia de resonancia aparece en ωr = 4383 rad/s. Por consiguiente,los valores anteriores pueden considerarse admisibles. Por otro lado, si elmuelle es no lineal, puesto que el parametro a > 0, de la ecuacion (6.78) sesigue

Page 124: Modelado y control de masas acopladas. Aplicación a dispositivos ...

124 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

−250

−200

−150

−100

−50

0

50

Mag

nitu

de (d

B)

102

103

104

105

106

−360

−315

−270

−225

−180

Pha

se (d

eg)

Bode Diagram

Frequency (rad/sec)

Figura 6.5 Diagrama de Bode para la funcion de transferenciaG(s) = Y2(s)/U(s) = (108(0,09286s+ 2156))/(s2(s2 + 928,6s+ 2,156× 107))

am >kycme

= 1078m/s2 (6.88)

Tomando am = 1200m/s2, de (6.78) se determina el valor para el parametroa del muelle:

a =meam − kyc

ky3c

= 4,526× 107 (6.89)

Sin embargo, los valores de aceleracion de la bibliografıa son del ordende 800m/s2. Si tomamos para yc = 10µm, se obtendrıa una aceleracionam = 215,6m/s2. Con am = 800m/s2, a = 2,7× 1010. En cuanto a la fuerzau(t) aplicada a la masa m1, tenemos

m1y1 ∼ u(t) + k(y2 − y1) (6.90)

Page 125: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.9. ANALISIS DE VALORES NUMERICOS 125

de donde

u(t) ∼ m1am + kyc = 0,18156N (6.91)

En resumen, los valores de los parametros usados para obtener las graficas(6.6) a (6.15) han sido m1 = m2 = 10−4Kg, k = 2156N/m, (δ = 10−3,β =9,3 × 10−4 Kg/s), (δ = 10−2,β = 9,3 × 10−3 Kg/s), am = 1200m/s2, a =4,5× 10−7 e yc = 50µm

0 1 2 3 4 5 6 7 8

x 10−5

−0.1

−0.05

0

0.05

0.1

x1(1,1:ni) = p2(t) = y

2(t) − y

1(t) − L (m)

dp2(t

)/dt

(m/s

eg)

−8 −6 −4 −2 0 2 4 6 8

x 10−5

−0.1

−0.05

0

0.05

0.1

x1(1,1:ni) = p2(t) = y

2(t) − y

1(t) − L (m)

dp2(t

)/dt

(m/s

eg)

Figuras 6.6-6.7 Dos aspectos del retrato de fase para p2(t).

De los valores de los parametros se deduce que para β = 0 hay un centro

en ±√α/(ω2

0a = ±4,714× 10−5 que coincide con el de la Figura (6.6).

Observese que si calculamos el primer valor de Lyapunov, de acuerdo con loestudiado en el apartado correspondiente del analisis del sistema con muelleduro y sin realimentacion, se obtendra un resultado similar. En efecto, elJacobiano del sistema en los puntos p1,2 tiene autovalores λ1,2 = ±i

√2α, de

forma que para β → 0 aparece una bifurcacion de Poincare- Andronov-Hopf.

Page 126: Modelado y control de masas acopladas. Aplicación a dispositivos ...

126 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7−1

−0.5

0

0.5

1x 10−4

Tiempo t (seg)

x 1(1,:)

; x

2(1,:)

(m

)

−8 −6 −4 −2 0 2 4 6 8 10

x 10−5

−0.1

−0.05

0

0.05

0.1

x1(1,:) = p

2 (m)

x 1(2,:)

= d

p 2/dt

(m/s

eg)

xo2

= xo1

+ xo1

.10−8

Dependencia sensible

Figura 6.8-6.9 Dependencia sensible de x1(t) cuando se toman doscondiciones iniciales que difieren 10−8, y aparicion de un atractor extrano.

En este caso, L1 < 0 y α(µ) < 0 y por tanto p1,2 son puntos de equilibrioestables, tal como muestra claramente la simulacion de la Figura (6.7).

A continuacion se simula el sistema para estudiar bajo que condiciones elvector de Melnikov informa sobre la posibilidad de comportamiento caotico.El resultado de esta simulacion se presenta en las figuras (6.10)-(6.12).

De acuerdo con la ecuacion (6.73), se puede obtener el valor lımite para ω yA1 para tener la condicion necesaria para comportamiento caotico. Si fijamosA1 = 0,008, β = 9,3 × 10−4, γ = A1/m1 = 4,3010, πω/2

√α = 0,106,108 y

cosh(πω/2√α) = 1,0057. Como ω debe ser menor que 100, el termino cosh()

puede tomarse como 1, con lo cual

γ

ω∼ 4

3πω

√α3

2ω20a

(6.92)

Page 127: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.9. ANALISIS DE VALORES NUMERICOS 127

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8−1

−0.5

0

0.5

1x 10−4

Tiempo (seg)

x 1(1,:)

; x2(1

,:) (

m)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8−1.5

−1

−0.5

0

0.5

1

1.5x 10−4

Tiempo (seg)

E =

x1(1

,:)−x

2(1,:) x

o2 = x

o1 + x

o1.10−15

Figuras 6.10-6.11 Dependencia sensible de las condiciones iniciales.

de donde ω ∼ 7,0932 rad/s. Por consiguiente, valores menores que este nodan comportamiento caotico. Si fijamos ω = 100, sera

A1 =4β

3πω

√α3

2ω20a

cosh(πω

2√α

) = 0,0002857 (6.93)

valor para el que con seguridad no hay caos. Unos comentarios finales sobrelas graficas obtenidas en esta seccion. En la Figura 6.8 aparece el fenomenode dependencia sensible, de forma que cuando se simula el sistema con doscondiciones iniciales que difieren en 10−8, para un tiempo de 0,3s el sistemamuestra comportamientos completamente diferentes, y por tanto la predic-cion para tiempos grandes es imposible. En la Figura 6.9 se indica la aparicionde un atractor extrano en torno a la orbita homoclınica. Claramente apare-cen estructuras de doblado y plegado caracterısticas de los sistemas caoticos.Las Figuras 6.10 y 6.11 muestran un caso similar al indicado en las Figuras6.8 y 6.9. Se observa que aun con errores iniciales del orden de 10−15, a partirde t = 0,4s la prediccion se hace imposible. En la Figura 6.12 se muestra

Page 128: Modelado y control de masas acopladas. Aplicación a dispositivos ...

128 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1

x 10−4

−0.1

−0.08

−0.06

−0.04

−0.02

0

0.02

0.04

0.06

0.08

0.1

x1(1,:) = p2(t) (m)

x1(2

,:) =

dp 2(t)

/dt (

m/s

eg)

Figura 6.12 Otro aspecto del retrato de fase p2(p2).

un atractor extrano en torno a la orbita homoclınica con la particularidadde que se observa claramente que el conjunto es denso. Como se vera masadelante, este comportamiento tiene implicaciones muy importantes desdeel punto de vista del control. La Figura 6.13 muestra la densidad espectralde potencia de la variable x1(t) en funcion de la frecuencia angular ωd dela perturbacion. Observese que esta forma del espectro es caracterıstica delos sistemas caoticos. De nuevo se concluye con razonable confianza que lasmasas acopladas se comportan de forma caotica.

6.10. Dinamica impulsiva

6.10.1. Motivacion

La respuesta de sistemas de una entrada y una salida ante entradas impul-sivas se describe bien en terminos de la funcion de transferencia. Sin embargo,esta descripcion no es adecuada cuando el sistema tiene multiples entradas osalidas. En estos casos, la funcion de transferencia de convierte en una matriz

Page 129: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.10. DINAMICA IMPULSIVA 129

0 50 100 150 200 250 30010

−7

10−6

10−5

10−4

10−3

Frecuencia angular ωd (rad/seg)

S =

log(

abs(

Fp))

Den

sida

d es

pect

ral d

e po

tenc

ia

Frecuencia angular de perturbación

Figura 6.13 Densidad espectral de potencia.

de transferencia, donde cada elemento es una funcion racional de la variabletransformada de Laplace. Por otro lado, la funcion de transferencia da cuen-ta del comportamiento del sistema para un unico conjunto de condicionesiniciales: aquel para el que todas las variables son nulas.

En esta seccion nos interesaremos por la dinamica impulsiva de dos masasacopladas que pueden moverse en un plano, problema mas general pero queadmite solucion analıtica exacta.

La Dinamica impulsiva es uno de los campos donde mas evidente se hacela diferencia de enfoque entre la Mecanica Vectorial y la Analıtica. En primerlugar, la primera requiere, para cada cuerpo, hacer el censo de las fuerzas queactuan sobre el. Pero las fuerzas impulsivas tienen un caracter especial quelas hace difıciles de tratar. Una fuerza impulsiva ideal tiene una magnitudmuy alta, pero se aplica durante un intervalo de tiempo muy breve. En ellımite, una fuerza impulsiva tiene una magnitud infinita y se aplica duranteun intervalo infinitesimal, de forma que su integral durante ese intervalo

Page 130: Modelado y control de masas acopladas. Aplicación a dispositivos ...

130 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

permanece acotada.

Son frecuentes en los textos elementales ejemplos sencillos que se resuelvenmediante hipotesis sobre las deformaciones que sufren los cuerpos implicados,que a su vez permiten estimar los impulsos.

En segundo lugar, el tratamiento vectorial no permite un punto de vistamas general, que incluya los efectos de las ligaduras, y en particular los efectosde su implantacion subita.

Estos dos defectos son superados de forma elegante por la Mecanica Analı-tica. Por una parte, integra de forma natural los efectos de las fuerzas impul-sivas y la implantacion brusca de ligaduras. Por otra, y esta es la diferenciabasica que queremos resaltar aquı, concibe el choque de los cuerpos no co-mo la aplicacion de un impulso sobre uno de ellos por el otro, sino comola implantacion de una ligadura de contacto entre ambos. Recordemos quela Mecanica Vectorial trata partıculas, mientras que la Mecanica Analıticatrata sistemas. Cuando dos cuerpos chocan, se manifiesta sobre el sistemaformado por ambos una ligadura que los obliga momentaneamente a per-manecer en contacto. Incluso esta ligadura puede ser persistente, y quedarlos cuerpos unidos a partir del instante del choque. Pero, momentanea o per-sistente, la ligadura es efecto de una fuerza, que en Mecanica Vectorial espreciso conocer, pero que en Mecanica Analıtica, simplemente no aparece.

De esta forma, podremos resolver los problemas de choque sin acudir ahipotesis sobre las fuerzas involucradas, usando a lo sumo el hecho experi-mental de que despues del choque la velocidad relativa de los dos cuerpos esuna fraccion de la velocidad relativa antes del mismo, y tiene sentido con-trario.

6.10.2. Ecuacion fundamental

Consideremos la ecuacion fundamental (C.14), que reproducimos de nuevopor conveniencia:

j

[d

dt

∂T

∂qj− ∂T

∂qj−Qj

]δqj = 0 (6.94)

Page 131: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.10. DINAMICA IMPULSIVA 131

Qj incluye las fuerzas aplicadas, impulsivas o no, y dentro de las segundas,las que derivan de un potencial y las que no. Destaquemos explıcitamentecon un asterisco las fuerzas impulsivas, y escribamos:

j

[d

dt

∂T

∂qj− ∂T

∂qj−Qj −Q∗j

]δqj = 0 (6.95)

El fenomeno impulsivo, que incluye tanto fuerzas de percusion como fuerzasde ligadura que aparecen bruscamente, tiene lugar durante un pequeno inter-valo que centraremos en el instante t0. Integrando 6.95 entre t0 − τ y t0 + τ ,tenemos:

j

∫ t0+τ

t0−τ

[d

dt

∂T

∂qj− ∂T

∂qj−Qj −Q∗j

]dtδqj = 0 (6.96)

Recordemos que

T =∑

i

1

2mi ˙ri

2(6.97)

y que

˙ri =∑

j

∂ri∂qj

qj +∂ri∂t

(6.98)

Por tanto, T es una funcion cuadratica de las velocidades generalizadas.Ahora bien, durante un choque se produce un cambio brusco de velocidad,pero sin cambio de posicion, y de forma que, en cualquier caso, las velocidadespermanecen acotadas. De esta forma, al integrar la ecuacion anterior, losterminos segundo y tercero se anulan a medida que τ → 0. Sirve similarrazonamiento para el termino que incluye la funcion de Rayleigh F , que esfuncion cuadratica de las velocidades generalizadas, que como queda dichopermanecen acotadas durante el choque. Pero puesto que la integral de unafuerza de percusion permanece acotada, tenemos finalmente (vease [47],[48]):

j

[∆

(∂T

∂qj

)− Tj

]δqj = 0 (6.99)

donde los Tj son los impulsos generalizados aplicados al sistema.

Page 132: Modelado y control de masas acopladas. Aplicación a dispositivos ...

132 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

Si todas las qj son independientes y permanecen ası despues del choque,6.99 son n ecuaciones que contienen n incognitas: las n velocidades despuesdel choque.

Ahora bien, si admitimos la implantacion simultanea de m ligaduras de laforma ϕh(q1, · · · , qn), con h = 1, · · · , m, introduciendo m multiplicadores deLagrange λh podemos escribir, siguiendo el procedimiento ya usado antes:

j

[∆

(∂T

∂qj

)− Tj +

h

λh∂ϕh∂qj

]δqj = 0 (6.100)

donde ahora, para cada j = 1, · · · , n:

(∂T

∂qj

)− Tj +

h

λh∂ϕh∂qj

= 0 (6.101)

que es un sistema de n ecuaciones y n+m incognitas: las n q+j y las m λh.

El superındice + indica valores despues del choque (analogamente, usaremosel superındice − para referirnos a valores antes del choque). Las m ecuacionesrestantes son naturalmente las relaciones ϕh, pero solo si las ligaduras sonpersistentes, y siguen existiendo despues de t0.

Quedan por tanto dos preguntas por responder: ¿Que ocurre si no dis-ponemos de las relaciones finitas ϕh, sino solo de relaciones diferenciales (ligaduras no holonomas )? y ¿Que ocurre si los enlaces no son persistentestras el choque y por tanto carecemos de cualquier tipo de relacion adicional,finita o no, para completar el numero de ecuaciones precisas ?.

6.10.3. Implantacion de ligaduras no holonomas

En este caso, existen relaciones diferenciales entre las coordenadas, o loque es igual, las relaciones entre las velocidades de la forma:

j

∂ϕh∂qj

qj +∂ϕh∂t

= 0 (6.102)

Si bien desconocemos las relaciones ϕh, las ligaduras adquieren la forma

j

ajhqj + ath = 0 (6.103)

Page 133: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.10. DINAMICA IMPULSIVA 133

lo que permite identificar:

ajh =∂ϕh∂qj

(6.104)

6.103 es el conjunto de m ecuaciones que completan el sistema.

6.10.4. Ligaduras no persistentes

La segunda pregunta que formulabamos atras requiere una explicacion masdetallada. Sin perdida de generalidad, consideremos solo la existencia de unaligadura de contacto momentanea. Las ecuaciones generales 6.101 se traducenentonces en

(∂T

∂qj

)− λ ∂ϕ

∂qj= 0 (6.105)

para j = 1, · · · , n. Esto puede escribirse como:

(∂T

∂qj

)/∂ϕ

∂qj= λ (6.106)

que es un sistema de n− 1 ecuaciones en las n incognitas qj+. La ecuacion

faltante se obtiene de la observacion experimental. Cuando los cuerpos entranen contacto, existe un plano tangente comun a ambos. Este plano tiene unanormal por el punto de contacto, y la experiencia dice que, si llamamos P alpunto del primer cuerpo que entra en contacto con P ∗ en el segundo cuerpo,entonces la velocidad de alejamiento tras el choque es una fraccion de lavelocidad de acercamiento. Expresado matematicamente, si n es la normalcomun a ambos cuerpos en el punto de contacto:

[v+(P )− v+(P ∗)

]n = −ε

[v−(P )− v−(P ∗)

]n (6.107)

donde ε es el llamado coeficiente de restitucion, que es un valor entre 0 y1. Para ε = 0, los cuerpos quedan en reposo relativo en el instante inmedia-tamente posterior al choque; para ε = 1 los cuerpos se alejan a la mismavelocidad a la que se aproximaron. En el primer caso se habla de choquestotalmente inelasticos, y en el segundo de choques totalmente elasticos. Laecuacion 6.107 es conocida como ecuacion de Newton.

Page 134: Modelado y control de masas acopladas. Aplicación a dispositivos ...

134 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

6.10.5. Sistema de dos masas acopladas

Consideremos el sistema de dos masas m1 y m2 acopladas mediante unelemento elastico y un amortiguador, libres de moverse en el plano y quereciben el impacto de una tercera masa m′. Tomaremos como coordenadasgeneralizadas del sistema las coordenadas X, Y de m1, las coordenadas η, νde m2 y el angulo θ que forma la lınea sobre la que descansan m1 y m2 conel eje X. La energıa cinetica del sistema de masas acopladas es

T =1

2m1(X2 + Y 2)+

1

2m2(X2 + Y 2 +L2θ2 +2Lθ(Y cos θ−X sen θ)) (6.108)

siendo L la distancia entre m1 y m2, que ahora no tiene que coincidirnecesariamente con la distancia de equilibrio. La energıa de la masa queimpacta con el sistema es

η ν( ). .

m m

m’

(X,Y)

L

X

Y

1 2

θ

Figura 6.15 Respuesta ante impactos en dos dimensiones.

Page 135: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.10. DINAMICA IMPULSIVA 135

T ′ =1

2m′(η2 + ν2) (6.109)

En relacion con la ecuacion fundamental 6.99 de la dinamica impulsiva,tenemos:

∂T

∂X= (m1 +m2)X −m2Lθ sen θ

∂T

∂Y= (m1 +m2)Y +m2Lθ cos θ

∂T ′

∂η= m′η

∂T ′

∂ν= m′ν

∂T

∂θ= m2L

2θ +m2L(Y cos θ − X sen θ) (6.110)

El impacto no es mas que una ligadura que mantiene en contacto a m′ conm2 (la eleccion de m2 no resta generalidad al tratamiento), y que se expresacomo:

ν − Yη −X = tan θ (6.111)

o

ϕ = ν − Y − (η −X) tan θ (6.112)

donde las coordenadas toman los valores del instante en que se produce elimpacto. Calculamos:

∂ϕ

∂X= tan θ

∂ϕ

∂Y= −1

∂ϕ

∂η= − tan θ

∂ϕ

∂ν= 1

Page 136: Modelado y control de masas acopladas. Aplicación a dispositivos ...

136 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

∂ϕ

∂θ= −(η −X) sec2 θ (6.113)

Una unica ligadura de contacto implica la introduccion de un multiplicadorde Lagrange, de forma que la relacion

(∂T

∂qj

)− λ ∂ϕ

∂qj= 0 (6.114)

implica un sistema de cinco ecuaciones y seis incognitas X+, Y +, θ+, η+,ν+ y λ. Es preciso, llegados a este punto, considerar los dos casos siguientes:

A) Choque inelastico

La masa m′ queda unida a m2 tras el impacto. En este caso, la ligaduraϕ = 0 sigue siendo valida tras el choque. Como este se produce sin cambiosen las coordenadas, tan solo en las velocidades, podemos tomar su derivadarespecto al tiempo y escribir:

ν+ − Y + − (η+ − X+) tan θ − (η −X)θ+ sec2 θ = 0 (6.115)

Y el problema queda reducido a la resolucion del sistema lineal de seisecuaciones con seis incognitas:

M(X+ − X−)−m2L sen θ(θ+ − θ−) + λ tan θ = 0

M(Y + − Y −) +m2L cos θ(θ+ − θ−)− λ = 0

m′(η+ − η−)− λ tan θ = 0

m′(ν+ − ν−) + λ = 0

m2L2(θ+ − θ−)−m2L sen θ(X+ − X−)

+m2L cos θ(Y + − Y −)− λ(η −X) sec2 θ = 0

ν+ − Y + − (η+ − X+) tan θ − (η −X)θ+ sec2 θ = 0 (6.116)

B) Choque elastico

Si el choque es elastico, la ligadura ϕ = 0 no es valida tras el choque, ypor tanto la ultima de las ecuaciones consideradas en el caso inelastico no esaplicable. Ha de ser sustituida por el hecho experimental de que la proyeccionde la velocidad relativa entre los dos puntos que entran en contacto sobre la

Page 137: Modelado y control de masas acopladas. Aplicación a dispositivos ...

6.10. DINAMICA IMPULSIVA 137

normal comun a ambos tras el choque es una fraccion ε de la que habıa antesdel mismo. A ε se le llama coeficiente de restitucion. En nuestro caso, y enreferencia a la ecuacion 6.107, tenemos

v(P ) =

[X − Lθ sen θ

Y + Lθ cos θ

](6.117)

v(P ∗) =

[ην

](6.118)

Por otra parte, la normal a m2 tiene componentes

n =

[sen θ− cos θ

](6.119)

La ecuacion faltante es entonces:

X− sen θ − Y − cos θ − Lθ− − η− sen θ + ν− cos θ =

−ε[X+ sen θ − Y + cos θ − Lθ+ − η+ sen θ + ν+ cos θ

](6.120)

Conviene hacer notar que no es el mismo fenomeno fısico un choque per-fectamente inelastico que un choque elastico con coeficiente de restitucionε = 0. En el primer caso, la ligadura de contacto persiste tras el choquepara tiempos posteriores arbitrarios, mientras que en el segundo solo se ase-gura que la velocidad relativa de los puntos que entran en contacto es nulainmediatamente despues del choque.

Por tanto, tanto en el caso de choque elastico como en el caso de choqueinelastico, lo que encontramos es una relacion lineal entre las velocidadesantes y despues del choque. Sobre las implicaciones de este hecho, veanse loscomentarios en el capıtulo de conclusiones.

Page 138: Modelado y control de masas acopladas. Aplicación a dispositivos ...

138 CAPITULO 6. DINAMICA NO LINEAL E IMPULSIVA

Page 139: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 7

Sistema completamenteactuado

7.1. Modelo y ecuaciones de control

Tal y como se discutio al deducir el modelo matematico de dos masasacopladas, de acuerdo con las ecuaciones (6.7), el modelo viene dado pordos osciladores de Duffing acoplados. Por otro lado, en el capıtulo anteriorse han obtenido valores razonables para los parametros del sistema y se haanalizado el comportamiento dinamico de las dos ultimas ecuaciones (6.7)con una realimentacion lineal del estado, elegida de tal forma que se tenıa unoscilador de Duffing, cuyo retrato de fases del sistema Hamiltoniano poseıauna orbita homoclınica.

La presencia de esta orbita homoclınica permitio obtener condiciones nece-sarias para comportamiento caotico.

Supongamos ahora que se consideran las ecuaciones (6.7) con la ley derealimentacion simple dada por (6.41), es decir:

x1 = x2

x2 =k

m1x3 + a

k

m1x3

3 +β

m1x4 +

1

m1u1(t)

x3 = x4

x4 = − k

me

x3 − ak

me

x33 −

β

me

x4 −1

m1

u1(t) +1

me

u2(t)

u1(t) = −kpx3(t)− u(t) (7.1)

139

Page 140: Modelado y control de masas acopladas. Aplicación a dispositivos ...

140 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

Si se sustituye la ultima ecuacion de (7.1) en las anteriores, el sistema no vaa funcionar correctamente, aun tomando u2(t) = 0. Efectivamente, operandose obtiene

x1 = x2

x2 =

(k

m1− kpm1

)x3 + a

k

m1x3

3 +β

m1x4 −

1

m1u(t)

x3 = x4

x4 =

(kpm1− k

me

)x3 −

β

mex4 −

1

m1u(t) +

1

meu2(t) (7.2)

Si recordamos que kp se elige de forma que kp > kpm, con kpm = (m1/me)k( m1 > me ), los puntos de equilibrio de (7.2) son

(k

m1− kpm1

)x3 + a

k

m1x3

3 = 0

(kpm1

− k

me

)x3 − a

k

me

x33 = 0 (7.3)

y puesto que las ecuaciones (7.2) constituyen dos osciladores acoplados,resulta que para el primer oscilador se obtiene

−(kp − k)x3 + akx33 = 0 (7.4)

con kp > k, de donde se siguen los puntos de equilibrio

x3e = ±√kp − kak

(7.5)

mientras que para el segundo oscilador se obtendra

(kpm1

− k

me

)x3 − a

k

me

x33 = 0 (7.6)

con kp > (m1/me)k y puntos de equilibrio

Page 141: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.1. MODELO Y ECUACIONES DE CONTROL 141

x3e = 0

x3e = ±√√√√ ak/m1

(kp/m1)− (k/me)(7.7)

y vemos que (7.5) y (7.7) representan puntos de equilibrio distintos, locual es imposible. Se podrıa argumentar que si en el equilibrio las senales decontrol no son nulas, las ecuaciones (7.3) se reducirıan a:

(k

m1− kpm1

)x3 + a

k

m1x3

3 −1

m1ue = 0

(kpm1

− k

me

)x3 − a

k

me

x33 −

1

m1

ue +1

me

u2e = 0 (7.8)

o lo que es igual

akx33 − (kp − k)x3 − ue = 0

−a k

me

x33 +

(kpm1

− k

me

)x3 −

1

m1

ue +1

me

u2e = 0 (7.9)

Las ecuaciones (7.9) son cubicas de forma que si se eligen valores de kp >kpm y ue, de acuerdo con la primera de (7.9) se tendra una raız real y portanto habra que elegir u2e para que la segunda de (7.9) tenga la misma raızreal. Es obvio que esta forma de operar puede ser muy ineficaz.

Los razonamientos anteriores conducen directamente a otra forma de abor-dar el control. Supongamos que u1(t) y u2(t) actuan sobre cada una de lasmasas m1 y m2. Para simplificar, usaremos las ecuaciones

p1 =k

m1(p2 + ap3

2) +β

m1p2 +

1

m1u1(t)

p2 = − k

me

(p2 + ap32)− β

me

p2 −1

m1

u1(t) +1

me

u2(t) (7.10)

Page 142: Modelado y control de masas acopladas. Aplicación a dispositivos ...

142 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

Si en las ecuaciones anteriores se eligen valores para u1(t) y u2(t) de formaque los coeficientes sean iguales, los puntos de equilibrio de los dos subsis-temas de Duffing acoplados seran los mismos. Por ejemplo, si se elige

u1(t) = −akqp32 − β1p2 + f1(t)

u2(t) = kpp2 − β2p2 + f2(t) (7.11)

las ecuaciones (7.10) se reducen a

p1 =k

m1p2 − a

(kqm1− k

m1

)p3

2 −(β1

m1− β

m1

)p2 +

1

m1f1(t)

p2 =

(kpme

− k

me

)p2 − a

(k

me

− kqm1

)p3

2 −(β

me

− β1

m1

+β2

me

)p2

− 1

m1f1(t) +

1

mef2(t) (7.12)

Si recordamos el analisis realizado anteriormente, el coeficiente de p2 debıaser positivo ( esto es lo que se conseguıa con la ley de realimentacion (6.41) )y el de p3

2 negativo, lo mismo que el de p2. Con estas ideas, de las ecuaciones(7.12) se busca que tengan los mismos puntos de equilibrio. Esto debe serası, ya que en caso contrario se obtienen incompatibilidades de tipo fısico. Laidea es determinar los valores de los parametros en las ecuaciones (7.11) paraque los puntos de equilibrio en (7.12) sean los mismos. Para ello, se realizanlas siguientes identificaciones:

k

m1=

kpme− k

me⇒ kp = k(

me

m1+ 1) (7.13)

kqm1− k

m1=

k

me− kqm1⇒ kq =

k

2(m1

me+ 1) (7.14)

β1

m1

− β

m1

= δ ⇒ β1 = β +m1δ (7.15)

con 1 < δ < 10. Por otro lado, de la (7.15) y de la segunda de (7.12), aligualar los coeficientes en p2 se deduce:

β2 = 2meδ − β(1− me

m1

) (7.16)

Page 143: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.1. MODELO Y ECUACIONES DE CONTROL 143

Llegados a este punto podemos preguntarnos ¿ Como especificar f1(t) yf2(t) en (7.11) ? Del analisis realizado anteriormente, hemos visto que elsubsistema de Duffing asociado a la masa m2, para valores senoidales de u(t)en la ley de realimentacion, podrıa tener comportamiento caotico. Ademas,vimos que en tal caso el atractor extrano ( veanse Figuras (6.6)-(6.9)-(6.11))estaba comprendido entre ±80µm, o sea, del tamano del area activa movildel dispositivo de almacenamiento masivo.

Por otro lado, es bien conocido que los atractores extranos forman un con-junto denso en el plano de fases, lo cual significa que si se fija un puntode consigna arbitrario en el intervalo 0 <= xe <= 80µm y el dispositivoesta oscilando en forma caotica, necesariamente habra un instante de tiem-po en el que el estado dinamico del sistema este muy proximo al punto deconsigna fijado. Si en ese instante se suprime el comportamiento caotico y seaplica un control adecuado para que el punto de consigna sea el unico puntode equilibrio del sistema y ademas que dicho punto sea estable, sera posiblellegar al punto que se desee leer de la zona activa con un esfuerzo pequeno,en general sub-optimo.

Observese que el hecho de que el control sea pequeno no es tan impor-tante. Lo verdaderamente significativo desde el punto de vista del control esla posibilidad de que cualquier punto de la zona activa tenga acceso a loscabezales de lectura-escritura del dispositivo de almacenamiento masivo.

Dados los valores tıpicos de los parametros en que nos estamos moviendo( masas del orden de 10−4 Kg, distancias del orden de micras y aceleracionesque pueden superar los 500m/s2 ) es obvio que una estrategia de controleficiente es necesaria. De hecho diversas estrategias de control optimo nolineal pueden dar lugar a problemas numericos, aun cuando se implementencasos de control de tiempo mınimo en problemas lineales ( masas acopladaspero con muelle lineal ).

Para concretar las ideas anteriores consideremos de nuevo las ecuaciones(7.10)-(7.11). Supongamos que los valores de f1(t) y f2(t) se eligen de laforma

f1(t) = A1 cos(ωd1t)

f2(t) = A2 cos(ωd2t) (7.17)

Page 144: Modelado y control de masas acopladas. Aplicación a dispositivos ...

144 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

Entonces, las ecuaciones (7.12) pasan a ser de la forma

p1 =k

m1

p2 − a(kqm1

− k

m1

)p3

2 −(β1

m1

− β

m1

)p2 +

A1

m1

cos(ωd1t)

p2 =

(kpme− k

me

)p2 − a

(k

me− kqm1

)p3

2 −(β

me− β1

m1− β2

me

)p2

−A1

m1cos(ωd1t) +

A2

mecos(ωd2t) (7.18)

Si elegimos

A2 =2me

m1A1

ωd2 = ωd1 (7.19)

La perturbacion senoidal en las ecuaciones (7.18) sera la misma. Si en estascondiciones se buscan los valores de A1 y ωd para que el sistema sea caotico,y llamamos tf el tiempo que tarda el dispositivo en pasar cerca del puntode consigna, conmutando en ese instante a la ley de control que se indica acontinuacion:

Para t < tf :

u1(t) = −akqp32 − β1p2 + A1 cos(ωdt)

u2(t) = kpp2 − β2p2 +2me

m1A1 cos(ωdt) (7.20)

y para t > tf

u1(t) = F1

u2(t) =2me

m1F1 (7.21)

bastarıa con elegir F1 de forma que el punto de equilibrio de las ecuaciones(7.18) fuera el punto de consigna predeterminado. Llamando p2e al puntode equilibrio ( que se relaciona facilmente con las coordenadas absolutas deequilibrio a traves de p2e = y2e − y1e ), de (7.18) y (7.20) se sigue

Page 145: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.1. MODELO Y ECUACIONES DE CONTROL 145

− k

me

p2e − ak

me

p32e +

F1

m1

= 0 (7.22)

que es una ecuacion cubica de la forma

x3 +mx− n = 0 (7.23)

con m = 1/a, n = F1/(m1aω20) y ω2

0 = k/me. La ecuacion (7.23) se puedeescribir en la forma

x3 +mx−n = (x−p)(x2 +b1x−c) = x3 +(b1−p)x2 +(c−pb1)x−pc (7.24)

de donde se deduce que b1 = p, c−pb1 = m, pc = n y finalmente c = m+p2.Usando estas relaciones y las ecuaciones anteriores podrıa operarse en laforma:

% fijar intervalo para ’p’

>>p=[pmin:(pmax-pmin)/(Np-1):pmax];

>>Np=length(p);

>>c=m*ones(1,Np)+p.^2;

>>n=p.*x;

>>F1=m1*a*w0^2*n;

>>plot(p,F1);

Para cada valor de p existe un punto de equilibrio al que corresponde unvalor de F1. Calculamos el jacobiano cuando se ha conmutado a la ley decontrol constante, y entonces

p2 = − k

mep2 − a

k

mep3

2 −β

mep2 + F1

x3 = x4

x4 = −ω20x3 − aω2

0x33 − bx4 + F1 (7.25)

El jacobiano y los autovalores asociados al punto de equilibrio p2e = x3e

son

J =

[0 1

−ω20 − 3aω2

0x23e −b

](7.26)

Page 146: Modelado y control de masas acopladas. Aplicación a dispositivos ...

146 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

y

λ1,2 =1

2(−b±

√b2 − 4ω2

0(1 + 3ax23e)) (7.27)

Como ω20 > 0 y b = β/me > 0 y a > 0, la estabilidad depende del valor

de x3e. Puesto que a cada valor de p le corresponde un punto de equili-brio, [pmin, pmax] → [x3emin, x3emax]. De la ecuacion (7.27) se deduce que si1 + 3ax2

3e > 0, con b = 0, entonces los puntos de equilibrio son complejosconjugados puros y nada se puede afirmar respecto a la estabilidad de dichospuntos de equilibrio.

La ley de realimentacion (7.20)-(7.21), aunque en principio puede pare-cer adecuada, tiene el siguiente inconveniente: como la conmutacion de laley de control en t = tf es muy brusca, y teniendo en cuenta los valoresde los parametros para el caso de memorias de almacenamiento masivo, vıasimulacion se comprueba que la dinamica del dispositivo cambia tan brus-camente que da lugar a fuertes oscilaciones. Por consiguiente, esta ley derealimentacion es poco util. Sin embargo, los razonamientos anteriores abrenmas posibilidades de aplicar una ley de control del mismo tipo. Una alter-nativa serıa modificar u1(t) y u2(t) para t > tf lo menos posible, es decir, sepodrıa elegir:

u1(t) = −akqp32 − β1p2 + A1 cos(ωdt)

u2(t) = kpp2 − β2p2 +2me

m1

A1 cos(ωdt) (7.28)

para t < tf y

u1(t) = −akqp32 − β1p2 + F1

u2(t) = kpp2 − β2p2 +2me

m1F1 (7.29)

para t > tf . En este caso, las ecuaciones del sistema se escriben:

p1 =k

m1

p2 − a(kqm1

− k

m1

)p3

2 −(β1

m1

− β

m1

)p2 +

F1

m1

p2 =

(kpme− k

me

)p2 − a

(k

me− kqm1

)p3

2

Page 147: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.1. MODELO Y ECUACIONES DE CONTROL 147

−(− β

me− β

m1+β2

me

)p2 +

F1

m1(7.30)

Pasando las ecuaciones (7.30) a variables de estado, con

x1

x2

x3

x4

=

p1(t)p1(t)p2(t)p2(t)

(7.31)

x1 = x2

x2 =k

m1x3 − a

(kqm1− k

m1

)x3

3 −(β1

m1− β

m1

)x4 +

F1

m1

x3 = x4

x4 =

(kpm1

− k

me

)x3 − a

(k

me

− kqm1

)x3

3

−(β

me

− β1

m1

+β2

me

)x4 +

F1

m1

(7.32)

en donde los valores de kp,kq,β1 y β2 vienen dados por las ecuaciones (7.13),(7.14), (7.15) y (7.16), respectivamente. Por consiguiente, las ecuaciones ge-nerales del sistema, con la ley de control incluida, quedan de la forma:

x1 = x2

x2 = ω21x3 + aω2

1x33 + d1x

4 +u1(t)

m1

x3 = x4

x4 = −ω20x3 − aω2

0x33 − d2x4 −

u1(t)

m1+u2(t)

m2

ω21 =

k

m1

d1 =β

m1

ω20 =

k

me

d2 =β

me

kp = k(me

m1+ 1

)

Page 148: Modelado y control de masas acopladas. Aplicación a dispositivos ...

148 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

kq =k

2

(m1

me+ 1

)

β1 = β +m1δ

β2 = 2δme − β(

1− me

m1

)1 < δ < 10 (7.33)

con

u1(t) = −akqx33 − β1x4 + A1 cos(ωdt)

u2(t) = kpx3 − β2x4 + 2me

m1A1 cos(ωdt) (7.34)

para t <= tf y

u1(t) = −akqx33 − β1x4 + F1

u2(t) = kpx3 − β2x4 + 2me

m1

F1 (7.35)

para t > tf .

La forma de operar es la siguiente: con las ecuaciones (7.33)- (7.35) sebuscan los valores A1, ωd para que el subsistema formado por las ecuacionestercera y cuarta en (7.33) sea caotico. Para ello se aplica la condicion deMelnikov. Se fija el punto de consigna deseado a partir de los valores y1e ey2e, es decir, de las coordenadas absolutas de las masas, y siendo

p1e = x1e = y1e

p2e = x3e = y2e − y1e − L (7.36)

El punto de equilibrio sera

x1e

0x3e

0

(7.37)

Si este punto esta embebido en el atractor extrano, se espera hasta que latrayectoria caotica pase lo suficientemente cerca de el. En ese instante t = tfse conmuta la ley de control, se destruye el caos y se espera a que el sistemaalcance el punto de equilibrio.

Page 149: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.1. MODELO Y ECUACIONES DE CONTROL 149

Analizemos los puntos de equilibrio que son alcanzables. Para ello intro-ducimos la siguiente nomenclatura:

a2 =kpm1

− k

m1

a3 =k

me

− kqm1

b2 =β

me− β

m1− β2

me(7.38)

Cuando t = tf se produce la conmutacion de la ley de control, y el subsis-tema dado por las ecuaciones en x3 y x4 se convierte en

x3 = x4

x4 = a2x3 − aa3x33 − b2x4 +

F1

m1(7.39)

En el equilibrio se verifica

x33 −

a2

aa3

x3 −F1

m1aa3

= 0⇒ x3 −mx− n = 0 (7.40)

con

m =a2

aa3

n =F1

m1aa3(7.41)

Razonando de la misma forma discutida anteriormente, las ecuaciones(7.23)-(7.24) son validas, pero teniendo en cuenta el cambio de signo

x3−mx− n = (x− p)(x2 + bx+ c) = x3 + (b− p)x2 + (c− pb)x− pc (7.42)

con

b = p

c− pb = −m

Page 150: Modelado y control de masas acopladas. Aplicación a dispositivos ...

150 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

pc = n

c = p2 −m (7.43)

Fijando un intervalo de valores de p, escribirıamos el codigo Matlab si-guiente:

>> p = [ pmin:(pmax-pmin)/(Np-1) ;

>> % Np = numero de puntos deseados

>> c = p*n-m*ones(1,Np) ;

>> n = p .* c ;

>> F1 = m1*a*a3*n ;

>> plot(p,F1)

Al representar p frente a F1 se obtienen los valores de F1. Se busca que valorde F1 da lugar a una raız real de (7.40) tal que sea el punto de equilibriodeseado x3e. Como para cada valor de p existe un x3e, habra que analizarque puntos x3e son estables. El Jacobiano del sistema es:

J =

[0 1

a2 − 3aa3x23 −b2

](7.44)

de donde

|λI− J| =∣∣∣∣∣

λ −1−a2 + 3aa3x

23e λ+ b2

∣∣∣∣∣ = 0 (7.45)

y

λ1,2 =1

2

(−b2 ±

√b2

2 + 4(a2 − 3aa3x23e))

(7.46)

Con estos valores propios, aparecen puntos silla inalcanzables si a2 >3aa3x

23e y un nodo o foco estable si a2 < 3aa3x

23e. En particular, aparece

nodo si b22 > 4(3aa3x

23e− a2) y foco si b2

2 < 4(3aa3x23e− a2). Por consiguiente,

existe un entorno centrado en el origen de radio±√a2/(3aa3) cuyos puntos no

son alcanzables, e intervalos (−x3emin,−√a2/(3aa3)) y (

√a2/(3aa3), x3emax)

que contienen puntos alcanzables.

Como el parametro a es muy grande y a2 es de su mismo orden de magni-tud, el valor de a3 que tambien es grande fija el valor de x3e.

Page 151: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.2. SIMULACIONES 151

El mantener los valores de β1 y β2 dados por las ecuaciones (7.15)-(7.16) enlas senales de control u1(t) y u2(t) para t > tf tiene el inconveniente de queb2 = δ << 1 es muy pequeno, y por tanto es posible que se produzcan fuertesoscilaciones al conmutar la ley de control. Desde un punto de vista fısico laconmutacion equivale a una disminucion brusca del rozamiento asociado ala dinamica del dispositivo, lo cual conlleva una dinamica oscilatoria. Paraevitar este problema se definen los controles u1(t) y u2(t) para t > tf en laforma

u1(t) = −akqx33 − β11x4 + F1

u2(t) = kpx3 − β22x4 +2me

m1F1 (7.47)

y se hace

β11 = β +m1δ1 δ1 >> 1

β22 = 2δ1me − β(1−me/m1) δ1 >> 10 (7.48)

7.2. Simulaciones

Las ecuaciones (7.47)-(7.48) se incluyen como una posibilidad mas paracomprobar su funcionamiento. A continuacion realizamos varias pruebas desimulacion. Los valores para los parametros son m1 = 50× 10−4, m2 = 10−4,L = 10−6, β = 0,5, k = 2156, δ = 9,486 y a = 4,5 × 107. Los restantesvalores son calculados de acuerdo con las ecuaciones (7.13)-(7.14) y (7.48).La frecuencia de Melnikov se ha tomado como 200. Para cumplir la condicionde Melnikov, el valor mınimo de la amplitud de la senal senoidal debe ser deA1min = 0,001; hemos tomado A = 0,05.

En las Figuras (7.1)-(7.2) se muestra como varıan los puntos de equilibrioen funcion de F1. Tambien se muestra como varıa la parte real de los auto-valores en funcion de x3e. Se observa que por debajo de aproximadamentex3e = 35× 10−6m existen tres puntos de equilibrio reales y entre 30 × 10−6

y 35 × 10−6 aparecen dos puntos de equilibrio estables ( con parte real ne-gativa ). En estas condiciones no sera posible posicionar el cuadro movil deldispositivo MEMS. Por debajo de 30 × 10−6, F1 < 0, lo cual indica que es-tamos en una region inalcanzable. Por encima de 35 × 10−6m aparecen dosautovalores complejos conjugados con parte real positiva y un autovalor real

Page 152: Modelado y control de masas acopladas. Aplicación a dispositivos ...

152 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

con parte real negativa y por tanto estable. Por tanto, la region admisible vade 35× 10−6 a 60× 10−6.

1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5

x 10−5

−0.1

0

0.1

0.2

0.3

0.4

Puntos de equilibrio x3e

(m)

Val

or d

e F

(N)

1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5

x 10−5

−5

0

5

10x 10−5

Puntos de equilibrio x3e

(m)

Par

te re

al ra

ices

Figuras 7.1-7.2 Variacion de los puntos de equilibrio x3e en funcion de F.

A continuacion se fijan los puntos de equilibrio de las masas m1 y m2.Tomamos y1e = 30× 10−6 e y2emax = 90× 10−6 = y1e + αL, siendo L = 10−6

la longitud del muelle sin deformar. Tomamos tambien y2e = y2emax y x3e =y2e− y1e−L = 50× 10−6m. De la Figura (7.1) se deduce que F1 = 0,1954N ,con lo cual estamos preparados para efectuar la simulacion, salvo condicionesiniciales, que fijamos con el vector xT01 = [0, 0, 2× 10−5, 0, 0, 0]. La simulacionse efectua durante un intervalo 2s. Ademas, se fija el radio que define elentorno al punto de consigna en 3 × 10−5. La entrada de la trayectoria delsistema en este entorno produce la conmutacion en la ley del control.

Se observa que las masas m1 y m2 oscilan de forma irregular y dejan deoscilar aproximadamente en 0,5 s. Las graficas (7.3)-(7.4) muestran la de-pendencia sensible con las condiciones iniciales, sıntoma claro de movimientocaotico.

Las variables x1 y x2 representan las posiciones y velocidades de las masasm1 y m2 para dos condiciones iniciales muy proximas (diferencia de 10−10). Se

Page 153: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.2. SIMULACIONES 153

0 0.5 1 1.5 2−0.04

−0.02

0

0.02

0.04

Tiempo (seg)

Val

ores

de

x l(1:2

,:)

0 0.5 1 1.5 2−0.04

−0.02

0

0.02

0.04

Tiempo (seg)

Val

ores

de

x l(3:4

,:)

Figuras 7.3-7.4 Transicion entre el regimen caotico y el deterministacuando se conmuta la ley de control, aproximadamente en t = 0,5 segundos.

observa que la masa m1, aproximadamente en t = 0,5s deja de oscilar caotica-mente y va al punto de consigna deseado x3e = 35 × 10−6, mientras que lavariable x2 deja de hacerlo aproximadamente en t = 1,3s. Esto es perfec-tamente logico, ya que cuando un sistema determinista alcanza movimientocaotico, es impredecible cuando la orbita caotica llegara a entrar en el en-torno del punto de consigna y por tanto cuando se producira la conmutacionen la ley de control. Respecto al error, al principio la diferencia entre lasdos simulaciones es practicamente cero, pero debido a la naturaleza caotica,conforme pasa el tiempo el error crece ( en un sistema no caotico el errorse mantendrıa en torno a 10−10 ) subiendo del orden de 106 en un tiempode aproximadamente medio segundo. Cuando el caos se destruye en los dossistemas el error vuelve a ser cero. Las Figuras (7.5)-(7.6) representan laposicion de la masa m1 con dos condiciones iniciales que difieren en 10−10,mientras que las Figuras (7.7)-(7.8) son las equivalente para m2.

Page 154: Modelado y control de masas acopladas. Aplicación a dispositivos ...

154 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

0 0.5 1 1.5 2−10

−5

0

5x 10−5

Tiempo (seg)

De.

sen

sibl

e: x

1(1,:)

, x2(1

,:)

0 0.5 1 1.5 2−5

0

5

10

15x 10−5

Tiempo (seg)

Err

or E

1 = x

1(1,:)

− x

2(1,:)

Figuras 7.5-7.6 Dependencia sensible. En (7.5) se muestra la evoluciontemporal de la posicion y velocidad de m1 para dos condiciones iniciales quedifieren en una cantidad muy pequena. En (7.6) se muestra la diferencia enx1(t) para dos condiciones iniciales muy proximas. Aproximadamente en 0,4segundos se entra en regimen caotico, que desaparece al conmutar la ley de

control, aproximadamente en t = 1,3 segundos.

Page 155: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.2. SIMULACIONES 155

0 0.5 1 1.5 2−1

−0.5

0

0.5

1x 10−4

Tiempo (seg)

De.

sen

sibl

e: x

1(3,:)

, x2(3

,:)

0 0.5 1 1.5 2−5

0

5

10

15x 10−5

Tiempo (seg)

Err

or E

2 = x

1(3,:)

− x

2(3,:)

Figuras 7.7-7.8 Dependencia sensible para la masa m2. El error crece delorden de 106 en un intervalo de medio segundo, cayendo bruscamente a cero

cuando se destruye el caos.

Las Figuras (7.9)-(7.10) muestran el atractor en el espacio de fases. Sepueden observar la aparicion de conjuntos de Cantor y el fenomeno de plegadoy estirado. Es interesante observar una pequena espiral en torno al punto deequilibrio: x1e = 30× 10−5, x2e = 0, x3e = 50× 10−5 y x4e = 0 que coincidecon los puntos de consigna prefijados.

Page 156: Modelado y control de masas acopladas. Aplicación a dispositivos ...

156 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

−8 −6 −4 −2 0 2 4

x 10−5

−0.04

−0.03

−0.02

−0.01

0

0.01

0.02

0.03

0.04

x1(1,:) (m)

x 1(2,:)

(m/s

eg)

Figura 7.9 Atractor extrano.

−6 −4 −2 0 2 4 6

x 10−5

−0.04

−0.03

−0.02

−0.01

0

0.01

0.02

0.03

0.04

x1(3,:) (m)

x 1(4,:)

(m/s

eg)

Figura 7.10 Atractor extrano.

Page 157: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.2. SIMULACIONES 157

En las Figuras (7.11)-(7.12) se muestra como varıan las senales de con-trol y las aceleraciones sobre las masas m1 y m2. Las fuerzas sobre ambasmasas estan comprendidas en el intervalo de ±0,5N , mientras que las ace-leraciones oscilan entre ±100ms−2, valores todos ellos admisibles para dis-positivos MEMS. Pueden compararse estos valores con los obtenidos en labibliografıa para un sistemas mas sencillo de una sola masa: ambos conjuntosse encuentran en el mismo orden de magnitud.

0 0.5 1 1.5 2−0.5

0

0.5

CONTROL Y ACELERACIONES SOBRE m1 EN AZUL Y m

2 EN VERDE

Tiempo (seg)

Con

trole

s u

1(t) u

2(t) (N

)

0 0.5 1 1.5 2−200

−100

0

100

200

Tiempo (seg)

a 1(t), a

2(t) (m

/seg

2 )

Figuras 7.11-7.12 En la primera grafica se muestran los controles sobrem1 y m2. En la segunda grafica se muestran las aceleraciones.

Un posible inconveniente del metodo propuesto esta en el hecho de quela conmutacion de la ley de control no asegura la accesibilidad de todos lospuntos del area activa movil. Por otro lado el hecho de que tengamos queesperar un tiempo indeterminado para que la trayectoria de fase pase por lasinmediaciones del punto de consigna puede ser una desventaja.

La estrategia de control presentada no puede evitar que el area activamovil del dispositivo no sea completamente accesible, pero puede actuarsesobre el tiempo de acceso. Vease la Figura (7.13), donde se muestra comovarıan las coordenadas x1(t) = p1(t) y x3(t) = p2(t). Se observa como enestado estacionario se alcanzan los puntos de consigna, al igual que en elejemplo anterior. Sin embargo ahora la conmutacion de la ley de control se

Page 158: Modelado y control de masas acopladas. Aplicación a dispositivos ...

158 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

realiza muy rapidamente debido a que el radio en torno al punto de consignase ha hecho suficientemente grande como para que no se alcance el regimencaotico. Observe como la ley de control posiciona las masas en 6 ms, lo cualpuede considerarse aceptable.

0 0.002 0.004 0.006 0.008 0.010

1

2

3

4

5

6x 10−5

Tiempo (seg)

x 1(t)(m

); x 3(t)

(m)

x1(t)

x2(t)

Figuras 7.13 Posiciones de las masas m1 y m2.

Las Figuras (7.14)-(7.15) muestran claramente el comportamiento en elespacio de fases para x1(t) y x3(t), mientras que las Figuras (7.16)-(7.17)muestran las senales de control y las aceleraciones de las masas m1 y m2. Losvalores obtenidos son completamente admisibles.

7.3. Realimentacion integral

En esta seccion estudiamos el sistema de dos masas acopladas subactuadocuando se anade una realimentacion integral. Este tipo de realimentacion hasido ilustrada por ejemplo en [73] y [74]; nosotros la usaremos en relacioncon el problema que en su momento aparecio en la Seccion 3.1 del presentetrabajo, cuando el intento de regular el sistema subactuado conducıa a os-cilaciones crecientes e incontrolables cuando el sistema se aproximaba a suestado final. Veremos ahora como la ampliacion del sistema para tener encuenta la accion integral y la reformulacion del problema de control optimoconduce a buenos resultados.

Consideremos el modelo (7.1) cuando u2(t) = 0:

Page 159: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.3. REALIMENTACION INTEGRAL 159

0 0.5 1 1.5 2 2.5 3 3.5

x 10−5

−0.01

0

0.01

0.02

0.03

x1(1,:) (m)

x 1(2,:)

(m/s

eg)

2 2.5 3 3.5 4 4.5 5 5.5

x 10−5

−0.01

0

0.01

0.02

0.03

x1(3,:) (m)

x 1(4,:)

(m/s

eg)

Figuras 7.14-7.15 Comportamiento en el espacio de fases para x1(t) yx3(t).

x1 = x2

x2 =k

m1

x3 + ak

m1

x33 +

β

m1

x4 +1

m1

u1(t)

x3 = x4

x4 = − k

mex3 − a

k

mex3

3 −β

mex4 −

1

m1u1(t) (7.49)

que reescribimos por conveniencia en la forma

x1 = x2

x2 = ω21x3 + aω2

1x33 + d1x4 +

1

m1u1(t)

x3 = x4

x4 = −ω20x3 − aω2

0x33 − d2x

4 − 1

m1

u1(t) (7.50)

Page 160: Modelado y control de masas acopladas. Aplicación a dispositivos ...

160 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

0 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.01−0.3

−0.2

−0.1

0

0.1

0.2

Tiempo (seg)

Con

trole

s u

1(t) u

2(t) (N

)

0 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.01−100

−50

0

50

Tiempo (seg)

a 1(t), a

2(t) (m

/seg

2 )

Figuras 7.16-7.17 Controles y aceleraciones.

Linealizando (7.50) en torno al punto de equilibrio x3e obtenemos:

x1

x2

x3

x4

=

0 1 0 00 0 ω2

1 + 3aω21x

23e d1

0 0 0 10 0 −ω2

0 − 3aω21x

23e −d2

x1

x2

x3

x4

+

01m1

0− 1m1

u1(t) (7.51)

Por otro lado, tomemos como salida

y =[

1 0 0 0]

x1

x2

x3

x4

(7.52)

La variable x1(t) de este modo es la que vamos a realimentar a traves dela accion integral. Entonces, las ecuaciones del sistema realimentado son:

˙x = Ax+ bu

y = cT x

Page 161: Modelado y control de masas acopladas. Aplicación a dispositivos ...

7.3. REALIMENTACION INTEGRAL 161

u = −kT x+ kIζ

ζ = r(t)− y = r − cT x (7.53)

Es decir, tenemos un sumador donde convergen la salida x1(t) y la senal dereferencia r(t), produciendo ζ, que una vez integrada y multiplicada por laconstante kI se suma a la realimentacion completa del estado, produciendoel control. Es posible ampliar el estado y escribir en forma matricial:

x−−ζ

=

A | 0−− −−−c | 0

x−−ζ

+

b−−0

u+

0−−1

r(t) (7.54)

Consideraremos el problema del regulador, que aparece cuando r(t) = 0.Introduciendo las variables de desviacion respecto al estado de equilibrio:

x′(t) = x(t)− xeζ ′(t) = ζ(t)− ζeu′(t) = u(t)− ue (7.55)

y el ındice cuadratico

J =∫ ∞

0

[x′TQx′ +Ru′2

]dt (7.56)

el problema queda en terminos sobre cuya solucion no es preciso abundar.Por supuesto, la correcta solucion del problema pasa por una eleccion acerta-da de Q y R. En las siguientes graficas se muestra como la variable x3 alcanzael punto de consigna, el esfuerzo de control y la aceleracion de m2. Destacaen este punto que el esfuerzo de control toma valores muy razonables, sobretodo si se compara esta solucion con la que ofrece el control por ubicacionde polos. Consecuentemente, las aceleraciones que experimenta m2 tambienson razonables. Hemos tomado R = 0,1 y

Q =

1 0 0 0 00 0,2 0 0 00 0 1 0 00 0 0 0,2 00 0 0 0 0,1

(7.57)

Page 162: Modelado y control de masas acopladas. Aplicación a dispositivos ...

162 CAPITULO 7. SISTEMA COMPLETAMENTE ACTUADO

0 1 2 3 4 5x 10

−3

−5

0

5

10

15

20x 10

−6

Tiempo (seg)

x(3,

:) (m

)

Figura 7.18 Posicion de m2. m1 = 0,005 Kg; m2 = 0,0001 Kg; L = 10−6 m;k = 2560 N/m; β = 0,5 Ns/m;

0 1 2 3 4 5x 10

−3

−20

−15

−10

−5

0

5x 10

−4 (N)

Tiempo (seg)

Con

trol u

(t)(N

)

Figura 7.19 Control u(t). m1 = 0,005 Kg; m2 = 0,0001 Kg; L = 10−6 m;k = 2560 N/m; β = 0,5 Ns/m;

Page 163: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 8

Modelo de actuadorbidimensional

8.1. Modelo fısico

Esta seccion se ocupa de un modelo de actuador bidimensional, con aco-plamiento elastico lineal y movimiento completamente desacoplado en ambosejes, como se muestra en la Figura 8.1. Puede ejercerse control independien-temente en cada eje. El interes principal de este capıtulo es que el modeloque se estudia es un modelo mixto regulador-servo. Se pretende por un ladoque la masa interior permanezca estacionaria respecto al marco, y al mismotiempo que este recorra una trayectoria especificada.

Consideraremos un bastidor cuadrangular de masa m1, cuyos lados sonparalelos a los ejes de un sistema de referencia inercial. Las coordenadas delvertice inferior izquierdo de dicho cuadrado tiene coordenadas x1 e y1. Elbastidor contiene a su vez una masa m2. Respecto a un sistema de referenciasolidario con el bastidor, paralelo al sistema inercial y centrado en el verticeinferior izquierdo del cuadrado, la masa m2 se encuentra en su posicion deequilibrio ,bajo el efecto de fuerzas restauradoras en ambos ejes, a distanciasLx y Ly del bastidor. Sean x2 e y2 las coordenadas de m2 respecto al bastidor.Por su parte, los esfuerzos de control son u segun el eje x y v segun el eje y.

Podemos escribir para la energıa cinetica

T =1

2m1(x2

1 + y21) +

1

2m2(x2

2 + y22) (8.1)

163

Page 164: Modelado y control de masas acopladas. Aplicación a dispositivos ...

164 CAPITULO 8. MODELO DE ACTUADOR BIDIMENSIONAL

m1

m2

yx

11

X

Y

Figura 8.1 Modelo bidimensional

para la energıa potencial

U =1

2kx(x2 − x1 − Lx)2 +

1

2ky(y2 − y1 − Ly)2 (8.2)

y para la funcion de disipacion de Rayleigh

F =1

2βx(x2 − x1)2 +

1

2βy(y2 − y1)2 (8.3)

Con las coordenadas generalizadas definidas por

q1 = x1

q2 = y1

q3 = x2 − x1 − Lxq4 = y2 − y1 − Ly (8.4)

Page 165: Modelado y control de masas acopladas. Aplicación a dispositivos ...

8.1. MODELO FISICO 165

la Lagrangiana se reescribe como

L =1

2m1(q2

1 +q22)+

1

2m2(q2

1 +q22 +q2

3 +q24 +2q1q3+2q2q4)−1

2kxq

23−

1

2kyq

24 (8.5)

donde llamamos kx,y a las constantes recuperadoras en los ejes homonimos,y βx,y a las constantes de friccion. La funcion de Rayleigh, por su parte, essimplemente

F =1

2βxq

23 +

1

2βy q

24 (8.6)

Es pura cuestion algebraica encontrar las ecuaciones del movimiento, quese expresan como

M¨q = kq + l ˙q + bu (8.7)

con

M =

m1 +m2 0 m2 00 m1 +m2 0 m2

m2 0 m2 00 m2 0 m2

(8.8)

k =

0 0 0 00 0 0 00 0 −kx 00 0 0 −ky

(8.9)

l =

0 0 0 00 0 0 00 0 −βx 00 0 0 −βy

(8.10)

b =

1 00 10 00 0

(8.11)

y

u =

[uv

](8.12)

Page 166: Modelado y control de masas acopladas. Aplicación a dispositivos ...

166 CAPITULO 8. MODELO DE ACTUADOR BIDIMENSIONAL

Ahora, podemos introducir el vector de estado

x =

q−−

˙q

(8.13)

y escribir ya la dinamica en la forma acostumbrada:

˙x = Ax+ Bu (8.14)

donde A es una supermatriz de 8 × 8 que tiene la estructura

A =

0 | I−− −−

M−1k | M−1l

(8.15)

mientras que

B =

0−−

M−1b

(8.16)

8.2. Servomecanismo LQR

Hemos realizado una serie de experimentos numericos para obtener lassenales de control y la evolucion del sistema cuando se desea hacerlo seguiruna senal de referencia. En realidad, este es un sistema mixto, con una parteque ha de funcionar como un regulador, pues se desea que m2 se mantengalo mas cerca posible de su posicion de equilibrio, y una parte que ha defuncionar, en general, como servomecanismo, ya que se desea que el marcom1 se desplaze segun una ley del movimiento.

Los parametros usados han sido m1 = 1Kg, m2 = 0,1Kg, kx = ky =20N/m y βx = βy = 2Ns/m. Como senal de referencia elegimos que elmarco se mueva completando un cırculo de radio R = 0,1m en un segundo,mientras que m2 ha de permanecer en su posicion de equilibrio. Ası:

Page 167: Modelado y control de masas acopladas. Aplicación a dispositivos ...

8.2. SERVOMECANISMO LQR 167

r(t) =

R cos(ωt)R sen(ωt)

00

−Rω sen(ωt)Rω cos(ωt)

00

(8.17)

La Figura 8.2 muestra la trayectoria de m1, cuando el sistema parte delorigen. Se ha reforzado el seguimiento haciendo Q = 100× I.

−0.02 −0.015 −0.01 −0.005 0 0.005 0.01 0.015−0.02

−0.015

−0.01

−0.005

0

0.005

0.01

0.015

0.02

Desviacion ’x’ masa interior (metros)

Des

viac

ion

’y’ m

asa

inte

rior (

met

ros)

Figura 8.2 Desviacion de m2 respecto a su posicion de equilibrio.m1 = 0,1 Kg; m2 = 0,1 Kg; kx = ky = 20 N/m; βx = βy = 2 Ns/m.

Las graficas 8.3-8.4 muestran los esfuerzos de control en los ejes x e y,respectivamente.

Vemos como la desviacion de m2 respecto a su posicion de equilibrio per-manece en valores razonables, ya que no supera los 0,02m a pesar de que elcaso que se ha simulado es especialmente desfavorable, pues el sistema partedel reposo en el origen y es obligado a seguir una trayectoria que comienzalejos del mismo. De ahı, la aparicion de picos en el control, que pueden apre-ciarse en las graficas 8.3 y 8.4. Especialmente en el eje vertical observamos

Page 168: Modelado y control de masas acopladas. Aplicación a dispositivos ...

168 CAPITULO 8. MODELO DE ACTUADOR BIDIMENSIONAL

0 50 100 150 200−12

−10

−8

−6

−4

−2

0

2

4

6

Tiempo (segundos/200)

Fuer

za e

je X

(New

tons

)

Figura 8.3 Control en el eje horizontal. m1 = 0,1 Kg; m2 = 0,1 Kg;kx = ky = 20 N/m; βx = βy = 2 Ns/m.

0 50 100 150 200−10

0

10

20

30

40

50

60

70

Tiempo (segundos/200)

Fuer

za e

je Y

(New

tons

)

Figura 8.4 Control en el eje vertical. m1 = 0,1 Kg; m2 = 0,1 Kg;kx = ky = 20 N/m; βx = βy = 2 Ns/m.

Page 169: Modelado y control de masas acopladas. Aplicación a dispositivos ...

8.2. SERVOMECANISMO LQR 169

un pico acusado necesario para incorporar al actuador a la trayectoria dereferencia. En cuanto a la implementacion, hemos seguido el procedimientoque describimos en el Apendice B, buscando mediante una doble integracionla solucion de la ecuacion diferencial de Ricatti (B.38) y de la ecuacion dife-rencial vectorial complementaria (B.39).

Page 170: Modelado y control de masas acopladas. Aplicación a dispositivos ...

170 CAPITULO 8. MODELO DE ACTUADOR BIDIMENSIONAL

Page 171: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Capıtulo 9

Conclusiones y perspectivas

9.1. Conclusiones

En este trabajo se ha realizado un estudio del sistema de dos masasacopladas que, si bien no puede calificarse de exhaustivo (¿ podrıa serlode algun modo ?) sı creemos que constituye una base analıtica seria en quefundamentar el control de sistemas de dos masas acopladas, con un cierto in-teres hacia los dispositivos de almacenamiento micro-electromecanicos peroaspirando a la mayor generalidad, motivo por el cual se han adoptado va-lores macroscopicos para los parametros en la mayor parte de este trabajo,evitando ası las particularidades de los DMEMS.

En el cuadro 9.1 se recogen las secciones en que se discuten los diversosproblemas que nos hemos planteado. Indicamos con T condiciones finales detiempo fijo, con X, estado final fijo, con TX tiempo y estado final especificadosy finalmente con ** tiempo y estado final libres.

Ademas, se ha discutido la dinamica impulsiva, la dinamica caotica y se haestudiado el control en presencia de caos. Concretamente, se ha estudiado laposibilidad de inducir el caos en el sistema y aprovechar el hecho de que lasorbitas caoticas son densas en el espacio de fases para ensayar una estrategiade control.

La mayor parte de este trabajo ofrece una solucion analıtica, aunque lassimulaciones que aparecen sean evidentemente numericas. Sin embargo, al-gunos de los problemas han de resolverse, por su propia naturaleza, de formanumerica. Tal sucede en la seccion 4.4 al discutir el efecto de una perturbacionacimutal, o al tratar la dinamica caotica.

171

Page 172: Modelado y control de masas acopladas. Aplicación a dispositivos ...

172 CAPITULO 9. CONCLUSIONES Y PERSPECTIVAS

Tabla 9.1: Familia de problemas investigados

TX T X **Regulador de energıamınima

2.4

Bang-bang 2.6Regulador LQR 3.1 3.3 3.2 3.4Regulador de tiempo-energıa con termino deMayer

3.4.1

Servo de tiempo-energıa con terminode Mayer

3.5

Servo LQR 3.6.1 3.6.2Discreto, progra-macion dinamica

3.7

Regulador de energıamınima, no lineal

4.2

Regulador de energıamınima, no linea, contermino de Mayer

4.3

Regulador LQR, nolineal, con termino deMayer y perturbacionacimutal

4.4

Regulador LQR nolineal

4.5.1 4.5.2

Regulador tiempo-energıa, acoplado aun bastidor

5.1.1

Regulador tiempo-energıa, con terminode Mayer, acoplado abastidor

5.2

Regulador LQRacoplado a bastidor

5.4 5.5 5.6 5.7

Realimentacion inte-gral

7.3

Servo LQR para actu-ador bidimensional

8.2

Page 173: Modelado y control de masas acopladas. Aplicación a dispositivos ...

9.1. CONCLUSIONES 173

En resumen, estos son los aspectos tratados en el presente trabajo:

1. Respecto a las perturbaciones del sistema, hemos tratado perturba-ciones en una y dos dimensiones. En el primer caso, consideramos per-turbaciones tanto en escalon como armonicas, de distintas frecuencias,y en el segundo nos limitamos a perturbaciones acimutales. Cierta-mente, estos modelos de perturbacion son sencillos e ideales, pero sipensamos en un actuador flexible operando en condiciones reales, po-dremos identificar aceleraciones lineales, rotaciones y combinaciones deambas.

2. Hemos identificado ademas perturbaciones intrınsecas de la propia senalde control, o por decirlo de otro modo, efectos indeseados de una senalde control que fue calculada para optimizar una funcion de coste enprincipio razonable. Es el fenomeno que se muestra en las graficas 3.4y 3.5.

3. En total, hemos resuelto una amplia familia de veintisiete problemasde control sobre el mismo modelo basico. La cantidad de trabajo teori-co que puede completarse sobre un sistema tan sencillo como es el dedos masas acopladas parece ingente, e ilimitado si consideramos otrosproblemas conexos, como el control a traves de sistemas de un numeroarbitrario de masas, sistemas donde cada masa puede estar conectadaun numero variables de otras masas y problemas en dos y tres dimen-siones; sin mencionar la dinamica y el control no lineales.

4. Como fue dicho en otro momento, no presentamos aquı todas las fasesque entran en juego cuando deseamos implementar un sistema realde control: nos limitamos al modelado y resolucion analıtica del controlcasi siempre en lazo abierto. Es evidente que, desde el punto de vista delcontrol, el tema de esta tesis puede ampliarse tanto cuanto es ampliablela disciplina del control, y que el control optimo es solo una de lasmuchas aproximaciones posibles.

5. En cuanto a los dispositivos de almacenamiento micro-electromecanicosaparecen en estos momentos como la mas seria alternativa para alma-cenamiento, tanto magnetico como no magnetico, a los discos durostradicionales. El hecho de que sean dispositivos que se encuentran enfase de pre-produccion ofrece la oportunidad de hacer una prospectivasobre las posibilidades de diseno.

6. Hemos considerado el control optimo con distintas funciones de coste ydistintas restricciones, de acuerdo con las distintas posibilidades de uso

Page 174: Modelado y control de masas acopladas. Aplicación a dispositivos ...

174 CAPITULO 9. CONCLUSIONES Y PERSPECTIVAS

de estos dispositivos, que obligaran a adquirir compromisos en el disenoentre velocidad de acceso a los datos, consumo reducido y respuesta sa-tisfactoria ante perturbaciones externas, inherentes a su uso en aparatosmoviles, como telefonos y reproductores portatiles de musica.

7. A su vez, se han considerado varios procedimientos analıticos y numeri-cos, que tienen relevancia en el diseno final. Por ejemplo, se ha consi-derado el control Bang-bang, util para implementaciones economicas, ocuando se desea dividir el control en dos fases: una aproximacion rapidaal estado deseado y una aproximacion posterior mas fina. Tambien se haconsiderado el control por programacion dinamica y los procedimientoshabituales analıticos con una serie de condiciones de contorno segun queel estado final y el intervalo de tiempo durante el que se aplica el controlesten previamente determinados o se dejen libres.

8. Hemos propuesto algoritmos numericos o soluciones analıticas para ca-da uno de los problemas planteados, e implementado el software nece-sario para simular el comportamiento del sistema, alcanzando tambienal diseno del servomecanismo LQR, donde mostramos como la ecuacionalgebraica de Ricatti es inadecuada para la dinamica que se esta tratan-do.

9.2. Perspectivas

Comenzamos esta investigacion poniendo de manifiesto la ubicuidad delproblema de las masas acopladas, y su interes tanto teorico como practico.No son de extranar las amplias posibilidades que existen para futuras in-vestigaciones relacionadas con la dinamica de este sencillo problema. Unasprovienen de la naturaleza misma del sistema, otras de las aplicaciones decontrol que pueden estudiarse y finalmente otras pueden ser ampliacionesdirectas de algunos de los problemas que contiene esta investigacion.

Entre las primeras, citemos en primer lugar las generalizaciones que puedenllevarse a cabo: control a traves de una serie arbitraria de masas, subactua-das o no; generalizacion a dos o tres dimensiones; teorıa de retıculas congeometrıas arbitrarias; aplicaciones especıficas a biomecanica, maquinas, in-genierıa civil; analisis del acoplamiento desaxial.

Entre las segundas, todas aquellas derivadas de la aplicacion de tecnicasde control que no hemos usado en esta investigacion, y todos los aspectos

Page 175: Modelado y control de masas acopladas. Aplicación a dispositivos ...

9.2. PERSPECTIVAS 175

que encontrarıamos al realizar el proceso completo de un sistema de control,ya que aquı nos hemos ocupado solamente del modelado y simulacion.

En cuanto a la extension de problemas especıficos tratados en esta inves-tigacion, la mas obvia consiste en la resolucion completa de la familia deproblemas que aparece en la Tabla 9.1. Pero, entre los que se encuentranresueltos, hay aun cuestiones de interes.

Ası, en la seccion 2.6 se estudia la posibilidad de aplicar control bang-bang, se llega a la conclusion de que es imposible alcanzar el estado finaldeseado y se muestra en que medida es posible acercarse a el. Pero es naturalpreguntarse por la aplicacion de control bang-zero-bang y el efecto de variasconmutaciones en el control.

En la seccion 3.1 se estudia el control LQR con condiciones de contornocompletas, y vemos, como muestran las graficas 3.4 y 3.5 como aparecenfuertes oscilaciones en el control cuando el sistema se aproxima al punto deconsigna en funcion de la ponderacion que se haga del esfuerzo de controla traves del parametro α. Serıa interesante la acotacion mas precisa en elespacio de parametros de este fenomeno.

En la seccion 4.4 se estudia el efecto de una perturbacion acimutal, y seresuelve el problema del control optimo mediante el metodo del gradiente.Decıamos allı (pagina 74) que ”La casuıstica en la obtencion del control opti-mo para este sistema es tan rica que deja pendiente un estudio numericoexhaustivo que acote, en un espacio de parametros, las regiones desde las queel origen es accesible o no, y esto para conjuntos representativos de condi-ciones iniciales.”

La seccion 6.8 se ocupa de la dinamica impulsiva, y allı se expone unsistema de ecuaciones lineal que permite relacionar las velocidades antes ydespues del impacto. Podemos imaginar que la respuesta del sistema anteuna senal continua pudiera aproximarse como una sucesion de impulsos, deforma que tras cada uno de ellos el sistema evolucionase libremente segunsu matriz de transicion de estados. ¿ Serıa esta una buena aproximacion alcomportamiento real ? ¿ Cuales serıan sus implicaciones ?.

Es evidente que este pequeno muestrario no agota las posibilidades, perohace patente que el problema de las masas acopladas es practicamente ili-mitado.

Page 176: Modelado y control de masas acopladas. Aplicación a dispositivos ...

176 CAPITULO 9. CONCLUSIONES Y PERSPECTIVAS

Page 177: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Apendice A

Notas historicas

A.1. Orıgenes del almacenamiento magnetico

Gran parte de nuestra informacion se encuentra registrada sobre mediosmagneticos: discos, cintas de audio y video, tarjetas de credito, etc.

Las memorias magneticas son el soporte por excelencia, desde hace masde tres decadas, para el manejo de la informacion tecnica, cientıfica, medicay administrativa en nuestra sociedad. Sobre otros medios de registro tienela ventaja ( o desventaja, vease [15] ) de que pueden reescribirse una y otravez.

Aunque descubierta hace mas de un siglo, la grabacion magnetica vivio enun segundo plano durante buena parte del siglo XX, debido a dificultadestecnicas y ausencia de aplicaciones practicas. Fue el descubrimiento de lasrelaciones entre electricidad y magnetismo el que abrio la puerta a aplica-ciones como el telegrafo y el telefono, aun cuando diversos fenomenos electri-cos y magneticos eran conocidos aisladamente desde la antiguedad.

En 1898, el ingeniero danes Valdemar Poulsen grabo la voz humana sobreun material magnetico. Con una vision de futuro que ahora podemos apre-ciar, Poulsen penso en la utilidad de grabar mensajes telefonicos. En esencia,el aparato de Poulsen consistıa en un cable de acero tenso, y un microfonotelefonico conectado a un electroiman, el cual deslizaba sobre el cable mien-tras hablaba ante el microfono. El microfono transformaba la voz en unacorriente electrica variable y el electroiman a esta en un campo magneticocuya variacion dependıa del volumen y el tono de la voz y que quedaba re-gistrado sobre el cable de acero. Sustituyendo el microfono por un auricular

177

Page 178: Modelado y control de masas acopladas. Aplicación a dispositivos ...

178 APENDICE A. NOTAS HISTORICAS

y deslizando de nuevo el electroiman, conseguıa que el aparato funcionase ala inversa, reproduciendo los sonidos grabados.

Oposiciones polıticas e industriales impidieron a Poulsen patentar su tele-grafono, que sin embargo tenıa indudables ventajas tecnicas sobre el fonografo,inventado veinte anos antes. En particular, el sonido era claro, libre de lamayor parte del ruido que sufrıa la reproduccion fonografica.

Por temor a la perdida de confidencialidad que podıa propiciar la grabacionde conversaciones, el temor al impacto que su comercializacion podıa tenersobre el telefono y la sospecha de que se uso en actividades de inteligen-cia militar durante la primera guerra mundial, se freno su desarrollo en losEstados Unidos.

En cuanto a Europa, el aleman Kurt Stille mejoro el telegrafono aumentan-do la duracion de las grabaciones y usando amplificadores que solucionaron elproblema del bajo volumen de reproduccion. Algunas companıas trabajaroncon licencia de Stille, como la Ludwig Blattner Picture Company de GranBretana, fabricante del Blattnerphone, que se uso en emisoras de radio hasta1945.

La empresa Lorenz, tambien con licencia Stille comercializo una grabado-ra sobre cinta de acero que permitio la transmision de programas de radiopreviamente grabados.

Estas primeras grabadoras precisaban de larguısimas cintas de acero, dekilometros de longitud. El siguiente paso lo dio Kurt Pfleumer, al desarro-llar un procedimiento para recubrir una cinta de papel con partıculas ferro-magneticas. En 1928 fabrico una grabadora que las usaba. Las patentes dePfleumer fueron adquiridas por la compania AEG. Esta empresa, en colabo-racion con I. G. Farben, actualmente BASF, investigo con distintas partıculasy sustratos, encontrando una optima combinacion de oxido de hierro sobreun sustrato plastico. Estas investigaciones permtieron la comercializacion delmagnetofon.

Tras el final de la segunda guerra mundial se produjo un trasvase tecnologi-co entre Europa y los Estados Unidos que permitio recuperar a estos ultimosel terreno perdido mediante la investigacion de firmas como Ampex y 3M.

Page 179: Modelado y control de masas acopladas. Aplicación a dispositivos ...

A.2. LA CRISIS DE LAS MEMORIAS MASIVAS 179

La grabacion magnetica pronto se impuso en el cine y la radio, pero nofueron estos los unicos terrenos en que se extendio. Otro de los frutos dela investigacion militar fueron los primeros ordenadores, con memorias denucleos de ferrita, como el Whirlwind I, mientras que otros, como el UNI-VAC I usaron cintas magneticas. Otros modelos empleaban tambores y discosmagneticos. Aunque los circuitos integrados sustituyeron a las memorias denucleos, los discos duros siguieron siendo el principal soporte de informacionen los ordenadores.

A.2. La crisis de las memorias masivas

El perfeccionamiento de los discos duros puede considerarse el paradig-ma de como la tecnologıa punta puede hacerse accesible al conjunto de lapoblacion cuando se produce en grandes cantidades. Desde los anos 80, lascapacidades de los discos duros han aumentado desde unos pocos Megabyteshasta centenares de Gigabytes: un crecimiento de cuatro ordenes de magni-tud, al tiempo que el precio por Gigabyte se ha reducido en otros tres ordenesde magnitud.

Los discos duros tienen su origen en la unidad RAMAC de IBM, presen-tada en 1956. Esta unidad usaba cincuenta platos coaxiales de aluminio deunos sesenta centımetros de diametro, recubiertos de oxido de hierro. El RA-MAC tenıa una capacidad de cinco Megabytes, pesaba casi una tonelada ysu volumen era del orden de un metro cubico.

Desde entonces, las mejoras en capacidad y velocidad de lectura y escriturahan tenido el factor comun de la miniaturizacion, especialmente en lo queconcierne a los cabezales.

Los primeros cabezales eran de ferrita, pero en 1979 hicieron su apari-cion cabezales de pelıcula delgada, que lograban inscribir datos en dominiosmagneticos mas pequenos. El siguiente paso fueron los cabezales de efectomagnetorresistivo. Este fenomeno, ya observado por Lord Kelvin en 1857,consiste en la alteracion de la resistencia electrica de un material cuandose expone a un campo magnetico. Ası, si los cabezales de ferrita usaban elfenomeno de la induccion tanto para la lectura como para la escritura, desdela introduccion de los cabezales magnetorresistivos en 1995 se usa este efectopara la lectura. En 1998 se descubrio el efecto magnetorresistivo gigante enmateriales estratificados. En estos materiales, la variacion en la resistencia

Page 180: Modelado y control de masas acopladas. Aplicación a dispositivos ...

180 APENDICE A. NOTAS HISTORICAS

electrica es uno o dos ordenes de magnitud mayor que la variacion que expe-rimentan los materiales magnetorresistivos de la generacion anterior. Desdeentonces, se ha descubierto toda una familia de efectos magnetorresistivos.

Sin embargo, estos avances en el diseno de los cabezales carecerıa de uti-lidad si el sustrato magnetico no fuese capaz de almacenar la densidad queel cabezal puede escribir. En la busqueda de materiales capaces de soportardensidades mayores de datos, se intenta reducir el tamano de los dominiosmagneticos. Hasta ahora, un bit puede ser almacenado en dominios que con-tienen del orden de 103 cristales de material ferromagnetico, y se investiga laforma de reducir esta cantidad.

Sin embargo, existe un lımite fısico: cuando la energıa magnetica almace-nada en un dominio sea del orden de su energıa termica, la magnetizacion nosera estable. A este efecto se le llama efecto super-paramagnetico, y se cree quese manifiesta con densidades de alrededor de veinte Gigabytes por centımetrocuadrado. Durante el presente ano, Hitachi e IBM han presentado alternati-vas que permiten superar este lımite. En concreto, IBM usa para el sustratoun material compuesto por tres capas. Dos de material ferromagnetico y unaintermedia, extraordinariamente delgada, de Rutenio. Por su parte, Hitachiha presentado una tecnica de grabacion perpendicular mediante la cual losdominios magneticos se incriben en el disco perpendicularmente a su super-ficie. Esta tecnica implica el uso de cabezales especiales.

Pero la densidad maxima que puede almacenarse depende tambien delnumero de pistas por centımetro que puedan grabarse, que a su vez es fun-cion de la capacidad de resolucion del cabezal y de su mecanismo de posi-cionamiento. Para dar una idea de la importancia de este ultimo factor bastedecir que la diferencia esencial en cuanto a capacidad entre un disco flexi-ble de 1.44 Megabytes y una unidad LS-120, aparecida a finales de los 90con una capacidad de 120 Megabytes, consiste en que esta ultima usaba unmecanismo de posicionamiento optico.

Otro factor digno de considerar es el de la velocidad de acceso a los datos.Historicamente, el aumento de capacidad de los discos duros ha sido muchomayor que el aumento en la velocidad de acceso, aunque la diferencia se hadisimulado con la adopcion de caches integradas en los propios discos, lascaches del sistema operativo, posibles a su vez por el abaratamiento de lamemoria principal, y la optimizacion en los sistemas de archivos. Pero seapunta ya a la posibilidad de que se produzca una bifurcacion en el mercado

Page 181: Modelado y control de masas acopladas. Aplicación a dispositivos ...

A.3. ALMACENAMIENTO MAGNETO-OPTICO 181

entre unidades de alta capacidad y unidades de alta velocidad de acceso.Estas ultimas se caracterizaran por una velocidad de rotacion superior a las10.000 rpm, lo que implicara a su vez el uso de cojinetes fluidos para los ejes.

A.3. Almacenamiento magneto-optico

Los sistemas de almacenamiento magneto-optico recurren a una tecnicahıbrida: puramente optica para lectura y termica-magnetica para escritura.

En esencia, cuando se desea escribir sobre el sustrato ferromagnetico secalienta en un punto mediante un delgado haz laser para elevar su tempe-ratura por encima de la temperatura de Curie, destruyendo la magnetizacionanterior, y a continuacion mediante una bobina cuyo plano es perpendicularal haz laser se induce la nueva magnetizacion para representar un 0 o 1binarios.

Para el proceso de lectura, se hace incidir el haz sobre un dominio magneticoy se estudia la polarizacion del haz reflejado. Este cambio de polarizacion deun haz de luz al reflejarse sobre un dominio magnetico se denomina efectoKerr.

En teorıa, este metodo es capaz de superar la barrera impuesta por el efec-to superparamagnetico. Para ello, los bits se inscriben perpendicularmentea la superficie del disco, en lugar de paralelamente como en los sistemasmagneticos convencionales.

Dos dificultades principales estan sin embargo retrasando la adopcion deesta tecnologıa. Por un lado, es preciso enfocar el haz laser sobre un puntomuy pequeno. Para ello se recurre a una lente de inmersion en solido, unatecnica derivada de la microscopıa de inmersion en lıquido. Por otro lado, latecnica requiere que la distancia del sistema de enfoque a la superficie deldisco sea muy pequena, del orden de la longitud de onda del laser.

Actualmente, esta tecnica esta siendo desarrollada por la empresa Terastor,con participacion de Quantum y acuerdos con Olympus para los componentesopticos y HP para la electronica de apoyo.

Page 182: Modelado y control de masas acopladas. Aplicación a dispositivos ...

182 APENDICE A. NOTAS HISTORICAS

A.4. Almacenamiento optico y holografico

Una tercera posibilidad la constituyen los medios de almacenamiento opti-cos, con discos CD y discos DVD. La densidad de almacenamiento varıa entrelos 0.11 Gigabytes/cm2 en los discos CD y los 0.51 Gigabytes/cm2 para losdiscos DVD. Aunque existen diferencias de implementacion que justifican es-tas distintas capacidades de almacenamiento, la tecnica basica es identica.Los bits se codifican realizando pequenas muescas sobre una pista espiral quecomienza en la parte interior del disco y acaba cerca del borde externo. Elsustrato es cubierto por una capa de aluminio y una segunda capa de lacaprotectora.

Para efectuar la lectura, un fino haz laser se desplaza a lo largo de la pista.Cuando encuentra una muesca, cuyo tamano es del orden de la longitud deonda del laser, se produce difraccion que hace que la intensidad de la luzreflejada disminuya drasticamente. El analisis de la intensidad reflejada porel disco permite reconstruir el patron de bits que fue codificado mediante lasmuescas.

Por su parte, el almacenamiento holografico recurre a una tecnica radi-calmente diferente, basada en la propiedad de algunos materiales para fijarmediante algun tipo de alteracion quımica o fısica una figura de interferenciade luz. En la tecnica holografica se hacen incidir simultaneamente sobre elmedio de registro dos haces laser. Para generarlos se usa un unico laser que esdividido en dos mediante un divisor de haz. A continuacion uno de los hacesresultantes se hace incidir directamente sobre el medio de registro, mientrasque el segundo se modifica mediante un modulador espacial de acuerdo conla informacion contenida en una pagina de datos. De la interferencia de am-bos haces surge un holograma, que queda registrado. La lectura se efectuailuminando el holograma mediante el haz de referencia. Como resultado, sereconstruye el haz objeto ( aquel que fue modulado antes de incidir sobre elmedio de registro ). Finalmente, el analisis del haz objeto permite reconstruirla pagina de datos que se uso para modularlo.

Dos caracterısticas hacen interesante el almacenamiento holografico. Porun lado, existe la posibilidad de multiplexar muchos hologramas, es decir,muchas paginas de datos, sobre el mismo medio de registro. Esto se consiguevariando los angulos de incidencia de los haces de registro, sus longitudesde onda, o ambos. Por otro lado, los datos se leen o escriben en paralelo.Los prototipos actuales pueden efectuar un acceso aleatorio en unos 100 µs,

Page 183: Modelado y control de masas acopladas. Aplicación a dispositivos ...

A.5. ALMACENAMIENTO CON RESOLUCION ATOMICA 183

mientras que el tiempo de acceso en un medio magnetico es del orden demilisegundos.

La investigacion en almacenamiento holografico se encuentra activa desdehace mas de dos decadas, y recibe el esfuerzo de companias como IBM, Rock-well, Lucent o Bayer. Se pueden distinguir dos aproximaciones distintas enel esfuerzo por conseguir un sistema de almacenamiento holografico practico.Por un lado, se hacen esfuerzos para basar la produccion en componentes quepuedan fabricarse en masa, aunque sea a costa de prestaciones mas modestas.Por otro, se trabaja en dispositivos donde la prioridad es el tiempo de accesomınimo a los datos, lo que a su vez puede implicar una reduccion en la den-sidad maxima admisible. En febrero de 2004, la compania de telefonıa moviljaponesa NTT anuncio la creacion de un prototipo de memoria holograficasobre un medio de registro estratificado de unos dos centımetros cuadrados,con capacidad para 1 Gigabyte. Se espera su comercializacion a lo largo de2005. Por su parte, la compania Aprilis comercializa ya una unidad de discoholografica con capacidad para 200 GB, y anuncia la disponibilidad en 2007de un disco de 1.6 TB.

A.5. Almacenamiento con resolucion atomica

El almacenamiento con resolucion atomica es una tecnica de campo proxi-mo mediante la cual se altera alguna propiedad del sustrato mediante unacorriente de electrones emitida por una punta de tamano atomico.

En la actualidad, el dispositivo mas avanzado es obra de HP. Se trata deun prototipo de unas decenas de milımetros cuadrados capaz de almacenar 2Gigabytes. Este dispositivo usa como sustrato un material bifasico, con unafase amorfa y una fase cristalina. Ambas fases son estables a temperaturaambiente. Cuando una punta atomica proxima emite un haz de electrones,induce un cambio de fase, permitiendo la escritura de un bit. Para la lectura,puede emplearse una tecnica de campo proximo emitiendo un haz debil deelectrones y detectando el cambio en alguna propiedad electrica dependientede la fase. Tambien puede emplearse una tecnica de campo lejano, mediantelectura optica.

Evidentemente, la viabilidad del dispositivo depende de la disponibilidadde microactuadores que permitan posicionar la matriz de agujas con unaprecision de unos pocos nanometros. HP ha patentado un micromotor queconsigue una precision de tres nanometros. El ultimo problema consiste en

Page 184: Modelado y control de masas acopladas. Aplicación a dispositivos ...

184 APENDICE A. NOTAS HISTORICAS

proporcionar al dispositivo un vacio para su funcionamiento, o al menos unaatmosfera controlada que evite la dispersion de los electrones, y un continenterobusto que permita integrarlo en dispositivos moviles. Con todo, HP esperatener en el mercado uno de estos dispositivos durante 2006, con una capaci-dad del orden de 10 Gigabytes. En competencia con los medios magneticosconvencionales, una ventaja de estos dispositivos consiste en su bajo con-sumo de energıa: es nulo mientras el dispositivo no funcione, al contrario queun Microdrive, u otro disco convencional, que ha de mantenerse en rotacionconstante.

Estructuralmente, los dispositivos de almacenamiento atomico son simi-lares a los dispositivos microelectromecanicos cuya dinamica se ha tratadoen este trabajo, aunque cambie el metodo de lectura y escritura.

Page 185: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Apendice B

Ecuaciones basicas del controloptimo

B.1. Planteamiento y ecuaciones basicas

El problema del control optimo se plantea como el de la eleccion del vectoru(t) de forma que

J =∫ t1

t0F (x, u, t)dt+ Φ( ¯x(t1), t1) (B.1)

alcance un valor mınimo entre todos los posibles. La funcion escalar Fqueda a eleccion del disenador, ası como la funcion Φ, que mide de algunaforma la separacion entre el estado final alcanzado por el sistema y el estadodeseado. Al primer termino se le suele llamar de Bolza, y al segundo, de Ma-yer. En la formulacion de un problema en particular pueden estar presentesambos, o solo uno de ellos. Naturalmente, el sistema obedece a una dinamica

˙x(t) = f(x, u, t) (B.2)

En definitiva, estamos ante un problema de extremos condicionados, quepuede resolverse aplicando el metodo de los multiplicadores de Lagrange.Para ello, definimos:

Ja =∫ t1

t0[F + pT (f − ˙x)]dt+ Φ(x(t1), t1) (B.3)

donde p es el vector de multiplicadores de Lagrange. El ultimo termino dela integral puede integrarse por partes:

185

Page 186: Modelado y control de masas acopladas. Aplicación a dispositivos ...

186 APENDICE B. ECUACIONES BASICAS DEL CONTROL OPTIMO

pT ˙x =d

dt(pT x)− ˙p

Tx (B.4)

Con lo que el problema se reformula ligeramente. Introduciendo la funcionH, que en adelante llamaremos Hamiltoniana 1 como

H = F + pT f (B.5)

tenemos:

Ja =∫ t1

t0(H + ˙p

Tx)dt+ [pT x]t1t0 + Φ(x(t1), t1) (B.6)

Sea u(t) el control que conduce al sistema por la trayectoria optima, esdecir, aquella que hace mınimo Ja. Una ligera variacion en u(t) conducira alsistema por una trayectoria ligeramente distinta, alcanzando un punto x(t1)ligeramente distinto, quizas en un instante t1 diferente. Pero, debido a que Jaes estacionario frente a ligeras variaciones del control, si este efectivamentees el optimo:

δJa =∂Ja∂u

δu =

∫ t1

t0

[∂H

∂x

T

δx+∂H

∂u

T

δu+∂H

∂tδt+ ˙p

Tδx

]dt

+pT (t1)δx(t1) +

(∂Φ

∂x

)T

t1

δx(t1) +

(∂Φ

∂t

)T

t1

δt = 0 (B.7)

donde .T indica matriz traspuesta 2. Recordemos la arbitrariedad del vectorp, de forma que podemos elegirlo de forma que

˙p = −∂H∂x

(B.8)

1un nombre desafortunado, pues aunque H juega un papel similar a la funcion Hamil-toniana conocida en la Mecanica Clasica, no es la misma

2consideramos a los vectores como una clase particular de matrices de una sola columnay un numero variable de filas

Page 187: Modelado y control de masas acopladas. Aplicación a dispositivos ...

B.2. REGULADORES Y SERVOMECANISMOS 187

La condicion δJa = 0 implica entonces que

∂H

∂u= 0 (B.9)

y las condiciones de contorno en t1 implican respectivamente que

(∂Φ

∂x− p

)Tδx = 0 (B.10)

y que

(H +

∂Φ

∂t

)δt = 0 (B.11)

Cuando δx o δt son arbitrarios, los factores que los multiplican en las dosecuaciones anteriores han de ser cero. Es frecuente sin embargo que δx enel instante final no sea arbitrario, sino que descanse sobre una superficiem(x) = 0, lo que significa que ha de ser

∂Φ

∂x− p = α

∂m

∂x(B.12)

Es decir, que el primer miembro es paralelo al gradiente de m(x), y portanto perpendicular a la superficie en que descansa δx, asegurando que secumple (B.10)

B.2. Reguladores y servomecanismos

Existen dos tipos de control que pueden aplicarse a un sistema. En primerlugar, podemos desear conducirlo a un punto fijo del espacio de configu-racion. Este punto se toma convencionalmente como origen de coordenadas.Si el punto deseado no coincide con el origen, siempre es posible realizaruna traslacion y tomar nuevas condiciones iniciales. En estas circunstanciastomaremos una funcion de coste cuadratica de la forma:

J =∫ t1

t0(xTQx+ uTRu)dt+ xT (t1)Mx(t1) (B.13)

donde Q y R son matrices de peso cuya eleccion queda al arbitrio deldisenador, al igual que M, que pondera el estado final.

Page 188: Modelado y control de masas acopladas. Aplicación a dispositivos ...

188 APENDICE B. ECUACIONES BASICAS DEL CONTROL OPTIMO

En segundo lugar, puede que deseemos que el punto figurativo del sistemaen el espacio de configuracion no se desplaze para alcanzar un punto fijo,sino que se mueva lo mas proximo posible a una trayectoria prefijada. Eneste segundo caso elegiremos una funcion de coste de la forma

J =∫ t1

t0(eTQe+ uTRu)dt+ eT (t1)Me(t1) (B.14)

donde e = x − r y r(t) es una trayectoria dada. No hemos introducidoningun concepto nuevo, sino unicamente hemos propuesto formas particularespara la funcion de coste, y estas formas particulares nos conduciran a unaHamiltoniana y unas ecuaciones de control determinadas. Lo que sigue portanto son simples manipulaciones algebraicas.

Comenzemos por los reguladores, con funcion de coste dada por (B.13) ydinamica lineal. La Hamiltoniana es

H = xTQx + uTRu+ pT (Ax+ Bu) (B.15)

De aquı:

∂H

∂u= 2Ru+ BT p = 0 (B.16)

de donde se sigue que

u = −1

2R−1BT p (B.17)

Por otra parte:

˙p = −∂H∂x

= −2Qx−AT p (B.18)

Podemos tomar un vector de estado ampliado

ξ(t) =

(x(t)p(t)

)(B.19)

Page 189: Modelado y control de masas acopladas. Aplicación a dispositivos ...

B.2. REGULADORES Y SERVOMECANISMOS 189

que obecederıa a la dinamica:

˙ξ =

(A −1

2BR−1BT

−2Q −AT

)ξ (B.20)

Sabemos como resolver este tipo de sistemas, pero necesitamos el vectorξ(t0), lo que implica conocer p(t0). Ahora bien, no conocemos p(t0) y sı p(t1),que puede obtenerse de

p(t1) =

(∂Φ

∂x

)

t1

= 2Mx(t1) (B.21)

Tampoco conocemos x(t1), y si este extremo fuese fijo, la ecuacion anteriorno serıa aplicable. Sin embargo, en este ultimo caso, llamando

Ω =

A | −12BR−1BT

−− | −−2Q | AT

(B.22)

tenemos que

x(t) = eΩt11 x(t0) + eΩt

12 p(t0) (B.23)

p(t) = eΩt21 x(t0) + eΩt

22 p(t0) (B.24)

Particularizando para t = t1, la primera permite encontrar p(t0), y lasegunda p(t). Entonces B.9 proporciona el control u(t).

Pero si x(t1) es un extremo libre, es preciso recurrir a otro metodo deresolucion. En particular, expondremos el metodo expuesto por Bryson yHo. Supongamos que para todo instante es valida una relacion lineal:

p(t) = P(t)x(t) (B.25)

donde P es una matriz que queda por determinar. Derivando B.25:

˙p = Px + P(Ax+ Bu) = −2Qx−ATPx (B.26)

Page 190: Modelado y control de masas acopladas. Aplicación a dispositivos ...

190 APENDICE B. ECUACIONES BASICAS DEL CONTROL OPTIMO

Usando (B.9) para eliminar u, y teniendo en cuenta que la relacion resul-tante es valida para cualquier x:

P + PA + ATP− 1

2PBR−1BTP + 2Q = 0 (B.27)

que es una ecuacion diferencial matricial que proporciona P en cada ins-tante de tiempo. Esta es la ecuacion de Ricatti. Conocida P, la ecuaciondinamica se reduce a una ecuacion homogenea lineal. Ahora bien, la resolu-cion de (B.27) rara vez puede hacerse de forma analıtica, debiendo recurrira procedimientos numericos. Ademas, faltan las condiciones de contorno quepermitan realizar la integracion. De

p(t1) = P(t1)x(t1) = 2Mx(t1) (B.28)

es claro que

P(t1) = 2M (B.29)

y que debemos realizar una integracion hacia atras, desde t1 hasta t0.

En contraposicion a la ecuacion diferencial de Ricatti, en muchos casosse usa la ecuacion algebraica de Ricatti. Consideremos la funcion de costecuadratica

J =∫ t1

t0(xTQx + uTRu)dt (B.30)

e introduzcamos la variable

τ = t1 − t (B.31)

de forma que

dP

dt= −dP

dτ(B.32)

Page 191: Modelado y control de masas acopladas. Aplicación a dispositivos ...

B.2. REGULADORES Y SERVOMECANISMOS 191

como M = 0, P(t1) = 0 o P(τ = 0) = 0. Tomemos ahora un valor fijo det y hagamos t1 → ∞. Entonces tambien τ → ∞. Por otra parte, P puedemantenerse finito en el lımite, o puede crecer sin lımite con τ . Pero un valorinfinito para P da valores infinitos para x y u y hace diverger a J . Por tanto,la unica posibilidad con sentido es que P permanezca finito, lo que implicaque

P = 0 (B.33)

En este caso, la ecuacion diferencial de Ricatti se transforma en unaecuacion algebraica.

Vayamos al caso de los servomecanismos. Esta claro que los reguladores sonun caso particular de los primeros, donde r(t) se reduce a un vector constante,usualmente el vector nulo. Para la funcion de coste (B.14), la Hamiltonianaes:

H = (x− r)TQ(x− r) + uTRu+ pT (Ax+ Bu) (B.34)

El primer termino del segundo miembro de esta ultima ecuacion introduceun rTQr y dos terminos cruzados rTQx y xTQr. Si tenemos la precaucionde elegir Q simetrica:

˙p = −2Qx− 2Qr −AT p (B.35)

Mientras que la ecuacion para u no cambia. La situacion es similar a laplanteada con los reguladores, salvo por la presencia del termino adicional2Qr. Ahora, supongamos que r(t) es aproximadamente igual al vector nulo.En este caso, la suposicion

p(t) = P(t)x(t) (B.36)

sera aproximadamente cierta. Introduzcamos un vector s(t) y supongamosque, aun cuando la trayectoria de referencia no sea proxima al vector nulo secumple que

p(t) = P(t)x(t) + s(t) (B.37)

Page 192: Modelado y control de masas acopladas. Aplicación a dispositivos ...

192 APENDICE B. ECUACIONES BASICAS DEL CONTROL OPTIMO

Tomando la derivada respecto al tiempo de esta ecuacion, sustituyendo enla misma el vector ˙x(t) primero y la expresion para u(t) despues e igualandoel resultado obtenido a (B.8) obtenemos una ecuacion que puede desdoblarseen dos:

P + PA + ATP− 1

2PBR−1BTP + 2Q = 0 (B.38)

˙s− 1

2PBR−1BT s+ AT s− 2Qr = 0 (B.39)

Ahora, las condiciones de contorno vienen dadas por:

p(t1) = P(t1)x(t1) + s(t1) = 2M(x(t1)− r(t1)) (B.40)

de donde

P(t1) = 2M (B.41)

s(t1) = −2Mr(t1) (B.42)

De nuevo es preciso realizar una integracion desde t1 hasta t0. Observeseque esta integracion no depende de los valores iniciales, por lo que la secuenciade matrices P(t) y s(t) se calcula una sola vez y para siempre para cadasistema en particular y para cada matriz M. El conocimiento de P y s reducela ecuacion dinamica a una ecuacion diferencial no homogenea que sabemosresolver. De ahı, es posible encontrar el control u(t).

Page 193: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Apendice C

Ecuaciones de la Mecanicaanalıtica

C.1. Mecanica vectorial y mecanica analıtica

La Mecanica Vectorial fue formulada para entes ideales llamados puntosmateriales o partıculas materiales. Las leyes de Newton permiten escribir laecuacion diferencial del movimiento para dichas partıculas, y la integracionde esta ecuacion proporciona, para cada instante de tiempo, la posicion dela partıcula. Cuando un punto material no se encuentra aislado, sino en in-teraccion con otras partıculas, por ejemplo, si forma parte de un solido oun fluido, el analisis anterior puede no obstante seguir aplicandose, siempreque se tenga la precaucion de aislar cada partıcula individual y escribir paraella la ecuacion del movimiento, que incluira las fuerzas que sobre la mismaejerza su entorno, incluidas las fuerzas ejercidas por las partıculas adyacentes.Pero este procedimiento requiere para llevarse a la practica de hipotesis adi-cionales, ya que, en general, las interacciones entre partıculas siguen leyesdesconocidas. Para eludir esta dificultad, Newton postulo la igualdad entreaccion y reaccion, es decir, entre la fuerza que una partıcula ejerce sobre otray la fuerza que la segunda ejerce sobre la primera. Pero incluso al tratar deestudiar el movimiento de agregados sencillos, como los solidos rıgidos, esnecesaria la hipotesis adicional de que las fuerzas entre partıculas son cen-trales, es decir, que descansan en la lınea que une a ambas.

En definitiva, la Mecanica Vectorial procede identificando cada partıculade un sistema, y haciendo el inventario de todas las fuerzas, cualquiera quesea su naturaleza, que actuan sobre ella. Solo de esta forma es posible escribirla ecuacion del movimiento.

193

Page 194: Modelado y control de masas acopladas. Aplicación a dispositivos ...

194 APENDICE C. ECUACIONES DE LA MECANICA ANALITICA

La aproximacion de la Mecanica Analıtica es radicalmente diferente, ya queno se ocupa de partıculas individuales, sino de sistemas como unidades indi-visibles. El segundo aspecto que marca esta diferencia tiene que ver con lascondiciones cinematicas que estan presentes en muchos sistemas. Por ejemplo,un solido rıgido puede moverse solo de forma que la distancia entre cualquierpareja de puntos pertenecientes al mismo permanezca constante. Evidente-mente, esta es una restriccion mantenida por la presencia de fuerzas muyintensas. Desde el punto de vista de la Mecanica Analıtica, las restriccionescinematicas estan integradas en la formulacion del problema, y es innecesarioconsiderar las fuerzas que las mantienen.

C.2. Coordenadas generalizadas

El concepto de coordenada no entra directamente en la formulacion vecto-rial de la Mecanica, que sigue un metodo esencialmente geometrico, adecuadopara problemas de estatica o problemas dinamicos sencillos, pero inadecuadoen muchos casos.

Por contra, el concepto de coordenada ocupa un lugar central en la MecanicaAnalıtica, que es una ciencia que reduce los problemas del movimiento de loscuerpos a la aplicacion ordenada de procedimientos algebraicos. Lagrange(1736-1813) lo expreso ası en su Mechanique Analitique de 1788:

Ya existen diversos tratados de Mecanica, pero el programa de estees completamente nuevo. Me he planteado la tarea de reducir tan-to la teorıa como el arte de resolver los problemas concernientesa esta Ciencia a formulas generales cuya simple aplicacion de to-das las ecuaciones necesarias para obtener la solucion de cadaproblema.

Mas aun:

No se encontraran figuras en esta obra. Los metodos que aquı ex-pongo no requieren ni imagenes ni razonamientos geometricos omecanicos, sino tan solo operaciones algebraicas sujetas a un pro-ceso regular y uniforme.

Consideremos un sistema de N partıculas, cada una de las cuales tiene, enel espacio euclıdeo tridimensional, coordenadas ri. Nuestro problema consisteen encontrar ri(t), es decir, encontrar 3N funciones del tiempo. Definiremos

Page 195: Modelado y control de masas acopladas. Aplicación a dispositivos ...

C.3. EL PRINCIPIO DE D’ALEMBERT 195

las coordenadas generalizadas qi como el mınimo conjunto de n variables enfuncion de las cuales pueden escribirse los ri:

ri = fi(q1, · · · , qn, t) (C.1)

A este numero mınimo le llamaremos grados de libertad del sistema. Porejemplo, la posicion de un pendulo ideal puede darse en funcion del anguloque forma con la vertical: n = 1, q1 = θ. La posicion de un punto materialsobre una superficie f(x, y, z) puede especificarse mediante el par q1 = x,q2 = y, y en este caso n = 2. Ocasionalmente, el conjunto de coordenadasgeneralizadas adecuadas para un problema en concreto puede coincidir conlas coordenadas cartesianas de una o varias de las partıculas que constituyenel sistema, aunque esto no es lo habitual. En el movimiento de un planetaalrededor del Sol, pueden usarse coordenadas cartesianas, pero suelen ser masadecuadas las coordenadas polares. Como ultimo ejemplo, consideremos unsolido rıgido. Su posicion en el espacio puede darse mediante las coordenadasde su centro de masas y tres angulos que especifican su orientacion: es unsistema con seis grados de libertad.

Aplicando los principios de la Mecanica Analıtica encontraremos el con-junto de ecuaciones diferenciales ordinarias:

qi = fi(q1, · · · , qn, q1, · · · , qn, t) (C.2)

La solucion de este conjunto de ecuaciones se considera como la soluciondel problema y normalmente no se requiere la obtencion de las coordenadascartesianas.

C.3. El principio de D’Alembert

El principio de D’Alembert introduce el concepto de desplazamiento vir-tual. Un desplazamiento virtual no tiene naturaleza cinematica, es decir, nose corresponde con un desplazamiento real que transcurre en un intervalo detiempo, sino naturaleza geometrica. Un desplazamiento virtual es un expe-rimento mental mediante el cual provocamos un ligero desplazamiento en elsistema, de forma compatible con las ligaduras 1. Por desplazamiento compa-tible entendemos aquel realizado de forma que el trabajo de las fuerzas de

1Este es el argumento que tradicionalmente puede encontrarse en la literatura an-glosajona. Sin embargo, vease [65] para una introduccion rigurosa del concepto de des-plazamiento virtual.

Page 196: Modelado y control de masas acopladas. Aplicación a dispositivos ...

196 APENDICE C. ECUACIONES DE LA MECANICA ANALITICA

ligadura sea nulo. Por ejemplo, podemos intentar estirar una barra delgada,en cuyo caso experimentaremos la oposicion de la ligadura que mantiene rıgi-da la barra. O podemos girarla ligeramente, o desplazarla como un todo, encuyo caso las fuerzas de ligadura no se manifiestan.

Hemos introducido en el parrafo anterior los terminos ligadura y fuerzade ligadura. El primero hace referencia a lo que antes habiamos llamadorestricciones cinematicas. El segundo, a las fuerzas que mantienen estas res-tricciones. En adelante, hablaremos simplemente de ligaduras y de fuerzas deligadura.

Si llamamos Fi a las fuerzas aplicadas al sistema en puntos ri, excluidaslas fuerzas de ligadura, el principio de D’Alembert establece que:

i

(Fi −miai)δri = 0 (C.3)

Podrıa parecer que, por mera manipulacion algebraica, podemos deducirla ecuacion anterior a partir de la ecuacion de Newton:

Fi −miai = 0 (C.4)

pero recordemos que esta ultima incluye en Fi todas las fuerzas que actuansobre la partıcula de masa mi y posicion ri, incluyendo las de ligadura. Portanto, es preciso reconocer al principio de D’Alembert como un principioindependiente y de naturaleza distinta.

Normalmente, este principio se escribira en funcion de las coordenadasgeneralizadas qi. Veamos para ello que:

δri =∑

j

∂ri∂qj

δqj (C.5)

y transformemos cada uno de los terminos en la formulacion original. Enprimer lugar:

i

Fiδri =∑

i

Fi∑

j

∂ri∂qj

δqj =∑

j

(∑

i

Fi∂ri∂qj

)δqj =

j

Qjδqj (C.6)

Page 197: Modelado y control de masas acopladas. Aplicación a dispositivos ...

C.3. EL PRINCIPIO DE D’ALEMBERT 197

donde hemos introducido las fuerzas generalizadas Qj. Por otro lado:

i

miaiδri =∑

i

mid ˙ridtδri =

i

d

dtmi ˙riδri −

i

mi ˙rid

dtδri (C.7)

Para el primer termino:

d

dt

i

mi ˙riδri =d

dt

i

mi ˙ri∑

j

∂ri∂qj

δqj (C.8)

Ahora bien:

∂ri∂qj

=∂ ˙ri∂qj

(C.9)

En efecto:

dridt

=∑

j

∂ri∂qj

qj +∂ri∂t

(C.10)

y de esta ultima se sigue la anterior. Por tanto, el primer termino queda:

d

dt

j

(∑

i

mi ˙ri∂ ˙ri∂qj

)δqj =

d

dt

j

∂qj

(∑

i

1

2mi ˙ri

2

)δqj (C.11)

Para el segundo:

i

mi ˙rid

dtδri =

i

mi ˙rid

dt

j

∂ri∂qj

δqj

=

i

mi ˙ri∑

j

d

dt

(∂ri∂qj

)δqj

=∑

i

mi ˙ri∑

j

(∑

k

∂2ri∂qj∂qk

qk +∂2ri∂qj∂t

)δqj

=∑

i

mi ˙ri∑

j

∂qj

(∑

k

∂ri∂qk

qk +∂ri∂t

)δqj

=∑

i

mi ˙ri∑

j

∂ ˙ri∂qj

δqj

=∑

j

i

mi ˙ri∂ ˙ri∂qj

δqj

Page 198: Modelado y control de masas acopladas. Aplicación a dispositivos ...

198 APENDICE C. ECUACIONES DE LA MECANICA ANALITICA

=∑

j

∂qj

(∑

i

1

2mi ˙ri

2

)δqj (C.12)

Definamos el escalar T como

T =∑

i

1

2mi ˙ri

2(C.13)

al que llamaremos Energıa Cinetica. Si ahora reunimos todas las piezas,podemos escribir el principio de D’Alembert en funcion de las coordenadasgeneralizadas:

j

[d

dt

∂T

∂qj− ∂T

∂qj−Qj

]δqj = 0 (C.14)

En esta version del principio de D’Alembert, toda la informacion sobre elsistema se encuentra sintetizada en el escalar T , y todas las fuerzas aplicadas,en las fuerzas generalizadas Qj. Si las coordenadas qj son realmente coorde-nadas generalizadas, es decir, el mınimo numero de parametros en funcionde los cuales puede expresarse la posicion de cualquier punto del sistema, noexistiran relaciones funcionales entre ellas, y las δqj seran independientes, loque conduce a las n ecuaciones del movimiento

d

dt

∂T

∂qj− ∂T

∂qj−Qj = 0 (C.15)

para j = 1, · · · , n.

C.4. Ligaduras holonomas y no holonomas

Hemos definido antes las coordenadas generalizadas como el mınimo nu-mero de parametros qj que determinan la configuracion del sistema. Nor-malmente, la geometrıa del problema nos indica los grados de libertad delsistema, y por tanto el numero de coordenadas generalizadas que hemos debuscar. Aunque podemos elegir las coordenadas generalizadas de muchas for-mas distintas, una vez conocidos los grados de libertad, tampoco suele serdifıcil elegir un conjunto adecuado qj.

Page 199: Modelado y control de masas acopladas. Aplicación a dispositivos ...

C.4. LIGADURAS HOLONOMAS Y NO HOLONOMAS 199

Pero desde un punto de vista formal, no tenemos garantıa de que, dado unconjunto de parametros qj, su numero sea mınimo. Si j = 1, · · · , n, existiranen general m relaciones de la forma

ϕh(q1, · · · , qn, t) = 0 (C.16)

para h = 1, · · · , m. Cuando existen relaciones cerradas como las anterioresse habla de ligaduras holonomas. Una posibilidad en esta situacion consisteen usar las m relaciones para escribir m de las qj en funcion de las n − mrestantes, y reducir el problema entonces a uno con n−m grados de libertad,donde todas las qj sean independientes. Este procedimiento puede ser en-gorroso, y esteticamente insatisfactorio, por cuanto establece una diferenciaarbitraria entre parametros dependientes e independientes.

Si volvemos atras, a la deduccion de C.15, vemos que solo en el ultimo pasodel razonamiento exigimos la independencia de las qj. Lagrange encontro unmetodo elegante que permite deducir las ecuaciones del movimiento parasistemas donde existen ligaduras holonomas. De las ecuaciones de ligadura,se sigue que:

δϕh =∑

j

∂ϕh∂qj

δqj = 0 (C.17)

Si introducimos m parametros indeterminados λh, llamados multiplicadoresde Lagrange, es obvio que

h

λhδϕh = 0 (C.18)

Reescribiendo la relacion anterior en la forma

j

(∑

h

λh∂ϕh∂qj

)δqj = 0 (C.19)

restandola a C.14 y reordenando:

j

[d

dt

∂T

∂qj− ∂T

∂qj−Qj −

h

λh∂ϕh∂qj

]δqj = 0 (C.20)

Page 200: Modelado y control de masas acopladas. Aplicación a dispositivos ...

200 APENDICE C. ECUACIONES DE LA MECANICA ANALITICA

Ahora bien, hay n − m coordenadas que son independientes, luego laecuacion anterior implica que n−m terminos de la suma anterior son cero in-dividualmente. Pero, dada la arbitrariedad de los multiplicadores λh, elijamos-los de forma que los m terminos restantes tambien se anulen. El resultado esque para j = 1, · · · , n podemos hacer:

d

dt

∂T

∂qj− ∂T

∂qj−Qj −

h

λh∂ϕh∂qj

= 0 (C.21)

Ahora tenemos las n ecuaciones C.21 y las n + m incognitas qj, λh. Porsupuesto, las ecuaciones de ligadura son las m ecuaciones restantes que per-miten resolver el problema.

Por otro lado, es evidente que este razonamiento podrıa mantenerse auncuando no conociesemos las relaciones C.16 y siempre que dispusiesemos deC.17. Este es realmente el caso en muchas situaciones: solo se dispone derelaciones lineales en las diferenciales de las coordenadas qj. A este tipo derelaciones se les llama ligaduras no holonomas.

Existe una interpretacion fısica sencilla para los multiplicadores de La-grange, y vamos a dedicarle unas lıneas. Consideremos un sistema A sobre elque no hay fuerzas aplicadas, y cuyo movimiento viene determinado por unconjunto de ligaduras. Sea n el numero de grados de libertad de este sistema.Imaginemos ahora un sistema B con n+m grados de libertad. Podemos elegirun conjunto de fuerzas aplicadas de forma que su movimiento sea identico aldel sistema A. Sus ecuaciones del movimiento seran:

d

dt

∂T

∂qj− ∂T

∂qj= Qj (C.22)

para j = 1, · · · , n+m. Podemos igualmente imaginar un sistema C dondeimpongamos m ligaduras de la forma

ϕ(q1, · · · , qn+m) = 0 (C.23)

de forma que su movimiento, de nuevo, sea igual al del sistema A. Susecuaciones del movimiento seran:

d

dt

∂T

∂qj− ∂T

∂qj=∑

h

λh∂ϕh∂qj

(C.24)

Page 201: Modelado y control de masas acopladas. Aplicación a dispositivos ...

C.5. SISTEMAS CON FUNCION POTENCIAL 201

B y C son equivalentes a A, y por tanto equivalentes entre sı, y esto nospermite identificar:

Qj =∑

h

λh∂ϕh∂qj

(C.25)

C.5. Sistemas con funcion potencial

Puede suceder que las fuerzas aplicadas al sistema deriven de una funcionpotencial, es decir, que exista una funcion U(q1, · · · , qn) tal que:

Fi = −∂U∂ri

(C.26)

En este caso, las fuerzas generalizadas adoptan la forma sencilla:

Qj =∑

i

Fi∂ri∂qj

= −∑

i

∂U

∂ri

∂ri∂qj

= −∂U∂qj

(C.27)

Las ecuaciones C.15 pueden escribirse entonces en la forma:

d

dt

∂L

∂qj− ∂L

∂qj= 0 (C.28)

donde hemos introducido la funcion L = T − U , conocida como funcionde Lagrange, o simplemente Lagrangiana. Esta funcion dependera en generalde las coordenadas y velocidades generalizadas, y posiblemente del tiempo:bien porque la energıa potencial dependa del tiempo, bien porque las rela-ciones ri(q1, · · · , qn, t) lo contengan, bien por ambas causas a la vez. Cuandolas ecuaciones del movimiento pueden escribirse en esta ultima forma, querecordemos son ecuaciones diferenciales de segundo orden en las coordenadasgeneralizadas, es posible averiguar las circunstancias en que existen integralesprimeras, que pueden usarse para resolver las ecuaciones del movimiento.

En primer lugar, veamos que cuando una coordenada qj no aparece ex-plıcitamente en la Lagrangiana:

d

dt

∂L

∂qj= 0 (C.29)

Page 202: Modelado y control de masas acopladas. Aplicación a dispositivos ...

202 APENDICE C. ECUACIONES DE LA MECANICA ANALITICA

lo que implica que la cantidad

pj =∂L

∂qj(C.30)

es una constante. A pj se le llama momento generalizado.

En segundo lugar, procedamos a calcular la derivada respecto al tiempode la Lagrangiana:

dL

dt=∑

j

(∂L

∂qjqj +

∂L

∂qjqj

)+∂L

∂t(C.31)

Pero usando C.28,

dL

dt=∑

j

d

dt

(qj∂L

∂qj

)+∂L

∂t(C.32)

Intercambiando en el segundo miembro derivada y sumatoria:

d

dt

L−

j

pj qj

=

∂L

∂t(C.33)

De manera que cuando L no es funcion explıcita del tiempo, resulta que lacantidad

h = L−∑

j

pj qj (C.34)

es constante. De esta forma, una de las velocidades puede expresarse enfuncion de las coordenadas y velocidades restantes.

C.6. Fuerzas disipativas

En general, actuaran sobre los sistemas fuerzas que deriven de un potencialy fuerzas que no deriven de un potencial. Designando estas ultimas por Q∗j ,es evidente que:

d

dt

∂L

∂qj− ∂L

∂qj= Q∗j (C.35)

Page 203: Modelado y control de masas acopladas. Aplicación a dispositivos ...

C.6. FUERZAS DISIPATIVAS 203

Por otro lado, pueden existir fuerzas de rozamiento dependientes de lavelocidad, de la forma

Fi = −k ˙ri (C.36)

Las fuerzas generalizadas se escriben entonces como:

Qj =∑

i

Fi∂ri∂qj

= −∑

i

k ˙ri∂ri∂qj

= −∑

i

k ˙ri∂ ˙ri∂qj

= −∂F∂qj

(C.37)

donde hemos introducido la funcion de disipacion de Rayleigh F :

F =∑

i

1

2k ˙ri

2(C.38)

Para tales sistemas, donde parte de las fuerzas derivan de un potencial yotra parte son fuerzas disipativas, las ecuaciones del movimiento son:

d

dt

∂L

∂qj− ∂L

∂qj+∂F∂qj

= 0 (C.39)

Page 204: Modelado y control de masas acopladas. Aplicación a dispositivos ...

204 APENDICE C. ECUACIONES DE LA MECANICA ANALITICA

Page 205: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Apendice D

Dinamica general del actuador

D.1. Energıa cinetica

Consideremos un sistema inercial O, y un sistema movil S paralelo al mis-mo, cuyo origen respecto a O viene dado por el vector τ . Con el mismo origenque S sea el sistema P, cuyo origen coincide con el de S y se relaciona conel mediante una rotacion R(ϕ, θ, ψ). P es el sistema local para el conjuntode las dos masas acopladas, de forma que la relacion geometrica entre lascoordenadas inerciales y las coordenadas locales se sigue de

ro = τ + rs = τ + Rrp (D.1)

La energıa cinetica, en el sistema inercial, viene dada por

T =1

2m1 ˙r

2o,1 +

1

2m2 ˙r

2o,2 (D.2)

donde los segundos subındices se refieren a las masas 1 y 2. Se siguenentonces las relaciones:

˙ro = ˙τ + Rrp + R ˙rp (D.3)

y

˙rTo

˙ro = ˙τT ˙τ + ˙τ

TRrp + ˙τ

TR ˙rp +

rTp RT ˙τ + rTp RT Rrp + rTp RTR ˙rp

˙rTpRT ˙τ + ˙r

TpRT Rrp + ˙r

TpRTR ˙rp (D.4)

205

Page 206: Modelado y control de masas acopladas. Aplicación a dispositivos ...

206 APENDICE D. DINAMICA GENERAL DEL ACTUADOR

D.2. Energıa potencial y funcion de Rayleigh

La energıa potencial depende de la distancia relativa entre las dos masas,que es la misma en cualquier sistema de referencia, de forma que podemosescribir directamente

U =1

2k(rp,2 − rp,1)2 (D.5)

En cuanto a la funcion de Rayleigh F , depende de la velocidad relativade las masas en la direccion que las une. Esta observacion es importante,puesto que en un sistema movil la velocidad relativa puede ser no nula auncuando la distancia entre las masas sea constante, lo que ocurre con cualquiermovimiento de rotacion pura del sistema. Por tanto, en el sistema inercial:

F =1

[(ro,2 − ro,1)T

|ro,2 − ro,1|( ˙ro,2 − ˙ro,1)

]2

(D.6)

Pero la cantidad entre corchetes es una cantidad escalar, y por tanto in-variante frente a rotaciones. Si consideramos que el sistema puede moversecon toda generalidad en la referencia P, y no unicamente a lo largo de unode sus ejes, tenemos:

F =1

[(rp,2 − rp,1)T|rp,2 − rp,1|

( ˙rp,2 − ˙rp,1)

]2

(D.7)

D.3. Ecuaciones del movimiento

Para el calculo subsiguiente necesitaremos derivar expresiones del tipo xAyy xAx, respecto a x y respecto a y. Consideremos por ejemplo la componentej de

d

dxxTAy (D.8)

que escribimos como

d

dxj

(∑

i

xi∑

k

Aikyk =∑

k

Ajkyk = (Ay)j

)(D.9)

Page 207: Modelado y control de masas acopladas. Aplicación a dispositivos ...

D.3. ECUACIONES DEL MOVIMIENTO 207

y por tanto

d

dxxTAy = Ay (D.10)

De la misma forma, es facil ver que

d

dyxTAy = AT x (D.11)

y

d

dxxTAx = (A + AT )x (D.12)

El calculo de las derivadas que producen las ecuaciones del movimiento,exige la derivacion de terminos como (C.4), que por conveniencia llamaremos(*). Entonces

∂(∗)∂ ˙rp

= 2RT ˙τ + 2RT Rrp + 2˙rp (D.13)

mientras que

∂U

∂ ˙rp= 0 (D.14)

y por tanto

d

dt

∂(∗)∂ ˙rp

= 2RT ˙τ + 2RT ¨τ + 2RT Rrp + 2RT (Rrp + R ˙rp) + 2¨rp (D.15)

donde se ha usado el hecho de que la derivacion y la transposicion de unamatriz son operadores conmutativos. Continuamos calculando:

∂(∗)∂rp

= 2RT ˙τ + (RT R + RRT ) + 2RTR ˙rp (D.16)

Page 208: Modelado y control de masas acopladas. Aplicación a dispositivos ...

208 APENDICE D. DINAMICA GENERAL DEL ACTUADOR

Para la energıa potencial:

∂U

∂ ˙rp,2= k(rp,2 − rp,1) (D.17)

∂U

∂ ˙rp,1= −k(rp,2 − rp,1) (D.18)

Finalmente, son precisas las derivadas

∂F∂ ˙rp,2

= β(rp,2 − rp,1)T|rp,2 − rp,1|

( ˙rp,2 − ˙rp,1) (D.19)

y

∂F∂ ˙rp,1

= −β (rp,2 − rp,1)T|rp,2 − rp,1|

( ˙rp,2 − ˙rp,1) (D.20)

D.4. Fuerzas generalizadas

Consideremos ahora las fuerzas generalizadas. En el caso menos restrictivo,el sistema no es subactuado, sino que cada masa m1 y m2 se encuentrasometida a fuerzas que en el sistema inercial tienen resultantes Fo,1 y F0,2. Silas coordenadas generalizadas son los vectores de posicion en el sistema P,las fuerzas generalizadas se escriben

Q1 = F To,1

∂ro,1∂rp,1

+ F To,2

∂ro,2∂rp,1

(D.21)

y

Q2 = F To,1

∂ro,1∂rp,2

+ F To,2

∂ro,2∂rp,2

(D.22)

Introduciendo la matriz

Jij =∂ro,i∂rp,j

(D.23)

es posible escribir

Q = JT Fo = JTRFp (D.24)

Page 209: Modelado y control de masas acopladas. Aplicación a dispositivos ...

D.4. FUERZAS GENERALIZADAS 209

Pero

JT = RT (D.25)

y

RTR = I (D.26)

luego

Qi = Fp,i (D.27)

Reuniendo todos los elementos, podemos escribir en forma explıcita lasecuaciones del movimiento

d

dt

∂L

∂ ˙rp− ∂L

∂rp+∂F∂ ˙rp

= Qp (D.28)

para m1 y m2. Son las siguientes:

Fp,1 = m1RT ˙τ +m1R

T ¨τ +m1RT Rrp,1

+m1RT Rrp,1 +m1R

T R ˙rp,1 +m1¨rp,1

−m1RT ˙τ − 1

2m1(RT R + RRT )rp,1 −m1R

TR ˙rp,1

−k( ˙rp,2 − ˙rp,1)− β(rp,2 − rp,1)T|rp,2 − rp,1|

( ˙rp,2 − ˙rp,1) (D.29)

Fp,2 = m2RT ˙τ +m2R

T ¨τ +m2RT Rrp,2

+m2RT Rrp,2 +m2R

T R ˙rp,2 +m2¨rp,2

−m2RT ˙τ − 1

2m2(RT R + RRT )rp,2 −m2R

TR ˙rp,2

+k( ˙rp,2 − ˙rp,1) + β(rp,2 − rp,1)T

|rp,2 − rp,1|( ˙rp,2 − ˙rp,1) (D.30)

Page 210: Modelado y control de masas acopladas. Aplicación a dispositivos ...

210 APENDICE D. DINAMICA GENERAL DEL ACTUADOR

Por otro lado, la ecuacion correspondiente a la coordenada generalizada τse reduce a la constancia del momento asociado. Por tanto, el problema ge-neral se expresa en terminos de las dos ecuaciones del movimiento anteriores,sometidas a la restriccion

d

dt

[(m1 +m2) ˙τ + R(m1rp,1 +m2rp,2) + R(m1 ˙rp,1 +m2 ˙rp,2)

]= 0 (D.31)

Es facil ver como estas ecuaciones se reducen a las que presentamos para elmodelo monodimensional. En efecto, podemos considerar que tanto R comoτ , al igual que sus derivadas, son nulas, por lo que el unico termino distintode cero en el producto ˙r

T0

˙r0 es el ultimo de ellos. Entonces, si

rp =

0y0

(D.32)

la energıa cinetica es simplemente

T =1

2m1y

21 +

1

2m2y

22 (D.33)

La reduccion para la energıa potencial es trivial, y en cuanto a la funcionde Rayleigh, veamos que tiene la forma

F =1

2

[uT q

]2(D.34)

donde u es un vector unitario. El cuadrado entre corchetes se desarrollacomo

qT uuT q = qT q (D.35)

cantidad invariante frente a traslaciones y rotaciones y que se reduce a laexpresion usada en la seccion (2.3).

Page 211: Modelado y control de masas acopladas. Aplicación a dispositivos ...

Bibliografıa

[1] L. A. Pars. A treatise on analytical dynamics. London; Heinemann, 1965

[2] H. Goldstein. Classical Mechanics. Second Edition. Addison-Wesley,1986

[3] S. Barnet y R. G. Cameron. Introduction to mathematical control theory.Clarendon Press. Oxford. 1993

[4] R. F. Stengel. Optimal control and estimation. Dover. 1994

[5] E. R. Pinch. Optimal control and the calculus of variations. Oxford Uni-versity Press. 1997

[6] Hongjun Jeon, Dirk Grunwald y Renjeng Su. Design of servo control sys-tems with quadratic optimal control and observed-state feedback controlfor mems-based storage devices

[7] P. Vettiger, G. Cross et al. The millipede. Nanotechnology entering datastorage. IEEE Transaction on Nanotechnology, vol. 1, #1, pag. 39-55,marzo 2002.

[8] Stuart A. Solin. Nanosensores de campos magneticos Investigacion yCiencia, octubre, 2004

[9] Stuart A. Solin, D. R. Hines et al. Nonmagnetic semiconductors as read-head sensors for ultra high density magnetic recording. Applied PhysicsLetters, vol. 80, #21, pag. 4012-4014, mayo 2002.

[10] Richard Carley, Gregory R. Ganger y David F. Nagle. MEMS-basedintegrated circuit mass storage systems. Communications of the ACM,vol. 43, #11, noviembre 2000

[11] Richard Carley, James A. Bain et al. Single-chip computers with MEMS-based magnetic memory. Journal of Applied Physics, vol. 78, #9, mayo2000

211

Page 212: Modelado y control de masas acopladas. Aplicación a dispositivos ...

212 BIBLIOGRAFIA

[12] Donald E. Kirk. Optimal control theory. An introduction Dover, 2004

[13] Gene F. Franklin, J. David Powell y Michael Workman. Digital controlof dynamic systems. Addison-Wesley Longman Inc., 1998

[14] Bryson A. E. y Y. C. Ho. Applied optimal control. Halsted Press, 1975.

[15] Rothemberg, Jeff ¿Son perdurables los documentos digitales ? Investi-gacion y Ciencia, Marzo, 1995

[16] Mustafa Uysal, Arif Merchant y Guillermo A. Alvarez. Using MEMS-based storage in disk arrays. Proceedings of the 2nd USENIX Conferenceon File and Storage Technologies, Marzo, 2003

[17] Raju Rangaswami, Zoran Dimitrijevic y Edward Chang. MEMS-baseddisk buffer for streaming media servers University of California in SantaBarbara. Supported by SONY/UC DiMI and the NSF CISE Infrastruc-ture grant EIA-0080134

[18] Elmer S. Hung y Stephen Senturia. Generating efficient dynamical mod-els for microelectromechanical systems from a few finite element simula-tion runs. IEEE Journal of microelectromechanical systems, vol. 8, #3,September 1999

[19] Jinghong Chen y Sung-Mo Kang. Reduced-order modeling of weakly non-linear MEMS devices with taylor-series expansion and Arnoldi approach.Jornal of Microelectromechanical systems, vol. 13, #3, June 2004

[20] E. M. Navarro-Lopez y R. Suarez. Vibraciones mecanicas en una sartade perforacion: problemas de control. Revista Iberoamericana de Au-tomatica e Informatica Industrial. vol. 2, #1, Enero 2005

[21] Brett J. F. The genesis of torsional drillstring vibrations. SPE DrillingEngineering, September, 168-174.

[22] Jansen J. D. y L. van den Steen. Active damping of self-excited torsionalvibrations in oil well drillstrings. Journal of sound and vibration, 179(4),647-668.

[23] Kyllingstad A. y G. W. Halsey. A study of slip/stick motion of the bit.SPE Drilling Engineering, December, 369-373

[24] Abbassian F. y V. A. Dunayevsky. Application of stability approach totorsional and lateral bit dynamics. SPE Drilling and completion. 13(2),99-107, 1998

Page 213: Modelado y control de masas acopladas. Aplicación a dispositivos ...

BIBLIOGRAFIA 213

[25] C. Phillips, Newsletter, Simulation 6,1. Enero 1966, p.6

[26] G. P. Cimellaro. Coupled buildings control. 16th ASCE Engineering Me-chanics Conference. Juli0 2003. Universidad de Washington. Seattle.

[27] Richard E. Christenson, B. F. Spencer, Jr., Natsuko Hori y Kazuto Seto.Coupled building control using acceleration feedback. Computer-AidedCivil and Infrastructure Engineering. Aceptado Agosto 2001.

[28] K. S. Fu, R. C. Gonzalez y C. S. G. Lee. Robotics: Control, sensing,vision and intelligence. McGraw-Hill, 1987

[29] G. L. Kotkin, V. G. Serbo. Problemas de mecanica clasica. Traducciondel ruso, Editorial MIR, 1980.

[30] Max Born. Atomic Physics. Dover Publications Inc. Nueva York, 1989

[31] Oliver Guenther, Tad Hogg y Bernardo A. Huberman. Controls for un-stable structures. Proc. of SPIE Conference on Mathematics and Controlin Smart Structures. Marzo, 1997. p. 754-763

[32] H. Cabannes. Cours de Mecanique Generale. Parıs, Dunod, 1966.

[33] Marsden J. E. Ratiu S. I.. Introduction to Mechanics and Simmetry.New York, Springer Verlag, 1999.

[34] Chetaev N. G.. Theoretical Mechanics Moscow, Mir, 1989.

[35] Arnold V. I.. Mathematical methods of classical mechanics. New York,Springer Verlag, 1974.

[36] Cannon R. H.. Dynamics of physical systems. New York, McGraw-Hill,1967.

[37] Wiggins S.. Introduction to applied nonlinear dynamical systems andchaos. New York, Springer Verlag, 1990.

[38] Franklin G. F., Powell J. D., Emani-Naeni A.. Feedback control of dy-namics systems. New York, Prentice Hall, 2000.

[39] Goodwin G. C., Grebe S. F., Salgado M. E.. Control system design.Saddle River, New Jersey, Prentice Hall, 2001.

[40] Shilnikov L. P., Shilnikov A. L., Turaev D. V., Chua L. O.. Methodsof qualitative theory in nonlinear dynamics. Part II. New Jersey, WorldScientific, 2001.

Page 214: Modelado y control de masas acopladas. Aplicación a dispositivos ...

214 BIBLIOGRAFIA

[41] Kuznetsov Y. A.. Elements of applied bifurcation theory. New York,Springer Verlag, 1998.

[42] Glendinning P.. Stability, instability and chaos: an introduction to thetheory of nonlinear differential equations. New York, Cambridge Univer-sity Press, 1996.

[43] Ogata K.. Modern engineering control. New York, Prentice Hall, 2000.

[44] Wiggins S.. Global bifurcation and chaos. Analytical methods. New York,Springer Verlag, 1998.

[45] Holden A. V. (editor) Chaos. Princeton, New Jersey, Princeton Univer-sity Press, 1986.

[46] Ott E.. Chaos in dynamical systems. Cambridge, Cambridge UniversityPress, 2002.

[47] Atanasio Lleo. Percusiones. Universidad Nacional de Educacion a Dis-tancia. 1975.

[48] J. Martınez Salas. Mecanica Analıtica. Paraninfo, 1986.

[49] F. Javier Gil Chica. Problemas resueltos de introduccion al control opti-mo. Universidad de Alicante, 2004.

[50] M. Perez Polo, J. Vicente Rocamora, J.A. Berna Galiano F. Javier GilChica. Control por linealizacion exacta entrada salida de un manipuladorplano subactuado. XXIV Jornadas de Automatica. Leon, 2003

[51] Special issue on solid-state sensors, actuators and interface electronics.IEEE Transactions on electron devices, vol. ED-26, 12, diciembre 1979.

[52] Kurt Petersen. Silicon as a mechanical material. Proceedings of theIEEE, vol. 70, 5, Mayo 1980.

[53] Special issue on solid-state sensors, actuators and interface electronics.IEEE transactions on electron devices, vol. ED-29, 1, Enero 1982.

[54] Guckenheimer, J. Holmes, P.. Nonlinear oscillations, dynamical systemsand bifurcations of vector fields. Springer Verlag, New York, 1996.

[55] Hale, J. Kocac, H.. Dynamics of bifurcations. Springer Verlag, NewYork, 1996.

Page 215: Modelado y control de masas acopladas. Aplicación a dispositivos ...

BIBLIOGRAFIA 215

[56] Hilborm, R.C.. Chaos and nonlinear dynamics. Oxford University Press,2000.

[57] Khalil, H.K.. Nonlinear systems. Prentice Hall, New York, 1996.

[58] Lichtenberg, A.J. Lieberman, M.A.. Regular and chaotic dynamics.Springer Verlag, New York, 1996.

[59] Marsden J.E. McCraken M.. The Hopf bifurcation and its applications.Springer Verlag, New York, 1976.

[60] Perko, L.. Differential equations and dynamical systems. Springer Verlag,New York, 1996.

[61] Seydel, R.. Practical bifurcation and stability analysis form equilibriumto chaos. Springer Verlag, New York, 1994.

[62] Vidyasagar, M.. Nonlinear system analysis. Prentice Hall, 1993.

[63] Bojkov, B. Luus, R.. Optimal control of nonlinear systems with unspec-ified final times. Chem. Eng. Sci., vol. 51, 6, 1996.

[64] Cannon, R.H. Dynamics of physical systems. McGraw-Hill, 1967.

[65] Gantmajer, F.R.. Mecanica Analıtica. Ed. URSS, Moscu, 1996.

[66] Grebenikov, E.A. Ryabov, Y.A.. Constructive methods in the analysisof nonlinear systems. MIR, Moscu, 1983.

[67] Meisel, J.. Principios de conversion de energıa electromecanica. SerieMcGraw-Hill de ingenierıa electrica y electronica. 1968.

[68] Migulin, V. Medvedev, V. Mustel, E..Basic theory of oscillations. MIR,Moscu, 1983.

[69] Ortega, R. Lorıa, A. Nicklasson, P.J. Sira Ramırez, H.. Passivity-basedcontrol of euler-lagrange systems. Springer Verlag, 1998.

[70] Ott, E. Gregobi, C. Yorke, J.A.. Controlling chaos. Phys. Rev. Lett.,64(11), 1990.

[71] Sastry, S.. Nonlinear system. Analysis, stability and control. SpringerVerlag, New York, 1999.

[72] Vincent, T.L.. Control using chaos. Control systems, 1997.

Page 216: Modelado y control de masas acopladas. Aplicación a dispositivos ...

216 BIBLIOGRAFIA

[73] Serra, I. Vilanoba, R.V.. Tractament del senyal. U.A.B., Bellaterra,1999.

[74] Albertos, P. Sala, A.. Multivariable control systems: an engineeringapproach. Springer Verlag, 2003.

[75] Perez Polo, M. Rocamora, V. Berna Galiano, J.A. Gil Chica, F.J..Control por linealizacion exacta entrada salida de un actuador planosubactuado. XXIV Jornadas de Autmatica, Leon, 2003.

[76] Kulakov A. Rumiantsev A.. Introduccion a la Fısica de procesos nolineales. MIR, Moscu, 1988.

[77] Manuel Perez, Rafael Font, Marco A.Montava. Regular self-oscillatingand chaotic dynamics of a continuous stirred tank reactor. ComputersChemical Engineering, 26 (2002) 889-901.

[78] Manuel F. Perez Polo, Manuel Perez Molina. Regular self-oscillating andchaotic behaviour of a PID controlled gimbal suspension gyro. ChaosSolitons Fractals 21 (2004) 1057-1074.