Control de Masas Acopladas

216
Modelado y control de masas acopladas. Aplicaci´ on a dispositivos de almacenamiento micro-electromec´ anicos. D. Francisco Javier Gil Chica Tesis Doctoral dirigida por el Dr. D. Manuel F. P´ erez Polo. Departamento de F´ ısica, Ingenier´ ıa de Sistemas y Teor´ ıa de la Se˜ nal. Escuela Polit´ ecnica Superior. Universidad de Alicante 1

Transcript of Control de Masas Acopladas

  • Modelado y control de masasacopladas. Aplicacion a dispositivos

    de almacenamientomicro-electromecanicos.

    D. Francisco Javier Gil Chica

    Tesis Doctoral

    dirigida por el Dr. D. Manuel F. Perez Polo.

    Departamento de Fsica, Ingeniera de Sistemas y Teora

    de la Senal.

    Escuela Politecnica Superior.

    Universidad de Alicante

    1

  • 2Para mis padresy hermanos

  • Indice general

    1. Objetivos y alcance de esta tesis 91.1. Interes del modelo objeto de esta tesis . . . . . . . . . . . . . 91.2. Oportunidad de la Tesis . . . . . . . . . . . . . . . . . . . . . 131.3. Naturaleza y contenidos de esta Tesis . . . . . . . . . . . . . . 151.4. Aportaciones novedosas . . . . . . . . . . . . . . . . . . . . . . 20

    2. Modelo fsico para el actuador 232.1. El modelo fsico . . . . . . . . . . . . . . . . . . . . . . . . . . 232.2. El porque del control optimo . . . . . . . . . . . . . . . . . . . 242.3. Modelo y ecuaciones basicas . . . . . . . . . . . . . . . . . . . 262.4. Regulador de energa mnima . . . . . . . . . . . . . . . . . . 322.5. Simulaciones y discusion . . . . . . . . . . . . . . . . . . . . . 332.6. Control Bang-Bang . . . . . . . . . . . . . . . . . . . . . . . . 35

    3. Regulacion y servocontrol 413.1. Tiempo y estado final fijos . . . . . . . . . . . . . . . . . . . . 413.2. Tiempo libre y estado final fijo . . . . . . . . . . . . . . . . . . 463.3. Tiempo fijo y estado final libre . . . . . . . . . . . . . . . . . . 463.4. Tiempo y estado final libres . . . . . . . . . . . . . . . . . . . 47

    3.4.1. Coste tiempo-energa con termino de Mayer . . . . . . 483.5. Servomecanismo con coste tiempo-energa . . . . . . . . . . . 513.6. Servomecanismo LQR . . . . . . . . . . . . . . . . . . . . . . 52

    3.6.1. Tiempo fijo y estado final libre. Ecuacion de Ricatti . . 523.6.2. Tiempo libre y estado final fijo . . . . . . . . . . . . . 54

    3.7. Programacion dinamica . . . . . . . . . . . . . . . . . . . . . . 58

    4. Modelo con acoplamiento no lineal 654.1. Modelo fsico . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.2. Regulador de energa mnima . . . . . . . . . . . . . . . . . . 664.3. Inclusion de un termino de Mayer . . . . . . . . . . . . . . . . 704.4. Efecto de una perturbacion acimutal . . . . . . . . . . . . . . 72

    3

  • 4 INDICE GENERAL

    4.5. Dinamica no lineal con funcion de coste LQR . . . . . . . . . 814.5.1. Tiempo y estado final fijos . . . . . . . . . . . . . . . . 814.5.2. Tiempo fijo y estado final libre . . . . . . . . . . . . . 83

    5. Acoplamiento a un dispositivo movil 855.1. El modelo fsico . . . . . . . . . . . . . . . . . . . . . . . . . . 85

    5.1.1. Regulador tiempo-energa con estado final conocido . . 895.2. Estado final libre y termino de Mayer . . . . . . . . . . . . . . 935.3. Efecto de un campo de aceleracion . . . . . . . . . . . . . . . 955.4. LQR con tiempo y estado final fijos . . . . . . . . . . . . . . . 975.5. LQR con tiempo final fijo y estado final libre . . . . . . . . . . 995.6. LQR con estado final fijo y tiempo final libre . . . . . . . . . . 1005.7. LQR con tiempo y estado final libres . . . . . . . . . . . . . . 100

    6. Dinamica no lineal e impulsiva 1016.1. Dispositivos micro-electromecanicos . . . . . . . . . . . . . . . 1016.2. Aspectos mecanicos comparativos . . . . . . . . . . . . . . . . 1046.3. Modelo fsico . . . . . . . . . . . . . . . . . . . . . . . . . . . 1066.4. Puntos de equilibrio . . . . . . . . . . . . . . . . . . . . . . . . 107

    6.4.1. Puntos de equilibrio para el muelle duro . . . . . . . . 1076.4.2. Puntos de equilibrio para el muelle blando . . . . . . . 108

    6.5. Analisis del sistema con muelle duro . . . . . . . . . . . . . . 1096.6. Analisis del sistema con muelle blando . . . . . . . . . . . . . 1146.7. Muelle duro con realimentacion del estado . . . . . . . . . . . 1146.8. Analisis del comportamiento caotico . . . . . . . . . . . . . . . 1186.9. Analisis de valores numericos . . . . . . . . . . . . . . . . . . 1216.10. Dinamica impulsiva . . . . . . . . . . . . . . . . . . . . . . . . 128

    6.10.1. Motivacion . . . . . . . . . . . . . . . . . . . . . . . . 1286.10.2. Ecuacion fundamental . . . . . . . . . . . . . . . . . . 1306.10.3. Implantacion de ligaduras no holonomas . . . . . . . . 1326.10.4. Ligaduras no persistentes . . . . . . . . . . . . . . . . . 1336.10.5. Sistema de dos masas acopladas . . . . . . . . . . . . . 134

    7. Sistema completamente actuado 1397.1. Modelo y ecuaciones de control . . . . . . . . . . . . . . . . . 1397.2. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1517.3. Realimentacion integral . . . . . . . . . . . . . . . . . . . . . . 158

    8. Modelo de actuador bidimensional 1638.1. Modelo fsico . . . . . . . . . . . . . . . . . . . . . . . . . . . 1638.2. Servomecanismo LQR . . . . . . . . . . . . . . . . . . . . . . 166

  • INDICE GENERAL 5

    9. Conclusiones y perspectivas 1719.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1719.2. Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

    A. Notas historicas 177A.1. Orgenes del almacenamiento magnetico . . . . . . . . . . . . 177A.2. La crisis de las memorias masivas . . . . . . . . . . . . . . . . 179A.3. Almacenamiento magneto-optico . . . . . . . . . . . . . . . . . 181A.4. Almacenamiento optico y holografico . . . . . . . . . . . . . . 182A.5. Almacenamiento con resolucion atomica . . . . . . . . . . . . 183

    B. Ecuaciones basicas del control optimo 185B.1. Planteamiento y ecuaciones basicas . . . . . . . . . . . . . . . 185B.2. Reguladores y servomecanismos . . . . . . . . . . . . . . . . . 187

    C. Ecuaciones de la Mecanica analtica 193C.1. Mecanica vectorial y mecanica analtica . . . . . . . . . . . . . 193C.2. Coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . 194C.3. El principio de DAlembert . . . . . . . . . . . . . . . . . . . . 195C.4. Ligaduras holonomas y no holonomas . . . . . . . . . . . . . . 198C.5. Sistemas con funcion potencial . . . . . . . . . . . . . . . . . . 201C.6. Fuerzas disipativas . . . . . . . . . . . . . . . . . . . . . . . . 202

    D. Dinamica general del actuador 205D.1. Energa cinetica . . . . . . . . . . . . . . . . . . . . . . . . . . 205D.2. Energa potencial y funcion de Rayleigh . . . . . . . . . . . . 206D.3. Ecuaciones del movimiento . . . . . . . . . . . . . . . . . . . . 206D.4. Fuerzas generalizadas . . . . . . . . . . . . . . . . . . . . . . . 208

  • 6 INDICE GENERAL

  • Indice de tablas

    3.1. t1 para distintos y n . . . . . . . . . . . . . . . . . . . . . . 50

    9.1. Familia de problemas investigados . . . . . . . . . . . . . . . . 172

    7

  • 8 INDICE DE TABLAS

  • Captulo 1

    Objetivos y alcance de estatesis

    1.1. Interes del modelo objeto de esta tesis

    El pendulo debe su ubicuidad en la Fsica al hecho de que es una re-presentacion simple del estado de muchos sistemas en las proximidades delequilibrio. No es de extranar que pueda encontrarsele desde los textos deMecanica elementales hasta trabajos mas avanzados sobre simulacion y con-trol de pendulos acoplados con comportamiento caotico. De igual forma, lasdistintas variantes de pendulos se utilizan para la demostracion de tecnicasintermedias y avanzadas, en mecanica y control de sistemas hamiltonianos.

    De igual forma, los sistemas de masas acopladas ilustran la posibilidadde modelar distintos dispositivos que aparecen en la tecnica y la ingenieramodernas. Esta tesis se centra precisamente en el modelado analisis y controlde sistemas de masas acopladas, incluyendo la posibilidad de no linealidadesen el acoplamiento elastico de las masas. A continuacion se exponen algunossistemas que se han modelado utilizando masas acopladas.

    El modelo de la Figura 1.1 ha sido discutido en [26] y [27] en relacion conla respuesta dinamica de edificios sometidos a sesmos. El edificio se modelacomo un conjunto de masas con acoplamiento elastico-viscoso, y se estudia elcontrol de las sacudidas ssmicas acoplando edificios con frecuencias propiasdiferentes.

    En otro contexto, el de la ingeniera minera, en [20] se propone un modelodinamico a partir de dos masas acopladas para estudiar y tratar de controlar

    9

  • 10 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

    Figura 1.1 Modelo para edificio sometido a sacudida ssmica.

    las vibraciones de la dinamica torsional de una sarta de perforacion, pro-blema que tambien se trata, entre otros, en [21], [22], [23] y [24]. La Figura1.2 representa dicho modelo, que incluye friccion torsional y friccion viscosaen los extremos de la sarta, a su vez modelados como discos homogeneoscon momentos de inercia Ia e Ib. Un modelo similar sirve para modelar elcomportamiento de un disco duro de altas prestaciones, como se discute en[13].

    Un caso particularmente interesante lo provee la biomecanica, que se ocu-pa desde hace tiempo del modelado del cuerpo humano, de forma que sepueda simular de forma realista su comportamiento, por ejemplo durante lamarcha o su respuesta frente a impactos. En [25] se discute el modelo quereproducimos en la Figura 1.3.

    Muchos ejemplos pueden obtenerse de la tecnica de automocion. Los vehcu-los pueden modelarse como un conjunto de solidos acoplados mediante fuerzasrestauradoras y disipativas. Considerese por ejemplo la relacion dinamica

  • 1.1. INTERES DEL MODELO OBJETO DE ESTA TESIS 11

    k

    Ia

    Ib

    1

    2

    k1

    k2

    Figura 1.2 Modelo para una sarta de perforacion.

    entre una carrocera autoportante y el chasis sobre el que se apoya. Partesmecanicas esenciales tambien se modelan mediante acoplamiento de masas,bien con dinamica lineal en el caso de los sistemas de amortiguacion, o condinamica torsional, como ocurre con los arboles de transmision.

    La robotica provee sistemas con dinamica similar, como cuando se modelauna articulacion mediante un par restaurador que depende del angulo relativoentre las secciones que une y una disipacion que depende de la velocidadangular entre dichas secciones. Vease por ejemplo [28].

    La Fsica Teorica se ha ocupado desde hace mucho de la respuesta deestructuras periodicas, que se modelan adecuadamente mediante retculas demasas unidas por elementos elasticos, modelos que han sido consideradostanto desde el punto de vista clasico, como en [29], como desde el punto devista cuantico, vease [30]. No obstante, estos modelos suelen tratarse comosistemas autonomos, mientras que a nosotros nos interesa el control que puedeejercerse sobre ellos.

  • 12 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

    Cabeza

    Torso

    AbdomenBrazos

    Figura 1.3 Modelo para el cuerpo humano.

    Nuevas oportunidades de analisis aparecen continuamente. En [31] se dis-cute el control que puede ejercerse sobre una cadena lineal de masas acopladas,y se aplica una tecnica novedosa. En este caso, como en otros muchos rela-cionados con el movimiento pendular, es interesante disponer de modelosmecanicos sencillos que no obstante exhiban una dinamica rica y capturenel comportamiento de una amplia variedad de dispositivos de la tecnica y laingeniera de la forma mas precisa posible.

    En [6], [10], [18] y [19] se discuten modelos para sistemas de almacenamien-to micro-electromecanicos. Mas adelante se dara una descripcion mas detalla-da de estos sistemas, en el contexto de los dispositivos para almacenamientode informacion, pero ahora nos interesa solo resaltar el hecho de que unmodelo fsico tan sencillo como el de una sola masa sometida a una fuerza

  • 1.2. OPORTUNIDAD DE LA TESIS 13

    restauradora y otra disipativa es suficiente para capturar la dinamica rele-vante.

    1.2. Oportunidad de la Tesis

    La oportunidad de esta Tesis se centra en dos vertientes:

    1. Los problemas planteados de modelado simulacion y control de dis-positivos formados por masas acopladas utilizando tecnicas de controloptimo y utilizacion del posible comportamiento caotico para disenarsistemas de control eficientes cuando las masas involucradas son muypequenas, tal como sucede en los dispositivos micro electromecanicosde almacenamiento masivo.

    2. El inicio de una nueva lnea de investigacion en control optimo y controlno lineal en la Universidad de Alicante.

    Ya se presentaron en la seccion anterior un muestrario de sistemas que hansido objeto de interes en sus respectivos campos: desde las vibraciones de unasarta de perforacion hasta un modelo biometrico para cuantificar el impactode un puno cerrado contra un bloque. Es oportuno por tanto este trabajo enel sentido de que establece una plataforma analtica comun para el estudiode esta heterogeneidad de sistemas, extrayendo en cada campo en particularla parte dinamica esencial y dando a todas ellas un tratamiento unificado,con una notacion coherente y un mismo metodo.

    Partiendo de la plataforma analtica que se va a construir, se explora untipo particular de sistemas que atraen la atencion de centros de investigaciony empresas desde hace tiempo. A saber, los sistemas de almacenamientobasados en dispositivos micro-electromecanicos. Se vera mas adelante que elmismo esquema general que permite modelar y analizar el control de sis-temas heterogeneos, permite tambien profundizar en el comportamiento deestos dispositivos, y as se analizara la influencia que sobre la dinamica y elcontrol tiene la integracion de estos dispositivos en aparatos portatiles, comotelefonos moviles.

    A la vista de los problemas planteados, el control optimo es lo suficiente-mente flexible para acomodarse a los propositos de la siguiente investigacion,ya que:

  • 14 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

    1. Enlaza a traves del calculo de variaciones con ramas de la Fsica quese apoyan en esta misma rama del Analisis, como la Mecanica.

    2. Se adapta igualmente bien a sistemas de una entrada y una salida y asistemas con multiples entradas y salidas.

    3. Permite al menos plantear de forma consistente tanto los problemaslineales como los no lineales, y se adapta bien en aquellos casos en quese quieran obtener soluciones analticas o semi-analticas de sistemasno lineales a partir de sistemas lineales mas simples.

    4. Permite integrar en la fase de diseno, pero sin condicionar el desarrolloposterior, requerimientos propios de fases mas avanzadas, como costede la implementacion o grado de precision requerida en el control, y esosimplemente eligiendo distintas formas de la funcion de coste y distintascondiciones de contorno.

    Se tiene por tanto una familia de problemas que abarca distintas condi-ciones de contorno y funciones de coste. Esta familia no es exhaustiva, peroconsideramos que suficientemente representativa, como se comprobara a par-tir de la Tabla 9.1. No obstante, hay un rasgo comun compartido por casitodos los problemas tratados aqu, y es el hecho de que son sistemas subac-tuados. En efecto, a diferencia de otras muchas descripciones teoricas, en estatesis se presentan los sistemas de masas acopladas sometidas a un esfuerzode control.

    Ademas del control optimo, en esta tesis se presenta un metodo novedosopara controlar sistemas de masas acopladas con muelle no lineal utilizandocomo modelo de referencia el oscilador de Duffing. A partir de este sistemase estudia el comportamiento caotico, el cual se utiliza de forma ventajosapara posicionar dispositivos MEM.

    Por consiguiente, este trabajo:

    1. Extrae la dinamica comun a una amplia variedad de modelos usados enmuchos lugares de la tecnica y la ingeniera, y provee un marco generaldonde considerar a todos ellos.

    2. Estudia el control de estos sistemas, y para ello considera idoneo el con-trol optimo y el posible comportamiento caotico de masas con acopla-miento no lineal.

  • 1.3. NATURALEZA Y CONTENIDOS DE ESTA TESIS 15

    1.3. Naturaleza y contenidos de esta Tesis

    A continuacion se describe el plan y contenidos del trabajo realizado captu-lo por captulo a partir del segundo.

    Captulo segundo. En este captulo se presenta un primer modelo paraun actuador formado por dos masas acopladas elasticamente y con disipacionviscosa. Existen en la bibliografa dos tendencias extremas. Por una parte, en[6] podemos encontrar un modelo extremadamente sencillo para un actuador,y de una sola masa y por tanto completamente actuado, lo que quiere decircompletamente rgido, mientras que en [18] se sigue el camino de modelar me-diante elementos finitos uno de estos dispositivos, simular su comportamientoy a partir de los datos de las simulaciones extraer los parametros fsicos paraajustar modelos mas sencillos. Por el contrario en esta tesis se propone unmodelo que siendo sencillo puede representar bien la dinamica que nos intere-sa. Al considerar dos masas acopladas y subactuadas estamos extendiendo elintervalo de aplicacion de un modelo que en caso lmite coincidira con el deuna sola masa.

    En la seccion 2.2 se vuelve a justificar el uso del control optimo, con ar-gumentos distintos a los usados anteriormente, y se concluye que se trata desentar las bases de diseno para una variedad de requerimientos: autonoma,velocidad de respuesta, precision, coste.

    Enseguida se pasa a exponer el modelo analtico: de las ecuaciones de La-grange a la introduccion de variables de estado, y de ah al calculo, tan engor-roso como necesario, de la matriz de transicion de estados. Inmediatamentese plantea y se resuelve el problema del control optimo para una funcionde coste energetica y se obtiene una solucion analtica para el control u(t).De las simulaciones se desprende la posibilidad de realizar un control bang-bang, que en determinados dispositivos podra resultar una opcion economicay suficiente, por el abaratamiento en los actuadores y en el propio sistemade control. Investigando este punto llegamos al primer resultado relevante:es imposible la existencia de un control de este tipo, afirmacion que se de-muestra en la seccion 2.6. La afirmacion de esta imposibilidad conduce a lapregunta natural de cuanto es posible acercarse al punto de consigna me-diante un control bang-bang. Esta discusion cierra el captulo segundo. Porotra parte, en las mismas simulaciones se observa la dependencia acusadaentre la energa consumida en el proceso y la rigidez del sistema, haciendovisible la dependencia analtica con la rigidez k que se encierra en la expre-

  • 16 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

    sion hallada para u(t) a traves de la matriz de transicion de estados, lo quejustifica el calculo que ocupa la primera parte del captulo.

    Captulo tercero. Es natural despues del captulo anterior ampliar lafuncion de coste con un termino cuadratico en el vector de estado, y este esel trabajo acometido en este tercero, que sin duda es mas denso. Los puntosde interes del captulo se resumen a continuacion:

    1. Se consideran tanto los reguladores como los servomecanismos.

    2. La discusion se completa comparando los resultados obtenidos, al menosparte de ellos, con la implementacion discreta que proporciona la pro-gramacion dinamica.

    3. Se considera una serie de condiciones de contorno, cada una de ellasapropiada para circunstancias especficas.

    4. Para llevar algo mas alla el objeto del captulo ( ampliar la funcion decoste con un termino cuadratico en el estado ) consideramos la funcionde coste tiempo-energa.

    5. Se considera la influencia en el control de la adicion de un terminode Mayer, pensando en aquellas implementaciones con requerimientosestrictos sobre el estado final del sistema.

    Respecto al trabajo computacional, hay que destacar:

    1. Con condiciones de contorno estrictas, cuando disminuye el factor quepondera el control, lo que conlleva valores mayores para este, aumentaun intervalo de tiempo en el que el esfuerzo de control toma valoresmuy pequenos, mientras que los mayores esfuerzos se concentran enlos extremos del intervalo. Esta tendencia se agudiza, acercandose alcontrol que se obtiene mediante programacion dinamica. Sin embargo,el control continuo conduce bruscamente a oscilaciones crecientes delsistema cerca del punto de consigna.

    2. Cuando el tiempo final se deja libre, no as el estado final, el controloptimo con funcion de coste LQR no puede conducir al sistema, comose justifica al final de la seccion 3.2. La discusion que aqu aparecejustifica el ensayo de una funcion de coste tiempo-energa con condicionde Mayer. Los calculos y simulaciones de la seccion 3.4.1 conduce alhecho significativo de que existe una relacion muy definida entre el

  • 1.3. NATURALEZA Y CONTENIDOS DE ESTA TESIS 17

    tiempo en que se puede alcanzar el punto de consigna y el factor quepondera el esfuerzo de control en la funcion de coste. La seccion 3.5extiende la discusion de la 3.4.1 al caso del servocontrol.

    3. El analisis del servocontrol con funcion de coste LQR y condiciones decontorno que dejan libres tanto el estado final como el tiempo en quese alcanza demuestra que:

    La ecuacion diferencial de Ricatti no puede sustituirse por su ver-sion algebraica.

    La norma de la matriz P y el esfuerzo de control u(t) varan deforma aproximadamente lineal.

    El error en el extremo del servo tiene un comportamiento muysatisfactorio.

    Captulo cuarto. Este es el captulo donde se introduce un acoplamientono lineal entre las masas. El planteamiento de las ecuaciones del movimientoy la introduccion de variables de estado conduce a la ecuacion (4.5), queresume la no linealidad en la aparicion de un vector dependiente del estado. Elprimer problema de control que planteamos aqu es el del regulador de energamnima con condiciones de contorno completas, y nuestro plan consiste enencontrar un procedimiento iterativo que permita, a partir de la solucion parael sistema lineal, encontrar tanto el estado como el control para el sistemano lineal con la precision que se desee. Es elocuente en este sentido la Figura4.1, que demuestra la rapida convergencia del metodo que se propone.

    Podramos preguntarnos si esta convergencia es debida a las particularescondiciones de contorno que se han elegido, y esta es la razon por la que enla seccion siguiente nos ocupamos de relajarlas parcialmente, dejando libreel estado final pero obligatoriamente entonces introduciendo un termino deMayer. Llegados a este punto, es importante darse cuenta de la extensibilidaddel metodo de aproximaciones sucesivas que acabamos de desarrollar, y as elcaptulo termina con una discusion del regulador con dinamica no lineal yfuncion de coste LQR.

    El otro punto significativo en el desarrollo de este captulo es el estudio delefecto de una perturbacion acimutal sobre el sistema que desea controlarse.Formalmente, el sistema viene descrito por una ecuacion no homogenea, nolineal, como la citada (4.5), con la diferencia de que ahora la matriz del sis-tema A es una funcion del tiempo, invalidando la herramienta que hemos

  • 18 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

    usado en el resto del trabajo. Por consiguiente se realiza en primer lugarun estudio analtico que parte de las ecuaciones (4.55), (4.59) Y (4.60) yen segundo la implementacion de los algoritmos computacionales que nosconduzcan al control deseado. La Figura 4.4 representa el control que es pre-ciso aplicar, pero la consecucion de esta grafica ha requerido el diseno deun algoritmo basado en el metodo del gradiente pero con un paso variabledinamicamente que se ha mostrado especialmente robusto, pues puede recu-perarse de ciclos divergentes, autocorrigiendose y conduciendo finalmente alresultado deseado.

    Captulo quinto. En este captulo se ampla el rango de aplicabilidaddel modelo estudiado en el captulo tercero. En efecto, se trata de acoplar elactuador a un dispositivo contenedor y estudiar el control que puede ejercersesobre el actuador cuando sobre el contenedor actuan perturbaciones generic-as, que nosotros pronto particularizamos a dos posibles: entradas en escalony perturbaciones armonicas de diferentes frecuencias. Los resultados que seobtienen aqu son de aplicacion directa a los DMEM. Tras plantear las ecua-ciones del movimiento e introducir las variables de estado, estudiamos lasfunciones de coste tiempo-energa y LQR con distintas condiciones de con-torno. Los dos puntos mas interesantes en este captulo son:

    1. La resolucion numerica de la condicion de contorno H(t)=0 para el regu-lador con funcion de coste tiempo-energa, donde se ve la dependenciaacusada y peculiar entre el tiempo en que puede alcanzarse el punto deconsigna y la frecuencia de la perturbacion que afecta al contenedor.

    2. La discusion de como un campo de aceleracion que afecte tanto alcontenedor como al actuador no modifica formalmente el problema.

    Captulo sexto. Este captulo se centra en los DMEM. Se hace una in-troduccion detallada a estos dispositivos y se comparan con los dispositivosconvencionales antes de entrar en el trabajo analtico, que comienza por laformulacion de las ecuaciones del movimiento. El plan que nos proponemosa partir de aqu abarca este captulo y el siguiente. Este tratara sobre aspec-tos de la dinamica, especialmente de los puntos de equilibrio, que requierenuna larga discusion que dara paso despues al analisis del control por reali-mentacion de estado. Siguiendo los resultados obtenidos en sistemas termicos,modelados a traves de balances de materia y energa [77], as como en dis-positivos electromecanicos [78], se estudia las condiciones bajo las cuales esde esperar comportamiento caotico del sistema de masas acopladas, a travesdel metodo de Melnikov, unico que permite encontrar condiciones necesarias

  • 1.3. NATURALEZA Y CONTENIDOS DE ESTA TESIS 19

    para la aparicion de caos. Se completa la exposicion con un analisis, en laseccion 6.9, de los valores numericos propios de los DMEM.

    Puesto que este captulo trata esencialmente de la dinamica de los DMEM,se ha completado con un estudio de la dinamica impulsiva. El metodo de lafuncion de transferencia permite encontrar la respuesta de sistemas de unaentrada y una salida ante entradas impulsivas, pero no puede extendersede forma natural para sistemas de muchas entradas y muchas salidas. Ladinamica analtica nos provee de las herramientas precisas para estudiar larespuesta impulsiva del sistema. Son frecuentes discusiones sobre dinamicaimpulsiva que se basan en estimaciones de las deformaciones y a partir deah de las aceleraciones y los impulsos. Lo cierto es que la mecanica analticatrata el problema de forma mucho mas general y elegante, eliminando lanecesidad de hacer estimaciones. Estas ventajas se discuten en la seccion 6.10,donde asimismo se presentan las ecuaciones basicas de la dinamica impulsiva,aplicandolas finalmente a nuestro sistema y obteniendo como resultado unsistema lineal de seis ecuaciones que relaciona las coordenadas y velocidadesgeneralizadas antes y despues del impulso, cuando el movimiento es bidi-mensional. Siendo como es esta seccion una simple aplicacion, tiene un dobleinteres. Primero, porque es extremadamente infrecuente en la bibliografa en-contrar resueltos problemas de dinamica impulsiva; segundo, porque de estaforma completamos nuestra vision sobre el sistema de masas acopladas.

    Captulo septimo. Este captulo puede considerarse la extension del an-terior, centrado en aspectos dinamicos, para tratar del control. Aqu se pro-pone un esquema de control basado precisamente en que el sistema puedealcanzar un regimen caotico. La idea es sencilla: puesto que en el sistemapuede instaurarse un regimen caotico, y puesto que una orbita caotica cubredensamente el espacio de fases, una estrategia posible consiste en simplementeesperar a que el sistema quede lo suficientemente cerca del punto de consignay entonces aplicar un control que saque al sistema del regimen caotico y loconduzca al estado final deseado con poco esfuerzo.

    Conseguimos este proposito actuando completamente el sistema, pero noqueremos excluir el control subactuado, pues este refleja bien la flexibilidadpresente en sistemas reales, y por eso se termina este captulo estudiandoel control subactuado con realimentacion integral. En nuestro deseo de es-tablecer la plataforma analtica para los DMEM, hemos tratado con masas,distancias y velocidades correspondientes a sistemas microscopicos.

  • 20 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

    Captulo octavo. Termina este trabajo con una extension del modeloque se viene considerando a dos dimensiones. Esencialmente solo se encon-trara aqu un punto de interes, y es la formulacion explcita del modelo quese hace en la primera seccion. La segunda seccion usa este para calcularel servocontrol. Es evidente que podran reproducirse todos los calculos decaptulos anteriores con el nuevo modelo. Queda pues este captulo como in-dicando una posible va de expansion para el futuro, si decidiesemos tomarcomo objeto de estudio alguna de las implementaciones de sistemas MEMque las empresas punteros en este campo barajan en este momento.

    Apendices. Finalmente, y tras el captulo de conclusiones, nos ha parecidooportuna la inclusion de unos pocos apendices. El primero pone a los DMEMen su contexto respecto a los medios de almacenamiento a los que pretendesustituir o al menos servir de alternativa, y para ello desarrolla a modo depequeno ensayo su historia durante el ultimo siglo, completandolo con unasbreves resenas sobre otras tecnologas emergentes, como el almacenamientoholografico o de resolucion atomica.

    Dos apendices adicionales tratan sobre las ecuaciones basicas del con-trol optimo y la mecanica analtica. Hemos buscado en ellos concision ygeneralidad, como cuadra a las pocas paginas de un apendice. El ultimoapendice esta dedicado a deducir las ecuaciones mas generales de un sistemade dos masas acopladas que puede moverse en tres dimensiones. De hecho,demostramos como las ecuaciones que hemos usado son casos particulares deestas mas generales.

    1.4. Aportaciones novedosas

    Sin perjuicio de los puntos que se han presentado en la seccion anteriorcomo relevantes para cada captulo, ni de la exposicion mas detallada que seencuentra en la presente memoria de dichos captulos, quisieramos destacarunas pocas aportaciones relevantes y novedosas de esta tesis, que puedencalificarse as tras la correspondiente revision bibliografica y con la relativareserva sobre los lmites hasta donde nos es dado conocer sobre un tema quese encuentra disperso en una variedad de campos.

    1. Demostracion de la imposibilidad de que un control bang-bang conduz-ca al sistema que consideramos hasta el punto de consigna.

  • 1.4. APORTACIONES NOVEDOSAS 21

    2. Desarrollo de algoritmos iterativos para encontrar la evolucion temporaly el control necesario para distintas condiciones de contorno cuandoexiste acoplamiento no lineal entre las masas.

    3. Desarrollo de un algoritmo robusto derivado del metodo del gradientepara encontrar el control optimo para un sistema no lineal. Este algo-ritmo puede de hecho recuperarse de ciclos divergentes, conduciendo alresultado deseado.

    4. Analisis e implementacion de un algoritmo de control que aprovecha laaparicion de caos en el sistema, y que constituye una ampliacion respec-to a los resultados obtenidos en los trabajos [77] y [78] anteriormenteresenados.

  • 22 CAPITULO 1. OBJETIVOS Y ALCANCE DE ESTA TESIS

  • Captulo 2

    Modelo fsico para el actuador

    2.1. El modelo fsico

    En [6] puede encontrarse una descripcion del diseno propuesto por laCarnegie Mellon University, y un analisis del modelo propuesto por la Uni-vesity of California Santa Cruz. Este ultimo es un modelo sencillo monodi-mensional que incluye la fuerza de control, la fuerza elastica restauradoray el rozamiento. No obstante, este es un modelo para una sola masa. Eneste trabajo, nosotros hemos considerado el problema mas general del con-trol a traves de un actuador flexible, que hemos modelado mediante dosmasas unidas por un resorte amortiguado. Realizaremos un estudio particu-lar tanto del regulador como del servomecanismo que use un actuador flexiblemonodimensional constituido por dos y por tres masas acopladas, tanto conacoplamiento lineal como con acoplamiento no lineal. Tambien presentaremosun modelo bidimensional servoactuado.

    Los modelos que se propondran aqu son modelos dinamicos obtenidos apartir de consideraciones fsicas sobre idealizaciones de DMEM. Sin embargo,es preciso indicar que otros investigadores, vease [18] han seguido un caminoinverso: modelando mediante elementos finitos uno de estos dispositivos yefectuando simulaciones de las cuales extraer los parametros que permitanajustar los datos a modelos dinamicos mucho mas sencillos, como los quepropongo aqu.

    Por otra parte, los modelos que aqu se propondran tratan del aspectopuramente mecanico del problema. Existe en marcha sin embargo una lneade investigacion sobre el modelado del acoplamiento entre las partes mecanicay electronica de DMEM, como se discute por ejemplo en [19].

    23

  • 24 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    2.2. El porque del control optimo

    Como se ha indicado arriba, los DMEM de almacenamiento estan en losinicios de su andadura, por lo que existen multitud de parametros abiertos.Es de suponer que desde la meseta actual, y conducido por consideracionesde todo tipo, incluidas las economicas, el diseno se ramifique tratando deproducir dispositivos adaptados a usos particulares.

    Autonoma, precision, coste, respuesta dinamica y resistencia a las per-turbaciones externas son algunos factores que incidiran directamente en eldiseno. El control optimo es la herramienta que permite formalizar estosobjetivos de diseno mediante la eleccion de la adecuada funcion de costey condiciones de contorno, vease [3]. Otra ventaja consiste en la adopcionde una notacion matricial compacta, apta tanto para sistemas monodimen-sionales como el descrito en [7] como para sistemas bidimensionales comola arquitectura propuesta por CMU y, en general, para sistemas tanto SISOcomo MIMO 1. Desde el punto de vista practico, esta formulacion matricialde los problemas de control optimo se beneficia de la existencia de softwarede calculo numerico y de control de contrastada eficacia, como Octave 2.

    En definitiva, el presente trabajo no se ocupa de la resolucion de un unicoproblema de control, formulado mediante la tecnica del control optimo, sinoque utiliza esta para plantear y resolver un conjunto de problemas, cada unode los cuales incide en unas especiales caractersticas de diseno.

    As, en referencia al modelo simple de actuador formado por dos masasunidas por un elemento elastico y un disipador, si se considera preponderanteel coste se ha de estudiar el control bang-bang, mas facil de implementar. Sise considera primordial el consumo energetico del dispositivo, lo que mejo-rara la autonoma del sistema completo, sera preciso considerar el control confuncion de coste energa, lo que efectivamente se hace tanto con dinamica li-neal como con dinamica no lineal. Si se busca un balance entre la autonomay la rapidez de respuesta, una funcion de coste que pondere el tiempo y laenerga consumida ha de ser estudiada. Cuando se desea una ponderacionentre respuesta adecuada y consumo energetico suele considerarse una fun-cion de coste LQR, que aqu se considera tanto con dinamica lineal como condinamica no lineal.

    1En el apendice B se presentan los resultados fundamentales del control optimo, tal ycomo, con algo mas de extension se encuentran en [3] y [49], entre otros

    2Version libre del conocido programa Matlab

  • 2.2. EL PORQUE DEL CONTROL OPTIMO 25

    En cuanto al servomecanismo para el mismo sistema al que nos estamos re-firiendo, consideramos una funcion de coste energa-tiempo con ponderaciondel estado final y un servo con funcion de coste LQR.

    Ademas, es preciso considerar distintas combinaciones de condiciones decontorno, segun el grado de laxitud permitido para el estado final y el tiempoen que se alcanza.

    En cuanto al actuador conectado a un sistema fsico que lo contiene, lomodelamos como un conjunto de tres masas. La primera, a la que en el textonos referiremos como md, representa el dispositivo contenedor, y se encuentraunida por un elemento elastico y un elemento disipativo a la masam1, sobre laque se efectua el esfuerzo de control, y a su vez esta ultima se haya unida porotro elemento elastico y un segundo disipador a una masa m2, cuya posicion yvelocidad son las que se quieren controlar. En las secciones correspondientesconsideramos el diseno del regulador con funcion de coste energa-tiempo,adecuado cuando es preponderante la relacion autonoma/prestaciones, elregulador con funcion de coste energa-tiempo, bajo las mismas considera-ciones pero con un termino de Mayer que incremente la precision del estadofinal, y finalmente la funcion de coste LQR, con la que suele alcanzarse unbuen compromiso.

    Respecto al modelo bidimensional, tratamos directamente el problema masgeneral del servomecanismo con funcion de coste LQR.

    En definitiva, en este trabajo se consideran una veintena de problemas, sen-tando las bases de diseno para una variedad de requerimientos: autonoma,velocidad de respuesta, precision, coste. Evidentemente, una exploracion ex-haustiva con media docena de funciones de coste distintas, cuatro conjuntosde condiciones de contorno y al menos tres modelos lineales y dos no lineales,mas las perturbaciones que pueden sufrir todos ellos, esta fuera de lugar. Enefecto, el diseno primero puede ramificarse, pero por imperativo economicono se consolidaran mas que unas pocas opciones. Por tanto, hay que tomaresta investigacion como una aproximacion razonable al modelado y control delos DMEM, a la espera de nuevos elementos de juicio que permitan dirigir conprecision el esfuerzo de modelado y diseno de estos sistemas. Pero ademas,como queda dicho arriba, los modelos que aqu presentamos son adecuadospara muchos sistemas, no necesariamente dispositivos MEMS, por lo que noparece necesario cenirse a estos ultimos.

  • 26 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    Una ultima consideracion es pertinente, y es que este trabajo se centra enuna de las fases del proceso completo del diseno de un sistema de control, asabiendas de que consideraciones ajenas a esta fase tienen en ella influencia.Por ejemplo, la ingeniera de produccion puede introducir restricciones so-bre los actuadores y la electronica de control. El sistema de proteccion antegolpes y vibraciones de los dispositivos que contengan DMEM puede tambiencondicionar fuertemente esta fase de diseno.

    En la Tabla 9.1 presentamos un resumen de la familia de problemas quevamos a tratar a lo largo de esta tesis. A ella nos remitimos para presentar elplan que nos disponemos a desarrollar; plan que si no exhaustivo si conside-ramos como una plataforma solida desde donde, segun las circunstancias, lossistemas a considerar y las consideraciones de diseno y operacion pertinentes,orientar futuros esfuerzos.

    2.3. Modelo y ecuaciones basicas

    Consideraremos un modelo monodimensional, donde el actuador se muevea lo largo del eje y. Introducimos la flexibilidad dividiendo el actuador en dosmasas m1 y m2 separadas mediante un muelle de constante elastica k y unamortiguador de constante . En el equilibrio, las dos masas se encuentran auna distancia L. Despreciaremos el rozamiento que se produce al desplazarseambas masas y consideraremos solo el efecto del amortiguador, que introduceuna fuerza proporcional a la diferencia de velocidades entre m1 y m2. Elactuador se opera aplicando a m1 una fuerza u dirigida a lo largo del eje y.La masa m2 se mueve por la accion indirecta del muelle y el amortiguador,y por tanto nuestro sistema es subactuado. Si y1 e y2 son las coordenadas dem1 y m2, la energa cinetica, la energa potencial y la funcion de Rayleighvienen dadas por

    T =1

    2m1y

    21 +

    1

    2m2y

    22 (2.1)

    U =1

    2k(y2 y1 L)2 (2.2)

    F = 12(y2 y1)2 (2.3)

  • 2.3. MODELO Y ECUACIONES BASICAS 27

    u1

    m2

    km

    O Yy

    y21

    Figura 2.1 Sistema de dos masas acopladas.

    Como coordenadas generalizadas, tomaremos

    q1 = y1

    q2 = y2 y1 L (2.4)

    Sustituyendo:

    T =1

    2m1q

    21 +

    1

    2m2(q1 + q2)

    2 (2.5)

    U =1

    2kq22 (2.6)

    F = 12q22 (2.7)

    Las ecuaciones del movimiento se siguen de (C.39), considerando que,ademas de fuerzas que derivan de un potencial, existen otras que no:

  • 28 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    d

    dt

    (L

    q

    ) Lq

    +Fq

    = Q (2.8)

    donde Q es la fuerza generalizada correspondiente a la coordenada gene-ralizada q. Obtenemos:

    (m1 +m2)q1 +m2q2 = u

    m2(q2 + q1) + kq2 + q2 = 0 (2.9)

    Introduzcamos las variables de estado siguientes:

    x1 = q1

    x2 = q1

    x3 = q2

    x4 = q2 (2.10)

    con lo que (2.9) puede sustituirse por

    x =

    0 1 0 00 0 k/m1 /m10 0 0 10 0 Mk/m1m2 M/m1m2

    x+

    01/m1

    01/m1

    u = Ax+ bu(2.11)

    donde M = m1 +m2. Introduciendo las cantidades p = k/m1, q = /m1 yr = M/m2, la matriz A puede ponerse como

    A =

    0 1 0 00 0 p q0 0 0 10 0 rp rq

    (2.12)

    A partir de aqu, es posible calcular la matriz de transicion de estados. Enprimer lugar, veamos que

  • 2.3. MODELO Y ECUACIONES BASICAS 29

    (sIA)1 =

    1/s 1/s2 p/s (p+ qs)/s20 1/s p/ (p+ qs)/s0 0 (qr + s)/ 1/0 0 pr/ s/

    (2.13)

    donde

    = s2 + qrs+ pr (2.14)

    Llamemos = qr y k = pr, y escribamos:

    = s2 + s+ k = (s+ /2)2 + (k 2/4) (2.15)

    Nos limitaremos al caso subamortiguado. Es decir, al caso en que

    k /4 > 0 (2.16)

    o lo que es igual

    k >1

    4

    M2

    m1m2(2.17)

    Buscamos la matriz de transicion de estados, que es la transformada inversade Laplace de (sIA)1. En el calculo de esta transformada inversa aparecenterminos de las formas:

    C1(s) =1

    s2(2.18)

    C2(s) =1

    s(2.19)

    C3(s) =1

    (2.20)

    C4(s) =s

    (2.21)

  • 30 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    Si llamamos = /2 y 2 = k 2/4, las correspondientes transformadasinversas para las funciones Ci(s) vienen dadas por

    C1(t) =1

    k

    (t

    k

    )+

    k2C4(t) +

    1

    k

    ( 2

    k 1

    )C3(t) (2.22)

    C2(t) =1

    k

    (1 et cos(t)

    et sen(t)

    )(2.23)

    C3(t) =1

    (et sen(t)

    )(2.24)

    C4(t) = et

    (cos(t)

    sen(t)

    )(2.25)

    Y ahora pueden escribirse explcitamente las componentes de la matriz detransicion de estados:

    eAt11 = 1

    eAt12 = t

    eAt13 = pC2(t)

    eAt14 = pC1(t) + qC2(t)

    eAt21 = 0

    eAt22 = 1

    eAt23 = pC3(t)

    eAt24 = pC2(t) + qC3(t)

    eAt31 = 0

    eAt32 = 0

    eAt33 = qrC3(t) + C4(t)

    eAt34 = C3(t)

    eAt41 = 0

    eAt42 = 0

    eAt43 = prC3(t)eAt44 = C4(t) (2.26)

    De la misma forma, sera preciso tener en cuenta la matriz

  • 2.3. MODELO Y ECUACIONES BASICAS 31

    AT =

    0 0 0 01 0 0 00 p 0 rp0 q 1 rq

    (2.27)

    La matriz (sI (AT ))1 contiene terminos de la forma

    D1(s) =1

    s2(2.28)

    D2(s) =1

    s(2.29)

    D3(s) =1

    (2.30)

    D4(s) =s

    (2.31)

    donde ahora

    = s2 qrs+ pr = (s /2)2 + (k 2/4) (2.32)

    En funcion de la constantes

    a = 2/(2 + 2)2

    b = 1/(2 + 2)

    c = ad = 42/(2 + 2)2 1/(2 + 2) (2.33)

    las correspondientes transformadas inversas Di(t) son:

    D1(t) = a+ bt + c(et cos(t) +

    et sen(t)

    )+d

    et sen(t) (2.34)

    D2(t) =1

    2 + 2

    (1 et(cos(t) +

    sen(t) +

    2

    et sen(t)

    )(2.35)

    D3(t) =1

    et sen(t) (2.36)

  • 32 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    D4(t) = et cos(t) +

    et sen(t) (2.37)

    Ahora podemos escribir explcitamente los elementos de la matriz de tran-sicion para AT :

    eAT t

    11 = 1

    eAT t

    12 = 0

    eAT t

    13 = 0

    eAT t

    14 = 0

    eAT t

    21 = teA

    T t22 = 1

    eAT t

    23 = 0

    eAT t

    24 = 0

    eAT t

    31 = pD2(t)

    eAT t

    32 = pD3(t)eA

    T t33 = D4(t) qrD3(t)eA

    T t34 = prD3(t)

    eAT t

    41 = pD1(t) + qD2(t)eA

    T t42 = pD2(t) qD3(t)eA

    T t43 = D3(t)eA

    T t44 = D4(t) (2.38)

    2.4. Regulador de energa mnima

    Consideraremos el control optimo de energa mnima y tiempo fijo. Elobjetivo es conducir al sistema desde un vector de estado inicial al origen enun tiempo fijo y con un gasto mnimo de energa. La funcion Hamiltonianapara este problema, tal y como se define en (B.5) es

    H = u2 + pT (Ax+ bu) (2.39)

    y las ecuaciones del control, como es sabido y se recoge en (B.9) y (B.8)son:

  • 2.5. SIMULACIONES Y DISCUSION 33

    H

    u= 0 = 2u+ bT p (2.40)

    p = Hx

    = AT p (2.41)

    De (2.40)

    u = 12bT p (2.42)

    y de (2.41)

    p(t) = eAT tp(0) (2.43)

    Pero de la dinamica del sistema

    x(t) = eAtx(0) 12

    [ t0eA(t) bbT eA

    T d]p(0) (2.44)

    Llamando E(t) a la matriz entre corchetes, y particularizando (2.44) parat1:

    p(0) = 2E1(t1)[x(t1) eAt1 x(0)

    ](2.45)

    de donde

    u(t) = bT eAT tE1(t1)

    [x(t1) eAt1 x(0)

    ](2.46)

    2.5. Simulaciones y discusion

    Consideremos el control necesario para conducir al sistema desde el estado

    x(0) =

    1000

    (2.47)

  • 34 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    hasta

    x(1) =

    0000

    (2.48)

    donde las constantes fsicas del problema se han elegido como m1 = m2 =1 Kg, k = 100 N/m, = 2 Ns/m y L = 1 m. Efectuando una integracionnumerica que proporcione los elementos de la matriz E(t1) y su inversa obte-nemos:

    E1(t1) =

    54,8660 28,5276 86,0751 14,393026,3008 9,5155 25,0317 4,640223,0136 11,6523 27,3983 21,408912,0240 4,0136 5,4011 1,9289

    (2.49)

    y a partir de aqu

    u(t) = 26,3008 54,8660t+ 54,8660(pD1(t) qD2(t))+26,3008(qD3(t) pD2(t))+23,0136D3(t) 12,0240D4(t) (2.50)

    En las Figuras 2.2-2.5 no se representan los valores para las variables deestado, sino para las coordenadas y1 e y2 y sus correspondientes velocidades.Las dos primeras representan la posicion y velocidad de m1, y las dos si-guientes la posicion y velocidad de m2. La Figura 2.6 representa el control u(t)y finalmente mostramos la integral para el cuadrado de la energa en funcionde la constante elastica, en la Figura 2.7. Interesa comparar las Figuras 2.2y 2.4, que representan los desplazamientos de m1 y m2. Vemos como m2tiene una primera fase de aceleracion y una ultima fase de deceleracion,mientras que durante la mayor parte del tiempo se mueve con velocidad casiconstante. Las oscilaciones inevitables son absorbidas mayormente por m1.La Figura 2.6, que representa el esfuerzo de control, demuestra como estees positivo durante la primera mitad del recorrido, y negativo en la segundaparte. Basicamente pues el control acelera al sistema durante la primeramitad del intervalo de simulacion, y lo frena durante la segunda parte. Estees el mismo comportamiento cualitativo que el que se obtiene si se resuelveel problema de la regulacion de energa mnima de una sola masa, que es

  • 2.6. CONTROL BANG-BANG 35

    una funcion lineal que se anula justo en el punto medio del intervalo. Perosobre este mismo comportamiento cualitativo, encontramos logicamente lascorrecciones necesarias para conseguir que la velocidad de m2 se anule a ladistancia de consigna, como puede verse en la Figura 2.5. Tambien merececomentario la Figura 2.7, donde se representa el esfuerzo de control necesarioen funcion de la constante elastica k. Como puede verse, la dependencia delcontrol con este parametro es muy acusada, y crece bruscamente cuandok se hace pequena. La razon es obvia: cuando k es muy pequena la unicaforma de ejercer control sobre m2 es a traves del termino de Rayleigh, quedepende de las velocidades relativas; entonces, es preciso un esfuerzo extrade aceleracion sobre m1 para alcanzar el punto de consigna, en donde deberespetarse la distancia L de equilibrio entre m1 y m2.

    2.6. Control Bang-Bang

    A la vista del grafico u(t), Figura 2.6, y a tenor de la discusion del mismoen la seccion 2.5, podra pensarse en la implementacion de un control bang-bang. Puesto que el control es positivo durante la primera mitad del tiempo ynegativo durante la segunda, parece razonable buscar la regulacion mediantela aplicacion de un control constante y positivo u1 durante la primera mitaddel tiempo y de un control u1 durante la segunda mitad. Sin embargo, de-mostraremos la imposibilidad de realizar un regulador optimo que conduzcaal sistema al estado final x(t1) = 0. Para ello, demostraremos que no es posi-ble conducir al sistema, bajo ningun criterio de optimalidad, hasta el estadofinal deseado. Sea un instante 0

  • 36 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    0 200 400 600 800 10001

    0.9

    0.8

    0.7

    0.6

    0.5

    0.4

    0.3

    0.2

    0.1

    0

    Tiempo (milisegundos)

    Des

    plaz

    amie

    nto

    (metr

    os)

    Figura 2.2 Posicion de m1 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100; = 2.

    0 200 400 600 800 10000

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2

    Tiempo (milisegundos)

    Velo

    cida

    d (m

    etros

    /segu

    ndo)

    Figura 2.3 Velocidad de m1 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100; = 2.

  • 2.6. CONTROL BANG-BANG 37

    0 200 400 600 800 10000

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    Tiempo (milisegundos)

    Des

    plaz

    amie

    nto

    (metr

    os)

    Figura 2.4 Posicion de m2 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100; = 2.

    0 200 400 600 800 10000.2

    0

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    Tiempo (milisegundos)

    Velo

    cida

    d (m

    etros

    /segu

    ndo)

    Figura 2.5 Velocidad de m2 en funcion del tiempo.m1 = m2 = 1 Kg; k = 100; = 2.

  • 38 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    0 200 400 600 800 100015

    10

    5

    0

    5

    10

    15

    Tiempo (milisegundos)

    Fuer

    za (N

    ewton

    s)

    Figura 2.6 Esfuerzo de control en funcion del tiempo.m1 = m2 = 1 Kg; k = 100; = 2.

    0 50 100 150 2000

    0.5

    1

    1.5

    2

    2.5

    3 x 104

    Constante k (Newtons/metro)

    Inte

    gral

    en

    [0,1]

    del c

    ontro

    l (New

    tons*s

    egun

    do)

    Figura 2.7 10 u

    2(t)dt para un rango de k.m1 = m2 = 1 Kg; = 2.

  • 2.6. CONTROL BANG-BANG 39

    y sustituyendo (2.51) en (2.52) tenemos:

    x(t1) = eAt1 x(0) + u1

    [eA(t1)E() E(t1 )

    ](2.54)

    que podemos escribir abreviadamente como

    x(t1) = + u1() (2.55)

    Ahora, la pregunta es si existe una pareja (u1, ) que hace ||x(t1)|| = 0.Para que se cumpla esta condicion, es preciso que

    2 + 2u1(.()) + u21

    2() = 0 (2.56)

    Se comprueba inmediatamente que el discriminante de esta ecuacion desegundo grado es mayor o igual que cero solo si

    (.())2 >= 22() (2.57)

    Ahora bien, para cualquier valor de ,

    (.())2

  • 40 CAPITULO 2. MODELO FISICO PARA EL ACTUADOR

    La grafica (2.7) muestra la norma de x(t1) en funcion de para u = 2,0N .Puede comprobarse como se alcanza un estado muy proximo al deseado, ycomo el tiempo de conmutacion se encuentra, para t1 = 2,0s, ligeramentedespues de t = 1,0s. Hay que senalar tambien que el calculo se ha realizadoperturbando ligeramente la matriz A, que es singular, sustituyendola por

    A = A +

    0 0 0 00 0 0 00 0 0 0 0 0 0

    (2.62)

    donde es una cantidad pequena. A no es singular, y existe un lmite parax(t1) cuando 0.

    0 50 100 150 2000

    0.5

    1

    1.5

    2

    2.5

    3

    3.5

    4

    Tiempo (segundos*0.01)

    Nor

    ma

    del e

    stad

    o fin

    al

    Figura 2.8 ||x(t1, )|| en funcion de , el instante en que conmuta elcontrol.

  • Captulo 3

    Regulacion y servocontrol

    3.1. Tiempo y estado final fijos

    En este apartado y sucesivos se estudia el modelo monodimensional repre-sentado en la Figura 2.1 cuando se desea controlarlo optimizando diversasfunciones de coste y usando distintas condiciones de contorno.

    Consideremos la Hamiltoniana

    H = xTQx+ u2 + pT (Ax+ bu) (3.1)

    donde la constante pondera el esfuerzo de control y la matriz Q laseparacion entre el estado y el origen.

    Sabemos, como se muestra en (B.9) y (B.8), que

    H

    u= 0 = 2u+ bT p (3.2)

    y que

    p = Hx

    = 2QxAT p (3.3)

    que junto con la dinamica del sistema puede formar un estado ampliadode dinamica lineal: [

    xp

    ]=

    [A 1

    2bbT

    2Q AT] [

    xp

    ](3.4)

    41

  • 42 CAPITULO 3. REGULACION Y SERVOCONTROL

    que en forma abreviada escribimos como

    = F (3.5)

    de solucion conocida

    (t) = eFt(0) (3.6)

    Puesto que x y p tienen la misma dimension, dividimos la matriz de tran-sicion en cuatro submatrices cuadradas iguales, y en notacion obvia:

    x(t) = eFt11x(0) + eFt

    12p(0)

    p(t) = eFt21x(0) + eFt

    22p(0) (3.7)

    Particularizando para t = t1, y conocido el estado final, que es el vectornulo, se encuentra de la primera de (3.7) que

    p(0) = (eFt1 12

    )1eFt1 11x(0) (3.8)

    y sustituyendo (3.8) en la segunda de (3.7)

    p(t) =[eFt21 eFt22

    (eFt1 12

    )1eFt111

    ]x(0) (3.9)

    y finalmente, de (3.2) y (3.9):

    u = 12bT[eFt21 eFt22

    (eFt112

    )1eFt111

    ]x(0) (3.10)

    Notese que hemos obtenido un control en lazo abierto, pero que nada impi-de en la primera de (3.7) tomar p(0) en funcion de x(t) y obtener as p(x(t))y por tanto el control en lazo cerrado.

    Hemos representado el control para tres valores distintos de , en las Fi-guras (3.1)-(3.3) y como puede apreciarse es bastante insensible respecto aeste parametro. As, la primera grafica esta calculada con = 10, es decir,penalizando relativamente mucho la energa consumida. La segunda graficase calcula con = 1, y finalmente la tercera con = 0,01.

  • 3.1. TIEMPO Y ESTADO FINAL FIJOS 43

    0 200 400 600 800 100030

    20

    10

    0

    10

    20

    30

    Tiempo (milisegundos)

    Fuer

    za (N

    ewton

    s)

    Figura 3.1 Esfuerzo de control cuando = 10. Parametros:m1 = m2 = 1 Kg; k = 25 N/m; = 2 Ns/m; Q=I

    0 200 400 600 800 100030

    20

    10

    0

    10

    20

    30

    Tiempo (milisegundos)

    Fuer

    za (N

    ewton

    s)

    Figura 3.2 Esfuerzo de control cuando = 1. Parametros:m1 = m2 = 1 Kg; k = 25 N/m; = 2 Ns/m; Q=I

  • 44 CAPITULO 3. REGULACION Y SERVOCONTROL

    0 200 400 600 800 100050

    40

    30

    20

    10

    0

    10

    20

    30

    40

    50

    Tiempo (milisegundos)

    Fuer

    za (N

    ewton

    s)

    Figura 3.3 Esfuerzo de control cuando = 0,01. Parametros:m1 = m2 = 1 Kg; k = 25 N/m; = 2 Ns/m; Q=I

    Es interesante estudiar el efecto de valores decrecientes de en el control.Cualitativamente, valores menores de este parametro en la funcion de costeautorizan esfuerzos de control mas elevados. Pero a medida que el esfuerzo decontrol se hace en terminos absolutos mas grande, ocurre que se incremen-ta el intervalo donde el control es practicamente nulo. Este efecto se ponede manifiesto de forma mas clara cuando el sistema es rgido. Por ejemplo,las graficas (3.4)-(3.5) corresponde a m1 = m2 = 0,4 Kg, k = 2500N/m y = 0,0040 para la primera y = 0,0036 para la segunda. La explicacionfsica es sencilla: el sistema ha de ser empujado durante la primera fase yfrenado durante la segunda, y si el control es suficientemente intenso en laprimera parte del recorrido el sistema puede desplazarse por mera inerciadurante parte del mismo, antes de ser frenado. Ahora bien, observamos unaamplitud creciente en las oscilaciones del ultimo tramo del recorrido a me-dida que decrece. Aparentemente, la accion de control excita al sistema, ycuando la frecuencia de esta excitacion es suficientemente alta se aproximaa la frecuencia natural de oscilacion de las masas acopladas. La resonanciaconduce a desplazamientos mayores de los deseados, que han de compensarsecon esfuerzos de control mayores, y as sucesivamente.

  • 3.1. TIEMPO Y ESTADO FINAL FIJOS 45

    0 200 400 600 800 100020

    15

    10

    5

    0

    5

    10

    15

    20

    25

    Tiempo (milisegundos)

    Fuer

    za (N

    ewton

    s)

    Figura 3.4 Esfuerzo de control cuando = 0,0040. Parametros:m1 = m2 = 0,4 Kg; k = 2500 N/m; = 2 Ns/m; Q=I

    0 200 400 600 800 100080

    60

    40

    20

    0

    20

    40

    60

    80

    100

    120

    Tiempo (milisegundos)

    Fuer

    za (N

    ewton

    s)

    Figura 3.5 Esfuerzo de control cuando = 0,0036. Parametros:m1 = m2 = 0,4 Kg; k = 2500 N/m; = 2 Ns/m; Q=I

  • 46 CAPITULO 3. REGULACION Y SERVOCONTROL

    3.2. Tiempo libre y estado final fijo

    Junto con (3.2) y (3.3) ahora tenemos, tal y como se muestra en (B.11)

    H(t1) = 0 (3.11)

    Pero x(t1) = 0, de manera que (3.11) conduce a p(t1) = 0. Esto a su vez im-plica que el determinante de la matriz de coeficientes en (3.7) ha de ser nulo,lo que constituye una ecuacion en t1. Ahora bien, esta ecuacion esta numeri-camente extremadamente mal condicionada, puesto que el determinante sehace menor que 106 en pocas centesimas, del orden de 1062 al cabo desolo dos segundos y del orden de 1096 al cabo de diez segundos, y continuabajando monotonamente hasta el lmite en que el computador puede repre-sentar numeros distintos de cero, que se alcanza al cabo de unos 70 segundos.Interpretamos que el objetivo del control de acuerdo con la funcion de costeelegida no puede alcanzarse con estas condiciones de contorno en tiempo fini-to. La razon de este comportamiento es que independientemente del valor de, puede alcanzarse un estado en el cual el termino xTQx sea despreciablefrente al termino que pondera el gasto energetico. Entonces, puesto que eltiempo final queda libre, la optimizacion del coste se consigue reduciendoel esfuerzo de control. Expresado en terminos llanos: la mejor forma de noconsumir energa consiste en no producir movimiento, puesto que se disponede un tiempo ilimitado para alcanzar el punto de consigna.

    Como podemos interpretar fsicamente este resultado ?. Si la funcion decoste no penaliza directamente el tiempo que el sistema permanece alejadodel punto de consigna, puede suceder que la optimizacion de la funcion decoste se base en el ahorro energetico. As, el sistema comienza a moversehacia el punto de consigna, pero cuando la norma del vector de estado essuficientemente pequena, el termino cuadratico en el estado es menor que eltermino energetico, por lo que se reduce el esfuerzo de control y se llega aque el sistema evoluciona muy lentamente hacia el punto de consigna, lo queexplica que no se encuentre un t1 que haga nulo el determinante de la matrizde coeficientes de (3.7), sino valores monotonamente decrecientes con t, perosin llegar a hacerse cero.

    3.3. Tiempo fijo y estado final libre

    Las mismas ecuaciones basicas conducen a (3.7), con la condicion de con-torno (B.10)

  • 3.4. TIEMPO Y ESTADO FINAL LIBRES 47

    p(t1) = 0 = eFt1

    21x(0) + eFt1

    22p(0) (3.12)

    de donde obtenemos p(0) en funcion de x(0) y por tanto x(t) en funcion dex(0), que podemos particularizar para t1 y obtener el estado final. Por otraparte, conocido p(t) tenemos el control:

    u = 12bbT

    [eFt21 eFt22

    (eFt122

    )1eFt121

    ]x(0) (3.13)

    Ahora bien, notese como el control obtenido en este caso es intrnsecamenteen lazo abierto. Una vez fijado p(t1) = 0, la segunda de (3.7) determina ap(0) en funcion del estado inicial, y por tanto el estado en funcion solo delestado inicial.

    3.4. Tiempo y estado final libres

    Es facil comprobar como, con la funcion de coste que estamos considerando,

    J = t

    0

    (xTQx + u2

    )dt (3.14)

    en este caso recaemos en situaciones anteriores. En particular, vemos quecon condiciones de contorno

    p(t1) = 0

    H(t1) = 0 (3.15)

    obtenemos la condicion x(t1) = 0. Esto es as incluso ampliando la fun-cion de coste con un termino de Mayer (nomenclatura que se introduce enla primera seccion del Apendice B; el termino de Mayer pondera explcita-mente el estado final del sistema mediante una matriz M que tiene el mismosignificado que la matriz Q):

    = xT (t1)Mx(t1) (3.16)

    En este caso,

    p(t1) = 2Mx(t1) (3.17)

  • 48 CAPITULO 3. REGULACION Y SERVOCONTROL

    que sustituida en la segunda de (3.15) conduce a

    xT (t1)[Q +

    1

    MT bbTM + 2MTA 2

    MT bbTM

    ]x(t1) = 0 (3.18)

    y recaemos en x(t1) = 0, ya que, en general, la matriz entre corchetes esdistinta de cero.

    3.4.1. Coste tiempo-energa con termino de Mayer

    La discusion anterior, y en particular los razonamientos que cierran laseccion 3.2, motiva el ensayo de una funcion de coste de la forma

    J = t1

    0(1 + u2)dt+ xT (t1)Mx(t1) (3.19)

    con tiempo y estado final libres. Aqu el termino de Mayer es esencial,puesto que de estar ausente, el problema de control carece de sentido: con-sumir la mnima cantidad de energa sin importar el estado ni el tiempo quese emplee. En estas circunstancias, la solucion optima consiste en no realizaresfuerzo de control alguno. De ah la necesidad de ponderar de alguna formael estado final. El mismo efecto correctivo se puede conseguir ponderando eltiempo total durante el que se realiza la accion de control, y por eso, en lafuncion de coste propuesta, se incluyen ambos. La Hamiltoniana es

    H = 1 + u2 + pT(Ax+ bu

    )(3.20)

    y las ecuaciones basicas del control (B.9) y (B.8) tienen las solucionesobvias:

    u = 12bT p (3.21)

    p(t) = eAT tp(0) (3.22)

    con condiciones de contorno

    p(t1) = 2Mx(t1)

    H(t1) = 1 + u2(t1) + p

    T (t1)[Ax(t1) + bu(t1)

    ]= 0 (3.23)

  • 3.4. TIEMPO Y ESTADO FINAL LIBRES 49

    Sustituyendo la primera de (3.23) en la segunda y teniendo asmismo encuenta (3.21), tras una pequena manipulacion encontramos:

    1 + xT (t1)[(

    1

    2

    )MT bbTM + 2MTA

    ]x(t1) = 0 (3.24)

    Pero al mismo tiempo,

    x(t1) = eAt1 x(0) 1

    2

    [ t10eA(t1)bbT eA

    T d]p(0) (3.25)

    Escribiendo p(0) en funcion de p(t1) de acuerdo con (3.22) y sustituyendoeste de acuerdo con la primera de (3.23) obtenemos una ecuacion en x(t1),de forma que

    x(t1) = F1(t1)eAt1 x(0) (3.26)

    donde

    F(t1) = I 1

    E(t1)(eA

    T t1)1

    M (3.27)

    y

    E(t) = t

    0eA(t1)bbT eA

    T d (3.28)

    Sustituyendo en H(t1) = 0 obtenemos una ecuacion escalar en t1

    1 + xT (0)Jx(0) = 0 (3.29)

    con

    J =(eAt1

    )T (F1(t1)

    )T [( 1 2

    )MT bbTM + 2MTA

    ]F1(t1)eAt1 (3.30)

    La Tabla (3.1) da idea de la forma en que t1 depende de . Hemos elegidoM = nI y damos algunos valores de t1 para distintos y dos valores den. Por su parte, la grafica (3.6) representa el primer miembro de (3.29) enfuncion de t.

  • 50 CAPITULO 3. REGULACION Y SERVOCONTROL

    Tabla 3.1: t1 para distintos y n

    = 0,6 0.8 1.0

    n = 20 2.649 4.146 4.990

    n = 100 3.536 4.986 5.950

    0 20 40 60 80 100 12080

    70

    60

    50

    40

    30

    20

    10

    0

    10

    Tiempo (segundos*0.05)

    H(t)

    Figura 3.6 H(t) en unidades de 0.05 segundos. Parametros:t = [0, 5];m1 = m2 = 1 Kg; = 0,8; = 2 Ns/m; k = 25 N/m; M=20I

    Una vez conocido t1 obtenemos x(t1) de (3.26) y de aqu de la primerade (3.23) p(t1) y por tanto p(0) y p(t). Finalmente, conocido este ultimoobtenemos el control u(t) de (3.21).

    Una mejor aproximacion al origen se obtiene obviamente cuando la normade M es mayor, puesto que comparativamente pequenas desviaciones delestado final respecto al punto de consigna tienen mayor influencia sobre lafuncion de coste. Por ejemplo, con M = 500I se obtiene, para = 0,8,t1 = 5,2 y un estado final

  • 3.5. SERVOMECANISMO CON COSTE TIEMPO-ENERGIA 51

    x(t1) =

    0,00060,00460,00030,0023

    (3.31)

    con una norma ||x(t1)|| = 0,005. Al efectuar la secuencia de calculo comple-ta ( x(t1) p(t1) p(t0) p(t) u(t) ), se encuentra el hecho significativode que u(t) es una funcion lineal del tiempo. Pero sabemos que un controllineal es el que puede esperarse del movimiento de una unica masa cuandoquiere llevarse al origen minimizando la energa, de donde interpretamos queen el caso que estamos estudiando la estrategia optima consiste en actuarsobre el sistema como si de un solido rgido se tratase, ya que, al quedar libreel estado final y actuar durante todo el proceso el termino de Rayleigh, quedisipa energa y por tanto atenua el movimiento relativo de las dos masas,prevalece el menor gasto de energa frente a la desviacion del estado finalrespecto al punto de consigna.

    3.5. Servomecanismo con coste tiempo-energa

    Consideremos el servomecanismo de tiempo-energa mnimo con una fun-cion de coste caracterizada por un termino de Mayer que mide la separaciondel estado final respecto a cierto estado de referencia. En este caso, la Hamil-toniana adopta la forma

    H = 1 + u2 + pT (Ax+ bu) (3.32)

    donde es un factor de ponderacion y la condicion de contorno sobre elmultiplicador de Lagrange se expresa como

    p(t1) = 2M(x(t1) r(t1)) (3.33)

    que es la particularizacion al caso que nos ocupa de la ecuacion (B.10).

    Supondremos que el estado final es libre, no as el instante final t1. En-tonces, las ecuaciones del control conducen a

    u(t) = 12bT p(t) (3.34)

  • 52 CAPITULO 3. REGULACION Y SERVOCONTROL

    y

    p(t) = eAT tp(0) (3.35)

    De (3.33) y (3.35):

    p(t1) = eAT t1 p(0) = 2M(x(t1) r(t1)) (3.36)

    Particularizando (3.35) para t = t1, sustituyendo en esta p(t1) dado por(3.36) tenemos una ecuacion que proporciona p(0); Por otro lado, sustituyen-do p(t) en u(t), y esta en la ecuacion dinamica del sistema y resolviendo elsistema lineal no homogeneo resultante, obtenemos, tras una pequena ma-nipulacion, una expresion para x(t) en funcion de x(t1).

    x(t) = eAtx(0)E(t)(eAT t1)1M(x(t1) r(t1)) (3.37)

    con

    E(t) = t

    0eA(t) bbT eA

    T d (3.38)

    No queda mas que particularizar la ecuacion anterior para t1 y resolverel estado final x(t1), lo que permite encontrar, sucesivamente, p(0), p(t) yfinalmente u(t).

    3.6. Servomecanismo LQR

    3.6.1. Tiempo fijo y estado final libre. Ecuacion de Ri-catti

    Una funcion de coste lineal cuadratica, con termino de Mayer, conduce auna Hamiltoniana de la forma

    H = (x r)TQ(x r) + u2 + pT (Ax+ bu) (3.39)

    con condiciones de contorno sobre el co-estado, de acuerdo con (B.10):

    p(t1) = 2M(x(t1) r(t1)) (3.40)

  • 3.6. SERVOMECANISMO LQR 53

    de donde se siguen las ecuaciones de control y co-estado. Como es sabido:

    u = 12bT p (3.41)

    y

    p = Hx

    = 2Qx + 2Qr AT p (3.42)

    Esta ultima, junto con la ecuacion dinamica, constituyen un sistema linealno homogeneo del que sin embargo se tiene un conocimiento solo parcial delas condiciones de contorno, pues si bien es conocido el estado inicial x(0) sedesconoce p(0). Para soslayar esta dificultad, se suele introducir una relacionlineal entre el estado y el co-estado, de la forma

    p = Px+ s (3.43)

    Tomando la derivada respecto al tiempo de esta ultima, sustituyendo laecuacion dinamica y el control ( proporcionado por la ecuacion (3.41) ) eigualando a (3.42), se obtiene el sistema de dos ecuaciones diferenciales or-dinarias, no lineales

    P + PA 12

    PbbTP + 2Q + ATP = 0 (3.44)

    y

    s+(AT 1

    2PbbT

    )s 2Qr = 0 (3.45)

    Ahora bien, de (3.40) se sigue

    P(t1) = 2M (3.46)

    s(t1) = 2Mr(t1) (3.47)

    que permiten integrar (3.44) desde t1 hasta 0, y despues (3.45). Una vezobtenida la secuencia de matrices P y vectores s las ecuacion de la dinamicase reduce a una ecuacion lineal no homogenea con condiciones de contornoen t = 0, de solucion conocida. Finalmente, obtenemos el control u(t).

  • 54 CAPITULO 3. REGULACION Y SERVOCONTROL

    0 50 100 150 200 250 300 350 4003.5

    3

    2.5

    2

    1.5

    1

    0.5

    0 x 103

    Tiempo (segundos*0.05)

    Erro

    r en

    el e

    xtre

    mo

    del s

    ervo

    (metr

    os)

    Figura 3.7 Error en el extremo del servo. Parametros: m1 = m2 = 1 Kg; = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

    intervalo de 2 segundos.

    Se ha elegido como senal de referencia del servo un desplazamiento rgi-do de las masas m1 y m2, a velocidad constante, hasta alcanzar el origen.Las graficas (3.7)-(3.10) muestran respectivamente el error en el extremo delactuador respecto a la senal del servo, el control aplicado y las normas deP y s. La integracion se ha realizado en un intervalo de 2 s., discretizadoen subintervalos de 0.005 s. y con los valores para los parametros fsicos quese usaron en la seccion 3. Como era de esperar en un sistema de dinamicarapida, la ecuacion diferencial de Ricatti no puede sustituirse por su contra-partida algebraica, como otras veces sucede. Esto puede verse por la acusadavariacion en la norma de la matriz P y del vector s. A su vez, este hechopuede tener implicaciones sobre la implementacion, ya que sera preciso elalmacenaje en el microcontrolador encargado de implementar el control detoda la secuencia de matrices y vectores.

    3.6.2. Tiempo libre y estado final fijo

    Al considerar el problema del servomecanismo con funcion de coste linealcuadratica, la Hamiltoniana toma la forma conocida:

    H = (x r)TQ(x r) + u2 + pT (Ax+ bu) (3.48)

  • 3.6. SERVOMECANISMO LQR 55

    0 50 100 150 200 250 300 350 4000.02

    0

    0.02

    0.04

    0.06

    0.08

    0.1

    0.12

    0.14

    Tiempo (segundos*0.005)

    Fuer

    za (N

    ewton

    s)

    Figura 3.8 Esfuerzo de control u(t). Parametros: m1 = m2 = 1 Kg; = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

    intervalo de 2 segundos.

    0 50 100 150 200 250 300 350 4000

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2 x 105

    Tiempo (segundos*0.005)

    Nor

    ma

    de P

    Figura 3.9 Norma de la matriz P. Parametros: m1 = m2 = 1 Kg; = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

    intervalo de 2 segundos.

  • 56 CAPITULO 3. REGULACION Y SERVOCONTROL

    50 100 150 200 250 300 350 4000

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    Tiempo (segundos*0.005)

    Nor

    ma

    de s

    Figura 3.10 Norma del vector s. Parametros: m1 = m2 = 1 Kg; = 10; k = 25 N/m; Q=M=I. La integracion se ha efectuado durante un

    intervalo de 2 segundos.

    Las dos ecuaciones del control, junto con la ecuacion dinamica, conducenal sistema

    u = 12bT p (3.49)

    p = AT p 2Qx+ 2Qr (3.50)

    x = Ax 12bbT p (3.51)

    donde r es la senal de referencia. Las dos ultimas pueden escribirse comouna sola en la forma

    = C + Ds (3.52)

    donde

    =

    [px

    ](3.53)

    C =

    [ AT 2Q 1

    2bbT p A

    ](3.54)

  • 3.6. SERVOMECANISMO LQR 57

    D =

    [2Q0

    ](3.55)

    y

    s =

    [r0

    ](3.56)

    La ecuacion (3.52) tiene la solucion

    (t) = eCt(0) + t

    0eC(t)Ds()d (3.57)

    Llamando e(t) al vector que resulta de la integral, usando subndices paraindicar las mitades superior e inferior del mismo y las submatrices de lamatriz de transicion de estados y descomponiendo (3.57) en dos ecuacionesvectoriales para el co-estado y el estado:

    p(t) = eCt11 p(0) + eCt12 x(0) + e1(t) (3.58)

    x(t) = eCt21 p(0) + eCt22 x(0) + e2(t) (3.59)

    De (3.59) obtenemos

    p(0) = (eCt21 )1 [x(t) eCt22 x(0) e2(t)] (3.60)

    y sustituyendo en (3.58)

    p(t) = eCt11[(eCt21 )

    1 [x(t) eCt22 x(0) e2(t)]] + eCt12 x(0) + e1(t) (3.61)Como condiciones de contorno, conocemos el estado final x(t1), aunque el

    mismo t1 sea desconocido. Pero aun disponemos de la condicion de contorno(B.11), H(t1) = 0 en nuestro caso, que adopta la forma

    (x r)Q(x r) 14pT bbT p+ pTAx|t1 = 0 (3.62)

  • 58 CAPITULO 3. REGULACION Y SERVOCONTROL

    El punto clave en el algoritmo de resolucion consiste entonces en encontrarel tiempo t1 que satisface la ecuacion anterior. La implementacion obviacomienza entonces eligiendo un t a partir del cual calcular p(0) y por tantop(t), sustituyendo esta ultima en (3.62) y usando algun criterio propio delalgoritmo en particular que se use para hallar la raz se seleccionara un nuevo ty se iterara el proceso, hasta el punto en que H(t) sea menor que una cantidadpequena predeterminada. Una vez conocido t1 la secuencia de calculo consisteen encontrar, sucesivamente p(0), p(t) y u(t).

    3.7. Programacion dinamica

    Discutiremos en esta seccion la implementacion discreta del sistema decontrol. La tecnica se encuentra descrita en [13] y [14]. Aqu mostraremosen primer lugar el modelo discreto que se deriva de la formulacion continuaque motiva toda la discusion precedente, para a continuacion mostrar laimplementacion discreta basada en programacion dinamica, una tecnica quepara sistemas lineales se revela mas compacta y sencilla de aplicar que laversion discreta de la ecuacion diferencial de Ricatti, tal y como se discuteen [13].

    Sabido es que para el sistema lineal

    x = Ax+ Bu (3.63)

    existe la solucion

    x(t) = eAtx(t0) + t1t0eA(t)Bu()d (3.64)

    y que el mismo sistema, con la notacion habitual, adquiere la forma discreta

    xk+1 = xk + uk (3.65)

    donde

    = eAT (3.66)

  • 3.7. PROGRAMACION DINAMICA 59

    y

    = T

    0eABd (3.67)

    donde T es el periodo de muestreo, que aqu tomaremos convencionalmentecomo 104s.

    Siguiendo a [12] aplicaremos el principio de optimalidad para encontrar elcontrol optimo de un sistema discreto que desea conducirse durante N etapasde forma que se minimize la funcion de coste

    J = xTNHxN +N1k=0

    xTkQxk + uTkRuk (3.68)

    Elijamos la notacion

    JNN = xTNHxN = x

    TNP0xN (3.69)

    y busquemos el control uN1 que conduce al sistema de la mejor formaposible desde xN1 hasta xN . El coste en esta operacion es

    JN1,N = xTNP0xN + xTN1QxN1 + u

    TN1RuN1 (3.70)

    Si usamos la dinamica para escribir xN en funcion de xN1 y uN1, desa-rrollamos la expresion resultante y aplicamos el hecho de que uN1 minimizaa JN1,N cuando

    JN1,NuN1

    = 0 (3.71)

    encontraremos que

    uN1 = FN1xN1 (3.72)

    con

    FN1 = (R + BTP0B

    )1BTP0A (3.73)

  • 60 CAPITULO 3. REGULACION Y SERVOCONTROL

    0 50 100 150 2000

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    Tiempo (segundos*0.005)

    Des

    plaz

    amie

    nto

    (metr

    os)

    Figura 3.11 Posicion de m2. Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=I;R = 0,0001. La integracion se ha efectuado durante un

    intervalo de 1 segundo.

    Con este valor para el control, podemos volver al coste JN1,N y recalcu-larlo. Obtendremos entonces

    JN1,N = xTN1P1xN1 (3.74)

    con

    P1 = ATP0A + A

    TP0BFN1 + FTN1BTP0A

    +FTN1BTP0BFN1 + Q + FTN1RFN1 (3.75)

    Lo importante aqu es que JN1,N tiene exactamente la misma forma queJNN , lo que muestra el procedimiento iterativo que hay que seguir para en-contrar sucesivamente JN2,N , JN3,N y en general JNk,N . Conocido P0, lafuncion de coste y la dinamica del sistema, podemos calcular FN1 . En elsiguiente paso, a partir de P0 y FN1, calculamos P1 y FN2 y as sucesi-vamente. Una vez que dispongamos de las secuencias de matrices Pi y Fi,sustituyendo los ui = Fixi en la ecuacion dinamica obtenemos la secuenciade vectores de estado, y finalmente la secuencia de control.

  • 3.7. PROGRAMACION DINAMICA 61

    0 50 100 150 2000.5

    0

    0.5

    1

    1.5

    2

    2.5

    Tiempo (segundos*0.005)

    Velo

    cida

    d (m

    etros

    /segu

    ndo)

    Figura 3.12 Velocidad de m2. Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=I;R = 0,0001. La integracion se ha efectuado durante un

    intervalo de 1 segundo.

    0 50 100 150 2002.5

    2

    1.5

    1

    0.5

    0

    0.5

    1

    1.5

    2

    2.5

    Tiempo (segundos*0.005)

    Fuer

    za (N

    ewton

    s)

    Figura 3.13 Esfuerzo de control u(t). Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=I;R = 0,0001. La integracion se ha efectuado durante un

    intervalo de 1 segundo.

  • 62 CAPITULO 3. REGULACION Y SERVOCONTROL

    0 50 100 150 2000

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    Tiempo (segundos*0.005)

    Des

    plaz

    amie

    nto

    (metr

    os)

    Figura 3.14 Posicion de m2. Parametros: m1 = m2 = 1 Kg;k = 25 N/m; Q=H=103I;R = 0,0001. La integracion se ha efectuado

    durante un intervalo de 1 segundo.

    La grafica (3.11) muestra el desplazamiento de m2 frente al tiempo, lagrafica (3.12) muestra la velocidad de m2 frente al tiempo, la grafica (3.13)el esfuerzo de control. Estas graficas se han obtenido con Q = I, R = 0,0001y H = 105I. Finalmente, la grafica (3.14) muestra la posicion de m2 frente altiempo cuando H = 103I y Q = 103I, lo que sugiere que un comportamien-to aceptable mediante este metodo se obtiene cuando el problema se trataesencialmente como un control sobre el estado terminal.

    Es interesante observar, por otro lado, como la grafica para el esfuerzo decontrol se asemeja mucho a la que en su momento obtuvimos para el reguladorLQR con condiciones de contorno completas ( tiempo y estado final fijos ),especialmente cuando se toman para el parametro valores pequenos. Sinembargo, y a pesar de que aqu el factor que pondera el esfuerzo de control,R, es mas pequeno, no observamos la inestabilidad que se produca all enlos instantes finales. La diferencia esencial esta en que aqu hemos relajadola condicion de que se alcance exactamente el estado final 0. As que, si esposible, ponderando el estado final, conducir al sistema dentro de un entornoarbitrariamente pequeno del punto de consigna, como ocurre cuando se deseaaccionar un DMEM de almacenamiento, esta puede ser una tecnica adecuada.

  • 3.7. PROGRAMACION DINAMICA 63

    Observese que, a pesar de los valores macroscopicos elegidos para las masasy la pequenez de R ( para valores mas pequenos de este parametro se autori-zan esfuerzos de control mayores ), los valores que se obtienen para el controlse mantienen en valores muy bajos aun en los entornos de los instantes inicialy final.

  • 64 CAPITULO 3. REGULACION Y SERVOCONTROL

  • Captulo 4

    Modelo con acoplamiento nolineal

    4.1. Modelo fsico

    Consideremos el efecto sobre el control de un termino no lineal en el ele-mento elastico. Este termino modifica a la energa potencial, de forma queahora

    U =1

    2k(y2 y1 L)2 + (y2 y1 L)4 (4.1)

    donde es un parametro pequeno y positivo, es decir, se trata de unmuelle duro. Por su parte, la energa cinetica y la funcion de Rayleigh no semodifican, de forma que obtenemos las ecuaciones del movimiento:

    (m1 +m2)q1 +m2q2 = u

    m2(q1 + q2) + kq2 + 4q32 + q2 = 0 (4.2)

    Introduciendo variables de estado

    x1 = q1

    x2 = q1

    x3 = q2

    x4 = q2 (4.3)

    65

  • 66 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

    tenemos:

    x1 = x2

    x2 =k

    m1x3 +

    4

    m1x33 +

    m1+

    1

    m1u

    x3 = x4

    x4 = Mkm1m2

    x3 4Mm1m2

    x33 M

    m1m2x4 1

    m1u (4.4)

    que en formato vectorial se expresa como:

    x = Ax+ bu+ d (4.5)

    con

    A =

    0 1 0 0

    0 0 km1

    m1

    0 0 0 1

    0 0 Mkm1m2

    Mm1m2

    (4.6)

    b =

    01m1

    0 1m1

    (4.7)

    d =

    0

    4m1x33

    0

    4Mm1m2

    x33

    (4.8)

    4.2. Regulador de energa mnima

    Estudiaremos la forma en que el termino no lineal d afecta al control, ypara ello consideraremos en primer lugar el regulador de energa mnima, esdecir, el que resulta de aquella funcion de coste que pondera exclusivamente laenerga consumida. Como se discutio arriba, este problema carece de sentidosi no se pondera de algun modo el estado final, o si, como es el caso que ahoravamos a discutir, no se dan condiciones de contorno completas. En fin, de ladefinicion de Hamiltoniana (B.5) y la dinamica (4.5):

  • 4.2. REGULADOR DE ENERGIA MINIMA 67

    H = u2 + pT (Ax + bu+ d) (4.9)

    y las ecuaciones del control (Apendice B)

    H

    u= 0 = 2u+ bT p (4.10)

    p = Hx

    = AT p x

    (pT d) (4.11)

    Procederemos a resolver estas ecuaciones mediante aproximaciones sucesi-vas, cuando tanto el tiempo final como el estado final se encuentran determi-nados. En la aproximacion de orden cero, = 0, y recaemos en el caso linealya estudiado, con d(x) = 0. En particular:

    x(t) = eAtx(0) 12E(t)p(0) (4.12)

    donde E fue definida en la seccion 2.4 como

    E(t) = t

    0eA(t) bbT eA

    T d (4.13)

    Para t = t1, x(t1) = 0, de donde, en la aproximacion de orden cero:

    p(0)(0) = 2E1(t1)eAt1 x(0) (4.14)

    x(0)(t) =[eAt E(t)E1(t1)eAt1

    ]x(0) (4.15)

    Usaremos la solucion de orden cero para obtener una mejor aproximacion.Partiendo del estado conocido, que suponemos proximo al real, el vector d(x)se transforma en una funcion conocida del tiempo f (0)(t), y se puede escribir:

    x = Ax+ bu+ f (0)(t) (4.16)

    y

    H = u2 + pT (Ax+ bu+ f (0)(t)) (4.17)

  • 68 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

    Las ecuaciones del control no se modifican, pero s la solucion de la ecuaciondinamica, que ahora adopta la forma:

    x(1)(t) = eAtx(0) 12E(t)p(0) + F (t) (4.18)

    con

    F (t) = t

    0eA(t)f (0)()d (4.19)

    De nuevo imponiendo que x(1)(t1) = 0:

    p(1)(0) = 2E1(t1)[eAt1 x(0) + F (0)(t1)

    ](4.20)

    y de aqu

    u(1)(t) = 12bT eA

    T tp(1)(0) (4.21)

    La generalizacion para una aproximacion arbitraria de orden (n) procedeconocido el estado en aproximacion (n 1). Entonces, d(x) es una funcionconocida del tiempo que llamaremos f (n1)(t). La solucion de la ecuacion delmovimiento es

    x(n)(t) = eAtx(0) 12E(t)p(0) + F (n1)(t) (4.22)

    Ahora con

    F (n1)(t) = t

    0eA(t)f (n1)()d (4.23)

    de donde se siguen

    p(n)(0) = 2E1(t1)[eAt1 x(0) + F (n1)(t1)

    ](4.24)

    p(n) = eAT tp(n)(0) (4.25)

    y

    u(n)(t) = 12bT eA

    T tp(n)(0) (4.26)

  • 4.2. REGULADOR DE ENERGIA MINIMA 69

    0 200 400 600 800 10001

    0.5

    0

    0.5

    1

    1.5

    2

    Tiempo (milisegundos)

    Dife

    renc

    ia 1

    2

    3 4

    Figura 4.1 Convergencia de la iteracion. La curva etiquetada como 1muestra la diferencia u(1) u(0). La curva etiquetada como 2 u(2) u(1). La

    curva 3 muestra u(3) u(2) y finalmente la curva 4 muestra u(4) u(3).Parametros: m1 = m2 = 1 Kg; = 0,01; k = 25 N/m; = 2 Ns/m; = 4 y

    Q= I

    0 200 400 600 800 10000

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    Tiempo (milisegundos)

    Des

    plaz

    amie

    nto

    (metr

    os)

    1

    4

    Figura 4.2 Elongacion de la masa m2, en orden 1 y en orden 4, comomuestran las etiquetas. Parametros: m1 = m2 = 1 Kg; = 0,01; k = 25 N/m; = 2 Ns/m; = 4 y Q=I

  • 70 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

    Observese que el vector p(0) se calcula cada vez a partir de la condicionx(n)(t1) = 0. La grafica (4.1) da una idea de la convergencia del procedimien-to, mostrando las diferencias u(1) u(0), u(2) u(1) y u(3) u(2) y u(4) u(3).La grafica (4.2) muestra la elongacion de m2 en aproximaciones de orden (0)y de orden (4).

    4.3. Inclusion de un termino de Mayer

    Una funcion de coste basada unicamente en la energa carece de sentido si elinstante final o el estado final quedan libres. En ese caso, es preciso ponderarbien el estado final, bien la historia del sistema mediante un termino quehabitualmente sera una funcion cuadratica del estado.

    Consideremos la funcion de coste

    J = t1

    0u2dt+ xT (t1)Mx(t1) (4.27)

    cuando el instante final t1 es fijo pero no as el estado final. Sea tambienla dinamica

    x = Ax+ bu+ d(x) (4.28)

    En la aproximacion de orden cero, d = 0 y las ecuaciones del controlconducen a

    u(0) = 12bT p (4.29)

    y

    p(0)(t) = eAT

    p(0) (4.30)

    Se sigue inmediatamente la solucion

    x(t) = eAtx(0) 12

    [ t0eA(t) bbT eA

    T d]p(0) (4.31)

  • 4.3. INCLUSION DE UN TERMINO DE MAYER 71

    Como venimos haciendo, llamaremos E(t) a la matriz entre corchetes enla ecuacion anterior. Que el estado final sea libre, implica la condicion(

    p x

    )t1

    x = 0 (4.32)

    donde es la funcion que pondera el estado final. Se sigue que

    p(t1) = 2Mx(t1) = eAT t1 p(0) (4.33)

    y combinando esta ecuacion con la solucion de la ecuacion dinamica:

    p(0) =(

    1

    2M1eA

    T t1 +1

    2E(t1)

    )1eAt1 x(0) (4.34)

    Conocido el vector p(0) ya es posible conocer p(t), mientras que la fun-cion d(x) se transforma en una funcion conocida del tiempo que llamaremosf (0)(t), que usaremos para buscar la aproximacion de primer orden para elestado. En efecto, sustituyendo f (0)(t) en la ecuacion dinamica:

    x(t) = eAtx(0) 12

    E(t)p(0) + F (t) (4.35)

    con

    F (t) = t

    0eA(t)f (0)()d (4.36)

    Particularizando para t1 y teniendo en cuenta que

    x(t1) =1

    2M1eA

    T t1 p(0) (4.37)

    obtenemos

    p(0) =(

    1

    2M1eA

    T t1 +1

    2E(t1)

    )1 (eAt1 x(0) + F (t1)

    )(4.38)

    Conocido p(0), obtenemos p(1)(t), y de ah el control en primer orden, quea su vez permite encontrar el estado. Esta nueva aproximacion puede usarsede nuevo poniendo d(x) = f (1)(t), e iterar el proceso.

  • 72 CAPITULO 4. MODELO CON ACOPLAMIENTO NO LINEAL

    4.4. Efecto de una perturbacion acimutal

    En esta seccion consideraremos la dinamica y control del sistema de dosmasas colineales cuando la lnea donde se efectua el movimiento forma unangulo variable con una direccion inercial fija. Pasamos por tanto de unmovimiento unidimensional a uno bidimensional, donde las coordenadas dem1, sobre la que se aplica el control, son x1 e y1 y las de m2, cuya posiciony velocidad quiere controlarse, son x2 e y2. Llamando q1 y q2 a la distanciaentre cada una de estas masas y el origen, existen las relaciones

    x1 = q1 cos((t))

    y1 = q1 sen((t))

    x2 = q2 cos((t))

    y2 = q2 sen((t)) (4.39)

    1m

    2

    km

    q1

    q2

    Figura 4.3 Actuador sometido a una perturbacion acimutal.

    La energa cinetica es, en el sistema inercial:

    T =1

    2m1(x

    21 + y

    21) +

    1

    2m2(x

    22 + y

    22) (4.40)

  • 4.4. EFECTO DE UNA PERTURBACION ACIMUTAL 73

    y a partir de las relaciones (4.39) puede escribirse como

    T =1

    2m1(q

    21

    2 + q21) +1

    2m2(q

    22

    2 + q22) (4.41)

    Ahora bien, tanto la energa potencial como la funcion de disipacion deRayleigh dependen de las coordenadas y velocidades relativas de m1 y m2,por lo que conviene introducir las nuevas coordenadas generalizadas

    p1 = q1

    p2 = q2 q1 L (4.42)

    donde L es la distancia de equilibrio de m1 y m2. Con esta ultima transfor-macion de coordenadas, las energas cinetica, potencial y funcion de Rayleighse escriben como

    T =1

    2m1(p

    21

    2 + p21) +1

    2m2((p2 + p1 + L)

    2 + (p1 + p2)2) (4.43)

    U =1

    2kp22 + p

    42 (4.44)

    F = 12p22 (4.45)

    donde se ha introducido un termino cuartico en la energa potencial quese traduce en una no linealidad cubica en la fuerza del resorte. Se siguenentonces de (2.8) las ecuaciones del movimiento:

    (m1 +m2)p1 +m2p2 m12p1 m22(p2 + p1 + L) = u (4.46)

    y

    m2p1 +m2p2 m22(p1 + p2) + kp2 + p2 = 4p32 +m2L2 (4.47)

    Pueden reunirse (4.46) y (4.47) en una unica ecuacion vectorial de la forma

    Mp = l p + k(t)p+ b