Aplicación de Técnicas de Control Óptimo a una plataforma...

16
RIELAC, Vol. XXXVII 3/2016 p. 34-49 Septiembre - Diciembre ISSN: 1815-5928 Aplicación de Técnicas de Control Óptimo a una plataforma estacionaria cuatrimotor Gerson Beauchamp Báez, Rafael Batista RESUMEN / ABSTRACT El estudio de las técnicas de control óptimo es de interés en varias aplicaciones que requieran controlar sistemas dinámicos complejos, uno de estos casos son los vehículos aéreos no tripulados (UAV). Los UAV han sido utilizados en diversos campos como: ingeniería civil, agricultura, manejo de desastres, etc. Dichos UAV requieren estrategias de control que garanticen su estabilidad, rechacen los disturbios externos y el ruido en las medidas. Se presentan los resultados obtenidos aplicando técnicas de control óptimo a una plataforma de vuelo estacionaria propulsada por cuatro motores. Se hace un análisis comparativo de los resultados obtenidos con los distintos controladores. Como criterios de comparación se utilizaron las especificaciones de desempeño de la respuesta temporal y se computó el índice de desempeño para cada estrategia implementada. El análisis incluye el desarrollo del modelo dinámico de la plataforma de vuelo estacionario mediante las ecuaciones de movimiento de Euler-Lagrange, obteniendo un sistema MIMO descrito por seis ecuaciones de estado y cuatro entradas. La primera técnica de control óptimo estudiada fue el regulador cuadrático lineal (LQR) junto con estimador del vector de estado. Esta implementación requirió la evaluación de distintas matrices de peso Q y R del índice de desempeño hasta obtener una respuesta satisfactoria del sistema. La siguiente estrategia fue la implementación del controlador LQ con filtro de Kalman (regulador cuadrático lineal Gaussiano, LQG) y el uso de Loop Transfer Recovery (LTR) para recobrar las características de robustez del LQR. Los resultados obtenidos muestran la viabilidad de aplicar dichas técnicas de control óptimo a vehículos aéreos, obteniendo los mejores resultados para la técnica del LQG con LTR. Palabras claves: Control óptimo, vehículos aéreos no tripulados, LQR, filtro de Kalman, Loop Transfer Recovery. The study of optimal control techniques is of interest in various types application which required the control of complex dynamical systems, one of this cases are Unmanned Aerial Vehicles (UAV). UAV have been used in diverse fields such as: civil engineering, agriculture, disaster management, etc. Such UAV require control strategies that guarantee their stability, reject external disturbances and measurement noise. The results obtained when applying optimal control techniques to a stationary platform, powered by four motors, are presented. A comparative analysis of the results for the different controls obtained is made. For this comparison, performance specifications of the time response were used and the performance index was calculated for each implemented strategy. The analysis includes the development of the steady state platform dynamic model by means of Euler-Lagrange equations of motion, obtaining a MIMO system described by six state equations and four inputs. The first optimal control technique studied was the linear quadratic regulator (LQR) with a state-observer. This implementation required the evaluation of different performance index weight matrices Q and R until a satisfactory response of the system was obtained. The next technique studied was the implementation of the LQ controller with Kalman filter (linear quadratic Gaussian regulator, LQG) and the use of Loop Transfer Recovery (LTR) to recover the robustness characteristics of LQR. Results obtained show the viability of applying such optimal control techniques to unmanned aerial vehicles, obtaining the best results with the LQG/ LTR technique. Key words: Optimal control, unmanned aerial vehicles, LQR, Kalman filter, Loop Transfer Recovery. Application of optimal control techniques to a quadmotor stationary platform 34

Transcript of Aplicación de Técnicas de Control Óptimo a una plataforma...

Page 1: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

RIELAC, Vol. XXXVII 3/2016 p. 34-49 Septiembre - Diciembre ISSN: 1815-5928

Aplicación de Técnicas de Control Óptimo a una plataforma estacionaria

cuatrimotor Gerson Beauchamp Báez, Rafael Batista

RESUMEN / ABSTRACT El estudio de las técnicas de control óptimo es de interés en varias aplicaciones que requieran controlar sistemas dinámicos complejos, uno de estos casos son los vehículos aéreos no tripulados (UAV). Los UAV han sido utilizados en diversos campos como: ingeniería civil, agricultura, manejo de desastres, etc. Dichos UAV requieren estrategias de control que garanticen su estabilidad, rechacen los disturbios externos y el ruido en las medidas. Se presentan los resultados obtenidos aplicando técnicas de control óptimo a una plataforma de vuelo estacionaria propulsada por cuatro motores. Se hace un análisis comparativo de los resultados obtenidos con los distintos controladores. Como criterios de comparación se utilizaron las especificaciones de desempeño de la respuesta temporal y se computó el índice de desempeño para cada estrategia implementada. El análisis incluye el desarrollo del modelo dinámico de la plataforma de vuelo estacionario mediante las ecuaciones de movimiento de Euler-Lagrange, obteniendo un sistema MIMO descrito por seis ecuaciones de estado y cuatro entradas. La primera técnica de control óptimo estudiada fue el regulador cuadrático lineal (LQR) junto con estimador del vector de estado. Esta implementación requirió la evaluación de distintas matrices de peso Q y R del índice de desempeño hasta obtener una respuesta satisfactoria del sistema. La siguiente estrategia fue la implementación del controlador LQ con filtro de Kalman (regulador cuadrático lineal Gaussiano, LQG) y el uso de Loop Transfer Recovery (LTR) para recobrar las características de robustez del LQR. Los resultados obtenidos muestran la viabilidad de aplicar dichas técnicas de control óptimo a vehículos aéreos, obteniendo los mejores resultados para la técnica del LQG con LTR.

Palabras claves: Control óptimo, vehículos aéreos no tripulados, LQR, filtro de Kalman, Loop Transfer Recovery.

The study of optimal control techniques is of interest in various types application which required the control of complex dynamical systems, one of this cases are Unmanned Aerial Vehicles (UAV). UAV have been used in diverse fields such as: civil engineering, agriculture, disaster management, etc. Such UAV require control strategies that guarantee their stability, reject external disturbances and measurement noise. The results obtained when applying optimal control techniques to a stationary platform, powered by four motors, are presented. A comparative analysis of the results for the different controls obtained is made. For this comparison, performance specifications of the time response were used and the performance index was calculated for each implemented strategy. The analysis includes the development of the steady state platform dynamic model by means of Euler-Lagrange equations of motion, obtaining a MIMO system described by six state equations and four inputs. The first optimal control technique studied was the linear quadratic regulator (LQR) with a state-observer. This implementation required the evaluation of different performance index weight matrices Q and R until a satisfactory response of the system was obtained. The next technique studied was the implementation of the LQ controller with Kalman filter (linear quadratic Gaussian regulator, LQG) and the use of Loop Transfer Recovery (LTR) to recover the robustness characteristics of LQR. Results obtained show the viability of applying such optimal control techniques to unmanned aerial vehicles, obtaining the best results with the LQG/ LTR technique.

Key words: Optimal control, unmanned aerial vehicles, LQR, Kalman filter, Loop Transfer Recovery.

Application of optimal control techniques to a quadmotor stationary platform

34

Page 2: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Emac

EPe

ctctcecuule

Epp(M

Leuácbcem

1. -INTREl auge en el muestra comoaplicaciones pcontrol que ayu

En la literaturProporcional-Dexponencial [7sistemas UAVcon comportamtodos los estadcontrol requeritécnicas de cocontrol óptimoestos sistemascomparar el deuna de estas téuna de las estrlineal Gaussianel mejor desem

Este documenplataforma de presenta el dis(LTR) con filtMATLAB® y

2.- MODLa plataforma el diseño del suna plataformaángulo de elevcontrolan el ánbalanceado. Lcuentas por reestado son lasmodelo del sis

RIELAC

RODUCCIuso de sistema

o esta tecnoloara sistemas Uuden a mejorar

ra, varios inveDerivativo (PD7-9] y Regulad

V. En cambio, emiento dinámicdos sean pesadida sobre todas

ontrol clásico. o disponibles, d UAV. Este tresempeño de décnicas se utilirategias implemno (LQG) com

mpeño para nue

nto está organivuelo estacio

seño del observtro de KalmanSimulink®. S

DELO DELde vuelo estacistema de conta, con cuatro mvación y giran ngulo de rotacias medidas devolución. El m

s posiciones y tema se deriva

Diagrama

GC, Vol. XXXVI

IÓN

as aéreos no trogía provee sUAV se puedenr el desempeño

estigadores haD) [5], Prop

dor Cuadrático el controlador Lco complejo codos (retroalimes las entradas dSin embargo,

de forma que srabajo proponedistintas estrateizará como critmentadas. Los mbinada con laestra plataform

zado de la signario; la seccivador asintótic y la sección 6e incluye adem

L SISTEMcionaria utilizadtrol para un vehmotores, montaen dirección coión y giran a fe las tres posicmodelo dinámi

velocidades aa del diagrama

de cuerpo libre

Gerson BeauchII 3/2016 p. 34

ripulados (UAoluciones a d

n encontrar en o de sistemas U

an utilizado diporcional-Integ

de SeguimientLQR es considomo son los UAentación compdel sistema [11se hace neces

se pueda tener ue utilizar una pegias de controterio la respueresultados mu

a técnica de Loma.

guiente maneraión 3 presentaco; la sección 6 presenta los

más una conclu

MA da es la “3 DOhículo aéreo no

ada en una baseontraria a las m

favor de las maciones son tomco del sistemangulares de lode cuerpo libre

e de la plataform

hamp Báez, Raf4- 49 Septiemb

V, por sus sigdistintas probl[1-4]. Por este

UAV.

iferentes estratgral-Derivativo to [10]. En [6]erado como unAV [7]. La estrleta del vector1], siendo estosario hacer un un punto de paplataforma de ol óptimo y de sta temporal destran como laop Transfer Re

a: la sección 2a el diseño del5 presenta la resultados par

usión y una lista

OF Hover” de Qo tripulado (Ene que rota en trmanecillas del anecillas del remadas por tresa tiene seis varos ejes y las ene ilustrado en l

Figura 1

ma de vuelo esta

fael Batista bre - Diciembre

glas en inglés) lemáticas que e motivo, es de

tegias de cont(PID) [6],

] establecen la na técnica adecrategia de contr de estado) al

o una ventaja danálisis comp

artida para la sevuelo estacionestimación de

del sistema así a estrategia de ecovery (LTR)

2 presenta la dl Regulador Caplicación de ra los diferentea de referencia

Quanser® [12]n este caso un res ejes. Los mreloj. En contr

eloj. Esto perms codificadoresriables de estadntradas son lola Fig. 1.

acionario de tre

e ISSN: 1815-5

en diversos caafectan a nu

e gran interés e

trol para sisteLQR con obdesventaja de

cuada para la estrol óptimo mel momento de del control óptiparativo de laselección de la nario con tres l vector de estacomo el índicecontrol median

) es la técnica d

derivación del Cuadrático Line

la técnica de Les controladoreas.

] y sirve como Quadcopter).

motores frontal raste, los moto

mite que el torqs ópticos con do y cuatro ens voltajes apli

es grados de lib

5928

ampos del conuestra sociedael estudio de té

mas UAV. Enbservador asiutilizar un PID

stabilización dediante LQR pe

determinar la imo en compars distintas estrestrategia adecgrados de lib

ado. Para compe de desempeñnte regulador cde control que

modelo dinámeal (LQR); la Loop Transferes propuestos

punto de referEste sistema cy posterior, co

ores izquierdo yque total del sisuna resolución

ntradas. Las vaicados a los m

bertad.

nocimiento ad. Varias écnicas de

ntre ellos: intótico o D para los e sistemas ermite que acción de

ración con ategias de cuada para ertad para parar cada ño de cada cuadrático resulta en

mico de la sección 4

r Recovery utilizando

rencia para consiste en ontrolan el y derecho, stema esté n de 8192 ariables de

motores. El

35

Page 3: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

En la Fig. 1 se observa que el plano donde descansan los motores está compuesto por los ejes de elevación y de rotación y el eje perpendicular a estos es el giro. Además, la distancia del centro de cualquier motor al punto de intersección de los ejes es igual a LA= 0.197m. Se presume que la fuerza aplicada por cada motor es normal al mismo. Es importante notar que, debido a que la plataforma de vuelo es estacionaria, nuestro modelo dinámico no incluye los efectos de la fricción del aire, fuerza de la gravedad, fuerza centrífuga ni el efecto Coriolis. Definimos F, B, R y L (por sus siglas en inglés) como frontal, posterior, derecho e izquierdo; además, definimos y, p y r (por sus iniciales en inglés) como los ejes de giro (yaw), elevación (pitch) y rotación (roll).

Para obtener un modelo matemático que describa la dinámica del sistema, se formulan primero las ecuaciones de movimiento de Euler- Lagrange, de la forma:

d L L

dt z z

. (1)

Donde L - Lagrangiano, z - Vector de coordenadas generalizadas, - Vector de torque generalizado aplicado al sistema.

Definiendo a - -C PL E E T U como el Lagrangiano, que es la diferencia entre la energía cinética y la energía potencial

de nuestro sistema, se tiene

2 2 21 1 1

2 2 2y p rL J y J p J r . (2)

Donde Jp = 0.552 kg⋅m2, Jr= 0.552 kg⋅m2 y Jy= 0.110 kg⋅m2 son, respectivamente, los momentos de inercia de la elevación,

rotación y el giro. Se presume que la energía potencial es cero ya que la plataforma de vuelo es estacionaria.

Se definen las coordenadas generalizadas (z i) como los ángulos de los ejes de giro (y), elevación (p) y rotación (r)

y

z pr

. (3)

Computando (1) con la L dada en (2) y aplicando los torques externos generalizados i , resulta

y TN F B TC R Lyd

v v vL L

J K K vdt y y

, (4)

FN Bp A F

d L LJ p v vK L

dt p p

, (5)

FC A Lr R

d L LJ r vK L

rv

dt r

. (6)

El vector de torques generalizados del sistema es

1

2

3

(7)

que son los torques que producen los motores en cada eje y donde KTN, KTC son las constantes de torque y KFN, KFC son las constantes de fuerza. Además, V es el voltaje aplicado al motor; donde el sub-índice designa el motor correspondiente. Finalmente, las ecuaciones de movimiento de Euler-Lagrange son: y TN F B TC R LJ Ky v v vK v , (8)

p FN A F BJ K Lp v v , (9)

36

Page 4: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

p FN A F BJ K Lp v v , (10)

Colocando las ecuaciones (8), (9) y (10) en forma matricial, resulta

0 00 0 0 0

TN F B TC R Ly

p FN A F B

r FC A R L

K v v v vyp v vr

KJJ K

K v vL

J L

(11)

Debido a que los cuatros motores son idénticos se tiene que 0.0036TN TC TK K K N m V y

0.1188FN FC FK K K N V . Resolviendo para las aceleraciones angulares y definiendo las velocidades angulares, se

obtiene la siguiente representación del sistema en variables de estado

0 1 0 0 0 0

0 0 0 0 0 0

0 0 0 1 0 0

0 0 0 0 0 0

0 0 0 0 0 1

0 0 0 0 0 0

y y

y y

p p

p p

r r

r r

0 0 0 0

0 0 0 0

0 0

0 0 0 0

0 0

T T T T

y y y y

F

Bf A f A

Rp p L

f A f A

r r

K K K K

J J J JvvK L K Lv

J J v

K L K L

J J

(12)

Definiendo las variables de estado y las entradas del sistema como

1 2 3 4 5 6

1 2 3 4

, , , , , ;

, , , .F B R L

x y x y x p x p x r x r

u V u V u V u V

Resulta

1 1

2 2

3 3

4 4

5 5

6 6

0 1 0 0 0 0

0 0 0 0 0 0

0 0 0 1 0 0

0 0 0 0 0 0

0 0 0 0 0 1

0 0 0 0 0 0

t

x x

x x

x xx

x x

x x

x x

1

2

3

4

0 0 0 0

0 0 0 0

0 0

0 0 0 0

0 0

T T T T

y y y y

f A f A

p p

f A f A

r r

K K K K

J J J JuuK L K Lu

J J u

K L K L

J J

. (13)

Definiendo además las salidas del sistema como 1 2 3, , y y y p y r y sustituyendo los parámetros físicos del sistema,

resulta la representación en variables de estado

0 1 0 0 0 0 0 0 0 00 0 0 0 0 0 0.0327 0.0327 0.0327 0.03270 0 0 1 0 0 0 0 0 00 0 0 0 0 0 0.4240 0.4240 0 00 0 0 0 0 1 0 0 0 00 0 0 0 0 0 0

( ) ( ) (

0 0.4240 0.4240

x t x t u t

1 0 0 0 00 0 0

)

0y( ) 1 ( )

0 10 0

0 0 0 0t x t

. (14)

donde 6( )x t R - vector de estado,

37

Page 5: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

4( )u t R - vector de entradas,

3( )y t R - vector de salidas medidas.

Dada esta representación en variables de estado del sistema, se pueden evaluar tres propiedades importantes: controlabilidad, observabilidad y estabilidad. El sistema es inestable por naturaleza debido a que todos sus polos se encuentran en el origen del plano complejo. Por otro lado, el sistema es totalmente controlable y totalmente observable por lo que es posible diseñar controladores que lo estabilicen y observadores que estimen sus variables de estado.

3.- DISEÑO DEL CONTROLADOR LQR El problema de control óptimo para el regulador cuadrático lineal (LQR) implica minimizar el índice de desempeño

0

0

1 1( )

2 2

TT T T

tT T TJ t x S x x Q x u R u dt (15)

donde 0, 0 0TS Q y R .

En el controlador LQR, las matrices de peso Q y R se convierten en los parámetros de diseño. La matriz Q es la matriz de peso para los estados intermedios, la matriz R es la matriz de peso para la acción de control del sistema y la matriz S(T) representa el peso del estado final x(T). La dinámica de la planta es

0, x t Ax t Bu t t t (16)

con la ley de control .u t Kx t (17)

Para lograr el objetivo de control se necesita determinar una ley de control (17) que minimice (15). Para lograr este resultado se requiere resolver la siguiente ecuación diferencial de Riccati

1 , .T TS A S SA SBR B S Q t T (18)

Si se considera que (18) tiene una solución en estado estacionario, el problema ahora se convierte en un problema de horizonte en infinito en donde la ecuación diferencial de Riccati (DRE) se torna en una ecuación algebraica de Riccati (ARE) [13] de la forma

10 .T TA S SA SBR B S Q (19)

Con índice de desempeño

0

1( ) .

2T TJ x Qx u Ru dt

(20)

En (20) ya no es necesario pesar el estado final ya que, cuando el sistema es asintóticamente estable, 0x t

según t . Resolviendo (19) se obtiene el valor de la ganancia de Kalman mediante

1 .TK R B S (21)

Finalmente, la acción de control para el controlador LQR con horizonte en infinito es

.u t K x t (22)

38

Page 6: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

P

L

d

E

c

v

ov

c

LLdl

Por lo que el si

La matriz Q hi=1, 2, …, 6 ddesempeño en

El criterio utilsistema y del vcuatro motores

voltaje máxim

4.- OBSESon pocos los observador asivector de esta

consiste en escsistema.

La Fig. 2 muesLa ganancia Ldeben ser asignla dinámica de

RIELAC

istema a lazo c

ha sido elegida donde qi es el la respuesta te

lizado para la valor del índics. Para los pes

o de la acción

ERVADOsistemas que p

intótico para esado x̂ t y se

coger la gananc

stra el diagramobs se escoge dnados de forma

el observador s

GC, Vol. XXXVI

cerrado es

como una matpeso para cad

emporal del sis

elección de loe de desempeñ

sos de las entra

de control (10

OR ASINTpermiten medistimar el vectoobtienen resu

cia Lobs de form

ma de bloques dde forma tal qua tal que sean ce mezcle con l

Diagrama

Gerson BeauchII 3/2016 p. 34

x t

triz diagonal dda producto. Etema.

1 000 00 00 00 0

qq

Q

os valores de ño. En el caso adas se utilizó

voltios), ir

ÓTICO ir todo el vectoor de estado seultados satisfac

ma tal que el er

del sistema (paue el sistema (Acinco o diez vea dinámica del

a de bloques del

hamp Báez, Raf4- 49 Septiemb

A BK x t

de dimensión seEstos pesos deb

2

3

4

5

0 0 0 00 0 0

0 0 00 0 00 0 00 0 0 0

qq

qq

la diagonal dede la matriz Rcomo criterio

21 0.0110

or de estado pagún se ilustra

ctorios [13,14]

rror en el estim

arte superior) cA – LobsC) tengeces más rápidol sistema de laz

Figura 2

l sistema con ob

fael Batista bre - Diciembre

.t

eis en la que soben ser elegid

5

6

0 00 00 0 .0 0

00 q

e la matriz de (peso a las en

o que el peso f

.

ara ser retroalien la Fig. 2. S. El problema

mado sea igual

conectado a un ga polos establos que los del szo cerrado.

bservador asintó

e ISSN: 1815-5

olamente se peos de forma ta

peso Q depenntradas), se colfuera igual al i

imentado. Por e puede retroa

a de diseño de

a cero y no se

observador dees, tomando ensistema de lazo

ótico.

5928

esan los producal que se logre

ndió de la respocó el mismo

inverso del cua

tal motivo, se alimentar el estel observador

afecte el desem

el estado (parten cuenta que eo cerrado para

(23)

ctos (xi ) 2,

e un buen

(24)

puesta del peso a los adrado del

utiliza un timado del asintótico

mpeño del

e inferior). estos polos evitar que

39

Page 7: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

Para diseñar un observador del estado, se tiene el sistema original

( ) ( ) ( ),

( ) ( ).

x t Ax t Bu t

y t Cx t

(25)

Se establece el sistema del observador como

ˆ ˆˆ .obsx t Ax t Bu t L y t y t (26)

Dado que ˆ ˆy t Cx t , entonces

ˆˆ .obs obsx t A L C x t Bu t L y t

El estimado de la salida se define como

ˆ ˆ( ) ( ).y t Cx t (27)

Definiendo el error como ˆx t x t x t , resulta en la dinámica del error

ˆ ,ˆ obsx t Ax t Bu t Ax t Bu t L Cx t Cx t (28)

o

( ) .obsx t A L C x t (29)

De modo que el error tenderá asintóticamente a cero si los polos de (A – LobsC) son estables. De ahí el nombre “asintótico” del observador.

5.- DISEÑO DE CONTROLADOR LQG/LTR El diseño del LQG implica la superposición de un regulador cuadrático lineal (LQR) junto a un estimador óptimo. El estimador óptimo reconstruye el vector de estado a partir de medidas contaminadas con ruido. Esto se conoce como el filtro de Kalman. Dicha técnica utiliza teoría de probabilidad para tratar las incertidumbres. Este estimador óptimo se considera un filtro ya que tiene buena capacidad para rechazar ruido.

Estableciendo el sistema lineal con ruido blanco en el proceso ( )w t y ruido blanco en las medidas v( )t , se tiene

,

.

x t Ax t Bu t Gw t

y t Cx t v t

(30)

Definiendo las matrices de covarianza del ruido en el proceso QN y del ruido en las medidas RN, se desarrolla el filtro de Kalman. Para determinar la ganancia del filtro de Kalman se resuelve la ecuación algebraica de Riccati (ARE, por sus siglas en inglés) de la forma

10 .TN

T TAP PA P CQ C P QG RG (31)

La solución de la ARE de Kalman es la matriz P, la covarianza del error del sistema en estado estacionario. Dada P se computa la ganancia del Filtro de Kalman mediante

1.TOL PC R (32)

El Filtro de Kalman es similar al sistema del observador asintótico,

ˆ ,ˆ ˆOx Ax Bu L y Cx (33)

donde x̂ es el estimado óptimo del vector de estado. La combinación del controlador LQR junto al Filtro de Kalman constituye el regulador cuadrático lineal Gaussiano (LQG).

40

Page 8: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

5.1.- REGULADOR CUADRÁTICO LINEAL GAUSSIANO (LQG) El regulador cuadrático lineal Gaussiano es una técnica de diseño de control óptimo que minimiza un índice de desempeño cuadrático así como costos del esfuerzo de control en presencia de disturbios gaussianos y desviaciones del modelo [15]. Se presume que el control de retroalimentación del vector de estado tiene la forma

u Kx r . (34)

Donde K es la ganancia obtenida mediante la técnica de LQR y r(t) es la referencia de entrada. Al sustituir el control en (30), el sistema de lazo cerrado es

.x A BK x Br Gw (35)

y el Filtro de Kalman es

ˆ ˆO Ox A L C x Bu L y . (36)

Esto implica que el controlador LQR se combina con el filtro de Kalman para producir un regulador dinámico en virtud del principio de separación de Kalman. El regulador LQG es una superposición del regulador cuadrático lineal (LQR) y el estimador cuadrático lineal (LQE) [16]. Cabe destacar que la técnica de LQG reduce la robustez del sistema, por lo cual se buscan métodos auxiliares para resolver dicha limitación.

5.2.- LOOP TRANSFER RECOVERY (LTR) La técnica de LTR se aplica cuando se desea que el regulador cuadrático lineal Gaussiano (LQG) recobre las propiedades de robustez de la retroalimentación del vector de estado que presenta el regulador cuadrático lineal (LQR). Usando el método de LTR, el filtro de Kalman se diseña de manera que la robustez asociada con el diseño de LQR se recupere asintóticamente [17]. El diseño LQG/LTR recobra las propiedades de robustez deseadas junto a un buen desempeño. En este método, las formas deseadas para valores singulares de la función de sensibilidad de la planta de lazo cerrado deben ser diseñadas en un problema LQG y estos valores singulares son recuperados en la entrada o en la salida de la planta real mediante sintonización sucesiva de la ganancia en un problema de LQR [18].

Figura 3

Diagrama de bloques del sistema para la técnica de LTR.

41

Page 9: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

La Fig. 3 muestra el diagrama de bloques para el diseño LQG/LTR. El recobro se hace en la entrada (recobro de sensibilidad) si se sintoniza la matriz de ganancia Kf. Por otro lado, si se sintoniza la matriz de ganancia Kc, el recobro se hace en la salida (recobro de robustez). El recobro de robustez está sujeto a las siguientes condiciones [19]:

Sea m el número de salidas del sistema y sea r el número de entradas al sistema, entonces

a) G(s) debe ser una matriz cuadrada

b) Para recobro en la entrada, G(s) debe ser de fase mínima (no debe tener ceros de transmisión en el lado derecho del plano complejo) con m r . Para recobro en la salida, m r y se debe cumplir el resto de las condiciones para recobro en la entrada.

En el sistema propuesto, el número de entradas es mayor que el número de salidas. De modo que solo es posible el recobro en la salida.

5.2.1- RECOBRO EN LA SALIDA

Siguiendo [19], se define la matriz de transición de lazo abierto como = 1sI A

, la ganancia del lazo del filtro de

Kalman es

k OL s C L . (37)

Definiendo r = 1sI A BK

, la matriz de transición del sistema con el regulador, la ganancia del lazo del regulador en

la salida es:

r Oo

rL s G s K C BK L . (38)

Se requiere diseñar una ganancia K de modo que ( )o

rL s se aproxime a OC L . Se define entonces el índice de desempeño

2

0

1

2T TJ x Qx q u Ru du

. (39)

Con la Q de la forma presentada por Doyle (1981) en [19]

20

TQ Q q C C (40)

donde 0 0 Q es la Q del LQR y C es la matriz de la salida del sistema. A medida que q tiende a infinito se obtiene el

resultado deseado

( )or OL s C L . (41)

El procedimiento para diseñar el LTR es el siguiente: se utiliza la ganancia de recobro q para modificar la Qo original del LQR (40) y se mantiene el valor original de R. Se dibujan las cotas de robustez a partir de la ganancia del lazo del Filtro de Kalman (37) y mediante las gráficas de los valores singulares del sistema se determina si se alcanzan los objetivos de robustez. De no ser así, se aumenta q hasta satisfacer las cotas de robustez. Con el valor Q obtenido de (40) se vuelve a resolver el problema del control LQR y se obtiene la nueva ganancia para K que recobra la robustez del LQR en la salida.

6.- RESULTADOS Esta sección presenta los resultados de una serie de experimentos realizados para validar la propuesta de este trabajo. Se tienen resultados de simulaciones y las respuestas reales del sistema que sirven como base para el análisis comparativo propuesto. Para este proceso de comparación se utilizó el desempeño de la respuesta temporal resultante de cada una de las estrategias de control así como el valor del índice de desempeño.

42

Page 10: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

G

Pip

P

Ec

DoM

Al

pe

Se presentan rGaussiano (LQ

6.1- LQPara obtener limplantación dplataforma rea

Para el diseño

El problema dcomo parámetrse obtiene la si

Debido a que nobservador asiMATLAB® d

A continuaciónla Fig. 4 se ob5 muestra la apor lo que conen el sistema r

RIELAC

esultados paraQG) y finalmen

QR CON Olos resultados de la estrategiaal de Quanser®

del regulador L

Q

el regulador curos de entrada iguiente ganan

no contamos cointótico para ese forma tal que

n, se muestranserva que el si

acción de contrn el diseño propeal.

Simulació

GC, Vol. XXXVI

el Regulador nte los resultad

OBSERVAque se muest

a de control L® y el sistema d

LQR se utiliza

800 00 350 00 00 00 0

uadrático linealas matrices d

ncia K para el si

141.4141.4141.4141.4

K

on las medidasstimar el valor e los polos del

n las respuestasistema respondrol simulada y puesto para la

n de la respuest

Gerson BeauchII 3/2016 p. 34

cuadrático linedos de aplicar la

ADOR AStran a continu

LQR con obserde control en tie

aron las siguien

0 0 00 0 0

350 0 00 20 00 0 3500 0 0

al se resuelve mdel modelo A yistema de lazo

2 55.102 55.102 55.102 55.10

s de todas las vde estas. Para observador qu

s obtenidas de de de manera ad

se observa questrategia LQG

ta de la posición

hamp Báez, Raf4- 49 Septiemb

eal (LQR) con a técnica de Lo

SINTÓTICuación, se consrvador asintótiempo real Qua

ntes matrices Q

000 ,0

0 020

R

mediante MATy B en (14) y la

cerrado con re

132.29 36.2132.29 36.2

0.00 0.00.00 0.0

variables de estlocalizar los po

uedaran en s = -

la simulación decuada y que

ue los voltajes G se espera obt

Figura 4

n angular utiliz

fael Batista bre - Diciembre

observador asoop Transfer R

CO struyó un instico, todas nuesarc® integrado

Q y R:

0.01 00 0.010 0 00 0

TLAB® utilizanas matrices de etroalimentació

22 022 000 132.2900 132.29

tado de nuestroolos del observ-24, -27, -32, -

del sistema con el error en estde los motorestener un buen

zando LQR y ob

e ISSN: 1815-5

sintótico, el regRecovery (LTR)

trumento virtustras pruebas fa la suite MAT

0 00 0 .0.01 00 0.01

ndo el comandpeso Q y R en

ón del vector d

00

36.2236.22

o sistema, fue nvador se utilizó-34, -37, -40.

n el esquema dtado estacionars nunca alcanzdesempeño al

bservador asint

5928

gulador cuadrá) al LQG.

ual para la simfueron realizadTLAB\Simulin

do “lqr”, el cuan (42). Con estde estado.

necesario diseñó el comando “

de control proprio tiende a cerzan su máximoimplantar el co

tótico.

ático lineal

mulación e das con la nk®.

(42)

al requiere tos valores

(43)

ñar un “place” de

puesto. En ro. La Fig. o (24VDC), ontrolador

43

Page 11: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Eco

En la Fig. 6 secontrol se utilioscilaciones en

RIELAC

A

e muestra la reizó el sistema dn los ángulos d

Respue

GC, Vol. XXXVI

Acción de contro

espuesta real ode tiempo real de elevación y r

esta posición an

Gerson BeauchII 3/2016 p. 34

ol simulada del

obtenida al impQuarc® desarrotación en com

ngular del sistem

hamp Báez, Raf4- 49 Septiemb

Figura 5

sistema con LQ

plantar el contrrrollado por Qumparación con

Figura 6

ma real utilizan

fael Batista bre - Diciembre

QR y observado

rolador medianuanser®. En lan la respuesta si

ndo LQR y obse

e ISSN: 1815-5

or asintótico.

nte LQR. Paraa Fig. 6 se obseimulada (Fig. 4

evador asintótic

5928

a implantar el servan pequeños4).

co.

sistema de s errores y

44

Page 12: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

PLdm

Ed

Fm

PmoulM

6.2- LQPara validar elLa Fig. 7 compde Kalman prmatrices de co

Comparaci

En la Fig. 7 sderivativo de psimilares para Fig. 8 muestramantiene un bu

6.3- LQPara determinamuestran en laobservan los vun regulador Lla cota de robMATLAB® ju

RIELAC

QG l desempeño dpara la velocidopuesto. Para varianza del ru

ión del estimad

se observa queprimer orden. la estimación a la respuesta uen desempeño

QG\LTRar el valor de la Fig. 9. Las cvalores singularLQG\LTR aplicbustez al aumunto al mando

GC, Vol. XXXVI

el Filtro de Kadad angular del resolver la ARuido en el proc

NQ

do de la velocida

e el Filtro de Solo se muest

de la velocida real obtenida o del sistema, m

R la ganancia deotas de robustres del sistemacando una gana

mentar la gana“sigma” para g

Gerson BeauchII 3/2016 p. 34

alman, se aplicl giro estimadaRE del filtro deso, QN, y de c

6

6

6

10 0 00 10 00 0 100 0 0

ad angular del s

Kalman provetra la estimaciód angular de la al implementmuy similar al

recobro del siez se obtienena con un regulaancia de recobancia de recobgraficar las cot

hamp Báez, Raf4- 49 Septiemb

có una onda cua con filtros dede Kalman uti

covarianza del r

6

6

00 ,0

10

NR

Figura 7

sistema real util

ee una estimaón de la veloca elevación y ltar el control m de LQR (Fig.6

istema q, se utn a partir de la ador LQG sin ro q = 1000. S

bro. Para obtetas de robustez

fael Batista bre - Diciembre

uadrada al manerivativos de prilizamos el coruido en las me

0.1 0 00 0.1 00 0 0.

lizando filtros d

ación con pococidad angular dla estimación dmediante LQG6).

tilizaron las grrespuesta deseaplicar LTR y

Según lo esperaener estas graf.

e ISSN: 1815-5

ndo del ángulo rimer orden y mando “kalmaedidas, RN con

00 .1

derivativos cont

o ruido en comdel giro, pero sde la velocidadG sin aplicar L

áficas de los veada del lazo dlos valores sin

ado, los valorefica se utilizó

5928

de giro de ± 2 la estimada poan” de MATLn los siguientes

tra Filtro de Ka

mparación conse obtuvieron

d angular de roLTR, se obser

valores singuladel Filtro de Kngulares del sis singulares se

ó el comando

20 grados. or el Filtro LAB® con s valores.

(44)

alman.

n un filtro resultados tación. La

rva que se

ares que se Kalman, se

stema con e acercan a

“ltry” de

45

Page 13: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Edl

Valores sing

Es importante de control se sla ganancia de

RIELAC

gulares del sist

destacar que eature [20], lo qrecobro hasta

GC, Vol. XXXVI

Respuesta

tema con LQGp

el recobro de roque introduce nq = 1000.

Gerson BeauchII 3/2016 p. 34

a posición angul

G y LQG\LTRpara facilitar l

obustez aumenno-linealidades

hamp Báez, Raf4- 49 Septiemb

Figura 8

lar del sistema r

Figura 9

R, se modificó la comparació

nta la ganancias e inestabilida

fael Batista bre - Diciembre

real utilizando L

la escala horizón de estas.

a del sistema, ead al sistema. P

e ISSN: 1815-5

LQG.

zontal de las d

esto conlleva elPor tal razón, so

5928

dos gráficas in

l riesgo de queolo fue posible

nferiores

e la acción e aumentar

46

Page 14: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Arr

Erdb(a

Fip

A continuaciónrecobro elegidretroalimentac

1

Q

En la Fig. 10 robustez en la disminución dbajas (rechaza(rechazando ruaplicar disturb

Finalmente, enimplementadasprincipal para

RIELAC

n se muestra lda. Además, seión Kc de nues

1800 0 00 35 00 0 1350 0 00 0 00 0 0

se muestra la salida. Al com

del error en estando variacionuido en las mios al sistema.

R

n la Tabla 1 ses. Es interesant seleccionar la

GC, Vol. XXXVI

la nueva matrie utilizó el costro sistema de

0 0 00 0 050 0 00 20 00 0 13500 0 0

respuesta obtmparar con la rtado estable. Anes en los par

medidas), ambo

Respuesta posi

e presenta el vte notar que la mejor estrateg

Gerson BeauchII 3/2016 p. 34

iz de peso Q’ omando “lqr” d

lazo cerrado. E

000 ,0020

CK

enida para lasrespuesta obtenAdemás, el regrámetros del

os efectos aum

ción angular d

valor del índic diferencia entia de control h

hamp Báez, Raf4- 49 Septiemb

del controladode MATLAB®El valor de la m

212.13 64212.13 64212.13 64212.13 64

posiciones annida en la Fig. gulador LQG\Lproceso) y un

mentan la robu

Figura 10

del sistema re

ce de desempeñtre cada valor eha sido el desem

fael Batista bre - Diciembre

or LQR luego ® para obtenematriz de peso

4.15 259.814.15 259.814.15 0.004.15 0.00

ngulares del si7, se observa u

LTR presenta na menor ganstez del sistem

al utilizando L

ño (20) compues pequeña. Pompeño de la res

e ISSN: 1815-5

de ser modificer el nuevo vaR se mantuvo

40.1640.160.00 20.00 2

stema luego dun menor tiemuna mayor ga

nancia de lazoma [13]. Este

LQG/LTR.

utado para cador tal razón, enspuesta tempor

5928

cada por la gaalor para la ga

inalterado.

0 00 0

59.81 40.1659.81 40.16

de realizar el rmpo de asentamanancia para fro para altas frhecho fue obs

da una de las en nuestro caso, ral del sistema.

anancia de anancia de

.66

(45)

recobro de miento y la recuencias recuencias servado al

estrategias el criterio .

47

Page 15: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

Tabla 1 Índices de desempeño para las estrategias de control implementadas.

Controlador Valor Índice de Desempeño LQR con Observador 357.6 LQG 353.9 LQG/LTR 360.9

7.- CONCLUSIONES Los resultados obtenidos demuestran la viabilidad de aplicar la estrategia de control LQG/LTR para aeronaves con configuración similar a la de nuestra plataforma de vuelo estacionario. Con el diseño del filtro de Kalman fue posible estimar de manera satisfactoria las variables de estado, disminuyendo el nivel de ruido de las estimaciones y mejorando la respuesta de nuestra acción de control. Además, se observó que al aplicar la técnica de LTR, mejoró la respuesta de nuestro regulador LQG.

Finalmente, este trabajo propone el impulsar la utilización de técnicas de control óptimo en vehículos aéreos no tripulados para seguir mejorando el desempeño de dichos vehículos que cada vez cobran más importancia en diversos tipos de aplicaciones.

REFERENCIAS 1. Santano D, Esmaelli H. Aerial videography in built heritage documentation: The case of post-independence

architecture of Malaysia. International Conference on Virtual Systems & Multimedia (VSMM). Hong Kong, China, 2014. p. 323-328

2. Tianyu L, Yongzhe L, Juntong Q, Xiangdong M, Jiandal H. Modeling and controller design of hydraulic rotorcraft aerial manipulator. Proceedings of the 2015 27th Chinese Control and Decision Conference, CCDC 2015. Qingdao, China, 2015. p. 5446-5452

3. Lin J, Tao H, Wang Y, Huang Z. Practical application of unmanned aerial vehicles for mountain hazards survey. 2010 18th International Conference on Geoinformatics. IEEE; 2010. p. 1–5.

4. Zang W, Lin J, Wang Y, Tao H. Investigating small-scale water pollution with UAV Remote Sensing Technology. World Automation Congress (WAC), 2012. 2012. p. 2–5.

5. Lara D, Sanchez A, Lozano R, Castillo P. Real-time embedded control system for VTOL aircrafts: Application to stabilize a quad-rotor helicopter. 2006 IEEE Conference on Computer Aided Control System Design. IEEE; 2006. p. 2553–2558.

6. Ataka A, Tnunay H, Inovan R, Abdurrohman M, Preastianto H, Cahyadi A,. Controllability and observability analysis of the gain scheduling based linearization for UAV quadrotor. 2013 International Conference on Robotics, Biomimetics, Intelligent Computational Systems. IEEE; 2013. p. 212–218.

7. Navajas GHT, Raad JAP, Prada SR. Concurrent design optimization and control of a custom designed quadcopter. 2015 16th International Conference on Research and Education in Mechatronics (REM). IEEE; 2015. p. 63–72.

8. Castillo P, Lozano R, Dzul A. Stabilization of a mini-rotorcraft having four rotors. 2004 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE; p. 2693–2698.

9. Argentim L, Rezende W, Santos P, Aguiar R. PID, LQR and LQR-PID on a quadcopter platform. 2013 International Conference on Informatics, Electronics and Vision (ICIEV). IEEE; 2013. p. 1–6.

10. Suicmez EC, Kutay AT. Optimal path tracking control of a quadrotor UAV. In: 2014 International Conference on Unmanned Aircraft Systems (ICUAS). IEEE; 2014. p. 115–25.

11. Ali Q, Montenegro S. Explicit Model Following Distributed Control Scheme for Formation Flying of Mini UAVs. IEEE Access. 2016;4:397–406.

12. Quanser Consulting. LABORATORY GUIDE: 3 DOF Hover Experiment for MATLAB® /Simulink® Users. Ontario (Canada): Quanser Consulting; 2013.

48

Page 16: Aplicación de Técnicas de Control Óptimo a una plataforma ...scielo.sld.cu/pdf/eac/v37n3/eac04316.pdf · dichas técnicas de control óptimo a vehículos aéreos, obteniendo los

Gerson Beauchamp Báez, Rafael Batista RIELAC, Vol. XXXVII 3/2016 p. 34- 49 Septiembre - Diciembre ISSN: 1815-5928

13. Lewis FL, Vrabie DL, Syrmos VL. Optimal Control. Hoboken, NJ, USA: John Wiley & Sons, Inc.; 2012.

14. Dufour P, Flila S, Hammouri H. Observer Design for MIMO Non-Uniformly Observable Systems. IEEE Transactions on Automatic Control. 2012 Feb;57(2):511–6.

15. Hendrix CD, Veth MJ, Carr RW. LQG control design for a hovering micro air vehicle using an optical tracking system. 2009 IEEE Aerospace conference. IEEE; 2009. p. 1–14.

16. Imran RM, Akbar Hussain DM, Zhe Chen. LQG controller design for pitch regulated variable speed wind turbine. 2014 IEEE International Energy Conference (ENERGYCON). IEEE; 2014. p. 101–5.

17. Nand Kishor, Saini RP, Singh SP. LQG / LTR controller for speed governing of hydro-turbine. Proceedings of the 12th IEEE Mediterranean Electrotechnical Conference. IEEE; 2004. p. 1125–1128 Vol.3.

18. Zarei J, Montazeri A, Reza Jahed Motlagh M, Poshtan J. Design and comparison of LQG/LTR and H∞ controllers for a VSTOL flight control system. Journal of the Franklin Institute. 2007 Aug;344(5):577–94.

19. Doyle J, Stein G. Multivariable feedback design: Concepts for a classical/modern synthesis. IEEE Transactions on Automatic Control. 1981 Feb;26(1):4–16.

20. Chen BM, Saberi A, Sannuti P. A new stable compensator design for exact and approximate loop transfer recovery. Automatica. 1991;27(2):257–80.

AUTORES Gerson Beauchamp Báez recibió su grado en Ciencias de Ingeniería Eléctrica del Recinto Universitario de Mayagüez (RUM) de la Universidad de Puerto Rico (UPR) con Altos Honores (Magna Cum Laude) en el 1984. El Dr. Beauchamp recibió su grado de Maestría en Ciencias de Ingeniería Eléctrica en el 1985 y su grado doctor en el 1990, ambos grados del Georgia Institute of Technology. Desde enero de 1990 el Dr. Beauchamp se desempeña como catedrático del Departamento de Ingeniería Eléctrica del RUM de la UPR. Correo electrónico: [email protected].

Rafael Batista recibió su grado de Ingeniería Electrónica por parte de la Universidad Católica Madre y Maestra (PUCMM) en Santiago, República Dominicana en el 2011. Desde el 2015 se encuentra cursando estudios de maestria en el Recinto Universitario de Mayagüez de la Universidad de Puerto Rico (UPRM). Ha formado parte de distintos grupos de investigación,y en estos momentos cumple la función de encargado del laboratorio de instrumentación y control de procesos de UPRM. Ha tenido experiencia desarrollando temas de investigación en el área de control automático y de electrónica de potencia. Correo electrónico: [email protected].

49