Tarea 5 Parte 1 - LQR Permanente - Requez

Efectos de los parmetros de optimizacin sobre un problema de Regulador ptimo Cuadrtico en tiempo

continuo en Rgimen Permanente JUAN PABLO REQUEZ VIVAS

[email protected]

1 OBJETIVO

Se desea resolver, a travs de la implementacin en Matlab, el problema de regulador ptimo

cuadrtico en tiempo continuo en rgimen permanente y observar el efecto de la variacin de la

penalizacin asociada a X1, X2 y U en la funcional de costo sobre la ruta ptima de los estados y la

entrada.

2 PROBLEMA DE MINIMIZACIN

El problema de minimizacin que se describe en este documento es el siguiente

minu

()() + ()()

0

Sujeto a

= +

(0) = [12

]

= [0 12 1

] , = [01

] , = [1 00 2

] , = 1

3 SOLUCIN DEL PROBLEMA LQR CONTINUO EN RGIMEN PERMANENTE

La solucin del problema de control LQR en rqimen permanente requiere calcular P que satisface

0 = + 1 + (1)

Y esta solucin permite calcular la matriz de realimentacin del vector de estados, dada por

= 1 (2)

De forma que

() = () (3)

Los multiplicadores de lagrange [1] del problema de minimizacin pueden calcularse como

() = () (4)

4 CDIGO IMPLEMENTADO

Para la resolucin se utiliza la funcin de Matlab lqr. Esta funcin utiliza la resolucin de la ecuacin

de Ricatti de horizonte infinito. Este cdigo fue implementado en dos etapas: la primera a travs de

una funcin que ejecuta directamente la resolucin del problema de LQR continuo en rgimen

permanente, y luego fue escrito un script que ejecuta la funcin para cambios en los parmetros del

problema descrito en la seccin anterior

4.1 CDIGO DE LA FUNCIN function [t,x,u,lambda]=lqr_cont_perm(A,B,x0,Q,R)

[K,P,autovalores]=lqr(A,B,Q,R);

Ac=A-B*K; Cc=eye(size(A));

sys=ss(Ac,[],Cc,[]);

[y,t,x]=initial(sys,x0,10);

u=(-K*x')';

lambda=(P*x')';

4.2 CDIGO DEL DOCUMENTO DE INSTRUCCIONES PARA LA EJECUCIN DEL PROBLEMA (SCRIPT) %Lqr continuo rgimen permanente %A: Matriz de estados %B: Matriz de entrada %Q: Matriz de optimizacin de x %R: Matriz de optimizacin de U %x(0):condicin inicial

%Datos de entrada A=[0 1;2 -1]; B=[0; 1]; x0=[-1 2]';

%% casos 1 2 y 3 R=1; Q=[1 0;0 0.2]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);

R=1; Q=[1 0;0 2]; [t2,x2,u2,lambda2]=lqr_cont_perm(A,B,x0,Q,R);


figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 1','caso 2','caso 3') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 1','caso 2','caso 3') ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 1','caso 2','caso 3') ylabel('u') xlabel('t')

figure subplot(2,1,1) plot(t1,lambda1(:,1),'k',t2,lambda2(:,1),'k.-',t3,lambda3(:,1),'k-.') legend('caso 1','caso 2','caso 3') ylabel('Lambda1') xlabel('t') subplot(2,1,2) plot(t1,lambda1(:,2),'k',t2,lambda2(:,2),'k.-',t3,lambda3(:,2),'k-.') legend('caso 1','caso 2','caso 3') ylabel('Lambda2') xlabel('t')

%% casos 4 5 y 6 R=1; Q=[0.1 0;0 2]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);


R=1; Q=[10 0;0 2];

[t3,x3,u3,lambda3]=lqr_cont_perm(A,B,x0,Q,R);

figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 4','caso 5','caso 6') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 4','caso 5','caso 6') ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 4','caso 5','caso 6') ylabel('u') xlabel('t')


%% casos 7 8 y 9 R=1; Q=[1 0;0 1]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);



figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 7','caso 8','caso 9') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 7','caso 8','caso 9')

ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 7','caso 8','caso 9') ylabel('u') xlabel('t')


5 RESULTADOS

5.1 CAMBIOS EN LA PENALIZACIN DE X2 El diseo de control LQR continuo en rgimen permanente fue implementado para cambios en el

valor del coeficiente de Q que afecta directamente a X2, que fue incrementado y disminuido 10

veces a partir del valor original, que era 2. Luego, se tienen tres casos, como se muestran en la Tabla

1.

Tabla 1: Casos para los cambios de la penalizacin de X2

Caso 1 = [1 00 0.2

] , = 1

Caso 2 (condiciones propuestas del problema)

= [1 00 2

] , = 1

Caso 3 = [1 00 20

] , = 1

Se puede observar en la Fig. 1a que a medida que se incrementa la penalizacin asociada a X2, mas

rpido se acerca esta variable a su valor final de cero, a expensas de X1 que requiere mas tiempo

para estabilizarse. Para los casos 1 y 2 hay poca diferenciacin aunque puede observarse que U tiene

un rango de valores mayores para lograr este objetivo, dicho de otra forma, a medida que se

incrementa la penalizacin asociada a X2, los valores de U permitidos tambin se incrementan. La

evolucin de los multiplicadores de lagrange asociados para cada caso se muestran en la Fig. 1b, y

es notable que, a medida que la penalizacin para X2 es mayor, el rango de valores de estos trminos

se hace ms grande en su evolucin temporal. Esto parece mostrar que a medida que se incrementa

la importancia asociada a X2, el sistema tiende a estabilizar estas variables a expensas de los dems

estados involucrados.

(a) (b)

Fig. 1. Respuesta del sistema de control para cambios de la penalizacin de X2. (a) Para X1, X2 y U.

(b) Para los parmetros 1 y 2.

5.2 CAMBIOS EN LA PENALIZACIN DE X1 Para cambios en el parmetro de la matriz Q que penaliza a X1, se proponen tres casos como se

muestran en la Tabla 2. Estos cambios corresponden a un incremento y una disminucin del

coeficiente de penalizacin por un factor de 10.

Tabla 2: Casos para los cambios de la penalizacin de X1

Caso 4 = [0.1 00 2

] , = 1

Caso 5 (condiciones propuestas del problema)

= [1 00 2

] , = 1

Caso 6 = [10 00 2

] , = 1

Las observaciones en este caso se muestran en la Fig. 2. Para cambios en la penalizacin asociada a

X1 hay muy poca diferenciacin entre la trayectoria de los estados para este rango propuesto. A

pesar de ello, es posible observar que para incrementos den el valor asociado a la penalizacin de

X1 la entrada se acerca ms rpidamente al valor final en la Fig. 2a. Esto se debe a que la entrada

afecta directamente al estado 2 en la descripcin de espacio de estados del proceso, y solamente el

estado 2 afecta a la evolucin del estado 1, lo que necesariamente implica que llevando a X2 hasta

cero se puede estabilizar a X1. En anlisis de los multiplicadores de Lagrange puede hacer observar

cuanto esfuerzo se est asignando a estabilizar a cada variable. A medida que se incrementa la

penalizacin asociada a X1, mayor ms rpido el valor de se acerca al valor 0, sin embargo un mayor

rango de valores son permitidos para su evolucin temporal, y menor se hace la importancia de X2

que se observa en la disminucin de 2 asociado a esta variable y la disminucin progresiva de su

rango de valores permitidos como se puede observar en la Fig. 2b.

0 1 2 3 4 5 6 7 8 9 10-1

-0.5

0

0.5

t

x1

caso 1

caso 2

caso 3

0 1 2 3 4 5 6 7 8 9 10-1

0

1

2

t

x2

caso 1

caso 2

caso 3

0 1 2 3 4 5 6 7 8 9 10-6

-4

-2

0

2

t

u

caso 1

caso 2

caso 3

0 1 2 3 4 5 6 7 8 9 10-8

-6

-4

-2

0

2

t

Lam

bda1

caso 1

caso 2

caso 3

0 1 2 3 4 5 6 7 8 9 10-1

0

1

2

3

4

5

t

Lam

bda2

caso 1

caso 2

caso 3

(a) (b)

Fig. 2. Respuesta del sistema de control para cambios de la penalizacin de X1. (a) Para X1, X2 y U.

(b) Para los parmetros 1 y 2

5.3 CAMBIOS EN LA PENALIZACIN DE U Ahora, para observar el impacto de los cambios de la penalizacin asociada a la entrada U, se

proponen los parmetros de la funcional de costo mostrados en la Tabla 3. Obsrvese que la

penalizacin asociada a X1 y X2 fue igualada a 1, y los cambios de R son en incrementos en 10

unidades, de forma geomtrica.

Tabla 3: Casos para los cambios de la penalizacin de U

Caso 7 = [1 00 1

] , = 1

Caso 8 = [1 00 1

] , = 10

Caso 9 = [1 00 1

] , = 100

Los resultados de la simulacin se pueden observar en la Fig. 3. La evolucin de los estados es muy

similar para los tres casos propuestos, aunque puede observarse que a medida que se incrementa

R, ms tiempo requieren los estados para estabilizarse. Respecto a U, puede verse que aunque el

efecto final sobre los estados es muy similar, un incremento de la penalizacin conduce a una

disminucin de los valores permitidos de U en su evolucin temporal. Los multiplicadores

muestran que la importancia asociada a X1 y X2 es indistinguible para cada caso, mostrando que el

factor R tiene poco impacto sobre la solucin del problema de minimizacin.

0 1 2 3 4 5 6 7 8 9 10-1

-0.5

0

0.5

t

x1

caso 4

caso 5

caso 6

0 1 2 3 4 5 6 7 8 9 10-0.5

0

0.5

1

1.5

2

t

x2

caso 4

caso 5

caso 6

0 1 2 3 4 5 6 7 8 9 10-0.8

-0.6

-0.4

-0.2

0

0.2

t

u

caso 4

caso 5

caso 6

0 1 2 3 4 5 6 7 8 9 10-5

-4

-3

-2

-1

0

1

t

Lam

bda1

caso 4

caso 5

caso 6

0 1 2 3 4 5 6 7 8 9 10-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

t

Lam

bda2

caso 4

caso 5

caso 6

(a) (b)

Fig. 3. Respuesta del sistema de control para cambios de la penalizacin de U. (a) Para X1, X2 y U.

(b) Para los parmetros 1 y 2

6 CONCLUSIONES

El diseo de controladores LQR en tiempo continuo en rgimen permanente establece una

estrategia de control de realimentacin de estados que minimiza la energa asociada a la entrada y

a los estados de acuerdo a las necesidades del problema, en particular un incremento de la

penalizacin asociada a la energa de una variable conduce a una estabilizacin ms rpida y a

menores desviaciones de ella respecto al valor cero a expensa de la energa asociada a las dems

variables involucradas.

7 REFERENCIAS

[1] D. S. Naidu, Optimal Control Systems, CRC Press LLC, 2003.

0 1 2 3 4 5 6 7 8 9 10-1

-0.8

-0.6

-0.4

-0.2

0

t

x1

caso 7

caso 8

caso 9

0 1 2 3 4 5 6 7 8 9 100

0.5

1

1.5

2

t

x2

caso 7

caso 8

caso 9

0 1 2 3 4 5 6 7 8 9 10-0.3

-0.2

-0.1

0

0.1

t

u

caso 7

caso 8

caso 9

0 1 2 3 4 5 6 7 8 9 10-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

-0.2

-0.1

0

t

Lam

bda1

caso 7

caso 8

caso 9

0 1 2 3 4 5 6 7 8 9 10-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

t

Lam

bda2

caso 7

caso 8

caso 9

Tarea 5 Parte 1 - LQR Permanente - Requez

Documents

Transcript of Tarea 5 Parte 1 - LQR Permanente - Requez