Tarea 5 Parte 1 - LQR Permanente - Requez
-
Upload
gustavo-sanchez -
Category
Documents
-
view
216 -
download
0
description
Transcript of Tarea 5 Parte 1 - LQR Permanente - Requez
-
Efectos de los parmetros de optimizacin sobre un problema de Regulador ptimo Cuadrtico en tiempo
continuo en Rgimen Permanente JUAN PABLO REQUEZ VIVAS
1 OBJETIVO
Se desea resolver, a travs de la implementacin en Matlab, el problema de regulador ptimo
cuadrtico en tiempo continuo en rgimen permanente y observar el efecto de la variacin de la
penalizacin asociada a X1, X2 y U en la funcional de costo sobre la ruta ptima de los estados y la
entrada.
2 PROBLEMA DE MINIMIZACIN
El problema de minimizacin que se describe en este documento es el siguiente
minu
()() + ()()
0
Sujeto a
= +
(0) = [12
]
= [0 12 1
] , = [01
] , = [1 00 2
] , = 1
3 SOLUCIN DEL PROBLEMA LQR CONTINUO EN RGIMEN PERMANENTE
La solucin del problema de control LQR en rqimen permanente requiere calcular P que satisface
0 = + 1 + (1)
Y esta solucin permite calcular la matriz de realimentacin del vector de estados, dada por
= 1 (2)
De forma que
-
() = () (3)
Los multiplicadores de lagrange [1] del problema de minimizacin pueden calcularse como
() = () (4)
4 CDIGO IMPLEMENTADO
Para la resolucin se utiliza la funcin de Matlab lqr. Esta funcin utiliza la resolucin de la ecuacin
de Ricatti de horizonte infinito. Este cdigo fue implementado en dos etapas: la primera a travs de
una funcin que ejecuta directamente la resolucin del problema de LQR continuo en rgimen
permanente, y luego fue escrito un script que ejecuta la funcin para cambios en los parmetros del
problema descrito en la seccin anterior
4.1 CDIGO DE LA FUNCIN function [t,x,u,lambda]=lqr_cont_perm(A,B,x0,Q,R)
[K,P,autovalores]=lqr(A,B,Q,R);
Ac=A-B*K; Cc=eye(size(A));
sys=ss(Ac,[],Cc,[]);
[y,t,x]=initial(sys,x0,10);
u=(-K*x')';
lambda=(P*x')';
4.2 CDIGO DEL DOCUMENTO DE INSTRUCCIONES PARA LA EJECUCIN DEL PROBLEMA (SCRIPT) %Lqr continuo rgimen permanente %A: Matriz de estados %B: Matriz de entrada %Q: Matriz de optimizacin de x %R: Matriz de optimizacin de U %x(0):condicin inicial
%Datos de entrada A=[0 1;2 -1]; B=[0; 1]; x0=[-1 2]';
-
%% casos 1 2 y 3 R=1; Q=[1 0;0 0.2]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);
R=1; Q=[1 0;0 2]; [t2,x2,u2,lambda2]=lqr_cont_perm(A,B,x0,Q,R);
R=1; Q=[1 0;0 20]; [t3,x3,u3,lambda3]=lqr_cont_perm(A,B,x0,Q,R);
figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 1','caso 2','caso 3') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 1','caso 2','caso 3') ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 1','caso 2','caso 3') ylabel('u') xlabel('t')
figure subplot(2,1,1) plot(t1,lambda1(:,1),'k',t2,lambda2(:,1),'k.-',t3,lambda3(:,1),'k-.') legend('caso 1','caso 2','caso 3') ylabel('Lambda1') xlabel('t') subplot(2,1,2) plot(t1,lambda1(:,2),'k',t2,lambda2(:,2),'k.-',t3,lambda3(:,2),'k-.') legend('caso 1','caso 2','caso 3') ylabel('Lambda2') xlabel('t')
%% casos 4 5 y 6 R=1; Q=[0.1 0;0 2]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);
R=1; Q=[1 0;0 2]; [t2,x2,u2,lambda2]=lqr_cont_perm(A,B,x0,Q,R);
R=1; Q=[10 0;0 2];
-
[t3,x3,u3,lambda3]=lqr_cont_perm(A,B,x0,Q,R);
figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 4','caso 5','caso 6') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 4','caso 5','caso 6') ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 4','caso 5','caso 6') ylabel('u') xlabel('t')
figure subplot(2,1,1) plot(t1,lambda1(:,1),'k',t2,lambda2(:,1),'k.-',t3,lambda3(:,1),'k-.') legend('caso 4','caso 5','caso 6') ylabel('Lambda1') xlabel('t') subplot(2,1,2) plot(t1,lambda1(:,2),'k',t2,lambda2(:,2),'k.-',t3,lambda3(:,2),'k-.') legend('caso 4','caso 5','caso 6') ylabel('Lambda2') xlabel('t')
%% casos 7 8 y 9 R=1; Q=[1 0;0 1]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);
R=10; Q=[1 0;0 1]; [t2,x2,u2,lambda2]=lqr_cont_perm(A,B,x0,Q,R);
R=100; Q=[1 0;0 1]; [t3,x3,u3,lambda3]=lqr_cont_perm(A,B,x0,Q,R);
figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 7','caso 8','caso 9') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 7','caso 8','caso 9')
-
ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 7','caso 8','caso 9') ylabel('u') xlabel('t')
figure subplot(2,1,1) plot(t1,lambda1(:,1),'k',t2,lambda2(:,1),'k.-',t3,lambda3(:,1),'k-.') legend('caso 7','caso 8','caso 9') ylabel('Lambda1') xlabel('t') subplot(2,1,2) plot(t1,lambda1(:,2),'k',t2,lambda2(:,2),'k.-',t3,lambda3(:,2),'k-.') legend('caso 7','caso 8','caso 9') ylabel('Lambda2') xlabel('t')
5 RESULTADOS
5.1 CAMBIOS EN LA PENALIZACIN DE X2 El diseo de control LQR continuo en rgimen permanente fue implementado para cambios en el
valor del coeficiente de Q que afecta directamente a X2, que fue incrementado y disminuido 10
veces a partir del valor original, que era 2. Luego, se tienen tres casos, como se muestran en la Tabla
1.
Tabla 1: Casos para los cambios de la penalizacin de X2
Caso 1 = [1 00 0.2
] , = 1
Caso 2 (condiciones propuestas del problema)
= [1 00 2
] , = 1
Caso 3 = [1 00 20
] , = 1
Se puede observar en la Fig. 1a que a medida que se incrementa la penalizacin asociada a X2, mas
rpido se acerca esta variable a su valor final de cero, a expensas de X1 que requiere mas tiempo
para estabilizarse. Para los casos 1 y 2 hay poca diferenciacin aunque puede observarse que U tiene
un rango de valores mayores para lograr este objetivo, dicho de otra forma, a medida que se
incrementa la penalizacin asociada a X2, los valores de U permitidos tambin se incrementan. La
evolucin de los multiplicadores de lagrange asociados para cada caso se muestran en la Fig. 1b, y
es notable que, a medida que la penalizacin para X2 es mayor, el rango de valores de estos trminos
se hace ms grande en su evolucin temporal. Esto parece mostrar que a medida que se incrementa
la importancia asociada a X2, el sistema tiende a estabilizar estas variables a expensas de los dems
estados involucrados.
-
(a) (b)
Fig. 1. Respuesta del sistema de control para cambios de la penalizacin de X2. (a) Para X1, X2 y U.
(b) Para los parmetros 1 y 2.
5.2 CAMBIOS EN LA PENALIZACIN DE X1 Para cambios en el parmetro de la matriz Q que penaliza a X1, se proponen tres casos como se
muestran en la Tabla 2. Estos cambios corresponden a un incremento y una disminucin del
coeficiente de penalizacin por un factor de 10.
Tabla 2: Casos para los cambios de la penalizacin de X1
Caso 4 = [0.1 00 2
] , = 1
Caso 5 (condiciones propuestas del problema)
= [1 00 2
] , = 1
Caso 6 = [10 00 2
] , = 1
Las observaciones en este caso se muestran en la Fig. 2. Para cambios en la penalizacin asociada a
X1 hay muy poca diferenciacin entre la trayectoria de los estados para este rango propuesto. A
pesar de ello, es posible observar que para incrementos den el valor asociado a la penalizacin de
X1 la entrada se acerca ms rpidamente al valor final en la Fig. 2a. Esto se debe a que la entrada
afecta directamente al estado 2 en la descripcin de espacio de estados del proceso, y solamente el
estado 2 afecta a la evolucin del estado 1, lo que necesariamente implica que llevando a X2 hasta
cero se puede estabilizar a X1. En anlisis de los multiplicadores de Lagrange puede hacer observar
cuanto esfuerzo se est asignando a estabilizar a cada variable. A medida que se incrementa la
penalizacin asociada a X1, mayor ms rpido el valor de se acerca al valor 0, sin embargo un mayor
rango de valores son permitidos para su evolucin temporal, y menor se hace la importancia de X2
que se observa en la disminucin de 2 asociado a esta variable y la disminucin progresiva de su
rango de valores permitidos como se puede observar en la Fig. 2b.
0 1 2 3 4 5 6 7 8 9 10-1
-0.5
0
0.5
t
x1
caso 1
caso 2
caso 3
0 1 2 3 4 5 6 7 8 9 10-1
0
1
2
t
x2
caso 1
caso 2
caso 3
0 1 2 3 4 5 6 7 8 9 10-6
-4
-2
0
2
t
u
caso 1
caso 2
caso 3
0 1 2 3 4 5 6 7 8 9 10-8
-6
-4
-2
0
2
t
Lam
bda1
caso 1
caso 2
caso 3
0 1 2 3 4 5 6 7 8 9 10-1
0
1
2
3
4
5
t
Lam
bda2
caso 1
caso 2
caso 3
-
(a) (b)
Fig. 2. Respuesta del sistema de control para cambios de la penalizacin de X1. (a) Para X1, X2 y U.
(b) Para los parmetros 1 y 2
5.3 CAMBIOS EN LA PENALIZACIN DE U Ahora, para observar el impacto de los cambios de la penalizacin asociada a la entrada U, se
proponen los parmetros de la funcional de costo mostrados en la Tabla 3. Obsrvese que la
penalizacin asociada a X1 y X2 fue igualada a 1, y los cambios de R son en incrementos en 10
unidades, de forma geomtrica.
Tabla 3: Casos para los cambios de la penalizacin de U
Caso 7 = [1 00 1
] , = 1
Caso 8 = [1 00 1
] , = 10
Caso 9 = [1 00 1
] , = 100
Los resultados de la simulacin se pueden observar en la Fig. 3. La evolucin de los estados es muy
similar para los tres casos propuestos, aunque puede observarse que a medida que se incrementa
R, ms tiempo requieren los estados para estabilizarse. Respecto a U, puede verse que aunque el
efecto final sobre los estados es muy similar, un incremento de la penalizacin conduce a una
disminucin de los valores permitidos de U en su evolucin temporal. Los multiplicadores
muestran que la importancia asociada a X1 y X2 es indistinguible para cada caso, mostrando que el
factor R tiene poco impacto sobre la solucin del problema de minimizacin.
0 1 2 3 4 5 6 7 8 9 10-1
-0.5
0
0.5
t
x1
caso 4
caso 5
caso 6
0 1 2 3 4 5 6 7 8 9 10-0.5
0
0.5
1
1.5
2
t
x2
caso 4
caso 5
caso 6
0 1 2 3 4 5 6 7 8 9 10-0.8
-0.6
-0.4
-0.2
0
0.2
t
u
caso 4
caso 5
caso 6
0 1 2 3 4 5 6 7 8 9 10-5
-4
-3
-2
-1
0
1
t
Lam
bda1
caso 4
caso 5
caso 6
0 1 2 3 4 5 6 7 8 9 10-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
t
Lam
bda2
caso 4
caso 5
caso 6
-
(a) (b)
Fig. 3. Respuesta del sistema de control para cambios de la penalizacin de U. (a) Para X1, X2 y U.
(b) Para los parmetros 1 y 2
6 CONCLUSIONES
El diseo de controladores LQR en tiempo continuo en rgimen permanente establece una
estrategia de control de realimentacin de estados que minimiza la energa asociada a la entrada y
a los estados de acuerdo a las necesidades del problema, en particular un incremento de la
penalizacin asociada a la energa de una variable conduce a una estabilizacin ms rpida y a
menores desviaciones de ella respecto al valor cero a expensa de la energa asociada a las dems
variables involucradas.
7 REFERENCIAS
[1] D. S. Naidu, Optimal Control Systems, CRC Press LLC, 2003.
0 1 2 3 4 5 6 7 8 9 10-1
-0.8
-0.6
-0.4
-0.2
0
t
x1
caso 7
caso 8
caso 9
0 1 2 3 4 5 6 7 8 9 100
0.5
1
1.5
2
t
x2
caso 7
caso 8
caso 9
0 1 2 3 4 5 6 7 8 9 10-0.3
-0.2
-0.1
0
0.1
t
u
caso 7
caso 8
caso 9
0 1 2 3 4 5 6 7 8 9 10-0.8
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2
-0.1
0
t
Lam
bda1
caso 7
caso 8
caso 9
0 1 2 3 4 5 6 7 8 9 10-0.1
-0.05
0
0.05
0.1
0.15
0.2
0.25
t
Lam
bda2
caso 7
caso 8
caso 9