Tarea 5 Parte 1 - LQR Permanente - Requez

download Tarea 5 Parte 1 - LQR Permanente - Requez

of 8

description

tarea5

Transcript of Tarea 5 Parte 1 - LQR Permanente - Requez

  • Efectos de los parmetros de optimizacin sobre un problema de Regulador ptimo Cuadrtico en tiempo

    continuo en Rgimen Permanente JUAN PABLO REQUEZ VIVAS

    [email protected]

    1 OBJETIVO

    Se desea resolver, a travs de la implementacin en Matlab, el problema de regulador ptimo

    cuadrtico en tiempo continuo en rgimen permanente y observar el efecto de la variacin de la

    penalizacin asociada a X1, X2 y U en la funcional de costo sobre la ruta ptima de los estados y la

    entrada.

    2 PROBLEMA DE MINIMIZACIN

    El problema de minimizacin que se describe en este documento es el siguiente

    minu

    ()() + ()()

    0

    Sujeto a

    = +

    (0) = [12

    ]

    = [0 12 1

    ] , = [01

    ] , = [1 00 2

    ] , = 1

    3 SOLUCIN DEL PROBLEMA LQR CONTINUO EN RGIMEN PERMANENTE

    La solucin del problema de control LQR en rqimen permanente requiere calcular P que satisface

    0 = + 1 + (1)

    Y esta solucin permite calcular la matriz de realimentacin del vector de estados, dada por

    = 1 (2)

    De forma que

  • () = () (3)

    Los multiplicadores de lagrange [1] del problema de minimizacin pueden calcularse como

    () = () (4)

    4 CDIGO IMPLEMENTADO

    Para la resolucin se utiliza la funcin de Matlab lqr. Esta funcin utiliza la resolucin de la ecuacin

    de Ricatti de horizonte infinito. Este cdigo fue implementado en dos etapas: la primera a travs de

    una funcin que ejecuta directamente la resolucin del problema de LQR continuo en rgimen

    permanente, y luego fue escrito un script que ejecuta la funcin para cambios en los parmetros del

    problema descrito en la seccin anterior

    4.1 CDIGO DE LA FUNCIN function [t,x,u,lambda]=lqr_cont_perm(A,B,x0,Q,R)

    [K,P,autovalores]=lqr(A,B,Q,R);

    Ac=A-B*K; Cc=eye(size(A));

    sys=ss(Ac,[],Cc,[]);

    [y,t,x]=initial(sys,x0,10);

    u=(-K*x')';

    lambda=(P*x')';

    4.2 CDIGO DEL DOCUMENTO DE INSTRUCCIONES PARA LA EJECUCIN DEL PROBLEMA (SCRIPT) %Lqr continuo rgimen permanente %A: Matriz de estados %B: Matriz de entrada %Q: Matriz de optimizacin de x %R: Matriz de optimizacin de U %x(0):condicin inicial

    %Datos de entrada A=[0 1;2 -1]; B=[0; 1]; x0=[-1 2]';

  • %% casos 1 2 y 3 R=1; Q=[1 0;0 0.2]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);

    R=1; Q=[1 0;0 2]; [t2,x2,u2,lambda2]=lqr_cont_perm(A,B,x0,Q,R);

    R=1; Q=[1 0;0 20]; [t3,x3,u3,lambda3]=lqr_cont_perm(A,B,x0,Q,R);

    figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 1','caso 2','caso 3') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 1','caso 2','caso 3') ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 1','caso 2','caso 3') ylabel('u') xlabel('t')

    figure subplot(2,1,1) plot(t1,lambda1(:,1),'k',t2,lambda2(:,1),'k.-',t3,lambda3(:,1),'k-.') legend('caso 1','caso 2','caso 3') ylabel('Lambda1') xlabel('t') subplot(2,1,2) plot(t1,lambda1(:,2),'k',t2,lambda2(:,2),'k.-',t3,lambda3(:,2),'k-.') legend('caso 1','caso 2','caso 3') ylabel('Lambda2') xlabel('t')

    %% casos 4 5 y 6 R=1; Q=[0.1 0;0 2]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);

    R=1; Q=[1 0;0 2]; [t2,x2,u2,lambda2]=lqr_cont_perm(A,B,x0,Q,R);

    R=1; Q=[10 0;0 2];

  • [t3,x3,u3,lambda3]=lqr_cont_perm(A,B,x0,Q,R);

    figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 4','caso 5','caso 6') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 4','caso 5','caso 6') ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 4','caso 5','caso 6') ylabel('u') xlabel('t')

    figure subplot(2,1,1) plot(t1,lambda1(:,1),'k',t2,lambda2(:,1),'k.-',t3,lambda3(:,1),'k-.') legend('caso 4','caso 5','caso 6') ylabel('Lambda1') xlabel('t') subplot(2,1,2) plot(t1,lambda1(:,2),'k',t2,lambda2(:,2),'k.-',t3,lambda3(:,2),'k-.') legend('caso 4','caso 5','caso 6') ylabel('Lambda2') xlabel('t')

    %% casos 7 8 y 9 R=1; Q=[1 0;0 1]; [t1,x1,u1,lambda1]=lqr_cont_perm(A,B,x0,Q,R);

    R=10; Q=[1 0;0 1]; [t2,x2,u2,lambda2]=lqr_cont_perm(A,B,x0,Q,R);

    R=100; Q=[1 0;0 1]; [t3,x3,u3,lambda3]=lqr_cont_perm(A,B,x0,Q,R);

    figure subplot(3,1,1) plot(t1,x1(:,1),'k',t2,x2(:,1),'k.-',t3,x3(:,1),'k--') legend('caso 7','caso 8','caso 9') ylabel('x1') xlabel('t') subplot(3,1,2) plot(t1,x1(:,2),'k',t2,x2(:,2),'k.-',t3,x3(:,2),'k--') legend('caso 7','caso 8','caso 9')

  • ylabel('x2') xlabel('t') subplot(3,1,3) plot(t1,u1,'k',t2,u2,'k.-',t3,u3,'k--') legend('caso 7','caso 8','caso 9') ylabel('u') xlabel('t')

    figure subplot(2,1,1) plot(t1,lambda1(:,1),'k',t2,lambda2(:,1),'k.-',t3,lambda3(:,1),'k-.') legend('caso 7','caso 8','caso 9') ylabel('Lambda1') xlabel('t') subplot(2,1,2) plot(t1,lambda1(:,2),'k',t2,lambda2(:,2),'k.-',t3,lambda3(:,2),'k-.') legend('caso 7','caso 8','caso 9') ylabel('Lambda2') xlabel('t')

    5 RESULTADOS

    5.1 CAMBIOS EN LA PENALIZACIN DE X2 El diseo de control LQR continuo en rgimen permanente fue implementado para cambios en el

    valor del coeficiente de Q que afecta directamente a X2, que fue incrementado y disminuido 10

    veces a partir del valor original, que era 2. Luego, se tienen tres casos, como se muestran en la Tabla

    1.

    Tabla 1: Casos para los cambios de la penalizacin de X2

    Caso 1 = [1 00 0.2

    ] , = 1

    Caso 2 (condiciones propuestas del problema)

    = [1 00 2

    ] , = 1

    Caso 3 = [1 00 20

    ] , = 1

    Se puede observar en la Fig. 1a que a medida que se incrementa la penalizacin asociada a X2, mas

    rpido se acerca esta variable a su valor final de cero, a expensas de X1 que requiere mas tiempo

    para estabilizarse. Para los casos 1 y 2 hay poca diferenciacin aunque puede observarse que U tiene

    un rango de valores mayores para lograr este objetivo, dicho de otra forma, a medida que se

    incrementa la penalizacin asociada a X2, los valores de U permitidos tambin se incrementan. La

    evolucin de los multiplicadores de lagrange asociados para cada caso se muestran en la Fig. 1b, y

    es notable que, a medida que la penalizacin para X2 es mayor, el rango de valores de estos trminos

    se hace ms grande en su evolucin temporal. Esto parece mostrar que a medida que se incrementa

    la importancia asociada a X2, el sistema tiende a estabilizar estas variables a expensas de los dems

    estados involucrados.

  • (a) (b)

    Fig. 1. Respuesta del sistema de control para cambios de la penalizacin de X2. (a) Para X1, X2 y U.

    (b) Para los parmetros 1 y 2.

    5.2 CAMBIOS EN LA PENALIZACIN DE X1 Para cambios en el parmetro de la matriz Q que penaliza a X1, se proponen tres casos como se

    muestran en la Tabla 2. Estos cambios corresponden a un incremento y una disminucin del

    coeficiente de penalizacin por un factor de 10.

    Tabla 2: Casos para los cambios de la penalizacin de X1

    Caso 4 = [0.1 00 2

    ] , = 1

    Caso 5 (condiciones propuestas del problema)

    = [1 00 2

    ] , = 1

    Caso 6 = [10 00 2

    ] , = 1

    Las observaciones en este caso se muestran en la Fig. 2. Para cambios en la penalizacin asociada a

    X1 hay muy poca diferenciacin entre la trayectoria de los estados para este rango propuesto. A

    pesar de ello, es posible observar que para incrementos den el valor asociado a la penalizacin de

    X1 la entrada se acerca ms rpidamente al valor final en la Fig. 2a. Esto se debe a que la entrada

    afecta directamente al estado 2 en la descripcin de espacio de estados del proceso, y solamente el

    estado 2 afecta a la evolucin del estado 1, lo que necesariamente implica que llevando a X2 hasta

    cero se puede estabilizar a X1. En anlisis de los multiplicadores de Lagrange puede hacer observar

    cuanto esfuerzo se est asignando a estabilizar a cada variable. A medida que se incrementa la

    penalizacin asociada a X1, mayor ms rpido el valor de se acerca al valor 0, sin embargo un mayor

    rango de valores son permitidos para su evolucin temporal, y menor se hace la importancia de X2

    que se observa en la disminucin de 2 asociado a esta variable y la disminucin progresiva de su

    rango de valores permitidos como se puede observar en la Fig. 2b.

    0 1 2 3 4 5 6 7 8 9 10-1

    -0.5

    0

    0.5

    t

    x1

    caso 1

    caso 2

    caso 3

    0 1 2 3 4 5 6 7 8 9 10-1

    0

    1

    2

    t

    x2

    caso 1

    caso 2

    caso 3

    0 1 2 3 4 5 6 7 8 9 10-6

    -4

    -2

    0

    2

    t

    u

    caso 1

    caso 2

    caso 3

    0 1 2 3 4 5 6 7 8 9 10-8

    -6

    -4

    -2

    0

    2

    t

    Lam

    bda1

    caso 1

    caso 2

    caso 3

    0 1 2 3 4 5 6 7 8 9 10-1

    0

    1

    2

    3

    4

    5

    t

    Lam

    bda2

    caso 1

    caso 2

    caso 3

  • (a) (b)

    Fig. 2. Respuesta del sistema de control para cambios de la penalizacin de X1. (a) Para X1, X2 y U.

    (b) Para los parmetros 1 y 2

    5.3 CAMBIOS EN LA PENALIZACIN DE U Ahora, para observar el impacto de los cambios de la penalizacin asociada a la entrada U, se

    proponen los parmetros de la funcional de costo mostrados en la Tabla 3. Obsrvese que la

    penalizacin asociada a X1 y X2 fue igualada a 1, y los cambios de R son en incrementos en 10

    unidades, de forma geomtrica.

    Tabla 3: Casos para los cambios de la penalizacin de U

    Caso 7 = [1 00 1

    ] , = 1

    Caso 8 = [1 00 1

    ] , = 10

    Caso 9 = [1 00 1

    ] , = 100

    Los resultados de la simulacin se pueden observar en la Fig. 3. La evolucin de los estados es muy

    similar para los tres casos propuestos, aunque puede observarse que a medida que se incrementa

    R, ms tiempo requieren los estados para estabilizarse. Respecto a U, puede verse que aunque el

    efecto final sobre los estados es muy similar, un incremento de la penalizacin conduce a una

    disminucin de los valores permitidos de U en su evolucin temporal. Los multiplicadores

    muestran que la importancia asociada a X1 y X2 es indistinguible para cada caso, mostrando que el

    factor R tiene poco impacto sobre la solucin del problema de minimizacin.

    0 1 2 3 4 5 6 7 8 9 10-1

    -0.5

    0

    0.5

    t

    x1

    caso 4

    caso 5

    caso 6

    0 1 2 3 4 5 6 7 8 9 10-0.5

    0

    0.5

    1

    1.5

    2

    t

    x2

    caso 4

    caso 5

    caso 6

    0 1 2 3 4 5 6 7 8 9 10-0.8

    -0.6

    -0.4

    -0.2

    0

    0.2

    t

    u

    caso 4

    caso 5

    caso 6

    0 1 2 3 4 5 6 7 8 9 10-5

    -4

    -3

    -2

    -1

    0

    1

    t

    Lam

    bda1

    caso 4

    caso 5

    caso 6

    0 1 2 3 4 5 6 7 8 9 10-0.2

    -0.1

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    t

    Lam

    bda2

    caso 4

    caso 5

    caso 6

  • (a) (b)

    Fig. 3. Respuesta del sistema de control para cambios de la penalizacin de U. (a) Para X1, X2 y U.

    (b) Para los parmetros 1 y 2

    6 CONCLUSIONES

    El diseo de controladores LQR en tiempo continuo en rgimen permanente establece una

    estrategia de control de realimentacin de estados que minimiza la energa asociada a la entrada y

    a los estados de acuerdo a las necesidades del problema, en particular un incremento de la

    penalizacin asociada a la energa de una variable conduce a una estabilizacin ms rpida y a

    menores desviaciones de ella respecto al valor cero a expensa de la energa asociada a las dems

    variables involucradas.

    7 REFERENCIAS

    [1] D. S. Naidu, Optimal Control Systems, CRC Press LLC, 2003.

    0 1 2 3 4 5 6 7 8 9 10-1

    -0.8

    -0.6

    -0.4

    -0.2

    0

    t

    x1

    caso 7

    caso 8

    caso 9

    0 1 2 3 4 5 6 7 8 9 100

    0.5

    1

    1.5

    2

    t

    x2

    caso 7

    caso 8

    caso 9

    0 1 2 3 4 5 6 7 8 9 10-0.3

    -0.2

    -0.1

    0

    0.1

    t

    u

    caso 7

    caso 8

    caso 9

    0 1 2 3 4 5 6 7 8 9 10-0.8

    -0.7

    -0.6

    -0.5

    -0.4

    -0.3

    -0.2

    -0.1

    0

    t

    Lam

    bda1

    caso 7

    caso 8

    caso 9

    0 1 2 3 4 5 6 7 8 9 10-0.1

    -0.05

    0

    0.05

    0.1

    0.15

    0.2

    0.25

    t

    Lam

    bda2

    caso 7

    caso 8

    caso 9