TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on...

317
TESIS DOCTORAL Control predictivo de sistemas no lineales con restricciones: estabilidad y robustez Daniel Lim´on Marruedo Sevilla, Septiembre de 2002

Transcript of TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on...

Page 1: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

TESIS DOCTORAL

Control predictivo de sistemasno lineales con restricciones:

estabilidad y robustez

Daniel Limon Marruedo

Sevilla, Septiembre de 2002

Page 2: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k
Page 3: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

TESIS DOCTORAL

Control predictivo de sistemasno lineales con restricciones:

estabilidad y robustez

por

Daniel Limon Marruedo

Ingeniero Industrial por la Escuela Superior de Ingenieros

de la Universidad de Sevilla

Presentada en la

Escuela Superior de Ingenieros

de la

Universidad de Sevilla

para la obtencion del

Grado de Doctor Ingeniero Industrial

Sevilla, Septiembre de 2002

Page 4: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k
Page 5: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

TESIS DOCTORAL

Control predictivo de sistemasno lineales con restricciones:

estabilidad y robustez

Autor: Daniel Limon Marruedo

Directores: Teodoro Alamo Cantarero

Eduardo Fernandez Camacho

Page 6: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k
Page 7: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Indice general

Notacion 1

1. Introduccion 3

1.1. Introduccion al control predictivo . . . . . . . . . . . . . . . . . . . . . 3

1.1.1. Formulacion del control predictivo . . . . . . . . . . . . . . . . . 4

1.1.2. Ventajas e inconvenientes del MPC . . . . . . . . . . . . . . . . 6

1.2. Motivacion de la investigacion . . . . . . . . . . . . . . . . . . . . . . . 8

1.3. Objetivos y estructura de la tesis . . . . . . . . . . . . . . . . . . . . . 8

2. Estabilidad y robustez del control predictivo basado en modelo 13

2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2. Controladores predictivos en la industria. . . . . . . . . . . . . . . . . . 14

2.3. El problema de la estabilidad: optimalidad no implica estabilidad . . . 15

2.3.1. Un ejemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . . 19

2.4. Controladores predictivos con estabilidad garantizada . . . . . . . . . . 20

2.5. Formulacion general del MPC: necesidad de la region terminal y el costeterminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

i

Page 8: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

ii INDICE GENERAL

2.5.1. Un ejemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . . 26

2.6. Robustez de los controladores MPC . . . . . . . . . . . . . . . . . . . . 28

2.6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.6.2. Analisis de robustez de los controladores MPC . . . . . . . . . . 28

2.6.3. Formulaciones robustas del MPC . . . . . . . . . . . . . . . . . 30

2.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3. Nuevas formulaciones del MPC con estabilidad garantizada 35

3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.2. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.3. Formulacion general del MPC . . . . . . . . . . . . . . . . . . . . . . . 37

3.3.1. Condiciones suficientes de estabilidad . . . . . . . . . . . . . . . 39

3.3.2. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 44

3.4. MPC con horizonte de prediccion mayor que el de control . . . . . . . . 45

3.4.1. Formulacion del controlador . . . . . . . . . . . . . . . . . . . . 47

3.4.2. Condiciones suficientes de estabilidad . . . . . . . . . . . . . . . 48

3.4.3. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 50

3.5. MPC con coste terminal cuasi-infinito . . . . . . . . . . . . . . . . . . . 52

3.5.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 57

3.6. El MPC como controlador optimo cuasi-infinito . . . . . . . . . . . . . 58

3.6.1. El MPC general como controlador con horizonte cuasi-infinito . 60

Page 9: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

INDICE GENERAL iii

3.6.2. Influencia de los horizontes en el coste optimo del MPC . . . . . 61

3.6.3. El MPC como aproximacion al controlador con horizonte infinito 62

3.6.4. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 65

3.7. Calculo de la region terminal . . . . . . . . . . . . . . . . . . . . . . . . 67

3.7.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 70

3.8. Analisis de estabilidad del MPC suboptimo . . . . . . . . . . . . . . . . 72

3.8.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 76

3.9. Eliminacion de la restriccion terminal . . . . . . . . . . . . . . . . . . . 77

3.9.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 85

3.10. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

4. Aumento del dominio de atraccion del MPC 89

4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4.2. El dominio de atraccion del MPC . . . . . . . . . . . . . . . . . . . . . 91

4.3. Aumento del dominio de atraccion mediante los horizontes . . . . . . . 93

4.3.1. Aumento mediante el horizonte de control . . . . . . . . . . . . 93

4.3.1.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 96

4.3.2. Aumento mediante el horizonte de prediccion . . . . . . . . . . 97

4.3.2.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 99

4.4. Aumento del dominio de atraccion mediante el coste terminal . . . . . 100

4.4.1. Incorporacion del coste terminal cuasi-infinito . . . . . . . . . . 100

Page 10: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

iv INDICE GENERAL

4.4.2. Aumento de la region terminal ponderando el coste terminal . . 102

4.4.2.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 103

4.5. Aumento del dominio de atraccion mediante la restriccion terminal . . 105

4.5.1. Aumento del dominio de atraccion mediante una region terminalcontractiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4.5.1.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 108

4.5.2. MPC con region terminal contractiva basada en invariantes decontrol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

4.5.2.1. Obtencion de una secuencia de invariantes de control . 110

4.5.2.2. MPC con restriccion terminal contractiva . . . . . . . 112

4.5.2.3. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 116

4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal . . 119

4.6.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 122

4.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

5. Analisis de robustez del MPC nominal 127

5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

5.2. Sistemas con incertidumbres aditivas . . . . . . . . . . . . . . . . . . . 129

5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas . . . . . 131

5.4. Aplicacion al analisis de robustez del MPC . . . . . . . . . . . . . . . . 138

5.4.1. Factibilidad robusta del MPC . . . . . . . . . . . . . . . . . . . 139

5.4.1.1. Invariancia robusta del dominio de atraccion . . . . . . 141

Page 11: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

INDICE GENERAL v

5.5. Estabilidad entrada a estado (ISS) del MPC . . . . . . . . . . . . . . . 143

5.5.1. Estabilidad entrada a estado . . . . . . . . . . . . . . . . . . . . 144

5.5.2. Aplicacion al MPC . . . . . . . . . . . . . . . . . . . . . . . . . 146

5.6. Suboptimalidad y robustez en el MPC . . . . . . . . . . . . . . . . . . 148

5.6.1. Estabilidad robusta del MPC suboptimo . . . . . . . . . . . . . 149

5.7. Robustez del controlador MPC sin restriccion terminal . . . . . . . . . 153

5.8. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . . . . . 155

5.9. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

6. MPC ISS con satisfaccion robusta de las restricciones 159

6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

6.2. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

6.3. Acotacion del efecto de las incertidumbres en la prediccion . . . . . . . 161

6.3.1. Acotacion basada en la continuidad Lipschitz . . . . . . . . . . 164

6.3.2. Reduccion del conservadurismo . . . . . . . . . . . . . . . . . . 164

6.4. Controlador MPC con estabilidad entrada a estado . . . . . . . . . . . 167

6.4.1. Determinacion de la region terminal . . . . . . . . . . . . . . . . 168

6.4.2. Formulacion del MPC . . . . . . . . . . . . . . . . . . . . . . . 170

6.4.3. Analisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . 171

6.5. Robustez de la formulacion con Np > Nc . . . . . . . . . . . . . . . . . 175

6.6. MPC robusto con restricciones en el estado . . . . . . . . . . . . . . . . 177

Page 12: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

vi INDICE GENERAL

6.6.1. Factibilidad del MPC basada en restricciones conservadoras . . 178

6.7. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . . . . . 182

6.8. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

7. MPC robusto basado en regiones de evolucion incierta 185

7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

7.2. Regiones de evolucion incierta . . . . . . . . . . . . . . . . . . . . . . . 186

7.2.1. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . 186

7.2.2. Notacion y definicion de operaciones sobre conjuntos . . . . . . 187

7.2.3. Regiones de evolucion incierta . . . . . . . . . . . . . . . . . . . 188

7.2.4. Un procedimiento de calculo basado en el algebra intervalar . . 192

7.3. Controlador MPC dual robusto . . . . . . . . . . . . . . . . . . . . . . 194

7.3.1. Analisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . 196

7.4. Controlador MPC robusto no dual . . . . . . . . . . . . . . . . . . . . 199

7.5. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . . . . . 203

7.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

8. MPC robusto basado en conjuntos invariantes robustos 209

8.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

8.2. MPC robusto en bucle cerrado . . . . . . . . . . . . . . . . . . . . . . . 210

8.2.1. Necesidad de controladores MPC en bucle cerrado . . . . . . . . 211

8.2.2. Formulacion del MPC robusto en bucle cerrado . . . . . . . . . 213

Page 13: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

INDICE GENERAL vii

8.3. Analisis de estabilidad del MPC robusto en bucle cerrado . . . . . . . . 214

8.3.1. Aproximacion desde la programacion dinamica . . . . . . . . . . 214

8.3.2. Estabilidad del MPC robusto en bucle cerrado con horizonte fijoe incertidumbres que decaen con el estado . . . . . . . . . . . . 216

8.3.3. Estabilidad del MPC robusto en bucle cerrado con horizonte fijoe incertidumbres acotadas . . . . . . . . . . . . . . . . . . . . . 219

8.4. Transformacion de la formulacion en bucle cerrado en restriccion esta-bilizante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

8.5. MPC robusto basado en conjuntos invariantes de control . . . . . . . . 223

8.5.1. Determinacion de una secuencia de invariantes de control robustos224

8.5.2. Formulacion del MPC robusto . . . . . . . . . . . . . . . . . . . 226

8.5.3. Analisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . 227

8.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

8.6.1. El sistema de Scokaert y Mayne . . . . . . . . . . . . . . . . . . 229

8.6.2. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 231

8.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

9. Conclusiones y futuras lıneas de investigacion 237

9.1. Conclusiones y aportaciones originales . . . . . . . . . . . . . . . . . . 237

9.2. Futuras lıneas de investigacion . . . . . . . . . . . . . . . . . . . . . . . 240

A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 243

A.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243

A.2. Estabilidad de sistemas no lineales en tiempo discreto . . . . . . . . . . 244

Page 14: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

viii INDICE GENERAL

A.2.1. Definiciones previas . . . . . . . . . . . . . . . . . . . . . . . . . 245

A.2.2. Estabilidad de un sistema . . . . . . . . . . . . . . . . . . . . . 247

A.2.3. Teorıa de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . 248

A.2.4. Estabilidad de sistemas con restricciones . . . . . . . . . . . . . 253

A.2.5. Generalizacion a sistemas no autonomos: funciones de Lyapunovde control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

A.2.5.1. Sistema sujeto a restricciones en el estado . . . . . . . 256

A.3. Teorıa de conjuntos invariantes . . . . . . . . . . . . . . . . . . . . . . 257

A.3.1. Determinacion del conjunto a un paso . . . . . . . . . . . . . . 265

A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado268

A.4.1. Suavidad implica robustez . . . . . . . . . . . . . . . . . . . . . 271

A.4.2. Robustez de sistemas no autonomos . . . . . . . . . . . . . . . . 272

A.5. Conjuntos invariantes robustos . . . . . . . . . . . . . . . . . . . . . . . 273

B. Un ejemplo ilustrativo: el reactor continuamente agitado (CSTR) 277

C. Analisis de la continuidad del coste optimo 281

C.1. El problema de programacion matematica en el MPC . . . . . . . . . . 281

C.2. Analisis de sensibilidad de un problema NLP . . . . . . . . . . . . . . 283

C.3. Continuidad Lipschitz del coste optimo J∗N(xk) . . . . . . . . . . . . . . 286

C.3.1. MPC con restricciones en el estado . . . . . . . . . . . . . . . . 286

C.3.2. MPC sin restricciones en el estado . . . . . . . . . . . . . . . . . 291

Page 15: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

INDICE GENERAL ix

C.4. Continuidad Lipschitz local del coste optimo J∗N(xk) ante incertidumbresparametricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293

Bibliografıa 295

Page 16: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

x INDICE GENERAL

Page 17: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Notacion

En el presente documento se utilizara la siguiente notacion:

J∗N(x) Coste optimo del problema de optimizacion del MPC con horizonteN , en el estado x.

JsN(x) Coste suboptimo del problema de optimizacion del MPC con hori-

zonte N , en el estado x.

J∗Nc,Np(x) Coste optimo del problema de optimizacion del MPC en el estado

x, con horizonte de control Nc y horizonte de prediccion Np .

JMNc,Np

(x) Coste optimo del problema de optimizacion del MPC en el estadox, con horizonte de control Nc, horizonte de prediccion Np y costeterminal VM(x).

J∗∞(x) Coste optimo, con horizonte infinito, en el estado x.

JMPC∞ (x) Coste asociado a la evolucion del sistema controlado por el MPC.

u∗F (k) Secuencia optima, solucion del problema de optimizacion del MPCcon horizonte N , en el instante k.

x∗(k + j|k) Estado del sistema predicho para el instante k+j a partir del estadoxk, utilizando el modelo de prediccion.

u∗(k + j|k) Actuacion futura correspondiente al instante k + j de la secuenciade actuaciones considerada en el instante k, u∗F (k).

xh(i + j|j) Estado del sistema predicho para el instante i + j a partir del in-stante j, considerando el sistema controlado por la ley de controlu = h(x).

∆φ(x, u) φ(f(x, u))− φ(x), siendo xk+1 = f(xk, uk) el modelo del sistema.

f−1(·) Funcion inversa. Es una funcion tal que f−1 f(x) = x

fn(·) Funcion resultante de la composicion n veces de la funcion f(·), esdecir, tal que fn(x) = f(fn−1(x)), siendo f 1(x) = f(x)

Bµ Vecindad del origen dada por x ∈ IRn : ‖x‖ ≤ µ (el orden seinfiere del contexto).

1

Page 18: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

2 INDICE GENERAL

A ∼ B Diferencia de Pontryagin entre los conjuntos A ⊂ IRn y B ⊂ IRn.Viene dada por c ∈ IRn : b + c ∈ A, ∀b ∈ B.

A⊕B Suma de Minkowski de dos conjuntos A ⊂ IRn y B ⊂ IRn. Vienedada por c ∈ IRn : ∃a ∈ A, ∃b ∈ B|c = a + b.

A \B representa el conjunto de estados que pertenecen a A pero no a B.

Q(Ω) Conjunto a un paso del conjunto a un paso. Vease la definicion enla seccion A.3.

Ki(X, Ω) Conjunto controlable en i pasos al conjunto Ω. Vease la definicionen la seccion A.3.

Ci(X) Conjunto admisible en i pasos. Vease la definicion en la seccion A.3.

Si(X, Ω) Conjunto estabilizable en i pasos al conjunto Ω. Vease la definicionen la seccion A.3.

IR+ Conjunto de numeros reales no negativos.Acronimos

MPC Control predictivo basado en modelo.

LQR Regulador lineal cuadratico.

CLF Funcion de Lyapunov de control.

ISS Estabilidad (o estable) entrada a estado.

Page 19: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 1

Introduccion

1.1. Introduccion al control predictivo

Esta tesis se centra en la estabilidad y robustez de una tecnica denominada gene-ricamente control predictivo basado en modelo o MPC 1. Esta estrategia tambien seconoce como control por horizonte deslizante, por ser esta la forma en la que se aplicanlas actuaciones.

El MPC se enmarca dentro de los controladores optimos, es decir, aquellos en losque las actuaciones responden a la optimizacion de un criterio. El criterio a optimizar,o funcion de coste, esta relacionado con el comportamiento futuro del sistema, que sepredice gracias a un modelo dinamico del mismo, denominado modelo de prediccion(de ahı el termino predictivo basado en modelo). El intervalo de tiempo futuro que seconsidera en la optimizacion se denomina horizonte de prediccion.

Dado que el comportamiento futuro del sistema depende de las actuaciones quese aplican a lo largo del horizonte de prediccion, son estas las variables de decisionrespecto a las que se optimiza el criterio. La aplicacion de estas actuaciones sobreel sistema conducen a un control en bucle abierto. La posible discrepancia entre elcomportamiento predicho y el comportamiento real del sistema crean la necesidadde imponer cierta robustez al sistema incorporando realimentacion del mismo. Estarealimentacion se consigue gracias a la tecnica del horizonte deslizante que consiste enaplicar las actuaciones obtenidas durante un periodo de tiempo, tras el cual se muestreael estado del sistema y se resuelve un nuevo problema de optimizacion. De esta manera,

1Acronimo derivado del termino ingles Model Predictive Control. Dado que estas siglas son con lasque se denomina frecuentemente esta tecnica de control en la literatura, se utilizaran para designarlaa lo largo de este documento.

3

Page 20: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

4 1.1. Introduccion al control predictivo

el horizonte de prediccion se va deslizando a lo largo del tiempo.

Una de las propiedades mas atractivas del MPC es su formulacion abierta, quepermite la incorporacion de distintos tipos de modelos de prediccion, sean lineales o nolineales, monovariables o multivariables, y la consideracion de restricciones sobre lassenales del sistema. Esto hace que sea una estrategia utilizada en muy diversas areas delcontrol, como se pone de manifiesto en los trabajos preliminares a esta tesis (Ramırez,Limon Marruedo, Gomez Ortega & Camacho 1999b, Gomez Ortega, Ramırez, LimonMarruedo & Camacho 2001, Ramırez, Limon Marruedo, Gomez Ortega & Camacho1999a). Ademas es una de las pocas tecnicas que permiten controlar sistemas conrestricciones incorporando estas en el propio diseno del controlador.

Estas caracterısticas han hecho del control predictivo una de las escasas estrategiasde control avanzado con un impacto importante en problemas de ambito industrial(J.Qin & Badgwell 1997). En este sentido es importante resaltar que el control predic-tivo se ha desarrollado en el mundo de la industria, y ha sido la comunidad investigadorala que se ha esforzado en dar un soporte teorico a los resultados practicos obtenidos.

1.1.1. Formulacion del control predictivo

El control predictivo esta formado por los siguientes elementos (Camacho & Bordons1999):

Modelo de prediccion : es el modelo matematico que describe el comportamientoesperado del sistema. Este modelo puede ser lineal o no lineal, en tiempo continuoo en tiempo discreto, en variables de estado o en entrada salida.

El hecho de que el problema de optimizacion implicado se resuelva mediante elcomputador, ası como la tecnica de horizonte deslizante con la que se aplica lasolucion, hace que sea mas natural considerar modelos discretos que continuos.Por ello, en lo que sigue se consideran modelos en tiempo discreto 2. Asimismo,dado que los modelos en el espacio de estados son mas generales que los modelosentrada-salida, en lo que sigue se adopta dicha formulacion. Se considera ademasque el origen es el punto de equilibrio en el que se quiere regular el sistema, locual no resta generalidad pues se puede conseguir con un cambio de variablesadecuado. Ası el modelo de prediccion considerado tiene la forma

xk+1 = f(xk, uk)

2Esto no supone una merma en la variedad de modelos sobre los que se puede aplicar, pues, dado queel controlador requiere de algoritmos de optimizacion a implementar sobre un computador, utilizandoalgun procedimiento de integracion de ecuaciones diferenciales se puede obtener implıcitamente unadescripcion en tiempo discreto a partir del modelo en tiempo continuo.

Page 21: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 1. Introduccion 5

siendo xk ∈ IRn el estado y uk ∈ IRm las actuaciones sobre el sistema en elinstante k.

A lo largo de esta tesis, se denota x(k + j|k) al estado del sistema predicho en elinstante k + j a partir del estado conocido en el instante k. Por lo tanto

x(k + j + 1|k) = f(x(k + j|k), u(k + j|k))

siendo x(k|k) = xk. Como se puede ver, la prediccion depende ademas de lasecuencia de actuaciones aplicadas desde el instante k hasta el instante k + j, ypor lo tanto futuras.

En el contexto de control predictivo, se denomina estado terminal al estado predi-cho al final del horizonte de prediccion, es decir x(k + N |k).

En el caso en que el sistema presente incertidumbres, estas pueden aparecer enel modelo de prediccion. En consecuencia, se considera su efecto en la predicciondel comportamiento futuro del sistema, dependiendo este del valor futuro de lasincertidumbres que se consideren. A esta secuencia de incertidumbres futuras sedenomina realizacion de las mismas.

Funcion de coste : es la funcion que indica el criterio a optimizar. Es una funciondefinida positiva que expresa el coste asociado a una determinada evolucion delsistema a lo largo del horizonte de prediccion N . Esta funcion suele tener la forma

JN(xk, uF (k)) =N−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

siendo L(·, ·) la funcion de coste de etapa y V (·) la funcion de coste terminal.Estas funciones son definidas positivas.

Dado que el coste considera el comportamiento del sistema hasta un horizonte N ,este depende del estado actual del sistema xk y de la secuencia de N actuacionesque se aplican durante el horizonte de prediccion uF (k), siendo

uF (k) = u(k|k), u(k + 1|k), · · · , u(k + N − 1|k)

Restricciones : indican los lımites dentro de los cuales debe discurrir la evolucion delsistema. La evolucion de las senales de un sistema no debe exceder determinadasrestricciones que, ya sea por lımites fısicos o bien por motivos de seguridad, seimponen al sistema. Por ejemplo, los lımites de los actuadores forman parte deestas restricciones. La necesidad, generalmente por motivos economicos, de tra-bajar en puntos de operacion cercanos a los lımites fısicos admisibles del sistemahan provocado la necesidad de incorporar dichas restricciones en la sıntesis de loscontroladores.

Estas restricciones se suelen expresar como conjuntos X y U , generalmente ce-rrados y acotados, en los cuales deben estar contenidos los estados del sistema y

Page 22: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

6 1.1. Introduccion al control predictivo

las actuaciones3 en cada instante, de forma que

xk ∈ X ∀kuk ∈ U ∀k

Es habitual imponer una restriccion sobre el estado terminal del sistema llama-da restriccion terminal. Esta viene dada por un conjunto Ω ⊆ X denominadoconjunto o region terminal. Ası, esta restriccion tiene la forma

x(k + N |k) ∈ Ω

Teniendo en cuenta todos estos elementos, el problema de optimizacion asociado alcontrolador predictivo que se debe resolver en cada instante es:

mınuF (k)

JN(xk, uF (k))

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + j|k) ∈ X j = 0, · · · , N − 1

x(k + N |k) ∈ Ω

Este problema de optimizacion tiene como variables de decision las actuaciones alo largo del horizonte de prediccion y depende de forma parametrica del estado delsistema. Una vez obtenida la solucion, segun la estrategia del horizonte deslizante, seaplica la actuacion obtenida para el instante siguiente u∗(k|k)4 y se vuelve a resolveren el siguiente periodo de muestreo. Ası la ley de control del MPC viene dada por

uk = KMPC(xk) = u∗(k|k)

1.1.2. Ventajas e inconvenientes del MPC

Los controladores predictivos han tenido un notable exito en el campo de la industriaası como en la comunidad investigadora. Esto se debe a las propiedades que tienen estastecnicas de control, no exentas, por otro lado, de desventajas (Camacho & Bordons1999, Mayne, Rawlings, Rao & Scokaert 2000).

Entre las ventajas del MPC se pueden destacar:

3Tambien se pueden considerar restricciones que relacionen estados y entradas, si bien, en la for-mulacion tıpica del MPC no se suelen anadir.

4A lo largo de esta tesis, el superındice ∗ indica que el valor es el optimo del problema de mini-mizacion asociado.

Page 23: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 1. Introduccion 7

Formulacion en el dominio del tiempo, flexible, abierta e intuitiva.

Permite tratar con sistemas lineales y no lineales, monovariables y multivariablesutilizando la misma formulacion del controlador.

La ley de control responde a criterios optimos.

Permite la incorporacion de restricciones en la sıntesis del controlador.

De todas estas ventajas, sin duda la mas importante es la posibilidad de incorporarrestricciones en el calculo de las actuaciones, aspecto que las tecnicas clasicas de controlno permiten.

Entre las desventajas de esta tecnica de control se pueden citar las siguientes:

Requiere el conocimiento de un modelo dinamico del sistema suficientementepreciso.

Requiere un algoritmo de optimizacion, por lo que solo puede implementarse porcomputador 5.

Requiere un alto coste computacional, lo que hace difıcil su aplicacion a sistemasrapidos.

Hasta hace relativamente poco, no se podıa garantizar la estabilidad de los con-troladores, especialmente en el caso con restricciones. Esto hacıa que el ajuste deestos controladores fuese heurıstico y sin un conocimiento de como podıan influirlos parametros en la estabilidad.

Resulta muy compleja la consideracion de incertidumbres en

Merece la pena destacar que el control predictivo es una tecnica muy potente quepermite formular controladores para sistemas complejos y con restricciones. Esta poten-cia tiene un precio asociado: el coste computacional y la sintonizacion del controlador.Recientes avances en el campo del MPC proveen un conocimiento mas profundo de es-tos controladores, obteniendose resultados que permiten relajar estos requerimientos.Ası por ejemplo, se han establecido condiciones generales para garantizar la estabi-lidad (Mayne 2001), condiciones bajo las cuales se puede relajar la optimalidad delcontrolador garantizando su estabilidad (Scokaert & Mayne 1998) y se han desarrolla-do algoritmos eficientes para la resolucion del problema (Biegler 1998).

5Para evitar esta necesidad, se han utilizado aproximaciones neuronales del controlador realizadasfuera de lınea (Gomez Ortega 1994, Parisini & Zoppoli 1995) , o bien se ha recurrido al calculoexplıcito del controlador cuando este es posible, como en (Ramırez 2002, Bemporad, Morari, Dua &Pistikopoulos 2000).

Page 24: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

8 1.2. Motivacion de la investigacion

1.2. Motivacion de la investigacion

El campo del control predictivo se puede dividir en dos areas: el control predictivode sistemas lineales y de sistemas no lineales. La facilidad y sencillez de tratamientode los sistemas lineales y la existencia de herramientas eficientes de analisis hicieronque este area tomase un protagonismo inicial. Sin embargo, la incorporacion de lasrestricciones en el controlador hacen que el sistema en bucle cerrado sea no lineal, porlo que estas herramientas de analisis dejaron de ser utiles.

Ası, el area de control predictivo no lineal ha ido tomando una importancia cre-ciente en los ultimos anos, y como consecuencia, un numero creciente de resultadosy publicaciones han aparecido en la literatura. Todo este desarrollo ha provocado unconocimiento cada vez mas profundo de la estabilidad y robustez de esta tecnica de con-trol, resolviendose problemas existentes y apareciendo nuevos retos. Entre los problemasque se consideran maduros se encuentra la estabilidad de los controladores. Gracias arecientes trabajos como (Mayne et al. 2000), se conocen procedimientos de ajuste delcontrolador para garantizar la estabilidad del mismo, pero quedan aspectos interesantesque tratar como el estudio del dominio de atraccion de los controladores, su desempeno,tecnicas que permitan mejorar la implementacion de los mismos, formulacion para elseguimiento de trayectorias, etc.

Otro importante campo abierto de investigacion es el analisis y sobre todo el disenode controladores predictivos robustos. La madurez alcanzada en la estabilidad ha susci-tado una revision de la robustez a la luz de esta. Esto ha permitido detectar deficienciasde los controladores propuestos, apareciendo nuevas formas de plantear el problema delcontrol robusto. Quiza la mas relevante sea la formulacion en bucle cerrado. Esto hamotivado la aparicion de nuevos controladores y por lo tanto de nuevos problemas queresolver.

En este contexto se enmarca la investigacion fruto de la cual ha surgido esta tesis,cuyos objetivos se detallan a continuacion.

1.3. Objetivos y estructura de la tesis

El objetivo de esta tesis se puede situar en la profundizacion en el conocimiento dela estabilidad y robustez de los controladores predictivos de sistemas no lineales sujetosa restricciones. El analisis llevado a cabo se fundamenta en la teorıa de Lyapunov (ysus variantes) y en la teorıa de los conjuntos invariantes. Estas dos teorıas conjugadasproveen el soporte teorico para comprender en profundidad la estabilidad del controlpredictivo con restricciones, con o sin incertidumbres.

Page 25: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 1. Introduccion 9

Ası, a la luz de estas, se han analizado los distintos aspectos del control predicti-vo: el diseno de controladores estabilizantes, el analisis de su robustez y el diseno decontroladores robustos. Fruto de este analisis han surgido las ideas que se presentan ydesarrollan en esta tesis.

El desarrollo de la tesis, y en consecuencia el presente documento, sigue la estruc-turacion que se indica a continuacion (vease la figura 1.1), donde se mencionan lasaportaciones originales de la misma:

En el capıtulo 2 se hace un recorrido por las distintas formulaciones existentes delos controladores predictivos en relacion a la estabilidad. El objetivo del capıtuloes poner de manifiesto el origen de la perdida de estabilidad de los controladorespredictivos, y el camino seguido hasta recuperarla. Tambien se hace un recorridopor los resultados existentes en la literatura sobre el analisis de robustez de loscontroladores predictivos y sus formulaciones robustas.

El capıtulo 3 se centra en el analisis y el diseno de controladores MPC esta-bilizantes. Para ello se parte del estudio de la formulacion general del MPCpropuesta en (Mayne et al. 2000). A partir de esta, se presentan dos nuevoscontroladores basados en el aumento del horizonte de prediccion y en la consid-eracion de un coste terminal cuasi-infinito. A continuacion se pone de manifiestoque ambos controladores mejoran el comportamiento del sistema. Ası mismo, seanalizan tecnicas encaminadas a una mejora en la implementacion de los contro-ladores predictivos: la suboptimalidad y la eliminacion de la restriccion terminal,obteniendose nuevos resultados.

Continuando con el analisis de los controladores predictivos, en el capıtulo 4 seestudia el dominio de atraccion de estos y se proponen tecnicas para su aumento.Estas tecnicas tienen un denominador comun: aumentar el dominio de atraccionsin aumento considerable del coste computacional. Se proponen procedimientosde ajuste del controlador encaminados a este fin y se presentan dos controladoresnuevos basados en una restriccion terminal contractiva. En el primero, la res-triccion esta basada en invariantes positivos y en el segundo, dicha restriccion sebasa en una secuencia de conjuntos invariantes de control. Este ultimo ha sidopublicado en (Limon Marruedo, Alamo & Camacho 2002a).

A partir del capıtulo 5, la tesis se centra en la robustez de los controladorespredictivos, comenzando por el analisis de la estabilidad de los controladorespredictivos nominales en presencia de incertidumbres en la planta. Ası, se haceuna primer analisis basado en la continuidad Lipschitz del coste optimo y lateorıa de Lyapunov y cuyos resultados se han publicado en (Limon Marruedo,Alamo & Camacho 2002c). A raız de estos, se incorpora un concepto novedosoen el contexto del control predictivo: la estabilidad entrada a estado. Esta teorıapermite el analisis de la robustez del MPC de una manera sencilla y permitegeneralizar resultados anteriores.

Page 26: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

10 1.3. Objetivos y estructura de la tesis

En el capıtulo 6 se propone un nuevo controlador MPC robusto. Este controladorparte de una acotacion de las discrepancias que existen entre el comportamientode la planta y la evolucion predicha por el modelo. A partir de esta, se propone unprocedimiento sencillo para garantizar la satisfaccion robusta de las restricciones yademas la convergencia del controlador, gracias a la estabilidad entrada a estado.Los resultados obtenidos han dado como fruto la publicacion (Limon Marruedo,Alamo & Camacho 2002b).

En el capıtulo 7 se propone un procedimiento para estimar la acotacion de lasdiscrepancias entre la planta y el modelo de una forma local. Dicha acotaciondepende del estado del sistema y de la actuacion aplicada sobre el mismo. Estoda lugar a las denominas regiones de evolucion incierta, que permiten calcular enlınea acotaciones de las discrepancias. Estas regiones, incorporadas en la formu-lacion del problema, dan lugar a un nuevo controlador MPC robusto. Este con-trolador se ha publicado en (Limon Marruedo, Bravo, Alamo & Camacho 2002).

En el capıtulo siguiente se abordan las denominadas formulaciones del MPC enbucle cerrado. Se parte de un analisis de la estabilidad y factibilidad de los con-troladores min-max en bucle cerrado y se extienden estos resultados a la garantıade estabilidad en caso de incertidumbres acotadas. Se pone de manifiesto un pro-cedimiento para garantizar la estabilidad y factibilidad a partir de una restriccionestabilizante impuesta sobre un controlador formulado en bucle abierto. Esto dalugar a un nuevo controlador robusto basado en una restriccion estabilizantecontractiva, que se obtiene a partir de una secuencia de invariantes de controlrobustos.

Por ultimo se presentan conclusiones de esta tesis y futuras lıneas de investigacion.

Con el fin de articular el documento, los controladores propuestos se han aplicadosobre un mismo banco de ensayo: un reactor continuamente agitado (CSTR) muyutilizado en la literatura.

Esta tesis se complementa mediante los apendices: en el primero se presenta uncompendio de resultados sobre la teorıa de estabilidad y teorıa de los conjuntos in-variantes utilizadas a lo largo de la tesis. El fin de este apendice es hacer un balancede los conocimientos necesarios para el analisis de la estabilidad y robustez de loscontroladores predictivos.

En el segundo apendice se presenta el modelo del reactor utilizado en los ejemplos,y en el tercer apendice se trata del analisis de la continuidad del coste optimo basadoen la sensibilidad del problema de optimizacion.

Con el fin de facilitar la lectura del documento se presentan a continuacion undiagrama con la estructura del mismo

Page 27: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 1. Introduccion 11

Estabilidad y robustez del

MPC

Capítulo 2

Nuevas formulaciones

del MPC

Capítulo 3

Aumento del dominio de atracción

Capítulo 4

MPC ISS con factibilidad

robusta

Capítulo 6

MPC robusto basado en

regiones de evolución incierta

Capítulo 7

MPC robusto basado en invariantes

robustos

Capítulo 8

Fundamentos Análisis y diseño de controladores MPC nominales

Análisis de

robustez

Análisis y diseño de controladores MPC robustos

Teoría de Lyapunov y teoría

de conjuntos invariantes

Apéndice A

Análisis de robustez del

MPC nominal

Capítulo 5

Figura 1.1: Organizacion de la tesis

Page 28: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

12 1.3. Objetivos y estructura de la tesis

Page 29: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2

Estabilidad y robustez del controlpredictivo basado en modelo

2.1. Introduccion

En este capıtulo se hace un recorrido por la evolucion del control predictivo desdela perspectiva de la estabilidad y de la robustez. Comienza poniendo de manifiesto elorigen de la perdida de la garantıa de estabilidad en las formulaciones originales delcontrolador. Este hecho aparecıa como un problema importante y una merma de losbeneficios de esta tecnica de control. La incorporacion de la teorıa de Lyapunov y lateorıa de conjuntos invariantes arroja una nueva luz sobre el problema. Esto provocala aparicion de trabajos que profundizan en el conocimiento y solucion del mismo, loscuales se recogen en una seccion del capıtulo.

La evolucion de este estudio termina en la presentacion de la denominada formu-lacion general del control predictivo. Esta formulacion viene a recoger la esencia delos controladores con estabilidad garantizada y tal y como se muestra, resuelve losproblemas que originalmente provocaron la perdida de la garantıa de estabilidad.

A continuacion se hace un balance de los principales resultados en la robustez decontroladores predictivos, centrandose en el caso de sistemas no lineales, por ser estael area objeto del estudio realizado.

Antes de adentrarse en el capıtulo, merece la pena destacar que el recorrido por laestabilidad y robustez de los controladores MPC que se va a exponer, se hace a la luzde la teorıa de estabilidad de Lyapunov y de la teorıa de los conjuntos invariantes. Porello, a lo largo del capıtulo se hacen numerosas referencias al apendice A, en el cual se

13

Page 30: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

14 2.2. Controladores predictivos en la industria.

recopilan los principales resultados en estos campos.

2.2. Controladores predictivos en la industria.

El control predictivo ha tenido una evolucion peculiar en la disciplina del control entanto en cuanto ha sido una estrategia en la cual el campo industrial ha ido por delantede la comunidad investigadora. Si bien los controladores predictivos tienen su origen enel control optimo (Propoi 1963, Lee & Markus 1967, Kwon & Pearson 1977), nuevas ymas avanzadas formulaciones surgieron en el seno de la industria, principalmente en laindustria petroquımica y de procesos. La necesidad de controlar procesos en puntos deoperacion lımites con el objetivo de optimizar el proceso productivo llevo a la aparicionde controladores predictivos basados en modelos sencillos, orientados a la resolucionde los problemas de control asociados, tales como la consideracion de restricciones,incertidumbres y no linealidades. Entre otras formulaciones destacan las siguientes:

IDCOM o MPHC : (Identification-Command o Model Predictive Heuristic Control)propuesto en (Richalet, Rault, Testud & Papon 1978), utiliza como modelo deprediccion la respuesta impulsional (FIR), funcion de coste cuadratica, y restric-ciones en las entradas y salidas. El algoritmo de optimizacion es heurıstico.

DMC : (Dynamic Matrix Control) propuesto en (Cutler & Ramaker 1980), utilizacomo modelo de prediccion la respuesta ante escalon, lo cual limita su aplicacion aplantas estables, considera un coste cuadratico penalizando el esfuerzo de controly no considera restricciones en la optimizacion.

QDMC : (Quadratic Dynamic Matrix Control) propuesto en (Garcıa & Morshedi1986), surge de la extension del DMC al caso con restricciones. Este controladorforma parte de la denominada segunda generacion de controladores predictivos,en los que el problema de optimizacion asociado se resuelve utilizando la pro-gramacion matematica. Establece dos tipos de restricciones: duras y blandas,permitiendo la violacion de estas ultimas durante algun periodo de tiempo.

SMOC : (Shell Multivariable Optimizing Control) propuesto en (Marquis & Broustail1988), forma parte de la tercera generacion de controladores predictivos. Permitela utilizacion de modelos en espacios de estados e incorpora observadores y mo-delos de perturbaciones. Introduce tambien restricciones duras, blandas y conniveles de prioridad.

GPC : (Generalized Predictive Control) propuesto en (Clarke, Mohtadi & Tuffs 1987a,Clarke, Mohtadi & Tuffs 1987b), utiliza como modelo de prediccion la formulacionCARIMA, que incorpora una perturbacion modelada como ruido blanco. Incor-pora restricciones y existen resultados asociados a la estabilidad.

Page 31: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 15

Se han propuesto otras formulaciones de controladores predictivos tales como elRMPCT, el PCT o el PFC. Una lectura mas profunda sobre todos estos controladoresse puede encontrar en (Camacho & Bordons 1999), donde se analizan tanto en aspectospracticos, como en los relativos a la estabilidad y robustez.

En la mayorıa de estos controladores, la estabilidad no esta garantizada, requirien-dose un ajuste especıfico para cada sistema de una forma heurıstica y sin garantıas deexito. Por ello, se establecen reglas practicas de ajuste, como la eleccion de un horizontede prediccion del orden del tiempo de establecimiento de la planta en sistemas estables.

El problema de la estabilidad no estaba resuelto en general y resultaba de hechouna suerte de barrera psicologica que los investigadores en control predictivo ni siquieraintentaban superar 1 , produciendose un vacıo teorico que mermaba las caracterısticasde estos controladores.

2.3. El problema de la estabilidad: optimalidad no

implica estabilidad

La ley de control obtenida en un controlador predictivo surge de la optimizacionde un criterio relacionado con el comportamiento del sistema, en el que se penalizatanto el error respecto al punto de equilibrio como el esfuerzo de control necesario paraalcanzar dicho equilibrio. Contrariamente a lo que dicta el sentido comun, el hechode que la actuacion aplicada sea optima no garantiza que el sistema en bucle cerradoalcance el punto de equilibrio tal y como se desea. El problema de la estabilidad tiene suorigen en el desarrollo propio de los controladores predictivos: la necesidad de utilizarun horizonte de prediccion finito e invariante en el tiempo y la estrategia de horizontedeslizante.

El origen de los controladores predictivos esta en el control optimo en el cual sepretende calcular la ley de control u = K∞(x) que minimiza el coste de regular elsistema al punto de equilibrio a lo largo de toda la evolucion del mismo. Ası, la funcionde coste a optimizar es:

J∞(xk) =∞∑

i=0

L(x(k + i|k), K∞(x(k + i|k)))

1Morari en (Morari 1994) hace la siguiente afirmacion en relacion a la estabilidad de los contro-ladores predictivos ”the recent work has removed this technical and to some extent psycologycal barrier(people did not even try) and started wide spread efforts to tackle extensions of these basic problemswith the new tools”.

Page 32: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

16 2.3. El problema de la estabilidad: optimalidad no implica estabilidad

y el problema de optimizacion a resolver viene dado por

mınK∞(x)

J∞(xk)

s.a

u(k + j|k) ∈ U ∀j ≥ 0

x(k + j|k) ∈ X ∀j ≥ 0

siendo x(k + j|k) la prediccion del estado del sistema en el instante k + j a partir delestado en xk. Los conjuntos U y X definen las restricciones, de forma que X es unconjunto acotado, U compacto y ambos contienen el origen en su interior.

Este problema de control, bajo ciertas condiciones de observabilidad relacionadascon la funcion de coste de etapa 2, estabiliza asintoticamente todo estado en cual existauna solucion con un coste asociado acotado. De hecho, todo punto asintoticamenteestabilizable, se puede estabilizar por esta estrategia de control.

El problema del control optimo se puede resolver utilizando dos tecnicas: la primerase deriva del principio de optimalidad de Bellman (Bellman 1957, Bryson & Ho 1969),segun el cual

J∗∞(x) = mınu∈U

L(x, u) + J∗∞(f(x, u))| f(x, u) ∈ X∞

siendo la ley de control la solucion de este problema de optimizacion en cada estadoK∞(x) = u∗(x). El conjunto X∞ es el conjunto de estados asintoticamente estabili-zables al origen de una forma admisible, y por lo tanto el conjunto estabilizable eninfinitos pasos al origen X∞ = S∞(X, 0). Es en este conjunto en el que esta definidoJ∗∞(x).

La solucion de este problema se puede obtener a partir de las ecuaciones de Hamilton-Jacobi-Bellman, cuya resolucion es muy compleja, si no imposible, salvo en casos es-peciales como el problema de regulacion de un sistema lineal sin restricciones con unafuncion de coste de etapa cuadratica, que da lugar al regulador lineal cuadratico o LQR(Bryson & Ho 1969).

Otro procedimiento para resolver este problema es la aplicacion del calculo varia-cional, que conduce a las ecuaciones de Euler-Lagrange. La gran diferencia entre ambasresoluciones es que en las ecuaciones de H-J-B la solucion es la ley de control, conducien-do a soluciones globales y en bucle cerrado, mientras la formulacion de E-L conduce asoluciones locales y en bucle abierto, si bien la resolucion de estas ecuaciones es mas

2La condicion de observabilidad consiste en L(x, u) ≥ l·‖(h(x), u)‖σ siendo σ ≥ 1 y h(x) unafuncion detectable con el modelo, y garantiza que si J∗N (xk) → 0 cuando k → ∞, entonces xk → 0(Keerthi & Gilbert 1988).

Page 33: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 17

sencilla que la de H-J-B. Un analisis mas exhaustivo, pero con un caracter didactico,sobre control optimo puede encontrarse en (Nevistic 1997).

La dificultad en la resolucion de este problema llevo a adoptar soluciones practicasque hiciesen mas sencilla su realizacion. Estas ideas son basicamente las siguientes:

Horizonte finito y fijo : considerando un horizonte finito, el problema de optimizaciontoma la forma habitual del control predictivo:

mınuF (k)

JN(xk, uF (k))

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + j|k) ∈ X j = 0, · · · , N − 1

x(k + N |k) ∈ Ω

donde el coste a optimizar

JN(xk, uF (k)) =N−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

siendo V (x) una funcion que penaliza el coste estado final de la prediccion (es-tado terminal), denominada funcion de coste terminal. Al conjunto Ω al que serestringe dicho estado se denomina region terminal.

La principal ventaja de la adopcion del horizonte finito reside en que el problemade optimizacion tiene la forma de un problema de programacion matematica,el cual admite solucion numerica gracias a los algoritmos existentes (Luenberger1989). Notese que el coste computacional de la resolucion de este problema puedeser muy elevado si el modelo es no lineal.

Estrategia de horizonte deslizante : segun esta tecnica, en cada periodo de mues-treo se resuelve el problema de optimizacion y se aplica tan solo la actuacionobtenida para el siguiente periodo de muestreo. En el siguiente periodo de muestreose toma un nuevo estado del sistema y se repite la operacion. Esto dota de re-alimentacion a la formulacion basada en el problema de optimizacion en bucleabierto, lo cual le confiere cierto grado de robustez.

El problema de control optimo con horizonte finito i se puede resolver mediante elproblema de programacion dinamica asociado:

J∗i (x) = mınuL(x, u) + J∗i−1(f(x, u))| f(x, u) ∈ Xi−1

Page 34: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

18 2.3. El problema de la estabilidad: optimalidad no implica estabilidad

siendo J∗0 (x) = V (x) y X0 = Ω. De la solucion de este problema se deriva la ley decontrol Ki(x) = u∗. El conjunto Xi−1 es el conjunto de estados que pueden ser llevadospor una ley de control admisible siguiendo una trayectoria admisible hasta el conjuntoΩ en i− 1 pasos. Por tanto este conjunto es el conjunto controlable en i− 1 pasos, esdecir, Xi−1 = Ki−1(X, Ω) 3. Este problema de optimizacion es factible en el conjuntoXi = Ki(X, Ω), siendo este el dominio de definicion del controlador Ki(x) y por lotanto de J∗i (x).

Considerese un estado inicial tal que el problema de optimizacion con horizonte Nes factible, es decir, x0 ∈ XN . Entonces, aplicando sobre el sistema la actuacion optimau0 = KN(x0), el estado evoluciona a x1. En ese instante, la actuacion optima vienedada por la ley de control optima con un horizonte N − 1, por tanto u1 = KN−1(x1).Esto se debe al principio de optimalidad de Bellman. Entonces, en el instante k, laactuacion optima vendra dada por uk = KN−k(xk), que es el controlador optimo paraconducir al sistema en N − k pasos al conjunto terminal Ω.

En consecuencia, el horizonte de prediccion se va reduciendo en cada instante, has-ta el instante N en el cual el sistema alcanza la region terminal Ω. En esta region,el problema de optimizacion dinamica no esta definido, requiriendose un controladoralternativo.

Sin embargo, en el control predictivo la estrategia de horizonte deslizante y horizontefinito e invariante hace que siempre se aplique el controlador con horizonte N . Por lotanto, la ley de control del MPC es invariante en el tiempo y viene dada por

uk = KMPC(xk) = KN(xk)

Esto hace que la convergencia del controlador optimo con horizonte finito se pierda,pues no se reduce el horizonte y este controlador no garantiza que el sistema evolucionehacia el punto de equilibrio, ni siquiera que alcance la region terminal.

Una segunda consecuencia es la posible perdida de la factibilidad del problema.En efecto, el hecho de que el problema tenga solucion factible en el instante k (xk ∈KN(X, Ω)) no garantiza la factibilidad del problema en el instante k+1. Lo que sı garan-tiza el controlador predictivo es que xk+1 pertenece al conjuntoKN−1(X, Ω). El conjuntoKN−1(X, Ω) no tiene por que estar contenido en KN(X, Ω) (salvo en el caso en que elconjunto Ω sea un conjunto invariante positivo o de control). Por lo tanto puede ocurrirque el estado xk+1 este en el conjunto KN−1(X, Ω) pero no este contenido en KN(X, Ω),por lo que el problema de optimizacion no tendrıa solucion factible.

3El conjunto controlable en i pasos, Ki(X, Ω) viene dado por:Ki(X, Ω) = x0 ∈ X : para todo k = 0, · · · , i− 1,∃uk ∈ U tal que xk ∈ X, y xi ∈ ΩEn el caso en que no hubiese restriccion terminal equivale a considerar Ω = X, por lo que en estecaso, Xi = Ki(X, X) = Ci(X) que es el conjunto admisible. Vease la seccion A.3.

Page 35: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 19

Por tanto, a pesar de que en cada instante se aplica una actuacion optima, en elsentido que optimiza un coste y satisface unas restricciones, esta actuacion no garantizani la factibilidad ni la convergencia del sistema en bucle cerrado.

Esta perdida de la estabilidad supuso un grave problema de los controladores pre-dictivos, haciendo necesario un ajuste del controlador particular para cada sistema conel fin de garantizar la estabilidad, con el temor anadido sobre como podıa influir lavariacion de un parametro sobre esta. Por ello los controladores predictivos contabanentre sus desventajas la dificultad del ajuste.

La comunidad investigadora tomo el reto del analisis de estabilidad de los contro-ladores predictivos, que dio como fruto una serie de formulaciones que garantizan laestabilidad.

2.3.1. Un ejemplo ilustrativo

Para ilustrar como el MPC con restriccion terminal no garantiza la estabilidad, seva a considerar un sistema lineal correspondiente a un doble integrador muestreadocon Tm = 1s. Su modelo es xk+1 = A·xk + B·uk siendo

A =

1,0 1,0

0,0 1,0

B =

0,5

1,0

y esta sujeto a las restricciones

x1 ∈ [−5, 5]

x2 ∈ [−5, 5]

u ∈ [−0,3, 0,3]

Este sistema se va a controlar con un MPC con horizonte de prediccion N = 4, y se vaa considerar un coste de etapa cuadratico

L(x, u) = xT ·Q·x + uT ·R·u

siendo

Q =

0,01 0,0

0,0 0,01

R = 1

y no se anade coste terminal. En el ejemplo se va a considerar una region terminal

Ω = x ∈ IR2 : ‖x‖∞ ≤ 1

Page 36: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

20 2.4. Controladores predictivos con estabilidad garantizada

−6 −4 −2 0 2 4 6

−2

−1

0

1

2

x1

x 2

Ω K

1

K2

K3

K4

Figura 2.1: Evolucion de un sistema controlado por un MPC sin garantıa de estabilidad

que no es un invariante positivo del sistema. Notese que conjunto en que este contro-lador es factible es K4(X, Ω).

En la figura 2.1 se muestran los conjuntos controlables desde 1 paso hasta 4 pasos.Dado que la region terminal no es un invariante positivo del sistema, estas regionesno tienen por que estar anidadas y, de hecho, no lo estan. Esto hace que puedanexistir estados iniciales factibles para los cuales el controlador no estabiliza el sistema,perdiendose en algun instante la factibilidad (vease el recuadro aumentado). Noteseque esto ocurre a pesar de que el problema es inicialmente factible, es decir, que existeuna secuencia admisible que conduce el sistema hacia Ω. Sin embargo, estas actuacionesno son las que proporciona el controlador MPC.

Esto no quiere decir, como tambien se muestra en la figura, que el controlador noestabilice al sistema en ciertos estados iniciales. El problema es que no se sabe a prioricuales son.

2.4. Controladores predictivos con estabilidad garan-

tizada

El rapido desarrollo de los controladores predictivos supuso un reto en la comunidadinvestigadora para dar un soporte teorico bajo el cual se garantizase la estabilidad. Esto

Page 37: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 21

dio lugar a una serie de formulaciones con estabilidad garantizada, cuyo denominadorcomun es la utilizacion de la teorıa de Lyapunov, y en particular, el coste optimo comofuncion de Lyapunov. Estas formulaciones se pueden agrupar de la siguiente forma:

MPC con restriccion terminal de igualdad : fue propuesto para garantizar esta-bilidad del problema LQR con restricciones en (Kwon & Pearson 1977) y exten-dido en (Keerthi & Gilbert 1988) a sistemas no lineales con modelo en espacio deestados, en tiempo discreto, sujetos a restricciones. La estabilidad se garantizaimponiendo como restriccion terminal

x(k + N |k) = 0

bajo ciertas condiciones de controlabilidad y observabilidad del sistema. En estecaso, la funcion de coste optimo es estrictamente decreciente con el tiempo, porlo que es una funcion de Lyapunov del sistema.

En (Mayne & Michalska 1990), se formula este controlador para sistemas entiempo continuo y se relajan las condiciones para garantizar la estabilidad.

En (Chisci, & Mosca 1994, Bemporad, Chisci & Mosca 1995) se extiende estacondicion a sistemas lineales descritos por un modelo CARMA, sin restricciones.En este caso, la restriccion terminal se traduce en una condicion sobre las salidasy las entradas del sistema.

MPC con coste terminal : la estabilidad se logra incorporando en la funcion decoste, un termino que penalice el estado terminal mediante el denominado costeterminal. En (Bitmead, Gervers & Wertz 1990) se propone, para sistemas linealessin restricciones un coste terminal cuadratico cuya matriz de ponderacion seobtiene de la resolucion de una ecuacion de Riccati.

En (Rawlings & Muske 1993), en el caso de un sistema lineal estable con res-tricciones politopicas, se propone tomar como coste terminal el coste infinitoresultante de aplicar la actuacion nula.

En (Alamir & Bornard 1995) se utiliza esta tecnica para sistemas no linealestomando como coste terminal el coste de un controlador localmente estabilizantedurante un periodo suficientemente largo.

MPC con restriccion terminal de desigualdad : los problemas computacionalesque supone el cumplimiento de una restriccion de igualdad, llevaron a relajar estacondicion, extendiendo la restriccion terminal a una vecindad del origen. Ası, seestablece una restriccion terminal de desigualdad de la forma

x(k + N |k) ∈ Ω

siendo el conjunto Ω el denominado conjunto terminal.

Page 38: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

22 2.4. Controladores predictivos con estabilidad garantizada

Esta estrategia fue propuesta en (Michalska & Mayne 1993) para sistemas nolineales en tiempo continuo y sujeto a restricciones. En este trabajo, se elige co-mo region terminal un invariante positivo del sistema no lineal controlado por uncontrolador local. Ademas, para garantizar la factibilidad se introduce como vari-able de decision el horizonte de prediccion. El controlador ası formulado garantizaque conduce al sistema a la region terminal, donde el sistema pasa a regularsepor el controlador local que lo estabiliza al origen. De ahı que este controladorse denomine controlador MPC dual. Las bondades de esta formulacion son tannotables, que marco las futuras lıneas de investigacion en estabilidad.

En (Chisci, Lombardi & Mosca 1996) se extiende el control predictivo dual alcaso de sistemas lineales con restricciones.

En esta misma lınea, se enmarcan los denominados controladores predictivoscon estabilidad forzada, en los que esta se garantiza por la satisfaccion de unarestriccion estabilizante. En (De Oliveira Kothare & Morari 2000) se presentael denominado control predictivo contractivo. Esta estrategia esta basada en eltrabajo anterior (Yang & Polak 1993) e incorpora como restriccion terminal unarestriccion que fuerza al estado terminal x(k + N |k) a tener una norma inferiora la del estado actual xk

‖x(k + N |k)‖P < ‖xk‖P

La secuencia obtenida se aplica en bucle abierto desde el instante k hasta hastael k + N , en el que se vuelve a resolver el problema. Esta formulacion tiene dosproblemas: el funcionamiento en bucle abierto durante el horizonte de prediccion,que se resuelve con un procedimiento de realimentacion extra, y el hecho de quela factibilidad esta garantizada tan solo en una vecindad del origen, que puedeser pequena y no se conoce a priori.

En (Primbs, Nevistic & Doyle 2000), se garantiza la estabilidad forzando que unafuncion de control de Lyapunov conocida a priori, sea estrictamente decreciente

V (x(k + 1|k)) < V (xk)

Esta restriccion se impone en la actuacion para el instante actual uk, y garantizaestabilidad para todo horizonte de prediccion N ≥ 1.

MPC con coste y restriccion terminal : esta es la estructura en la que se enmar-can las mas recientes formulaciones del MPC. Es importante decir que en algunasde las formulaciones propuestas en las que se garantiza estabilidad con la adicionunicamente de una funcion de coste terminal, implıcitamente se impone que laprediccion alcance una vecindad del origen. En consecuencia se deben considerartambien como formulaciones con restriccion terminal.

El primer trabajo en el que se garantiza estabilidad incorporando ambos ingredi-entes es en (Sznaier & Damborg 1987) en el cual, para sistemas lineales sujetosa restricciones politopicas, se considera como controlador local el LQR y como

Page 39: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 23

region terminal un invariante asociado. En este trabajo se demuestra que paracada estado, existe un horizonte de prediccion suficientemente largo, tal que lasolucion optima garantiza la satisfaccion de la restriccion terminal, lo que permiteeliminarla.

Esta misma lınea se sigue en (Parisini & Zoppoli 1995) para sistemas no linea-les en tiempo discreto con restricciones. Se calcula un controlador lineal basadoen la linealizacion del modelo en torno al punto de equilibrio (analogamente alprocedimiento presentado en (Michalska & Mayne 1993) para el calculo de laregion terminal) y se toma como coste terminal una funcion proporcional a lafuncion de Lyapunov asociada al sistema linealizado en torno al origen en buclecerrado V (x) = a·xT ·P ·x. La estabilidad se garantiza demostrando que existeuna combinacion de la constante a y del horizonte de prediccion N tal que elestado terminal resultante del problema de optimizacion (sin restriccion termi-nal) alcanza un invariante positivo del sistema y la funcion de coste optimo esestrictamente decreciente.

En (De Nicolao, Magni & Scattolini 1998) se propone como coste terminal elcoste infinito incurrido por el sistema controlado por el controlador local. Estaopcion es una aproximacion razonable al coste optimo en el estado terminal, porlo que el coste del MPC sera proximo al del controlador optimo. La imposicionde que el estado terminal alcance la region terminal se impone implıcitamenteen la suposicion de que la funcion de coste terminal solo esta definida en laregion terminal, tomando un valor infinito fuera de ella. La region terminal es uninvariante positivo del sistema controlado por el controlador local. En (Magni, DeNicolao, Magnani & Scattolini 2001), se propone una formulacion implementabledel controlador predictivo anterior. Se basa en considerar como funcion de costeterminal una aproximacion truncada del coste infinito. Pero lo mas destacable deeste trabajo es que considera un horizonte de prediccion mayor que el de controlgracias a la incorporacion del controlador local.

En (Jadbabaie, Yu & Hauser 2001) se establece la estabilidad de un contro-lador predictivo para sistemas sin restricciones, tomando como coste terminaluna funcion de Lyapunov de control y sin restriccion terminal. En este trabajose demuestra que existe una vecindad del origen en la cual la solucion optimadel problema sin restricciones, garantiza la satisfaccion de la restriccion termi-nal. Ası, de una forma implıcita, se considera dicha restriccion. La eliminacionde la restriccion terminal hace que el controlador se formule como un problemade optimizacion sin restricciones, lo que permite su implementacion en sistemasrapidos, como sistemas aeronauticos.

La formulacion del MPC incluyendo explıcitamente la restriccion terminal y lafuncion de coste terminal no se alcanza hasta el denominado MPC con horizontequasi-infinito (Chen & Allgower 1998b). Para el calculo de estos, se propone uncontrolador local lineal con una funcion de Lyapunov cuadratica asociada tal quegarantiza que el coste terminal es una cota superior del coste optimo del estadoterminal controlado por el controlador local. De ahı la denominacion horizonte

Page 40: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

24 2.5. Formulacion general del MPC: necesidad de la region terminal y el coste terminal

cuasi-infinito, pues el coste optimo del MPC es una cota superior del coste optimo(con horizonte infinito).

2.5. Formulacion general del MPC: necesidad de la

region terminal y el coste terminal

Como se ha mostrado anteriormente, las formulaciones del control predictivo congarantıa de estabilidad han ido evolucionando hasta llegar a la necesidad de la regionterminal y del coste terminal de una u otra forma. Sorprendentemente, todas las estrate-gias responden a unas condiciones generales de estabilidad. Este importante resultadoes el que se propuso en (Mayne et al. 2000). Este trabajo, a juicio del autor de estatesis, constituye una piedra angular del control predictivo y una referencia obligadapara futuros desarrollos en este campo.

En este trabajo se analizan las formulaciones existentes de controladores predictivoscon estabilidad garantizada y se establece que el control predictivo con coste terminaly restriccion terminal puede, bajo ciertas condiciones, estabilizar asintoticamente unsistema no lineal sujeto a restricciones. Ademas se establecen condiciones suficientessobre la funcion de coste terminal y la region terminal para garantizar dicha estabilidad.Estas condiciones son las siguientes:

La region terminal Ω debe ser un conjunto invariante positivo admisible del sis-tema. Es decir, que debe existir una ley de control local u = h(x) tal que estabilizael sistema en Ω y ademas la evolucion del sistema y las actuaciones en dicho con-junto son admisibles.

El coste terminal V (x) es una funcion de Lyapunov 4 asociada al sistema reguladopor el controlador local, tal que

V (f(x, h(x)))− V (x) ≤ −L(x, h(x))

para todo x ∈ Ω. Por lo tanto, la ley de control local estabiliza asintoticamenteel sistema.

Esta formulacion del predictivo se denomina a lo largo de esta tesis formulaciongeneral del MPC. Esto se debe al hecho de que, como se demuestra en el artıculo,

4En el artıculo (Mayne 2001), inspirado por (Jadbabaie et al. 2001), se extiende esta condicion afunciones de Lyapunov de control (CLF), que son mas generales que las funciones de Lyapunov. Veasela seccion A.2.5.

Page 41: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 25

todas las formulaciones existentes hasta entonces se reducen a casos particulares deestas condiciones.

Considerando el analisis realizado en la seccion 2.3, se puede ver como las hipotesisimpuestas resuelven los problemas existentes y garantizan la estabilidad.

Necesidad de la region terminal invariante : Si la region terminal es un invarian-te positivo, entonces el conjunto de estados factibles es el conjunto de estados es-tabilizables en N pasos XN = SN(X, Ω). Considerese xk ∈ XN . Dada la ausenciade discrepancias entre el modelo de prediccion y el sistema, se tiene que el estadoal que evoluciona el sistema es el predicho xk+1 = x(k + 1|k). Este estado puedealcanzar la region Ω en N − 1 pasos, luego xk+1 ∈ XN−1. Gracias a que Ω es unconjunto invariante, este conjunto tiene la propiedad que XN−1 ⊆ XN y por lotanto XN es un conjunto invariante positivo del sistema en bucle cerrado, lo quegarantiza la factibilidad del controlador en todo instante.

Necesidad del coste terminal como funcion de Lyapunov : bajo esta condicionse garantiza que el coste optimo es estrictamente decreciente, y por lo tanto esuna funcion de Lyapunov del sistema. Esto garantiza la estabilidad asintotica delsistema en bucle cerrado con restricciones.

La monotonıa de la funcion de coste optimo se basa en la existencia de unasecuencia de actuaciones factibles uF (k+1) basada en la solucion optima obtenidaen el instante anterior u∗F (k). Esta secuencia no es mas que los N − 1 terminosque restan de la secuencia anterior mas la actuacion obtenida de la ley de controllocal. Ası, la diferencia entre el coste de esta secuencia, JN(xk+1), y el costeoptimo anterior, J∗N(xk), es

JN(xk+1)− J∗N(xk) = −L(xk, u∗(k|k)) +

L(x∗(k + N |k), h(x∗(k + N |k)))

+V (f(x∗(k + N |k), h(x∗(k + N |k))))− V (x∗(k + N |k))

La incorporacion del coste terminal garantiza que el termino entre llaves es ne-gativo, y por lo tanto la secuencia factible tiene un coste menor que el optimoanterior, por lo que la solucion optima tambien lo tendra. En consecuencia

J∗N(xk+1)− J∗N(xk) ≤ −L(xk, KMPC(xk))

y por lo tanto el coste optimo es una funcion de Lyapunov que decrece a lolargo de la evolucion del sistema, lo que garantiza la estabilidad asintotica. Estademostracion se hace con mas detalle en el capıtulo siguiente, dedicado al analisisde estabilidad del MPC.

Es importante resaltar que, aun en el caso en el que el controlador garantice laestabilidad en bucle cerrado del sistema, la trayectoria seguida por el mismo no es

Page 42: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

26 2.5. Formulacion general del MPC: necesidad de la region terminal y el coste terminal

optima, en el sentido de que puede existir otra cuyo coste total a lo largo de la mismasea inferior. Esto se deriva del horizonte finito considerado en la formulacion del pro-blema. Ası, la trayectoria del sistema difiere de la trayectoria resultante de la secuenciaoptima calculada en un instante (consecuencia derivada del principio de optimalidadde Bellman).

Un resultado muy interesante relacionado con la estabilidad de los controladoresMPC es el denominado MPC suboptimo que se presenta en (Scokaert, Mayne &Rawlings. 1999). En este trabajo se demuestra que es la factibilidad de la solucionla que garantiza la estabilidad, siempre que esta garantice un decrecimiento de la fun-cion de coste, no siendo necesaria la optimalidad de la solucion obtenida al problema deoptimizacion. Esta consideracion es trascendental para la implementacion de contro-ladores MPC en sistemas no lineales. En efecto, el problema de optimizacion implicadoen el MPC es en general no convexo, y por lo tanto el problema puede presentar mıni-mos locales. La obtencion del mınimo global es sumamente costosa comparada con laobtencion de un mınimo local, y tanto mas comparada con la obtencion de una solucionque simplemente presente un menor coste que la anterior.

2.5.1. Un ejemplo ilustrativo

Retomando el ejemplo del doble intergrador utilizado en la seccion 2.3.1, se va aaplicar sobre el sistema un controlador MPC siguiendo la formulacion general, es decir,anadiendo un coste terminal y una region terminal adecuados.

Para ello se ha calculado un controlador LQR para el sistema con las mismas ma-trices de ponderacion que el MPC y, asociado a el, un invariante positivo Ω. Dada laoptimalidad del LQR, la funcion de Lyapunov asociada V (x) = xT ·P ·x, siendo

P =

0,0511 0,1001

0,1001 0,4668

representa el coste infinito de la evolucion del sistema en bucle cerrado para todos losestados de Ω. En consecuencia satisface las condiciones de estabilidad.

En la figura 2.2 se muestran los conjuntos estabilizables desde 1 paso hasta 4 pasos.En este caso, al contrario que el mostrado anteriormente, los conjuntos estan anidados,por lo que S3(X, Ω) ⊂ S4(X, Ω) lo que garantiza la factibilidad. Ademas el costeterminal anadido garantiza la convergencia asintotica del sistema al origen, como semuestra en la figura.

En la figura 2.3 se muestran las curvas de nivel de la funcion de coste optimo, juntocon las trayectorias del sistema. Se puede comprobar que el coste es una funcion de

Page 43: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 27

Lyapunov del sistema observando como la evolucion del sistema es tal que el costeasociado decrece con el tiempo.

−6 −4 −2 0 2 4 6−2

−1

0

1

2

x1

x 2

Ω

S1 S

2S

3S

4

Figura 2.2: Evolucion de un sistema controlado por un MPC con garantıa de estabilidad

−6 −4 −2 0 2 4 6−2

−1

0

1

2

x1

x 2

Ω

Figura 2.3: Evolucion del coste optimo en las trayectorias del sistema

Page 44: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

28 2.6. Robustez de los controladores MPC

2.6. Robustez de los controladores MPC

2.6.1. Introduccion

La estabilidad de los controladores predictivos se garantiza bajo la hipotesis de queel modelo de prediccion coincide con el modelo del sistema a controlar. Sin embargo,todo sistema tiene asociado un error con el modelo que representa su dinamica. Por ello,para que un controlador sea aplicable debe poseer ciertas caracterısticas de robustez.

En el caso en que no hubiese incertidumbres, si se aplica la secuencia de actuacionesobtenida en bucle abierto, el sistema evoluciona de una manera admisible hasta alcanzarel conjunto terminal. Sin embargo, las posibles discrepancias existentes entre el modelode prediccion y el sistema real pueden hacer que su evolucion viole las restricciones obien que el controlador deje de ser factible o incluso que se pierda la convergencia delsistema en bucle cerrado. El hecho de que el MPC se aplique mediante la estrategia dehorizonte deslizante hace que la actuacion se recalcule en cada periodo de muestreo, loque dota de realimentacion al sistema y por lo tanto de cierta robustez.

El estudio de la robustez se puede realizar desde dos puntos de vista: el del analisisde robustez y el de la sıntesis de controladores robustos. En el primero, se parte de uncontrolador MPC obtenido para un sistema sin considerar el efecto de las incertidum-bres en su diseno y se determina que grado de incertidumbres es capaz de soportardicho controlador conservando la estabilidad del sistema.

El segundo enfoque es el de la sıntesis, por el cual se establecen formulacionesdel controlador que consideran en el calculo de las actuaciones el efecto que tienen lasincertidumbres sobre el sistema. El objetivo es por lo tanto garantizar, para cierto gradode incertidumbres, la estabilidad, la satisfaccion de las restricciones y, a ser posible,alguna especificacion sobre el desempeno.

A continuacion se trata el primer aspecto, abordandose la sıntesis de controladoresrobustos en el siguiente apartado.

2.6.2. Analisis de robustez de los controladores MPC

En el caso de sistemas lineales, existen numerosas tecnicas de analisis de robustez desistemas sin restricciones, pero pocas en el caso de sistemas con restricciones, pues, eneste caso el sistema en bucle cerrado puede ser no lineal. En (Zafiriou 1990) se presentancondiciones suficientes (y tambien necesarias) para garantizar la estabilidad nominal

Page 45: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 29

y robusta del MPC. En (Genceli & Nikolau 1993) se dan condiciones suficientes deestabilidad robusta del DMC y se analiza el comportamiento del sistema en presencia deincertidumbres. En (Primbs et al. 2000) se presenta un procedimiento para comprobarla robustez de controladores predictivos de sistemas lineales con restricciones en lasentradas, basado en la solucion de una serie de desigualdades matriciales lineales (LMI).

La robustez de los controladores predictivos de sistemas no lineales se ha analizadosiguiendo dos lıneas: una en la que se explota la optimalidad del controlador, y otrabasada en la teorıa de Lyapunov.

En la lınea basada en la optimalidad del controlador, en (Glad 1987) se presenta uncompendio de resultados de estabilidad robusta de controladores optimos para sistemasno lineales en tiempo continuo, afines en la actuacion y sin restricciones. En este trabajose considera unicamente incertidumbres en las actuaciones de dos tipos: incertidumbresen la ganancia, de forma que la actuacion real ur = φ(u) es una funcion (estatica) dela actuacion que se aplica, e incertidumbres aditivas, de forma que ur = u + ψ(x). Elprincipal resultado de este trabajo es la demostracion de que el controlador optimoestabiliza al sistema con incertidumbres de ganancia contenidas en el sector (1/2,∞),es decir tal que

1

2·u2 < u·φ(u) < ∞

Este resultado se demuestra para el caso de una entrada y se extiende al caso demultiples entradas, garantizandose la robustez en otro sector.

Este trabajo se extendio en (Geromel & Da Cruz 1987) al caso de sistemas discre-tos afines en la actuacion, sin restricciones y con incertidumbres en las actuaciones,considerando tambien horizonte infinito. En este trabajo se analiza la estabilidad delsistema ante incertidumbres en la ganancia del controlador, obteniendose bajo ciertascondiciones, un margen de estabilidad, que en el caso de una unica entrada, se reduceal sector (0,5,∞), como en los sistemas continuos. En este trabajo tambien se analizael caso de incertidumbres aditivas en la ganancia.

En (De Nicolao, Magni & Scattolini 1996) se extiende el trabajo de (Geromel &Da Cruz 1987) al analisis de robustez de sistemas discretos sin restricciones controla-dos con un MPC con restriccion terminal. Si bien el trabajo original esta formuladopara el caso de restriccion terminal nula, esta se puede extender al caso general puesesta basado en el principio de optimalidad (De Nicolao et al. 1998). Siguiendo un desar-rollo practicamente paralelo al desarrollado en (Geromel & Da Cruz 1987), se obtienenresultados semejantes.

Otra forma de demostrar la robustez del MPC general basada en la optimalidades la presentada en (Magni & Sepulchre 1997). En este trabajo se demuestra la op-timalidad inversa del MPC: el controlador obtenido de un MPC con horizonte finito

Page 46: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

30 2.6. Robustez de los controladores MPC

y estabilidad garantizada para un sistema sin restricciones se puede considerar comoun controlador optimo con horizonte infinito considerando un coste de etapa modifica-do. En consecuencia, todo controlador MPC hereda las propiedades de robustez de loscontroladores optimos, y en particular, el margen de incertidumbre en la ganancia de(0,5,∞).

El segundo enfoque para el analisis de robustez de los controladores es la teorıa deLyapunov, y se basa en la estabilidad asintotica (o bien, exponencial) que presentan es-tos controladores. La idea basica consiste en garantizar que el coste optimo sigue siendouna funcion de Lyapunov estrictamente decreciente a pesar de las incertidumbres. Espor tanto una herramienta general y no aprovecha la optimalidad de los controladores,sin embargo permite el analisis en presencia de restricciones, no consideradas en elenfoque de la optimalidad. Es importante resaltar que la presencia de restricciones enel controlador, en especial sobre los estados, impone un grado de complejidad mayor ala robustez del controlador, pues se debe garantizar la satisfaccion de las restriccionesen presencia de las incertidumbres.

En (Scokaert, Rawlings & Meadows 1997) se analiza la estabilidad robusta de loscontroladores MPC con horizonte finito para sistemas en tiempo discreto con restric-ciones bajo incertidumbres aditivas que decaen con el tiempo. Este analisis se orientaa la estabilidad del MPC cuando se conecta en cascada un observador para estimarlos estados del sistema, suponiendo que el error en la estimacion de los estados decaecon el tiempo. Basandose en las propiedades de los sistemas exponencialmente establesy bajo la continuidad Lipschitz de la ley de control, se demuestra que el controladorMPC soporta cierto grado de incertidumbre.

En (De Nicolao et al. 1998) se presenta una formulacion estable del MPC y ademasse analiza la estabilidad del controlador siguiendo la lınea de (Scokaert et al. 1997),considerando incertidumbres aditivas que decaen y cierta condicion de continuidadsobre el coste optimo.

Todos estos trabajos demuestran que los controladores predictivos tienen ciertogrado de robustez de forma inherente, es decir, que ante cierto grado de incertidumbres,el sistema mantiene la estabilidad. Otro problema distinto es la sıntesis de controladoresconsiderando las incertidumbres que presenta el sistema, el cual se trata en la siguienteseccion.

2.6.3. Formulaciones robustas del MPC

Dado el alto grado de complejidad de los controladores predictivos (que incorporanoptimalidad y satisfaccion de restricciones en el control de sistemas no lineales), la in-

Page 47: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 31

corporacion de las incertidumbres en el diseno es muy costosa, por lo que la mayor partede las formulaciones propuestas (con estabilidad garantizada) constituyen solucionesmeramente teoricas.

La forma habitual de considerar las incertidumbres en predictivo es incorporandotodas las posibles realizaciones de estas en la solucion del problema de optimizacion.Ası, si el sistema incierto responde a un modelo

xk+1 = f(xk, uk, wk)

siendo wk el vector de incertidumbres tal que wk ∈ W ⊂ IRp. La prediccion de laevolucion del sistema incierto a lo largo del horizonte depende de la realizacion de lasincertidumbres wF = wi con wi ∈ W para i = 0, · · · , N − 1. Considerando esta, elcontrolador tiene la forma

mınuF (k)

JN(xk, uF (k),W )

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + j|k) ∈ X j = 0, · · · , N − 1, ∀wF

x(k + N |k) ∈ Ω ∀wF

siendo el estado predicho

x(k + j + 1|k) = f(x(k + j|k), u(k + j|k), wk+j)

con x(k|k) = xk.

Notese que las restricciones en la evolucion de los estados se deben satisfacer de unaforma robusta, es decir, para todas las posibles realizaciones de las incertidumbres. Laincorporacion de restricciones en el estado complica notablemente el problema, pero,aun en el caso en el que no haya restricciones sobre los estados, la restriccion terminalsiempre esta presente en el problema de optimizacion pues se anade para garantizar laestabilidad del controlador.

El coste a optimizar JN(xk, uF (k),W ) puede basarse en las predicciones nominalesdel sistema o bien considerar el efecto de las incertidumbres tomando, por ejemplo, lapeor situacion posible. Esto da lugar a la denominada formulacion min-max

JN(xk, uF (k),W ) = maxwF

N−1∑

i=0

L(x(k + i|k), u(k + i|k), wk+i) + V (x(k + N |k))

Otra formulacion consiste en anadir un termino en la funcion de coste de etapa quepondera la posible incertidumbre, como en la formulacion H∞.

Page 48: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

32 2.6. Robustez de los controladores MPC

Esta forma de considerar las incertidumbres es intuitiva y razonable, pero puedeconducir a soluciones muy conservadoras. Este conservadurismo radica en la naturalezamisma del control predictivo: la prediccion en bucle abierto.

En efecto, el control predictivo surge como solucion practica e implementable decontroladores optimos, evitando la resolucion del problema de programacion dinamicagracias a la resolucion en cada instante del problema de optimizacion asociado. Esohace que, en vez de obtener una ley de control uk = KN(xk), se obtiene una secuenciaactuaciones asociada al estado actual, xk. En el caso en que haya incertidumbres, lafactibilidad del problema se debe garantizar para todas las posibles incertidumbres.Por tanto, para que la secuencia obtenida sea factible, debe garantizar que la evoluciondel sistema incierto satisfaga las restricciones para toda posible incertidumbre. Enconsecuencia, el conjunto de estados para los cuales existe una solucion factible Xba,puede ser muy reducido.

Entre los controladores predictivos que se pueden englobar en esta formulacionesta el controlador min-max propuesto en (Campo & Morari 1987) para sistemas li-neales, y el controlador dual robusto presentado en (Michalska & Mayne 1993). Eneste trabajo se presenta el denominado MPC dual y se propone un procedimientoque garantiza robustez. Este procedimiento parte de un controlador local robusto conun invariante positivo robusto asociado Ω. Sin embargo, considera en el problema deoptimizacion un conjunto φ ⊂ Ω, de forma que la secuencia optima para la regionconservadora garantice que el estado terminal incierto este contenido en Ω. Esta ideapermite garantizar la satisfaccion robusta de la restriccion terminal.

Si se considera, en vez de una secuencia de actuaciones, una ley de control en laoptimizacion, la actuacion a aplicar en cada estado predicho para una determinadarealizacion de las incertidumbres, depende del estado en que se encuentra y en conse-cuencia, de la realizacion de las incertidumbres. Por tanto la actuacion puede compen-sar el efecto de las mismas con el fin de satisfacer las restricciones. En consecuencia, elconjunto de estados que pueden satisfacer las restricciones de este modo Xbc es muchomayor, de forma que

Xba ⊂⊂ Xbc

La incorporacion de esta idea en el controlador MPC da lugar a la denominadaformulacion en bucle cerrado y fue introducida en (Scokaert & Mayne 1998, Lee &Yu 1997) en el contexto del min-max. En esta formulacion, el problema de control noesta planteado en terminos de una secuencia de actuaciones, sino de una secuencia deleyes de control

πF = u, π1(x) · · · , πN−1(x)lo cual hace que el problema de optimizacion implicado sea infinito-dimensional. Enconsecuencia estos controladores constituyen (por ahora) una herramienta meramente

Page 49: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 2. Estabilidad y robustez del control predictivo basado en modelo 33

teorica (Mayne et al. 2000). Sin embargo, estas consideraciones han permitido enfocarmejor el problema de la robustez, dando un giro en la investigacion en este campo.

Esta formulacion se sigue tambien en (Magni, Nijmeijer & van der Shaft 2001),donde se propone un controlador H∞ con horizonte deslizante para un sistema nolineal, afın en la actuacion y sin restricciones.

Dentro del control predictivo en bucle cerrado se pueden considerar otras for-mulaciones como por ejemplo el trabajo presentado en (Kothare, Balakrishnan &Morari 1996). En este se propone un controlador que estabiliza una planta inciertatal que se puede expresar en cada instante como una combinacion convexa de una seriede plantas lineales y que presenta restricciones en los estados y en las actuaciones. Enesta formulacion se considera como variable de optimizacion un controlador lineal queestabiliza todas las plantas y se puede plantear como un LMI que se resuelve en cadainstante.

Tambien se pueden considerar dentro de los controladores en bucle cerrado los tra-bajos (Bemporad 1998) y (Chisci, Rossiter & Zappa 2001) en los cuales se parametrizala ley de control como uk = K·xk + vk, siendo K·x una ley de control que estabiliza laplanta nominal. El controlador predictivo se formula en terminos de vk. Las restriccio-nes en los estados y en las actuaciones son politopicas, y por lo tanto, tras el cambio devariables siguen siendo politopicas. Esta tecnica mejora el condicionamiento numericodel problema de optimizacion y en cierta forma, el controlador anadido reduce el efectode las incertidumbres, pues anade cierta realimentacion en las predicciones en bucleabierto.

Ademas, en (Chisci & Zappa 1999) se anade una restriccion adicional con el finde garantizar la satisfaccion robusta de las incertidumbres. Esta idea se generaliza alcaso no lineal en (Kerrigan 2000), donde se analiza utilizando la teorıa de conjuntosinvariantes la satisfaccion robusta de las restricciones.

Todas estos controladores reducen el conservadurismo de la formulacion en bucleabierto, pero siguen siendo mas conservadoras que la formulacion en bucle cerrado. Asu favor tienen que son controladores mas facilmente implementables.

2.7. Conclusiones

En este capıtulo se ha hecho un repaso de las formulaciones del control predictivo,especialmente enfocado al analisis de la estabilidad y la robustez, por ser estos losaspectos que se tratan en esta tesis. Existen en la literatura publicaciones en las que

Page 50: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

34 2.7. Conclusiones

se hace un balance y se resumen las distintas estrategias de controladores predictivosexistentes. Entre ellas caben citar (Camacho & Bordons 1999, Garcıa, Prett & Morari1989, Mayne 2000, De Nicolao, Magni & Scattolini 2000, Chen & Allgower 1998a,Mayne et al. 2000, Mayne 2001).

Se ha puesto de manifiesto que el origen de la perdida de estabilidad de los con-troladores predictivos radica en la formulacion con horizonte finito, fijo y aplicado enmodo deslizante, y como las soluciones propuestas en la literatura, resumidas en ladenominada formulacion general del predictivo, resuelven los problemas derivados deesta formulacion.

Tambien se muestra la robustez de los controladores predictivos desde dos puntosde vista: el analisis de la estabilidad del MPC ante incertidumbres en la planta y eldiseno de controladores MPC robustos. La incorporacion de las incertidumbres en eldiseno de controladores es uno de los grandes temas de investigacion abiertos en MPC,en los que se han realizado avances significativos, como la formulacion en bucle cerradodel MPC.

En el capıtulo siguiente se presenta con mayor profundidad la denominada formu-lacion general del MPC que sirve de base para un posterior analisis de la estabilidad deestos controladores. En este capıtulo se introducen nuevas formulaciones del MPC conestabilidad garantizada que son aportaciones originales de esta tesis. Ademas se anali-zan aspectos como el comportamiento y la optimalidad de los controladores. Tambiense analiza la posibilidad de garantizar estabilidad en ausencia de la restriccion terminal,obteniendose una serie de resultados originales y generalizando otros existentes.

Page 51: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3

Nuevas formulaciones del MPC conestabilidad garantizada

3.1. Introduccion

El control predictivo basado en modelo es una de las pocas tecnicas de control quepermite la incorporacion de restricciones en su formulacion. Ademas esta estrategia decontrol es valida para un amplio abanico de sistemas, tanto lineales como no linealesy ha tenido una importante repercusion en la industria.

Un aspecto primordial en el diseno de un controlador es la garantıa de estabilidaddel sistema en bucle cerrado. El estudio de la estabilidad en el MPC es un aspecto queha ido evolucionando hasta llegar al estado actual, en el que se considera una materiamadura. Esto se debe en gran parte al establecimiento de unas condiciones generales(validas para la mayorıa de sistemas) bajo las cuales se garantiza la estabilidad delcontrolador MPC (Mayne et al. 2000). Estas condiciones parten de una formulaciondel controlador que incluye el coste terminal ası como la restriccion terminal y que sedenomina a lo largo de este documento, formulacion general del MPC.

Este capıtulo comienza estableciendo las condiciones de estabilidad del MPC ge-neral, pues sirven de base para las posteriores secciones. A continuacion se presentannuevas formulaciones del MPC con estabilidad garantizada: en la primera de ella sepropone un controlador MPC con un horizonte de prediccion mayor que el horizontede control. Esta es una aportacion original de esta tesis y supone una generalizacionde la formulacion propuesta en (Magni, De Nicolao, Magnani & Scattolini 2001).

Otro nuevo controlador propuesto en este capıtulo considera un coste terminal basa-

35

Page 52: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

36 3.1. Introduccion

do en una funcion de Lyapunov del sistema, el cual, ademas de garantizar estabilidad,mejora la optimalidad del controlador. Este coste es una aproximacion finita al coste(con horizonte infinito) del sistema regulado por el controlador local, y por ello se hadenominado coste terminal con horizonte cuasi-infinito (o simplemente coste terminalcuasi-infinito). Este resultado es una generalizacion del controlador propuesto en (DeNicolao et al. 1998).

A continuacion se realiza un analisis del comportamiento de los controladores desdeel punto de vista de la optimalidad, donde se demuestra que las dos formulacionesanteriores mejoran la optimalidad del controlador.

Tambien se analiza la estabilidad de los controladores en caso de la suboptimali-dad del controlador, y se imponen unas condiciones mas suaves que las originalmentepropuestas en (Scokaert et al. 1999).

Por ultimo se analizan bajo que condiciones se puede eliminar la restriccion terminalconservandose la estabilidad y se caracteriza una region en la cual se garantiza la esta-bilidad asintotica. Este analisis es una generalizacion de trabajos anteriores (Parisini &Zoppoli 1995, Jadbabaie et al. 2001) a la formulacion general del MPC, constituyendouna aportacion original de esta tesis. Estos resultados han dado lugar a la publicacion(Limon Marruedo, Alamo & Camacho 2003) que esta pendiente de revision.

Ası, la organizacion de este capıtulo se ilustra en el siguiente diagrama:

Formulación general del MPC

Controlador MPC con mayor

horizonte de predicción

Controlador MPC con coste terminal

cuasi-infinito

Análisis de optimalidad

Estabilidad MPC subóptimo

Eliminación de la restricción

terminal

Fundamentos Nuevos

controladores MPC

Análisis de los nuevos controladores

Aspectos de implementación

Figura 3.1: Organizacion del capıtulo

Es importante indicar que todo el analisis llevado a cabo en este capıtulo, y engeneral a lo largo de la tesis, se basa en la teorıa de Lyapunov y en la teorıa de conjuntosinvariantes, cuyos resultados mas importantes estan recopilados en el apendice A. Caberesaltar que para el analisis y el diseno de los controladores se considera que el sistemano presenta incertidumbres. En capıtulos posteriores se analizara la robustez de loscontroladores MPC.

Page 53: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 37

3.2. Descripcion del sistema

A lo largo de este capıtulo, se considera un sistema descrito por un modelo no linealen tiempo discreto de la forma

xk+1 = f(xk, uk) (3.1)

siendo xk ∈ IRn el estado del sistema y uk ∈ IRm el vector de actuaciones sobre elsistema en el instante k. El sistema presenta un punto de equilibrio en el origen, portanto f(0, 0) = 0.

Cada una de estas senales estan confinadas en una serie de restricciones a lo largodel tiempo. Estas restricciones tienen la forma

xk ∈ X (3.2)

uk ∈ U (3.3)

donde el conjunto X se considera generalmente cerrado y U compacto. Para que elsistema pueda evolucionar al punto de equilibrio, los conjuntos X y U deben contenerel vector nulo en su interior.

3.3. Formulacion general del MPC

Como se comento en el capıtulo anterior, la evolucion que han experimentado loscontroladores MPC en busca de la estabilidad ha convergido en la denominada formu-lacion general del MPC 1. Esta formulacion establece unas condiciones suficientes deestabilidad del MPC genericas que, como demuestran en el artıculo, reune la mayorıade las formulaciones existentes hasta la fecha. En esta seccion se hace un analisis deestabilidad de esta formulacion analogo al realizado en (Mayne et al. 2000), que sirvede introduccion e inicio al analisis de los controladores posteriores.

La formulacion del problema de optimizacion del MPC es

mınuF (k)

JN(xk, uF (k))

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + j|k) ∈ X j = 0, · · · , N − 1

x(k + N |k) ∈ Ω

1De esta forma se refiere en este documento a la formulacion del MPC propuesta en (Mayneet al. 2000).

Page 54: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

38 3.3. Formulacion general del MPC

siendo el funcional a optimizar

JN(xk, uF (k)) =N−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

El vector uF (k) denota la secuencia de N actuaciones futuras

uF (k) = u(k|k), · · · , u(k + N − 1|k)

siendo u(k + j|k) la actuacion en el instante k + j calculada en el instante actual k.Ante esta secuencia de actuaciones, la evolucion predicha del sistema en el instantek + j + 1 a partir del modelo (3.1) se denota como x(k + j + 1|k) y viene dada por

x(k + j + 1|k) = f(x(k + j|k), u(k + j|k))

de modo que x(k|k) = xk es el estado muestreado del sistema en el instante actual.

El problema de optimizacion es un problema de programacion matematica cuyasvariables de decision son las componentes del vector de actuaciones futuras uF (k) detamano N ×m. Si las funciones que intervienen en el problema de optimizacion, f(·, ·),V (·) y L(·, ·) son funciones continuas y si el conjunto U es compacto y los conjuntosX y Ω son cerrados, entonces se puede garantizar que el problema de optimizacion, encaso de ser factible, presenta al menos un mınimo (Mayne et al. 2000).

Este problema depende del estado del sistema en cada instante, siendo por tantoun problema parametrizado en xk. La solucion del problema dependera por tanto delvalor de xk. Dado que la solucion obtenida que se aplica mediante la estrategia dehorizonte deslizante, en cada instante k se calcula la secuencia optima u∗F (k). De estasecuencia tan solo se aplica la actuacion correspondiente al instante k, es decir, u∗(k|k)desechandose, por tanto, el resto de la secuencia de actuaciones. Dado que esta soluciondepende del estado de la planta, la ley de control del MPC viene dada implıcitamentepor

KMPC(xk) = u∗(k|k)

Es interesante resaltar que, debido a la ausencia de discrepancias entre el modelode prediccion y el del sistema, el estado al que evoluciona el sistema es el predicho, esdecir, xk+1 = x(k + 1|k). Pero, dado que el problema a resolver depende del estado, laactuacion optima en el instante k + j solucion en xk puede ser distinta a la actuacionoptima para ese mismo instante en xk+1, es decir, u∗(k+j|k) 6= u∗(k+j|k+1). Por tanto,las trayectorias optimas predichas en cada instante son distintas y, en consecuencia, laevolucion del sistema en bucle cerrado difiere de la evolucion predicha en la resoluciondel sistema. Tan solo en el caso de horizonte infinito se verifica que la evolucion realcoincide con la predicha, por el principio de optimalidad de Bellman.

Page 55: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 39

3.3.1. Condiciones suficientes de estabilidad

La formulacion general del MPC comprende los siguientes parametros de diseno:

Horizonte de prediccion (N) : es el horizonte temporal en el que se considera laevolucion futura de la planta para el calculo de la actuacion.

Coste de etapa (L(x, u)) : es la funcion que penaliza el estado y la actuacion sobreel sistema en el funcional a optimizar. Esta funcion es continua y definida positivatal que L(0, 0) = 0 y ademas L(x, u) ≥ α(‖(x, u)‖), siendo α(·) una funcion K .Generalmente se impone que L(x, u) ≥ l·‖(x, u)‖σ para ciertas constantes l > 0y σ > 0.

Esta condicion se puede relajar tomando L(x, u) ≥ l·‖(g(x), u)‖σ satisfaciendog(x) ciertas condiciones de observabilidad (Keerthi & Gilbert 1988).

Las funciones de coste pueden estar basadas en norma infinito, en norma 1, sibien lo mas habitual es considerar norma 2 ponderada, lo que da lugar al costecuadratico

L(x, u) = xT ·Q·x + uT ·R·usiendo Q una matriz semidefinida positiva y R una matriz definida positiva.

Coste terminal (V (x)) : es la funcion que penaliza el estado terminal, es decir, elestado predicho al final del horizonte de prediccion.

Region terminal (Ω) : es un conjunto cerrado, vecindad del origen, que el estadoterminal debe alcanzar. Para garantizar esto, se impone como restriccion en elproblema de optimizacion denominada restriccion terminal.

Estos son los parametros del controlador MPC sobre los cuales se imponen condi-ciones para garantizar la estabilidad del sistema. En esta seccion se presentan condi-ciones suficientes incorporando los resultados presentados por Mayne en (Mayne 2001).

Para una mayor sencillez en la exposicion de los resultados, se incorpora la siguientenotacion: sea φ(x) una funcion IRn 7→ IR, en lo que sigue se denota

∆φ(x, u) = φ(f(x, u))− φ(x)

que representa el incremento que experimenta la funcion al evolucionar el sistema quese encuentra en un estado x al aplicar una actuacion u. Analogamente se denota

[∆φ + L](x, u) = ∆φ(x, u) + L(x, u)

Page 56: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

40 3.3. Formulacion general del MPC

Hipotesis 3.1 (Region y coste terminal) El sistema es tal que existe una vecindaddel origen Ω ⊆ X que es un conjunto invariante de control del sistema 2 y ademas tieneasociada una funcion de Lyapunov de control (CLF) 3 V (x) tal que

mınu∈U

V (f(x, u))− V (x) + L(x, u), sujeto a f(x, u) ∈ Ω ≤ 0 ∀x ∈ Ω (3.4)

Esta hipotesis suele formularse en terminos de funcion de Lyapunov. Pero el con-cepto de CLF es mas general y engloba a las funciones de Lyapunov, dado que estas sepueden considerar funciones de Lyapunov de control particularizadas para una ciertaley de control. Esta generalidad se plasmara en una mayor diversidad de funciones ysobre todo en mayores regiones invariantes. Notese tambien que toda region del tipo

Ω = x ∈ IRn : V (x) ≤ α

contenida en la region factible del problema (3.4) es un invariante de control del sistema.

Sea u = hV (x) la ley de control formada por las actuaciones optimas de (3.4) encada estado, entonces, esta condicion se puede reescribir de una forma mas compactacomo

[∆V + L](x, hV (x)) ≤ 0

para todo x ∈ Ω.

A partir de las condiciones anteriormente expuestas se puede establecer el siguienteresultado:

Teorema 3.2 (Estabilidad asintotica) (Mayne et al. 2000)

Sea un sistema xk+1 = f(xk, uk), tal que f(0, 0) = 0 y esta sujeto a las restriccionesxk ∈ X y uk ∈ U .Sea un problema de optimizacion MPC con una funcion de coste terminal y una regionterminal tales que satisfacen la hipotesis 3.1.Entonces el sistema controlado por la ley de control uk = KMPC(xk) es asintoticamenteestable con un dominio de atraccion XN que es el conjunto de estados para los que elproblema de optimizacion es factible.

Demostracion:

Factibilidad:

La estabilidad se basa en probar que el conjunto factible XN es un invariante positivo

2Vease la seccion A.3.3Vease la seccion A.2.5.

Page 57: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 41

del sistema en bucle cerrado. El conjunto XN es el conjunto de estados para los cualesexiste una secuencia de N actuaciones admisibles tales que el sistema evoluciona dentrode X hasta alcanzar el conjunto terminal Ω. Este conjunto es el conjunto estabilizableen N pasos 4, SN(X, Ω). Por tanto el dominio de atraccion es XN = SN(X, Ω).

Sea xk ∈ SN(X, Ω), entonces el estado siguiente puede alcanzar Ω en N − 1 pasos,por lo que xk+1 = x(k+1|k) ∈ SN−1(X, Ω) ⊆ SN(X, Ω). Por tanto, verifica la condicionde invariancia y el conjunto SN(X, Ω) es un invariante positivo del sistema en buclecerrado.

Convergencia:

Se demuestra comprobando que el coste optimo es una funcion de Lyapunov del sistemaen bucle cerrado.

Sea u∗F (k) la solucion optima del sistema en xk, con un coste optimo J∗N(xk) y unasecuencia predicha optima x∗(k+j|k) para j = 1, · · · , N . Es facil comprobar que J∗N(xk)es una funcion definida positiva por serlo L(·, ·), ya que

J∗N(xk) ≥ L(xk, u∗(k|k)) ≥ l·‖(xk, u

∗(k|k))‖σ ≥ l·‖xk‖σ

Considerese la secuencia uF (k + 1) dada por:

u(k + j|k + 1) =

u∗(k + j|k) j = 1, · · · , N − 1

hV (x(k + N |k + 1)) j = N

siendo hV (·) la actuacion optima de (3.4) para el coste terminal y x(k+j|k+1) el estadopredicho en el instante k + j a partir del estado xk+1 aplicando la secuencia uF (k + 1).Notese que esta secuencia esta formada por los terminos que restan de la secuenciaoptima anterior completada por la actuacion que satisface la condicion terminal (3.4).

Dado que no hay discrepancias entre el modelo de prediccion y el sistema real, setiene que xk+1 = x∗(k + 1|k). Ası, aplicando la secuencia uF (k + 1), el estado predichox(k + j|k + 1) satisface que

x(k + j|k + 1) = x∗(k + j|k) para j = 1, · · · , N

Por lo tanto, x(k + j|k + 1) ∈ X para todo j = 1, · · · , N . Ademas, de la factibilidadde la secuencia optima se deduce que x(k + N |k + 1) ∈ Ω y por lo tanto la actuacionu(k+N |k+1) = hV (x(k+N |k+1)) esta definida y es admisible y ademas satisface quex(k + N + 1|k + 1) ∈ Ω por la hipotesis 3.1 . De todo esto se deduce que la secuenciauF (k + 1) es una secuencia de actuaciones factible.

4Vease la seccion A.3.

Page 58: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

42 3.3. Formulacion general del MPC

Sea JN(xk+1) el coste asociado a la secuencia factible uF (k + 1). Entonces se tieneque

JN(xk+1)− J∗N(xk) = −L(xk, u∗(k|k)) +

L(x(k + N |k + 1), hV (x(k + N |k + 1))

+V (x(k + N + 1|k + 1))− V (x∗(k + N |k))

dado que x(k + N |k + 1) = x∗(k + N |k) ∈ Ω, que

x(k + N + 1|k + 1) = f(x∗(k + N |k), hV (x∗(k + N |k)))

y que hV (·) satisface (3.4), se deduce que

JN(xk+1)− J∗N(xk) = −L(xk, u∗(k|k)) + [∆V + L](x∗(k + N |k), hV (x∗(k + N |k))

≤ −L(xk, u∗(k|k))

Por tanto, del principio de optimalidad se tiene que

J∗N(xk+1)− J∗N(xk) ≤ JN(xk+1)− J∗N(xk) ≤ −L(xk, u∗(k|k)) ≤ −l·‖xk‖σ

Por tanto J∗N(x) es una funcion de Lyapunov y el sistema es asintoticamente estable.

Esta demostracion es la base de resultados posteriores y se divide en dos partes:la factibilidad que garantiza que el controlador esta definido en todo instante y quela evolucion del sistema satisface las restricciones, y la convergencia, que se deriva deque el coste optimo es una funcion de Lyapunov. La mayorıa de las demostraciones deestabilidad en el campo de predictivo siguen esta lınea.

Nota 3.3 La demostracion de estabilidad asintotica se basa en que el coste optimo esuna funcion de Lyapunov del sistema. Es interesante resaltar que para completar lademostracion con rigor, es necesario encontrar una funcion K que acote superiormenteel coste optimo en una vecindad del origen. Esta condicion se puede inferir de la con-tinuidad del coste optimo. Tambien se podrıa derivar de la continuidad de la funcionde coste terminal, pues para todo estado en Ω se tiene que J∗N(x) ≤ V (x), como sedemostrara posteriormente.

A continuacion se establecen condiciones suficientes para garantizar la estabilidadexponencial del sistema en bucle cerrado.

Page 59: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 43

Corolario 3.4 (Estabilidad exponencial) (Scokaert et al. 1997)

Sea la funcion de coste tal que L(x, u) ≤ cx·‖x‖σ + cu·‖u‖σ

Sea la secuencia optima u∗F (k) para la cual existe una constante bu > 0 tal que

‖u∗(k + j|k)‖ ≤ bu·‖xk‖Sea el modelo f(·, ·) para el cual existen unas constantes ax > 0 y au > 0 tales que

‖f(x, u)‖ ≤ ax·‖x‖+ au·‖u‖Sea el coste terminal V (x) tal que V (x) ≤ dx·‖x‖σ.Entonces el sistema controlado por el MPC, bajo las hipotesis del teorema 3.2, es ex-ponencialmente estable en XN .

Demostracion:

Del teorema 3.2 se tiene que el coste optimo J∗N(x) es una funcion de Lyapunov delsistema. Ademas verifica que

J∗(x) ≥ l·‖x‖σ

∆J∗(x,KMPC(x)) ≤ −l·‖x‖σ

Entonces, si existe una constante r tal que J∗N(xk) ≤ r·‖xk‖σ, segun la teorıa de Lya-punov el sistema sea exponencialmente estable (ver apendice A). Para ello se va ademostrar primero que

‖x(k + 1|k)‖ ≤ ax·‖xk‖+ au·‖u∗(k|k)‖ ≤ (ax + au·bu)·‖xk‖ = α1·‖xk‖‖x(k + 2|k)‖ ≤ ax·‖x(k + 1|k)‖+ au·‖u∗(k + 1|k)‖

≤ (ax·α1 + au·bu)·‖xk‖ = α2·‖xk‖...

‖x(k + j|k)‖ ≤ ax·‖x(k + j + 1|k)‖+ au·‖u∗(k + j − 1|k)‖≤ (ax·αj−1 + au·bu)·‖xk‖ = αj·‖xk‖

Entonces se tiene que

J∗N(xk) =N−1∑

i=0

L(x(k + i|k), u∗(k + i|k)) + V (x(k + N |k))

≤N−1∑

i=0

cx·ασi ·‖xk‖σ + cu·bσ

u·‖xk‖σ+ dx·ασN‖xk‖σ

=

cx·

N−1∑

i=0

ασi + N ·cu·bσ

u + dx·ασN

·‖xk‖σ = r·‖xk‖σ

Page 60: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

44 3.3. Formulacion general del MPC

Las condiciones anteriores son suaves en general, salvo la impuesta sobre la secuenciade actuaciones, que esta relacionada con su continuidad Lipschitz. Esta condicion sesatisface bajo ciertas condiciones de regularidad del problema de optimizacion. En elapendice C se hace un analisis de esta propiedad.

3.3.2. Ejemplo de aplicacion al reactor

Para ilustrar el controlador MPC general se aplica este controlador sobre el reactorcontinuamente agitado que se muestra en el apendice B. Se va a considerar una funcionde coste cuadratica

L(x, u) = xT ·Q·x + uT ·R·u

siendo las matrices de ponderacion

Q =

10 0

0 1

R = 1

Para poder aplicar esta estrategia de control, es necesario calcular un invariantepositivo del sistema ası como una funcion de Lyapunov, o bien una CLF, asociada quesatisfagan la hipotesis 3.1. Como se muestra en la seccion 3.7, si el sistema linealizado enel punto de equilibrio es controlable, se puede establecer un procedimiento sistematicopara el calculo de un invariante positivo basado en la funcion de Lyapunov del sistemalinealizado. Procediendo de esta forma se disena un controlador por la tecnica LQRobteniendose el controlador uk = K·xk siendo

K =[−1,6154 −3,6644

]

para este controlador se calcula la funcion de Lyapunov V (x) = xT ·P ·x, que satis-face la condicion (3.4) en la region invariante

Ω = x ∈ IRn : V (x) ≤ α

siendo

P =

265,8811 49,3961

49,3961 125,9963

α = 9,3353

Considerando V (x) y Ω como funcion de coste terminal y region terminal, y tomandoun horizonte de prediccion N = 5, se aplica el controlador MPC al sistema, partiendo

Page 61: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 45

de diversos estados iniciales. De esta forma se ha obtenido el retrato de estados quese muestra en la figura 3.2 en la que tambien se puede observar la region terminalcalculada para el sistema Ω.

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Ω

Figura 3.2: Retrato de estados del reactor en bucle cerrado con N = 5.

En la figura 3.3 se muestra la evolucion a lo largo del tiempo de las senales delsistema partiendo de una concentracion inicial CA = 0,4 mol/l (x1 = −0,1) y unatemperatura inicial T = 357,6 K (x2 = 0,38). Considerando un horizonte de controlN = 5, el estado inicial es factible, por lo que es asintoticamente estabilizado porel controlador. Notese como el controlador satura la actuacion durante los primerosinstantes para no violar las restricciones impuestas.

Tal y como se demuestra en el teorema 3.2, la secuencia de valores del coste optimoes estrictamente decreciente a lo largo de la trayectoria optima como se puede ver enla figura 3.4.

3.4. MPC con horizonte de prediccion mayor que

el de control

En la formulacion general del MPC se considera como variables de decision lasactuaciones aplicadas a lo largo del horizonte de prediccion. Sin embargo, en la tradicionde los controladores predictivos lineales se encuentra la consideracion de un horizonte deprediccion mayor que el horizonte de control (Camacho & Bordons 1999). El horizonte

Page 62: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

46 3.4. MPC con horizonte de prediccion mayor que el de control

0 5 10 15 20 25 30 35 40 45 50

−0.1

−0.05

0

0.05

x 1

0 5 10 15 20 25 30 35 40 45 50−0.1

0

0.1

0.2

0.3

x 2

0 5 10 15 20 25 30 35 40 45 50

−1

−0.5

0

u

muestras

Figura 3.3: Evolucion de las senales del reactor en bucle cerrado.

0 5 10 15 20 25 30 35 40 45 50−2

−1.5

−1

−0.5

0

0.5

1

1.5

muestras

log 10

J* 5

Figura 3.4: Evolucion del logaritmo decimal del coste optimo del reactor.

de control se refiere al numero de variables de decision consideradas en el problema deoptimizacion. Esta medida permite considerar en el controlador el comportamiento delsistema en un horizonte mayor sin aumentar el numero de variables de decision, si bienes necesario fijar las actuaciones a considerar en la porcion de horizonte de prediccionque es mayor que el horizonte de control.

Esta medida fue traslada a sistemas no lineales en (Chen & Allgower 1997, Zheng2000), limitandose al caso de sistemas estables. En (Magni, De Nicolao, Magnani &Scattolini 2001) se generalizo para una formulacion particular del MPC, en la que seconsidera como funcion de coste terminal el coste de la evolucion del sistema controlado

Page 63: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 47

por la ley de control local u = h(x) en un horizonte finito suficientemente largo. Estaaproximacion es una version implementable de la formulacion propuesta por los autoresen (De Nicolao et al. 1998) en la cual consideran como coste terminal el coste infinitodel sistema controlado por un controlador local.

En esta seccion se extiende la formulacion general del MPC a la formulacion conmayor horizonte de prediccion y se establecen condiciones de estabilidad del contro-lador. Esta formulacion, no solo conserva las propiedades del controlador propuestoen (Magni, De Nicolao, Magnani & Scattolini 2001), sino que ademas posee algunasnuevas. Todas estas propiedades se analizan en secciones posteriores. Esta formulaciony su analisis posterior son una de las contribuciones originales de esta tesis.

3.4.1. Formulacion del controlador

Supongamos que el sistema satisface las siguientes hipotesis:

Hipotesis 3.5 El sistema es tal que existe un conjunto Ω que es un conjunto invariantepositivo del sistema controlado por una ley de control uk = h(xk), que verifica

(i) Ω ⊆ Xh = x ∈ X : h(x) ∈ U.(ii) El sistema en bucle cerrado tiene una funcion de Lyapunov asociada V (x) tal que

V (f(x, h(x)))− V (x) ≤ −L(x, h(x)) ∀ x ∈ Ω

Notese que esta hipotesis es la particularizacion de la hipotesis 3.1 al caso de unafuncion de Lyapunov, para la cual se conoce una ley de control estabilizante. La condi-cion terminal puede reescribirse como

[∆V + L](x, h(x)) ≤ 0

En lo que sigue se denota Lh(x) = L(x, h(x)) al coste de etapa asociado al estadode la planta x aplicando la ley de control local u = h(x).

El funcional considerado en el MPC con un horizonte de prediccion Np y un hori-zonte de control Nc viene dado por

JNc,Np(xk, uF (k)) =Nc−1∑

i=0

L(x(k+ i|k), u(k+ i|k))+Np−1∑

i=Nc

Lh(x(k+ i|k))+V (x(k+Np|k))

Page 64: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

48 3.4. MPC con horizonte de prediccion mayor que el de control

Notese que en este caso las variables de optimizacion son las Nc acciones de control alo largo del horizonte de control. A partir de entonces se considera que el sistema secontrola con la ley de control local uk = h(xk). Por tanto, el problema de optimizacionse formula de la siguiente manera:

mınuF (k)

JNc,Np(xk, uF (k))

s.a

u(k + j|k) ∈ U j = 0, · · · , Nc − 1

h(x(k + j|k)) ∈ U j = Nc, · · · , Np − 1

x(k + j|k) ∈ X j = 0, · · · , Np − 1

x(k + Np|k) ∈ Ω

En este caso las predicciones se realizan de forma que

x(k + j + 1|k) = f(x(k + j|k), u(k + j|k)) j = 0, · · ·Nc − 1

x(k + j + 1|k) = f(x(k + j|k), h(x(k + j|k))) j = Nc, · · ·Np − 1

siendo x(k|k) = xk.

En cada instante se resuelve este problema de optimizacion y se aplica sobre elsistema segun la estrategia de horizonte deslizante. Por tanto, la ley de control vienedada por

KMPC(xk) = u∗(k|k)

3.4.2. Condiciones suficientes de estabilidad

A continuacion se va a demostrar que el nuevo controlador estabiliza asintoticamenteel sistema bajo las mismas hipotesis que el MPC general. Esto permite extender laformulacion general del MPC a horizontes de prediccion mayores que el de control, locual es una contribucion de esta tesis.

Page 65: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 49

Teorema 3.6 (Estabilidad asintotica)

Sea un sistema xk+1 = f(xk, uk), tal que f(0, 0) = 0 y esta sujeto a las restriccionesxk ∈ X y uk ∈ U .Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y unaregion terminal Ω tales que satisfacen la hipotesis 3.5.Entonces el sistema controlado por la ley de control uk = KMPC(xk) con un horizonte deprediccion Np y un horizonte de control Nc es asintoticamente estable con un dominio deatraccion XNc,Np que es el conjunto de estados para los que el problema de optimizaciones factible.

Demostracion:

La demostracion es similar a la del teorema 3.2, por lo que habra razonamientos quese infieran de esta.

Factibilidad:

Al igual que en el MPC general, se puede obtener una solucion factible uF (k + 1) apartir de la solucion optima anterior u∗F (k). Esta viene dada por

u(k + j|k + 1) =

u∗(k + j|k) j = 1, · · · , Nc − 1

h(x(k + Nc|k + 1)) j = Nc

La secuencia de estados predichos obtenida al aplicar la secuencia de actuacionesuF (k + 1) se denota x(k + j|k + 1).

Dado que el sistema no discrepa del modelo, se tiene que xk+1 = x(k+1|k). Entoncesla prediccion nominal en k+1 a partir de la secuencia factible satisface que x(k+ j|k+1) = x∗(k + j|k) para j = 1, · · · , Nc. Ademas, dado que x(k +Nc|k +1) = x∗(k +Nc|k),y que a partir de este instante se aplica la ley de control local u = h(x), se tiene quex(k + j|k +1) = x∗(k + j|k) para j = Nc +1, · · · , Np. Por lo tanto x(k +Np|k +1) ∈ Ω,y de la hipotesis 3.5 se tiene que la ley de control local proporciona una actuacionadmisible tal que x(k + Np + 1|k + 1) ∈ Ω ⊆ X.

Por tanto, la restriccion en el estado, ası como la restriccion terminal, y la restriccionsobre las actuaciones se satisfacen, y en consecuencia la secuencia uF (k +1) es factible.

De aquı se deduce que para todo xk ∈ XNc,Np , el estado siguiente xk+1 ∈ XNc,Np ,luego el conjunto factible XNc,Np es un invariante positivo del sistema en bucle cerrado.

Convergencia:

Sea JNc,Np(xk+1) el coste en el estado xk+1 asociado a la actuacion factible uF (k + 1),

Page 66: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

50 3.4. MPC con horizonte de prediccion mayor que el de control

entonces dado que x∗(k + Np|k) ∈ Ω y considerando la hipotesis 3.5, se tiene que

JNc,Np(xk+1)− J∗Nc,Np(xk) = −L(xk, u

∗(k|k)) +Lh(x(k + Np|k + 1))

+V (x(k + Np + 1|k + 1))− V (x∗(k + Np|k))

= −L(xk, u∗(k|k))

+[∆V + L](x∗(k + Np|k), h(x∗(k + Np|k)))

≤ −L(xk, u∗(k|k))

Por tanto, del principio de optimalidad se tiene que

J∗Nc,Np(xk+1)− J∗Nc,Np

(xk) ≤ JNc,Np(xk+1)− J∗Nc,Np(xk) ≤ −L(xk, u

∗(k|k))

De aquı se deduce que el coste optimo es una funcion de Lyapunov estrictamentedecreciente y, por tanto, el sistema es asintoticamente estable.

Como se comento anteriormente, esta formulacion es una generalizacion de la pro-puesta en (Magni, De Nicolao, Magnani & Scattolini 2001). En dicho trabajo se utilizacomo coste terminal, una version truncada del coste infinito del sistema controladopor la ley de control local. El numero de terminos considerados en el coste terminalse calcula para garantizar que el sistema en bucle cerrado sea asintoticamente estable.Estas condiciones dan como resultados altos valores del horizonte y ademas, dichohorizonte depende del estado terminal del sistema, y del estado inicial de la planta.Esto es un gran inconveniente, pues la sintonizacion del controlador depende de laevolucion del sistema. Estas desventajas se mitigan en la formulacion propuesta, en laque se demuestra estabilidad para un coste terminal fijo.

Si bien la formulacion propuesta en (Magni, De Nicolao, Magnani & Scattolini 2001)presenta ciertas propiedades entre las que destacan un mayor dominio de atraccion yun mejor desempeno debido al mayor grado de optimalidad. Esta ultima tan solo severifica en el caso de coste terminal con horizonte infinito (que es irrealizable desde unpunto de vista practico, salvo en el caso de sistemas lineales). En secciones posterioresy en el capıtulo siguiente, se demuestra que la formulacion que se propone en esta tesisconserva las propiedades del controlador anterior y ademas presenta un mayor gradode optimalidad sin tener que recurrir a soluciones meramente teoricas.

3.4.3. Ejemplo de aplicacion al reactor

El controlador MPC propuesto se aplica al reactor utilizando los parametros delcontrolador (coste de etapa, region y coste terminal) presentados en el ejemplo de laseccion 3.3.2. Considerando en este caso un horizonte de control Nc = 3 y un horizonte

Page 67: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 51

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Figura 3.5: Retrato de estados del sistema en bucle cerrado.

de prediccion Np = 15, se aplica el MPC al sistema partiendo de diversos estadosiniciales, dando como resultado el retrato de estados que se muestra en la figura 3.5.

En la figura 3.6 se muestra la evolucion a lo largo del tiempo de las senales delsistema partiendo de una concentracion inicial CA = 0,4 mol/l (x1 = −0,1) y unatemperatura inicial T = 357,6 K (x2 = 0,38).

0 5 10 15 20 25 30 35 40 45 50−0.2

−0.15

−0.1

−0.05

0

0.05

x 1

0 5 10 15 20 25 30 35 40 45 50

0

0.2

0.4

x 2

0 5 10 15 20 25 30 35 40 45 50

−1

−0.5

0

0.5

u

muestras

Figura 3.6: Evolucion de las senales del sistema en bucle cerrado.

Page 68: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

52 3.5. MPC con coste terminal cuasi-infinito

Tal y como se demuestra, la secuencia de valores del coste optimo es estrictamentedecreciente a lo largo de la trayectoria optima como se puede ver en la figura 3.7.

0 5 10 15 20 25 30 35 40 45 50−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

log 10

J*

muestras

Figura 3.7: Evolucion del logaritmo decimal del coste optimo.

Notese que manteniendo una complejidad de calculo similar a la formulacion ge-neral, se extienden los estados futuros a considerar en el controlador de 3 a 15. Estoconfiere un mejor comportamiento al sistema y un mayor dominio de atraccion comose demostrara posteriormente.

3.5. MPC con coste terminal cuasi-infinito

En el artıculo (De Nicolao et al. 1998) se presenta una formulacion del MPC conestabilidad garantizada. Esta emplea como coste terminal el coste con horizonte infinitodel controlador local, es decir,

V∞(x) =i=∞∑

i=0

L(xh(i + j|j), h(xh(i + j|j)))

siendo xh(i + j|j) la prediccion del estado del sistema en el instante i + j, controladopor la ley de control local u = h(x), partiendo de xh(j|j) = x .

Esta eleccion de coste terminal satisface la hipotesis 3.5 pues, si la ley local esasintoticamente estabilizable, se verifica que

V∞(f(x, h(x)))− V∞(x) = −L(x, h(x))

y por tanto garantiza la estabilidad asintotica del sistema en bucle cerrado. Sin embar-go, esta es una solucion meramente teorica pues es practicamente imposible calcular el

Page 69: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 53

coste infinito V∞(x) de forma analıtica, salvo en el caso de sistemas lineales. Este costese podrıa calcular en lınea de forma numerica, pero el horizonte infinito hace que seaimposible a menos que se aproxime por el coste en un horizonte finito suficientementelargo. En este caso, podrıa no estar garantizada la estabilidad del controlador.

Esta limitacion se resolvio en un trabajo posterior (Magni, De Nicolao, Magnani& Scattolini 2001) limitando el coste a un horizonte finito. Esta solucion garantizaestabilidad para un horizonte suficientemente largo como para que sea una aproxi-macion suficientemente precisa. Este horizonte se fija a partir de una condicion quedepende del estado terminal predicho en cada instante y del estado en que se encuentrael sistema. Por lo tanto depende de la evolucion del sistema, lo que la hace muy difıcil decomprobar a priori. Esta condicion, que en el artıculo se presenta como una condiciontecnica, es clave para la demostracion de la estabilidad del controlador, no estandogarantizada si esta no se cumple.

En esta seccion se presenta un coste terminal con horizonte finito de la forma5

VM(x) =j=M−1∑

j=0

Lh(xh(i + j|i)) + V (xh(i + M |i)) (3.5)

siendo V (·) una funcion de Lyapunov del sistema que satisface la hipotesis 3.5. Estecoste terminal se denomina coste terminal con horizonte cuasi-infinito, o simplementecoste terminal cuasi-infinito.

Este coste terminal garantiza la estabilidad del MPC para cualquier horizonteM ≥ 1 y ademas puede aproximar arbitrariamente bien el coste infinito. Esta formu-lacion conserva, como se vera, la optimalidad de la formulacion de (Magni, De Nicolao,Magnani & Scattolini 2001) sin los problemas que esta presenta. Este controlador ysus resultados asociados constituye una de las aportaciones originales de esta tesis.

El nuevo controlador que se presenta en esta seccion se basa en el siguiente resultado:

Lema 3.7 Sea la funcion V (x) y la region Ω tales que satisfacen la hipotesis 3.5. Seala funcion

VM(x) =j=M−1∑

j=0

Lh(xh(i + j|i)) + V (xh(i + M |i)) (3.6)

siendo xh(i+j|i) la prediccion del sistema controlado por la ley de control local u = h(x)considerando x(i|i) = x, de forma que

xh(i + j + 1|i) = f(xh(i + j|i), h(xh(i + j|i)))5En lo que sigue y por sencillez en la presentacion de los resultados se denota Lh(x) = L(x, h(x)).

Page 70: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

54 3.5. MPC con coste terminal cuasi-infinito

Entonces la funcion VM(x) y la region ShM(X, Ω) 6 tambien satisfacen la hipotesis 3.5.

Demostracion:

De la teorıa de conjuntos invariantes se deduce que el conjunto ShM(X, Ω) ⊆ Xh es un

invariante positivo del sistema por serlo Ω. Entonces, para todo x ∈ ShM(X, Ω) se tiene

que

VM(f(x, h(x)))− VM(x) = V (xh(i + M + 1|i)) + Lh(xh(i + M |i))−Lh(x)− V (xh(i + M |i))

≤ −Lh(x) + ∆V (xh(i + M |i)) + Lh(x(i + M |i))

Dado que x ∈ ShM(X, Ω), entonces xh(i + M |i) ∈ Ω, y por lo tanto por la hipotesis

3.5 se tiene queVM(f(x, h(x)))− VM(x) ≤ −Lh(x)

con lo que se demuestra el lema.

Nota 3.8 Bajo las condiciones del lema 3.7, es facil demostrar que para cualquierconjunto invariante positivo del sistema controlado por la ley de control local u = h(x),Γ ⊆ Sh

M(X, Ω), la funcion de Lyapunov VM(x) y el conjunto Γ tambien satisfacen lahipotesis 3.5. En particular tambien se satisface con el conjunto Ω.

La funcion VM(x) tiene una serie de propiedades que se establecen en el siguienteteorema:

Teorema 3.9 Sea V (x) la funcion de Lyapunov de la hipotesis 3.5 y sea VM(x) lafuncion de Lyapunov definida a partir de V (x) como en el lema 3.7. Entonces se tieneque:

(i) V (x) ≥ VM(x), para todo M ≥ 1, para todo x ∈ Ω.

(ii) VM(x) ≥ ∞∑j=0

Lh(xh(i + j|i)) = V∞(x) siendo x(i|i) = x, para todo x ∈ ShM(X, Ω).

(iii) VM(x) ≥ VM+1(x) para todo x ∈ ShM(X, Ω).

6La region ShM (X, Ω) es el conjunto de estados del sistema controlado por la ley de control u = h(x)

tales que la evolucion del sistema es admisible y ademas alcanzan Ω en M pasos. Vease la seccion A.3.

Page 71: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 55

(iv) VM(x)− V∞(x) ≥ VM(f(x, h(x)))− V∞(f(x, h(x))) para todo x ∈ ShM(X, Ω).

Demostracion:

(i) De la hipotesis 3.5 se tiene que para todo x ∈ Ω se verifica

V (xh(i + j|i))− V (xh(i + j + 1|i)) ≥ Lh(xh(i + j|i))

siendo x(i|i) = x. De aquı se deduce que

V (x)− V (xh(i + M |i)) =j=M−1∑

j=0

V (xh(i + j|i))− V (xh(i + j + 1|i))

≥j=M−1∑

j=0

Lh(xh(i + j|i))

Por tanto V (x) ≥ VM(x), lo que demuestra la primera afirmacion del teorema.

(ii) De la invariancia positiva de ShM(X, Ω), se tiene que para todo x ∈ Sh

M(X, Ω)implica que xh(i + j|i) ∈ Sh

M(X, Ω) para todo i ≥ 0. Entonces, aplicando el lema3.7 se tiene que

VM(xh(i + j|i))− VM(xh(i + j + 1|i)) ≥ Lh(xh(i + j|i))

siendo xh(i|i) = x. De aquı se deduce que

j=∞∑

j=0

VM(xh(i + j|i))− VM(xh(i + j + 1|i)) ≥j=∞∑

j=0

Lh(xh(i + j|i))

= V∞(x)

dado que el sistema controlado con la ley de control u = h(x) es asintoticamenteestable en Ω, el termino de la izquierda se reduce a VM(x), lo que demuestra lapropiedad.

(iii) Para demostrar la tercera consecuencia basta con considerar que

VM+1(x)− VM(x) = Lh(xh(i + M |i)) + V (xh(i + M + 1|i))− V (xh(i + M |i))= ∆V (xh(i + M |i), h(xh(i + M |i))) + Lh(xh(i + M |i))

dado que xh(i + M |i) ∈ Ω, de la hipotesis 3.5 se demuestra la propiedad.

(iv) La cuarta propiedad surge inmediatamente considerando que

VM(x)− VM(f(x, h(x))) ≥ Lh(x) = V∞(x)− V∞(f(x, h(x)))

Page 72: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

56 3.5. MPC con coste terminal cuasi-infinito

De estos resultados se deriva que para todo x ∈ Ω, la diferencia

VM(x)− V∞(x)

se puede hacer tan pequena como se desee tomando un valor de M suficientementegrande.

Por ejemplo, supongamos que el controlador local u = h(x) de la hipotesis 3.5estabiliza exponencialmente al sistema en Ω = x : V (x) ≤ α. Por tanto existe unaconstante ρ ∈ [0, 1) tal que

V (f(x, h(x)) ≤ ρ·V (x)

Si se quiere que la diferencia sea

VM(x)− V∞(x) ≤ ε

se puede encontrar un valor de M(ε) tal que para todo M ≥ M(ε) se verifique lacondicion anterior.

En efecto, de las propiedades de VM(x) se tiene que

VM(x)− V∞(x) = V (xh(i + M |i))− V∞(xh(i + M |i))dado que x ∈ Ω, se tiene que

V (xh(i + M |i)) ≤ ρM ·V (x) ≤ ρM ·αpor lo tanto, considerando que V∞(x) ≥ 0, se verifica que

VM(x)− V∞(x) ≤ ρM ·α

En consecuencia considerando un M tal que ρM ·α ≤ ε, se satisface la condicion.Por lo tanto, de aquı se deduce que para todo M tal que

M ≥ M(ε) =log (α)− log (ε)

log (1/ρ)

la diferencia VM(x)− V∞(x) ≤ ε.

A continuacion se presenta un corolario que establece que considerando como costeterminal VM(x), el MPC es asintoticamente estable para cualquier valor del numero demuestras consideradas en el coste terminal M . Esto generaliza el resultado de (Magni,De Nicolao, Magnani & Scattolini 2001), pues la estabilidad se conserva para cualquiervalor de M considerado, independientemente del estado en el que se encuentre el sis-tema. Ademas puede aproximar el coste infinito con la precision que se desee, sincondicionar el valor de M tomado, la estabilidad del controlador.

Page 73: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 57

Corolario 3.10 Sea V (x) y Ω tales que satisfacen la hipotesis 3.5. Sea un controladorMPC de horizonte de control Nc y horizonte de prediccion Np tal que la region terminales Ω y el coste terminal

VM(x) =j=M−1∑

j=0

Lh(xh(i + j|i)) + V (xh(i + M |i)) (3.7)

siendo xh(i + j|i) la prediccion del sistema controlado por la ley de control local u =h(x) considerando x(i|i) = x. Entonces el controlador predictivo anterior estabilizaasintoticamente el sistema para todo M ≥ 1 y el dominio de atraccion XNc,Np es elconjunto de estados para los que el problema es factible.

La demostracion es consecuencia inmediata del teorema 3.6, dado que por el lema3.7 la region terminal VM(x) y Ω satisfacen la hipotesis 3.5.

Este controlador propuesto permite observar el efecto del aumento del horizonte deprediccion desde una nueva perspectiva.

El controlador MPC con horizonte de control Nc y horizonte de prediccion Np =Nc + M formulado con region terminal Ω y coste terminal V (x), puede considerarsecomo un controlador MPC general con horizonte Nc tal que la funcion de coste terminales VM(x) y la region terminal Sh

M(X, Ω).

El caracter no lineal del modelo hace que en general sea imposible calcular conexactitud dicho conjunto. Por tanto, la ventaja de la formulacion con un mayor hori-zonte de prediccion Np es basicamente que evita el calculo del conjunto Sh

M(X, Ω). Ası,permite considerar una mayor region terminal (y en consecuencia, un mayor dominiode atraccion) sin necesidad de calcular dicho invariante.

3.5.1. Ejemplo de aplicacion al reactor

El controlador propuesto se aplica al control del reactor sintonizado con el mismocoste de etapa y el invariante positivo y la funcion de Lyapunov utilizadas como regiony coste terminal en la seccion 3.3.2.

Para comprobar las propiedades demostradas de la funcion de coste terminal VM(x)se ha calculado, para un estado contenido en Ω, el valor de VM(x) frente a M . El re-sultado obtenido se muestra en la figura 3.8(a). Se puede comprobar el caracter estric-tamente decreciente de VM(x) al aumentar M , evolucionando hacia V∞(x) tomandovalores siempre superiores. Notese como, considerando un M suficientemente largo, elcoste VM(x) aproxima arbitrariamente bien el coste infinito V∞(x).

Page 74: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

58 3.6. El MPC como controlador optimo cuasi-infinito

Otra propiedad interesante es que V (x) ≥ VM(x) para todo x ∈ Ω y para todoM ≥ 1. Para ilustrar esto, en la figura 3.8 (b) se muestra la evolucion del coste VM(xk)con M = 10, junto con el de V (xk) a lo largo de la evolucion del sistema regulado con elcontrolador local. En esta figura se observa como la evolucion de ambas funciones sonestrictamente decrecientes, por ser ambas funciones de Lyapunov del sistema y ademasV (xk) ≥ VM(xk) y su diferencia se reduce a medida que se acerca el sistema al puntode equilibrio.

0 5 10 15 20 25 30 35 40 45 500.6

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1

M

log 10

VM

(x)

0 10 20 30 40 50 60 70 80 90 100−6

−5

−4

−3

−2

−1

0

1

muestras

log10

V10

(xk)

log10

V(xk)

(a) (b)

Figura 3.8: (a) Variacion de VM (x) frente a M , (b) Evolucion de V10(xk) y V (xk).

A continuacion se muestra la evolucion del sistema controlado con el controladorMPC propuesto considerando Nc = 5, Np = 5 y M = 10. En la figura 3.9 se puedeobservar el plano de fases del sistema en bucle cerrado. En la figura 3.10 se muestrala evolucion de las senales del sistema partiendo de un estado inicial x1 = −0,1 yx2 = 0,38.

3.6. El MPC como controlador optimo cuasi-infinito

El MPC es una formulacion implementable de los controladores optimos con hori-zonte infinito. Estos controladores tratan de optimizar el coste del comportamiento delsistema a lo largo de toda su evolucion. Esto confiere propiedades muy interesantes aestos controladores como optimalidad, robustez y ademas la posibilidad de conducirhacia el origen al sistema partiendo de cualquier estado asintoticamente estabilizable.La trayectoria del sistema ası controlado es aquella que minimiza el coste de su evolu-cion, no existiendo otra con menor coste. Por ello, es la trayectoria que optimiza eldesempeno impuesto sobre el sistema mediante el coste de etapa.

El horizonte finito y fijo con el que se resuelve el MPC hace que la trayectoriaque sigue el sistema pueda diferir de la obtenida por el controlador con horizonte

Page 75: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 59

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Figura 3.9: Retrato de estados del sistema con M = 10.

0 5 10 15 20 25 30 35 40 45 50

−0.1

−0.05

0

0.05

x 1

0 5 10 15 20 25 30 35 40 45 50

0

0.2

0.4

x 2

0 5 10 15 20 25 30 35 40 45 50

−1

−0.5

0

u

muestras

Figura 3.10: Evolucion de las senales del sistema en bucle cerrado.

infinito. Por consiguiente la trayectoria no es optima y por lo tanto presenta un peorcomportamiento.

En esta seccion se analiza la relacion que existe entre ambas soluciones desde unpunto de vista de la optimalidad. Ademas se analiza como influyen los distintos ele-mentos del controlador sobre esta, demostrandose que las formulaciones presentadasanteriormente proveen de un mejor comportamiento al sistema en bucle cerrado. Este

Page 76: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

60 3.6. El MPC como controlador optimo cuasi-infinito

analisis se realiza para la formulacion con Np ≥ Nc por ser esta mas general, pues losresultados son extrapolables al caso de Nc = Np.

En lo que sigue se denota J∗∞(x) al coste optimo con horizonte infinito. Se denominaJ∗Nc,∞(x) al coste optimo del MPC con horizonte de control Nc y horizonte de prediccioninfinito. Por ultimo, JMPC

∞ (x) representa el coste asociado a la evolucion del sistemacontrolado por el MPC, partiendo del estado x.

3.6.1. El MPC general como controlador con horizonte cuasi-infinito

En (Chen & Allgower 1998b) se presenta una formulacion denominada MPC conhorizonte cuasi-infinito. Esta se basa en la incorporacion en el funcional de una funcionde coste terminal que es una cota superior del coste optimo del estado terminal. En esteapartado se comprueba que esta propiedad tambien la satisface la formulacion generaldel MPC. Para ello, en el siguiente lema se muestra una propiedad interesante de lafuncion de coste.

Lema 3.11 Sea V (x) una funcion de Lyapunov de control tal que satisface la hipotesis3.5, entonces se tiene que V (x) ≥ J∗∞(x) para todo x ∈ Ω.

Demostracion:

Sea u = h(x) la ley de control local asociada a V (x). Entonces del teorema 3.9 se tieneque para todo x ∈ Ω

V (x) ≥ V∞(x)

por otro lado, de la optimalidad del control con horizonte infinito se deduce queV∞(x) ≥ J∗∞(x), y por lo tanto

V (x) ≥ J∗∞(x)

lo que demuestra el lema.

De esta propiedad se puede inferir el siguiente resultado:

Propiedad 3.12 Del lema anterior se deduce que para todo xk ∈ XNc,Np

J∗Nc,Np(xk) ≥ J∗∞(xk)

Page 77: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 61

Por tanto la hipotesis 3.5 garantiza que el coste a optimizar es una cota superior delcoste infinito, de forma que la convergencia del coste del MPC garantiza en cierta formala convergencia del coste infinito.

3.6.2. Influencia de los horizontes en el coste optimo del MPC

A continuacion se analiza como influye un incremento en los horizontes de controly de prediccion sobre el coste optimo del MPC.

Teorema 3.13 Sea un sistema y un controlador MPC tal que satisfacen las hipotesisdel teorema 3.6, entonces se tiene que para todo xk ∈ XNc,Np

J∗Nc,Np(xk) ≥ J∗Nc+1,Np

(xk)

Demostracion:

Sea u∗F (k) la solucion optima del MPC en el estado xk con horizontes Nc y Np, con uncoste asociado J∗Nc,Np

(xk). Entonces la secuencia uF (k) dada por

u(k + j|k) =

u∗(k + j|k) j = 0, · · · , Nc − 1

h(x∗(k + Nc|k)) j = Nc

es factible en el mismo estado xk, para unos horizontes Nc + 1 y Np. Esto se derivadel hecho que x(k + j|k) = x∗(k + j|k) para todo j = 0, · · · , Np. Ademas, dado quex∗(k + Nc|k) ∈ Sh

Np−Nc(X, Ω) la actuacion, h(x∗(k + Nc|k)) es admisible.

Sea el JNc+1,Np(xk) el coste asociado a la actuacion factible. Entonces se tiene que

J∗Nc,Np(xk) = JNc+1,Np(xk)

y del principio de optimalidad se deduce que

J∗Nc+1,Np(xk) ≤ JNc+1,Np(xk) = J∗Nc,Np

(xk)

En consecuencia, cuanto mayor es el horizonte de control, menor sera el coste opti-mo. Por tanto al aumentar el horizonte de control se gana en optimalidad de la solucionpero a costa de aumentar el coste computacional en la resolucion del problema. Analogoresultado se obtiene a continuacion al aumentar el horizonte de prediccion.

Page 78: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

62 3.6. El MPC como controlador optimo cuasi-infinito

Teorema 3.14 Sea un sistema y un controlador MPC tal que satisfacen las hipotesisdel teorema 3.6, entonces se tiene que

J∗Nc,Np(xk) ≥ J∗Nc,Np+1(xk)

Demostracion:

Sea u∗F (k) la solucion optima del MPC con coste JNc,Np(xk, uF ), entonces, dado que laley de control local u = h(x) es estabilizante, uF (k) = u∗F (k) es una solucion factibledel problema de optimizacion con horizonte Np+1. Por lo tanto x(k+j|k) = x∗(k+j|k)para todo j = 1, · · · , Np. Ademas se tiene que

x(k + Np + 1|k) = f(x∗(k + Np|k), h(x∗(k + Np|k)))

Entonces se tiene que

JNc,Np+1(xk)− J∗Nc,Np(xk) = Lh(x

∗(k + Np|k)) + V (x(k + Np + 1|k))

−V (x∗(k + Np|k)) ≤ 0

dado que x∗(k + Np|k) ∈ Ω. Del principio de optimalidad se deduce que

J∗Nc,Np+1(xk) ≤ JNc,Np+1(xk) ≤ J∗Nc,Np(xk)

Notese que el controlador propuesto verifica que un aumento del horizonte de predic-cion reduce el coste optimo y por lo tanto se aproxima mas a la optimalidad, mejorandoel comportamiento del sistema en bucle cerrado. Esta mejora se consigue sin un incre-mento apreciable del coste computacional.

3.6.3. El MPC como aproximacion al controlador con hori-zonte infinito

A continuacion se analizan propiedades de los nuevos controladores MPC propues-tos en relacion a su aproximacion al controlador con horizonte infinito, es decir, ala optimalidad de la solucion. Ası, cuanto mayor sea la optimalidad de la solucionobtenida, mejor sera el comportamiento del sistema en bucle cerrado. Este analisis esuna de las contribuciones de esta tesis.

Corolario 3.15 Sea V (x) y Ω tales que satisfacen la hipotesis 3.5. Sea uF (k) unasecuencia factible del MPC en el estado xk con horizonte de prediccion Np y de control

Page 79: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 63

Nc. Sea JMNc,Np

(xk, uF (k)) el coste de dicha secuencia considerando como coste terminalVM(·) y sea JNc,Np(xk, uF (k)) el coste considerando como coste terminal V (·). Entonces

JNc,Np(xk, uF (k)) ≥ JMNc,Np

(xk, uF (k))

Es decir, que considerar como coste terminal VM(·) en el MPC reduce el costeoptimo y por tanto se acerca mas a la evolucion optima. Este corolario se deduce de lapropiedad

V (x) ≥ VM(x)

para todo M ≥ 1 y para todo x ∈ Ω, demostrada en el teorema 3.9.

Corolario 3.16 Bajo las hipotesis del teorema 3.6, para cualquier secuencia factibleuF (k), la funcion de coste con horizonte de prediccion Np es una cota superior del costecon horizonte de prediccion infinito

JNc,Np(xk, uF (k)) ≥ JNc,∞(xk, uF (k))

Esto es consecuencia inmediata del corolario anterior, de la propiedad VM(x) ≥ V∞(x)demostrada en el teorema 3.9.

Corolario 3.17 De las propiedades anteriores se deduce que, para toda secuenciafactible uF (k)

JNc,Np(xk, uF (k)) ≥ JMNc,Np

(xk, uF (k)) ≥ JNc,∞(xk, uF (k))

y ademas la diferencia JMNc,Np

(xk, uF )− JNc,∞(xk, uF ) se puede reducir arbitrariamentetomando un valor de M suficientemente grande.

Esto se deduce de que

JMNc,Np

(xk, uF )− JNc,∞(xk, uF ) = VM(x(k + Np|k))− V∞(x(k + Np|k))

y de que esta diferencia se puede hacer tan pequena como se desee tomando un valorde M suficientemente grande.

A continuacion se va a analizar la relacion del coste optimo del MPC obtenido en xk

con el coste en que incurre la evolucion del sistema controlado por el MPC a partir deese estado, lo cual forma parte del trabajo original realizado en la tesis. Ası, se denotaJMPC∞ (xk) al coste infinito asociado al sistema controlado por el MPC, es decir,

JMPC

∞ (xk) =j=∞∑

j=0

L(xk+j, KMPC(xk+j))

Page 80: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

64 3.6. El MPC como controlador optimo cuasi-infinito

Teorema 3.18 Sea un sistema tal que satisface la hipotesis 3.5. Sea un controladorMPC tal que la region terminal es Ω y el coste terminal V (x), la funcion de Lyapunovasociada. Entonces se verifica que

J∗Nc,Np(xk) ≥ JMPC

∞ (xk)

y ademas, la diferencia entre ambas es monotonamente decreciente con el tiempo

J∗Nc,Np(xk)− JMPC

∞ (xk) ≥ J∗Nc,Np(xk+1)− JMPC

∞ (xk+1)

Demostracion:

Por las hipotesis se tiene que el sistema controlado por el MPC es asintoticamenteestable y ademas el coste optimo satisface

J∗Nc,Np(xk+j)− J∗Nc,Np

(xk+j+1) ≥ L(xk+j, KMPC(xk+j))

por tanto

j=∞∑

j=0

J∗Nc,Np

(xk+j)− J∗Nc,Np(xk+j+1)

j=∞∑

j=0

L(xk+j, KMPC(xk+j)) = JMPC

∞ (xk)

dado que el sistema controlado por el MPC es asintoticamente estable, el termino dela izquierda se reduce a J∗Nc,Np

(xk), lo que demuestra la primera afirmacion del teorema.

La monotonıa se deduce de

J∗Nc,Np(xk)− J∗Nc,Np

(xk+1) ≥ L(xk, KMPC(xk))

= JMPC

∞ (xk)− JMPC

∞ (xk+1)

de donde se tiene que

J∗Nc,Np(xk)− JMPC

∞ (xk) ≥ J∗Nc,Np(xk+1)− JMPC

∞ (xk+1)

y por recurrencia se demuestra la propiedad.

Nota 3.19 De todo lo expuesto hasta ahora se puede obtener el siguiente balance:

J∗Nc(x) ≥ J∗Nc,Np

(x) ≥ JMNc,Np

(x) ≥ JMPC

∞ (x) ≥ J∗∞(x)

siendo JMPC∞ (x) el coste de la evolucion del sistema controlado por la ley de control

obtenida con Nc, Np y M .

Page 81: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 65

Este es quiza el resultado mas importante de todo este analisis: las nuevas formu-laciones propuestas consistentes en el aumento del horizonte de prediccion, ası comola consideracion como coste terminal VM(·) producen una reduccion del coste optimodel MPC y por lo tanto un comportamiento del sistema mas optimo y un mejor com-portamiento del sistema en bucle cerrado. Ademas el coste computacional en el que seincurre por la incorporacion de estas medidas no es grande y, dado que la estabilidadesta garantizada para todo Np ≥ Nc y M ≥ 0, estos elementos se pueden anadir enfuncion del tiempo de calculo disponible sin peligrar la estabilidad.

3.6.4. Ejemplo de aplicacion al reactor

Para ilustrar las propiedades de optimalidad del MPC se va a analizar como influyenlos distintos parametros sobre el sistema partiendo del estado inicial CA = 0,2 mol/l yT = 340 K que equivale a x1 = −0,3 y x2 = −0,5.

En la figura 3.11 se muestra la variacion del coste optimo del MPC en un estadodeterminado al variar el horizonte de control (considerando Np = Nc). Como se puedeobservar, el coste optimo disminuye al aumentar el horizonte de control tal y como sedemostro.

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2020

25

30

35

40

45

Nc

J* Nc

Figura 3.11: Variacion del coste optimo con Nc.

En la figura 3.12 se puede observar la variacion del coste optimo del MPC con unhorizonte de control fijo Nc = 5, para una serie de valores del horizonte de prediccion.Tal y como se demostro, el coste optimo disminuye monotonamente al aumentar Np.

En el analisis realizado anteriormente se ha demostrado que al aumentar el horizontede control, o el de prediccion o bien tomando como coste terminal el cuasi-infinito, el

Page 82: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

66 3.6. El MPC como controlador optimo cuasi-infinito

5 10 15 20 25 30 35 40 45 5020

25

30

35

40

45

Np

J* 5,N

p

Figura 3.12: Variacion del coste optimo con Np.

coste del MPC se reduce tendiendo a la optimalidad. En consecuencia, la evoluciondel sistema en cada una de estas situaciones debe tender a la trayectoria optima delsistema. Esto se ilustra en la figura 3.13, en la que se muestran las trayectorias delsistema controlado con un horizonte de control Nc = 4 y Np = 4, otra con un horizontede control Nc = 4 y un horizonte de prediccion Np = 10, otra igual a la anterior peroconsiderando como coste terminal V10(x) y por ultimo la evolucion optima.

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2

−0.5

−0.4

−0.3

−0.2

−0.1

0

0.1

0.2

0.3

x1

x 2

Nc=4

Nc=4, N

p=10

Nc=4, N

p=10, M=10

Nc=∞

Figura 3.13: Tendencia a la optimalidad al variar Nc, Np y M .

Ademas se han calculado los costes optimos en el estado inicial, obteniendose lossiguientes resultados

Page 83: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 67

J∗4 (x0) 33.5711

J∗4,10(x0) 29.4109

J104,10(x0) 25.7196

JMPC∞ (x0) 23.6733

J∗∞(x0) 23.5891

siendo JMPC∞ (x0) el coste de la evolucion del MPC con Nc = 4, Np = 10 y M = 10.

En esta tabla se puede comprobar como un aumento del horizonte de prediccion y/odel numero de terminos del coste terminal cuasi-infinito, hacen que el coste optimodisminuya, aproximandose el controlador al optimo. Tambien el aumento del horizontede control aproxima el controlador, pero al contrario que las medidas anteriores, estasupone una mayor carga computacional.

3.7. Calculo de la region terminal

El elemento esencial en la sintonizacion de un controlador MPC con estabilidadgarantizada para un sistema es, sin duda, el calculo de la region terminal y una funcionde Lyapunov asociada tales que satisfagan la hipotesis 3.5. En la literatura se hanpropuesto metodos para su calculo en el caso de sistemas continuos (Michalska &Mayne 1993, Chen & Allgower 1998b) y discretos (Parisini & Zoppoli 1995, Magni, DeNicolao, Magnani & Scattolini 2001) garantizando la existencia de ambos. Sin embargo,la necesidad de calcular Ω y V (x) se presenta habitualmente como una desventaja delMPC, por la complejidad que ello entrana. Teniendo en cuenta que con ello se obtieneestabilidad de un sistema no lineal sujeto a restricciones, el calculo de esta region esinsignificante comparado con las ventajas que ofrece el controlador MPC. Ademas,dado que el invariante es una vecindad de un punto de equilibrio, permite el uso detecnicas locales. Por ultimo, hay que resaltar, que el calculo se hace fuera de lınea, porlo que no supone un mayor coste computacional del controlador.

Con el fin de mostrar que el calculo de la region y coste terminal es una tareaabordable, aunque costosa, se presenta aquı un procedimiento de calculo para el casode coste de etapa cuadratico

L(x, u) = ‖x‖2Q + ‖u‖2

R

siendo la matriz Q semidefinida positiva y R definida positiva. En este procedimiento,similar al presentado en (Magni, De Nicolao, Magnani & Scattolini 2001), se suponeque el modelo del sistema

xk+1 = f(xk, uk)

Page 84: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

68 3.7. Calculo de la region terminal

es una funcion C2 y ademas que el sistema linealizado en el origen es estabilizable.

Para la determinacion del coste terminal y de la region terminal deben seguirse lossiguientes pasos:

1. Sea el sistema linealizado en el origen xk+1 = A·xk + B·uk siendo

A =∂f(x, u)

∂x

∣∣∣∣∣(0,0)

y B =∂f(x, u)

∂u

∣∣∣∣∣(0,0)

Calcular un controlador uk = K·xk por cualquier procedimiento habitual (LQR,PID, asignacion de polos, etc.), tal que estabilice asintoticamente el sistema lin-ealizado.

2. Sea AK = A + B·K y sea Q∗ = Q + KT ·R·K. Tomese una matriz Q Â Q∗ (porejemplo Q = λ·Q∗ para cierto λ > 1) y calculese la matriz P tal que

ATK ·P ·AK − P = −Q

3. Sea V (x) = xT ·P ·x. Calcular la constante α > 0 tal que para todo

x ∈ Ωα = x ∈ IRn : V (x) ≤ α

se satisfaga

Ωα ⊆ XK = x ∈ X : u = K·x ∈ UV (f(x, K·x))− V (x) ≤ −xT ·Q∗·x

4. Si se desea calcular el invariante positivo en el cual el sistema es asintoticamenteestable pero en el que no se verifica la hipotesis 3.5, tomese una constante γ ∈[0, λmin(Q∗)] arbitrariamente pequena. Calcular la constante β > 0 tal que paratodo x ∈ Ωβ = x ∈ IRn : V (x) ≤ β se satisface

Ωβ ⊆ XK

V (f(x,K·x))− V (x) ≤ −γ·xT ·x

El calculo del paso 3 se puede realizar resolviendo el problema de optimizacion nolineal

κ = mınx

V (x)

s.a

V (f(x,K·x))− V (x) > −xT ·Q∗·x

Page 85: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 69

Para todo x ∈ Ωκ = x ∈ IRn : V (x) ≤ κ, se satisface la condicion V (f(x,K·x))−V (x) ≤ −xT ·Q∗·x.

Este problema tiene solucion factible ya que, definiendo

Φ(x) = f(x,K·x)− AK ·x

la condicion V (f(x,K·x))− V (x) ≤ −xT ·Q∗·x se puede reescribir como

(Φ(x) + AK ·x)T ·P ·(Φ(x) + AK ·x)− xT ·P ·x =

Φ(x)T ·P ·Φ(x) + 2·Φ(x)T ·P ·AK ·x + xT ·(ATK ·P ·AK)·x− xT ·P ·x ≤ −xT ·Q∗·x

Teniendo en cuenta que ATK ·P ·AK − P = −Q se tiene que

Φ(x)T ·P ·Φ(x) + 2·Φ(x)T ·P ·AK ·x ≤ xT ·(Q−Q∗)·x

Dado que el modelo es dos veces continuamente diferenciable, existe una constante

Lr = max0<‖x‖P≤r

‖Φ(x)‖P

‖x‖P

siendo ‖x‖P =√

xT ·P ·x. Esta constante satisface que Lr → 0 cuando r → 0.

A continuacion se va a demostrar las siguientes propiedades

(i) Φ(x)T ·P ·Φ(x) ≤ L2r·‖x‖2

P .Es consecuencia inmediata de la definicion de la constante Lr.

(ii) 2·Φ(x)T ·P ·AK ·x ≤ 2·Lr·‖A‖P ·‖x‖P .Para ello basta comprobar que,

2·Φ(x)T ·P ·AK ·x = 2·(Φ(x)T ·P 1/2

)·(P 1/2·AK ·x

)

≤ 2·‖P 1/2·Φ(x)‖·‖P 1/2·AK ·x‖≤ 2·‖Φ(x)‖P ·‖AK ·x‖P

≤ 2·Lr·‖x‖P ·‖AK‖P ·‖x‖P = 2·Lr·‖AK‖P ·‖x‖2P

(iii) xT (Q−Q∗)·x ≥ γ·‖x‖2P , siendo γ = λmin(P−1/2·(Q−Q∗)·P−1/2).

En efecto,

xT (Q−Q∗)·x = xT ·P 1/2·P−1/2(Q−Q∗)·P−1/2·P 1/2·x≥ xT ·P 1/2·λmin(P−1/2(Q−Q∗)·P−1/2)·P 1/2·x= λmin(P−1/2(Q−Q∗)·P−1/2)·‖x‖2

P

Page 86: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

70 3.7. Calculo de la region terminal

Entonces, de estas tres propiedades se tiene que

Φ(x)T ·P ·Φ(x) + 2·Φ(x)T ·P ·AK ·x− xT ·(Q−Q∗)·x ≤ (L2r + 2·Lr·‖AK‖P − γ)·‖x‖2

P

Dado que Lr → 0 cuando r → 0, existira un r suficientemente pequeno tal que

L2r + 2·Lr·‖AK‖P ≤ γ

y por lo tanto, para todo x tal que V (x) = ‖x‖2P ≤ r2 se satisface la condicion. En

consecuencia, siempre existe una vecindad del origen en la que se cumple la hipotesis3.5.

Habitualmente las restricciones en las actuaciones y en el estado son politopicas, conlo que el conjunto XK tambien es un politopo. Dado que el invariante es un elipsoide,es posible calcular el maximo elipsoide contenido en XK . Sea el conjunto XK formadopor nr restricciones lineales aT

i ·x ≤ bi. Entonces Ωδ esta contenido en XK siendo

δ = mıni

b2i

aTi ·P−1·ai

Por tanto, la region Ωα = x ∈ IRn : xT ·P ·x ≤ α = mın(κ, δ) es un invariantepositivo admisible del sistema.

En caso de que los conjuntos de restricciones no sean politopicos, entonces habra quecalcular el maximo elipsoide que satisface las restricciones, que se obtiene resolviendouno o varios problemas de optimizacion analogos al propuesto (siempre que XK seaconvexo). Por tanto se deben resolver una serie de problemas de optimizacion y α setomara como el menor de los argumentos obtenidos.

3.7.1. Ejemplo de aplicacion al reactor

Para ilustrar el calculo de la region terminal, se va aplicar el procedimiento presen-tado al ejemplo del reactor. En este caso se obtiene el controlador local linealizando elsistema en torno al origen obteniendose

A =

0,9385 −0,0443

0,1624 1,1365

B =

−0,0013

0,0668

y calculando el controlador lineal mediante la tecnica del LQR con los mismos factoresde ponderacion que los utilizados en la seccion 3.3.2, se obtiene

K =[−1,6154 −3,6644

]

Page 87: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 71

Para esta ley de control se calcula la matriz Pλ que resuelve la ecuacion de Lyapunov

ATK ·Pλ·AK − Pλ = −λ·Q∗

siendo

AK = A + B·K =

0,9406 −0,0396

0,0545 0,8918

la matriz del sistema en bucle cerrado linealizado, y la matriz Q∗

Q∗ = Q + KT ·Q·K =

12,6095 5,9195

5,9195 14,4279

y el parametro λ > 1.

Para calcular el conjunto invariante hay que calcular el maximo αλ tal que se veri-fique la condicion

f(x,K·x)T ·Pλ·f(x,K·x)− xT ·Pλ·x ≤ −xT ·Q∗·x

En el caso de λ = 2, se obtiene la solucion utilizada en los ejemplos realizados a lolargo de este capıtulo: α2 = 9,3353 y

P2 =

265,8811 49,3961

49,3961 125,9963

Analizando la ecuacion de Lyapunov del sistema linealizado se observa que

Pλ = λ·P1

relacion que al sustituirse en la condicion de Lyapunov se tiene que

f(x,K·x)T ·P1·f(x.K·x)− xT ·P1x ≤ −1

λ·xT ·Q∗·x

por lo que al aumentar λ disminuye la tasa de decrecimiento de la funcion de Lyapunov,es decir, se relaja la condicion, lo que conduce a regiones invariantes mayores. Estehecho se ilustra en la figura 3.14, en la que se muestra el conjunto factible XK , que esun politopo, y las regiones para distintos valores de λ: 1,1, 1,25 y 1,5. Como se puedeobservar, la region crece hasta alcanzar el maximo que esta limitado por su pertenenciaal conjunto XK .

En la figura 3.15 se muestra el valor de α (referido a P1) para distintos valores de λ,en la que se puede observar que el tamano del invariante crece hasta llegar a su lımite.

Page 88: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

72 3.8. Analisis de estabilidad del MPC suboptimo

−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1−1.5

−1

−0.5

0

0.5

1

x1

x 2

Figura 3.14: Invariantes positivos del sistema para λ = 1,1, 1,25 y 1,5.

1.1 1.15 1.2 1.25 1.3 1.35 1.4 1.45 1.5 1.55 1.60

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

λ

α

Figura 3.15: Evolucion de α en funcion de λ.

3.8. Analisis de estabilidad del MPC suboptimo

El controlador MPC se basa en la solucion global de un problema de optimizacionque es no lineal. Existen algoritmos eficientes como el denominado Sequential QuadraticProgramming (SQP) que solucionan estos problemas en un tiempo computacionalmenteaceptable para la implementacion en sistemas no muy rapidos (Luenberger 1989, Biegler1998). Pero el caracter no lineal del problema conlleva normalmente la no convexidaddel mismo, por lo que podrıa presentar mınimos locales que el algoritmo puede dar comosolucion al problema. El calculo de la solucion global es posible, pero el incremento detiempo de calculo que esto conlleva puede ser excesivo y, en consecuencia, dejar de serimplementable (ya que el tiempo de calculo esta limitado por el periodo de muestreo,y en consecuencia, por la dinamica de la planta a controlar).

Page 89: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 73

Por tanto, para que un controlador MPC sea implementable debe ser capaz deconservar la estabilidad asintotica en bucle cerrado del sistema en el caso de solucionessuboptimas del problema de optimizacion.

Como se puede observar en los teoremas de estabilidad del MPC, esta surge de laposibilidad de calcular una solucion factible uF (k) a partir de la solucion factible (laoptima, por ejemplo) obtenida en el instante anterior u∗F (k− 1) que ademas incurre enun menor coste. Por tanto, la convergencia esta garantizada tomando como solucionen cada instante la factible uF (k), si no se calcula una mejor. Esto es teoricamenteposible, dada la ausencia de errores entre la prediccion y el comportamiento real de laplanta, y puede conducir a un control en bucle abierto de la planta. En consecuencia, laoptimalidad de la solucion se puede relajar dando lugar al denominado MPC suboptimo.Como se mostrara en el capıtulo 5, esta propiedad toma un mayor sentido cuando elsistema presenta incertidumbres, pues estas pueden hacer que la solucion factible tengaun coste superior al anterior.

A continuacion se demuestra la estabilidad del MPC suboptimo. Esta formulacionfue propuesta inicialmente en (Scokaert et al. 1999) para unas formulaciones del MPCy extendida a la formulacion general en (Mayne et al. 2000). La demostracion presen-tada aquı se basa en la teorıa de conjuntos invariantes y en la convergencia del costesuboptimo.

Para esta demostracion se ha considerado la formulacion general del MPC, si bi-en es extensible a las otras formulaciones presentadas. A lo largo de esta seccion, elsuperındice s denota suboptimo, en oposicion al asterisco que denota optimo.

Teorema 3.20 (Estabilidad asintotica del MPC Suboptimo)

Sea un sistema xk+1 = f(xk, uk), tal que f(0, 0) = 0 y esta sujeto a las restriccionesxk ∈ X y uk ∈ U .Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y unaregion terminal Ω tales que satisfacen la hipotesis 3.5.Sea us

F (xk) una solucion suboptima del MPC tal que

JsN(xk) ≤ Js

N(xk−1)− µ·L(xk−1, usk−1)

siendo µ un parametro libre tal que 0 < µ ≤ 1.

Entonces el controlador predictivo KsMPC(xk) = us(k|k) estabiliza asintoticamente

el sistema y el dominio de atraccion XN es el conjunto de estados para los que elproblema es factible.

Page 90: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

74 3.8. Analisis de estabilidad del MPC suboptimo

Demostracion:

Factibilidad:

Analogamente a la demostracion del teorema 3.6, conocida una solucion factible enk, us

F (k), se puede obtener una secuencia de actuaciones uF (k + 1) dada por

u(k + j|k + 1) =

us(k + j|k) j = 1, · · · , N − 1

h(x(k + Nc|k + 1)) j = N

que es una solucion factible en k + 1. Esto es consecuencia de que x(k + j|k + 1) =xs(k + j|k) para todo j = 1, · · · , N − 1 y de la hipotesis 3.5.

Por tanto XN es un invariante positivo del sistema. Ası, si el conjunto XN es aco-tado, entonces el sistema en bucle cerrado es estable.

Convergencia:

Analogamente al teorema 3.6 se puede comprobar que la secuencia uF (k + 1) tieneun coste asociado tal que

JN(xk+1)− JsN(xk) ≤ −L(xk, u

s(k|k))

Por lo tanto existe una secuencia de actuaciones que satisface la condicion

JsN(xk) ≤ Js

N(xk−1)− µ·L(xk−1, usk−1)

Ademas, se tiene que la secuencia de numeros positivos JsN(xk) es estrictamente decre-

ciente para todo xk 6= 0. Entonces, cuando k → ∞, JsN(xk) − Js

N(xk+1) → 0. Por lotanto L(xk, u

sk) → 0 por lo que, dado que L(x, u) ≥ l·‖x‖σ, se tiene que xk → 0 y el

sistema es asintoticamente estable.

Con esta demostracion se demuestra que el controlador esta definido a lo largode la evolucion del sistema, satisface las restricciones y ademas converge al origen.Sin embargo, para demostrar con rigor la estabilidad asintotica hay que probar queel origen es un punto de equilibrio estable. Notese que la funcion de coste suboptimono puede considerarse como una funcion de Lyapunov estricta y ademas no tiene porque ser continua.

Para ello en (Scokaert et al. 1999) se propone imponer una restriccion adicional sobreel sistema. Esta garantiza que en una vecindad del origen, la secuencia suboptima de

Page 91: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 75

actuaciones decrezca en norma con el estado, es decir que existe una funcion K , γ(·),tal que

‖usF (k)‖ ≤ γ(‖xk‖)

Esta condicion no es muy restrictiva, pero dado que no se puede demostrar, hay queimponerla como restriccion.

Esta restriccion se puede evitar imponiendo unas condiciones mas suaves que lasanteriores. En efecto, para garantizar la estabilidad del origen es suficiente encontraruna funcion K que acote superiormente el coste suboptimo en una vecindad del mismo.Esto se puede garantizar si para todo xk ∈ Ω, se satisface que Js

N(xk) ≤ V (xk). Estacondicion es muy suave, y se debe satisfacer en la mayorıa de los casos, siempre que elgrado de suboptimalidad no sea alto.

Si para xk ∈ Ω esta condicion no se satisface, esta se puede imponer simplementetomando como secuencia suboptima, la derivada de aplicar la ley de control local, puesen este caso, Js

N(xk) = VN(xk) ≤ V (xk).

Ası, para todo x0 tal que ‖x0‖ ≤ δ = β−1(l·εσ), siendo β(·) la funcion K tal queV (x) ≤ β(‖x‖) y tal que esta bola esta contenida en Ω, se tiene que

l·‖xk‖σ ≤ JsN(xk) < Js

N(x0) ≤ V (x0) ≤ β(‖x0‖) ≤ l·εσ

y por lo tanto ‖xk‖ ≤ ε, lo que demuestra la estabilidad.

Un procedimiento mas sencillo para garantizar la estabilidad consiste en partir dela solucion optima en el estado inicial. Ası, dado que J∗N(x) ≤ V (x) para todo x ∈ Ω,se satisface la condicion anterior.

En (Scokaert et al. 1999) los autores resaltan que la suboptimalidad no es deseableen un controlador pues, aunque hace el controlador mas facilmente implementable,tiene asociado una perdida de optimalidad y por lo tanto un peor comportamiento. Lasuboptimalidad es, por tanto, una deficiencia en el control optimo y no un objetivoen sı. Esta puede estar motivada por diversas razones: un algoritmo de optimizaciondeficiente, insuficiente tiempo de calculo o bien discrepancias entre los estados predichosy reales. Bajo estas circunstancias, la condicion de convergencia impuesta garantizala estabilidad asintotica del sistema en bucle cerrado. El parametro µ ∈ [0, 1] es unfactor de convergencia mınimo del sistema en bucle cerrado, que permite establecer uncompromiso entre suboptimalidad y comportamiento.

Page 92: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

76 3.8. Analisis de estabilidad del MPC suboptimo

3.8.1. Ejemplo de aplicacion al reactor

Para ilustrar el efecto de la suboptimalidad de la solucion del problema de op-timizacion, se ha aplicado esta estrategia al reactor con los mismos parametros deejemplos anteriores, con un horizonte de prediccion igual al de control Nc = 5 y par-tiendo de un estado inicial x1 = −0,3 y x2 = −0,5. Para poder mostrar el efecto dela suboptimalidad, la resolucion del problema de optimizacion no se ha iniciado con lasolucion inicial factible y se ha reducido el numero de iteraciones hasta lograr la condi-cion de convergencia con un valor del parametro µ = 0,1. La trayectoria resultante sepuede observar en la figura 3.16 junto con la obtenida por el controlador optimo.

En la figura 3.17 se puede ver la evolucion de los estados y la actuacion a lo largodel tiempo.

−0.4 −0.3 −0.2 −0.1 0 0.1−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0

0.1

x1

x 2

trayectoria óptima trayectoria subóptima

Figura 3.16: Trayectorias optima y suboptima del sistema en bucle cerrado.

Como se puede observar, la trayectoria obtenida difiere en gran medida del com-portamiento optimo, presentado un peor comportamiento en cuanto a desempeno serefiere. Observese ademas la evolucion de la actuacion sobre el sistema: aparecen cam-bios bruscos en la entrada, perdiendose la suavidad que presenta en el caso optimo.Este efecto no es deseable pues puede someter a los actuadores a cambios bruscos.

En la figura 3.18 se muestra la evolucion del coste suboptimo en escala logarıtmica.Como se puede observar, esta evolucion es monotonamente decreciente, lo que garantizala convergencia del sistema.

Page 93: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 77

0 5 10 15 20 25 30 35 40 45 50−0.4

−0.3

−0.2

−0.1

0

0.1

x 1

0 5 10 15 20 25 30 35 40 45 50−0.6

−0.4

−0.2

0

x 2

0 5 10 15 20 25 30 35 40 45 50−0.5

0.5

1.5

2.5

u

muestras

Figura 3.17: Evolucion de la senales del sistema con MPC suboptimo.

0 5 10 15 20 25 30 35 40 45 50−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

log 10

J*

muestras

Figura 3.18: Evolucion del logaritmo decimal del coste suboptimo.

3.9. Eliminacion de la restriccion terminal

En la literatura existen resultados de estabilidad en MPC formulado con costeterminal pero sin restriccion terminal. En estos controladores la restriccion terminalesta implıcitamente considerada pues se establecen hipotesis bajo las cuales la soluciondel MPC sin restriccion terminal satisface dicha restriccion. En (Parisini & Zoppoli1995) se establecen condiciones bajo las cuales un MPC con coste terminal cuadraticoestabiliza asintoticamente un sistema discreto con restricciones y en (Jadbabaie et al.2001) se analiza la estabilidad del MPC para sistemas continuos sin restricciones. En

Page 94: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

78 3.9. Eliminacion de la restriccion terminal

estos se demuestra que existe una vecindad del origen que contiene a la region terminalen la cual el MPC sin restriccion terminal estabiliza asintoticamente el sistema. Ademasse comprueba que, bajo ciertas condiciones, existe un horizonte de control tal queel controlador predictivo sin restriccion terminal es capaz de estabilizar todo estadoasintoticamente estabilizable.

En esta seccion los resultados anteriores se trasladan a la formulacion general delMPC con restricciones, estableciendose condiciones bajo las cuales se puede eliminardel problema de optimizacion la restriccion terminal sin que el controlador pierda sucaracterıstica estabilizante. Tambien se demuestra que todo estado asintoticamenteestabilizable se puede estabilizar con un MPC con un horizonte suficientemente largo.

De las demostraciones anteriores, se extrae un resultado muy interesante y quedota de una originalidad mayor al analisis de esta seccion: la caracterizacion de unaregion en la que el controlador MPC sin restriccion terminal estabiliza el sistema. Esteresultado permite ademas analizar como sintonizar el MPC para que la region en laque se puede eliminar la restriccion terminal sea mayor. Estos resultados se muestranen el capıtulo siguiente, dedicado al analisis del dominio de atraccion del MPC. Porultimo, tambien se demuestra la estabilidad del controlador sin restriccion terminal enel caso suboptimo. Estos resultados son contribuciones originales de esta tesis.

La eliminacion de esta restriccion es especialmente interesante en sistemas sin res-tricciones en el estado del sistema, pues hace que el problema de optimizacion tan solopresente restricciones sobre las variables de decision, reduciendose considerablementela complejidad en la resolucion de dicho problema. Ası, dado que el tiempo de calculose reduce, se podrıa aplicar a sistemas mas rapidos.

Esta seccion comienza generalizando los resultados obtenidos en (Jadbabaie et al.2001) de sistemas en tiempo continuo sin restricciones, a sistemas en tiempo discretocon restricciones en las actuaciones y en el estado.

Teorema 3.21

Sea un sistema xk+1 = f(xk, uk), tal que f(0, 0) = 0 y que esta sujeto a las restriccionesxk ∈ X y uk ∈ U .Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y unaregion terminal Ω dada por

Ω = x ∈ IRn : V (x) ≤ αtales que satisfacen la hipotesis 3.1.Entonces el MPC general sin restriccion terminal estabiliza asintoticamente el sistemapara todo estado inicial tal que x0 ∈ Γα, siendo

Γα = x ∈ IRn : J∗N(x) ≤ α

Page 95: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 79

Demostracion:

Estabilidad:

Dado que el coste de etapa es definido positivo, se tiene que

V (x∗(k + N |k)) ≤ J∗N(xk)

y por tanto, para todo xk ∈ Γα, resulta que V (x∗(k + N |k)) ≤ J∗N(xk) ≤ α, lo queimplica que x∗(k + N |k) ∈ Ω, y se satisface la restriccion terminal.

A continuacion se va a comprobar que xk+1 tambien esta contenido en Γα.

Sea u∗F (k) la solucion optima del sistema en xk, con un coste optimo J∗N(xk) y seala secuencia uF (k + 1) dada por

u(k + j|k + 1) =

u∗(k + j|k) j = 1, · · · , N − 1

hV (x(k + N |k + 1)) j = N

siendo hV (·) la actuacion optima de (3.4) para el coste terminal. Dado que xk+1 = x∗(k+1|k), para esta secuencia el estado predicho satisface que x(k + j|k + 1) = x∗(k + j|k)para j = 1, · · · , N . En consecuencia x(k + N |k + 1) = x∗(k + N |k) ∈ Ω y por lo tantoesta definida hV (·) para ese estado.

Es inmediato comprobar que la ausencia de incertidumbres, la factibilidad de u∗F (k)y la hipotesis 3.1 garantizan la factibilidad de uF (k + 1) aplicada en xk+1. Entonces setiene que el coste de la secuencia optima verifica que

JN(xk+1)− J∗N(xk) = −L(xk, u∗(k|k)) + [∆V + L](x∗(k + N |k), hV (x∗(k + N |k)))

≤ −L(xk, u∗(k|k))

dado que x(k + N |k + 1) = x∗(k + N |k) ∈ Ω y que hV (·) satisface (3.4). Por tanto, delprincipio de optimalidad se tiene que

J∗N(xk+1)− J∗N(xk) ≤ JN(xk+1)− J∗N(xk) ≤ −L(xk, u∗(k|k)) ≤ −l·‖xk‖σ

Por tanto J∗N(xk+1) < J∗N(xk) ≤ α lo que implica que xk+1 ∈ Γα. En consecuenciaeste conjunto es un invariante positivo del sistema.

Convergencia:

Es consecuencia inmediata de lo anterior que J∗N(x) es una funcion de Lyapunov y queel sistema es asintoticamente estable.

Lema 3.22 Sea V (x) y Ω tales que satisfacen la hipotesis 3.1. Entonces J∗N(x) ≤ V (x)para todo x ∈ Ω.

Page 96: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

80 3.9. Eliminacion de la restriccion terminal

Demostracion:

De la hipotesis 3.1 se tiene que para x ∈ Ω, el sistema controlado por u = hV (x)satisface

V (x(k + j|k))− V (x(k + j + 1|k)) ≥ L(x, hV (x))

entonces

N−1∑

j=0

V (x(k + j|k))− V (x(k + j + 1|k)) = V (x)− V (x(k + N |k)) ≥N−1∑

j=0

L(x, hV (x))

Del principio de optimalidad se tiene que

V (x) ≥N−1∑

j=0

L(x, hV (x)) + V (x(k + N |k)) ≥ J∗N(x)

De este lema se deduce que para todo x ∈ Ω, resulta que J∗N(x) ≤ V (x) ≤ α y porlo tanto x ∈ Γα. En consecuencia

Ω ⊆ Γα

Con los resultados anteriores se ha demostrado que existe una vecindad del origenΓα tal que para todo estado inicial contenido en ella, el MPC sin la restriccion terminalestabiliza el sistema. En (Jadbabaie et al. 2001) se demuestra que para todo estadoasintoticamente estabilizable existe un horizonte N tal que el MPC sin restricciones ysin restriccion terminal estabiliza el sistema. En (Parisini & Zoppoli 1995) se demuestraque para un MPC con restricciones, sin restriccion terminal y con un coste terminalV (x) = a·xT ·P ·x existe un valor de la constante a, la matriz P y del horizonte N , talesque el MPC estabiliza cualquier estado asintoticamente estabilizable.

A continuacion se extienden ambos resultados a la formulacion general del MPC,demostrando que todo estado asintoticamente estabilizable es estabilizable por el MPCsin restriccion terminal, para un horizonte N suficientemente largo. Para ello primeroes necesario establecer el siguiente resultado.

Lema 3.23 Sea V (x) y Ω = x ∈ IRn : V (x) ≤ α tales que satisfacen la hipotesis3.1. Sea u∗F (k) la secuencia optima del MPC sin restriccion terminal en xk ∈ SN(X, Ω).Entonces si x∗(k+N |k) /∈ Ω, ningun otro estado x∗(k+j|k) /∈ Ω, para j = 0, · · · , N−1.

Demostracion:

Se procede por reduccion al absurdo. Supongamos que x∗(k + N |k) /∈ Ω, pero existe

Page 97: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 81

un i tal que x∗(k + i|k) ∈ Ω. Por optimalidad se tiene que la solucion optima del MPCcon horizonte N − i en x∗(k + i|k) es la secuencia [u∗(k + i|k), · · · , u∗(k + N − 1|k)].Entonces, en virtud del lema 3.22:

V (x∗(k + i|k)) ≥ J∗N−i(x∗(k + i|k)) ≥ V (x∗(k + N |k)) > α

luego x∗(k + i|k) /∈ Ω lo que es una contradiccion, demostrandose el lema.

A la luz de este lema se puede demostrar este otro:

Lema 3.24 Para todo x asintoticamente estabilizable existe un horizonte N finito talque la solucion optima del MPC con horizonte N y sin restriccion terminal satisfacela restriccion terminal.

Demostracion:

Dado el caracter definido positivo del coste de etapa L(x, u), y teniendo en cuentaque el invariante Ω es una vecindad del origen, existe una constante d > 0 tal queL(x, u) ≥ d para todo x /∈ Ω.

Por otro lado, para todo estado asintoticamente estabilizable, el coste con horizontefinito esta acotado.

Para demostrar el lema se va a proceder por reduccion al absurdo. Supongamos quepara un estado xk estabilizable no existe un N tal que la solucion del MPC verifica quex∗(k + N |k) pertenece a Ω. Entonces, del lema anterior se tiene que x∗(k + j|k) /∈ Ω,para j = 0, · · · , N − 1. Por tanto,

J∗N(xk) ≥ N ·d + α ∀N ≥ 1

Haciendo N →∞ se deduce que el coste optimo J∗∞(xk) no esta acotado y por lo tantono es estabilizable asintoticamente, lo que es una contradiccion.

A partir de este lema se puede establecer el siguiente resultado:

Teorema 3.25 (Estabilidad asintotica)

Sea un sistema xk+1 = f(xk, uk), tal que f(0, 0) = 0 y esta sujeto a las restriccionesxk ∈ X y uk ∈ U .

Page 98: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

82 3.9. Eliminacion de la restriccion terminal

Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y unaregion terminal Ω dada por

Ω = x ∈ IRn : V (x) ≤ αtales que satisfacen la hipotesis 3.1.Entonces, para todo x0 asintoticamente estabilizable existe un horizonte finito N tal queel controlador MPC con horizonte N y sin restriccion terminal estabiliza asintotica-mente el sistema.

Demostracion:

Sea un N tal que satisface esta condicion

J∗N(x0) ≤ N ·d + α

entonces del lema anterior se deduce que la solucion optima en x0 satisface la restriccionterminal. Ademas para todo estado tal que x ∈ Γ = x ∈ IRm : J∗N(x) ≤ J∗(x0)tambien se verifica, y por tanto la solucion optima alcanza la region terminal. Tambiense verificara para todo horizonte mayor que N .

Considerando este valor de N , se puede comprobar que Γ es un invariante positivodel sistema. Para ello se demuestra que si xk ∈ Γ entonces xk+1 ∈ Γ.

El procedimiento es similar a las demostraciones de estabilidad anteriores. Sea u∗F (k)la solucion optima del sistema en xk, con un coste optimo J∗N(xk) y sea la secuenciauF (k + 1) dada por

u(k + j|k + 1) =

u∗(k + j|k) j = 1, · · · , N − 1

hV (x(k + N |k + 1)) j = N

siendo hV (·) la actuacion optima de (3.4) para el estado terminal. Es inmediato com-probar que la ausencia de incertidumbres, la factibilidad de u∗F (k) y la hipotesis 3.1garantizan la factibilidad de uF (k + 1) aplicada en xk+1 = x∗(k + 1|k).

Entonces se tiene que el coste de la secuencia factible verifica que

JN(xk+1)− J∗N(xk) = −L(xk, u∗(k|k)) + [∆V + L](x∗(k + N |k), hV (x∗(k + N |k)))

≤ −L(xk, u∗(k|k))

dado que x(k + N |k + 1) = x∗(k + N |k) ∈ Ω y que hV (·) satisface (3.4). Por tanto, delprincipio de optimalidad se tiene que

J∗N(xk+1)− J∗N(xk) ≤ JN(xk+1)− J∗N(xk) ≤ −L(xk, u∗(k|k)) ≤ −l·‖xk‖σ

Page 99: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 83

Por tanto J∗N(xk+1) ≤ J∗N(xk) ≤ J∗N(x0).

En consecuencia, para el horizonte N la solucion optima del MPC satisface la re-striccion terminal a lo largo de la evolucion del sistema en bucle cerrado. Por tanto elconjunto Γ es un invariante positivo, lo que garantiza estabilidad. La convergencia esconsecuencia de la monotonıa del coste optimo.

De los resultados obtenidos hasta ahora se puede caracterizar una zona en la queel controlador MPC sin restriccion terminal estabiliza asintoticamente el sistema. Estacaracterizacion no esta hecha en (Jadbabaie et al. 2001) ni en (Parisini & Zoppoli 1995).En esta tesis se presenta el siguiente teorema en el cual se determina una vecindad delorigen, que crece con el horizonte de control, en la que el controlador sin restriccionterminal estabiliza el sistema. De esta forma se extiende el resultado presentado en elteorema 3.21.

Teorema 3.26 (Caracterizacion del dominio de atraccion)

Sea un sistema xk+1 = f(xk, uk), tal que f(0, 0) = 0 y esta sujeto a las restriccionesxk ∈ X y uk ∈ U .Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y unaregion terminal Ω dada por

Ω = x ∈ IRn : V (x) ≤ αtales que satisfacen la hipotesis 3.1.Entonces el MPC general sin restriccion terminal estabiliza asintoticamente el sistema,para todo estado inicial tal que x0 ∈ Γ, siendo esta region

Γ = x ∈ IRn : J∗N(x) ≤ L∗(x) + (N − 1)·d + αsiendo L∗(x) = L(x,KMPC(x)) el coste de etapa optimo.

Demostracion:

Como ya se ha demostrado anteriormente, si xk es tal que la solucion optima no conduceal sistema hasta la region terminal, entonces ningun estado de la trayectoria optimaentra en la region terminal. Ası, por el principio de optimalidad de Bellman se tieneque

J∗N(xk)− L∗(xk) = J∗N−1(x∗(k + 1|k)) ≥ (N − 1)·d + α

Page 100: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

84 3.9. Eliminacion de la restriccion terminal

siendo L∗(xk) = L(xk, u∗(k|k)). Por tanto si xk es tal que

J∗(xk) ≤ L∗(xk) + (N − 1)·d + α

entonces la solucion optima conduce al sistema a la region terminal.

Se va a demostrar que si xk satisface la condicion anterior, entonces xk+1 tambien.Dado que la solucion optima en xk es tal que x∗(k+N |k) ∈ Ω, se tiene que la secuenciauF (k + 1) dada por

u(k + j|k + 1) =

u∗(k + j|k) j = 1, · · · , N − 1

hV (x(k + N |k + 1)) j = N

siendo hV (·) la actuacion optima de (3.4) para el coste terminal, es factible y ademasla trayectoria tambien satisface la condicion terminal. Entonces se tiene que

J∗N(xk+1) ≤ JN(xk+1) ≤ J∗N(xk)− L(xk, u∗(k|k))

≤ (N − 1)·d + α ≤ L∗(xk+1) + (N − 1)·d + α

Por recurrencia se deduce que dado que x0 es tal que J∗(x0) ≤ L∗(x0)+(N−1)·d+α,entonces xk verifica que J∗(xk) ≤ L∗(xk) + (N − 1)·d + α para todo k, y por tanto lasolucion optima del MPC siempre cumple la restriccion terminal. Notese ademas quepara todo k tambien se tiene que J∗(xk) ≤ J∗(x0) ≤ L∗(x0) + (N − 1)·d + α y porlo tanto xk ∈ Γ que es un conjunto acotado, por lo que el sistema es estable en buclecerrado.

La monotonıa del coste optimo garantiza la convergencia asintotica del sistema.

A continuacion se presenta un nuevo resultado en el que se demuestra que el con-trolador sin restriccion terminal suboptimo estabiliza asintoticamente el sistema. Estaafirmacion que puede parecer una traslacion de la suboptimalidad del MPC con res-triccion terminal, no es tan inmediata. Tengase en cuenta que el lema 3.23 y todos losresultados derivados de el, estan basados en la optimalidad de la solucion y no en lafactibilidad.

Teorema 3.27 (Suboptimalidad)

Bajo las hipotesis del teorema anterior, el controlador MPC sin restriccion terminalsuboptimo estabiliza asintoticamente el sistema si

JsN(xk+1) < Js

N(xk)− µ·‖xk‖σ

siendo L(x, u) ≥ l·‖x‖σ y µ ∈ [0, l], para todo

x0 ∈ Γ = x ∈ IRn : JsN(x0) ≤ N ·d + α

Page 101: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 85

Demostracion:

Sea xk tal que JsN(xk) ≤ N ·d + α. Entonces por optimalidad se tiene que

J∗N(xk) ≤ JsN(xk) ≤ N ·d + α

lo que implica que xk ∈ Γ. Como se demostro anteriormente el controlador optimouk = K∗

MPC(xk) hace que

J∗N(xk+1) ≤ J∗N(xk)−L(xk, K∗MPC(xk)) ≤ Js

N(xk)−L(xk, K∗MPC(xk)) ≤ Js

N(xk)−µ·‖xk‖σ

por lo tanto existe una actuacion factible tal que satisface la condicion de convergenciaJs

N(xk+1) < JsN(xk)− µ·‖xk‖σ. En consecuencia, el problema tiene solucion factible en

todo instante xk si x0 ∈ Γ.

De aquı se deduce que el sistema evoluciona de forma que xk ∈ Γ, por lo que Γ es uninvariante positivo del sistema. Ademas la monotonıa del coste suboptimo garantizala convergencia asintotica al origen (teniendo en cuenta las consideraciones sobre laestabilidad hechas en la seccion 3.8).

3.9.1. Ejemplo de aplicacion al reactor

El controlador propuesto se va aplicar al reactor utilizado a lo largo de este capıtulo.Para ilustrar el efecto de la eliminacion de la restriccion terminal sobre el calculo enlınea de la actuacion optima, se ha eliminado las restricciones sobre los estados. Deesta manera el problema sin restriccion terminal no presenta restricciones en los estados(restricciones no lineales sobre las actuaciones) mientras que el problema con restriccionterminal sı las presenta. Esta diferencia, como se vera mas adelante, supone un ahorrosustancial de calculo.

Para el ejemplo se va a considerar como matrices de ponderacion

Q =

10 0

0 10

R = 1

y como funcion de coste terminal y region terminal las utilizadas hasta ahora. Elhorizonte de control es Nc = 10 y el horizonte de prediccion se considera igual al decontrol. Con estos parametros se calcula la constante d que toma el valor 7

d = λmin(P−1/2Q·P−1/2)·α = 0,3316

7En la seccion 4.6 se demuestra que d = λmin(P−1/2Q·P−1/2)·α.

Page 102: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

86 3.10. Conclusiones

por lo que la region en la que se puede eliminar la region terminal es

Γ = x ∈ IRn : J∗10(x) ≤ 10·d + α = 12,6508

Para el reactor se han probado distintos estados iniciales contenidos en dicha region.En la tabla siguiente se muestran los valores de las operaciones en punto flotante (flops)requeridas para la resolucion del problema sin y con restriccion terminal. Estos valorescorresponden a la resolucion del problema utilizando la funcion fmincon de la bibliotecade optimizacion de MATLAB.

x0 J∗10(x0) flops sin R.T. flops con R.T. ratio(%)

(−0,2, 0,3) 12.267 957794 1743184 54.94

(−0,25, 0,2) 11.898 796123 1505492 52.88

(−0,27, 0,1) 12.210 698281 1324588 52.71

(−0,24,−0,1) 11.755 781474 1483264 52.68

(−0,1,−0,34) 12.391 790154 1499478 52.69

(−0,0,−0,375) 11.881 885181 1670070 53.00

(0,2,−0,275) 11.961 896235 1696148 52.83

(0,25,−0,1) 10.741 827263 1544369 53.56

El ratio calculado (razon entre flops sin restriccion terminal y con ella) pone demanifiesto que el ahorro computacional es importante y ademas se logra sin perdidade optimalidad, pues la solucion en cada caso es la misma.

En la figura 3.19 se muestra la evolucion del sistema partiendo de un estado inicial(−0,2, 0,3). En la figura 3.20 se muestra la evolucion del coste optimo, que como se hademostrado, es monotonamente decreciente, lo que garantiza la convergencia.

3.10. Conclusiones

En este capıtulo se ha analizado la estabilidad del MPC de la formulacion generaldel MPC en la que se ha establecido el procedimiento de analisis que es comun en losrestantes analisis de estabilidad. Basandose en esta se proponen dos nuevas formula-ciones del MPC con estabilidad garantizada: la formulacion con un mayor horizontede prediccion y la formulacion basada en el coste con horizonte cuasi-infinito. Se haanalizado tambien el comportamiento de los controladores propuestos en cuanto a suoptimalidad. De este analisis se desprende que el aumento del horizonte de prediccion,

Page 103: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 3. Nuevas formulaciones del MPC con estabilidad garantizada 87

0 5 10 15 20 25 30 35 40 45 50

−0.2

−0.1

0

0.1

x 1

0 5 10 15 20 25 30 35 40 45 50

0

0.2

0.4

x 2

0 5 10 15 20 25 30 35 40 45 50

−1

−0.5

0

0.5

u

muestras

Figura 3.19: Evolucion del sistema en bucle cerrado con MPC sin restriccion terminal.

0 5 10 15 20 25 30 35 40 45 50−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

log 10

J*

muestras

Figura 3.20: Evolucion del coste optimo del MPC sin restriccion terminal.

ası como la consideracion del coste terminal cuasi-infinito suponen un acercamiento ala optimalidad y por lo tanto una mejora del comportamiento.

Tambien se ha abordado la estabilidad asintotica en caso de suboptimalidad de lasolucion, demostrandose esta basandose en el analisis anterior y relajandose la condicionpara la estabilidad originalmente impuesta. Por ultimo se ha estudiado la estabilidaddel controlador MPC en ausencia de restriccion terminal, lo cual es especialmenteinteresante en caso de sistemas sin restricciones en los estados. Se han obtenido nuevosresultados generalizado otros existentes a la formulacion general del MPC y se hacaracterizado las regiones en las que el controlador estabiliza al sistema.

Page 104: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

88 3.10. Conclusiones

Asociado al concepto de estabilidad asintotica del controlador esta el concepto deinvariancia y en particular el concepto de dominio de atraccion del mismo. Este conjun-to es la region en la que el sistema es asintoticamente estabilizable por el controlador,y por lo tanto, cuanto mayor sea mayor sera la validez del controlador. El capıtulosiguiente esta dedicado al estudio del dominio de atraccion del controlador y en el seproponen procedimientos y nuevas formulaciones orientadas a su aumento.

Page 105: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4

Aumento del dominio de atracciondel MPC

4.1. Introduccion

Como se ha mostrado en capıtulos anteriores, bajo ciertas condiciones, el MPCestabiliza asintoticamente el sistema garantizando la satisfaccion de las restriccionesimpuestas a los estados y actuaciones a lo largo de la evolucion del mismo. Estasrestricciones, ası como la propia naturaleza del sistema, pueden hacer que no todoslos estados sean estabilizables por el controlador. El sistema sera por tanto localmenteestable en una determinada region, denominada dominio de atraccion, que es ademasun invariante positivo del sistema controlado.

El conocimiento de este conjunto es importante pues representa el dominio de validezdel controlador, de forma que, si la planta partiese de estados fuera del mismo, elcontrolador no serıa apropiado, haciendose necesario el diseno de un nuevo controladorvalido para ese estado. Por tanto, cuanto mayor sea esta region, mayor sera el conjuntode estados estabilizables por el controlador, lo cual es notablemente beneficioso.

En este capıtulo se aborda el analisis del dominio de atraccion del MPC orientadoa su aumento. Este es un problema que no se ha tratado monograficamente en laliteratura, en la que sı se pueden encontrar resultados aislados sobre el dominio deatraccion de las formulaciones existentes (Mayne 2001, Magni, De Nicolao, Magnani &Scattolini 2001, Kerrigan & Maciejowski 2000, Keerthi & Gilbert 1988).

Para ello, se parte del analisis del dominio de atraccion del MPC desde el puntode vista de la teorıa de conjuntos invariantes, y se pone de manifiesto que paramet-

89

Page 106: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

90 4.1. Introduccion

ros influyen sobre el. A partir de estos, se proponen procedimientos encaminados alaumento del dominio de atraccion del controlador sin aumento significativo del costecomputacional. Ası se pueden establecer tres medidas a tomar: aumento de los hori-zontes, variacion del coste terminal y variacion de la restriccion terminal.

En esta ultima medida se proponen nuevas formulaciones del MPC considerandorestricciones terminales contractivas, basadas en conjuntos invariantes positivos e in-variantes de control. Esta ultima formulacion ha sido publicada en (Limon Marruedo,Alamo & Camacho 2002a). Tanto el analisis del aumento de atraccion, como las nuevasformulaciones introducidas en este capıtulo son aportaciones originales de esta tesis.

La organizacion de las medidas llevadas a cabo en este capıtulo se ilustran en elsiguiente diagrama:

Aumento del dominio de

atracción del MPC

Incremento de los horizontes

Modificación del coste terminal

Restricción terminal

contractiva

Horizonte de control

Horizonte de predicción

cuasi-infinito ponderado invariantes positivos

invariantes de control

Figura 4.1: Tecnicas para el aumento del dominio de atraccion.

El capıtulo termina presentando procedimientos para aumentar el dominio de atrac-cion del MPC sin restriccion terminal que se caracterizo en el capıtulo anterior. Estotambien forma parte de las contribuciones originales de esta tesis.

Antes de proceder al cuerpo del capıtulo merece la pena destacar que el analisisdel dominio de atraccion se basa principalmente en la teorıa de conjuntos invariantes,cuyos principales resultados se pueden consultar en la seccion A.3.

Page 107: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 91

4.2. El dominio de atraccion del MPC

La formulacion general del MPC tiene los siguientes elementos de diseno: el hori-zonte de control, la funcion de coste de etapa, la funcion de coste terminal y la regionterminal. Como se ha demostrado, si se considera como region terminal un invariantepositivo del sistema Ω y como coste terminal una funcion de Lyapunov asociada talque el decrecimiento de esta sea mayor que el coste de etapa incurrido (hipotesis 3.1),entonces el controlador MPC estabiliza asintoticamente el sistema. Estas condiciones,demostradas en el teorema 3.2, se denominan a lo largo del capıtulo como condicionessuficientes de estabilidad del MPC.

La imposicion de la invariancia positiva de la region terminal garantiza que, conocidauna secuencia de actuaciones factibles en el instante k, se puede construir otra secuenciafactible para el instante siguiente k + 1. Por tanto si el estado inicial es tal que elproblema de optimizacion tiene solucion (es factible), entonces dicho problema tienesolucion a lo largo de la trayectoria del sistema. En consecuencia, el conjunto de estadospara los cuales el problema de optimizacion es factible es un invariante positivo delsistema en bucle cerrado y, por lo tanto, el dominio de atraccion del controlador.Ademas para todo estado en el cual el problema no tiene solucion, el controladorno esta definido. De aquı se deduce que el conjunto factible es el mayor dominio deatraccion posible del sistema.

Segun lo anterior, el dominio de atraccion del controlador XN sera el conjunto deestados para los cuales el problema de optimizacion es factible. Este conjunto dependeexclusivamente del conjunto de restricciones del problema de optimizacion y no delfuncional a optimizar. Entonces, el coste de etapa L(x, u) y la funcion de coste terminalno influyen en el dominio de atraccion. Tampoco depende, por tanto, de la optimalidadde la solucion, pues basta con que dicha solucion sea factible.

El conjunto de restricciones del MPC en su formulacion general con un horizontede control N son

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + j|k) ∈ X j = 0, · · · , N − 1

x(k + N |k) ∈ Ω

Un estado xk pertenece al conjunto factible de estas restricciones (es decir, pertenecea XN) si existe una secuencia de N actuaciones admisibles (u(k + j|k) ∈ U) tal que laevolucion del sistema es admisible (x(k + j|k) ∈ X) y alcanza el conjunto terminal Ωen N pasos (x(k + N |k) ∈ Ω). Al conjunto de estados que satisfacen las condiciones

Page 108: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

92 4.2. El dominio de atraccion del MPC

anteriores se denomina conjunto estabilizable en N pasos SN(X, Ω)1. Por tanto,

XN = SN(X, Ω)

El conjunto SN(X, Ω) es el maximo conjunto que satisface las condiciones anteriores.Ademas esta contenido en el maximo conjunto estabilizable 2 SN(X, Ω) ⊆ S∞(X, 0).

En el caso en el que la region terminal no fuese un invariante positivo, entoncesse puede perder la invariancia positiva del conjunto factible, es decir, la garantıa deque, si el estado inicial es factible, el problema lo sera a lo largo de su evolucion. Esteproblema es estudiado en (Kerrigan 2000) donde se establecen condiciones sobre laregion terminal para que el problema sea factible a lo largo de la evolucion del sistema.Estos resultados estan basados en la teorıa de conjuntos invariantes.

En este capıtulo el analisis se va a centrar en el aumento del dominio de atracciondel controlador. Para poder llevar esto a cabo es fundamental considerar que factoresdel controlador influyen en el dominio de atraccion. Dado que el dominio de atraccionXN tan solo depende del conjunto factible y no de la funcion de coste a optimizar nide la optimalidad de la solucion obtenida, este esta caracterizado por:

(i) El conjunto de restricciones en las actuaciones U .

(ii) El conjunto de restricciones en el estado X.

(iii) El modelo del sistema, que esta implıcito en las restricciones impuestas sobre elestado

(iv) La region terminal Ω.

(v) El horizonte de control N .

Los tres primeros elementos forman parte de la descripcion del sistema: el modelode prediccion describe el sistema a controlar y las restricciones impuestas sobre lasactuaciones y estados, vienen dadas en general por lımites fısicos sobre las senalesdel sistema, tales como saturaciones en los actuadores, temperaturas lımites en proce-sos,etc. Por tanto, los unicos parametros manipulables sobre los que se puede influirpara variar el dominio de atraccion son el horizonte N y la region terminal Ω.

En este capıtulo se proponen medidas para el aumento del dominio de atraccion delcontrolador, que se pueden agrupar en tres :

1Vease la seccion A.3 para consultar la definicion del conjunto estabilizable ası como suspropiedades.

2El maximo conjunto estabilizable, es decir, el conjunto de estados que pueden ser llevados al origensiguiendo una evolucion admisible por un controlador admisible, es S∞(X, 0)

Page 109: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 93

1. Variacion de los horizontes (de control y de prediccion) del MPC.

2. Incorporacion de funciones de coste terminal adecuadas.

3. Modificacion de la restriccion terminal.

Como se vera a continuacion, a excepcion del aumento del horizonte de control,estas medidas son procedimientos encaminados al aumento de la region terminal, pues,de la propiedad de los conjuntos estabilizables se tiene que si Ω2 ⊆ Ω1 resulta que

SN(X, Ω2) ⊆ SN(X, Ω1)

Por lo tanto, un aumento de la region terminal supone un aumento del dominio deatraccion del controlador. Ademas, dado que el calculo de la region terminal del con-trolador se hace fuera de lınea, esta medida no incurre en un aumento significativodel coste computacional. Por ello, la mayorıa de las medidas van encaminadas en estadireccion.

4.3. Aumento del dominio de atraccion mediante

los horizontes

4.3.1. Aumento mediante el horizonte de control

Se va a considerar un controlador MPC con horizonte de control igual al horizontede prediccion Nc = Np = N . Entonces, como se ha mostrado en la seccion anterior, eldominio de atraccion XN es el conjunto estabilizable del sistema en N pasos SN(X, Ω),siendo N el horizonte de control. Basandose en las propiedades de este conjunto sepueden establecer los siguientes resultados:

Teorema 4.1 (Mayne 2001) Sea un controlador MPC general con una region terminalΩ y un coste terminal V (x), tal que satisface las condiciones suficientes de estabilidad(teorema 3.2). Entonces el dominio de atraccion del controlador satisface las siguientespropiedades:

1. Para cualquier horizonte de control N ≥ 1, el dominio de atraccion del MPCcontiene la region terminal.

Ω ⊆ XN ⊆ X

Page 110: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

94 4.3. Aumento del dominio de atraccion mediante los horizontes

2. Aumentando el horizonte de control, el dominio de atraccion aumenta

XN ⊆ XN+1

3. Puede existir un horizonte N∗ tal que para todo N ≥ N∗, el dominio de atraccionno aumenta, es decir, XN = XN∗

Demostracion:

La demostracion se basa en las propiedades del conjunto estabilizable (propiedad A.27).

1. XN = SN(X, Ω) ⊆ X para todo N ≥ 1. Ademas SN(X, Ω) ⊆ Ω.

2. XN = SN(X, Ω) ⊆ SN+1(X, Ω) = XN+1.

3. En todo sistema dinamico puede existir un ındice de determinacion N∗ tal queSN∗(X, Ω) = SN(X, Ω) = S∞(X, Ω) para todo N ≥ N∗. Por tanto XN = XN∗ =X∞.

La primera consecuencia de estas propiedades es que el controlador MPC tiene undominio de atraccion mayor que el obtenido con el controlador local. Esto permiteinterpretar el control MPC como un procedimiento para aumentar el dominio de atrac-cion de controladores locales (ademas de introducir un criterio optimo en la obtencionde la actuacion sobre el sistema).

La segunda consecuencia es el aumento del dominio de atraccion del controlador alaumentar el horizonte de control. En efecto, en la mayorıa de los casos al aumentarN , se puede comprobar que el dominio de atraccion aumenta. Pero esto no siempre esası, debido a la propiedad de determinacion finita del conjunto estabilizable. Existenplantas (como, por ejemplo, una planta lineal inestable con actuaciones limitadas) paralas cuales el conjunto estabilizable S∞(X, Ω) esta finitamente determinado, y por lotanto a partir de un cierto horizonte finito N∗, el conjunto de estados estabilizablespara un horizonte N > N∗ no aumenta, es decir,

SN(X, Ω) = SN+1(X, Ω) = S∞(X, Ω)

En consecuencia, para estas plantas, el aumento del horizonte de control puede noaumentar el dominio de atraccion, a partir de cierto valor del mismo.

Page 111: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 95

Entonces se puede afirmar que para horizontes de control inferiores al ındice dedeterminacion N∗, el dominio de atraccion aumenta al aumentar el horizonte de con-trol. En plantas en las que S∞(X, Ω) no esta finitamente determinado, el dominio deatraccion aumenta para todo N .

Dado que Ω ⊂ S∞(X, 0), aplicando el teorema A.28, se deduce que

S∞(X, Ω) = S∞(X, 0)siendo S∞(X, 0) el conjunto de estados asintoticamente estabilizables. Entonces, siel conjunto S∞(X, Ω) esta finitamente determinado, del corolario A.29 se deduce queel conjunto S∞(X, 0) tambien esta finitamente determinado, y ademas existe un N∗

tal queSN(X, Ω) = S∞(X, Ω) = S∞(X, 0)

para todo N ≥ N∗.

En consecuencia, un controlador MPC con horizonte finito (N ≥ N∗) alcanza elmaximo dominio de atraccion posible S∞(X, 0), que es el dominio de atraccion delMPC con horizonte infinito (Keerthi & Gilbert 1988). Este horizonte serıa valido paratodo estado inicial asintoticamente estabilizable.

Si S∞(X, 0) no esta finitamente determinado entonces tampoco lo esta S∞(X, Ω)y por lo tanto no existe un horizonte fijo N∗ tal que estabilice todos los estados a-sintoticamente estabilizables. Lo que sı se verifica es que para todo estado existe unhorizonte finito que depende del estado (por ejemplo, si x ∈ Si(X, 0), basta tomarN = i) tal que el MPC con ese horizonte lo estabiliza.

Notese que el desarrollo anterior, viene a demostrar desde un punto de vista deconjuntos invariantes el resultado obtenido en el teorema 3.25, en virtud del cual,todo estado asintoticamente estabilizable (x ∈ S∞(X, 0)) puede ser asintoticamenteestabilizado por un controlador MPC de un horizonte N suficientemente largo, es decir,existe un N tal que x ∈ SN(X, Ω).

De lo anteriormente expuesto se deriva el hecho de que aumentando el horizonte decontrol, se puede aumentar el dominio de atraccion del controlador (siempre que no sesupere el ındice de determinacion de S∞(X, Ω)). Este procedimiento es el que habitual-mente se sigue y, como se ha comentado, con resultados satisfactorios en la mayorıa delos sistemas. Sin embargo, esta tecnica tiene un gran inconveniente: el aumento del ho-rizonte de control produce tambien un aumento del numero de variables de decision, ypor lo tanto un aumento de la complejidad del problema de programacion matematicaa resolver. Dado que en un problema de programacion no lineal (NLP) la necesidadde computo crece generalmente de forma exponencial con el numero de variables dedecision, el tiempo de calculo del controlador puede aumentar apreciablemente. Comoes sabido, el tiempo de calculo esta limitado por el periodo de muestreo del sistema,

Page 112: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

96 4.3. Aumento del dominio de atraccion mediante los horizontes

que depende de la dinamica que presente el sistema a controlar. Por tanto, el tiempode calculo del MPC esta limitado y, en consecuencia, tambien lo esta el horizonte decontrol que se puede considerar. Ası, este procedimiento de aumento del dominio deatraccion es costoso, y limitado.

Por este motivo, los restantes procedimientos expuestos en este capıtulo para au-mentar el dominio de atraccion se centran en el aumento de la region terminal, quepermite aumentar el dominio de atraccion sin afectar a la dimension del problema deoptimizacion.

4.3.1.1. Ejemplo de aplicacion al reactor

Para ilustrar lo anteriormente expuesto se va a aplicar el controlador MPC al reactorcontinuamente agitado. Los parametros del controlador, y en consecuencia la regionterminal, utilizados en este ejemlo son los obtenidos en la seccion 3.3.2. Para estecontrolador se ha calculado el dominio de atraccion del controlador para N = 3 y paraN = 4. Estas dos regiones se representan en la figura 4.2.

−0.4 −0.2 0 0.2−1.2

−0.8

−0.4

0

0.4

x1

x 2

Ω

X3

X4

Figura 4.2: Dominio de atraccion del MPC para N = 3 (X3) y para N = 4 (X4).

Como se puede observar en la misma, X3 ⊆ X4 aumentandose el dominio de atrac-cion al aumentar N . Ademas cabe resaltar que Ω ⊂ X3, es decir, que el controladorMPC consigue un dominio de atraccion mayor que el conseguido con la ley de controllocal.

Page 113: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 97

4.3.2. Aumento mediante el horizonte de prediccion

En el anterior capıtulo se presento la formulacion del MPC con un horizonte deprediccion mayor que el horizonte de control, estableciendose condiciones suficientesbajo las cuales el controlador estabiliza asintoticamente el sistema (teorema 3.6). Laidea clave radica en considerar el controlador local para extender la prediccion masalla del horizonte de control. Esta formulacion presenta una serie de propiedades quelo hacen beneficioso, entre las que destaca el mayor grado de optimalidad conseguido.Sin duda alguna la propiedad mas interesante que se consigue con esta formulacion esel aumento del dominio de atraccion del controlador.

En efecto, como se comento en la seccion 3.5, el controlador MPC con horizonte decontrol Nc y horizonte de prediccion Np = Nc + M formulado con una region terminalΩ y un coste terminal V (x), puede considerarse como un controlador MPC generalcon horizonte Nc tal que la funcion de coste terminal fuese VM(x) y la region terminalSh

M(X, Ω). Esta region es el conjunto de los estados que pueden ser estabilizados a Ω enM pasos por la ley de control local u = h(x) de forma que la trayectoria es admisibley las actuaciones tambien.

El conjunto estabilizable en j pasos por la ley de control u = h(x), Shj (X, Ω), viene

dada por 3

Shj (X, Ω) = Qh(Sh

j−1(X, Ω)) ∩X

siendo Sh0 (X, Ω) = Ω. Por lo tanto se puede calcular a partir del conjunto a un paso

del sistema controlado por u = h(x), que viene dado por

Qh(Φ) = x ∈ IRn : h(x) ∈ U y f(x, h(x)) ∈ Φ

el cual representa el conjunto de estados que pueden llevarse al conjunto invariante Φpor la ley de control u = h(x) con una actuacion admisible.

El caracter no lineal del modelo hace que en general sea imposible calcular con exac-titud dicho conjunto. Por tanto, la ventaja de la formulacion con un mayor horizontede prediccion Np es la consideracion como region terminal del conjunto Sh

M(X, Ω) sinnecesidad de realizar el calculo del mismo, pues esta implıcitamente impuesto en lasrestricciones.

Dado que Ω ⊆ ShM(X, Ω), se tiene que el dominio de atraccion del MPC es mayor

(respecto al del controlador con horizonte de prediccion Np = Nc). El dominio deatraccion de este controlador se denota XNc,Np , y depende ademas del horizonte deprediccion. En el siguiente teorema se establece la influencia que sobre el dominio deatraccion tiene el aumento de los horizonte de control y de prediccion.

3Vease la seccion A.3.

Page 114: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

98 4.3. Aumento del dominio de atraccion mediante los horizontes

Teorema 4.2 (Aumento del dominio de atraccion) Sea un sistema y un contro-lador MPC tal que el coste terminal y la region terminal Ω satisfacen las hipotesis delteorema 3.6, entonces se tiene que

XNc,Np ⊆ XNc,Np+1 ⊆ XNc+1,Np+1

y ademas

XNc,Np ⊆ XNc+1,Np ⊆ XNc+1,Np+1

Demostracion:

De las propiedades de los conjuntos estabilizables (propiedad A.27), se tiene que siel conjunto Ω es un invariante positivo del sistema, Sh

j (X, Ω) es un invariante positivodel sistema controlado por el controlador local y verifica que Sh

j (X, Ω) ⊆ Shj+1(X, Ω).

Ademas verifica que Shj (X, Ω) ⊆ Sj(X, Ω).

De estas propiedades tambien se deduce que el conjunto estabilizable en N pasosverifica que

SN(X, Ω) = SN−j(X, Sj(X, Ω))

Considerando las anteriores propiedades se tiene que

XNc,Np = SNc(X, ShNp−Nc

(X, Ω)) ⊆ SNc(X, ShNp−Nc+1(X, Ω)) = XNc,Np+1

⊆ SNc(X,S1(X, ShNp−Nc

(X, Ω))) = SNc+1(X,ShNp−Nc

(X, Ω)) = XNc+1,Np+1

La segunda afirmacion es inmediata dado que

XNc,Np = SNc(X,ShNp−Nc

(X, Ω)) ⊆ SNc+1(X,ShNp−Nc

(X, Ω))

= XNc+1,Np ⊆ XNc+1,Np+1

demostrandose el teorema.

Una teorema similar a este se puede encontrar en (Magni, De Nicolao, Magnani &Scattolini 2001), en el que se demuestra parte del resultado aquı establecido sin utilizarla teorıa de conjuntos invariantes.

Una consecuencia inmediata del teorema 4.2 es que

XNc = XNc,Nc ⊆ XNc,Np

Page 115: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 99

para todo Np ≥ Nc. Es decir, que tal y como se comprobo anteriormente, la conside-racion de un horizonte de prediccion mayor que el de control aumenta el dominio deatraccion del controlador. Es importante resaltar que, dado que el numero de variablesde decision no se varıa, el aumento de dominio de atraccion se consigue con un escasoincremento del coste computacional. Este esfuerzo se incrementa por la incorporacionde nuevas restricciones sobre el problema, pero es un incremento leve.

4.3.2.1. Ejemplo de aplicacion al reactor

Para este ejemplo se va a considerar como region terminal la utilizada en la seccion3.3.2 (Ωb). Ası, se han calculado los dominios de atraccion del MPC con Nc = 3 yNp = 3 (X3), con Np = 4 (X3,4) y con Np = 10 (X3,10). Estos conjuntos se muestran enla figura 4.3, en la cual se puede observar que al aumentar el horizonte de prediccionel dominio de atraccion aumenta. Este aumento es monotono al aumentar Np, si bienpara cierto valor de Np el incremento es escaso o nulo, de hecho, a partir de Np = 10,este incremento no es sustancial.

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4

−1.5

−1

−0.5

0

0.5

x1

x 2

X3 X

3,4

X3,10

Ω

Figura 4.3: Aumento del dominio de atraccion al aumentar Np.

En la figura 4.4 se muestra el dominio de atraccion X3, X3,4 y X4. Como se puedeobservar, tal y como se demostro en el teorema 4.2, X3 ⊆ X3,4 ⊆ X4

Page 116: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

100 4.4. Aumento del dominio de atraccion mediante el coste terminal

−0.4 −0.2 0 0.2−1.2

−0.8

−0.4

0

0.4

x1

x 2

X3

X3,4

X4

Figura 4.4: Relacion entre X3 (lınea con puntos), X3,4 (lınea gruesa) y X4 (lınea con cruces).

4.4. Aumento del dominio de atraccion mediante el

coste terminal

En esta seccion se van a presentar un par de procedimientos de aumento del do-minio de atraccion mediante la modificacion del coste terminal. Esto puede resultarcontradictorio con el desarrollo llevado a cabo en la seccion 4.2, en el que se afirmo queel dominio de atraccion no depende del funcional a optimizar.

Sin embargo, para que el controlador MPC estabilice asintoticamente el sistema,la funcion de coste terminal y la region terminal deben satisfacer la hipotesis 3.5. Porlo tanto, una modificacion adecuada de la funcion de coste terminal, puede llevar aencontrar una mayor region terminal en la que se satisfacen las condiciones suficientesde estabilidad, y de esta forma aumentar el dominio de atraccion.

Por lo tanto, las modificaciones que se presentan a continuacion estan encaminadasal aumento de la region terminal y por consiguiente, del dominio de atraccion.

4.4.1. Incorporacion del coste terminal cuasi-infinito

Considerese un controlador local u = h(x) que estabiliza asintoticamente el sistema,una funcion de Lyapunov asociada V (x) y una region Ω (invariante positivo) tales que

Page 117: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 101

satisfacen la hipotesis 3.5. Como se demostro en la seccion 3.5, a partir de estos sepuede obtener otra funcion VM(x), denominada funcion de coste cuasi-infinito, dadapor

VM(x) =j=M−1∑

j=0

Lh(xh(i + j|i)) + V (xh(i + M |i)) (4.1)

siendo xh(i + j|i) la prediccion del sistema controlado por la ley de control localu = h(x) considerando x(i|i) = x.

Esta funcion es tambien una funcion de Lyapunov para el sistema controlado porla ley de control u = h(x) y tal que satisface la condicion terminal en el conjuntoSh

M(X, Ω). El conjunto invariante a utilizar como region terminal se puede aumen-tar aproximandose a Sh

M(X, Ω), aumentando, por tanto, el dominio de atraccion delcontrolador MPC con VM(x) como coste terminal.

Como se comento anteriormente, para incorporar este conjunto como region termi-nal, basta con considerar un horizonte de prediccion Np = Nc + M . Sin embargo hayocasiones en las que la consideracion de un horizonte de prediccion Np > Nc puede noser deseable. Esto se puede deber al hecho de que esto supone aumento de restriccionesen los estados y por lo tanto un incremento del coste computacional en lınea. Esteproblema es mas acusado cuando el problema no presenta restricciones en los estados.En estas ocasiones, puede resultar interesante el aumento del dominio de atraccionconsiderando el coste terminal cuasi-infinito.

Para determinar una region terminal asociada, basta con encontrar una constanteβM > 0 tal que el conjunto

ΩM = x ∈ IRn : VM(x) ≤ βM

este contenido en ShM(X, Ω). Esto se puede realizar mediante el siguiente procedimiento:

se calcula el conjunto factible Xh (que se supone convexo) y se resuelve el siguienteproblema de minimizacion

γ = mınx

VM(x)

s.a x /∈ Xh

Entonces para todo βM ≤ γ, se tiene que ΩM ⊆ Xh.

Para garantizar que ΩM ⊆ ShM(X, Ω), basta con tomar βM = mın(γ, M ·d + α),

siendo Ω = x ∈ IRn : V (x) ≤ α y d una constante positiva tal que Lh(x) ≥ d paratodo x /∈ Ω. La condicion β ≤ M ·d + α es una consecuencia inmediata de la siguientepropiedad.

Page 118: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

102 4.4. Aumento del dominio de atraccion mediante el coste terminal

Propiedad 4.3 Sea la ley de control u = h(x) tal que estabiliza asintoticamente elsistema, sea V (x) una funcion de Lyapunov asociada y sea Ω ⊆ Xh un invariantepositivo asociado de la forma

Ω = x ∈ IRn : V (x) ≤ αtal que V (x) y Ω satisfacen la hipotesis 3.5. Sea VM(x) la funcion de Lyapunov definidapor (4.1). Sea la region

ΩM = x ∈ IRn : VM(x) ≤ M ·d + αsiendo d una constante positiva tal que Lh(x) ≥ d para todo x /∈ Ω.

Entonces para todo x ∈ ΩM la ley de control u = h(x) lleva al sistema a Ω en Mpasos (o menos).

Demostracion:

Supongamos que VM(x) es menor que M ·d + α y la prediccion en el instante M es talque xh(i + M |i) /∈ Ω. Del principio de invariancia se tiene que x(i + j|i) /∈ Ω para todoj = 0, · · · ,M − 1, pues si en algun instante el sistema entrase en Ω, permanecerıa enel. Entonces se tiene que

VM(x) =j=M−1∑

j=0

Lh(xh(i + j|i)) + V (xh(i + M |i)) ≤ M ·d + α

y por tanto

V (xh(i + M |i)) ≤j=M−1∑

j=0

d− Lh(xh(i + j|i))+ α

Dado que xh(i + j|i) /∈ Ω se tiene que Lh(xh(i + j|i)) ≥ d. En consecuencia

V (xh(i + M |i)) ≤ α

lo que contradice la hipotesis, demostrandose la propiedad.

En consecuencia se puede calcular un conjunto invariante positivo ΩM tal queΩ ⊆ ΩM y ademas el coste terminal cuasi-infinito VM(x) y la region ΩM satisfacenla hipotesis 3.5.

4.4.2. Aumento de la region terminal ponderando el coste ter-minal

Como se mostro en la seccion 3.7, el procedimiento habitual para obtener la regionterminal Ω y el coste terminal asociado V (x) suele ser:

Page 119: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 103

1. Calcular una ley de control u = h(x) localmente estabilizante.

2. Obtener una funcion de Lyapunov asociada V (x).

3. Calcular la region Ω = x ∈ IRn : V (x) ≤ α ⊆ Xh tal que para todo x ∈ Ω

V (f(x, h(x)))− V (x) ≤ −L(x, h(x)) (4.2)

Esta region debe estar contenida en Xh para garantizar que tanto las actuacionescomo la evolucion del sistema son admisibles.

El tamano de la region suele estar limitado por la condicion de convergencia (4.2),de forma que, cuanto mayor sea la tasa de decrecimiento impuesta a la funcion deLyapunov, menor sera la region terminal Ω.

Si el coste terminal V (x) se multiplica por una constante λ ≥ 1, entonces el costeponderado

Vλ(x) = λ·V (x)

es tambien una funcion de Lyapunov asociada al controlador local u = h(x), pues Vλ(x)es definida positiva por serlo V (x) y ser λ > 0 y ademas, si V (f(x, h(x))) < V (x),entonces λ·V (f(x, h(x))) < λ·V (x).

La condicion de convergencia para el coste terminal Vλ(x) es

Vλ(f(x, h(x)))− Vλ(x) = λ·V (f(x, h(x)))− λ·V (x) ≤ −L(x, h(x))

que se traduce en

V (f(x, h(x)))− V (x) ≤ −1

λL(x, h(x))

dado que λ ≥ 1, entonces la tasa de decrecimiento impuesta se reduce, y por lo tanto,aumentara la region en la que se satisface dicha condicion. En consecuencia la regionterminal asociada a Vλ(x) sera mayor que la asociada a V (x), y por lo tanto el dominiode atraccion aumenta.

Es importante resaltar, que la ponderacion de este coste desvirtua su caracterısticade aproximacion al coste infinito. Por lo tanto, el controlador obtenido tendra un mayordominio de atraccion, pero a costa de empobrecer la optimalidad de la evolucion delsistema.

4.4.2.1. Ejemplo de aplicacion al reactor

Para el calculo de la region terminal y el coste terminal se utilizan los resultadosobtenidos en la seccion 3.7. En esta seccion se calcula un controlador local lineal a

Page 120: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

104 4.4. Aumento del dominio de atraccion mediante el coste terminal

partir del modelo linealizado y se calcula la funcion de Lyapunov asociada. A partir deesta se toma una region terminal de la forma

Ω = x ∈ IR2 : xT ·P ·x ≤ αλ

siendo

P =

132,9406 24,6980

24,6980 62,9982

Como se mostro en el ejemplo de dicha seccion, al aumentar λ, la constante αλ crece,siendo por tanto mayor el tamano de la region terminal tal y como se ha expuesto. Ası,considerando λa = 1,1, la region terminal Ωa viene dada por αa = 0,5. Si se consideracomo ponderacion λb = 2,0, la region terminal Ωb que viene dada por αb = 4,66, quees la region utilizada en ejemplos anteriores.

En la figura 4.5 se pueden observar ambas regiones terminales, de forma que Ωa ⊂Ωb. Se muestran ademas los dominios de atraccion del MPC con un horizonte de controlN = 3 utilizando como region terminal Ωa (Xa

3 ) y el dominio utilizando Ωb (Xb3). Como

se ha demostrado, el dominio de atraccion del MPC con la mayor region terminal esmayor que el dominio del otro MPC (Xa

3 ⊂ Xb3).

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

X3b

X3a

Ωa

Ωb

Figura 4.5: Dominio de atraccion del MPC con N = 3 con Ωa como region terminal (Xa3 ) y

con Ωb (Xb3).

Page 121: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 105

4.5. Aumento del dominio de atraccion mediante la

restriccion terminal

A continuacion se presentan dos controladores originales basados en la sustitucionde la restriccion terminal por otra cuyo fin es el aumento del dominio de atraccion delcontrolador (conservando por lo tanto la estabilidad asintotica del controlador resul-tante).

4.5.1. Aumento del dominio de atraccion mediante una regionterminal contractiva

En este apartado se presenta una formulacion del MPC que aumenta el dominiode atraccion del controlador incorporando una region terminal, en la que no tiene porque cumplirse la condicion terminal y que se contrae en cada instante. Esta estrategiagarantiza la estabilidad y la factibilidad del MPC en cada instante y no anade costecomputacional en la resolucion del problema asociado. Este controlador es una de lasaportaciones originales de esta tesis.

Se va a considerar en este caso que existe un controlador local u = h(x) que esta-biliza exponencialmente el sistema, con una funcion de Lyapunov asociada V (x) y unconjunto invariante

Ωα = x ∈ IRn : V (x) ≤ α ⊆ Xh

tales que satisfacen las condiciones suficientes de estabilidad del MPC dadas por lahipotesis 3.5. Entonces existe una region

Ωβ = x ∈ IRn : V (x) ≤ β ⊆ Xh

siendo β ≥ α (y por tanto Ωα ⊆ Ωβ) tal que para todo x ∈ Ωβ, se satisface que

V (f(x, h(x))) < ρ·V (x)

siendo ρ ∈ [0, 1). Por lo tanto es un invariante positivo en el que el sistema en buclecerrado es exponencialmente estable y en el que no tiene por que cumplirse la condicionde convergencia de la hipotesis 3.5. Cabe resaltar que el procedimiento de calculo delinvariante propuesto en la seccion 3.7 garantiza todas estas condiciones.

Bajo estas condiciones se puede formular un controlador MPC tal que se consideracomo coste terminal V (x) y como restriccion terminal

V (x(k + N |k)) ≤ ρk·β

Page 122: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

106 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

Esta restriccion terminal es una restriccion contractiva, en el sentido en el que encada instante la secuencia de actuaciones debe conducir al sistema a una region cadavez mas pequena.

Este controlador no sigue la formulacion general del MPC, pues la region terminalcambia en cada instante y ademas no cumple la hipotesis 3.5 y por lo tanto el contro-lador MPC no garantiza la estabilidad. En consecuencia, es necesario demostrar queel controlador propuesto estabiliza asintoticamente al sistema, lo cual se hace en elsiguiente teorema.

Teorema 4.4 (Estabilidad asintotica)

Sea un sistema dado porxk+1 = f(xk, uk)

tal que los estados y las actuaciones estan sujetas a las restricciones xk ∈ X y uk ∈ U .Sea un controlador u = h(x) que estabiliza exponencialmente el sistema y tiene unafuncion de Lyapunov V (x) asociada tal que

(i) Existe una region Ωα ⊆ Xh, en la cual se satisface la hipotesis 3.5 y que tiene laforma

Ωα = x ∈ IRn : V (x) ≤ α

(ii) Existe una region Ωβ ⊆ Xh

Ωβ = x ∈ IRn : V (x) ≤ β

tal que β > α (por lo tanto Ωα ⊂ Ωβ) y tal que para todo x ∈ Ωβ existe unaconstante ρ ∈ [0, 1) tal que

V (f(x, h(x))) ≤ ρ·V (x)

Entonces el controlador MPC con coste terminal V (x) y restriccion terminal

V (x(k + N |k)) ≤ ρk·β

estabiliza asintoticamente el sistema con un dominio de atraccion XβN = SN(X, Ωβ).

Demostracion:

Factibilidad:

Se va a proceder por induccion.

Page 123: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 107

Sea un estado inicial x0 ∈ SN(X, Ωβ), entonces existe una secuencia de N actuacionestales que conducen al sistema a Ωβ, y por lo tanto el problema de optimizacion esfactible, satisfaciendo la restriccion terminal

V (x(k + N |k)) ≤ β

En el instante siguiente k = 1, existe una secuencia factible uF (1) calculada a partirde la secuencia optima u∗F (0) dada por

u(j|1) =

u∗(j|0) j = 1, · · · , N − 1

h(x(N |1)) j = N

Dado que x1 = x∗(1|0), se tiene que x(j|1) = x∗(j|0) para todo j = 1, · · ·N . Entoncesel estado predicho satisface V (x(N |1)) ≤ β. Al aplicar a partir de este instante elcontrolador local, se tiene que el estado terminal verifica V (x(N + 1|1)) ≤ ρ·β, por loque en x1 el problema de optimizacion es factible.

Considerese que el problema es factible en el instante k, entonces de manera analogase puede obtener una secuencia factible uF (k + 1), a partir de la solucion optima en ku∗F (k) dada por

u(k + j|k + 1) =

u∗(k + j|k) j = 1, · · · , N − 1

h(x(k + N |k + 1)) j = N

Dado que xk+1 = x(k + 1|k), se tiene que x(k + j|k + 1) = x∗(k + j|k) para todoj = 1, · · ·N . Por lo tanto se tiene que

V (x(k + N |k + 1)) ≤ ρk·β

Al aplicar la ley de control local en el estado x(k + N |k + 1), se tiene que

V (x(k + N + 1|k + 1)) ≤ ρ·V (x(k + N |k + 1)) ≤ ρk+1·β

y por lo tanto el problema de optimizacion es factible.

Por induccion se deriva que el problema es factible a lo largo de la trayectoria delsistema para todo x0 ∈ SN(X, Ωβ).

Convergencia:

Esta propiedad se deriva del hecho de que existe una region Ωα ⊆ Ωβ (α ≤ β) en lacual se satisface la condicion terminal 4.2. Dado que en todo instante k, existe unasolucion tal que

V (x∗(k + N |k)) ≤ ρk·β

Page 124: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

108 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

existe un instante k∗ tal que ρk∗ ·β ≤ α. Por tanto a partir de ese instante, el MPCsatisface la condicion terminal, y por el teorema de estabilidad del MPC (teorema 3.2),el controlador estabiliza asintoticamente el sistema.

Este controlador establece un procedimiento para extender la region terminal almaximo conjunto invariante Ωβ contenido en Xh. Por tanto el dominio de atracciondel controlador aumenta, respecto a la formulacion general. Ademas es de resaltar elhecho de que el controlador estabiliza asintoticamente el sistema sin necesidad de quese satisfaga la condicion terminal en dicho invariante.

4.5.1.1. Ejemplo de aplicacion al reactor

Partiendo del ejemplo del apartado 4.4.2, se observa que el conjunto Ωa es uninvariante positivo del sistema, para el cual la funcion de Lyapunov asociada V (x) =xT ·Pa·x viene dada por Pa = 1,1·P , siendo P la matriz de Lyapunov obtenida delproblema linealizado controlado por un controlador LQR. El dominio de atraccionasociado a esta region terminal es Xa

3 .

El dominio de atraccion del controlador se puede aumentar dicha region ponderandola funcion de Lyapunov, de forma que para λb = 2,0, se obtiene la region Ωb notable-mente mas grande. El controlador MPC con una funcion de coste terminal dada porPb = 2,0·P estabiliza asintoticamente el sistema con un dominio de atraccion mayorXb

3. Pero, la ponderacion aplicada sobre el coste terminal hace que la optimalidad dela solucion empeore dado que la funcion de coste terminal se empobrece como aproxi-macion al coste optimo.

Aplicando en controlador propuesto, se puede conseguir estabilizar el sistema en eldominio de atraccion Xb

3 utilizando como coste terminal V (x) = xT ·Pa·x que es masaproximada a la solucion optima. Para ello se considera una region terminal contractivade la forma

xT ·Pa·x ≤ ρk·βsiendo β = 1,1 · 4,667 = 5,134 y α = 1,1 · 0,5 = 0,55. La constante ρ indica el factorde decrecimiento de la funcion de Lyapunov y toma un valor ρ = 0,9223.

En la figura 4.6 se muestra el retrato de fases del sistema controlado por el MPC conregion terminal contractiva. Como se puede observar, el dominio de atraccion es Xb

3, apesar que la condicion terminal tan solo se satisface en Ωa. La restriccion terminal secontrae sucesivamente partiendo de Ωb hasta Ωa.

En la figura 4.7 se muestra la evolucion del sistema controlado por el MPC propuesto

Page 125: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 109

con region terminal contractiva (lınea con puntos) y del sistema controlado con elMPC general con una funcion de coste terminal adecuada V (x) = 2·xT ·P ·x (lınea concuadros). La trayectoria con lınea con cruces es la evolucion del sistema con Nc =10, Np = 10 y un coste terminal cuasi infinito V30(x). Como se ha demostrado, estatrayectoria tiene un grado de optimalidad mayor que las otras dos, y por lo tantosupone un comportamiento mas proximo al optimo.

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

X3b

Ωa

Ωb

X3a

Figura 4.6: Retrato de fases y dominio de atraccion del MPC con N = 3 y con regionterminal contractiva.

4.5.2. MPC con region terminal contractiva basada en inva-riantes de control

En esta seccion se presenta una nueva formulacion de control MPC orientada alaumento del dominio de atraccion mediante la incorporacion como restriccion terminalla pertenencia a una secuencia contractiva de regiones invariantes de control. Estaformulacion del controlador MPC forma parte de las contribuciones originales de estatesis y ha sido publicada en (Limon Marruedo, Alamo & Camacho 2002a).

La idea es similar a la que se ha presentado en la seccion 4.5.1, en la que a partirde un invariante positivo se contrae dicha region hasta alcanzar una region en la quese satisface la condicion terminal. En este caso, se propone una generalizacion de estaidea incorporando el concepto de regiones invariantes de control. Basandose en laspropiedades de estos conjuntos, es posible determinar una secuencia de invariantes decontrol tales que permiten una formulacion contractiva del MPC.

Page 126: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

110 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05

−0.6

−0.5

−0.4

−0.3

−0.2

−0.1

0

x1

x 2

X3b

Ωb

Figura 4.7: Evolucion del sistema controlado por el MPC con N = 3, con region terminalcontractiva (puntos), con la region terminal fija Ωb (cuadrados) y con un MPC con Np =Nc = 10 y V30(x) (cruces).

4.5.2.1. Obtencion de una secuencia de invariantes de control

Para obtener una secuencia de invariantes de control se hace uso de la teorıa deconjuntos invariantes. Un compendio de definiciones y resultados de esta teorıa sepuede consultar en la seccion A.3 de este documento. A continuacion se presentanalgunas de ellas que son de utilidad en esta seccion.

Un conjunto Φ ⊂ IRn se dice que es un invariante de control, si para cualquierestado contenido en Φ, existe una actuacion admisible u(x) ∈ U tal que el estadosiguiente permanece en el, f(x, u) ∈ Φ.

La obtencion de invariantes de control esta basada en el conjunto a un paso Q(Ω).Este conjunto viene dado por

Q(Ω) = x ∈ IRn : ∃u(x) ∈ U tal que f(x, u) ∈ Ω

es decir, el conjunto de estados para los cuales existe una actuacion admisible tal queel estado siguiente esta contenido en Ω.

Teniendo en cuenta lo anterior, se puede establecer la siguiente propiedad

Propiedad 4.5 Sea Ω ⊆ X un invariante de control del sistema y sea Q(Ω) su con-

Page 127: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 111

junto a un paso, entonces todo conjunto Φ tal que

Ω ⊆ Φ ⊆ Q(Ω) ∩X (4.3)

es un invariante de control del sistema.

Esta propiedad es inmediata, considerando el principio de invariancia y la definiciondel conjunto a un paso. La interseccion con el conjunto de restricciones sobre el estadoX es necesario para garantizar que la evolucion del sistema es admisible.

Esta propiedad se verifica tambien si Ω es un invariante positivo, pues esta basadoen la propiedad geometrica de invariancia. En general, el calculo del conjunto Q(Ω)es muy costoso, si no imposible, debido al caracter no lineal del modelo. Pero, graciasa la propiedad anterior, este conjunto puede sustituirse por un conjunto aproxima-do Qap(Ω). Este conjunto aproximado debe ser lo suficientemente preciso como paragarantizar que

Ω ⊆ Qap(Ω) ⊆ Q(Ω)

con el fin de que el conjunto Φ = Qap(Ω) ∩X satisfaga la condicion (4.3).

De todo lo anterior se deduce que mediante el siguiente algoritmo es posible obte-ner una secuencia de Nr invariantes de control, partiendo de un conjunto invariante(positivo o de control) Ω.

1. Hacer Ω0 = Ω. i ← 0

2. Calcular Ωi = Qap(Ωi−1) ∩X ⊇ Ωi−1

3. Si i = Nr ir a 5

4. Si no, hacer i ← i + 1 e ir a 2

5. Fin

Notese que el procedimiento para calcular Qap(·) debe ser lo suficientemente precisocomo para que el paso 2 tenga solucion.

De este algoritmo se obtienen Nr conjuntos invariantes de control tales que satis-facen las siguientes propiedades

Propiedad 4.6 Sea Ωi la secuencia de Nr invariantes de control obtenidos del al-goritmo anterior, entonces

Page 128: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

112 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

1. Ω0 = Ω ⊆ Ω1 ⊆ · · · ⊆ ΩNr ⊆ X.

2. Para todo x ∈ Ωi existe una actuacion admisible u ∈ U tal que f(x, u) ∈ Ωi−1.

3. Ωi ⊆ Si(X, Ω).

4. Si el calculo de la region a un paso es exacta (Qap(·) = Q(·)), entonces Ωi =Si(X, Ω).

Es interesante resaltar que esta secuencia de invariantes de control puede estar fini-tamente determinada, es decir, que exista un i∗ tal que para todo i ≥ i∗, resulta queΩi = Ωi+1 = Ω∞. En consecuencia, la secuencia de invariantes de control dejarıa decrecer. Esto puede ser a consecuencia de la determinacion finita de Si(X, Ω), es de-cir, de la propia naturaleza del sistema y de las restricciones, o bien por el caracteraproximado del calculo de Qap(·).

Para el caso de sistemas lineales sujetos a restricciones politopicas, existen pro-cedimientos numericamente eficientes para realizar el calculo del conjunto Q(·) conexactitud (Blanchini 1999, Kerrigan 2000). En el caso de sistemas no lineales, no ex-isten procedimientos para el calculo de estos conjuntos, y es un tema abierto en lacomunidad investigadora. En el apendice A de esta tesis, se propone un metodo parasu calculo aproximado basado en la obtencion de una envoltura convexa y en la resolu-cion de problemas de optimizacion. La complejidad del procedimiento obtenido parael calculo de estos conjuntos no es crıtico en la implementacion del controlador pues elcalculo se realiza fuera de lınea, formando parte de la etapa de diseno del controlador.

4.5.2.2. MPC con restriccion terminal contractiva

Sea una funcion de Lyapunov de control V (x) y un conjunto invariante de controlΩ tales que satisfacen la hipotesis 3.1, y por lo tanto pueden utilizarse para sintonizarun controlador MPC general con estabilidad garantizada.

Considerese que, a partir del conjunto invariante de control Ω, se calcula una secuen-cia de Nr invariantes de control Ωi utilizando el algoritmo propuesto en el apartadoanterior. A partir de esta secuencia se puede formular el siguiente problema de opti-mizacion MPC:

Page 129: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 113

mınuF (k)

JN(xk, uF (k))

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + j|k) ∈ X j = 0, · · · , N − 1

x(k + N |k) ∈ ΩNr−k si k < Nr

x(k + N |k) ∈ Ω si k ≥ Nr

siendo el funcional a optimizar

JN(xk, uF (k)) =N−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

Como se puede observar, la unica variacion que tiene el MPC propuesto, respectoa la formulacion general del MPC esta en la restriccion terminal. Para k < Nr, larestriccion contractiva fuerza al estado terminal a estar contenido en el invariante decontrol ΩNr−k. El caracter contractivo de esta secuencia hace que la region terminal vayaevolucionando a una region menor, hasta que en el instante Nr, esta region terminal esel invariante de control Ω.

La solucion de este problema depende del instante en el que nos encontremos, porlo que, para k < Nr, la ley de control MPC es variante en el tiempo. A partir de Nr,coincide con la formulacion general del MPC. Ademas, cabe destacar que este problemaes computacionalmente similar al MPC general, si bien requiere tener almacenada lasecuencia de invariantes de control.

Antes de demostrar la estabilidad del controlador propuesto, es necesario establecerel siguiente lema.

Lema 4.7 Sea Ωi una secuencia de invariantes de control calculados a partir delalgoritmo propuesto. Entonces se satisface que

SN−1(X, Ωi) ⊆ SN(X, Ωi−1)

Demostracion:

De las propiedades de la secuencia de invariantes de control se tiene que

Ωi = Qap(Ωi−1) ∩X ⊆ Q(Ωi−1) ∩X = S1(X, Ωi−1)

Page 130: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

114 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

Dado que el conjunto estabilizable en N pasos verifica la siguiente propiedad (vease laseccion A.3)

SN(X, Ω) = SN−j(X, Sj(X, Ω))

se deduce que

SN−1(X, Ωi) ⊆ SN−1(X,S1(X, Ωi−1)) = SN(X, Ωi−1)

con lo que se demuestra el lema.

Basandose en este lema, se demuestra que el nuevo controlador propuesto estabilizaasintoticamente el sistema en todo estado inicial para el cual el problema de opti-mizacion tiene solucion factible.

Teorema 4.8 (Estabilidad asintotica)

Sea una funcion de Lyapunov de control V (x) y un conjunto invariante de controlasociado Ω tales que satisfacen la hipotesis 3.5.Sea una secuencia de Nr invariantes de control Ωi obtenida a partir del conjuntoinvariante de control Ω utilizando el algoritmo propuesto.Entonces el controlador MPC con restriccion terminal contractiva estabiliza asintoti-camente el sistema con un dominio de atraccion SN(X, ΩNr).

Demostracion:

Factibilidad:

Se procede por induccion.Sea el estado inicial tal que x0 ∈ SN(X, ΩNr), entonces por definicion de conjunto esta-bilizable, existe una secuencia de actuaciones admisibles tal que el sistema es conducidohasta el conjunto ΩNr en N pasos siguiendo una evolucion admisible. Por tanto el pro-blema de optimizacion es factible en ese instante. Dado que no existe discrepanciasentre el modelo de prediccion y el comportamiento del sistema,

x1 = f(x0, u∗(0|0)) ∈ SN−1(X, ΩNr)

Del lema 4.7 se deduce que x1 ∈ SN(X, ΩNr−1) y por lo tanto, el controlador es factibleen k = 1.

Considerese que el problema es factible en k < Nr, es decir, que xk ∈ SN(X, ΩNr−k).Entonces la solucion optima garantiza que

xk+1 = f(xk, u∗(k|k)) ∈ SN−1(X, ΩNr−k)

Page 131: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 115

Del lema 4.7 se deduce que xk+1 ∈ SN(X, ΩNr−k−1) y por lo tanto, el controladores factible en k + 1.

Por induccion se infiere que el problema es factible para todo k ≤ Nr.

Notese ademas que xNr ∈ SN(X, Ω). Por tanto para k > Nr la factibilidad esta garan-tizada por la estabilidad del MPC general.

Convergencia:

Como se ha visto anteriormente, la evolucion del sistema es tal que es factible a lolargo de la evolucion del sistema y ademas, para k > Nr, el controlador coincide con laformulacion general del MPC y es factible. Por lo tanto el sistema a partir de entoncesevoluciona asintoticamente hacia el punto de equilibrio.

Corolario 4.9 Dado que la estabilidad y la convergencia estan basadas en la factibili-dad del problema, la formulacion suboptima de este controlador, tambien garantiza laconvergencia, bajo las hipotesis del teorema anterior, manteniendo el mismo dominiode atraccion.

El objetivo final de este controlador es aumentar el dominio de atraccion. Estapropiedad se establece en el siguiente corolario.

Corolario 4.10 Sea la secuencia de invariantes de control tal que Ω ⊂ ΩNr y sea elhorizonte de control menor que el ındice de determinacion del conjunto estabilizableS∞(X, Ω). Entonces el dominio de atraccion del MPC propuesto es mayor que el delcontrolador MPC general. Es decir

SN(X, Ω) ⊂ SN(X, ΩNr)

Demostracion:

Dado que Ω ⊂ ΩNr y que el horizonte de control es menor que el ındice de determinacionN < i∗, es inmediato que

SN(X, Ω) ⊂ SN(X, ΩNr) ⊆ SN+Nr(X, Ω)

Por lo tanto, en el caso en que el conjunto S∞(X, Ω) no este finitamente determinado, obien el horizonte de control N sea inferior al ındice de determinacion i∗, el controladorpropuesto aumenta el dominio de atraccion.

Page 132: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

116 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

Notese que para un horizonte de control tal que N ≥ i∗ se tiene que SN(X, Ω) =SN+Nr(X, Ω) = Si∗(X, Ω) = S∞(X, Ω). Por lo tanto, del resultado anterior se deduceque SN(X, Ω) = SN(X, ΩNr), por lo que el dominio de atraccion no aumenta al incor-porar la secuencia.

Es interesante resaltar que, en el caso en que se pudiese calcular con exactitud elconjunto Q(·), entonces la secuencia de invariantes de control es Ωi = Si(X, Ω). Por loque el dominio de atraccion del controlador es SN+Nr(X, Ω). Por tanto, tiene el mismodominio de atraccion que un MPC general con horizonte de control N + Nr, peroutilizando tan solo un horizonte de control N . Esto es particularmente interesante parasistemas lineales sujetos a restricciones politopicas, para los cuales se puede calcularestos conjuntos con exactitud.

El precio a pagar por el aumento del dominio de atraccion es una perdida de opti-malidad del controlador en los primeros Nr periodos de muestreo. Esto se debe a queel coste terminal no se puede considerar como una aproximacion del coste optimo fueradel conjunto Ω.

4.5.2.3. Ejemplo de aplicacion al reactor

En la sintonizacion del controlador se han utilizado los siguientes parametros: elcoste de etapa cuadratico con

Q =

10 0

0 1

y R = 1. Como region terminal y coste terminal se ha utilizado la correspondientea un controlador local lineal y un factor de ponderacion λ = 2 (vease el ejemplo delapartado 4.3.1.1).

Para la aplicacion del controlador propuesto es necesario calcular una secuenciade invariantes de control del sistema. Para ello se ha seguido el algoritmo propuestoy como conjuntos invariantes de control se han tomado politopos por la sencillez detratamiento matematico y la flexibilidad que permiten. La unica restriccion que suponeesta consideracion es que los conjuntos obtenidos son aproximaciones convexas de losconjuntos reales, que no tienen por que serlo. El procedimiento para calcular la aprox-imacion al conjunto a un paso a partir de politopos, Qap(·) se basa en el calculo de unpolitopo interior al conjunto Q(·).

Para iniciar el algoritmo se ha calculado un politopo que es un invariante positivo delsistema, por ser interior al invariante V (x) ≤ α y contener al conjunto V (x) ≤ ρ·α.El conjunto obtenido se denota Ω0. A partir de este conjunto se ha calculado una

Page 133: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 117

secuencia de 3 conjuntos invariantes de control denotados Ω1, Ω2 y Ω3, que se muestranen la figura 4.8.

−0.3 −0.2 −0.1 0 0.1 0.2 0.3−1

−0.8

−0.6

−0.4

−0.2

0

0.2

x1

x 2

Ω0

Ω1

Ω2

Ω3

Figura 4.8: Secuencia de invariantes de control Ωi.

El dominio de atraccion del MPC con region terminal contractiva y con Np = Nc = 3(Xc

3) es el conjunto de estados que pueden alcanzar la region Ω3 en Nc = 3 pasos, esdecir, Xc

3 = S3(X, Ω3). En la figura 4.9 se muestra el dominio de atraccion Xc3 (lınea

con cruces) junto con la secuencia de invariantes de control. Tambien se ha trazadoel dominio de atraccion del controlador MPC con Nc = 3 y con region terminal elinvariante Ω. Como se puede observar, el nuevo dominio de atraccion es mayor queel del MPC general. Es importante resaltar que este aumento no implica un mayorcoste computacional del predictivo. Se ha conseguido gracias a la incorporacion de lasecuencia de invariantes de control, cuyo calculo se realiza en la etapa de diseno delcontrolador, fuera de lınea.

En la figura 4.10 se muestra el retrato de estados del sistema controlado con elMPC con restriccion terminal contractiva propuesta en esta seccion. En la figura 4.11se han trazado las curvas de evolucion del sistema a lo largo del tiempo, junto con laactuacion. Es interesante resaltar que la estabilidad no esta basada en el decrecimientodel coste optimo durante las 3 primeras muestras, pudiendo aumentar el coste optimo.A partir de entonces, una vez que la region terminal se ha contraıdo hasta Ω0, el costeoptimo sı decrece.

Page 134: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

118 4.5. Aumento del dominio de atraccion mediante la restriccion terminal

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−1.5

−1

−0.5

0

0.5

x1

x 2

Ω0

Ω1

Ω2

Ω3

X3c

X3

Figura 4.9: Dominio de atraccion del MPC con restriccion terminal contractiva (Xc3), frente

al del MPC general (X3).

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−1.5

−1

−0.5

0

0.5

x1

x 2

Ω0

Ω1

Ω2

Ω3

X3c

Figura 4.10: Trayectorias del sistema controlado con el MPC con restriccion terminal con-tractiva.

Page 135: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 119

0 5 10 15 20 25 30 35 40 45 50−0.1

−0.05

0

0.05

0.1

x 1

0 5 10 15 20 25 30 35 40 45 50−1.5

−1

−0.5

0

x 2

0 5 10 15 20 25 30 35 40 45 50−0.5

0.5

1.5

2.5

3.5

muestras

u

Figura 4.11: Evolucion del sistema controlado con el MPC con restriccion terminal contrac-tiva.

4.6. Aumento del dominio de atraccion del MPC

sin restriccion terminal

En el capıtulo anterior se caracterizo una region vecindad del origen en la cual elMPC sin restriccion terminal estabiliza asintoticamente el sistema. Lo mas interesantede la caracterizacion de la region es poder llevar a cabo el analisis de que factoresinfluyen sobre esta con el fin de poder aumentar el dominio de atraccion del MPCsin restriccion terminal. Este analisis es el que se presenta en esta seccion y es unaaportacion original de esta tesis.

Como se demostro en la seccion 3.9, la region en la que el controlador MPC sinrestriccion terminal estabiliza asintoticamente el sistema viene dada por

Γ = x ∈ CN(X) : J∗N(x) ≤ L(x,KMPC(x)) + (N − 1)·d + αsiendo la region terminal

Ω = x ∈ IRn : V (x) ≤ αy siendo la constante d tal que L(x,KMPC(x)) ≥ d para todo estado x /∈ Ω, dondeKMPC(x) es la solucion optima del controlador en x.

La condicion de pertenencia al conjunto admisible en N pasos, CN(X), pone demanifiesto que este conjunto existe en todos aquellos estados factibles, en los que existeuna secuencia de N actuaciones admisibles tal que la evolucion del sistema es admisible

Page 136: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

120 4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal

,y ,por lo tanto, para los cuales el J∗N(x) esta definido. Notese que en el caso en el que nohaya restricciones en el estado, X = IRn se tiene que CN( IRn) = IRn, por lo que el costeoptimo estara definido en todo IRn. Por otro lado, dado que la solucion optima alcanzala region terminal en N pasos para todo x ∈ Γ, entonces x ∈ SN(X, Ω) ⊆ CN(X). Enconsecuencia Γ ⊆ SN(X, Ω).

Esta region es un invariante positivo del sistema en bucle cerrado, y por lo tantoes un dominio de atraccion del controlador. No obstante, esta region no es el maximodominio de atraccion del controlador, pues la condicion bajo la que se ha determinadodicha region es conservadora.

El objetivo de esta seccion es analizar como se puede ajustar un controlador predic-tivo para obtener una region Γ mayor, y por lo tanto, un mayor dominio de atracciondel controlador. Esta region esta caracterizada por cuatro elementos: el coste optimo (yen consecuencia todos aquellos parametros que influyan sobre su valor, como el costede etapa L(x, u), etc.), el horizonte de control N , la constante d y la constante α. Enlo que sigue se proponen ciertas medidas para conseguir una mayor region Γ.

1. Aumentar la constante α:

Esta medida se puede obtener, por ejemplo, aumentando la region terminal (cal-culando el controlador local con este fin o bien con un coste de etapa con menorvalor) o bien ponderando el coste terminal.

En el caso en el que se aumente la region terminal se aumenta tanto α como d,pues, dado que la funcion de coste de etapa es definida positiva, al aumentar eltamano de Ω puede aumentar el mınimo coste de etapa de los estados que nopertenecen a dicha region. Por ejemplo en el caso del coste de etapa cuadraticoy de la region terminal calculada a partir de un controlador lineal siguiendo elprocedimiento propuesto en la seccion 3.7, el parametro d viene dado por

d = λmin(P−1/2·Q·P−1/2)·α

Para demostrar esta afirmacion, se comprueba que para todo x /∈ Ω, es decir, talque xT ·P ·x ≥ α, se verifica que

xT ·Q·x > xT ·Q·x− λmin(P−1/2·Q·P−1/2)·(xT ·P ·x− α)

= xT ·(Q− λmin(P−1/2·Q·P−1/2)·P

)·x + λmin(P−1/2·Q·P−1/2)·α

= xT ·P 1/2·(P−1/2·Q·P−1/2 − λmin(P−1/2·Q·P−1/2)·I

)·P 1/2·x

+λmin(P−1/2·Q·P−1/2)·α≥ λmin(P−1/2·Q·P−1/2)·α

siendo I la matriz identidad.

Page 137: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 121

De lo anterior se deduce el tamano de la region aumentara al aumentar α.

J∗N(x) ≤ L(x, u∗) +(λmin(P−1/2·Q·P−1/2)·(N − 1) + 1

)·α

Esto se puede conseguir mediante la ponderacion del coste terminal como se hacomentado en secciones anteriores. La ponderacion de la funcion de Lyapunov,relaja la condicion terminal a imponer en la region, y por lo tanto esta regionaumenta, es decir, la constante α aumenta.

2. Aumentar la ponderacion del coste terminal:

Como se ha comentado anteriormente, la ponderacion de la funcion de Lyapunovasociada al invariante (y en consecuencia del coste terminal) aumenta la regionterminal, si bien, a partir de un cierto valor, esta region deja de crecer. Aunen esta situacion, la ponderacion de la funcion de coste terminal en el funcionalaumenta el dominio de atraccion del controlador MPC sin restricciones.

Considerese, que el nuevo coste terminal es Vλ(x) = λ·V (x), siendo λ ≥ 1. En-tonces la region terminal Ω, se puede expresar en terminos del coste terminalcomo

Ω = x ∈ IRn : Vλ(x) ≤ λ·α

En este caso, el dominio de atraccion del controlador es

Γ = x ∈ CN(X) : J∗N(x) ≤ L(x, u∗) + (N − 1)·d + λ·α

Notese que la ponderacion puede aumentar el dominio de atraccion y en conse-cuencia afectar tambien al valor de la constante d. Pero, aun en el caso en quela region no crezca, y la constante d no se vea afectada por λ, el termino λ·αaumenta, lo que produce un aumento del dominio de atraccion.

Por otra parte la ponderacion del coste terminal puede aumentar el coste optimoJ∗N(x), con lo que el aumento de la region terminal puede no ser tan acusado comose puede esperar. Sin embargo, es razonable pensar que esta medida aumente eldominio de atraccion, pues la ponderacion del coste terminal se puede considerarcomo una funcion de barrera de la restriccion terminal nula. El caracter definidopositivo de la funcion de coste terminal fuerza a la solucion optima a que el estadoterminal este lo mas cerca posible del origen.

En (Parisini & Zoppoli 1995) se calcula una funcion de Lyapunov V (x) = xT ·P ·xsimilar a la obtenida en el procedimiento de calculo de la region terminal pro-puesto en 3.7. Basandose en esta, considera como coste terminal esta funcionponderada a·xT ·P ·x y demuestra que existe una terna de valores (a, P, N) talesque el controlador MPC sin restriccion terminal estabiliza cualquier estado a-sintoticamente estabilizable. Este resultado se puede interpretar a la luz de losresultados obtenidos.

Page 138: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

122 4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal

En este caso, la ponderacion del coste terminal introducida por los autores tieneun triple efecto, satisfacer la hipotesis 3.5, aumentar la region terminal y au-mentar el dominio de atraccion del controlador sin restriccion terminal hastalograr estabilizar cualquier estado contenido en SN(X, Ω). Por ultimo, como sedemostro anteriormente, existe un horizonte N finito tal que el MPC generalestabiliza un estado asintoticamente estabilizable.

A la luz de esto se podrıa extender el resultado de (Parisini & Zoppoli 1995)al caso de la formulacion general del MPC, de forma que existe una pareja devalores (λ,N) para los cuales el MPC sin restriccion terminal estabiliza cualquierestado asintoticamente estabilizable.

3. Aumentar el horizonte de control N :

Esta medida aumenta la region Γ por dos motivos principales:

a) porque aumenta el sumando (N − 1)·d.

b) porque disminuye el coste optimo J∗N(x).

Por lo tanto habra un mayor conjunto de estados que satisfacen la condicion. Espor tanto beneficiosa, pero notese, que a costa de aumentar el coste computacionaldel controlador.

4. Aumentar el horizonte de prediccion Np:

Como se comento anteriormente, un aumento del horizonte de prediccion Np =N + M con M ≥ 1, se puede considerar como un MPC general con un horizontede control N y con una funcion de coste terminal VM(x) y una region terminalΩM = x ∈ IRn : VM(x) ≤ β ⊆ Sh

M(X, Ω). En este caso la region Γ vendra dadapor J∗N(x) ≤ L∗(x) + (N − 1)·d + β.

La region terminal Ω esta contenida en ΩM , por tanto, este aumento de la regionterminal, produce un aumento de la constante d. Ademas es muy posible que laconstante β sea mayor que α. De hecho, en el caso en el que no haya restricciones,esta constante puede tomarse β = M ·dα + α, siendo dα la constante d calculadapara Ω.

En este caso la region Γ puede aumentar por tres motivos:

a) porque β ≥ α.

b) porque aumenta d.

c) porque el coste optimo se reduce al aumentar el horizonte de prediccion.

4.6.1. Ejemplo de aplicacion al reactor

Para ilustrar los resultados obtenidos se va a calcular el dominio de atraccion delcontrolador sin restricciones del reactor utilizado hasta ahora. Para estos ejemplos se

Page 139: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 123

ha tomado un coste de etapa cuadratico con una ponderacion dada por

Q =

10 0

0 10

y R = 1. Como region terminal y coste terminal se ha utilizado la consideradainicialmente en los ejemplos (vease el ejemplo del apartado 4.3.1.1). La constante d,que es el mınimo coste de etapa de los estados que no pertenecen a la region terminal,es

d = 0,3316

Por defecto, el horizonte de control considerado es Nc = 3 y el de prediccion Np = 3.En este caso el dominio de atraccion es la region

Γa = x ∈ C3(X) : J∗3 (x) ≤ L(x,KMPC(x)) + 9,9984

siendo 2·d + α = 9,9984. Esta region, comparada con el dominio de atraccion delcontrolador con restricciones X3 se muestra en las figuras de este ejemplo.

Con el fin de comprobar la influencia de las distintas medidas propuestas, se van amostrar los dominios de atraccion en diversas situaciones:

1. Aumento Nc:Se calcula el dominio de atraccion con un horizonte de control y de prediccionNp = Nc = 4. En este caso la region viene dada por

Γb = x ∈ C4(X) : J∗4 (x) ≤ L(x, u∗) + 10,33

siendo 3·d+α = 10,33. En la figura 4.12 se muestra este dominio de atraccion Γb

comparado con el correspondiente a Nc = 3, que es Γa. Como se puede observar,el dominio de atraccion aumenta, sin bien el aumento es pequeno.

2. Ponderando la funcion de coste terminal:Se ha calculado el dominio de atraccion considerando como coste terminal 10veces el coste terminal original. Esta region viene dada por:

Γb = x ∈ C3(X) : J∗3 (x) ≤ L(x, u∗) + 94,016

siendo 2·d + 10·α = 94,016.

Esta medida, como se puede observar en la figura 4.13, produce un aumentoconsiderable del dominio de atraccion, alcanzando casi la totalidad del dominiode atraccion maximo X3.

Page 140: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

124 4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

X3

Γa

Γb

Figura 4.12: Aumento del dominio de atraccion del MPC sin restriccion terminal al aumentarNc.

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Γa

Γb X

3

Figura 4.13: Aumento del dominio de atraccion del MPC sin restriccion terminal al aumentarla ponderacion del coste terminal.

3. Aumento del horizonte de prediccion:Esta medida produce un aumento de la region principalmente porque el costeoptimo en un determinado estado es menor al aumentar Np. Para ilustrar esto,se ha considerado un controlador MPC con un horizonte de prediccion Np = 30,

Page 141: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 4. Aumento del dominio de atraccion del MPC 125

por lo que el dominio de atraccion del nuevo controlador viene dado por:

Γb = x ∈ C3(X) : J∗3,30(x) ≤ L(x, u∗) + 9,9984

En la figura 4.14 se muestra los dominios de atraccion de los controladores. Comose puede observar, el dominio aumenta como consecuencia de la consideracion deun mayor horizonte de prediccion. En esta figura se observa que Γb no esta con-tenida en X3, lo cual no es sorprendente pues el dominio de atraccion maximocon Np = 30 es bastante mayor.

−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Γa

Γb

X3

Figura 4.14: Aumento del dominio de atraccion del MPC sin restriccion terminal al aumentarel horizonte de prediccion.

4.7. Conclusiones

En este capıtulo se ha abordado el problema del aumento del dominio de atracciondel controlador MPC. Este problema es relevante, pues permite aumentar el conjuntode estados estabilizables por el controlador.

Para ello se proponen dos metodos fundamentales: aumentando el horizonte decontrol o bien aumentando la region terminal. Entre ellos, se opta por el segundo,pues el primero incurre en un aumento del coste computacional. En este sentido sehan propuesto una serie de medidas para el aumento del dominio de atraccion comoson: el incremento del horizonte de prediccion, la variacion de la funcion de coste

Page 142: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

126 4.7. Conclusiones

terminal mediante la ponderacion del coste terminal o la incorporacion como costeterminal de la funcion VM(x). Por ultimo se han propuesto dos nuevos controladoresMPC que aumentan el dominio de atraccion sustituyendo la restriccion terminal poruna restriccion terminal contractiva. Esta restriccion contractiva puede estar basadaen invariantes positivos o en invariantes de control.

El analisis realizado, y en particular las nuevas formulaciones del MPC son aporta-ciones originales de esta tesis. El controlador basado en conjuntos invariantes de controlha sido publicado en (Limon Marruedo, Alamo & Camacho 2002a).

Por ultimo se ha analizado el dominio de atraccion del MPC sin restriccion terminal,proponiendose una serie de medidas encaminadas a aumentar dicha region. Este analisistambien es una de las aportaciones originales de esta tesis.

Con este capıtulo se cierra la primera parte de la tesis dedicada al analisis decontroladores MPC en ausencia de incertidumbres. Las discrepancias entre el modelode prediccion y el modelo real hacen que los resultados obtenidos hasta ahora puedan noser validos, lo que conduce a la necesidad de analizar la robustez de estos controladores,es decir, a analizar bajo que condiciones el controlador mantiene la estabilidad delsistema incierto en bucle cerrado. Este analisis se lleva a cabo en el siguiente capıtulo.

Page 143: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5

Analisis de robustez del MPCnominal

5.1. Introduccion

Como se ha visto en los capıtulos anteriores, el control predictivo esta basado en ladeterminacion de la evolucion futura del sistema, para lo cual es necesario disponer deun modelo que exprese la dinamica del sistema a controlar. Estas predicciones permitenestimar el coste de una determinada secuencia de actuaciones, y comprobar si el sistemase mantendra dentro de una serie de restricciones impuestas.

Sin embargo, es muy difıcil, si no imposible, la obtencion de un modelo de un sis-tema tal que caracterice el comportamiento del sistema real con total exactitud. Estose puede deber a diversas causas como la presencia de fenomenos inmodelados, la sim-plificacion de modelos, la consideracion de parametros inexactos o bien el efecto deperturbaciones externas. Por tanto, todo modelo tiene asociado unos errores en el mo-delado o incertidumbres, que hacen que exista un discrepancia entre el comportamientopredicho y el comportamiento futuro del sistema real.

Estas discrepancias en el modelo son trascendentales en el diseno de controladoresbasados en este como en el caso del control MPC. Las incertidumbres pueden provocarlos siguientes efectos sobre el controlador MPC:

(i) La actuacion obtenida, basada en un modelo sin incertidumbres, puede no seroptima para el sistema real incurriendo en un coste mayor, y por tanto, en unpeor comportamiento del sistema.

127

Page 144: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

128 5.1. Introduccion

(ii) El sistema real puede evolucionar a estados en los que el control MPC no esfactible, es decir, en los que es imposible satisfacer todas las restricciones delsistema y por tanto el problema de optimizacion no tendrıa solucion posible. Esdecir, que las incertidumbres pueden hacer que el sistema, en su evolucion, aban-done el dominio de atraccion del controlador, fuera del cual este no esta definido.

(iii) La evolucion del sistema podrıa hacerse inestable, a pesar del correcto diseno delcontrolador con el modelo sin incertidumbres.

Por tanto es de relevante importancia la consideracion de dichas incertidumbres enel diseno del controlador, con el fin primordial de garantizar la estabilidad del sistemay la satisfaccion de las restricciones impuestas.

Esto conduce a dos cuestiones fundamentales en el control: la primera es el anali-sis de la estabilidad robusta del sistema en bucle cerrado, es decir, la determinaciondel grado de incertidumbre que puede tener un sistema de forma que el controladordisenado para el sistema nominal conserve la estabilidad en bucle cerrado. La segundacuestion es el diseno robusto, en el cual, dado un sistema con un cierto grado de in-certidumbres, se disena un controlador tal que garantice la estabilidad del sistema enbucle cerrado, la satisfaccion de las restricciones y a ser posible, ciertas caracterısticasen su comportamiento.

Este capıtulo se centra en el primer aspecto: en el analisis de la robustez. En laseccion 2.6.2 se ha presentado un balance de los resultados existentes en este campo,los cuales se pueden agrupar en dos grandes grupos: unos basados en la optimalidaddel controlador (Glad 1987, Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni& Sepulchre 1997) y otros basados unicamente en la teorıa de Lyapunov. El analisisaquı realizado sigue la segunda lınea.

En (Scokaert et al. 1997) se analiza la estabilidad robusta de los controladores MPCcon horizonte finito para sistemas en tiempo discreto con restricciones bajo incertidum-bres aditivas que decaen con el tiempo. Este analisis se orienta a la estabilidad del MPCcuando se anade un observador para estimar los estados del sistema, suponiendo que elerror en la estimacion de los estados decae con el tiempo. Basandose en las propiedadesde los sistemas exponencialmente estables, y bajo la continuidad Lipschitz de la ley decontrol, demuestra que el controlador MPC soporta cierto grado de incertidumbre.

En (De Nicolao et al. 1998) se presenta un controlador MPC con restriccion terminaly coste terminal respondiendo a la formulacion general del MPC. Tambien se haceun analisis de la robustez siguiendo la lınea de (Scokaert et al. 1997), considerandoincertidumbres aditivas que decaen y cierta condicion de continuidad sobre el costeoptimo.

Page 145: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 129

En la misma lınea se encuentra (Santos & Biegler 1999), en el cual, desde un puntode vista de la sensibilidad del problema de optimizacion, se prueba que el controladorMPC con restriccion terminal nula y sin restricciones en los estados soporta ciertogrado de robustez.

En este capıtulo se aborda el analisis de la estabilidad robusta del controlador MPCgeneral. En una primera parte se incorpora la teorıa de Lyapunov y la teorıa de con-juntos invariantes1 al analisis de robustez de sistemas con incertidumbres simplementeacotadas, es decir, que no tienen por que decaer. Esto generaliza los resultados de(Scokaert et al. 1997) e incorpora nuevos aspectos:

(i) Se consideran incertidumbres aditivas acotadas (que no decaen).

(ii) Se simplifican los resultados y se suavizan las condiciones a imponer sobre elsistema.

(iii) Se cuantifica el grado de incertidumbres que soporta el sistema.

(iv) Se analiza la satisfaccion robusta de las restricciones.

Estos resultados han sido publicados en (Limon Marruedo, Alamo & Camacho 2002c)y constituyen una de las aportaciones originales de esta tesis.

En una segunda parte de este capıtulo, se generaliza el analisis anterior incorporandolos conceptos de estabilidad entrada a estado. Esto permite considerar incertidumbresparametricas y extender las condiciones de continuidad Lipschitz del coste optimoy estabilidad exponencial del sistema a la suavidad de dicha funcion y estabilidadasintotica del controlador. La incorporacion de la estabilidad entrada a estado en elanalisis de la estabilidad robusta del MPC arroja mucha luz sobre el problema y esotra de las aportaciones originales de esta tesis.

La organizacion de este capıtulo se ilustra en el siguiente diagrama

5.2. Sistemas con incertidumbres aditivas

Sea un sistema descrito por un modelo en tiempo discreto, no lineal con incertidum-bres aditivas, de la forma

xk+1 = f(xk, uk) + wk (5.1)

1En el apendice A se presenta un compendio de resultados de cada uno de estos campos.

Page 146: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

130 5.2. Sistemas con incertidumbres aditivas

Robustez del MPC

Estabilidad robusta

Factibilidad robusta

Estabilidad entrada estado

Incertidumbres paramétricas

coste óptimo suave

Teoría de Lyapunov

Incertidumbres aditivas

coste óptimo Lipschitz

MPC subóptimo

Figura 5.1: Organizacion del capıtulo 5

siendo el vector de estados del sistema xk ∈ IRn y las actuaciones uk ∈ IRm en elinstante k. El vector wk ∈ IRn representa las incertidumbres sobre el sistema. El unicoconocimiento que se tiene de las incertidumbres es que estan acotadas, de forma que

wk ∈ W (5.2)

siendo W un conjunto compacto en IRn.

El sistema esta sometido a una serie de restricciones tanto en las actuaciones comoen los estados del sistema

xk ∈ X (5.3)

uk ∈ U (5.4)

donde X ⊂ IRn y U ⊂ IRm son conjuntos compactos, tales que el origen esta contenidoen ellos.

El modeloxk+1 = f(xk, uk) (5.5)

describe el comportamiento del sistema en caso de no haber incertidumbres. Este mo-delo se denomina modelo nominal del sistema y es el que se utiliza como modelo deprediccion en el controlador MPC.

En la literatura relativa a MPC es frecuente el modelado de las incertidumbres comoincertidumbres aditivas (Mayne 2000, Michalska & Mayne 1993, De Nicolao et al. 1998),pues son sencillas de identificar, mas faciles de tratar que otras posibles representacionesde las incertidumbres y ademas permiten modelar un amplio espectro de discrepanciasen el modelo. Para ello basta comprobar que las incertidumbres aditivas representan

Page 147: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 131

la diferencia entre el comportamiento del modelo nominal y el comportamiento realdel sistema. Estas pueden representar perturbaciones sobre el estado del sistema odiscrepancias entre modelos que dependan del estado o de las salidas del sistema.Ası supongase un sistema real cuyo modelo es xk+1 = f(xk, uk), que se describe por unmodelo nominal xk+1 = f(xk, uk), entonces

xk+1 = f(xk, uk) = f(xk, uk) + ∆f(xk, uk)

y por lo tanto se puede tomar una incertidumbre wk y un conjunto W tales que

wk = f(xk, uk)− f(xk, uk) = ∆f(xk, uk) ∈ W, ∀xk ∈ X, uk ∈ U

Este tipo de incertidumbres proveen una informacion poco precisa del compor-tamiento de la planta real. Para obtener una mejor descripcion de este, es necesarioobtener un mejor modelo de las incertidumbres. Esto se podrıa hacer considerandoincertidumbres estructuradas. La estructuracion provee una aproximacion mas precisadel comportamiento real del sistema y puede permitir obtener resultados menos con-servadores. Sin embargo, la determinacion de este tipo de incertidumbres puede ser unatarea difıcil en sistemas no lineales. Las incertidumbres aditivas proveen un modelo sen-cillo de incertidumbres que ademas facilita el analisis del comportamiento del sistemaincierto. El precio a pagar es en general, la obtencion de resultados conservadores. Laconsideracion de incertidumbres estructuradas constituye una lınea de trabajo futuro.

5.3. Estabilidad de sistemas no lineales con incer-

tidumbres aditivas sujetos a restricciones

En esta seccion se aborda el analisis de estabilidad robusta de un sistema no linealautonomo con incertidumbres aditivas

xk+1 = F (xk) + wk

sujeto a la restriccion xk ∈ X ⊂ IRn. El vector wk representa las incertidumbresaditivas tales que wk ∈ W . El sistema nominal viene dado por

xk+1 = F (xk)

y el origen es un punto de equilibrio, por lo que F (0) = 0.

Se parte de la base de que el sistema es estable y satisface las restricciones impuestasen ausencia de incertidumbres. En el caso que el sistema fuese incierto, se estudia bajoque condiciones se conserva la estabilidad del sistema y ademas se siguen satisfaciendolas restricciones.

Page 148: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

132 5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas

Esto es esencial para el analisis de sistemas en bucle cerrado. Ası, si un sistema noautonomo dado por (5.5) sujeto a las restricciones (5.4) y (5.3) se controla por unaley uk = h(xk), el sistema en bucle cerrado es un sistema autonomo que responde almodelo

xk+1 = f(xk, h(xk)) = F (xk)

donde el estado esta restringido al conjunto Xh, tal que

Xh = x ∈ X : h(x) ∈ U

Si bien la ley de control se disena para que estabilice el sistema nominal satisfaciendolas restricciones a las que esta sometido, las incertidumbres pueden hacer perder laestabilidad o la factibilidad que el comportamiento nominal presenta. En esta seccionse establecen condiciones bajo las cuales se conservan ambas propiedades del sistema.

Dado que el unico conocimiento que se tiene de las incertidumbres que presentael sistema, wk, es que estan acotadas, el origen deja de ser un punto de equilibrio delsistema incierto. De hecho lo que se puede esperar es que el sistema evolucione hastauna determinada vecindad del origen en la cual permanece confinado. Por tanto lasdefiniciones clasicas de estabilidad, tales como estabilidad asintotica o exponencial, nopueden aplicarse a este tipo de sistemas. Tampoco la teorıa clasica de Lyapunov esaplicable por este mismo motivo. Esto nos lleva a utilizar una definicion de estabilidadapropiada a este caso.

Definicion 5.1 Un sistema es asintoticamente acotado al final si el sistema evolucionaa un conjunto acotado, es decir, si existen unas constantes positivas b y c tales quepara todo α ∈ (0, c), existe un k∗ tal que para todo estado inicial ‖x0‖ ≤ α se tiene que‖xk‖ ≤ b ∀k > k∗.

Esta definicion es una adaptacion a sistemas discretos de la utilizada en (Khalil 1996).

Para el analisis de estabilidad de sistemas con incertidumbres es importante, comose apunta en (Scokaert et al. 1997), el concepto de continuidad Lipschitz de una funcion.

Definicion 5.2 Sea una funcion g(z) : IRp → IRq, se dice que es localmente Lipschitzen un conjunto Z ⊆ IRp si para todo z1, z2 ∈ Z, existe una constante 0 < L < ∞ talque se verifica

‖g(z1)− g(z2)‖ ≤ L·‖z1 − z2‖La constante L se denomina constante de Lipschitz.

Page 149: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 133

Es importante resaltar el hecho de que si una funcion es Lipschitz en una determina-da norma, entonces, en virtud de la equivalencia entre normas, es tambien Lipschitzen cualquier otra norma. Sin embargo, el valor que toma la constante de Lipschitzsı depende de la norma elegida.

La continuidad Lipschitz garantiza que la discrepancia de una funcion entre dospuntos esta acotada y depende, ademas, de la distancia entre ellos. Esta propiedad esmas fuerte que la continuidad pero mas debil que la derivabilidad.

Propiedad 5.3 (Khalil 1996) Sea la funcion g(z) : IRp → IRq continua en una regionZ ⊂ IRp y tal que existe ∂g

∂zy es continua en Z, entonces dicha funcion es localmente

Lipschitz en Z.

Esta condicion es suficiente, pero no necesaria, pues no toda funcion Lipschitz tieneque ser derivable.

Basandose en estas propiedades se presenta en esta tesis el siguiente teorema deestabilidad.

Teorema 5.4 (Estabilidad robusta)

Sea el sistema autonomo xk+1 = F (xk) tal que el origen es un punto de equilibrio delsistema y por tanto F (0) = 0.Sea V (x) una funcion de Lyapunov asociada al sistema tal que

a·‖x‖σ ≤ V (x) ≤ b·‖x‖σ

V (F (x))− V (x) ≤ −c·‖x‖σ

siendo a, b, c constantes positivas y σ > 0. Ademas V (x) es Lipschitz en una vecindaddel origen

Ωr = x ∈ IRn : V (x) ≤ rEntonces existe una constante µ > 0 tal que para toda incertidumbre

wk ∈ Bµ = wk ∈ IRn : ‖wk‖ < µ

el sistema incierto xk+1 = F (xk) + wk es asintoticamente acotado al final, para todoestado inicial x0 ∈ Ωr.

Page 150: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

134 5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas

Demostracion:

Estabilidad:

La demostracion se hace utilizando conceptos de la teorıa de conjuntos invariantes 2

tales como el conjunto robusto a un paso Q(Ω) y la propiedad que este conjunto verificaen el caso de incertidumbres aditivas

Q(Ω) = Q(Ω ∼ W )

siendo W el conjunto de incertidumbres y siendo Ω ∼ W la diferencia de Pontryaginde ambos conjuntos. En lo que sigue se denotan los siguientes conjuntos

Ωp = x ∈ IRn : V (x) ≤ pBp = x ∈ IRn : ‖x‖ ≤ p

De la teorıa de Lyapunov3 se tiene el sistema xk+1 = F (xk) es exponencialmenteestable en el origen y ademas existe una constante ρ ∈ [0, 1) tal que V (F (x)) ≤ ρ·V (x).Sea Lv la constante de Lipschitz de la funcion de Lyapunov V (x) en el conjunto acotadoΩr. Entonces se tiene que

V (x + w) ≤ V (x) + Lv·‖w‖

Considerese una constante

µ ≤ 1− ρ

Lv

·r

entonces se satisface que

Q(Ωr) = Q(Ωr ∼ Bµ) ⊇ Q(Ωr−Lv ·µ) ⊇ Ωq ⊇ Ωr

siendo q = r−Lv ·µρ

. Para demostrarlo se van a probar las siguientes propiedades:

(i) Q(Ωr ∼ Bµ) ⊇ Q(Ωr−Lv ·µ):

Para ello considerese que para todo xk ∈ Ωr−Lv·µ se tiene que

V (xk) ≤ r − Lv·µ ⇒ V (xk + wk) ≤ V (xk) + Lv·µ ≤ r

Por tanto, xk + wk ∈ Ωr,∀wk ∈ Bµ, y entonces xk ∈ Ωr ∼ Bµ. En consecuenciaΩr−Lv ·µ ⊆ Ωr ∼ Bµ.

De la propiedad de monotonıa del conjunto a un paso se tiene que Q(Ωr ∼ Bµ) ⊇Q(Ωr−Lv ·µ)

2Vease la seccion A.3.3Vease la seccion A.2.3.

Page 151: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 135

(ii) Ωq ⊆ Q(Ωr−Lv·µ), siendo q = r−Lv ·µρ

:

xk ∈ Ωq ⇒ V (F (xk)) ≤ ρ·V (xk) ≤ r−Lv·µ ⇒ F (xk) ∈ Ωr−Lv ·µ ⇒ xk ∈ Q(Ωr−Lv ·µ)

(iii) Ωr ⊆ Ωq:

q =r − Lv·µ

ρ≥ r

ρ·(1− Lv·1− ρ

Lv

) = r

Por lo tanto el conjunto acotado Ωr es un invariante positivo robusto para unas incer-tidumbres wk ∈ Bµ y esta acotado, lo que demuestra la estabilidad.

Convergencia:

Se va a demostrar que para una incertidumbre wk ∈ Bµ con µ ≤ 1−ρLv·r, el estado del

sistema evoluciona al conjunto invariante robusto

Ωr∗ = x ∈ IRn : V (x) ≤ Lv

1− ρ·µ = r∗

en el cual permanece. Para ello basta demostrar que la evolucion del sistema verificaque

V (x1) ≤ V (F (x0)) + Lv·‖wo‖ ≤ ρ·r + Lv·µ = r1 ≤ r

V (x2) ≤ V (F (x1)) + Lv·‖w1‖ ≤ ρ·r1 + Lv·µ = ρ2·r + Lv·(1 + ρ)·µ = r2 ≤ r...

V (xj) ≤ ρj·r +j−1∑

i=0

Lv·ρj−1−i·‖wi‖ ≤ ρj·r +1− ρj

1− ρ·Lv·µ = rj ≤ r

Dado que ρ < 1 entonces rj → Lv

1−ρ·µ = r∗ ≤ r cuando j →∞.

Ademas la evolucion del estado satisface la siguiente acotacion

‖xk‖σ ≤ 1

a·ρk·r +

k−1∑

j=0

Lv·ρk−j−1·‖wj‖ (5.6)

De este teorema se infiere que el conjunto Ωr es un invariante robusto para unconjunto de incertidumbres Bµ.

Page 152: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

136 5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas

Este teorema es una generalizacion del resultado principal presentado en (Scokaertet al. 1997), el cual demuestra estabilidad (ante perturbaciones que decaen) bajo lashipotesis de que F (x) sea exponencialmente estable y Lipschitz. Como se va a compro-bar, estas hipotesis son un caso particular de las del teorema 5.4.

Corolario 5.5 Por el teorema inverso de Lyapunov (vease el teorema A1 en (Scokaertet al. 1997)), si F (x) es Lipschitz y el origen es exponencialmente estable, entoncesexiste una funcion de Lyapunov asociada que es Lipschitz, por lo que se satisfacen lashipotesis del teorema 5.4.

Para un sistema en bucle cerrado, la imposicion de la continuidad Lipschitz delmodelo nominal f(x, h(x)) se puede garantizar bajo la continuidad Lipschitz del modelorespecto a x y a u y ademas bajo la continuidad Lipschitz de la ley de control u = h(x).Sin embargo, el teorema 5.4 esta formulado en terminos de la continuidad Lipschitzde la funcion de Lyapunov, que se puede satisfacer sin necesidad de la continuidadLipschitz de la ley de control.

Merece la pena resaltar que la incorporacion de la teorıa de conjuntos invariantesen la demostracion del teorema permite obtener resultados compactos y sencillos.

A continuacion se extiende el teorema anterior al caso de sistemas con restriccionesen el estado (que en el caso de sistemas en bucle cerrado pueden derivar de restriccionesen las actuaciones y en los estados). Estas restricciones se transforman en la existenciade un dominio de atraccion del sistema nominal, que es un invariante positivo, tal queXF ⊆ X. En este caso, se establece el siguiente corolario.

Corolario 5.6 Sea el sistema xk+1 = F (xk) tal que satisface las hipotesis del teorema5.4 en el dominio de atraccion XF . Entonces existe una constante µ > 0 tal que paratoda incertidumbre

wk ∈ Bµ = wk ∈ IRn : ‖wk‖ < µel sistema incierto xk+1 = F (xk) + wk es asintoticamente acotado al final, para todoestado inicial x0 ∈ Ωr = x ∈ IRn : V (x) ≤ r ⊆ XF .

Esto se debe a la invariancia robusta del conjunto Ωr. Gracias a ella, siempre que elsistema parta de este conjunto, la evolucion del sistema permanece en dicho conjunto,y ademas evoluciona convergiendo a un conjunto interior en el cual permanece acotado.Por tanto, dado que el conjunto Ωr esta contenido en el dominio de atraccion del sistemaXF ⊆ X, la evolucion del mismo satisface las restricciones.

Como se puede observar, la invariancia robusta es la propiedad que garantiza lasatisfaccion de las restricciones del sistema incierto. En el caso de que el dominio

Page 153: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 137

de atraccion sea un invariante robusto del sistema, se puede establecer el siguienteresultado.

Corolario 5.7 Sea el sistema xk+1 = F (xk) tal que satisface las hipotesis del teorema5.4 en el dominio de atraccion XF .Sea el dominio de atraccion XF invariante robusto del sistema incierto xk+1 = F (xk)+wk para

wk ∈ Bγ = wk ∈ IRn : ‖wk‖ < γEntonces existe una constante 0 < µ ≤ γ tal que para toda incertidumbre

wk ∈ Bµ = wk ∈ IRn : ‖wk‖ < µel sistema incierto xk+1 = F (xk) + wk es asintoticamente acotado al final, para todoestado inicial x0 ∈ XF .

Para demostrar este corolario, basta con tomar una region Ωr (preferiblemente laregion maxima) tal que Ωr ⊆ XF . Entonces considerando una constante

µ ≤ mın(γ,1− ρ

Lv

·r)

el sistema incierto con wk ∈ Bµ, evoluciona a la region Ωr para todo estado inicial deXF , donde permanece acotado.

En resumen, si un sistema esta sometido a restricciones y tiene un dominio deatraccion XF , tan solo se puede garantizar la estabilidad robusta cumpliendo las res-tricciones (factibilidad robusta) en una region Ωr contenida en XF y para cierto gradode incertidumbre Bµ. Solamente en el caso en que dicho conjunto XF sea un invarianterobusto (para un cierto grado de incertidumbres Bγ), se puede garantizar que en todoel dominio de atraccion XF se satisfacen las restricciones. En este caso, para garantizarque para todo estado de XF evoluciona hasta Ωr, donde queda confinado, el grado deincertidumbre que admite el sistema es el mınimo de µ (para garantizar convergencia)y γ ( para que XF sea invariante robusto).

En el siguiente corolario se trasladan los resultados anteriores al caso de perturba-ciones que decaen.

Corolario 5.8 Bajo las hipotesis del teorema 5.4, si las incertidumbres tienden a 0,entonces el origen es un punto de equilibrio asintoticamente estable del sistema pertur-bado para un cierto grado de incertidumbres.

Si, ademas, el sistema presenta restricciones, los corolarios anteriores garantizanla factibilidad robusta.

Page 154: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

138 5.4. Aplicacion al analisis de robustez del MPC

Si la perturbacion decae exponencialmente de forma que ‖wk‖ ≤ α·λk‖w0‖, conλ < 1, entonces la evolucion del sistema es exponencial

‖xk‖ ≤[r·ρk

a+

Lv·α·(λk − ρk)

a·(λ− ρ)·‖w0‖

]1/σ

≤γk·

r

a·(

ρ

γ

)k

+Lv·α·

a·|λ− ρ| ·∣∣∣∣∣∣

γ

)k

−(

ρ

γ

)k∣∣∣∣∣∣·‖w0‖

1/σ

siendo γ = max(ρ, λ). Dado que γ ≥ ρ y γ ≥ λ se tiene que

∣∣∣∣∣∣

γ

) k

−(

ρ

γ

)k∣∣∣∣∣∣≤ 1

Por lo tanto, se deduce que

‖xk‖ ≤[γk·

(r

a+

Lv·αa·|λ− ρ| ·‖w0‖

)]1/σ

≤ κ·γk/σ

siendo κ > 0.

5.4. Aplicacion al analisis de robustez del MPC

Los resultados obtenidos anteriormente establecen un procedimiento para analizar laestabilidad robusta de un sistema en bucle cerrado (con o sin restricciones). Basandoseen ellos se va a analizar la estabilidad robusta y la satisfaccion de las restricciones deun sistema controlado por un controlador MPC en su formulacion general.

Corolario 5.9 (Estabilidad robusta del MPC)

Sea un sistema descrito por un modelo nominal

xk+1 = f(xk, uk)

sujeto a las restricciones uk ∈ U , y xk ∈ X.Sea un controlador MPC uk = KMPC(xk) tal que estabiliza exponencialmente el sistemaen el dominio de atraccion XN .Sea el coste optimo del MPC J∗N(xk) una funcion Lipschitz en XN .Entonces, existe una constante µ > 0 tal que para cualquier incertidumbre

wk ∈ Bµ = wk ∈ IRn : ‖wk‖ ≤ µ

Page 155: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 139

el sistema incierto descrito por

xk+1 = f(xk, KMPC(xk)) + wk

es asintoticamente acotado al final para todo

x0 ∈ Ωr = x ∈ IRn : J∗N(x) ≤ r ⊆ XN

Este corolario es consecuencia inmediata de los resultados obtenidos en la seccionanterior. Es importante resaltar que una propiedad que parece clave en la robustez delcontrolador predictivo es la continuidad Lipschitz del coste optimo, segun la cual

|J∗N(x + w)− J∗N(x)| ≤ LJ ·‖w‖

Esta garantiza que el efecto de las incertidumbres sobre el coste optimo este limitado, esdecir, que una incertidumbre acotada supone una variacion en el coste optimo acotada.

Las condiciones bajo las cuales el MPC garantiza la continuidad Lipschitz del costeoptimo estan asociadas a las condiciones de regularidad del problema de optimizaciony a la optimalidad de la solucion obtenida. Esta propiedad tan solo esta garantizadapara sistemas lineales sujetos a restricciones lineales (Muske 1995). En el apendice C deeste documento se presenta un analisis de las condiciones bajo las cuales el controladorMPC para sistemas no lineales satisface la continuidad Lipschitz del coste optimo.

Bajo estas mismas condiciones se establece tambien la continuidad Lipschitz de lasecuencia optima, lo que garantiza en virtud del corolario 3.4 que el controlador MPCestabiliza exponencialmente el sistema.

5.4.1. Factibilidad robusta del MPC

En el caso de que el sistema este sujeto a restricciones tanto en las actuaciones comoen el estado, el controlador MPC debe garantizar la satisfaccion de dichas restricciones apesar de las incertidumbres. Las restricciones sobre las actuaciones se satisfacen graciasa la factibilidad de la solucion del problema de optimizacion. Son las restriccionesimpuestas sobre los estados las que realmente el controlador puede no ser capaz desatisfacer. Estas restricciones son de dos tipos: restriccion por lımites sobre los estados yla restriccion terminal para garantizar la estabilidad. La violacion de las primeras hacenque el sistema evolucione fuera de los lımites fısicos impuestos y el incumplimiento de lasegunda puede hacer que el sistema pierda la estabilidad y la convergencia. Sin duda,ambas son igualmente importantes y su satisfaccion a pesar de las incertidumbresconstituyen un gran reto y una gran complejidad en la robustez del MPC. De hecho,

Page 156: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

140 5.4. Aplicacion al analisis de robustez del MPC

gran parte de los resultados existentes en robustez del MPC omiten las restricciones delproblema (Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni & Sepulchre 1997).

El analisis llevado a cabo anteriormente garantiza la factibilidad robusta en unconjunto

Ωr = x ∈ IRn : J∗N(x) ≤ r ⊆ XN

contenido en XN . Este conjunto satisface las restricciones gracias a que es un invariantepositivo robusto y por lo tanto garantiza que si el sistema parte de un estado en elcontenido, la evolucion permanece en su interior. Este conjunto puede interpretarsecomo que existe un coste optimo umbral r tal que si en el instante inicial J∗N(x0) ≤ r(x0 ∈ Ωr), entonces se satisfacen las restricciones. Si por el contrario el estado iniciales tal que J∗N(x0) > r (x0 ∈ XN \ Ωr), el sistema podrıa evolucionar de forma que enun determinado instante no satisfaga las restricciones.

Conocido el dominio de atraccion del MPC XN , y suponiendo que es un conjuntoconexo y compacto, es posible calcular el coste umbral que garantiza la estabilidady satisfaccion robusta de las restricciones ante incertidumbres. En el caso en que XN

sea convexo, el coste optimo umbral r se puede determinar de la solucion del siguienteproblema

r = mınx/∈XN

J∗N(x)

el cual se resuelve fuera de lınea. Si XN no fuese convexo, se podrıa considerar en elproblema un conjunto convexo contenido en el, obteniendo un coste umbral conser-vador.

Para ilustrar esto, considerese un sistema lineal xk+1 = A·xk + B·uk + wk dado por

A =

1,2775 −1,3499

1,0 0,0

B =

1,0

0,0

sujeto a las restricciones ‖x‖∞ ≤ 5 y |u| < 1. El sistema real presenta unas incertidum-bres ‖wk‖∞ ≤ 0,35. Considerando el coste de etapa cuadratico L(x, u) = ‖x‖2 + ‖u‖2,y calculando el controlador local con un LQR, la region terminal obtenida es Ω.

El MPC con un horizonte N = 5 estabiliza robustamente el sistema para las incer-tidumbres dadas y la region Ωr viene dada por un coste optimo umbral de r = 25,24. Enla figura 5.2 se muestra como la evolucion del sistema para estados iniciales contenidosen Ωr, permanece contenida en este.

En la figura 5.3 se muestra que existen estados iniciales pertenecientes a X5 \ Ωr

tales que la evolucion del sistema permanece en X5, satisfaciendo las restricciones, y

Page 157: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 141

−3 −2 −1 0 1 2 3−4

−3

−2

−1

0

1

2

3

4

x1

x 2Ω

r

Ω X

5

Figura 5.2: Evolucion del sistema con x0 ∈ Ωr

sin embargo existen otros estados desde los cuales la evolucion del sistema pierde laestabilidad, abandonando el dominio de atraccion.

−3 −2 −1 0 1 2 3−4

−3

−2

−1

0

1

2

3

4

x1

x 2

Ωr

Ω X

5

Figura 5.3: Evolucion del sistema con x0 ∈ X5 \ Ωr

5.4.1.1. Invariancia robusta del dominio de atraccion

Un analisis mas exhaustivo sobre la condiciones bajo las cuales el MPC satisfacelas restricciones en presencia de incertidumbres se ha llevado a cabo en (Kerrigan2000, Kerrigan & Maciejowski 2001). Este trabajo se basa en la teorıa de conjuntosinvariantes y establece condiciones bajo las cuales el controlador MPC garantiza quesu dominio de atraccion es un invariante robusto. La invariancia robusta es condicionnecesaria y suficiente para garantizar que el sistema no abandona dicho conjunto en

Page 158: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

142 5.4. Aplicacion al analisis de robustez del MPC

su evolucion. Ası, si el dominio de atraccion es un invariante robusto, todo estadoestabilizable satisface las restricciones. En estos trabajos no se aborda la convergenciarobusta del MPC, tan solo se determinan condiciones para la satisfaccion robusta delas restricciones. Por ello, los resultados obtenidos no se limitan a las formulaciones conestabilidad garantizada. Sin embargo, en esta seccion, se han adaptado estos resultadostan solo a este caso.

Lo primero que se analiza es bajo que condiciones el dominio de atraccion del MPCes un invariante robusto y se establece el siguiente teorema .

Teorema 5.10 (Kerrigan 2000)Sea un controlador MPC formulado para un sistema xk+1 = f(xk, uk) sujeto a restric-ciones xk ∈ X, uk ∈ U que satisface las condiciones suficientes de estabilidad (teorema3.2). Entonces, el sistema incierto, con incertidumbres aditivas acotadas a W , satisfacelas restricciones si se verifica la siguiente condicion

SN−1(X, Ω)⊕W ⊆ SN(X, Ω)

siendo ⊕ la operacion de suma de Minkowski 4

Es interesante resaltar que la satisfaccion de esta condicion depende de la forma quetengan los conjuntos estabilizables en N y en N−1 pasos. Estos conjuntos dependen delmodelo del sistema, de los conjuntos de restricciones X y U y del conjunto invarianteΩ. En lo unico en lo que puede influir la sintonizacion del controlador es en el conjuntoinvariante Ω y el horizonte de control N . Por tanto, es el sistema y sus restricciones losque limitan la satisfaccion de esta condicion. Es probable encontrar casos en los queesa condicion no se satisface para ningun valor del horizonte de control.

En el caso en el que el dominio de atraccion del MPC no sea inherentemente ro-busto, Kerrigan propone anadir una restriccion adicional al MPC que garantice dichapropiedad. El trabajo de Kerrigan es una generalizacion de la restriccion del mismotipo propuesta en (Chisci & Zappa 1999) para sistemas lineales.

Esta restriccion se denomina restriccion de robustez y tiene la forma

x(k + 1|k) ∈ XR ∼ W

siendo x(k + 1|k) la prediccion nominal del estado en el instante siguiente y XR unconjunto que es parametro de diseno. Esta nueva restriccion modifica el dominio deatraccion del MPC, siendo por tanto distinto al del MPC general. El nuevo dominiode atraccion es

XrN = Q(XR ∼ W ) ∩ SN(X, Ω)

4A⊕B es la suma de Minkowski de los conjuntos A y B y viene dada porc ∈ IRn : ∃a ∈ A, ∃b ∈ B|c = a + b.

Page 159: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 143

Kerrigan establece condiciones sobre el conjunto XR ⊂ X para que el dominio deatraccion del MPC modificado, Xr

N , sea un invariante robusto. Estas condiciones seresumen en el siguiente teorema.

Teorema 5.11 (Kerrigan 2000)Sea un controlador MPC con restriccion de robustez formulado para un sistema xk+1 =f(xk, uk) sujeto a restricciones xk ∈ X, uk ∈ U que satisface las condiciones suficientesde estabilidad (teorema 3.2). Entonces, el sistema incierto, con incertidumbres aditivasacotadas a W , satisface las restricciones si

(R(XrN) ∩ (XR ∼ W ) ∩ SN−1(X, Ω))⊕W ⊆ Xr

N

siendo R(·) el conjunto de alcance (vease la seccion A.3).

Ademas, Kerrigan propone formas de determinacion del conjunto XR que general-mente se toma un conjunto invariante robusto de control del sistema.

Como se ha comentado, estos resultados garantizan la factibilidad robusta del MPC,no su convergencia. El analisis de estabilidad realizado previamente permite establecerresultados que aseguren la convergencia del sistema. Ası, aplicando el corolario 5.7, sedetermina que si el dominio de atraccion es robusto para incertidumbres contenidas enBγ y el MPC converge para incertidumbres contenidas en Bµ, siendo µ ≤ γ, entonces,el controlador MPC satisface las restricciones y converge a un conjunto Ωr ⊂ XN .

En el caso de perturbaciones que decaen con el tiempo, no es necesario estable-cer condiciones adicionales de convergencia, pues la naturaleza desvaneciente de lasincertidumbres hacen que el sistema vaya convergiendo al punto de equilibrio.

5.5. Estabilidad entrada a estado (ISS) del MPC

En la seccion anterior se ha analizado la robustez de los controladores MPC anteincertidumbres aditivas en el sistema y se ha comprobado que todo sistema controla-do por un MPC, bajo ciertas condiciones, admite un cierto grado de incertidumbre.Tomando un poco de perspectiva en el analisis realizado, se puede observar que lasclaves de la estabilidad robustas son dos: la estabilidad exponencial del sistema y lacontinuidad Lipschitz del coste optimo. La primera garantiza un decrecimiento distintode cero del coste optimo en cada instante y la segunda garantiza que el efecto de lasincertidumbres esta acotado, y ademas este depende del grado de incertidumbre. Portanto, para mantener la estabilidad del sistema, basta con que el posible incremento

Page 160: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

144 5.5. Estabilidad entrada a estado (ISS) del MPC

de coste optimo que experimenta el sistema por la incertidumbre sea compensado porel decrecimiento en el coste que fuerza la estabilidad exponencial.

De todo esto se deduce que la prueba de estabilidad anterior es generalizable asistemas asintoticamente estabilizables e incluso a sistemas con otro tipo de modelode incertidumbres (no aditivas o parametricas, por ejemplo) con tal de que su efectosobre el coste optimo este acotado. Esta generalizacion se puede hacer incorporando elconcepto de estabilidad entrada a estado o ISS 5.

5.5.1. Estabilidad entrada a estado

La estabilidad entrada a estado fue formulada por primera vez en (Sontag 1989a)para sistemas en tiempo continuo, pero recientes resultados (Jiang, Sontag & Wang1999, Jiang & Wang 2001) han trasladado estos conceptos a sistemas en tiempo discreto.A continuacion se presentan las definiciones y resultados necesarios para el desarrollode esta seccion. En la seccion A.4 se presentan estos resultados de una manera masextensa y detallada.

Definicion 5.12 (Estabilidad entrada a estado) (Jiang & Wang 2001) Un sis-tema xk+1 = F (xk, wk) es estable entrada a estado si existe una funcion KL , β(·, ·), yuna funcion K , γ(·), tal que la evolucion del sistema satisface que

‖xk‖ ≤ β(‖x0‖, k) + γ(µ)

para todo x0 ∈ Bε, siendo ‖wk‖ ≤ µ para todo k.

La senal de entrada a la que se refiere en esta definicion es wk, que en el contextode la robustez viene a ser la incertidumbre. Ası, esta definicion dice que en ausenciade incertidumbres el sistema es asintoticamente estable. Sin embargo, cuando apare-cen incertidumbres acotadas, el efecto que estas tienen sobre la evolucion del sistemaesta acotada, es decir, que las incertidumbres no hacen divergir al sistema.

Notese que esta definicion incluye a la anteriormente utilizada de estabilidad asin-totica acotada al final, pues, de la definicion de estabilidad entrada a estado se deduceque para todo ‖x0‖ ≤ ε, el estado esta acotado ‖xk‖ ≤ bk de forma que bk → γ(µ)cuando k →∞, dado que β(‖x0‖, k) → 0.

Asociada a este concepto de estabilidad existe la definicion de una funcion de Lya-punov entrada a estado:

5Acronimo ingles de Input to State Stability

Page 161: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 145

Definicion 5.13 (Funcion de Lyapunov entrada a estado) (Jiang & Wang 2001)Una funcion continua V : IRn 7→ IR+ se denomina funcion de Lyapunov entrada a es-tado si satisface que

Existen unas funciones K , α1(·) y α2(·), tales que

α1(‖x‖) ≤ V (x) ≤ α2(‖x‖) ∀x ∈ Bε

Existe una funcion K , α3(·), y una funcion K , σ(·), tales que

V (F (x,w))−V (x) ≤ −α3(‖x‖)+σ(µ) ∀x ∈ Bε ∀w ∈ Bµ = w ∈ IRp : ‖w‖ ≤ µ

La segunda propiedad de la definicion es equivalente a decir que existe una funcionK∞ , χ(·), y una funcion K , α4(·), tales que

V (F (x,w))− V (x) ≤ −α4(x) ∀x : ‖x‖ ≥ χ(µ)

es decir, que se satisface la condicion de Lyapunov tan solo fuera de una vecindad delorigen.

El principal resultado es el siguiente lema, donde se establece la condicion suficientepara garantizar la estabilidad entrada a estado de un sistema.

Lema 5.14 (Jiang & Wang 2001) Si un sistema xk+1 = F (xk, wk) admite una funcionde Lyapunov entrada a estado entonces el sistema es estable entrada a estado

La demostracion de este lema se muestra en la seccion A.4. De este resultado se deduceque existe una funcion K , ρ(·), tal que

V (F (x,w)) ≤ ρ(V (x)) + σ(µ)

Entonces la funcion K , d(µ) = (id−ρ)−1σ(µ), siendo id(s) = s, satisface las siguientespropiedades

(i) Si un sistema es estable entrada a estado y la entrada (incertidumbre) tiene unacota µ, entonces todo conjunto Ωr, siendo r ≥ d(µ), es un conjunto invarianterobusto del sistema. Ademas el sistema evoluciona hasta quedar confinado enΩr = x ∈ IRn : V (x) ≤ r siendo r = d(µ).

(ii) Todo conjunto Ωr es invariante robusto para unas incertidumbres tales que sucota satisfaga

µ ≤ d−1(r) = σ−1 (r − ρ(r)) (5.7)

Page 162: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

146 5.5. Estabilidad entrada a estado (ISS) del MPC

Los resultados obtenidos son mas generales, pero con un desarrollo semejante, a lospresentados en el analisis de estabilidad robusta de la seccion 5.3. En ese caso se tieneque ρ(r) = ρ·r siendo ρ una constante ρ ∈ [0, 1), y σ(µ) es Lv·µ. Por tanto de (5.7) setiene que

µ ≤ 1− ρ

Lv

·r

que es la misma cota obtenida en la seccion 5.2.

La aplicacion de estos resultados a sistemas con restricciones se hace siguiendo lalınea presentada en la seccion 5.3: la invariancia robusta de Ωr garantiza la satisfac-cion de las restricciones siempre que Ωr este contenido en el dominio de atraccion delcontrolador. Si dicho dominio es un invariante robusto, entonces el resultado obtenidogarantiza que evoluciona a un conjunto en el que permanecera acotado y cuyo tamanodepende de la cota de la incertidumbre.

5.5.2. Aplicacion al MPC

Sea un sistema incierto descrito por la ecuacion

xk+1 = f(xk, uk, wk)

siendo wk ∈ IRp las incertidumbres presentes en el modelo, el cual esta acotada a unconjunto wk ∈ Bµ = w ∈ IRp : ‖w‖ ≤ µ. Por otro lado las entradas y los estadosestan sujetos a uk ∈ U , y xk ∈ X.

El modelo en ausencia de incertidumbres

xk+1 = f(xk, uk, 0)

es el modelo nominal y es el que se utiliza como modelo de prediccion en un MPCtal que satisface las condiciones suficientes de estabilidad (teorema 3.2), y por tantoestabiliza asintoticamente el sistema en un dominio de atraccion XN . La ley de controlobtenida es uk = KMPC(xk).

Como se puede comprobar en el teorema 3.2, el coste optimo resultado del MPC esuna funcion de Lyapunov del sistema y ademas verifica que

J∗N(f(xk, KMPC(xk), 0))− J∗N(xk) ≤ −L(xk, KMPC(xk))

De todo lo anterior se puede establecer el siguiente teorema, que es el resultadoprincipal de este analisis, aportacion de esta tesis.

Page 163: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 147

Teorema 5.15 (Estabilidad robusta)

Sea un sistema incierto descrito por la ecuacion

xk+1 = f(xk, uk, wk)

con uk ∈ U , xk ∈ X y las incertidumbres wk ∈ Bµ.Sea un controlador MPC obtenido a partir del modelo nominal (sin incertidumbres)tal que satisface las condiciones suficientes de estabilidad (teorema 3.2) y estabilizaasintoticamente el sistema nominal en XN .Supongase que el coste optimo es suave con las incertidumbres de forma que existe unafuncion K , γ(·), tal que

|J∗N(f(x,KMPC(x), w))− J∗N(f(x,KMPC(x), 0))| ≤ γ(‖w‖)para todo x ∈ XN .Entonces el sistema es estable entrada a estado y ademas para todo Ωr ⊆ XN , existeuna cota de la incertidumbre µ = µ(r) para la cual el sistema incierto es estable ysatisface las restricciones.

Demostracion:

Para demostrar el teorema basta comprobar que el coste optimo es una funcion deLyapunov entrada a estado. Sea el estado xk+1 = f(xk, KMPC(xk), wk), entonces

J∗N(xk+1)− J∗N(xk) = [J∗N(f(xk, KMPC(xk), wk))− J∗N(f(xk, KMPC(xk), 0))]

+ [J∗N(f(xk, KMPC(xk), 0))− J∗N(xk)]

≤ γ(‖wk‖)− L∗(xk, KMPC(xk))

≤ −l·‖xk‖σ + γ(µ)

Ademas la region Ωr ⊆ XN es un invariante robusto del sistema, y por lo tanto satisfacelas restricciones a lo largo de la evolucion del sistema.

Para un conjunto Ωr dado, el grado de incertidumbre que soporta el controladordepende de las funciones l·‖x‖σ y γ(·). Por tanto, el grado de conservadurismo asociadoa esta cota dependera del grado de aproximacion que tenga la funcion a la discrepanciareal γ(·).

Es importante resaltar que la condicion

|J∗N(f(x,KMPC(x), w))− J∗N(f(x,KMPC(x), 0))| ≤ γ(‖w‖)es una condicion sobre la suavidad de la funcion de coste respecto a los parametros. Porejemplo, si la funcion de coste es Lipschitz (o bien C1) con las incertidumbres, entoncesexiste una constante LJ tal que

|J∗N(f(x,KMPC(x), w))− J∗N(f(x,KMPC(x), 0))| ≤ LJ ·‖w‖

Page 164: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

148 5.6. Suboptimalidad y robustez en el MPC

Por lo tanto, segun su grado de derivabilidad, se puede realizar una aproximacion demayor orden (por la formula de Taylor, por ejemplo), y por lo tanto obtener una funcionγ(·) menos conservadora.

Una condicion suficiente para garantizar la suavidad del coste optimo respecto alos parametros es la suavidad de J∗N(x) respecto al estado y la suavidad del modelof(x, u, w) respecto a los parametros. En efecto, supongase que existen dos funcionesK , δJ(·) y δf (·), tales que

|J∗N(x + ∆x)− J∗N(x)| ≤ δJ(‖∆x‖)‖f(x, u, w)− f(x, u, 0)‖ ≤ δf (‖w‖)

entonces se tiene que

|J∗N(f(x, u, w))− J∗N(f(x, u, 0))| ≤ δJ(‖f(x, u, w)− f(x, u, 0)‖) ≤ δJ δf (‖w‖)

Dado que γ = δJ δf es una funcion K , se comprueba la suavidad del coste optimo.

5.6. Suboptimalidad y robustez en el MPC

La estabilidad asintotica del MPC (en ausencia de incertidumbres) esta basada en eldecrecimiento que experimenta el coste optimo a lo largo del tiempo. Esto permite con-siderar el coste optimo como funcion de Lyapunov. Sin embargo, como se demostro enla seccion 3.8, la optimalidad de la solucion no es necesaria para garantizar la estabi-lidad, es tan solo una caracterıstica deseable de cara al comportamiento del sistemacontrolado. En realidad basta con que la evolucion del coste optimo sea estrictamentedecreciente para garantizar la estabilidad asintotica del controlador. Esto se consigueimponiendo al problema de optimizacion a resolver en el instante k, la siguiente re-striccion de convergencia

JsN(xk) ≤ Js

N(xk−1)− κ·L(xk−1, us(k − 1|k − 1)) (5.8)

siendo κ una constante positiva tal que κ ≤ 1 y us(k− 1|k− 1) la actuacion suboptimaobtenida en el instante k − 1. La constante κ indica la tasa de convergencia mınimaque se desea del controlador de forma que cuanto menor sea, mas lenta puede ser laconvergencia del sistema en bucle cerrado al origen.

En (Mayne et al. 2000) se comenta que la solucion optima global del problema deoptimizacion del MPC puede ser inabordable desde un punto de vista computacional,lo que conduce a la necesidad de soluciones suboptimas para que el MPC sea imple-mentable. Sin embargo, en ausencia de incertidumbres, la restriccion de convergencia no

Page 165: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 149

es necesaria, pues la factibilidad de la solucion en un instante k, garantiza la existenciade una solucion factible en k + 1, uF (k + 1), tal que 6

JN(xk+1, uF (k + 1))− J∗N(xk) ≤ L(xk, u∗(k|k))

Por lo tanto, en ausencia de incertidumbres, la factibilidad de la solucion garantiza laestabilidad del controlador MPC.

La necesidad de la restriccion de convergencia surge de la discrepancia entre laevolucion predicha del sistema y la evolucion real del mismo, es decir, cuando el sistemaesta sujeto a incertidumbres. En este caso, dado que xk+1 6= x(k + 1|k), no se puedegarantizar que la solucion optima sea tal que el coste optimo decrezca mas que el costede etapa, haciendose necesaria la imposicion de la restriccion de convergencia paragarantizar la estabilidad asintotica del sistema.

5.6.1. Estabilidad robusta del MPC suboptimo

Dado que el controlador MPC suboptimo toma sentido en presencia de incertidum-bres, se va a trasladar el analisis de estabilidad entrada a estado del MPC optimo alcaso suboptimo.

El MPC suboptimo presenta las restricciones propias del MPC, es decir, la re-striccion sobre los estados, sobre las actuaciones y sobre el estado terminal, y ademasimpone la restriccion de convergencia dada por la ecuacion (5.8), por la cual garantizauna convergencia mınima del sistema en bucle cerrado. Las restricciones sobre las en-tradas y estados en presencia de incertidumbres presentan el problema de factibilidadrobusta tratado anteriormente y que esta relacionado con la invariancia robusta. Lasatisfaccion de la restriccion de convergencia depende tambien de las incertidumbres yno esta garantizada a pesar del cumplimiento de las anteriores.

Del analisis de estabilidad entrada a estado desarrollado anteriormente, se estableceque bajo condiciones de suavidad del coste optimo, el incremento que experimenta estepor el efecto de la incertidumbre esta acotado y depende del grado de incertidumbreque presenta el sistema

|J∗N(xk+1)− J∗N(x(k + 1|k))| ≤ γ(µ)

siendo γ(·) una funcion K y µ la cota de las incertidumbres. Entonces, el coste optimoes una funcion de Lyapunov ISS y verifica que

J∗N(xk+1)− J∗N(xk) ≤ −L(xk, u∗(k|k)) + γ(µ)

6Vease la demostracion de estabilidad de la formulacion general del MPC en la seccion 3.3

Page 166: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

150 5.6. Suboptimalidad y robustez en el MPC

Para que el coste optimo satisfaga la condicion de convergencia basta con que severifique que

−L(xk, u∗k) + γ(µ) ≤ −κ·L(xk, u

∗k)

de donde se tiene queγ(µ) ≤ (1− κ)·L(xk, u

∗k)

Por lo tanto, κ, la tasa de convergencia del controlador, condiciona el grado de incer-tidumbres que admite el sistema y viceversa. Cuanto mayor sea la tasa de convergenciaκ, menor sera el grado de incertidumbres µ para el cual se satisface la restriccion deconvergencia, o lo que es lo mismo, el grado de incertidumbres para el cual el contro-lador esta definido (es factible). Por el contrario, mas rapida sera la convergencia delsistema en bucle cerrado.

En resumen, la restriccion de convergencia del MPC suboptimo tiene como fin ase-gurar una tasa de convergencia del controlador, limitando ası el grado de incertidumbresque admite. Notese ademas que si las incertidumbres no decaen con el tiempo, tan solose podra satisfacer la restriccion de convergencia fuera de una vecindad del origen.

Es importante resaltar que estos resultados son validos si la funcion de coste essuave ante las incertidumbres. En el caso del MPC optimo esto se puede garantizarbajo ciertas condiciones de regularidad del problema de optimizacion. Sin embargo estasuavidad esta sujeta a la optimalidad de la solucion, perdiendose en caso de subopti-malidad7.

Esto se puede solucionar gracias a que, como se demuestra en el teorema siguiente,la suavidad del coste optimo, garantiza la factibilidad del problema suboptimo, y porlo tanto la estabilidad del controlador.

A continuacion se va a demostrar la estabilidad del controlador MPC suboptimopropuesto en el artıculo (Scokaert et al. 1999), que viene dado por

Si existe una solucion factible con restriccion de convergencia, entonces se aplicala solucion.

Si no, aplicar la mejor solucion obtenida.

Este procedimiento garantiza convergencia siempre que el problema de optimizacionsea factible. Pero los autores no analizan bajo que condiciones es factible el problema yen consecuencia bajo que condiciones este procedimiento estabiliza el sistema incierto.En el siguiente teorema, fruto de esta tesis, se establecen condiciones que garantizanla estabilidad.

7Vease el ejemplo de la seccion 3.8, en el que se pone de manifiesto la falta de suavidad en el casosuboptimo.

Page 167: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 151

Teorema 5.16 (Estabilidad robusta del MPC suboptimo)

Sea un sistema incierto descrito por la ecuacion

xk+1 = f(xk, uk, wk)

con uk ∈ U , xk ∈ X y las incertidumbres wk ∈ Bµ.Sea un controlador MPC obtenido a partir del modelo nominal (sin incertidumbres)tal que satisface las condiciones suficientes de estabilidad (teorema 3.2) y estabilizaasintoticamente el sistema nominal en XN .Supongase que el coste optimo es suave con las incertidumbres de forma que existe unafuncion K , γ(·), tal que

|J∗N(f(x, u, w))− J∗N(f(x, u, 0))| ≤ γ(‖w‖)para todo x ∈ XN y para todo u ∈ U .Entonces el controlador MPC suboptimo propuesto, con una restriccion de convergencia

JsN(xk) ≤ Js

N(xk−1)− κ·L(xk−1, us(k − 1|k − 1))

siendo JsN(xk−1) el coste suboptimo y us(k − 1|k − 1) la actuacion suboptima en el

instante k − 1, estabiliza el sistema en un conjunto

Ωr = x ∈ IRn : JsN(x) ≤ r

tal que Ωr ⊆ XN , para una cota de la incertidumbre µ = µ(r, κ). Ademas la evoluciondel sistema incierto satisface las restricciones.

Demostracion:

La clave de la demostracion radica en comprobar la existencia de una solucion factiblea la restriccion de convergencia (que sera la secuencia optima).

Supongase que el sistema en el instante k − 1 se encuentra en el estado xk−1 talque la actuacion proporcionada por el controlador suboptimo es us(k− 1|k− 1). Comoconsecuencia el sistema evoluciona a xk (estado que difiere del estado predicho xk 6=xs(k|k − 1) = f(xk−1, u

s(k − 1|k − 1), 0)).

A partir de la secuencia de actuaciones usF (k − 1) se obtiene la secuencia para el

instante k, usF (k) dada por

us(k + j − 1|k) =

us(k + j − 1|k − 1) j = 1, · · · , N − 1

h(x(k + N − 1|k))

siendo u = h(x) la ley de control local a la region terminal. Esta secuencia garantiza lasatisfaccion de las restricciones sobre los estados y sobre las actuaciones en el estado

x(k|k − 1) = f(xk−1, usk−1, 0)

Page 168: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

152 5.6. Suboptimalidad y robustez en el MPC

y tiene asociado un coste JN(x(k|k − 1)), el cual satisface que

JN(x(k|k − 1)) ≤ JsN(xk−1)− L(xk−1, u

s(k − 1|k − 1))

Entonces la solucion optima del MPC en el instante xk verifica que

J∗N(xk) ≤ J∗N(f(xk−1, usk−1, 0)) + γ(‖wk−1‖)

≤ JN(x(k|k − 1)) + γ(‖wk−1‖)≤ Js

N(xk−1)− L(xk−1, usk−1) + γ(‖wk−1‖)

≤ JsN(xk−1)− κ·L(xk−1, u

sk−1)−

(1− κ)·L(xk−1, u

sk−1)− γ(‖wk−1‖)

Una vez establecido este resultado se va a demostrar la estabilidad comprobandoque el conjunto

Ωr = x ∈ IRn : JsN(x) ≤ r

tal que Ωr ⊆ XN es un invariante robusto del sistema controlado por el MPC suboptimopara un cierto grado de incertidumbres. Para ello se va a demostrar que para todoxk−1 ∈ Ωr, entonces xk ∈ Ωr para cualquier incertidumbre admisible.

Para ello se van a considerar dos casos:

(i) Incertidumbres acotadas:

Considerese una cota de incertidumbres µ tal que wk ∈ Bµ, para la cual existeuna constante q ∈ (0, r − γ(µ)) tal que

(1− κ)·l·‖x‖σ ≥ γ(µ) ∀x ∈ Ωr \ Ωq

Notese que siempre existe una pareja de valores (µ, q) tal que satisface lo anterior.

Entonces, para todo xk−1 ∈ Ωr \ Ωq se tiene que

γ(µ) ≤ (1− κ)·l·‖xk−1‖σ ≤ (1− κ)·L(xk−1, us(k − 1|k − 1))

Por lo tanto se tiene que

J∗N(xk) ≤ JsN(xk−1)− κ·L(xk−1, u

s(k − 1|k − 1))

y en consecuencia existe una solucion factible tal que verifica la restriccion deconvergencia.

De aquı se deduce que para todo x ∈ Ωr \ Ωq, el coste suboptimo es estricta-mente decreciente y por lo tanto el estado se va aproximando al origen hasta undeterminado instante en el que el estado del sistema entra en la region Ωq.

En este conjunto, las incertidumbres pueden hacer que la restriccion de conver-gencia no sea factible. En ese caso se elimina y se proporciona la mejor actuacion

Page 169: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 153

disponible. Ası, el estado podrıa volver a salir de Ωq, pero no de Ωr. En efecto,supongase que xk ∈ Ωq, entonces en ese instante, la solucion puede no satisfacerla condicion de convergencia, pero sin embargo satisface que

JsN(xk+1) ≤ Js

N(xk)− L(xk, us(k|k)) + γ(µ)

≤ JsN(xk) + γ(µ) ≤ q + γ(µ) ≤ r

por lo tanto xk+1 ∈ Ωr. En el caso en que el estado saliese de Ωq, el controladorvuelve a conducirlo hacia este. Por lo tanto, el sistema quedara confinado por lotanto en una region contenida en Ωr.

(ii) Incertidumbres que decaen con el estado:

Sean unas incertidumbres tales que

γ(‖wk‖) ≤ (1− κ)·l·‖xk‖σ

para todo xk ∈ Ωr, entonces se satisface la restriccion de convergencia en todoinstante y por lo tanto el sistema incierto es asintoticamente estable al origen.

Notese que este resultado tambien se satisface para las incertidumbres que decaenen el tiempo.

De todo lo anterior se deduce que el conjunto Ωr es un invariante robusto paracierto grado de incertidumbres. Entonces, por estar contenido en XN la evolucion delsistema satisface las restricciones.

Notese que en el caso de incertidumbres acotadas el sistema evoluciona partiendode Ωr hasta un invariante robusto contenido en el donde queda confinado. En este caso,ante perturbaciones subitas tales que no saquen al sistema de Ωr el sistema conservala estabilidad. Esto demuestra el comportamiento estable de los ensayos realizados en(Scokaert et al. 1999).

5.7. Robustez del controlador MPC sin restriccion

terminal

El analisis de robustez realizado en las secciones anteriores es facilmente trasladableal controlador MPC sin restriccion terminal ni restricciones sobre los estados. Esto sedebe a que la condicion de suavidad del coste optimo se satisface bajo condicionesblandas.

Page 170: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

154 5.7. Robustez del controlador MPC sin restriccion terminal

Lema 5.17 Sea un sistema incierto descrito por la ecuacion

xk+1 = f(xk, uk, wk)

tal que uk ∈ U y xk ∈ IRn. La funcion del modelo f(·, ·, ·) es Lipschitz respecto xk y awk para todo uk ∈ U es decir

‖f(x1, u, w1)− f(x2, u, w2)‖ ≤ Lx·‖x1 − x2‖+ Lw·‖w1 − w2‖

siendo Lx y Lw las constantes de Lipschitz del sistema.

Sea la funcion de coste de etapa L(x, u) Lipschitz en x con una constante Lc y sea lafuncion de coste terminal V (x) Lipschitz con una constante de Lipschitz Lv. Entoncesla funcion de coste optima del MPC sin restriccion terminal es suave y verifica que

|J∗N(f(x, u, w))− J∗N(f(x, u, 0))| ≤ LJ ·‖w‖

siendo

LJ ≤(Lc·L

Nx − 1

Lx − 1+ Lv·LN

x

)·Lw

Este resultado es una consecuencia inmediata del analisis de sensibilidad del MPCdesarrollado en el apendice C.

Por lo tanto, segun se establecio anteriormente, el coste optimo es una funcion deLyapunov ISS, lo que garantiza estabilidad robusta del sistema para cierta cota de laincertidumbre.

Dado que el controlador sin restriccion terminal estabiliza el sistema en una region

Γ = x ∈ IRn : J∗N(x) ≤ L(x,KMPC(x)) + (N − 1)·d + α

siendo d el mınimo coste de estapa que puede tener todo estado que no pertenece ala region terminal Ω = x ∈ IRn : V (x) ≤ α. En el siguiente corolario se analiza lainvariancia robusta de esta conjunto.

Corolario 5.18 Bajo las hipotesis del lema anterior, el conjunto Γ es un invarianterobusto para toda incertidumbre tal que

‖w‖ ≤ µ =d

LJ

Page 171: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 155

Demostracion:

En efecto, supongase que xk y xk+1 no pertenecen a Ω, entonces

J∗N(xk+1) ≤ J∗N(xk)− L(xk, KMPC(xk)) + LJ ·µ ≤ (N − 1)·d + α + LJ ·µsustituyendo el valor de µ se tiene que

J∗N(xk+1) ≤ N ·d + α ≤ L(xk+1, KMPC(xk+1)) + (N − 1)·d + α

por lo que xk+1 ∈ Γ.

Ademas dado que para todo x /∈ Ω, se tiene que L(x,KMPC(x)) ≥ d, entonces

J∗N(xk+1) ≤ J∗N(xk)− (L(xk, KMPC(xk))− d)

por tanto para todo xk /∈ Ω, J∗N(xk+1) decrece haciendo converger el sistema en Ω. Elsistema permanece en este conjunto, salvo que la incertidumbre en un momento dadolo saque de este conjunto, de forma que el controlador vuelve a conducir el sistemahasta esta region. Notese que si x0 ∈ Γ, entonces en ningun caso se abandonarıa dicharegion.

5.8. Ejemplo de aplicacion al reactor

A continuacion se va a comprobar que el MPC aplicado al reactor posee una robustezinherente ante incertidumbres. En este caso se sintoniza el controlador MPC con losmismos parametros que en la seccion 3.3.2. El horizonte de control en este caso es deNc = Np = 3.

Para el sistema ası sintonizado se ha calculado un conjunto invariante Ωr contenidoen X3. Este conjunto viene dado por

Ωr = x ∈ IR2 : J∗3 (x) ≤ 8,5

Como se ha demostrado anteriormente, existe un conjunto de incertidumbres cuyacota depende de r, para el cual el conjunto Ωr es un conjunto invariante robusto. Conel objeto de ilustrar la robustez inherente del controlador, se ha calculado grado deincertidumbres que admite la region de una forma no conservadora, obteniendose unosvalores de las incertidumbres:

w1 ∈ [−6·10−3, 6·10−3]

w2 ∈ [−2·10−2, 1·10−3]

Page 172: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

156 5.8. Ejemplo de aplicacion al reactor

−0.3 −0.2 −0.1 0 0.1 0.2−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2 Ωr

X3

Figura 5.4: Evolucion del sistema incierto controlado por el MPC.

En la figura 5.4 se muestra el dominio de atraccion del controlador X3 y la region Ωr.Tambien se muestra la evolucion del sistema ante incertidumbres que se han modeladocomo aleatorias. Como se puede observar, el sistema evoluciona hasta quedar confinadoen una cierta vecindad del origen.

En la figura 5.5 se ilustra que la evolucion del sistema incierto permanece en Ωr

para las cotas de incertidumbres obtenidas. Para ello se muestra la evolucion del sistemaconsiderando las incertidumbres mınimas (a) y maximas (b), constantes a lo largo de laevolucion. Se han considerado por ser estas las realizaciones mas desfavorables. Se puedecomprobar que los estados mas sensibles a las incertidumbres son los extremos derechoe izquierdo de las regiones y son las zonas que marcan las maximas incertidumbres queadmite el sistema. Esto supone un conservadurismo en el resto del invariante, pero esla unica forma de garantizar la estabilidad robusta en toda la region Ωr.

Es importante resaltar, que las cotas que se obtienen a partir de los procedimientospresentados en este capıtulo son mas conservadoras que las utilizadas en este ejemplo.Estas han sido calculadas para ilustrar la robustez inherente del controlador y tras unexhaustivo analisis del sistema. Sin embargo, a pesar del conservadurismo de los proce-dimientos presentados, son metodos generales para obtener un grado de incertidumbrespara las cuales el sistema es robusto.

Page 173: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 5. Analisis de robustez del MPC nominal 157

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2−0.4

−0.3

−0.2

−0.1

0

0.1

0.2

0.3

0.4

x1

x 2Ω

r

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2−0.4

−0.3

−0.2

−0.1

0

0.1

0.2

0.3

0.4

Ωr

x 2

x1

(a) (b)

Figura 5.5: Evolucion del sistema incierto con incertidumbres mınimas (a) y maximas (b)

5.9. Conclusiones

En esta seccion se ha abordado el analisis de robustez inherente del controladorMPC, es decir, se ha analizado el grado de incertidumbre que es capaz de soportar elcontrolador disenado para el sistema nominal. Resultados existentes en la literaturaestablecen robustez del MPC para sistemas cuyas actuaciones son afines en el modeloy no presentan restricciones ni en los estados ni en las actuaciones. Basandose en laoptimalidad del problema, se establecen margenes de estabilidad robusta ante incer-tidumbres en las entradas (Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni &Sepulchre 1997).

En este capıtulo, el analisis de estabilidad se basa en la teorıa de Lyapunov, sigui-endo la lınea de (Scokaert et al. 1997, De Nicolao et al. 1998) extendiendo resultadosprevios al caso de incertidumbres aditivas en el modelo. Se hace hincapie en la necesi-dad de garantizar la satisfaccion de las restricciones a pesar de las incertidumbres,para lo cual se hace uso del concepto de invariancia robusta y se incorporan resultadosexistentes (Kerrigan 2000). Este resultado ha sido presentado en (Limon Marruedo,Alamo & Camacho 2002c).

Este analisis se puede generalizar a controladores con estabilidad asintotica e in-certidumbres parametricas en el sistema gracias a la incorporacion del concepto yresultados de la estabilidad entrada a estado (ISS) del sistema. Ası, se puede establecerel siguiente resultado: la suavidad de la funcion de coste optimo garantiza que el MPCadmite cierto grado de incertidumbre. Este analisis, al igual que el anterior, representauna de las aportaciones originales de esta tesis.

Page 174: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

158 5.9. Conclusiones

Tambien se pone de manifiesto la relacion entre suboptimalidad y robustez, puesesta tan solo tiene sentido en presencia de incertidumbres. Dado que las condiciones desuavidad del coste optimo estan basadas en la optimalidad de la solucion, la suavidadse puede perder en el MPC suboptimo. Sin embargo, sorprendentemente, la suavidaddel coste optimo, garantiza la robustez del MPC suboptimo, pues garantiza la factibili-dad de la restriccion de convergencia. Este analisis constituye tambien una aportacionoriginal de esta tesis.

Por ultimo, se ha demostrado la robustez del MPC sin restriccion terminal, dadoque la ausencia de restricciones en los estados permite garantizar la suavidad del costeoptimo. Ademas se determina una cota explıcita de las incertidumbres que admite.Este analisis tambien es original de esta tesis.

En este capıtulo se ha puesto de manifiesto que la suavidad del coste optimo es unapieza clave para la robustez del MPC nominal. Sin embargo, esta condicion se puedesatisfacer bajo ciertas condiciones de regularidad del problema, difıciles de comprobar.Por lo tanto, resulta interesante encontrar alguna forma de sintonizar el controlador quegarantice cierto grado de robustez. En el capıtulo siguiente se presenta una formulaciondel MPC que la estabilidad entrada a estado del controlador y la satisfaccion robustade las restricciones.

Page 175: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6

MPC ISS con satisfaccion robustade las restricciones

6.1. Introduccion

En el anterior capıtulo se analizo la robustez que inherentemente presenta el contro-lador predictivo. Esta robustez se comprueba de dos formas: mediante la optimalidadde la solucion y mediante la capacidad del controlador MPC de estabilizar asintotica-mente el sistema. En todos los estudios realizados se parte de la hipotesis que el costeoptimo es una funcion suave (en los basados en optimalidad se exige que sea C2 (DeNicolao et al. 1996, Magni & Sepulchre 1997)) y esta condicion tan solo esta garan-tizada bajo ciertas condiciones de regularidad del problema de optimizacion (vease elapendice C).

En este capıtulo se presenta un procedimiento sencillo para incorporar el conocimien-to de las incertidumbres en el diseno del controlador. Esta basado en la acotacion de ladiscrepancia entre la evolucion del sistema nominal y el real cuando el sistema presentaincertidumbres. Esta acotacion se incorpora en las restricciones en los estados y en eldiseno de la region terminal y a partir de estos, se formula un controlador MPC basadoen predicciones nominales, semejante a las formulaciones no robustas.

El controlador presentado es factible en todo instante (partiendo de estados ini-ciales factibles) y por lo tanto satisface las restricciones en cada instante a pesar dela incertidumbres. Ademas, el controlador es estable entrada a estado lo que garantizala convergencia del sistema. Este trabajo ha cristalizado en una publicacion (LimonMarruedo, Alamo & Camacho 2002b).

159

Page 176: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

160 6.2. Descripcion del sistema

6.2. Descripcion del sistema

A lo largo del capıtulo se va a considerar que el sistema real o planta responde aun modelo incierto descrito por

xk+1 = f(xk, uk, wk) (6.1)

siendo xk ∈ IRn el vector de estados del sistema y uk ∈ IRm las actuaciones sobre elmismo. El vector wk ∈ IRp representa las incertidumbres presentes en el modelo, de lascuales se conoce exclusivamente que estan acotadas de forma que

wk ∈ Bµ = w ∈ IRp : ‖w‖ ≤ µ

Por otro lado las entradas y los estados estan sujetos a las restricciones

uk ∈ U

xk ∈ X

El modelo en ausencia de incertidumbres viene dado por

xk+1 = f(xk, uk, 0) (6.2)

y se denomina modelo nominal. Este modelo es el que se utiliza como modelo deprediccion en el controlador MPC propuesto.

Ademas se va a suponer que el sistema satisface la siguiente hipotesis de suavidad.

Hipotesis 6.1 El modelo es suave respecto a los estados y a las incertidumbres, deforma que existen dos funciones K , δx(·) y δw(·), tales que

‖f(x + ∆x, u, 0)− f(x, u, 0)‖ ≤ δx(‖∆x‖)‖f(x, u, w)− f(x, u, 0)‖ ≤ δw(‖w‖)

para todo x, x + ∆x ∈ X, u ∈ U y w ∈ Bµ.

Resulta interesante destacar que en el caso en el que el modelo sea Lipschitz respectoa x y a w, entonces estas funciones tienen la forma

δx(‖∆x‖) = Lx·‖∆x‖δw(‖w‖) = Lw·‖w‖

Page 177: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 161

6.3. Acotacion del efecto de las incertidumbres en

la prediccion

Las incertidumbres existentes en el sistema real o planta hacen que el compor-tamiento de este difiera del comportamiento dado por el modelo nominal, por lo queel sistema no evolucionara como se espera. Con el fin de incorporar este efecto en eldiseno del controlador, resulta de interes realizar una acotacion de la discrepancia entrela evolucion del sistema real y la evolucion esperada o predicha por el modelo nominal,ante una misma secuencia de actuaciones.

Para hacer mas legibles las demostraciones de esta seccion se denotara:

xk+j : el estado del sistema real (incierto) en el instante k + j al aplicar una secuenciade actuaciones uk, · · · , uk+j−1 a partir del instante k, estando el sistema en elestado xk.

x(k + j|k) : el estado predicho mediante el modelo nominal (en ausencia de incertidum-bres) ante la misma secuencia de actuaciones y partiendo de xk.

El objeto de esta seccion es pues calcular una acotacion de la forma

‖xk+j − x(k + j|k)‖ ≤ cj(µ)

siendo la constante µ la cota de las incertidumbres, tal que wk ∈ Bµ. Esta se estableceen el siguiente lema.

Lema 6.2 Sea un sistema dado por la ecuacion (6.1) tal que satisface la hipotesis 6.1,entonces

‖xk+j − x(k + j|k)‖ ≤ cj(µ)

donde cj(µ) viene dada por la recursion

cj(µ) = δw(µ) + δx(cj−1(µ))

siendo c1(µ) = δw(µ).

Demostracion:

Para ello se va a proceder de la siguiente forma:

Page 178: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

162 6.3. Acotacion del efecto de las incertidumbres en la prediccion

j = 1 :

‖xk+1 − x(k + 1|k)‖ = ‖f(xk, uk, wk)− f(xk, uk, 0)‖ ≤ δw(µ) = c1(µ)

j = 2 :

‖xk+2 − x(k + 2|k)‖ = ‖f(xk+1, uk+1, wk+1)− f(x(k + 1|k), uk+1, 0)‖≤ ‖f(xk+1, uk+1, wk+1)− f(xk+1, uk+1, 0)‖

+‖f(xk+1, uk+1, 0)− f(x(k + 1|k), uk+1, 0)‖≤ δw(µ) + δx(‖xk+1 − x(k + 1|k)‖)≤ δw(µ) + δx(c1(µ)) = c2(µ)

j : siguiendo este procedimiento, para k + j se tendra

‖xk+j − x(k + j|k)‖ = ‖f(xk+j−1, uk+j−1, wk+j−1)− f(x(k + j − 1|k), uk+j−1, 0)‖≤ ‖f(xk+j−1, uk+j−1, wk+j−1)− f(xk+j−1, uk+j−1, 0)‖

+‖f(xk+j−1, uk+j−1, 0)− f(x(k + j − 1|k), uk+j−1, 0)‖≤ δw(µ) + δx(‖xk+j−1 − x(k + j − 1|k)‖)≤ δw(µ) + δx(cj−1(µ)) = cj(µ)

Es interesante resaltar que la funcion cj(·) tiene las siguientes propiedades:

Propiedad 6.3 La funcion cj(·) verifica que:

(i) Es una funcion K .

(ii) La secuencia cj(µ) es monotonamente creciente, es decir, cj(µ) > cj−1(µ) paratodo µ > 0.

Demostracion:

(i) Se demuestra por induccion: dado que c1(·) = δw(·), esta funcion es K .Supongase que cj−1(·) es una funcion K . Entonces, considerando que la composi-cion de dos funciones K es tambien una funcion K y que la suma de dos funcionesK es tambien una funcion K , se tiene que

cj(µ) = δw(µ) + δx(cj−1(µ))

es una funcion K .

Page 179: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 163

(ii) Se demuestra por induccion: en primer lugar se demuestra que

c2(µ) = δw(µ) + δx(c1(µ)) > δw(µ) = c1(µ)

Entonces si cj(µ) > cj−1(µ), se tiene que

cj+1(µ) = δx(µ) + δx(cj(µ)) > δx(µ) + δx(cj−1(µ)) = cj(µ)

por ser δx(·) una funcion K .

Notese que una secuencia monotonamente creciente no tiene por que divergir. Portanto, la acotacion del efecto de las incertidumbres puede no tender a infinito (cuandoj →∞), permaneciendo acotado, tal y como puede ocurrir en sistemas estables.

En el desarrollo llevado a cabo en las siguientes secciones, se requiere la acotacionde la discrepancia que experimenta el sistema considerando tan solo el efecto de lasincertidumbres en el instante siguiente. Esta acotacion se establece en el siguiente lema.

Lema 6.4 Sea xk el estado de un sistema incierto descrito por (6.1) tal que satisfacela hipotesis 6.1. Sea x(k + j|k) el estado predicho en el instante k + j a partir dex(k|k) = xk utilizando el modelo nominal y aplicando una secuencia de actuaciones

uF (k) = u(k|k), · · · , u(k + j − 1|k)

Sea xk+1 el estado al que evoluciona el sistema incierto al aplicar u(k|k). Sea el estadox(k + j|k + 1) el estado predicho en el instante k + j a partir de x(k + 1|k + 1) = xk+1

aplicando el resto de la secuencia uF (k), es decir u(k + 1|k), · · · , u(k + j − 1|k).Entonces se tiene que

‖x(k + j|k)− x(k + j|k + 1)‖ ≤ δj−1x δw(µ) (6.3)

para cualquier incertidumbre wk ∈ Bµ, siendo δix(·) la composicion sucesiva i veces de

la funcion δx(·).

Demostracion:

Para j = 1 se tiene que

‖x(k + 1|k + 1)− x(k + 1|k)‖ = ‖xk+1 − x(k + 1|k)‖ ≤ δw(µ)

Page 180: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

164 6.3. Acotacion del efecto de las incertidumbres en la prediccion

La prediccion en el instante siguiente verifica que

‖x(k + 2|k + 1)− x(k + 2|k)‖ ≤ δx(‖x(k + 1|k + 1)− x(k + 1|k)‖) ≤ δx δw(µ)

y analogamente para la prediccion siguiente se tiene que

‖x(k + 3|k + 1)− x(k + 3|k)‖ ≤ δx(‖x(k + 2|k + 1)− x(k + 2|k)‖) ≤ δ2x δw(µ)

Procediendo por recursion se demuestra el lema.

6.3.1. Acotacion basada en la continuidad Lipschitz

Particularmente interesante resulta el caso en el que el modelo sea Lipschitz, tantoen los estados como en las incertidumbres. Como se comento anteriormente, en estecaso las funciones δx(·) y δw(·) toman la forma

δx(‖∆x‖) = Lx·‖∆x‖δw(‖w‖) = Lw·‖w‖

y por lo tantoδjx(∆x) = Lj

x·‖∆x‖

De la recursion presentada en el lema 6.2 es inmediato comprobar que

‖xk+j − x(k + j|k)‖ ≤ cj(µ) =i=j−1∑

i=0

Lix·Lw·µ =

Ljx − 1

Lx − 1·Lw·µ

y ademas se tiene quecj(µ) = cj−1(µ) + Lj−1

x ·Lw·µ

Merece la pena destacar que la continuidad Lipschitz es la forma mas blanda desuavidad y basta con que la funcion sea continuamente diferenciable para garantizarla.En este caso, la constante de Lipschitz se puede calcular como la maxima norma in-ducida del jacobiano del modelo, lo que no es complejo de obtener.

6.3.2. Reduccion del conservadurismo

Las cotas obtenidas de la discrepancia entre la evolucion real del sistema y lapredicha por el modelo nominal estan basadas en las funciones K que acotan las varia-ciones del modelo en el estado δx(·) y en las incertidumbres δw(·),

‖f(x + ∆x, u, w)− f(x, u, w)‖ ≤ δx(‖∆x‖)‖f(x, u, w)− f(x, u, 0)‖ ≤ δw(‖w‖)

Page 181: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 165

que se verifican para todo x, x + ∆x ∈ X, u ∈ U y w ∈ Bµ. Dado el caracter globalde estas acotaciones, las cotas obtenidas son conservadoras, pues representan la peorde las situaciones posibles. Por lo tanto al incorporar estas acotaciones en el diseno delcontrolador predictivo, se esta considerando siempre que el sistema se encuentra en lasituacion mas desfavorable, lo que conduce a actuaciones conservadoras.

Sin embargo, la principal fuente de conservadurismo radica en el hecho de que laspredicciones se hacen a partir de una secuencia de actuaciones fijas, independiente delas incertidumbres. Es decir, que las predicciones no consideran el efecto de la realimen-tacion del controlador, y por lo tanto, la adaptacion que las actuaciones experimentanante el efecto de las incertidumbres. Esto es derivado del hecho de que el MPC esuna estrategia en bucle abierto aplicada en bucle cerrado mediante la estrategia dehorizonte deslizante. Este problema ha dado lugar a una reformulacion del MPC decara a la robustez, en lo que se ha denominado formulacion del MPC en bucle cerrado(Mayne et al. 2000, Scokaert & Mayne 1998). Este problema se tratara en un capıtuloposterior de esta tesis.

Con vista a reducir el conservadurismo de estas cotas se pueden llevar a cabo lassiguientes medidas:

Eleccion de una norma adecuada : las acotaciones obtenidas estan definidas enuna norma y sus propiedades son independientes de esta. Sin embargo, los val-ores alcanzados por estas funciones, y por lo tanto la bondad de la acotacion,sı puede depender de la norma elegida. Una reduccion en alguna de estas fun-ciones puede reducir el grado de conservadurismo de la cota. La reduccion deδx(·) es particularmente interesante por la composicion sucesiva que experimentaen la determinacion de la cota.

Para ilustrar este punto, considerese una acotacion basada en la constante deLipschitz. Como se comento anteriormente, el valor de dicha constante dependede la norma. Sea la norma ‖·‖s en la que se acota la discrepancia, de forma que

‖f(x, u, w)− f(x, u, 0)‖s ≤ Lw·‖w‖s ≤ Lw·µConsiderese otra norma diferente ‖·‖q en la que se calcula la constante de Lips-chitz Lx, de forma que

‖f(y, u, w)− f(x, u, w)‖q ≤ Lx‖y − x‖q

Sean las constantes mq y Mq tales que mq·‖x‖q ≤ ‖x‖s ≤ Mq·‖x‖q, entonces

‖f(x, u, w)− f(x, u, 0)‖q ≤ Mq·‖f(x, u, w)− f(x, u, 0)‖s ≤ Mq·Lw·µPor lo tanto la acotacion de la discrepancia en norma ‖·‖q viene dada por

‖xk+j − x(k + j|k)‖q ≤ Ljx − 1

Lx − 1·Mq·Lw·µ

Page 182: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

166 6.3. Acotacion del efecto de las incertidumbres en la prediccion

y de la equivalencia entre normas se deduce que la acotacion de la discrepanciaen norma ‖·‖s es

‖xk+j − x(k + j|k)‖s ≤ Ljx − 1

Lx − 1·Mq

mq

·Lw·µ

De esta expresion se deduce que, por el efecto de la composicion de Lx, una re-duccion en el valor de Lx puede afectar en mayor medida que un posible aumentoen la relacion entre normas (que viene dado por la razon Mq/mq).

Tomese por ejemplo un sistema lineal xk+1 = A·xk + wk siendo

A =

0,9 2,0

0 0,8

con unas incertidumbres ‖wk‖∞ ≤ 0,1 y considerando la norma-s como la norma∞. Dado que la norma de la matriz ‖A‖ es una constante de Lipschitz del modelo,se tiene que Lx = ‖A‖∞ = 2,9. Dado que la incertidumbre es aditiva, la constantede Lipschitz Lw = 1, por lo que la cota obtenida en j = 5 es

‖xk+5 − x(k + 5|k)‖∞ ≤ 107,43× 0,1 = 10,74

Sin embargo, si se toma como norma-q, para calcular la constante de Lipschitz, lanorma dos ponderada ‖·‖P con una matriz de ponderacion P tal que AT ·P ·A ≤ε·P entonces la constante de Lipschitz es LP = ‖A‖P =

√ε. Resolviendo este

problema, que se puede expresar en forma de desigualdad matricial lineal (LMI)(Boyd, Ghaoui, Feron & Balakrishnan 1994), se obtiene una matriz

P =

1,0189 0,7283

0,7283 29,9620

lo que induce una constante de Lipschitz LP = 1,113 y unas constantes mP =0,1826 y MP = 1,4138. En este caso, la cota obtenida es

‖x(k + 5|k)− xk+5‖∞ ≤ 4,84

Como se puede observar, la cota obtenida es mas precisa. La obtencion de unanorma adecuada para un sistema no lineal es una tarea difıcil, pero lo que nodebe hacerse es tomar cualquier norma, pues se puede incurrir en el aumento delconservadurismo.

Controlador en cascada : fue propuesto originalmente en (Bemporad 1998), conel fin de reducir el conservadurismo de las predicciones en bucle abierto en uncontrolador MPC robusto lineal. La idea consiste en anadir una realimentacionadicional al sistema con el fin de considerar en las predicciones la realimentacionque introduce el controlador MPC.

Page 183: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 167

Incorporando esta idea en la acotacion que se esta realizando, la actuacion sobreel sistema se reformula como

uk = K·xk + vk

siendo vk la nueva variable de decision en el problema de optimizacion. Ası, elmodelo del sistema prealimentado sera

xk+1 = f(xk, K·xk + vk, wk) = fK(xk, vk, wk)

el cual varıa por el efecto del controlador de la prealimentacion. De esta manera,las funciones de acotacion, principalmente δx(·), varıan y por lo tanto se puedenreducir las cotas.

Utilizacion de aproximaciones locales : la acotacion sobre la discrepancia entreel estado predicho y el real, se puede reducir si se calcula esta de forma local, esdecir, dependiendo no solo del grado de incertidumbre, sino tambien del estadoy secuencia de actuaciones que se aplican. Esto se puede hacer utilizando lasregiones de evolucion incierta, que se desarrolla en el capıtulo siguiente.

6.4. Controlador MPC con estabilidad entrada a

estado

En el capıtulo anterior se introdujo el concepto de estabilidad entrada a estado yse comprobo que esta teorıa ofrece un marco adecuado para el analisis de robustezdel controlador MPC. De este analisis se deduce que si el coste optimo es suave y lainfluencia de las incertidumbres sobre el sistema es suave, entonces el sistema admitecierto grado de incertidumbre. La suavidad del MPC esta sujeta a condiciones deregularidad en el problema de optimizacion, que resultan difıciles de comprobar.

En esta seccion se plantea una formulacion del MPC que garantiza la estabilidadentrada a estado del sistema sin consideraciones de suavidad en el coste optimo. En esteanalisis se considera primero el caso en que no hayan restricciones en los estados. Enuna seccion posterior se extienden los resultados al caso con restricciones en los estados.La motivacion de este analisis por separado es distinguir los dos aspectos de la robustez:la factibilidad robusta y la convergencia. La convergencia esta garantizada para todoestado inicial factible, bajo cierta cota de las incertidumbres admitidas, gracias a laestabilidad entrada a estado. La factibilidad se garantiza modificando las restriccionesen funcion de las incertidumbres presentes en el sistema.

El controlador que se propone se basa en la formulacion robusta del controladorMPC dual presentada en (Michalska & Mayne 1993). En este trabajo se presenta

Page 184: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

168 6.4. Controlador MPC con estabilidad entrada a estado

primero un controlador MPC dual, tal que conduce el sistema hasta una region terminalΩ, donde un controlador local es el encargado de estabilizarlo hasta el origen. En estaformulacion, ademas de la conmutacion del controlador, el horizonte de control es unavariable de decision, por lo que se va reduciendo a lo largo de la evolucion del sistema.Con el fin de proveer robustez al sistema cuando se anade un observador de los estados,se propone un controlador robusto dual que estabiliza sistemas con cierto grado deincertidumbres aditivas que decaen con el tiempo. Partiendo de un invariante robusto,se considera en el problema de optimizacion una region terminal mas conservadoraΦ. Para cierto grado de incertidumbres se garantiza que en el instante siguiente elproblema es factible en Ω y por lo tanto el controlador local lo puede llevar hasta Φ enun tiempo determinado.

En la formulacion que se propone en esta seccion, se utiliza la idea de la regionterminal conservadora pero se extiende a un controlador MPC con horizonte fijo, y porlo tanto no es necesario conmutar a un controlador local. Ademas se demuestra que elcontrolador propuesto garantiza la estabilidad entrada a estado para ciertas cotas delas incertidumbres.

Cabe resaltar que la formulacion que se presenta esta basada en la prediccion no-minal del sistema, con un problema de optimizacion semejante al de un MPC general.Por lo tanto el procedimiento propuesto para garantizar robustez es tan sencillo co-mo considerar en el problema de optimizacion una region interior a la region terminalobtenida.

A continuacion se presentan una serie de resultados preliminares sobre la regionterminal necesarios para la formulacion del controlador que se propone.

6.4.1. Determinacion de la region terminal

Se va a considerar que el sistema satisface la siguiente hipotesis:

Hipotesis 6.5 El sistema es tal que existe un conjunto Ω que es un conjunto invariantepositivo del sistema controlado por una ley de control uk = h(xk), tal que

1. Ω ⊆ Xh = x ∈ IRn : h(x) ∈ U.2. Sea un conjunto invariante Φ ⊂ Ω tal que 1

Ω ⊆ Qh(Φ) (6.4)

1Qh(Φ) = x ∈ IRn : h(x) ∈ U y f(x, h(x)) ∈ Φ. Vease la seccion A.3.

Page 185: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 169

es decir, que para todo x ∈ Ω, se satisface que f(x, h(x), 0) ∈ Φ.

3. El sistema en bucle cerrado tiene una funcion de Lyapunov asociada V (x) tal que

V (f(x, h(x), 0))− V (x) ≤ −L(x, h(x)) ∀x ∈ Φ

4. Sea un conjunto no vacıo Bγ = z ∈ IRn : ‖z‖ ≤ γ tal que

Φ⊕Bγ ⊆ Ω (6.5)

siendo Φ⊕Bγ = ω ∈ IRn : ∃φ ∈ Φ, ∃z ∈ Bγ |ω = φ + z.

Notese que las condiciones impuestas sobre el conjunto invariante Ω y la funcionde coste terminal V (x) son la hipotesis habituales a imponer sobre la region terminaldel MPC nominal. El conjunto Φ y el conjunto Bγ existen gracias a que el controladorlocal estabiliza asintoticamente el sistema.

Se va a suponer ademas que la funcion de Lyapunov satisface la siguiente hipotesis

Hipotesis 6.6 La funcion de coste terminal V (x) es suave, de forma que existe unafuncion K , δV (x), tal que

|V (x + ∆x)− V (x)| ≤ δV (‖∆x‖)para todo x ∈ Ω.

En el caso en que el conjunto Ω venga dado por

Ω = x ∈ IRn : V (x) ≤ αy el controlador local estabilice exponencialmente el sistema siendo V (x) la funcionde Lyapunov asociada, se puede obtener el conjunto Φ de la siguiente forma: sea unaconstante positiva ρ < 1 tal que, para todo x ∈ Ω verifica2

V (f(x, h(x), 0)) ≤ ρ·V (x)

entonces se puede determinar el conjunto Φ como

Φ = x ∈ IRn : V (x) ≤ ρ·α = αv

El conjunto Bγ vendra dado por un valor de γ tal que

δV (γ) ≤ (α− αv) = (1− ρ)·α (6.6)

dado que para todo x ∈ Φ y z ∈ Bγ, se verifica que

V (x + z) ≤ V (x) + δV (‖z‖) ≤ αv + δV (γ) ≤ α

y por tanto x + z ∈ Ω, por lo que Φ⊕Bγ ⊆ Ω.

2Vease la seccion A.2.3.

Page 186: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

170 6.4. Controlador MPC con estabilidad entrada a estado

6.4.2. Formulacion del MPC

Una vez determinados la region terminal Φ, el controlador MPC se obtiene de laresolucion del siguiente problema de optimizacion:

mınuF (k)

JN(xk, uF (k))

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + N |k) ∈ Φ

siendo el funcional a optimizar

JN(xk, uF (k)) =N−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

El vector uF (k) denota la secuencia de N actuaciones futuras

uF (k) = u(k|k), · · · , u(k + N − 1|k)

siendo u(k + j|k) la actuacion en el instante k + j calculada en el instante actual k.Ante esta secuencia de actuaciones, la evolucion predicha del sistema en el instantek + j +1 a partir del modelo nominal del sistema se denota como x(k + j +1|k) y vienedada por

x(k + j + 1|k) = f(x(k + j|k), u(k + j|k), 0)

de modo que x(k|k) es el estado muestreado del sistema en el instante actual xk.

Como se puede observar, este problema de optimizacion es semejante al asociado ala formulacion general del MPC, en el que la region terminal es un invariante con unascondiciones adicionales.

Se va a considerar que el coste de etapa satisface la siguiente hipotesis de suavidad:

Hipotesis 6.7 La funcion de coste de etapa L(x, u) es suave respecto al estado deforma que existe una funcion K , δL(x), tal que

|L(x + ∆x, u)− L(x, u)| ≤ δL(‖∆x‖)

para todo u ∈ U y para todo x ∈ IRn.

Page 187: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 171

6.4.3. Analisis de estabilidad

Para comprobar la estabilidad entrada a estado del sistema, se va a demostrarprimero que el controlador esta bien planteado bajo cierto grado de incertidumbres,es decir, que si un estado es factible, entonces el estado siguiente tambien lo es. Estaprueba de factibilidad robusta permite afirmar que el conjunto de estados factibles esun invariante robusto positivo del sistema.

Teorema 6.8 (Factibilidad robusta)

Sea un sistema incierto descrito por un modelo

xk+1 = f(xk, uk, wk)

con las actuaciones sujetas a uk ∈ U en todo instante k. Las incertidumbres wk ∈ IRp

estan contenidas en el conjunto wk ∈ Bµ = w ∈ IRp : ‖w‖ ≤ µ.Supongase que las funciones que describen el modelo f(·, ·, ·), el coste terminal V (·) yel coste de etapa L(·, ·) son funciones suaves que satisfacen las hipotesis 6.1,6.6 y 6.7.Sea el controlador MPC obtenido del problema de optimizacion propuesto,de forma talque el conjunto terminal Φ satisface la hipotesis 6.5, siendo Bγ el conjunto asociado aΦ.Entonces el sistema incierto controlado por el controlador MPC propuesto, si partede un estado inicial factible (x0 ∈ Xr

N), la evolucion del sistema incierto es factible(xk ∈ Xr

N), para unas incertidumbres tales que

δN−1x δw(µ) ≤ γ

Demostracion:

Para probar el teorema, se va a proceder demostrando que para todo xk−1 ∈ XrN , se

tiene que xk = f(xk−1, u∗(k−1|k−1), wk−1) ∈ Xr

N para toda incertidumbre wk−1 ∈ Bµ.Esta condicion garantiza que el conjunto Xr

N es un invariante robusto del sistema enbucle cerrado.

Sea u∗F (k − 1) la solucion optima en el instante k − 1. A partir de esta se va acalcular una secuencia uF (k) para el instante k, de forma que

u(k + j − 1|k) =

u∗(k + j − 1|k − 1) para j = 1, ..., N − 1

h(x(k + N − 1|k)) para j = N(6.7)

Se denota x(k + j|k) al estado predicho en k + j a partir del estado x(k|k) = xk

utilizando el modelo nominal (en ausencia de incertidumbres) y aplicando la secuenciade actuaciones uF (k).

Page 188: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

172 6.4. Controlador MPC con estabilidad entrada a estado

A continuacion se va a demostrar que esta secuencia de actuaciones es factible enel instante k, lo que demuestra el teorema. Para ello se va a comprobar la satisfaccionde las restricciones del problema de optimizacion en xk para cualquier incertidumbreadmisible.

a) u(k + j|k) ∈ U : es consecuencia inmediata de la factibilidad de u∗F (k− 1) y de lapropiedad del controlador local por la cual h(x) ∈ U , ∀x ∈ Ω.

b) x(k + N |k) ∈ Φ: en la figura 6.1,se ilustra la idea de esta demostracion. Primerose va a demostrar que x(k + N − 1|k) ∈ Ω. Para ello tengase en cuenta que porel lema 6.4 se tiene que

‖x(k + N − 1|k)− x∗(k + N − 1|k − 1)‖ ≤ δN−1x δw(µ)

Considerando que δN−1x δw(µ) ≤ γ se deduce que el vector

z = x(k + N − 1|k)− x∗(k + N − 1|k − 1) ∈ Bγ

Entonces, considerando que x∗(k + N − 1|k − 1) ∈ Φ y que z ∈ Bγ se tiene que

x(k + N − 1|k) = x∗(k + N − 1|k − 1) + z ∈ Φ⊕Bγ ⊆ Ω

Por la hipotesis 6.4 se tiene que Ω ⊆ Qh(Φ) y por lo tanto el controlador local escapaz de llevar cualquier estado de Ω a Φ en un solo paso. Por lo tanto

x(k + N |k) = f(x(k + N − 1|k), h(x(k + N − 1|k)), 0) ∈ Φ

lo que demuestra la factibilidad de la restriccion terminal.

−4 −3 −2 −1 00

1

2

3

4

x1

x 2

xk−1

xk

x*(k+N−1|k−1) x(k+N−1|k)

x(k+N|k)

Ω

Φ

Figura 6.1: Ilustracion de la factibilidad robusta de la restriccion terminal

Page 189: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 173

En el caso de continuidad Lipschitz de las funciones, la cota de incertidumbre ad-mitida es

µ ≤ γ·αLN−1

x ·Lw

Notese que si el sistema es estable y con una constante de Lipschitz Lx < 1, cuantomayor es el horizonte, mayor es el grado de incertidumbres que admite el controlador.

Una vez demostrado que el controlador es factible a lo largo de la evolucion delsistema incierto, se va a demostrar que el sistema en bucle cerrado es estable entrada aestado respecto a las incertidumbres. Esto implica que el controlador es robusto en elsentido de que si las incertidumbres sobre el sistema estan acotadas, el comportamientodel sistema tambien estara acotado. Si, ademas, estas decaen con el tiempo, el contro-lador estabiliza asintoticamente el sistema incierto. Este resultado forma parte de lascontribuciones de esta tesis.

Teorema 6.9 (Estabilidad entrada a estado)

Sea un sistema incierto descrito por un modelo

xk+1 = f(xk, uk, wk)

con las actuaciones sujetas a uk ∈ U en todo instante k. Las incertidumbres wk ∈ IRp

estan contenidas en el conjunto wk ∈ Bµ = w ∈ IRp : ‖w‖ ≤ µ.Sea el sistema y el controlador MPC tales que satisfacen las hipotesis del teorema 6.8con un dominio de atraccion Xr

N .Entonces el sistema en bucle cerrado es estable entrada a estado respecto a las incer-tidumbres para todo x0 ∈ Xr

N .

Demostracion:

En esta demostracion se sigue la misma notacion utilizada en la demostracion delteorema 6.8, siendo u∗F (k−1) la secuencia optima de actuaciones obtenida en el estadoxk−1. Como consecuencia de la aplicacion de la actuacion optima, el sistema evolucionaal estado xk, en el cual, como se demostro anteriormente, existe una secuencia factiblede actuaciones uF (k) calculada a partir de la secuencia u∗F (k−1). Los estados predichoscon esta secuencia son x(k + j|k). Ası el coste optimo en el instante k − 1 es

J∗N(xk−1) =N−1∑

i=0

L(x∗(k + i− 1|k − 1), u∗(k + i− 1|k − 1)) + V (x(k + N − 1|k − 1))

Page 190: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

174 6.4. Controlador MPC con estabilidad entrada a estado

y el coste de la secuencia factible en k es

JN(xk) = JN(xk, uF (k)) =N−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

Restando ambas expresiones se tiene que

JN(xk)− J∗N(xk−1) =N−2∑

i=0

L(x(k + i|k), u(k + i|k))

−L(x∗(k + i|k − 1), u∗(k + i|k − 1))

−L(xk−1, u∗(k − 1|k − 1))

+L(x(k + N − 1|k), h(x(k + N − 1|k)))

+V (x(k + N |k))− V (x∗(k + N − 1|k − 1))

Teniendo en cuenta que u(k + i|k) = u∗(k + i|k− 1) para todo i = 0, · · · , N − 2, dellema 6.4 se tiene que

‖x(k + i|k)− x∗(k + i|k − 1)‖ ≤ δix δw(µ)

Basandose en la suavidad de L(·, ·) y V (·) se pueden obtener las siguientes acotaciones:

L(x(k + i|k), u(k + i|k))− L(x∗(k + i|k − 1), u∗(k + i|k − 1)) ≤ δL δix δw(µ)

y analogamente

V (x(k + N − 1|k))− V (x∗(k + N − 1|k − 1)) ≤ δV δN−1x δw(µ)

Considerando que x(k + N − 1|k) ∈ Ω, de la condicion terminal se tiene que

L(x(k + N − 1|k), h(x(k + N − 1|k))) + V (x(k + N |k)) ≤ V (x(k + N − 1|k))

Incorporando estas condiciones se tiene que

JN(xk)− J∗N(xk−1) ≤

N−2∑

i=0

δL δix δw(µ)+ δV δN−1

x δw(µ)

−L(xk−1, u∗(k − 1|k − 1))

Dado que las funciones δL(·), δV (·), δx(·) y δw(·), son funciones K , entonces elprimer sumando es una funcion K que se va a denotar ψ(µ). Por otro lado, la funcionde coste de etapa verifica L(xk−1, u

∗(k− 1|k− 1)) ≥ l·‖xk−1‖σ. Considerando esto, porel principio de optimalidad se tiene que

J∗N(xk)− J∗N(xk−1) ≤ −l·‖xk−1‖σ + ψ(µ)

Page 191: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 175

y por lo tanto, en virtud de la definicion de funcion de Lyapunov entrada a estado3,la funcion de coste optimo es una funcion de Lyapunov entrada a estado, y en conse-cuencia, el sistema en bucle cerrado es estable entrada a estado.

Por ultimo, merece la pena resaltar que el controlador propuesto puede ser bastanteconservador por dos motivos:

Esta basado en una acotacion conservadora. El conservadurismo en la acotacionhace que las cotas de incertidumbre que admite el sistema y el dominio de atrac-cion asociado sean menores que los que se podrıan obtener con otro tipo deacotaciones no tan conservadoras. Las medidas propuestas para reducir el con-servadurismo tienden a suavizar este efecto.

Esta basado en predicciones en bucle abierto. Esta es sin duda la causa masimportante. La prediccion del comportamiento del sistema se hace sin atender ala posible reaccion del controlador ante la incertidumbre presente en el sistema.Esto hace que el sistema real pueda admitir un mayor grado de incertidumbreque el grado para el cual se garantiza la estabilidad.

6.5. Robustez de la formulacion con Np > Nc

Del analisis de estabilidad desarrollado en la seccion anterior, se deducen unas pro-piedades interesantes en el caso en que se considere un horizonte de prediccion mayorque el de control.

En esta formulacion, la secuencia de actuaciones se calcula para un horizonte decontrol Nc, de forma que la prediccion del comportamiento se extiende hasta Np apli-cando el controlador local obtenido para la region terminal uk = h(xk). Segun esto, elMPC se formula como

mınuF

JNc,Np(xk, uF )

s.a

u(k + j|k) ∈ U j = 0, · · · , Nc − 1

h(x(k + j|k)) ∈ U j = Nc, · · · , Np − 1

x(k + Np|k) ∈ Φ

(6.8)

3Vease la seccion A.4.

Page 192: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

176 6.5. Robustez de la formulacion con Np > Nc

siendo el funcional considerado

JNc,Np(xk, uF ) =Nc−1∑

i=0

L(x(k + i|k), u(k + i|k))

+Np−1∑

i=Nc

L(x(k + i|k), h(x(k + i|k))) + V (x(k + Np|k))

En este caso las predicciones se realizan de forma que

x(k + j + 1|k) = f(x(k + j|k), u(k + j|k), 0) j = 0, · · ·Nc − 1

x(k + j + 1|k) = f(x(k + j|k), h(x(k + j|k)), 0) j = Nc, · · ·Np − 1

siendo x(k|k) = xk.

Esta formulacion hace que la acotacion del efecto de la incertidumbre obtenidacambie para predicciones mas alla del horizonte de control. Para ello basta considerarla funcion K , δhx(·), tal que

‖f(x + ∆x, h(x + ∆x), 0)− f(x, h(x), 0)‖ ≤ δhx(‖∆x‖)para todo x, x + ∆x ∈ SNp−Nc( IRn, Φ).

Notese que esta acotacion es menos conservadora que δx(·) pues acota el efecto dela variacion sobre el estado del sistema en bucle cerrado controlado por una ley decontrol asintoticamente estabilizante. Por tanto, el efecto de ∆x sobre el sistema es-tara compensado por el controlador. Esta compensacion no se considera en la definicionde δx(·).

En consecuencia la acotacion ‖x(k + j|k)− xk+j‖ ≤ cj(µ) se obtiene haciendo

cj(µ) = δw(µ) + δx(cj−1(µ)) para j ≤ Nc

cj(µ) = δw(µ) + δhx(cj−1(µ)) para j > Nc

siendo c1(µ) = δw(µ).

Analogamente al desarrollo realizado en la seccion anterior, se deduce el siguienteteorema:

Teorema 6.10 Sea un sistema incierto descrito por un modelo

xk+1 = f(xk, uk, wk)

con las actuaciones sujetas a uk ∈ U en todo instante k. Las incertidumbres wk ∈ IRp

estan contenidas en el conjunto wk ∈ Bµ = w ∈ IRp : ‖w‖ ≤ µ.

Page 193: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 177

Supongase que las funciones que describen el modelo f(·, ·, ·), el coste terminal V (·) yel coste de etapa L(·, ·) son funciones suaves que satisfacen las hipotesis 6.1,6.6 y 6.7.Sea el controlador MPC obtenido del problema de optimizacion dado por la ecuacion(6.8), de forma que el conjunto terminal Φ satisface la hipotesis 6.5, para cierto con-junto de incertidumbres Bγ.Entonces el sistema incierto controlado por el controlador MPC propuesto es estableentrada a estado con un dominio de atraccion que es el conjunto factible del problemaXNc,Np y para unas incertidumbres tales que

δNp−Nc

hx δNc−1x δw(µ) ≤ γ

La incorporacion del horizonte de prediccion dota al controlador de una serie depropiedades:

Aumento del dominio de atraccion : dado que Ω ⊆ Sh1 ( IRn, Ω), resulta que para

cualquier horizonte de prediccion mayor que el de control, la disminucion dedominio de atraccion derivado de considerar como region terminal Φ ⊂ Ω, secompensa. De hecho para Np > Nc, el controlador puede presentar un dominiode atraccion mayor.

Posible aumento de la incertidumbres admitidas : el hecho de que el sistemacontrolado por la ley de control local sea asintoticamente estable hace posibleque para cierta norma, la funcion δhx(·) satisfaga que

δhx(‖∆x‖) ≤ ‖∆x‖

Esta propiedad hace que el efecto de las incertidumbres se atenue a partir Nc.

Esto se puede satisfacer, por ejemplo, tomando un controlador local lineal queestabilice exponencialmente el sistema y tomando como norma en la acotacion lanorma ponderada por la matriz de Lyapunov del sistema linealizado en torno alorigen controlado por dicho controlador.

6.6. MPC robusto con restricciones en el estado

Las restricciones impuestas sobre los estados son especialmente delicadas en el casoen el que el sistema real tenga incertidumbres. En efecto, si el comportamiento realdel sistema difiere de la prediccion realizada a partir del modelo nominal, la actuacionobtenida del controlador basado en este puede hacer que el sistema incierto viole lasrestricciones impuestas.

Page 194: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

178 6.6. MPC robusto con restricciones en el estado

En el capıtulo anterior se analizo el problema de la factibilidad robusta y se ex-pusieron distintas formas de garantizarla. Todas estas medidas estan relacionadas conla propiedad de invariancia robusta:

1. La primera forma y mas inmediata es basandose en el coste optimo que es unafuncion de Lyapunov entrada a estado. Ası toda region

Ωr = x ∈ IRn : J∗N(x) ≤ r

es un invariante robusto (para un cierto grado de incertidumbres). Ası en unconjunto tal que Ωr ⊆ X el controlador garantiza las restricciones.

2. Determinando si el dominio de atraccion XrN = SN(X, Φ) es un invariante robusto

del sistema en bucle cerrado. En el caso de incertidumbres aditivas, esto se cumplebajo la condicion (Kerrigan 2000) dada por

SN−1(X, Φ)⊕W ⊆ SN(X, Φ)

3. Incorporando la restriccion de robustez (Kerrigan 2000). Anadiendo al problemade optimizacion la restriccion

x(k + 1|k) ∈ XR ∼ W

y bajo ciertas condiciones sobre XR se establece que el dominio de atraccion delcontrolador con esta restriccion es un invariante robusto, y por lo tanto satisfacelas restricciones.

Hay que indicar que en este caso, en las condiciones impuestas en la determinacionde la region terminal en la hipotesis 6.5, se debe considerar las restricciones en losestados, de forma que Ω ⊆ X.

Bajo estas condiciones, el controlador MPC propuesto garantiza la estabilidad ro-busta, pues los teoremas sobre la estabilidad entrada a estado se siguen satisfaciendo,y la factibilidad robusta.

6.6.1. Factibilidad del MPC basada en restricciones conser-vadoras

La acotacion sobre la discrepancia entre la evolucion predicha y la evolucion delsistema real permite establecer un procedimiento para garantizar la factibilidad robus-ta. Basandose en esta acotacion se puede considerar un conjunto de restricciones mas

Page 195: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 179

conservador tal que garantice que si el sistema nominal satisface la restriccion conser-vadora, entonces el sistema real satisface la restriccion X a pesar de las incertidumbres.

Para ello se va a definir una nueva secuencia de cotas cj(µ) que posee unas propiedadesinteresantes:

cj(µ) = maxδw(µ) + δx(cj−1(µ)), cj−1 + δj−1

x δw(µ)

(6.9)

siendo c1(µ) = δw(µ) y δix(·) la composicion sucesiva i veces de la funcion δx(·), siendo

δ1x(·) = δx(·). Es inmediato que cj(µ) ≤ cj(µ).

A continuacion se va a establecer el procedimiento de obtencion de las restriccionesconservadoras: sea Xj el conjunto de restriccion conservadora que debe satisfacer elestado predicho (utilizando el modelo nominal) en el instante k+j a partir del instantek. Este conjunto viene dado por:

Xj = X ∼ Bjµ (6.10)

siendo X0 = X y donde Bjµ es el conjunto

Bjµ = z ∈ IRn : ‖z‖ ≤ cj(µ)

De esta manera, si x(k + j|k) es tal que esta contenido en Xj, entonces el estadoreal del sistema, ante la misma secuencia de entradas, satisface la restriccion xk+j ∈ X,ante cualquier incertidumbre presente en el sistema. De la definicion de diferencia dePontryagin de conjuntos se deduce que para todo x(k + j|k) ∈ Xj y para todo z ∈ Bj

µ,se tiene que

x(k + j|k) + z ∈ X

Dado que, para una determinada secuencia de actuaciones, la discrepancia entre elestado predicho y el real es

‖xk+j − x(k + j|k)‖ ≤ cj(µ) ≤ cj(µ)

entoncesxk+j = x(k + j|k) + xk+j − x(k + j|k)︸ ︷︷ ︸

∈Bjµ

∈ X

Esta idea esta relacionada con la restriccion de robustez introducida en (Chisciet al. 2001) para sistemas lineales. En este caso, se resta al conjunto de las restriccionesX los conjuntos de Kolmanovski que son una acotacion de la evolucion del sistemaincierto.

Los conjuntos definidos verifican una propiedad que sera de utilidad en posterioresdemostraciones.

Page 196: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

180 6.6. MPC robusto con restricciones en el estado

Lema 6.11 Sea x ∈ Xj+1 y sea y ∈ IRn tal que ‖x− y‖ ≤ δjx δw(µ) entonces y ∈ Xj.

Demostracion:

Sea ej ∈ Bjµ y sea z = x− y + ej. Entonces se tiene que

‖z‖ ≤ ‖x− y‖+ ‖ej‖ ≤ δjx δw(µ) + cj(µ) ≤ cj+1(µ)

por lo tanto z ∈ Bj+1µ .

Teniendo en cuenta que x ∈ Xj+1, se tiene que y + ej = x + z ∈ X para todoej ∈ Bj

µ. Por lo tanto y ∈ Xj.

En este caso, el controlador MPC toma la forma

mınuF (k)

JN(xk, uF (k))

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

x(k + j|k) ∈ Xj j = 0, · · · , N − 1

x(k + N |k) ∈ Φ

Ademas, en las condiciones de la hipotesis 6.5, se debe considerar las restriccionesen los estados, de forma que Ω ⊆ XN−1.

A continuacion se va a demostrar que el controlador ası obtenido garantiza la fac-tibilidad robusta del sistema. Para ello se va a demostrar el teorema 6.8 considerandoestas restricciones. Dado que las restricciones en los estados y la restriccion terminalson factibles como ya se demostro, tan solo se va a demostrar que las restricciones enlos estados son factibles. De esta forma se complementa el nuevo controlador propues-to en este capıtulo, en el que se garantiza la satisfaccion robusta de las restricciones,ası como la convergencia gracias a la estabilidad ISS.

Teorema 6.12 (Factibilidad robusta con restricciones en el estado)

Sea un sistema incierto descrito por un modelo

xk+1 = f(xk, uk, wk)

con el estado sujeto a xk ∈ X y las actuaciones sujetas a uk ∈ U en todo instante k.Las incertidumbres wk ∈ IRp estan contenidas en el conjunto wk ∈ Bµ = w ∈ IRp :

Page 197: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 181

‖w‖ ≤ µ.Supongase que las funciones que describen el modelo f(·, ·, ·), el coste terminal V (·) yel coste de etapa L(·, ·) son funciones suaves que satisfacen las hipotesis 6.1,6.6 y 6.7.Sea el controlador MPC obtenido del problema de optimizacion propuesto, de formaque los conjuntos de restricciones Xj vienen dados por la ecuacion (6.10) y el conjuntoterminal Φ ⊂ Ω ⊆ XN−1 satisface la hipotesis 6.5, siendo Bγ el conjunto asociado a Φ.Entonces el sistema incierto controlado por el controlador MPC propuesto es factible alo largo de la evolucion del sistema, para todo estado inicial perteneciente al conjuntofactible del problema Xr

N y para unas incertidumbres tales que

δN−1x δw(µ) ≤ γ

Demostracion:

Se procede de la misma forma que en la demostracion del teorema 6.8, comprobandoque la secuencia uF (k) es factible. En esta demostracion se probo que se satisface larestriccion terminal y ademas que

x(k + N + 1|k) ∈ Ω

Para demostrar x(k + j|k) ∈ Xj, considerese que, por el efecto de la incertidumbre,la discrepancia entre el estado real y el predicho verifica

‖xk − x∗(k|k − 1)‖ ≤ δw(µ)

Aplicando el lema 6.4 se tiene que

‖x(k + j|k)− x∗(k + j|k − 1)‖ ≤ δjx δw(µ)

Teniendo en cuenta esto, y dado que x∗(k+j|k−1) ∈ Xj+1 para todo j = 0, · · · , N−2,por el lema 6.11 se tiene que x(k + j|k) ∈ Xj para todo j = 0, · · · , N − 2.

Por ultimo, dado que x(k + N − 1|k) ∈ Ω ⊆ XN−1, las restricciones se satisfacen.

Por lo tanto la acotacion realizada sobre la discrepancia en las predicciones, permiteestablecer un procedimiento sencillo para demostrar factibilidad robusta del sistema.Ademas, tambien se puede comprobar que el controlador es estable entrada a estado,lo que garantiza convergencia.

Page 198: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

182 6.7. Ejemplo de aplicacion al reactor

6.7. Ejemplo de aplicacion al reactor

Para ilustrar el controlador presentado en este capıtulo, se va a aplicar al reactorutilizado a lo largo de la tesis. Las incertidumbres en el sistema se van a modelarcomo incertidumbres aditivas acotadas. Ademas, para reducir el conservadurismo seva a considerar el sistema prealimentado por el controlador local. Tambien se van aconsiderar unas restricciones sobre el sistema dadas por:

x1 ∈ [−0,21, 0,21]

x2 ∈ [−2,0, 0,25]

La aplicacion de este controlador requiere una serie de calculos previos encaminadosa la determinacion del grado de robustez capaz de soportar el controlador. Ası, esnecesario determinar las funciones de suavidad y un conjunto invariante.

Para la determinacion del invariante positivo, se ha sintonizado un controlador locallineal obtenido por la tecnica LQR, con matrices de ponderacion

Q =

10 0

0 0,1

R = 1

y para las cuales se obtiene un controlador lineal y una funcion de Lyapunov cuadraticadados por

K =[−1,5488 −3,4658

]P =

263,5900 47,1760

47,1760 117,4640

El sistema controlado por este controlador local tiene un invariante positivo dado por

Ω = x ∈ IR2 : xT ·P ·x ≤ αsiendo α = 9,764 y una constante de decrecimiento de la funcion de Lyapunov ρ =0,924. El conjunto que se va a considerar como region terminal en el problema deoptimizacion sera

Φ = x ∈ IR2 : xT ·P ·x ≤ αvsiendo αv = α·ρ = 9,0219.

Como norma para expresar las incertidumbres se va a tomar la norma dos ponderadapor la matriz P . Ası, la constante γ viene dada en este caso por

‖w‖P ≤ γ = (1−√ρ)·√α

obteniendose γ = 0,1208.

Page 199: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 6. MPC ISS con satisfaccion robusta de las restricciones 183

A continuacion, se calcula la constante de Lipschitz en la norma dos ponderada, delsistema prealimentado, obteniendose un valor de la constante de Lx = 1,6. Dado quelas incertidumbres son aditivas, se tiene que Lw = 1. Por consiguiente, tomando unhorizonte de control Nc = 4, se tiene que la incertidumbre admitida por el controlador(µ) viene dada por

L3x·Lw·µ ≤ γ

de donde se deduce que µ ≤ 0,0295.

Con el fin de considerar las restricciones en los estados del controlador, se obtieneuna cota conservadora en norma infinito de las incertidumbres obtenidas en norma P .Esto se debe a que las restricciones se han expresado en norma infinito. En consecuenciase tiene que

Bjµ = z ∈ IR2 : ‖z‖∞ ≤ Lj

x − 1

Lx − 1·µ∞

siendo µ∞ = 5,9·10−3.

La evolucion del sistema incierto en bucle cerrado se puede observar en la figura6.2.

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25−1.5

−1

−0.5

0

0.5

x1

x 2

Φ

Figura 6.2: Evolucion del sistema incierto en bucle cerrado

6.8. Conclusiones

En este capıtulo se ha presentado un procedimiento para incorporar el conocimien-to de las incertidumbres en el diseno del controlador. Basandose en la acotacion de

Page 200: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

184 6.8. Conclusiones

las discrepancias entre la evolucion del sistema real y el comportamiento predicho porel modelo nominal, se garantiza que, bajo ciertas cotas de la incertidumbres y con-siderando como region terminal una region mas conservadora, se satisface de manerarobusta la condicion terminal. Tambien se consideran unas restricciones conservadorasen los estados predichos que garantizan la satisfaccion robusta de las restricciones porparte del sistema incierto. En consecuencia, se garantiza la satisfaccion robusta de lasrestricciones en el conjunto factible Xr

N .

Ademas se puede garantizar la estabilidad entrada a estado del sistema para todoestado inicial factible lo que dota de convergencia al controlador. Esta formulacionforma parte de las contribuciones originales de esta tesis y ha dado lugar al artıculo(Limon Marruedo, Alamo & Camacho 2002b).

Cabe resaltar que la factibilidad robusta y la convergencia se han obtenido mo-dificando ligeramente la formulacion general del MPC y se basa en las prediccionesnominales del sistema. Por lo tanto el coste computacional del controlador es el mismoque el controlador nominal. Ademas estas propiedades se satisfacen bajo hipotesis desuavidad de las funciones que forman parte del problema de optimizacion y no esnecesario imponer condiciones adicionales como la suavidad del coste optimo, que esdifıcil de comprobar.

Un problema del controlador propuesto es que puede conducir a controladores con-servadores y/o pequenos dominios de atraccion. Este conservadurismo tiene su origenen la acotacion realizada y en la prediccion en bucle abierto del sistema. La primerade las causas, puede reducirse incorporando una serie de medidas propuestas, como laincorporacion de un controlador en cascada o bien, la utilizacion de acotaciones localesque dependan del estado del sistema y de las actuaciones aplicadas sobre el mismo.En el capıtulo siguiente de la tesis se presenta un procedimiento para la acotacion lo-cal de las discrepancias, que da lugar a las denominadas regiones de evolucion incierta.Ademas se disena un controlador que incorpora estas regiones para garantizar robustez.

La segunda causa, y mas importante, es la prediccion en bucle abierto realizado,sin incorporar en la prediccion el efecto corrector que incorpora el controlador. Esteproblema se puede subsanar con las denominadas formulaciones en bucle cerrado, quese tratan en un capıtulo posterior.

Page 201: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7

MPC robusto basado en regionesde evolucion incierta

7.1. Introduccion

En el capıtulo anterior se han establecido condiciones bajo las cuales el controladorestabiliza el sistema para cierto nivel de incertidumbres. Ası, suponiendo ciertas condi-ciones de suavidad del sistema y considerando una region terminal conservadora, elcontrolador es factible a lo largo de la evolucion del sistema incierto y garantiza que elcoste optimo es una funcion de Lyapunov entrada a estado.

El grado de incertidumbres que puede soportar el controlador garantizando estabi-lidad se obtiene a partir de acotaciones basadas en la suavidad de las funciones. Es-tas acotaciones son acotaciones globales, es decir, validas para todo estado, actuacione incertidumbre admisible del sistema. Esto hace que los niveles de incertidumbresobtenidos sean mas conservadores.

Para tratar de mitigar este efecto, se establece en este capıtulo un procedimientopara incorporar al diseno de controladores predictivos robustos, procedimientos localespara la determinacion de la discrepancia entre el estado predicho y la posible evoluciondel sistema. Este procedimiento se plasma en el concepto de region de evolucion incierta.

Con el fin de dotar de robustez al controlador predictivo, se incorporan las regionesde evolucion incierta en su formulacion, dando lugar a un controlador dual y otro nodual que garantizan la estabilidad bajo la factibilidad del estado inicial. Estos contro-ladores MPC robustos son aportaciones originales de esta tesis y han dado lugar alartıculo (Limon Marruedo, Bravo, Alamo & Camacho 2002).

185

Page 202: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

186 7.2. Regiones de evolucion incierta

A continuacion se introduce el concepto de region de evolucion incierta, en el cualse basa el controlador propuesto.

7.2. Regiones de evolucion incierta

7.2.1. Descripcion del sistema

Sea un sistema tal que responde a un modelo con incertidumbres aditivas de laforma

xk+1 = f(xk, uk) + wk (7.1)

siendo xk ∈ IRn el estado del sistema en el instante k, uk ∈ IRm el vector de actuacionesy wk ∈ IRn las posibles incertidumbres que afectan al sistema. Tanto los estados comolas actuaciones estan restringidos a lo largo del tiempo, de forma que

xk ∈ X (7.2)

uk ∈ U (7.3)

Ademas, las incertidumbres se consideran que estan acotadas en un conjunto compacto

wk ∈ W (7.4)

El sistema en ausencia de incertidumbres se denomina modelo nominal y viene dadopor

xk+1 = f(xk, uk)

de forma que, dicho modelo presenta un punto de equilibrio en el origen, por tantof(0, 0) = 0.

El modelado de incertidumbres como aditivas representa a una gran cantidad desistemas inciertos, dado que la incertidumbre wk puede depender del estado del sistema.El unico conocimiento de las incertidumbres es el margen de variacion que estas puedentener, que se traduce en un determinado conjunto W . Por ejemplo, considerese unsistema incierto descrito por

xk+1 = f(xk, uk, pk)

siendo pk ∈ P el vector de incertidumbres parametricas del que depende el sistema.Entonces

xk+1 = f(xk, uk, pk) = f(xk, uk)+(f(xk, uk, pk)−f(xk, uk)) = f(xk, uk)+∆f(xk, uk, pk)

Page 203: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 187

considerando como modelo nominal xk+1 = f(xk, uk, 0) = f(xk, uk), se puede definirunas incertidumbres wk y un conjunto W tales que

wk = ∆f(xk, uk, pk) ∈ W, ∀xk ∈ X, uk ∈ U, pk ∈ P

Este tipo de sistemas tambien se suelen denominar sistemas perturbados, por res-ponder estos al mismo modelo. Es importante resaltar que desde un punto de vistapractico, este tipo de descripciones son muy sencillas de obtener en la etapa de iden-tificacion de un sistema, pues wk respresentarıa el error entre el sistema real y elidentificado.

7.2.2. Notacion y definicion de operaciones sobre conjuntos

Con el fin de simplificar la exposicion de los desarrollos y resultados obtenidos eneste capıtulo, se introduce una notacion para describir distintos elementos implicadosen estos. Ası se denota:

uNF (k) : a una secuencia de N actuaciones futuras a partir del instante k, es decir

uNF (k) = u(k|k), u(k + 1|k), · · · , u(k + N − 1|k)

siendo u(k + j|k) la actuacion j-esima de dicha secuencia. El numero de termi-nos de esta secuencia se suele inferir del contexto, por lo que se suele denotarsimplemente uF (k).

uNF (k)j

i : a los terminos de la secuencia uNF (k)

uNF (k)j

i = u(k + i|k), · · · , u(k + j|k)siendo i ≤ j ≤ N .

x(k + j|k) : a la prediccion en el instante k + j de la evolucion del sistema en ausenciade incertidumbres a partir del estado xk aplicando sobre el sistema una secuenciade actuaciones uF (k).

Tambien resulta de utilidad la definicion de ciertas operaciones sobre conjuntos quese utilizan en el desarrollo de posteriores resultados.

Definicion 7.1 Sea el conjunto Ω ⊆ IRn, y sea la funcion g : IRn → IRn , entoncesse define el conjunto g(Ω) como

g(Ω) = z ∈ IRn : ∃s ∈ Ω, z = g(s)

Page 204: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

188 7.2. Regiones de evolucion incierta

Definicion 7.2 Sea Ω ⊂ IRn, y Φ ⊂ IRn, se denomina conjunto diferencia de Pon-tryagin al conjunto

Ω ∼ Φ = x ∈ IRn : x + y ∈ Ω, ∀y ∈ Φ

Definicion 7.3 Sea Ω ⊂ IRn, y Φ ⊂ IRn, se denomina conjunto suma de Minkowskial conjunto

Ω⊕ Φ = z ∈ IRn : ∃x ∈ Ω, y ∈ Φ, z = x + y

Esta definicion se puede extender a la operacion x⊕Φ siendo x un vector contenidoen IRn, sin mas que considerar que Ω = x. Ası x⊕ Φ = x + a, ∀a ∈ Φ.

Propiedad 7.4 Si Φ incluye el origen, entonces

(Ω ∼ Φ)⊕ Φ ⊆ Ω

7.2.3. Regiones de evolucion incierta

Como es bien sabido, el efecto de la incertidumbre sobre el sistema hace que, anteuna determinada accion de control, exista una discrepancia entre el estado al que esteevoluciona y el que predice el modelo nominal. Ası, el estado real del sistema puedeevolucionar a cualquier estado contenido en una vecindad del estado nominal, dadoque 0 ∈ W . La region a la que el sistema real puede evolucionar ante una determinadaactuacion depende del estado del que se parte, de la actuacion aplicada y del grado deincertidumbres que presenta el sistema, siendo tanto mayor cuanto mayor sea el gradode incertidumbre.

Esta idea puede extenderse a la prediccion realizada a j pasos. Ası, existe una regionentorno al estado nominal predicho x(k+j|k) tal que contiene todas los posibles estadosa los que el sistema puede evolucionar ante una determinada secuencia de actuaciones.Esta region se plasma en la denominada region exacta de evolucion incierta.

Definicion 7.5 Sea un sistema incierto descrito por un modelo

xk+1 = f(xk, uk) + wk

de forma que las incertidumbres wk ∈ W , entonces se denomina region exacta deevolucion incierta en el instante k + j partiendo del estado en el instante k,xk, y anteuna secuencia de actuaciones uF (k), al conjunto que contiene todos los posibles estados

Page 205: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 189

a los que el sistema incierto puede evolucionar en el instante k+j. Este conjunto vienedado por:

Xj(xk, uF (k)j−10 ) = f(Xj−1(xk, uF (k)j−2

0 ), u(k + j − 1|k))⊕W

siendoX1 = f(xk, u(k|k))⊕W

La region exacta de evolucion incierta Xj depende en general del estado del sistemaen el instante k, xk, de la secuencia de actuaciones desde el instante k hasta el instantej − 1, uF (k)Nj−1

0 , del conjunto de incertidumbres W y del modelo nominal f(·, ·).Para simplificar la notacion, esta region se denota Xj(xk, uF (k)). Ası esta viene dadapor la composicion

Xj(xk, uF (k)) = f(Xj−1(xk, uF (k)), u(k + j − 1|k))⊕W

Notese que la region Xj se puede entender como la union de todas las regionesexactas de evolucion incierta a un paso que parten de cualquier estado en Xj−1 ante laactuacion u(k + j − 1|k), es decir

Xj(xk, uF (k)) =⋃

x∈Xj−1

f(x, u(k + j − 1|k))⊕W

Dado que las regiones exactas de evolucion incierta resultan en general muy difıcilesde calcular con exactitud, resulta de interes caracterizar regiones que las aproximen deuna manera conservadora y cuyo calculo sea sencillo. Esto da lugar a las denominadasregiones de evolucion incierta.

Para ello se parte de un procedimiento ψ(·, ·) tal que para un conjunto A ⊂ IRn

dado proporciona otro conjunto ψ(A, u) tal que

f(A, u) ⊆ ψ(A, u)

para todo A ⊆ IRn y para todo u ∈ U . En consecuencia, el procedimiento ψ(A, u) es unaaproximacion conservadora de f(A, u) que se puede obtener mediante la utilizacion detecnicas de aproximacion de conjuntos. De este modo se puede hacer mas facil y menoscostoso el calculo de estos conjuntos, a cambio, claro esta, de un mayor conservadurismoen la aproximacion. Este procedimiento debe satisfacer la siguiente hipotesis

Hipotesis 7.6 Sea un conjunto A ⊂ IRn y sea una actuacion admisible u ∈ U . Sea elprocedimiento ψ(·, u) : A ⊆ IRn 7→ ψ(A, u) ⊆ IRn, entonces ψ(·, ·) debe satisfacer lassiguientes condiciones:

Page 206: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

190 7.2. Regiones de evolucion incierta

1. Condicion de inclusion: f(A, u) ⊆ ψ(A, u).

2. Condicion de monotonıa: Sea un conjunto B ⊆ A, entonces

ψ(B, u) ⊆ ψ(A, u)

siendo f(·, ·) el modelo nominal del sistema.

Considerando esto, se puede establecer la siguiente definicion.

Definicion 7.7 (Region de evolucion incerta) Sea un sistema incierto descrito porun modelo

xk+1 = f(xk, uk) + wk

de forma que las incertidumbres wk ∈ W . Sea ψ(·, ·) un procedimiento tal que satisfagala hipotesis 7.6, entonces se denomina region de evolucion incierta en el instante k + jpartiendo del estado xk y ante una secuencia de actuaciones uF (k) al conjunto:

Xj(xk, uF (k)) = ψ(Xj−1(xk, uF (k)), u(k + j − 1|k))⊕W

siendoX1 = f(xk, u(k|k))⊕W = X1

Estos conjuntos tienen las siguientes propiedades:

Propiedad 7.8 Sea Xj(xk, uF (k)) el conjunto de evolucion incierta en el instante k+j.Este conjunto satisface las siguientes propiedades:

1. Contiene todos lo estados posibles del sistema en el instante k + j, es decir

Xj(xk, uF (k)) ⊆ Xj(xk, uF (k))

2. Para todo xk+1 = f(xk, u(k|k)) + wk con wk ∈ W , se tiene que

Xj(xk+1, uF (k + 1)) ⊆ Xj+1(xk, uF (k))

siendo uF (k + 1) = uF (k)j1.

Page 207: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 191

Demostracion:

1. Se procede por induccion: considerese que j = 2. Entonces se tiene que

X2(xk, uF (k)) = f(X1, u(k + 1|k))⊕W ⊆ ψ(X1, u(k + 1|k))⊕W = X2(xk, uF (k))

Supongase que Xj−1(xk, uF (k)) ⊆ Xj−1(xk, uF (k)), entonces

Xj(xk, uF (k)) = f(Xj−1, u(k + j − 1|k))⊕W

⊆ ψ(Xj−1, u(k + j − 1|k))⊕W

⊆ ψ(Xj−1, u(k + j − 1|k))⊕W

= Xj(xk, uF (k))

Con lo que se demuestra esta propiedad.

2. Para demostrar la propiedad se procede tambien por induccion:Partiendo de que xk+1 ∈ X1(xk, uF (k)) y utilizando la propiedad de monotonıase tiene que

X1(xk+1, uF (k + 1)) = ψ(xk+1, u(k + 1|k + 1))⊕W

⊆ ψ(X1(xk, u(k|k)), u(k + 1|k))⊕W = X2(xk, uF (k))

Supongase que Xj−1(xk+1, uF (k + 1)) ⊆ Xj(xk, uF (k)). Dado que

u(k + j|k + 1) = u(k + j|k)

de la propiedad de inclusion se tiene que:

Xj(xk+1, uF (k + 1)) = ψ(Xj−1(xk+1, uF (k + 1)), u(k + j|k + 1))⊕W

⊆ ψ(Xj(xk, uF (k)), u(k + j|k + 1)⊕W

= ψ(Xj(xk, uF (k)), u(k + j|k)⊕W = Xj+1(xk, uF (k))

La primera de las propiedades demuestra que bajo las hipotesis impuestas al pro-cedimiento ψ(·, ·) se garantiza que las regiones de evolucion incierta contienen a lasregiones exactas.

La segunda propiedad resulta muy interesante para posteriores aplicaciones, puesdemuestra que ante una misma secuencia de actuaciones, las regiones de evolucionincierta obtenidas en un estado real de la planta en k + 1 estan contenidas en lascalculadas en el instante anterior k.

Page 208: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

192 7.2. Regiones de evolucion incierta

7.2.4. Un procedimiento de calculo basado en el algebra in-tervalar

La region de evolucion incierta es una aproximacion conservadora de la posibleevolucion del sistema incierto calculada a partir de un procedimiento que permitaobtener el mapa de un conjunto a traves del modelo nominal de una forma conservadoray no muy costosa computacionalmente.

Las acotaciones sobre la evolucion del sistema incierto realizadas en el capıtuloanterior llevan a regiones inciertas de la forma

Xj = x ∈ IRn : ‖x− x(k + j|k)‖ ≤ cj(µ)Dado que las constantes cj(µ) se calculan fuera de lınea, la determinacion de las re-giones de evolucion incierta en cada instante k se lleva a cabo realizando la prediccionnominal del sistema. Este procedimiento es muy sencillo, pero por su caracter globalresulta conservadora. Por tanto, interesan procedimientos locales (que dependan de lasactuaciones) para reducir este conservadurismo. El algebra intervalar ofrece un marcopara la definicion de procedimientos apropiados para el calculo de estas regiones.

La aritmetica intervalar es una generalizacion del algebra real en la que los numerosse sustituyen por intervalos y las operaciones sobre los numeros se sustituyen poroperaciones intervalares (Moore 1996).

Un intervalo en IR, X = [a, b], es el conjunto de numeros reales

X = x ∈ IR : a ≤ x ≤ bLa extension de un intervalo a IRn es un vector de intervalos en los que cada compo-nente del vector es un intervalo escalar. Como se puede ver un intervalo en IRn es unhiperrectangulo en IRn.

La aritmetica intervalar esta caracterizada por las cuatro operaciones basicas sobreintervalos (Moore 1996):

[a, b] + [c, d] = [a + c, b + d]

[a, b]− [c, d] = [a− d, b− c]

[a, b]× [c, d] = [min(a·c, a·d, b·c, b·d),max(a·c, a·d, b·c, b·d)]

[a, b] / [c, d] = [a, b]×[

1d, 1

c

]si 0 /∈ [c, d]

(7.5)

En (Hansen 1992) se puede encontrar la definicion del operador division en el caso enel que el intervalo cociente contiene el 0. Merece la pena resaltar que el rango de estosintervalos son exactos, en el sentido en el que coincide con el rango de variacion de losposibles valores reales.

Page 209: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 193

Considerese una funcion g : IRn 7→ IRn, y X un intervalo en IRn. Entonces, esclaro que en general el conjunto g(X) no es un intervalo. El algebra intervalar ofreceun procedimiento para obtener un intervalo Y tal que g(X) ⊆ Y . Esto se basa en ladenominada funcion de inclusion.

Definicion 7.9 Una funcion G : IRn 7→ IRn es una funcion de inclusion de g(·) sipara cualquier intervalo en X ⊆ IRn se tiene que

g(X) ⊆ G(X)

Se dice que una funcion de inclusion es monotona si para cualquier pareja de intervalosX,Y ⊆ IRn tales que X ⊆ Y , se tiene que

G(X) ⊆ G(Y )

En el caso de funciones estandar (exponenciales, logaritmos, etc.) se pueden obtenerfunciones de inclusion de forma analıtica, utilizando por ejemplo su desarrollo en seriede Taylor, o en serie de potencias, en los que se tiene una cota del termino de error.Sin embargo, para funciones complejas se pueden obtener a partir de la denominadaextension intervalar natural (Keartfort 1996).

Definicion 7.10 Si una funcion g(·) se puede calcular por una expresion (o un algo-ritmo) formada por las cuatro operaciones elementales y funciones estandar, entoncesuna extension intervalar natural de g(·) se obtiene sustituyendo las operaciones ele-mentales por sus equivalentes intervalares y las funciones estandar por sus funcionesde inclusion.

Por tanto la extension intervalar natural es un procedimiento que transforma unintervalo en otro intervalo. En el siguiente teorema se establece el resultado mas im-portante.

Teorema 7.11 (Keartfort 1996) Sea una funcion g : IRn 7→ IRm, entonces su exten-sion natural intervalar es una funcion de inclusion monotona de g(·).

Este resultado establece una forma sencilla de obtener un procedimiento para cal-cular regiones intervalares que acoten el mapa de otra region intervalar a traves de unafuncion dada. Este consiste en sustituir las operaciones y funciones estandar por susequivalentes intervalares. Ası, la determinacion de la region dada por un intervalo noes mas que la evaluacion de dicho intervalo en la funcion intervalar obtenida (que es laextension intervalar natural), lo cual no es muy costoso computacionalmente.

Page 210: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

194 7.3. Controlador MPC dual robusto

Este procedimiento se puede utilizar para la determinacion de regiones de evolucionincierta, obteniendo la funcion de extension intervalar natural del modelo nominalf(x, u) respecto al estado del sistema x, con lo que se obtiene una funcion intervalarF (X, u), en la que las actuaciones u son un parametro de la funcion. Se va a comprobarque este procedimiento satisface la hipotesis 7.6:

Condicion de inclusion : Se satisface por el teorema 7.11 y por la definicion defuncion de inclusion, segun los cuales, para todo X se tiene que

f(X, u) ⊆ F (X, u)

Condicion de monotonıa : El teorema 7.11 tambien establece que la funcion deextension intervalar natural es monotona, por lo tanto, para todo X ⊆ Y , setiene que

F (X, u) ⊆ F (Y, u)

7.3. Controlador MPC dual robusto

Como ya se ha comentado en capıtulos anteriores, la estabilidad que garantiza laformulacion general del MPC puede perderse cuando existen discrepancias entre elmodelo de prediccion y el modelo real de la planta. Para dotar de robustez al contro-lador, hay que considerar su efecto en su diseno, de forma que el sistema sea estable ygarantice la satisfaccion robusta de las restricciones impuestas sobre los estados.

En esta seccion se presenta un controlador MPC dual que considera el efecto de lasincertidumbres gracias a la incorporacion en su formulacion de las regiones de evolucionincierta anteriormente introducidas.

El controlador MPC dual se propuso por primera vez en (Michalska & Mayne 1993)para sistemas no lineales en tiempo continuo. Este controlador parte del conocimientode un invariante positivo del sistema denominado region terminal Ω, donde el sistemase estabiliza por una ley de control local u = h(x). Si el estado del sistema esta fuera dedicho conjunto, entonces se resuelve un problema de optimizacion MPC de horizontefinito tomando como restriccion terminal la pertenencia al conjunto Ω. El horizonte,que inicialmente es N , se reduce un periodo de muestreo en cada instante de forma queen el instante k, el horizonte del controlador es N − k. Una vez obtenida la actuacionse aplica. De esta forma se garantiza que el controlador conduce el sistema hasta elconjunto invariante en N pasos, donde se conmuta a la ley de control local que estabilizael sistema hasta el origen. De ahı el termino de dual.

Page 211: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 195

En este trabajo tambien se presenta una tecnica para dotar de robustez al con-trolador, que es la que inspiro la formulacion presentada en el capıtulo anterior. Eneste caso la presencia de incertidumbres hace necesario que el controlador local debaestabilizar el sistema incierto y que el conjunto terminal Ω sea un invariante robusto.Entonces considerando como restriccion terminal un conjunto contenido en Ω, demues-tra que el controlador estabiliza el sistema ante un cierto grado de incertidumbresaditivas que decaen.

El controlador que se propone en esta seccion es esencialmente distinto pues se incor-poran los conjuntos de evolucion incierta en la formulacion del controlador MPC dual.Para ello, y dado que el sistema presenta incertidumbres, se requiere el conocimientode un conjunto invariante robusto para las incertidumbres del sistema.

Hipotesis 7.12 Sea el conjunto Ω ⊆ X, una region entorno al origen que es un in-variante robusto del sistema (7.1). La ley de control local asociada u = h(x) es talque

Ω ⊆ Xh = x ∈ X : h(x) ∈ U.Para todo x ∈ Ω se tiene que

f(x, h(x)) ∈ Ω ∼ W

Esta condicion garantiza que el conjunto es un invariante robusto por el principiode invariancia.

Partiendo de la determinacion del conjunto invariante robusto y de un procedimien-to para el calculo de las regiones de evolucion incierta, se puede formular el siguienteproblema de optimizacion:

mınuF

JN−k(xk, uF )

s.a

u(k + j|k) ∈ U j = 0, · · · , N − k − 1

Xj(xk, uF ) ⊆ X j = 1, · · · , N − k − 1

XN−k(xk, uF ) ⊆ Ω

Siendo el funcional a minimizar :

JN−k =N−k−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

Page 212: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

196 7.3. Controlador MPC dual robusto

Este coste esta basado en las predicciones nominales del sistema, sin considerar el efectode las incertidumbres. En este caso el funcional afecta exclusivamente al desempenodel sistema y no a la estabilidad como en la formulacion general del MPC. Ası, porejemplo, el coste terminal se puede eliminar, o bien se puede tomar una funcion decoste que considere el efecto de las incertidumbres, como por ejemplo, el coste de lapeor situacion posible, lo cual conduce a un problema min-max.

La principal caracterıstica de este controlador es que las restricciones en los estadosse establecen en terminos de regiones de evolucion incierta en vez de en terminos deestados nominales del sistema. Estas regiones dependen del estado actual xk, de lasecuencia de actuaciones futuras uF , y del grado de incertidumbres. Por tanto sonrestricciones en uF .

Notese tambien que el problema de optimizacion reduce el horizonte de control a lolargo del tiempo, de forma que el controlador tan solo esta definido desde k = 0 hastak = N − 1. Pero esto no ofrece problemas pues, como se demostrara mas adelante, segarantiza que en el instante N el estado del sistema alcanza la region terminal, dondese conmuta al controlador local.

A partir de este problema de optimizacion se establece la siguiente ley de controldual:

KdMPC(xk) =

u∗(k|k) xk 6∈ Ω

h(xk) xk ∈ Ω(7.6)

siendo u∗(k|k) el primer termino de la secuencia de control optima del problema en elinstante k.

7.3.1. Analisis de estabilidad

Dado que las incertidumbres que afectan al sistema se modelan como incertidumbresaditivas acotadas, el origen no es un punto de equilibrio del sistema incierto, por loque hay que considerar otro concepto de estabilidad como la estabilidad finalmenteacotada, que se presento en el capıtulo 6.

Definicion 7.13 (Khalil 1996) Un sistema es asintoticamente acotado al final si elsistema evoluciona a un conjunto acotado. Es decir, si existen unas constantes positivasb y c tales que para todo α ∈ (0, c), existe un k∗ tal que para todo estado inicial ‖x0‖ ≤ αse tiene que ‖xk‖ ≤ b ∀k > k∗.

Entonces se puede establecer el siguiente teorema en el que se demuestra que la leyde control derivada del problema de optimizacion propuesto estabiliza al sistema en

Page 213: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 197

cualquier estado inicial factible.

Teorema 7.14 (Estabilidad finalmente acotada)

Sea un sistema incierto que responde al modelo

xk+1 = f(xk, uk) + wk

con unas incertidumbres wk ∈ W y sujeto a las restricciones

uk ∈ U xk ∈ X

Sea el sistema tal que satisface la hipotesis 7.12.Sea Xd

N el conjunto de estados tal que el problema de optimizacion del MPC robustodual tiene solucion factible con horizonte N .Entonces la ley de control Kd

MPC(x) estabiliza robustamente al sistema para todo x0 ∈Xd

N , evolucionando hacia la region Ω, donde queda confinado.

Demostracion:

Para probar el teorema se va a comprobar que en cada instante k se puede calcularuna secuencia de actuaciones a partir de la solucion optima en k − 1 que es factible.La secuencia de actuaciones factibles es

u(k + j|k) = u∗(k + j|k − 1) j = 0, · · · , N − k − 1

es decir uF (k) = u∗F (k − 1)N−k1

Para comprobar la factibilidad se va a proceder por induccion.

Sea x0 ∈ XdN , entonces el problema de optimizacion es factible y tiene una solucion

optima u∗F (0). Sea x1 el estado al que evoluciona el sistema incierto al aplicar u∗(0|0).Sea uF (1) la solucion factible calculada.

Entonces, esta secuencia es admisible por serlo u∗F (0). Dado que x1 ∈ X1(x0, u∗(0|0)),

de la propiedad 7.8 se tiene que

Xj−1(x1, uF (1)) ⊆ Xj(x0, u∗F (0)) ⊆ X

para todo j = 2, · · · , N . De aquı se deduce ademas que

XN−1(x1, uF (1)) ⊆ XN(x0, u∗F (0)) ⊆ Ω

Por lo tanto, el problema de optimizacion es factible en k = 1.

Page 214: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

198 7.3. Controlador MPC dual robusto

Supongase que el problema de optimizacion es factible en el instante k−1, situandoseel sistema en xk−1 donde se obtiene una solucion optima u∗F (k − 1). Sea xk el estadoal que evoluciona el sistema al aplicar u∗(k − 1|k − 1). Sea uF (k − 1) la secuenciade actuaciones calculada a partir de u∗F (k). Entonces es obvio que esta secuencia esadmisible por serlo u∗F (k). Ademas, dado que xk ∈ X1(xk−1, u

∗(k − 1|k − 1)), de lapropiedad 7.8 se tiene que

Xj−1(xk, uF (k)) ⊆ Xj(xk−1, u∗F (k − 1)) ⊆ X

para todo j = 2, · · · , N − k + 1. Ademas

XN−k(xk, uF (k)) ⊆ XN−k+1(xk−1, u∗F (k − 1)) ⊆ Ω

y por lo tanto, el problema de optimizacion es factible en el instante k.

Por induccion se deduce que el problema es factible en todo k < N .

En el instante k = N − 1, se tiene que

X1(xN−1, u∗(N − 1|N − 1)) ⊆ Ω

por lo que el estado en el instante N satisface que xN ∈ Ω.

Una vez que el sistema entra en la region Ω, se conmuta a la ley de control localu = h(x), que mantiene la evolucion del sistema incierto en Ω, por la propiedad deinvariancia. Por tanto xk ∈ Ω para todo k ≥ N .

Nota 7.15 La convergencia del controlador esta basada en la obtencion de una solu-cion factible del problema de optimizacion, que no necesariamente tiene que ser lasolucion optima. Esto implica que soluciones suboptimas del problema de optimizacionestabilizan igualmente el sistema.

De este teorema se deduce que para todo estado inicial factible, el controladorconduce al sistema incierto hasta el invariante robusto Ω donde queda confinado. Portanto el sistema es asintoticamente estable acotado al final. Si las incertidumbres fuesendecayendo a lo largo del tiempo y el controlador local estabilizase al sistema asintotica-mente, entonces el controlador dual conduce el sistema hasta el origen.

Una bondad del controlador propuesto es que la estabilidad esta sujeta a la factibili-dad del estado inicial. Por tanto no se imponen cotas explıcitas sobre las incertidumbres,sino que estas estan implıcitamente consideradas en la factibilidad del problema con lasregiones de evolucion incierta. En efecto este controlador admite cualquier grado de in-certidumbres y garantiza que estabiliza el sistema siempre que, para las incertidumbresconsideradas, el estado del que se parte sea factible.

Page 215: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 199

Ademas, el caracter local de estas regiones hace que la cota de incertidumbres queadmite el controlador dependa del estado inicial en que se encuentra el sistema. Esto esuna ventaja pues en otro tipo de controladores basados en acotaciones globales de lasincertidumbres (como por ejemplo las basadas en la continuidad Lipschitz del modelo)se toma el caso mas desfavorable como cota de incertidumbres, incurriendo en ciertoconservadurismo del controlador.

A pesar de la ventaja que supone la aproximacion local, no debe perderse de vistaque este controlador se enmarca dentro de los controladores en bucle abierto, es decir,aquellos en los que no se considera el efecto de realimentacion del controlador en laprediccion del comportamiento del sistema incierto. Esto hace que el controlador pre-sente un alto grado de conservadurismo en relacion a formulaciones en bucle cerrado.De todas formas existen procedimientos que permiten reducir este efecto, como ya secomento en el capıtulo anterior.

7.4. Controlador MPC robusto no dual

Los controladores duales proporcionan un metodo sencillo e intuitivo de controlarel sistema, muy relacionado ademas con el control optimo con horizonte finito. Sinembargo, la conmutacion necesaria de una ley de control a otra se presenta comouna desventaja de estos (Allgower, Badgwell, Qin, Rawlings & Wright 1999, Chen &Allgower 1998a). Quiza la mas inmediata es la perdida de optimalidad del controladordentro de la region terminal.

Para evitar la conmutacion al controlador local, se reformula el problema de opti-mizacion para que el controlador garantice la estabilidad tanto fuera como dentro dela region terminal. Esto permite eliminar la conmutacion al controlador local y dotade optimalidad a las actuaciones obtenidas en esta region.

Una forma sencilla de lograr esto es considerando el principio de invariancia robustaque se satisface en la region Ω. Ası, anadiendo la restriccion

x(k + j|k) ∈ Ω ∼ W

para todo j = N − k + 1, · · · , N , se puede extender el horizonte de control hasta N ,de forma que las actuaciones obtenidas en este intervalo garantizan que el sistemaincierto permanece en el conjunto Ω. Notese que la factibilidad esta garantizada por laexistencia de la ley de control local u = h(x).

Teniendo en cuenta esto, se puede reformular el problema de optimizacion dual,para obtener un MPC no dual

Page 216: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

200 7.4. Controlador MPC robusto no dual

mınuF

JN(xk, uF )

s.a

u(k + j|k) ∈ U j = 0, · · · , N − 1

si k < N

Xj(xk, uF ) ⊆ X j = 1, · · · , N − k − 1

XN−k(xk, uF (k)) ⊆ Ω

x(k + j|k) ∈ Ω ∼ W j = N − k + 1, · · · , Nsi no x(k + j|k) ∈ Ω ∼ W j = 1, · · · , N

Como se puede observar, en el instante inicial coincide con la formulacion dual. Peroen este caso, en todo instante k el horizonte de control se extiende hasta N , anadiendosedesde N − k + 1 hasta N la condicion de invariancia robusta sobre los estados. Ası,para k > N es esta restriccion la unica que se impone sobre los estados, quedando elproblema de optimizacion

mınuF

JN(xk, uF )

s.au(k + j|k) ∈ U j = 0, · · · , N − 1x(k + j|k) ∈ Ω ∼ W j = 1, · · · , N

Notese que esto hace que el controlador aplique soluciones optimas en el conjuntoinvariante robusto que garantizan la robustez. Ademas, si la region terminal y la funcionde coste terminal se obtienen de forma que satisfacen las condiciones de estabilidad dela formulacion general del MPC (hipotesis 3.5), entonces el controlador optimo obtenidoproporciona un mejor desempeno y garantiza la estabilidad asintotica del sistema alorigen en el caso en que las incertidumbres decaigan con el tiempo.

El nuevo controlador robusto viene dado por

KndMPC(xk) = u∗(k|k)

A continuacion se demuestra la estabilidad robusta del controlador no dual propuesto.

Page 217: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 201

Teorema 7.16 (Estabilidad finalmente acotada)

Sea un sistema incierto que responde al modelo

xk+1 = f(xk, uk) + wk

con unas incertidumbres wk ∈ W y sujeto a las restricciones dadas por

uk ∈ U xk ∈ X

tal que satisface la hipotesis 7.12.Sea Xd

N el conjunto de estados tal que el problema de optimizacion del MPC robustodual tiene solucion factible con horizonte N .Entonces la ley de control Knd

MPC(x) estabiliza robustamente al sistema para todo x0 ∈Xd

N , evolucionando hacia la region Ω, donde queda confinado.

Demostracion:

Para probar el teorema se va a comprobar que en cada instante k se puede calcularuna secuencia de actuaciones a partir de la solucion optima en k − 1 que es factible.La secuencia de actuaciones factibles es

u(k + j|k) =

u∗(k + j|k − 1) j = 0, · · · , N − k − 1h(x(k + j|k)) j = N − k, · · · , N − 1

que verifica uF (k)N−k−10 = u∗F (k − 1)N−k

1 .

Para comprobar la factibilidad se va a proceder por induccion.

Sea x0 ∈ XdN , entonces el problema de optimizacion es factible y tiene una solucion

optima u∗F (0). Sea x1 el estado al que evoluciona el sistema incierto al aplicar u∗(0|0).Sea uF (1) la solucion factible calculada.

Entonces, esta secuencia uF (1)N−20 es factible por serlo u∗F (0). Dado que

x1 ∈ X1(x0, u∗(0|0))

de la propiedad 7.8 se tiene que

Xj−1(x1, uF (1)N−20 ) ⊆ Xj(x0, u∗F (0)N−1

1 ) ⊆ X

para todo j = 2, · · · , N . De aquı se deduce ademas que

XN−1(x1, uF (1)N−20 ) ⊆ XN(x0, u∗F (0)N−1

1 ) ⊆ Ω

Page 218: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

202 7.4. Controlador MPC robusto no dual

Por lo tanto, x(N |1) ∈ Ω. Aplicando la ley de control local se tiene una actuacionadmisible tal que

x(N + 1|1) = f(x(N |1), h(x(N |1))) ∈ Ω ∼ W

Consecuentemente, el problema de optimizacion es factible en k = 1.

Supongase que el instante k − 1 el estado del sistema es xk−1 y el problema deoptimizacion es factible. Entonces, se obtiene una solucion optima u∗F (k − 1). Sea xk

el estado al que evoluciona el sistema al aplicar u∗(k − 1|k − 1) y sea uF (k − 1) lasecuencia de actuaciones calculada a partir de u∗F (k). Entonces es obvio que la secuenciauF (k)N−k−1

0 es admisible por serlo u∗F (k). Ademas, dado que

xk ∈ X1(xk−1, u∗(k − 1|k − 1))

de la propiedad 7.8 se tiene que

Xj−1(xk, uF (k)N−k−10 ) ⊆ Xj(xk−1, u∗F (k − 1)N−k

1 ) ⊆ X

para todo j = 2, · · · , N − k + 1. Ademas

XN−k(xk, uF (k)N−k−10 ) ⊆ XN−k+1(xk−1, u∗F (k − 1)N−k

1 ) ⊆ Ω

Ademas se tiene que x(N |k) ∈ Ω. Aplicando la ley de control local se mantiene el sis-tema nominal en Ω ∼ W con una secuencia de actuaciones admisibles. En consecuenciael problema es factible.

Por induccion se deduce que el problema es factible en todo k ≤ N − 1.

En el instante k = N − 1, se tiene que

X1(xN−1, u∗(N − 1|N − 1)) ⊆ Ω

por lo que el estado en el instante N satisface que xN ∈ Ω.

A partir de este instante, la restriccion

x(k + j|k) ∈ Ω ∼ W

es factible gracias a la invariancia robusta de Ω, lo que garantiza la estabilidad. Noteseque a partir de este instante la secuencia dada por el controlador local es la secuenciafactible, y el controlador proporciona una actuacion que minimiza el coste.

Page 219: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 203

7.5. Ejemplo de aplicacion al reactor

En esta seccion se muestran los resultados de aplicar el controlador dual presentadoal ejemplo del reactor utilizado a lo largo de la tesis. Para el calculo de las regionesde evolucion incierta se ha utilizado el algebra intervalar, que como se demostro ante-riormente, proporciona un procedimiento adecuado por ser sencillo de desarrollar y noimplicar un alto coste computacional. Estos resultados han sido publicados en (LimonMarruedo, Bravo, Alamo & Camacho 2002).

El algebra intervalar ofrece una ventaja anadida que mejora aun mas su imple-mentacion: las regiones de evolucion obtenidas son hiperrectangulos. Dado que la re-gion terminal suele calcularse a partir de la linealizacion del modelo en torno al origen,las regiones invariantes suelen ser elipsoides o politopos. Ademas las restricciones enlos estados tambien suelen ser regiones convexas. La convexidad de estas regiones per-miten expresar la restriccion de que una region de evolucion incierta esta contenidaen ellas como una restriccion sobre cada uno de los vertices del hiperrectangulo. Portanto cada restriccion en terminos de region de evolucion incierta se transforma en 2n

restricciones sobre los vertices del hiperrectangulo.

El calculo del conjunto invariante robusto, que se va a utilizar como region termi-nal, se ha hecho buscando el mayor grado de incertidumbre posible. Para ello se hatomado como controlador local, el controlador lineal obtenido en el ejemplo del capıtuloanterior, cuyo controlador y cuya funcion de Lyapunov cuadratica vienen dadas por

K =[−1,5488 −3,4658

]P =

[263,5900 47,176047,1760 117,4640

]

El sistema controlado por este controlador local tiene un invariante positivo dado por

Ω = x ∈ IR2 : xT ·P ·x ≤ αsiendo α = 9,764. Tomando de base este conjunto, se ha calculado un invariante positivoen el cual el controlador local estabiliza robustamente el sistema con una incertidumbre

w1 ∈[−8·10−3, 6,5·10−3

]

w2 ∈[−8,5·10−2, 1,2·10−2

]

Como coste de etapa se ha tomado un coste cuadratico con unas matrices de pon-deracion

Q =

[0,5000 0

0 1,1429

]R = 1,3333

Se ha considerado tambien como coste terminal, V (x) = xT ·P ·x.

Page 220: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

204 7.5. Ejemplo de aplicacion al reactor

En este ejemplo se han realizado dos ensayos del controlador. En el primero se haconsiderado como incertidumbres del sistema las maximas incertidumbres que admiteel invariante robusto y se ha tomado un horizonte de control N = 4. En la figura 7.1se muestran las regiones de evolucion inciertas correspondientes a la primera iteraciondel controlador, para un par de estados iniciales. Como se puede observar, la region X4

esta en el interior de la region terminal Ω, satisfaciendo la factibilidad del problema.

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

x1

x 2

Ω

Figura 7.1: Regiones de evolucion incierta en k = 0 para el ensayo 1.

En la figura 7.2 se muestra la evolucion del sistema incierto controlado por el MPCrobusto dual para el primer ensayo. Como se puede observar, el sistema se estabilizahasta el invariante robusto donde, debido a las incertidumbres, el sistema evolucionahasta quedarse confinado en una vecindad del origen.

En un segundo ensayo, se ha considerado que la planta tiene unas incertidumbresmenores, dadas por

w1 ∈[−6,5·10−3, 6,5·10−3

]

w2 ∈[−1,2·10−2, 1,2·10−2

]

Como se ha comentado, el controlador es valido para cualquier grado de incertidumbre,pues la estabilidad esta garantizada en todo estado inicial factible. En efecto, notese queel tamano de las regiones de evolucion incierta (y en particular la terminal) aumentacon el grado de incertidumbre y con el horizonte de control. Por lo tanto dado queel sistema tiene menor incertidumbre, el controlador admite un mayor horizonte decontrol y en consecuencia un mayor dominio de atraccion del controlador.

Page 221: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 205

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Ω

Figura 7.2: Evolucion del sistema incierto en bucle cerrado en el ensayo 1.

Por este motivo se ha considerado para este segundo ensayo un horizonte de controlde N = 7. En la figura 7.3 se ilustra la primera iteracion del algoritmo en un par deestados iniciales, en la que se puede observar la evolucion de las regiones inciertas,ası como la factibilidad del problema de optimizacion. El comportamiento del sistemaen bucle cerrado se muestra en la figura 7.4. En esta se puede observar que, tal y como seesperaba, el controlador es capaz de estabilizar el sistema incierto partiendo de estadosmas alejados del punto de equilibrio que los estabilizables en el primer ensayo.

7.6. Conclusiones

En este capıtulo se ha presentado un procedimiento para incorporar el efecto de lasincertidumbres en la formulacion del MPC. Este procedimiento se basa en el conceptode regiones de evolucion incierta. Estas regiones no son mas que aquellas que confi-nan la evolucion futura del sistema ante una determinada secuencia de actuaciones. Elprincipal matiz que las diferencia es que estas regiones se orientan a su calculo en lıneamediante la utilizacion de procedimientos aproximados de acotacion de mapas de con-juntos. Ası se establecen condiciones sobre los procedimientos aproximados adecuadospara su determinacion y se presentan algunas caracterısticas de estas regiones.

Basado en estas regiones, se propone un controlador MPC robusto dual en el quelas restricciones en los estados y terminal se formulan en terminos de regiones deevolucion incierta. Requiere tambien la determinacion de un controlador robusto local

Page 222: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

206 7.6. Conclusiones

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25−1.6

−1.4

−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Ω

Figura 7.3: Regiones de evolucion incierta en k = 0, para el ensayo 2.

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25−1.6

−1.2

−0.8

−0.4

0

0.4

x1

x 2

Ω

Figura 7.4: Evolucion del sistema incierto en bucle cerrado en el ensayo2.

con un conjunto invariante positivo admisible asociado. Ası, para todo estado factible,el controlador estabiliza de forma robusta el sistema. Ademas, la estabilidad se conservaen ausencia de optimalidad de la solucion.

Para evitar la conmutacion al controlador local, se propone una modificacion sobrela formulacion del MPC que consiste en incorporar el principio de invariancia como

Page 223: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 7. MPC robusto basado en regiones de evolucion incierta 207

restriccion. Esta restriccion es admisible gracias a la existencia del controlador localrobusto y confiere optimalidad (y convergencia) en la region terminal.

Por ultimo se ha aplicado el controlador dual al reactor utilizado a lo largo dela tesis. Las regiones de evolucion incierta se implementan gracias al algebra inter-valar. Este algebra proporciona un procedimiento general, sencillo y no muy costosocomputacionalmente de calcular estas regiones y de incorporarlas en el problema deoptimizacion.

Estos controladores MPC robustos son aportaciones originales de esta tesis y handado lugar al artıculo (Limon Marruedo, Bravo, Alamo & Camacho 2002).

Hay que resaltar que el controlador propuesto puede tener un alto grado de conser-vadurismo, pues se enmarca dentro de los controladores MPC en bucle abierto en losque se predice el comportamiento del sistema incierto en bucle abierto. Este defecto,presente en los controladores predictivos, viene a solucionarse con formulaciones delcontrolador en bucle cerrado. Dentro de ellas se puede considerar el controlador robus-to que se presenta en el siguiente capıtulo, en el que se incorpora el comportamientodel sistema ante las incertidumbres gracias a la teorıa de conjuntos invariantes.

Page 224: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

208 7.6. Conclusiones

Page 225: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8

MPC robusto basado en conjuntosinvariantes robustos

8.1. Introduccion

La consideracion de incertidumbres en la formulacion estandar de los controladoresMPC incurre en un alto grado de conservadurismo. El origen de este efecto es la nat-uraleza de las predicciones que se llevan a cabo en el problema de optimizacion: laprediccion se hace sin considerar la posible reaccion del controlador ante las incer-tidumbres presentes. Para resolver este problema se han propuesto en la literatura losdenominados controladores predictivos en bucle cerrado (Scokaert & Mayne 1998, Lee& Yu 1997).

En este capıtulo se muestra la necesidad de estas estrategias, su planteamiento yse analiza su estabilidad desde el punto de vista de la programacion dinamica y de laformulacion min-max. Estos controladores resuelven el problema del conservadurismopero a costa de resolver un problema de optimizacion sumamente complejo.

Sin embargo, de este analisis se deriva la importancia del concepto de invarianciarobusta en esta formulacion, lo cual permite establecer una nueva forma de resolverel problema: una restriccion estabilizante que, impuesta sobre el problema MPC enbucle abierto, garantiza la estabilidad robusta del sistema. Esta restriccion esta basa-da en el calculo de las regiones estabilizables robustas. Dado que para sistemas nolineales pueden resultar muy complejas de determinar, se propone una nueva restric-cion estabilizante basada en una secuencia de conjuntos invariantes de control robustosmas sencilla de calcular y que permite garantizar la estabilidad de igual forma. Estaformulacion es una contribucion original de esta tesis.

209

Page 226: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

210 8.2. MPC robusto en bucle cerrado

La organizacion del capıtulo se muestra en el siguiente diagrama:

MPC en

bucle cerrado

Min-max MPC

MPC robusto basado en

invariantes robustos

Incertidumbres acotadas

Incertidumbres que decaen

Restricción estabilizante

Figura 8.1: Organizacion del capıtulo 8

8.2. MPC robusto en bucle cerrado

En capıtulos anteriores se han dado ciertas pinceladas sobre la formulacion en buclecerrado del MPC, como solucion al conservadurismo de los controladores predictivosrobustos basados en la incorporacion de las incertidumbres en la prediccion en bucleabierto. En esta seccion se pretende abordar mas directamente el tema, justificandoel por que de esta necesidad y como se formula este tipo de controladores. Para ellose sigue la lınea presentada en (Mayne 2001), en el cual se analiza el problema de larobustez del MPC desde un punto de vista de la programacion dinamica. De este modose continua la lınea de anteriores capıtulos y se hace hincapie sobre la necesidad de laconsideracion de aspectos de invariancia.

A lo largo de esta seccion se va a considerar que el sistema real o planta respondea un modelo incierto descrito por la ecuacion

xk+1 = f(xk, uk, wk) (8.1)

siendo xk ∈ IRn el vector de estados del sistema y uk ∈ IRm las actuaciones sobre elmismo. El vector wk ∈ IRp representa las incertidumbres presentes en el modelo, de lascuales tan solo se conoce que estan acotadas en un conjunto

wk ∈ W

Page 227: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 211

Por otro lado las entradas y los estados estan sujetos a las restricciones

uk ∈ U xk ∈ X

siendo ambos conjuntos compactos.

8.2.1. Necesidad de controladores MPC en bucle cerrado

Para justificar la necesidad de la formulacion e introducir al concepto de prediccionen bucle cerrado, se va a seguir un ejemplo ilustrativo utilizado en (Scokaert & Mayne1998).

Considerese el sistema lineal incierto dado por

xk+1 = xk + uk + wk

siendo xk ∈ IR el estado del sistema, uk la actuacion sobre el mismo y wk las incer-tidumbres del sistema. El estado del sistema esta restringido a

xk ∈ [−1,2, 2]

mientras que la actuacion no esta acotada. Las incertidumbres del sistema son

wk ∈ [−1, 1]

El conjunto Ω = x ∈ [−1, 1] es un conjunto invariante robusto del sistema con-trolado con una ley de control uk = −xk ya que para todo xk ∈ Ω, se tiene quexk+1 = wk ∈ Ω.

Considerese un controlador MPC con horizonte de prediccion N = 2 y region ter-minal Ω. El estado del sistema en k + 2 sera

xk+2 = xk + uk + uk+1 + wk + wk+1

Considerese una formulacion robusta estandar (en bucle abierto) del MPC. El ob-jetivo del controlador robusto es determinar una secuencia de actuaciones uk, uk+1tal que lleve al sistema a Ω para cualquier realizacion de las incertidumbres. De laprediccion del estado terminal se observa que

xk+2 = xk + uk + uk+1 + wk + wk+1︸ ︷︷ ︸∈[−2,2]

Page 228: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

212 8.2. MPC robusto en bucle cerrado

entonces, dado que la incertidumbre posible es mayor que la region Ω se deduce queno existe ninguna secuencia de actuaciones tal que el problema sea factible.

Sin embargo el problema sı es robustamente controlable a ese conjunto en dos pasos.Para ello basta hacer uk = −xk y uk+1 = −xk+1. En efecto

xk+1 = xk + uk + wk = wk ∈ [−1, 1] ⊂ [−1,2, 2]

luego satisface las restricciones. En el instante siguiente se tiene que

xk+2 = xk+1 + uk+1 + wk+1 = wk+1 ∈ [−1, 1] = Ω

luego, el sistema puede ser llevado hasta la region terminal en N pasos.

La diferencia entre ambas situaciones es que en la primera la secuencia de actua-ciones que se determina en un determinado estado es fija e independiente de la real-izacion de las incertidumbres futuras: debe satisfacer las restricciones para cualquierincertidumbre posible, y esta secuencia no existe. Sin embargo, si se considera que in-certidumbres han intervenido en el sistema se pueden determinar actuaciones, depen-dientes de la evolucion del sistema, que satisfacen las restricciones. Notese que estasactuaciones son leyes de control, pues proporcionan una actuacion en funcion del estadodel sistema: uk = −xk, uk+1 = −xk+1.

En efecto, para un sistema incierto, el conjunto de estados que pueden ser lleva-dos por una secuencia de actuaciones admisible uk = πk(xk) ∈ U a un determinadoinvariante robusto Ω, en N pasos y satisfaciendo las restricciones a pesar de las incer-tidumbres es el conjunto estabilizable a N pasos robusto SN(X, Ω).

SN(X, Ω) = x0 ∈ X : ∃uk = πk(xk) ∈ U k = 0, · · · , N−1 |xk ∈ X, xN ∈ Ω, ∀wk ∈ W

Sin embargo, en el control predictivo robusto (en bucle abierto) el conjunto deestados robustamente estabilizables es

Xba = x0 ∈ X : ∃uk(x0) ∈ U k = 0, · · · , N − 1 |xk ∈ X, xN ∈ Ω, ∀wk ∈ Wes decir, el conjunto de estados que pueden ser llevados por una secuencia de actua-ciones admisible y fija hasta el conjunto Ω en N pasos. Este conjunto esta incluido enSN(X, Ω), y de hecho suele ocurrir que este conjunto es mucho menor

Xba ⊂⊂ SN(X, Ω)

En consecuencia, el problema de la prediccion en bucle abierto es un problema de fac-tibilidad: el conjunto de estados estabilizables de forma robusta en bucle abierto esmucho menor que el que realmente se puede estabilizar. Este es el origen del conser-vadurismo de las formulaciones robustas del MPC basadas en predicciones en bucleabierto.

Page 229: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 213

8.2.2. Formulacion del MPC robusto en bucle cerrado

La formulacion del MPC en bucle cerrado consiste, basicamente, en sustituir lasecuencia de actuaciones

uF (k) = u(k|k), · · · , u(k + N − 1|k)por una secuencia de leyes de control

Π(k) = u(k|k), π1(·), · · · , πN−1(·)como variables de decision del problema de optimizacion. Notese que la actuacionu(k|k) se mantiene como variable de decision, pues el estado actual es conocido.

Ası, el problema de optimizacion del predictivo se reformula como

mınΠ(k)

JN(xk, Π(k),W )

s.au(k|k) ∈ Uπj(x(k + j|k)) ∈ U j = 1, · · · , N − 1 ∀wk+i ∈ W, i = 0, · · · j − 1x(k + j|k) ∈ X j = 0, · · · , N − 1 ∀wk+i ∈ W, i = 0, · · · j − 1x(k + N |k) ∈ Ω ∀wk+i ∈ W, i = 0, · · ·N − 1

siendo x(k + 1|k) = f(xk, u(k|k), wk) y para j = 1, · · · , N − 1

x(k + j + 1|k) = f(x(k + j|k), πj(x(k + j|k)), wk+j)

el estado predicho incorporando el efecto de las incertidumbres.

Es importante poner de manifiesto que la prediccion de los estados depende de larealizacion de las incertidumbres, pudiendo ser esta distinta en el calculo del coste aoptimizar que en la determinacion de las restricciones. Serıa conveniente pues, anadir ala notacion de los estados predichos la dependencia de las incertidumbres. Sin embargo,dado que esta dependencia se deriva del contexto y con el objetivo de la sencillez enel desarrollo de los resultados que se presentan, se realiza un abuso de notacion y seomite esta dependencia. Sin embargo, se insta al lector a tener esto en cuenta a lolargo del capıtulo, pues en secciones posteriores, los estados predichos corresponden alcomportamiento nominal.

La region terminal Ω ⊆ X suele ser un conjunto invariante robusto, con una ley decontrol local asociada uk = h(xk) tal que garantiza que f(x, h(x), w) ∈ Ω para todox ∈ Ω y w ∈ W .

En consecuencia el coste a minimizar tiene la forma

JN(xk, Π(k), W ) =j=N−1∑

j=0

L(x(k + j|k), πj(x(k + j|k))) + V (x(k + N |k))

Page 230: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

214 8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

considerando π0 = u(k|k) (en aras de la sencillez). El coste puede depender del con-junto de incertidumbres presentes sobre el sistema, segun como se calculen los estadospredichos para la determinacion de su coste. Ası, se puede considerar la peor de lasrealizaciones posibles de las incertidumbres, lo cual conduce a un problema min-max, obien considerar el coste nominal, resultante de hacer wk+j = 0. Por eso, la dependenciadel coste con las incertidumbres se pone de manifiesto en la incorporacion del conjuntode incertidumbres W en la notacion del coste.

Notese que independientemente de la forma del coste a minimizar, las restriccionesdeben satisfacerse para toda posible realizacion de las incertidumbres.

Como es logico, este problema de optimizacion es notablemente mas complejo ensu resolucion que la formulacion en bucle abierto, pues requiere el calculo de leyes decontrol, que son variables infinito dimensionales, en general. Por tanto, esta estrategiase considera una solucion teorica por ahora, si bien importantes esfuerzos se estanhaciendo en la comunidad investigadora para tratar este nuevo reto.

Esta formulacion se utiliza en (Scokaert & Mayne 1998) en el contexto de min-maxy en (Magni, De Nicolao, Magnani & Scattolini 2001) en el contexto del control H∞.Dentro de esta familia de controladores se puede englobar el presentado en (Kothareet al. 1996), en el cual se plantea el problema en bucle cerrado en forma de LMI quese resuelve en cada instante.

8.3. Analisis de estabilidad del MPC robusto en bu-

cle cerrado

8.3.1. Aproximacion desde la programacion dinamica

Al igual que los controladores nominales, el control robusto permite una inter-pretacion desde el punto de vista de la programacion dinamica. Para ello se va aconsiderar el controlador en su formulacion min-max, el cual se puede expresar comola solucion del siguiente problema de programacion dinamica (Mayne 2001):

J∗i (x) = mınu∈U

maxw∈W

L(x, u) + J∗i−1(f(x, u, w)) | f(x, u, w) ∈ Xi−1, ∀w ∈ W

siendo J∗0 (x) = V (x) y X0 = Ω. Este problema esta definido en el conjunto Xi, quees el conjunto de estados que pueden alcanzar el conjunto terminal Ω en i pasos,estabilizados por una secuencia de actuaciones admisibles y siguiendo una trayectoriaadmisible. Por tanto este conjunto es el conjunto controlable en i pasos robusto.

Xi = Ki(X, Ω)

Page 231: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 215

Al igual que en el caso nominal, para garantizar la factibilidad del problema deoptimizacion en cada instante, se debe imponer la condicion que Ω sea un invarianterobusto del sistema. Entonces

Xi = Si(X, Ω)

que garantiza que Xi−1 ⊆ Xi.

La ley de control resultante de este problema es

Kri (x) = arg mın

u∈U

maxw∈W

L(x, u) + J∗i−1(f(x, u, w)) | f(x, u, w) ∈ Xi−1, ∀w ∈ W

Aplicando en el instante k la ley de control uk = KrN−k(xk) el sistema incierto

evoluciona de una forma admisible hasta alcanzar el invariante robusto Ω donde la leyde control local uk = h(xk) mantiene el sistema evolucionando en dicho conjunto.

Es importante resaltar que la convergencia al conjunto Ω no se debe a la optimalidadde la solucion obtenida, sino a la satisfaccion de la restriccion

f(x, u, w) ∈ Xi−1 ∀w ∈ W

Esta restriccion garantiza que en el instante k, xk ∈ XN−k, y por lo tanto el estadoevoluciona de una region a otra interior, de forma que en el instante N alcanza la regionΩ, xN ∈ Ω.

Por tanto, cualquier solucion suboptima factible del problema de programaciondinamica estabiliza el sistema, si bien con un peor comportamiento en la evoluciondel mismo. En esta idea se basa la formulacion robusta propuesta en este capıtulo: seimpone sobre el problema en bucle abierto una restriccion tal que garantiza la robustezdel sistema, con las ventajas del bucle cerrado. Este nuevo controlador se expone enuna seccion posterior.

Notese que este analisis justifica la estabilidad siempre y cuando el horizonte decontrol se reduzca en cada instante, de forma que en el instante k, el horizonte de controles N−k. Sin embargo, la formulacion habitual del MPC considera un horizonte fijo N ,por lo que se aplica en cada instante el controlador invariante en el tiempo Kr

N(x). Estecontrolador tan solo garantiza la factibilidad del problema, siempre y cuando la regionterminal sea un invariante robusto. Al igual que en el caso nominal, para garantizarla convergencia del controlador, es necesario imponer condiciones adicionales, que seexponen a continuacion.

Page 232: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

216 8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

8.3.2. Estabilidad del MPC robusto en bucle cerrado con ho-rizonte fijo e incertidumbres que decaen con el estado

Siguiendo la lınea de (Mayne 2001), se establecen condiciones suficientes bajo lascuales el control predictivo robusto en bucle cerrado en su formulacion min-max es-tabiliza el sistema. Para ello supone que las incertidumbres dependen del estado, deforma que tienden a 0 cuando el sistema tiende al origen.

∀w ∈ W (x) : x → 0 ⇒ w → 0

Este tipo de incertidumbres pueden aparecer, por ejemplo, cuando se obtienen modelosque son muy precisos en una vecindad del punto de equilibrio, aumentando el error deestos cuanto mas alejado se encuentra el estado del equilibrio.

En este caso, el origen es un punto de equilibrio del sistema incierto y por lo tantopuede ser asintoticamente estabilizado al origen. Esta condicion permite la satisfaccionde la siguiente hipotesis

Hipotesis 8.1 Existe un conjunto invariante robusto Ω con una ley de control asociadauk = h(xk) y una funcion de Lyapunov 1 V (x) tales que

(i) Ω ⊆ Xh.

(ii) f(x, h(x), w) ∈ Ω para todo x ∈ Ω y w ∈ W .

(iii) V (f(x, h(x), w))− V (x) + L(x, h(x)) ≤ 0 para todo x ∈ Ω y w ∈ W .

El controlador min-max MPC considerando como coste terminal V (x) y regionterminal Ω viene dado por el siguiente problema de optimizacion

mınΠ(k)

maxwF∈W

j=N−1∑j=0

L(x(k + j|k), πj(x(k + j|k))) + V (x(k + N |k))

s.au(k|k) ∈ Uπj(x(k + j|k)) ∈ U j = 1, · · · , N − 1 ∀wk+i ∈ W, i = 0, · · · j − 1x(k + j|k) ∈ X j = 0, · · · , N − 1 ∀wk+i ∈ W, i = 0, · · · j − 1x(k + N |k) ∈ Ω ∀wk+i ∈ W, i = 0, · · ·N − 1

del cual se deriva la ley de control

uk = KrMPC(xk) = u∗(k|k)

La estabilidad de este controlador se establece en el siguiente teorema

1Analogamente se puede establecer esta hipotesis en terminos de funcion de Lyapunov de control.

Page 233: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 217

Teorema 8.2 (Mayne 2001) Sea un sistema incierto que responde a un modelo

xk+1 = f(xk, uk, wk)

siendo xk ∈ IRn , uk ∈ IRm y wk ∈ IRp. Las entradas y los estados estan sujetos a lasrestricciones

uk ∈ U xk ∈ X

Las incertidumbres presentes en el modelo satisfacen wk ∈ W de forma que w → 0cuando x → 0. Por lo tanto f(0, 0, 0) = 0 es un punto de equilibrio del sistema incierto.Sea el sistema tal que se satisface la hipotesis 8.1.Entonces la ley de control uk = Kr

MPC(xk) estabiliza asintoticamente el sistema al origenpara todo estado inicial factible x0 ∈ XN .

Demostracion:

Todo estado inicial, por ser factible, satisface que x0 ∈ XN = SN(X, Ω) y ademas paratodo xk ∈ XN se satisface que xk+1 ∈ XN−1 = SN−1(X, Ω) ⊆ SN(X, Ω), por lo que elcontrolador es siempre factible a pesar de las incertidumbres.

Para probar la convergencia, se va a demostrar antes el siguiente resultado

J∗i (x)− J∗i−1(x) ≤ 0 ∀x ∈ Xi−1

para lo cual se va a proceder por induccion.

Ası, para i = 1, para todo x ∈ Ω se tiene que

J∗1 (x)− J∗0 (x) = mınu∈U

maxw∈W

L(x, u) + V (f(x, u, w))|f(x, u, w) ∈ Ω, ∀w ∈ W − V (x)

En virtud de la hipotesis 8.1, se tiene que

mınu∈U

maxw∈W

L(x, u) + V (f(x, u, w))|f(x, u, w) ∈ Ω, ∀w ∈ W − V (x) ≤ 0

luego, J∗1 (x)− J∗0 (x) ≤ 0.

Supongase que J∗i (x) ≤ J∗i−1(x) para todo x ∈ Xi−1. Entonces para todo x ∈ Xi setiene que

J∗i+1(x)−J∗i (x) = mınu∈U

maxw∈W

L(x, u)+J∗i (f(x, u, w)) | f(x, u, w) ∈ Xi, ∀w ∈ W−J∗i (x)

dado que x ∈ Xi, el controlador optimo a i pasos Kri (x) es un controlador suboptimo

factible del problema en i + 1 pasos pues para todo x ∈ Xi satisface la restriccion, yaque

f(x,Kri (x), w) ∈ Xi−1 ⊆ Xi

Page 234: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

218 8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

En lo que sigue, y en aras de la sencillez de la presentacion de la demostracion, seomitira la restriccion f(x, u, w) ∈ Xi, ∀w ∈ W de los calculos.

Considerando esto y la optimalidad de Kri (x) para todo x ∈ Xi, se tiene que

J∗i+1(x)− J∗i (x) ≤ maxw∈W

L(x,Kri (x)) + J∗i (f(x, Kr

i (x), w)) − J∗i (x)

= maxw∈W

L(x,Kri (x)) + J∗i (f(x, Kr

i (x), w))−max

w∈WL(x,Kr

i (x)) + J∗i−1(f(x,Kri (x), w))

Teniendo en cuenta la siguiente propiedad

maxw

A(w)−maxw

B(w) ≤ maxwA(w)−B(w)

se deriva que

J∗i+1(x)− J∗i (x) ≤ maxw∈W

J∗i (f(x,Kri (x), w))− J∗i−1(f(x, Kr

i (x), w))

Dado que f(x,Kri (x), w) ∈ Xi−1 para todo w ∈ W , de la hipotesis de partida se verifica

queJ∗i+1(x)− J∗i (x) ≤ 0

Con lo que queda demostrada la afirmacion anterior.

Considerando este resultado se puede establecer que

J∗N(xk+1)− J∗N(xk) = J∗N(xk+1)−maxw∈W

L(xk, KrMPC(xk)) + J∗N−1(f(xk, K

rMPC(xk), w))

Dado que xk+1 = f(xk, KrMPC(xk), wk), se verifica que

maxw∈W

L(xk, KrMPC(xk)) + J∗N−1(f(xk, K

rMPC(xk), w)) ≥ L(xk, K

rMPC(xk))

+J∗N−1(f(xk, KrMPC(xk), wk))

= L(xk, KrMPC(xk)) + J∗N−1(xk+1)

Por lo tanto, se tiene que

J∗N(xk+1)− J∗N(xk) ≤ J∗N(xk+1)− L(xk, KrMPC(xk))− J∗N−1(xk+1)

Dado que xk+1 ∈ XN−1, se aplica el resultado anterior por el cual

J∗N(xk+1)− J∗N−1(xk+1) ≤ 0

de donde se deduce que

J∗N(xk+1)− J∗N(xk) ≤ −L(xk, KrMPC(xk))

Page 235: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 219

y por lo tanto J∗N(x) es una funcion de Lyapunov del sistema.

Este resultado demuestra la estabilidad asintotica del sistema controlado por unMPC min-max, para incertidumbres que tienden a cero cuando el estado del sistematiende al origen. Esta demostracion es una version detallada de la presentada en (Mayne2001).

8.3.3. Estabilidad del MPC robusto en bucle cerrado con ho-rizonte fijo e incertidumbres acotadas

Considerese el caso de incertidumbres simplemente acotadas, es decir aquellas queno tienen por que tender a cero cuando el estado tiende al origen. En este caso, tansolo se conoce de las incertidumbres su pertenencia a un conjunto acotado W , de formaque, existe una constante µ > 0 tal que para todo w ∈ W , se tiene que ‖w‖ ≤ µ.

Este tipo de incertidumbres hacen que el origen no sea un punto de equilibriodel sistema y por lo tanto el resultado anterior no puede aplicarse. En este caso, en(Mayne 2001) se propone la utilizacion de una formulacion dual del controlador, en laque se anade como variable de decision el horizonte de control.

Sin embargo, incorporando resultados de la estabilidad entrada a estado se puedeestablecer que el sistema controlado por el controlador robusto min-max anterior, es-tabiliza el sistema en sentido entrada estado. Esto generaliza el resultado anterior ydemuestra que en caso de incertidumbres acotadas no es necesario recurrir a formula-ciones duales para demostrar estabilidad. Este resultado es una contribucion de estatesis.

El sistema debe satisfacer la siguiente hipotesis, segun la cual debe existir un inva-riante robusto en el que el sistema es estabilizable entrada a estado.

Hipotesis 8.3 Existe un conjunto invariante robusto Ω con una ley de control asociadauk = h(xk) y una funcion de Lyapunov V (x) tales que

(i) Ω ⊆ Xh.

(ii) f(x, h(x), w) ∈ Ω para todo x ∈ Ω y w ∈ W .

(iii) Existe una funcion K , γ(·), tal que

V (f(x, h(x), w))− V (x) ≤ −L(x, u) + γ(µ)

Page 236: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

220 8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

para todo x ∈ Ω y w ∈ W .

Con esta ligera modificacion se puede comprobar que el sistema controlado por laley

uk = KrMPC(xk)

es estable entrada a estado, y por lo tanto, que el sistema evoluciona hasta un invarianterobusto en el que queda acotado. Este resultado es original de esta tesis y se estableceen el siguiente teorema

Teorema 8.4 Sea un sistema incierto que responde a un modelo

xk+1 = f(xk, uk, wk)

siendo xk ∈ IRn , uk ∈ IRm y wk ∈ IRp. Las entradas y los estados estan sujetos a lasrestricciones

uk ∈ U xk ∈ X

Las incertidumbres presentes en el modelo satisfacen

wk ∈ W

siendo el conjunto de incertidumbres W tal que existe una constante µ > 0 que verificaW ⊆ Bµ = ‖w‖ ≤ µ.Sea el sistema tal que se satisface la hipotesis 8.3.Entonces la ley de control uk = Kr

MPC(xk) estabiliza el sistema en el sentido entrada aestado para todo estado inicial factible x0 ∈ XN .

En la demostracion del teorema se simplifica por ser muy similar a la del teoremaanterior.

Demostracion:

La evolucion del sistema garantiza la factibilidad robusta del problema de optimizacion.

Para probar la convergencia, se va a demostrar por induccion que

J∗i (x)− J∗i−1(x) ≤ γ(µ) ∀x ∈ Xi−1

Ası, para i = 1, para todo x ∈ Ω se tiene que2

J∗1 (x)− J∗0 (x) = mınu∈U

maxw∈W

L(x, u) + V (f(x, u, w)) − V (x)

2Al igual que en la demostracion anterior, en aras de la sencillez de la misma, se omite en lanotacion la restriccion en el estado siguiente f(x, u, w) ∈ Xi, ∀w ∈ W .

Page 237: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 221

≤ maxw∈W

L(x, h(x)) + V (f(x, h(x), w)) − V (x)

≤ γ(µ)

consecuencia de la hipotesis 8.3.

Supongase que J∗i (x) − J∗i−1(x) ≤ γ(µ) para todo x ∈ Xi−1. Entonces para todo

x ∈ Xi se tiene que

J∗i+1(x)− J∗i (x) ≤ maxw∈W

J∗i (f(x,Kri (x), w))− J∗i−1(f(x,Kr

i (x), w))

Dado que f(x,Kri (x), w) ∈ Xi−1 para todo w ∈ W , de la hipotesis de partida se verifica

que

J∗i+1(x)− J∗i (x) ≤ γ(µ)

Con lo que queda demostrada la afirmacion anterior.

Considerando esto se tiene que

J∗N(xk+1)− J∗N(xk) = J∗N(xk+1)−maxw∈W

L(xk, KrMPC(xk)) + J∗N−1(f(xk, K

rMPC(xk), wk))

≤ J∗N(xk+1)− L(xk, KrMPC(xk))− J∗N−1(xk+1)

Dado que xk+1 ∈ XN−1, se aplica el resultado anterior por el cual

J∗N(xk+1)− J∗N−1(xk+1) ≤ γ(µ)

de donde se deduce que

J∗N(xk+1)− J∗N(xk) ≤ −L(xk, KrMPC(xk)) + γ(µ)

y por lo tanto J∗N(x) es una funcion de Lyapunov entrada a estado del sistema.

8.4. Transformacion de la formulacion en bucle ce-

rrado en restriccion estabilizante

La formulacion en bucle cerrado del MPC aparece como una formulacion nece-saria para solventar los problemas asociados a los controladores robustos tradicionales,basados en las predicciones en bucle abierto. Sin embargo, la incorporacion de leyes decontrol en el problema de optimizacion hacen el problema tan complejo de resolver,que se considera por ahora una solucion teorica.

Page 238: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

222 8.4. Transformacion de la formulacion en bucle cerrado en restriccion estabilizante

Del analisis hecho anteriormente se comprueba que la teorıa de conjuntos invariantesofrece un marco para el analisis de la estabilidad y factibilidad de sistemas inciertos.Estas propiedades estan muy relacionadas con el concepto de conjunto invariante decontrol robusto, y en particular con los conjuntos estabilizables robustos. En efecto, enel caso de la programacion dinamica se observa que es la satisfaccion en el instante kde la restriccion

f(xk, uk, wk) ∈ XN−k−1 ∀w ∈ W

lo que garantiza la convergencia del sistema al invariante robusto Ω a pesar de lasincertidumbres, dado que la secuencia de conjuntos XN−k es una secuencia contractiva3

que converge en Ω.

Esta consideracion permite abandonar la optimalidad de la solucion, pues es lafactibilidad la garantıa de convergencia. Por tanto un controlador formulado a partirdel siguiente problema de optimizacion

mınuF

JN(xk, uF ,W )

s.a

x(k + 1) ∈ XN−k−1 ∀w ∈ Wu(k + j|k) ∈ U j = 0, · · · , N − 1x(k + j|k) ∈ X j = 0, · · · , N − 1x(k + N |k) ∈ Ω

siendo x(k + 1) = f(x, u(k|k), w), garantiza igual la factibilidad del sistema y su con-vergencia al conjunto Ω a pesar de las incertidumbres. Notese que en el problemade optimizacion, las predicciones hechas a partir del instante k + 1, x(k + j|j) paraj = 2, · · · , N pueden ser predicciones nominales del sistema.

La propiedad mas importante de este problema de optimizacion es que se recuperala formulacion en bucle abierto, que es mucho mas sencilla de resolver. La adicion enel problema en bucle abierto de la restriccion

x(k + 1) ∈ XN−k−1 ∀w ∈ W

es lo que garantiza la factibilidad del problema, pues para todo xk ∈ XN−k, existeuna actuacion factible tal que xk+1 ∈ XN−k−1 para toda incertidumbre w ∈ W yademas, dado que XN−k−1 ⊆ X, la restriccion asegura la satisfaccion robusta de lasrestricciones en el estado. Por tanto, la consideracion de un horizonte de control mayorque 1, ası como el resto de restricciones impuestas sobre los estados, tienen sentidoen lo que respecta al desempeno del controlador pero no por la estabilidad ni por eldominio de atraccion del controlador.

En efecto, el conocimiento de la secuencia de conjuntos estabilizables a i pasos, Xi =Si(X, Ω), ofrece una informacion del sistema muy importante que puede incorporarse

3Se entiende una secuencia contractiva de conjuntos, aquella secuencia tal que Ωi ⊆ Ωi+1 paratodo i.

Page 239: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 223

al diseno de controladores estabilizantes. Para ello es necesario llevar a cabo el calculoexplıcito de estas regiones para incorporarlas como restricciones. Este calculo se hacefuera de lınea, por lo que el coste computacional derivado, si bien puede ser grande,forma parte del diseno del controlador. En lınea, el coste computacional asociado a laresolucion de este problema de optimizacion es similar a la del MPC nominal.

Existen algoritmos eficientes para la determinacion de estos conjuntos tan solo ensistemas lineales con restricciones politopicas (Kerrigan 2000). En un contexto diferenteal MPC, en (Mayne & Schroeder 1997) se disena un controlador en tiempo mınimorobusto para sistemas lineales utilizando conjuntos invariantes.

En el caso de sistemas no lineales es necesario recurrir a procedimientos aproxi-mados, que hacen que la anterior restriccion estabilizante no se pueda implementar.Para subsanar este problema, se propone en la siguiente seccion una formulacion de larestriccion basada en una secuencia de conjuntos invariantes de control robustos, quepueden calcularse a partir de procedimientos aproximados.

Esta idea se puede enmarcar dentro los denominados controladores predictivos conrestriccion estabilizante, en los cuales se garantiza la estabilidad del sistema medianteuna restriccion estabilizante impuesta sobre el estado siguiente. En (Primbs et al. 2000),se presenta un controlador con estabilidad garantizada para sistemas sin incertidumbresy sin restricciones en los estados. Este controlador se basa la incorporacion de unarestriccion basada en una funcion de Lyapunov de control (CLF). Esta restriccionobliga a tomar una actuacion que provoque un decrecimiento de la CLF en el instantesiguiente. Ası, esta funcion es funcion de Lyapunov del sistema en bucle cerrado. Laidea de restriccion estabilizante basada en invariantes de control se podrıa consideraruna generalizacion de estos resultados.

8.5. MPC robusto basado en conjuntos invariantes

de control

En la seccion anterior se mostro como se pueden transformar las condiciones im-puestas en el control predictivo en bucle cerrado en una restriccion estabilizante so-bre el problema formulado en bucle abierto. Esto tiene unas ventajas notables, peroesta basado en la determinacion de los conjuntos Si(X, Ω).

Con el fin de evitar el calculo de estos conjuntos y conservar las caracterısticasestabilizantes del controlador, se propone un controlador basado en una secuencia deinvariantes de control robustos, que es mas sencilla de obtener.

Page 240: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

224 8.5. MPC robusto basado en conjuntos invariantes de control

En lo que sigue se va a considerar un sistema incierto cuyo modelo responde aincertidumbres aditivas

xk+1 = f(xk, uk) + wk

de forma que las incertidumbres estan contenidas en un conjunto acotado wk ∈ W . Lasactuaciones y los estados estan a su vez restringidos a

uk ∈ U, xk ∈ X

8.5.1. Determinacion de una secuencia de invariantes de con-trol robustos

A lo largo del desarrollo de esta seccion se utilizan conceptos y resultados de lateorıa de conjuntos invariantes, que se puede encontrar en el apendice A.

Un conjunto Φ ⊂ IRn se dice que es un invariante de control robusto, si paracualquier estado contenido en Φ, existe una actuacion admisible u(x) ∈ U tal que elestado siguiente permanece en el, es decir, f(x, u) + w ∈ Φ para todo w ∈ W .

La obtencion de invariantes de control esta basada en el conjunto a un paso robustoQ(Ω). Este conjunto viene dado por

Q(Ω) = x ∈ IRn : ∃u(x) ∈ U | f(x, u) + w ∈ Ω ∀w ∈ Wes decir, el conjunto de estados para los cuales existe una actuacion admisible tal queel estado siguiente esta contenido en Ω para toda posible incertidumbre.

En el caso de incertidumbres aditivas, el conjunto a un paso robusto satisface lapropiedad

Q(Ω) = Q(Ω ∼ W )

por lo que se puede obtener a partir del conjunto a un paso nominal 4.

Teniendo en cuenta lo anterior, se puede establecer la siguiente propiedad

Propiedad 8.5 Sea Ω ⊆ X un invariante de control robusto del sistema y sea Q(Ω)su conjunto a un paso robusto, entonces todo conjunto Φ tal que

Ω ⊆ Φ ⊆ Q(Ω) ∩X

es un invariante de control robusto del sistema.4El fin ultimo de considerar modelos con incertidumbres aditivas es poder obtener el conjunto a

un paso robusto a partir del nominal, que resulta mas sencillo de calcular. Sin embargo, todos losresultados posteriores son extensibles a otro tipo de incertidumbres considerando el conjunto a unpaso robusto

Page 241: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 225

Esta propiedad es inmediata, considerando el principio de invariancia y la definiciondel conjunto a un paso robusto. La interseccion con el conjunto de restricciones sobreel estado X es necesario para garantizar que la evolucion del sistema es admisible. Enel caso en que el conjunto Ω fuese un invariante positivo robusto tambien se satisfacela propiedad pues esta basada en la propiedad geometrica de invariancia.

Como se ha comentado en capıtulos anteriores, el calculo del conjunto a un paso Q(·)es muy costoso, si no imposible, en el caso de sistemas no lineales. Pero la propiedadanterior provee un procedimiento para determinar invariantes de control robustos apartir de un calculo aproximado del conjunto a un paso Q(·). Ası, se puede obtener unprocedimiento aproximado de calculo Qap(·) tal que

Ω ⊆ Φ = Qap(Ω ∼ W ) ⊆ Q(Ω ∼ W )

De todo lo anterior se deduce que mediante el siguiente algoritmo es posible obteneruna secuencia de Nr invariantes de control robustos.

1. Hacer Ω0 = Ω. i ← 0

2. Calcular Ωi = Qap(Ωi−1 ∼ W ) ∩X ⊇ Ωi−1

3. Si i = Nr ir a 5

4. Si no, hacer i ← i + 1 e ir a 2

5. Fin

Notese que el procedimiento para calcular Qap(·) debe ser lo suficientemente precisocomo para que el paso 2 tenga solucion.

De este algoritmo se obtienen Nr conjuntos invariantes de control robusto tales quesatisfacen las siguientes propiedades

Propiedad 8.6 Sea Ωi la secuencia de Nr invariantes de control robustos obtenidosdel anterior algoritmo, entonces

1. Ω0 = Ω ⊆ Ω1 ⊆ · · · ⊆ ΩNr ⊆ X.

2. Para todo x ∈ Ωi existe una actuacion admisible u ∈ U tal que f(x, u)+w ∈ Ωi−1

para todo w ∈ W .

3. Ωi ⊆ Si(X, Ω).

Page 242: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

226 8.5. MPC robusto basado en conjuntos invariantes de control

4. Si el calculo de la region a un paso es exacta, es decir Qap(·) = Q(·), entoncesΩi = Si(X, Ω).

Es interesante resaltar que esta secuencia de invariantes de control robustos puedeestar finitamente determinada, es decir, que exista un i∗ tal que para todo i ≥ i∗, resultaque Ωi = Ωi+1. En consecuencia, la secuencia de invariantes de control dejarıa de crecer.Esta determinacion puede venir derivada de la determinacion finita de S∞(X, Ω), esdecir, de la propia naturaleza del sistema y de las restricciones, o bien por el caracteraproximado del calculo de Qap(·).

8.5.2. Formulacion del MPC robusto

El analisis llevado a cabo anteriormente muestra que la incorporacion de una re-striccion estabilizante basada en las regiones estabilizables asegura estabilidad del con-trolador robusto en una formulacion en bucle abierto. Sin embargo, la dificultad de ladeterminacion de estos conjuntos en sistemas no lineales, conduce a la necesidad deformulaciones mas implementables.

La estabilidad de la formulacion anterior esta basada en la contractividad de lasecuencia de regiones XN−k, que va forzando al sistema, de una forma admisible, aalcanzar el invariante robusto. Para conservar la contractividad y admisibilidad de lassoluciones, se propone el calculo de una secuencia de Nr invariantes de control robustosdesarrollado en el apartado anterior. Por tanto, esta secuencia puede utilizarse paraformular un nuevo controlador MPC robusto:

mınuF

JN(xk, uF ,W )

s.a x(k + 1|k) ∈ ΩNr−k ∼ W si k < Nr

x(k + 1|k) ∈ Ω ∼ W si k ≥ Nr

u(k + j|k) ∈ U j = 0, · · · , N − 1x(k + j|k) ∈ X j = 0, · · · , N − 1

En este caso los estados x(k+j|k) son los estados predichos a partir del modelo nominaldel sistema.

Este problema de optimizacion es en bucle abierto, lo que simplifica la resolucion delproblema. El coste a optimizar JN(xk, uF ,W ) puede basarse en predicciones nominales,o bien el correspondiente a una formulacion min-max o cualquier otra. El coste JN , elhorizonte de control N , ası como las restricciones adicionales sobre los estados tan soloafectan al comportamiento del sistema controlado, no a la estabilidad del mismo, queesta garantizada por la restriccion estabilizante (como se demostrara a continuacion).

Page 243: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 227

8.5.3. Analisis de estabilidad

A continuacion se demuestra que el controlador propuesto estabiliza el sistemaincierto.

Teorema 8.7 (Estabilidad robusta)

Sea un sistema incierto cuyo modelo responde a

xk+1 = f(xk, uk) + wk

de forma que las incertidumbres estan contenidas en un conjunto acotado wk ∈ W . Lasactuaciones y los estados estan a su vez restringidos a

uk ∈ U xk ∈ X

Sea Ω ⊂ X un conjunto invariante robusto del sistema incierto y sea Ωi una secuen-cia contractiva de Nr invariantes de control robustos basada en Ω obtenida utilizandoel algoritmo propuesto.Entonces el sistema incierto controlado por el controlador MPC robusto propuesto es-tabiliza el sistema hasta quedar acotado en Ω, para todo estado contenido en Xr

N =Q(ΩNr ∼ W ) ∩X.

Demostracion:

Se va a comprobar que todo x0 ∈ XrN es asintoticamente estabilizado al conjunto Ω, y

para ello se procede por induccion.

Supongase que x0 ∈ XrN = Q(ΩNr ∼ W ) ∩ X, entonces existe una actuacion

admisible u0 ∈ U tal que f(x0, u0) ∈ ΩNr ∼ W ⊂ X. Por lo tanto satisface lasrestricciones en x(1|0). Ademas, de la teorıa de conjuntos invariantes se tiene queΩNr ⊆ SNr(X, Ω) ⊆ SNr(X, Ω) ⊆ C∞(X), siendo C∞(X) el maximo invariante decontrol robusto. Por lo tanto existe una secuencia de actuaciones admisibles tales que laevolucion del sistema es admisible. En consecuencia se satisfacen todas las restriccionesy el problema es factible en x0. Ademas el estado siguiente x1 ∈ ΩNr ⊆ Q(ΩNr−1 ∼W ) ∩X.

Supongase ahora que xk ∈ Q(ΩNr−k ∼ W ) ∩ X. Entonces existe una actuacionadmisible uk ∈ U tal que x(k + 1|k) ∈ ΩNr−k ∼ W . Ademas, dado que ΩNr−k ⊆C∞(X), existe una secuencia de actuaciones admisibles que mantienen la evolucion delsistema admisible. Entonces el problema es factible en xk y ademas xk+1 ∈ ΩNr−k ⊆Q(ΩNr−k−1 ∼ W ) ∩X.

Page 244: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

228 8.5. MPC robusto basado en conjuntos invariantes de control

Por lo tanto, para todo k < Nr, se satisface que el problema es factible y ademas elsistema evoluciona de forma que xNr ∈ Ω.

Para k ≥ Nr la restriccion x(k + 1|k) ∈ Ω ∼ W es factible por ser Ω un conjuntoinvariante robusto, y ademas la actuacion obtenida garantiza que el sistema permanececontenido en dicho invariante.

Nota 8.8 La restriccion x(k + 1|k) ∈ Ω ∼ W se anade para garantizar que el contro-lador mantiene el sistema en Ω una vez alcanzada la region. Si se omite, entonces esnecesaria una formulacion dual, y por lo tanto la conmutacion al controlador local unavez que el sistema alcanza el conjunto Ω.

Nota 8.9 Si la funcion de coste se toma de forma que el MPC estabiliza asintotica-mente el sistema en ausencia de incertidumbres, entonces el controlador estabilizaasintoticamente el sistema incierto si las incertidumbres decaen con el tiempo.

Esto se debe a que, una vez que el estado del sistema queda confinado en Ω, larobustez inherente del controlador MPC garantiza la estabilidad asintotica.

Nota 8.10 La adicion de la restriccion terminal x(k + N |k) ∈ Ω en el problema deoptimizacion, solo se puede hacer cuando N ≥ Nr. La incorporacion de esta restriccionmejora el comportamiento del controlador.

Nota 8.11 El sistema se puede comportar de forma que en un determinado instantek, el sistema evolucione a un conjunto de la secuencia Ωi con i < Nr−k (es decir, quese salte una o mas de una region de la secuencia en un solo paso). En este caso el con-trolador sigue estabilizando el sistema, pero el desempeno del sistema podrıa empeorar.Para evitar esto, la restriccion estabilizante se puede sustituir por

x(k + 1|k) ∈ Ωi ∼ W

siendo i tal que xk ∈ Ωi+1 \ Ωi.

Propiedad 8.12 El controlador propuesto tiene las siguientes propiedades:

(i) El controlador obtenido eliminando las restricciones sobre los estados x(k+j|k) ∈X del problema de optimizacion tambien estabiliza el sistema de forma admisible,es decir, satisfaciendo las restricciones.

Page 245: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 229

(ii) El controlador estabiliza el sistema para cualquier funcion de coste.

(iii) El dominio de atraccion tan solo depende de la secuencia Ωi.

(iv) Si el procedimiento Qap(·) = Q(·), entonces el dominio de atraccion es XNr =SNr(X, Ω).

(v) El controlador estabiliza el sistema con el mismo dominio de atraccion paracualquier horizonte de control N ≥ 1.

(vi) El controlador estabiliza el sistema con el mismo dominio de atraccion antecualquier solucion suboptima del problema de optimizacion.

Por lo tanto, la secuencia de invariantes de control robustos sirven para garantizarla estabilidad del controlador, y en consecuencia, determinar el dominio de atracciondel mismo. El horizonte de control, el coste a optimizar y la optimalidad de la soluciontan solo afecta al comportamiento del sistema controlado. Ası, el horizonte de controly por ende el numero de variables de decision, se puede fijar en funcion del costecomputacional en lınea que es admisible para que el tiempo de calculo del controladorno supere el periodo de muestreo.

8.6. Ejemplos

8.6.1. El sistema de Scokaert y Mayne

Se va aplicar la tecnica propuesta al ejemplo utilizado en (Scokaert & Mayne 1998),con el que se ilustro anteriormente la necesidad de la formulacion en bucle cerrado.

Considerese el sistema lineal incierto dado por

xk+1 = xk + uk + wk

siendo xk ∈ IR el estado del sistema, uk la actuacion sobre el mismo y wk las incer-tidumbres del sistema. El estado del sistema esta restringido a

xk ∈ [−1,2, 2]

mientras que la actuacion no esta acotada. Las incertidumbres del sistema son

wk ∈ [−1, 1]

Page 246: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

230 8.6. Ejemplos

El conjunto Ω = x ∈ [−1, 1] es un conjunto invariante robusto del sistema controladocon una ley de control uk = −xk. La secuencia de invariantes de control robustosesta finitamente determinada en un solo paso, de forma que Ω1 = X.

Basandose en la secuencia de invariantes se aplica el controlador propuesto conhorizonte de control N = 3 y coste de etapa L(x, u) = x2 + u2 sin funcion de costeterminal. El controlador se aplica en las situaciones ilustradas en (Scokaert & Mayne1998, Bemporad, Borrelli & Morari 2001), con una perturbacion wk = −1/k y con otrawk = −cos(k/5). En las figuras 8.2 y 8.3 se muestran las evoluciones del sistema enambas situaciones, que como era de esperar, estabilizan el sistema en un solo paso.

0 2 4 6 8 10 12 14 16 18 20−1

−0.5

0

0.5

1

1.5

2

2.5

muestras

0 2 4 6 8 10 12 14 16 18 20−1.5

−1

−0.5

0

0.5

xx

Figura 8.2: Evolucion del sistema con wk = −1/k,partiendo de x0 = 2 y x0 = −1,2.

0 5 10 15 20 25 30 35 40−1.5

−1

−0.5

0

0.5

1

1.5

2

sample time

x k

Figura 8.3: Evolucion del sistema con wk = −cos(k/5) y x0 = 2.

Page 247: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 231

8.6.2. Ejemplo de aplicacion al reactor

En este apartado se aplica la estrategia presentada al ejemplo del reactor (CSTR)utilizado a lo largo de esta tesis. En capıtulos anteriores se han disenado controladoresrobustos basados en la formulacion en bucle abierto del mismo. En este caso se vaa sintonizar un controlador basado en invariantes de control robustos para lo cual esnecesario partir de un conjunto invariante robusto. Como tal se va a tomar el utilizadoen el ejemplo del capıtulo anterior, el cual para un controlador local

K =[−1,5488 −3,4658

]

admite unas incertidumbres

w1 ∈[−8·10−3, 6,5·10−3

]

w2 ∈[−8,5·10−2, 1,2·10−2

]

A partir de este conjunto se debe calcular la secuencia de invariantes de controlrobustos. Para ilustrar la satisfaccion robusta de las restricciones, se van a considerarunas restricciones sobre los estados mas exigentes, de forma que

x1 ∈ [−0,2, 0,2]

Para el calculo de la secuencia se ha seguido el algoritmo propuesto dando lugar alos conjuntos que se muestran en la figura 8.4.

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Ω0

Ω1

Ω2 Ω

3

Ω4Ω

5

Ω6

Figura 8.4: Secuencia de 6 conjuntos invariantes de control del reactor.

Para ilustrar la forma en que los invariantes de control introducen informacion delcomportamiento del sistema en bucle cerrado, se muestra en la figura 8.5 la evolucion

Page 248: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

232 8.6. Ejemplos

de varias realizaciones de incertidumbres aleatorias considerando la restriccion estabi-lizante. En esta se puede comprobar que la evolucion es siempre admisible a pesar delas incertidumbres.

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2x 2

x1

Figura 8.5: Evolucion del sistema para un gran numero de realizaciones de las incertidum-bres.

En la figura 8.6 se muestra las trayectorias del sistema incierto en bucle cerrado.Como ponderacion en el controlador se han tomado las mismas matrices de ponderacionanteriormente citadas y se ha tomado un coste terminal cuadratico dado por la matrizP . El horizonte de control considerado ha sido Nc = 1 y el de prediccion Np = 1. Parala simulacion se ha considerado incertidumbres aditivas sobre el sistema aleatorias, deahı el comportamiento erratico del sistema una vez ha alcanzado el invariante robusto.

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

x 2

x1

x 2

x1

Figura 8.6: Trayectorias del sistema en bucle cerrado con incertidumbres aleatorias.

Para mostrar la satisfaccion robusta de las incertidumbres se muestra la evolucion

Page 249: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 233

del sistema considerando las incertidumbres extremas constantes. En el caso (a) seconsidera w1 = −8·10−3 y w2 = −8,5·10−2. En el caso (b) se considera w1 = 6,5·10−3

y w2 = 1,2·10−2. En la figura 8.7 se muestran ambos casos y se puede comprobar queexisten situaciones en las que las restricciones se mantienen a pesar de las incertidum-bres.

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

x1

x 2

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

(a) (b)

Figura 8.7: Trayectorias del sistema en bucle cerrado con incertidumbres mınimas y maxi-mas.

En la figura 8.8 se muestra la evolucion del sistema en el caso (b) en el estadoproximo a la violacion de las restricciones.

0 5 10 15 20 25 30 350.1

0.15

0.2

x 1

0 5 10 15 20 25 30 35

−0.4

−0.2

0

x 2

0 5 10 15 20 25 30 35−1

0

1

2

3

muestras

u

Figura 8.8: Satisfaccion de las restricciones en la evolucion del sistema en bucle cerrado.

A continuacion se van a ilustrar ciertas propiedades del controlador propuesto.

Page 250: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

234 8.6. Ejemplos

Como se comento anteriormente, la restriccion

x(k + 1|k) ∈ Ω0 ∼ W

garantiza la estabilidad del sistema, pues fuerza al sistema a permanecer en el invarianterobusto. Sin embargo esta restriccion por sı sola puede no ofrecer un comportamientosatisfactorio, si se compara con el que tendrıa el controlador conmutando a la ley decontrol local. En la figura 8.9 se muestra la evolucion del sistema en bucle cerrado en elcaso de incertidumbres que decaen con el tiempo. La evolucion representada medianteuna lınea con puntos corresponde con la del sistema en bucle cerrado conmutando alcontrolador local lineal una vez ha alcanzado la region terminal. En lınea con crucesse muestra la evolucion del controlador optimo sin conmutar. En ambos casos no seanade al funcional la funcion de coste terminal y se considera Nc = 1.

Como se puede observar, el controlador local conduce el sistema al origen, mientrasel controlador optimo mantiene el sistema en el invariante pero de forma no deseable.Este efecto se debe a que la actuacion obtenida no es estabilizable asintoticamente,pues no se considera la ponderacion en el estado terminal. Si se anade esta, entonces elcontrolador MPC nominal es estabilizante en la region terminal y, dada la robustez in-herente del MPC, estabiliza asintoticamente al sistema con incertidumbres que decaen.Esto se muestra en la misma figura, en lınea con cırculos.

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

x1

x 2

Figura 8.9: Influencia del coste terminal en el sistema en bucle cerrado: lınea con pun-tos: MPC dual, lınea con cruces: MPC no dual, lınea con cırculos: MPC no dual con costeterminal.

En los ejemplos anteriores, el controlador estabiliza el sistema con un horizonte decontrol Nc = 1. Sin embargo, la consideracion de horizontes mayores mejora el de-sempeno y la optimalidad del controlador, a costa de un mayor coste computacional.

Page 251: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 8. MPC robusto basado en conjuntos invariantes robustos 235

En la figura 8.10 se muestra la evolucion del sistema incierto, considerando las incer-tidumbres maximas, para ciertos valores de los horizontes.

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x1

x 2

Figura 8.10: Influencia del horizonte de control y de prediccion sobre el sistema en buclecerrado

Los resultados obtenidos se resumen en la siguiente tabla:

Tipo de lınea Nc Np JMPC

puntos 1 1 60.38cruces 3 3 52.61cırculos 3 10 45.91

siendo JMPC el coste de la trayectoria en bucle cerrado.

Como se puede observar, la estabilidad de la evolucion del sistema esta siempregarantizada, sin embargo, el incremento de los horizontes de prediccion mejoran el de-sempeno del sistema, a pesar de que las incertidumbres no se consideran en el funcionala optimizar. Esto se puede comprobar observando el coste asociado a la evolucion delsistema en bucle cerrado JMPC para cada uno de los casos.

La incorporacion de la restriccion terminal tambien mejora el desempeno del sis-tema en bucle cerrado, pero para ello los horizontes deben ser tales que garanticen lafactibilidad inicial del sistema.

Page 252: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

236 8.7. Conclusiones

8.7. Conclusiones

En este capıtulo se ha abordado el control predictivo robusto en bucle cerrado. Apartir de un ejemplo ilustrativo se pone de manifiesto que la necesidad de la formulaciondel controlador en bucle cerrado esta basicamente motivada por la perdida de dominiode atraccion de los controladores en bucle abierto. Este problema se debe a la formaen la que se realiza la prediccion: sin considerar la realimentacion del sistema. Ası,considerando como variables de decision leyes de control, en vez de actuaciones, seformula el MPC en bucle cerrado.

A continuacion se analiza la estabilidad de los controladores en bucle cerrado desdela programacion dinamica. A partir de esta, se demuestra la estabilidad del MPCmin-max en bucle cerrado para incertidumbres que decaen con el estado, siguiendola demostracion de (Mayne 2001). Este analisis se extiende al caso de sistemas conincertidumbres acotadas incorporando el concepto de estabilidad entrada a estado, locual es un resultado novedoso.

Este analisis sirve ademas de base para probar que la estabilidad robusta del contro-lador se puede transformar en una restriccion estabilizante. Por tanto, la factibilidad dedicha restriccion garantiza la estabilidad robusta. Esto permite volver a la formulacionen bucle abierto, a costa de un peor desempeno.

La restriccion estabilizante se basa en la determinacion del conjunto estabilizablerobusto en i pasos, lo cual es practicamente imposible salvo en sistemas lineales conincertidumbres aditivas o politopicas (Kerrigan 2000). Por ello, se propone un contro-lador MPC robusto basado en una secuencia de invariantes robustos de control, massencilla de calcular. Este controlador garantiza estabilidad robusta con las ventajas delbucle abierto y las del bucle cerrado: permite reducir el conservadurismo del contro-lador sin apenas incremento del coste computacional en lınea. El dominio de atracciondel controlador propuesto puede llegar a ser igual que el de la formulacion en buclecerrado, y el controlador presenta unas caracterısticas interesantes, como que estabilizapara todo horizonte de control Nc ≥ 1, entre otras.

Este controlador es uno de los controladores MPC originales propuestos en estatesis.

Page 253: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 9

Conclusiones y futuras lıneas deinvestigacion

9.1. Conclusiones y aportaciones originales

En esta tesis se ha abordado el analisis y el diseno de controladores MPC parasistemas no lineales sujetos a restricciones. Todo ello se ha llevado a cabo siguiendoun hilo argumental: la garantıa de estabilidad del sistema controlado. La teorıa deLyapunov y la teorıa de conjuntos invariantes han sido el soporte teorico del analisis,ası como de las pruebas de estabilidad realizadas a lo largo de la tesis.

El desarrollo de la tesis se puede distinguir en tres partes diferenciadas: comienzacon el analisis y diseno de nuevos controladores MPC que garantizan la estabilidad enausencia de incertidumbres. A continuacion se analiza la robustez de los controladoresMPC nominales, incorporando un nuevo enfoque: la estabilidad entrada a estado. Latercera y ultima parte constituye el diseno de nuevos controladores robustos que garan-tizan la estabilidad en presencia de incertidumbres, tanto en la formulacion en bucleabierto como en bucle cerrado. A continuacion se detallan las aportaciones realizadasen esta tesis en cada una de las tres partes citadas:

Diseno de controladores con estabilidad garantizada :

Partiendo del analisis de estabilidad de la formulacion general del MPC, se hanpropuesto dos controladores originales: El controlador MPC con horizonte deprediccion mayor que el de control, y el controlador MPC con coste terminalcuasi-infinito. El controlador con mayor horizonte de prediccion es una gene-ralizacion del trabajo previo (Magni, De Nicolao, Magnani & Scattolini 2001)

237

Page 254: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

238 9.1. Conclusiones y aportaciones originales

a la formulacion general del MPC. Este controlador soluciona problemas de laformulacion original, conserva sus propiedades y anade otras nuevas que este notenıa. Por otro lado, el controlador con coste cuasi-infinito surge como solucion alos problemas que presenta el controlador propuesto en (De Nicolao et al. 1998).Se ha analizado ademas el desempeno de estos controladores, demostrandose quelo mejoran sin un incremento apreciable del coste computacional del controlador.

Con el objetivo de mejorar la implementacion de los controladores MPC, se anali-zan la suboptimalidad de las soluciones y la eliminacion de la restriccion terminalen el problema de optimizacion. El analisis de la estabilidad del MPC suboptimose hace desde la perspectiva de la teorıa de conjuntos invariantes y se estable-cen condiciones mas suaves que las consideradas en (Scokaert et al. 1999, Mayneet al. 2000). Por otro lado, se establecen condiciones bajo las cuales se puede elim-inar la restriccion terminal del problema de optimizacion de los controladoresMPC, extendiendo resultados anteriores (Parisini & Zoppoli 1995, Jadbabaieet al. 2001) al MPC general. Ademas se ha caracterizado un dominio de atrac-cion de este controlador. Estos resultados, ası como los derivados del aumento deldominio de atraccion caracterizado ha dado lugar al artıculo (Limon Marruedoet al. 2003), que esta pendiente de revision.

A continuacion se analiza un aspecto importante de los controladores predictivos:el dominio de atraccion y medidas para aumentarlo. Se parte de un analisis deldominio de atraccion mediante la teorıa de conjuntos invariantes. Tambien se de-muestra utilizando la teorıa de conjuntos invariantes que todo estado estabilizablepuede ser estabilizado por un controlador MPC con horizonte finito.

A la luz de este analisis se proponen procedimientos de sintonizacion y nuevoscontroladores MPC orientados a aumentar el dominio de atraccion del contro-lador MPC general. Se demuestra que la ponderacion del coste terminal o bien laincorporacion del coste cuasi-infinito pueden aumentar el dominio de atraccion.Por otro lado, los nuevos controladores propuestos se basan en la consideracion deuna region terminal contractiva: uno contrayendo un conjunto invariante positivoy otro basado en una secuencia de invariantes de control. Este ultimo controladorha sido publicado en (Limon Marruedo, Alamo & Camacho 2002a).

Por ultimo, se proponen medidas para aumentar el dominio de atraccion delcontrolador sin restriccion terminal: partiendo de la region caracterizada anteri-ormente, se muestran procedimientos para aumentarlo, entre los que destacan:la ponderacion del coste terminal y la consideracion de un mayor horizonte deprediccion.

Analisis de la robustez de los controladores MPC :

La garantıa de estabilidad de los controladores MPC esta basada en la ausenciade incertidumbres, hipotesis que es una idealizacion, pues todo sistema dinamicodiscrepa en mayor o menor medida, del modelo que lo describe. Por lo tanto, esimprescindible realizar un analisis del grado de incertidumbres del sistema que escapaz de soportar los controladores predictivos garantizando la estabilidad. Este

Page 255: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 9. Conclusiones y futuras lıneas de investigacion 239

analisis se debe realizar desde dos aspectos: la convergencia y la satisfaccion delas restricciones.

Partiendo de la teorıa de Lyapunov, se analiza la estabilidad robusta de con-troladores MPC aplicados sobre sistemas con incertidumbres aditivas acotadas.Este estudio es una generalizacion de (Scokaert et al. 1997) y ha sido publicadoen (Limon Marruedo, Alamo & Camacho 2002c). Este analisis se extiende incor-porando el concepto de estabilidad entrada a estado, no utilizado anteriormenteen este contexto. De este analisis se infiere un resultado interesante: la suavidaddel coste optimo garantiza la robustez del controlador.

La satisfaccion de las restricciones esta ıntimamente unida con el concepto deinvariancia robusta. Por ello su analisis se hace incorporando conceptos de lateorıa de conjuntos invariantes robustos.

Por ultimo, basandose en el analisis de continuidad del coste optimo realizado enel apendice C, se demuestra que el controlador MPC sin restriccion terminal esrobusto, pues esta garantizada la suavidad del coste optimo.

Diseno de controladores MPC robustos :

Del analisis anterior se pone de manifiesto que la suavidad del coste optimo escondicion suficiente para garantizar la estabilidad entrada estado del controlador,y por lo tanto su robustez. Sin embargo, la funcion de coste de un controladorpredictivo no tiene por que ser suave.

Basandose en la acotacion del efecto de las incertidumbres sobre el sistema, sepropone un controlador MPC que garantiza la satisfaccion robusta de las restric-ciones y ademas la estabilidad entrada a estado bajo condiciones de suavidad delmodelo y de las funciones implicadas en el problema de optimizacion. Estos resul-tados estan en periodo de revision (Limon Marruedo, Alamo & Camacho 2002b).

Un problema asociado a la acotacion del efecto de las incertidumbres necesariapara la robustez es su conservadurismo, derivado en parte del caracter globalde esta. Para mitigar este efecto, se propone el concepto de region de evolucionincierta. Estas regiones son acotaciones del efecto de las incertidumbres que secalculan en lınea por algun procedimiento adecuado, como puede ser el algebraintervalar. De esta forma se propone un nuevo controlador MPC que incorporaen su formulacion estas regiones. Este controlador se formula como controladordual y no dual. La estabilidad robusta y la satisfaccion de las restricciones estangarantizadas bajo la factibilidad del problema. Estos resultados han dado lugara la publicacion (Limon Marruedo, Bravo, Alamo & Camacho 2002).

Los controladores robustos propuestos anteriormente se engloban dentro de losdenominados, controladores MPC en bucle abierto, pues no consideran el efectode la realimentacion del sistema sobre la prediccion del comportamiento futuro delsistema. Esto hace que puedan incurrir en un alto grado de conservadurismo, porlo que se han propuesto en la literatura los denominados controladores MPC enbucle cerrado. Por ello se hace un analisis de la estabilidad de estos controladores

Page 256: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

240 9.2. Futuras lıneas de investigacion

en su formulacion min-max basado en (Mayne 2001). Este estudio se ha extendido,estableciendo condiciones para garantizar la estabilidad entrada a estado de loscontroladores min-max cuando el sistema presenta incertidumbres acotadas.

Estos controladores, si bien resultan menos conservadores, su implementacion estan costosa que no resultan practicos (por ahora). Como una posible solucion aeste problema se propone un nuevo controlador hıbrido entre la formulacion enbucle abierto y la formulacion en bucle cerrado. Para ello se analiza el origen dela estabilidad robusta de los controladores en bucle cerrado a la luz de la teorıade conjuntos invariantes y se demuestra que se puede convertir en una restriccionestabilizante a imponer sobre un controlador MPC estandar. De esta forma seconserva la facilidad de implementacion del bucle abierto, manteniendo el mismodominio de atraccion del controlador en bucle cerrado.

Esta restriccion estabilizante se basa en el conjunto estabilizable robusto, el cuales difıcil de calcular con exactitud salvo para el caso de sistemas lineales conincertidumbres aditivas o politopicas. Por ello se propone un nuevo controladorMPC con una restriccion estabilizante basada en el calculo de una secuencia deinvariantes robustos de control, mas sencilla de obtener.

Es importante resaltar que todo el analisis llevado a cabo en esta tesis se basa en lateorıa de Lyapunov conjugada con la teorıa de conjuntos invariantes. El enfoque de laestabilidad de sistemas no lineales con restricciones a la luz de ambas teorıas permitenuna comprension profunda del problema y dan una amplia perspectiva en el analisis y enel diseno de controladores predictivos. Por ello se ha tratado de recoger en el apendice Aun conjunto de resultados sobre la estabilidad de sistemas no lineales discretos sujetosa restricciones. Para ello se han desarrollado algunos resultados (Vidyasagar 1993) yse han extendido otros, como los relativos a las funciones de control de Lyapunov.

En el apendice C se muestra un estudio de la continuidad del coste optimo basadoen el analisis de sensibilidad del problema de optimizacion, propiedad interesante parala robustez del controlador.

9.2. Futuras lıneas de investigacion

Las caracterısticas del control predictivo y el rapido avance que se ha experimen-tado recientemente en aspectos teoricos como estabilidad y robustez, hacen que estaestrategia tenga un futuro prometedor. Sin embargo, quedan temas abiertos en los quetrabajar, principalmente orientados a la implementacion.

En esta tesis se ha estudiado con profundidad la estabilidad y robustez de loscontroladores predictivos y se han adquirido conocimientos que serviran de base para

Page 257: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Capıtulo 9. Conclusiones y futuras lıneas de investigacion 241

el analisis de aspectos del control predictivo no abordados en la misma o bien que hanquedado abiertos. Entre ellos se pueden destacar:

La implementacion de los controladores propuestos y analizados en esta tesis.Para ello, se esta disenando una planta de laboratorio formada por 4 depositosinterconectados y dotada de instrumentacion industrial. Esta planta esta orien-tada principalmente a la utilizacion de controladores predictivos no lineales enespacio de estados y permite ser configurada para explotar distintos aspectos co-mo son: control multivariable, presencia de ceros de transmision, incorporacionde senales logicas, posibilidad de subactuacion y sobreactuacion sobre el sistema.

Implementaciones de controladores MPC rapidos como son controladores sin res-triccion terminal, suboptimos y con restricciones blandas en los estados. Para ellose pueden utilizar algoritmos de optimizacion no lineal como son los algoritmosgeneticos, que se han probado en aplicaciones de control predictivo de robotsmoviles con bastante exito.

Estudiar y analizar la formulacion del control predictivo para seguimiento dereferencias. Esto conlleva dos aspectos distintos: la formulacion del controladoren entrada-salida (con la posible incorporacion de observadores) y la estabilidady satisfaccion de restricciones ante cambios en la referencia.

La incorporacion de invariantes de control en el diseno de controladores pre-dictivos es, a juicio del autor, una idea prometedora, pues permite incorporarconocimiento del sistema sobre el que se va aplicar el controlador en la propiaformulacion del mismo. El procedimiento de calculo de estos conjuntos es geo-metrico y se basa en la determinacion del conjunto a un paso Q(·). En el casode sistemas no lineales, interesa trabajar en procedimientos que mejoren los pro-puestos en esta tesis para el calculo de estos de una forma aproximada.

Consideracion de incertidumbres estructuradas en el analisis de robustez de loscontroladores.

Estudio de la formulacion simultanea del controlador: la ruptura de la composi-cion sucesiva que conlleva esta formulacion, mejora el condicionamiento del pro-blema y permite explotar propiedades como afinidad del modelo con respecto alos parametros.

Page 258: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

242 9.2. Futuras lıneas de investigacion

Page 259: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A

Estabilidad y robustez de sistemasno lineales en tiempo discreto

A.1. Introduccion

Esta tesis se centra en el analisis y el diseno de controladores predictivos de sistemasno lineales en tiempo discreto sujetos a restricciones. En esta se contemplan tantosistemas sin incertidumbres como sistemas inciertos y todo ello con un nexo de union:la garantıa de estabilidad.

Ya sea por la naturaleza no lineal del modelo del sistema o por la presencia derestricciones, los sistemas que se estudian son no lineales. La teorıa de Lyapunov pro-porciona un marco adecuado para el analisis de la estabilidad de sistemas no linealesautonomos. De hecho, el analisis de la estabilidad de los controladores predictivos sesuele realizar mediante esta teorıa (Mayne et al. 2000).

La teorıa de Lyapunov se extiende a sistemas no autonomos gracias a la denominadafuncion de Lyapunov de control (CLF 1). En este apendice se presenta una recopilacionde esta teorıa formulada para el caso de sistemas en tiempo discreto.

Intimamente relacionada con esta teorıa esta el concepto invariancia positiva deun conjunto en relacion a un sistema autonomo (en bucle cerrado, por ejemplo). Esteconcepto se extiende a sistemas no autonomos incorporando el concepto de invarianciade control, alrededor del cual se desarrolla la teorıa de conjuntos invariantes. Estateorıa da soporte al analisis de regiones estabilizables, dominios de atraccion, etc. y es

1Acronimo del termino ingles Control Lyapunov Function.

243

Page 260: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

244 A.2. Estabilidad de sistemas no lineales en tiempo discreto

de suma utilidad en el analisis de sistemas con restricciones. Esta teorıa, ademas de seruna potente herramienta de analisis, puede ser utilizada en la sıntesis de controladores.Todo ello hace de la teorıa de conjuntos invariantes un campo que, a juicio del autor, vaa tener un protagonismo cada vez mayor en el area del control. Como referencia tomeseel artıculo, (Mayne 2001), que resume la sesion plenaria del ECC del ano 2000, en lacual D. Q. Mayne hace un enfoque de la estabilidad y robustez del MPC introduciendoconceptos de la teorıa de conjuntos invariantes.

En este apendice se presenta ademas un balance de resultados en el campo de lateorıa de conjuntos invariantes de sistemas en tiempo discreto. Entre las publicacionesdentro de esta teorıa cabe destacar (Blanchini 1999), en el que se presentan resultadosen este campo, y los trabajos de E. C. Kerrigan (Kerrigan & Maciejowski 2000, Kerrigan2000) en los que se hace un balance de esta teorıa con una notacion y nomenclaturamuy consistente, que es la que se ha adoptado en esta tesis.

En el caso de que los sistemas presenten incertidumbres, la teorıa de Lyapunovse extiende de una manera natural a la denominada estabilidad entrada a estado.Esta teorıa ofrece un marco teorico para el analisis de estos sistemas, dentro del cualse enmarcan el analisis y diseno de controladores predictivos para sistemas inciertosdesarrollados en esta tesis. Junto a esta se extiende tambien el concepto de invarianciarobusta, que se desarrolla en la teorıa de conjuntos invariantes robustos.

A.2. Estabilidad de sistemas no lineales en tiempo

discreto

Sea un sistema dinamico autonomo en tiempo discreto dado por

xk+1 = F (xk)

siendo xk ∈ IRn el estado del sistema en el instante k y la funcion F : IRn 7→ IRn unafuncion continua. En lo que sigue se va a considerar siempre que k es un numero enterono negativo, es decir, que el tiempo discurre hacia delante.

Un estado xo se dice que es un punto de equilibrio del sistema (tambien denominadopunto fijo) si

xo = F (xo)

es decir, si el sistema, una vez que alcanza ese estado, permanece en el.

En adelante, y sin perdida de generalidad, se considera que el origen es un puntode equilibrio del sistema2.

2Basta con hacer el cambio de variables z = x− xo para trasladar el punto de equilibrio al origen.

Page 261: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 245

A.2.1. Definiciones previas

Antes de introducir el concepto de estabilidad, se va a definir un tipo de funcionesmuy utiles en la teorıa de estabilidad (Khalil 1996, Vidyasagar 1993).

Definicion A.1 (Funciones K , K∞ y KL )

Una funcion α : IR+ 7→ IR+ se dice que es una funcion K si:

• Es una funcion continua.

• Es estrictamente creciente, es decir: si a > b, entonces α(a) > α(b).

• α(0) = 0.

Una funcion α : IR+ 7→ IR+ se dice que es una funcion K∞ si es una funcionK y ademas

• α(a) →∞ cuando a →∞.

Una funcion β : IR+ × IR+ 7→ IR+ se dice que es una funcion KL si

• La funcion β(a, k) es una funcion K en a para todo k ≥ 0 fijo.

• La funcion β(a, k) es decreciente en k para todo a ≥ 0 fijo, de forma queβ(a, k) → 0 cuando k →∞.

Estas funciones tienen una serie de propiedades muy utiles. A continuacion se pre-senta una recopilacion de algunas de ellas.

Propiedad A.2 (Propiedades de las funciones K , K∞ y KL )

(i) Sean α1(·) y α2(·) funciones K definidas en [0, a).

(ii) Sean α3(·) y α4(·) funciones K∞ .

(iii) Sea β(·, ·) una funcion KL .

Entonces:

Notese que esto hace que la funcion que describe el sistema pueda depender del punto de equilibrio,variando esta si dicho punto cambia.

Page 262: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

246 A.2. Estabilidad de sistemas no lineales en tiempo discreto

La funcion inversa α−11 (·) es una funcion K definida en [0, α1(a)).

La funcion inversa α−13 (·) es una funcion K∞ .

La composicion de dos funciones K , α1 α2, es una funcion K .

La composicion de dos funciones K∞ , α3 α4, es una funcion K∞ .

La composicion de una funcion K con una KL , α1 β, es una funcion KL .

La funcion α5(s) = max(α1(s), α2(s)) es una funcion K .

Dada una funcion K∞ , α3(·), existe una funcion K∞ ,α6(·), asociada tal que

• α6(s) ≤ α3(s) para todo s ≥ 0.

• La funcion α7(s) = s − α6(s) es una funcion K , es decir α6(s) < s paratodo s > 0.

Tambien resulta de interes introducir el concepto de funcion definida positiva

Definicion A.3 (Funcion definida positiva) Una funcion V : IRn 7→ IR+ se diceque es (localmente) definida positiva si existe una funcion K , α(·) tal que

α(‖x‖) ≤ V (x)

para todo x ∈ Br = x ∈ IRn : ‖x‖ ≤ r.

Si esta condicion se extiende a IRn, entonces se denomina globalmente definidapositiva.

Si la funcion V (·) es globalmente definida positiva y ademas existe una funcion α(·)que es K∞ , entonces se dice que es radialmente no acotada. En este caso se verificaque V (x) →∞ cuando ‖x‖ → ∞.

Lema A.4 (Khalil 1996) Sea una funcion V : IRn 7→ IR+ continua y definida positivaen Br, entonces existe una funcion K γ(·) definida en [0, r] tal que

V (x) ≤ γ(‖x‖)

para todo x ∈ Br.

Si ademas V (·) es radialmente no acotada, entonces γ(·) puede ser K∞ .

Page 263: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 247

A.2.2. Estabilidad de un sistema

A continuacion se definen los conceptos de estabilidad de un sistema en el origen(Vidyasagar 1993).

Definicion A.5 (Estabilidad) Un sistema xk+1 = F (xk) se dice que es estable en elorigen (o bien que el origen es un punto de equilibrio estable) si para todo δ > 0 existeuna constante ε = ε(δ) tal que

∀x0 : ‖x0‖ ≤ ε ⇒ ‖xk‖ ≤ δ ∀ k ≥ 0

En consecuencia un sistema es estable si para una cota del sistema dada δ existeuna vecindad del origen tal que si el sistema parte de ella, este evoluciona acotado porδ. Esta condicion esta relacionada con cierta robustez del sistema en torno al puntode equilibrio, pues garantiza que una variacion pequena de la cota del estado inicial,supone una variacion pequena de la cota en la evolucion del sistema.

Definicion A.6 (Estabilidad asintotica) Un sistema xk+1 = F (xk) se dice que esasintoticamente estable en el origen si es estable y ademas existe una constante ε > 0tal que

∀ x0 : ‖x0‖ ≤ ε ⇒ xk → 0 cuando k →∞o lo que es equivalente, que existe una funcion KL β(·, ·) tal que

‖xk‖ ≤ β(‖x0‖, k)

para todo k ≥ 0 y para todo x0 tal que ‖x0‖ ≤ ε.

La definicion de estabilidad asintotica consta de dos partes: que el sistema seaestable y ademas que tienda asintoticamente al origen. Puede caber la duda de si latendencia del sistema al origen implica que el sistema sea estable. Sin embargo no esası, pues puede existir un sistema tal que para una vecindad del origen arbitrariamentepequena, existen estados tales que si el sistema parte de ellos, este evoluciona saliendosede esta vecindad, para posteriormente tender al origen asintoticamente. Por lo tanto, elsistema no es estable pero sı tiende al origen asintoticamente. Para mas detalles, veasela discusion sobre el tema y su ejemplo de la pagina 141 de (Vidyasagar 1993).

Definicion A.7 (Estabilidad exponencial) Un sistema xk+1 = F (xk) se dice quees exponencialmente estable en el origen si es asintoticamente estable y ademas existenunas constantes ε > 0, a > 0 y λ ∈ [0, 1) tal que

‖xk‖ ≤ a·‖x0‖·λk

para todo k ≥ 0 y para todo x0 tal que ‖x0‖ ≤ ε.

Page 264: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

248 A.2. Estabilidad de sistemas no lineales en tiempo discreto

Como se puede observar, la diferencia entre estabilidad asintotica y exponencial,es la existencia de una funcion KL que acota el sistema tal que tiene una expresionexponencial

β(‖x0‖, k) = a·‖x0‖·λk

Todas las definiciones de estabilidad anteriormente presentadas se formulan parauna vecindad del origen Bε = x ∈ IRn : ‖x‖ ≤ ε. Se dice en ese caso que el sistemaes estable localmente. En el caso en el que dichas definiciones se puedan extender atodo IRn entonces se dice que el sistema es globalmente estable.

A.2.3. Teorıa de Lyapunov

Esta teorıa establece condiciones suficientes para garantizar la estabilidad de unsistema y esta basada en la existencia de una funcion del estado definida positivaasociada al sistema denominada funcion de Lyapunov. Bajo ciertas hipotesis sobreesta funcion se puede demostrar estabilidad, estabilidad asintotica o exponencial. Ası,existe un teorema de estabilidad de Lyapunov asociado a cada tipo de estabilidad(Vidyasagar 1993).

Antes de establecer los teoremas de estabilidad resulta util la siguiente definicion:

Definicion A.8 Sea una funcion V : IRn 7→ IR+ asociada a un sistema dinamico

xk+1 = F (xk)

siendo xk ∈ IRn el estado del sistema en el instante k. Entonces se define

∆V (x) = V (F (x))− V (x)

Teorema A.9 (Estabilidad)

(i) Sea un sistema dinamico en tiempo discreto dado por

xk+1 = F (xk)

siendo xk ∈ IRn el estado del sistema en el instante k y tal que el origen es unpunto de equilibrio.

(ii) Sea una funcion V : IRn 7→ IR+ definida positiva tal que

Page 265: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 249

Existen dos funciones K α1(·) y α2(·) tales que

α1(‖x‖) ≤ V (x) ≤ α2(‖x‖)

Satisface la condicion∆V (x) ≤ 0

para todo x ∈ Br3.

Entonces el origen es un punto de equilibrio estable del sistema. Si estas condicionesse extienden a IRn entonces es globalmente estable4.

A la funcion V (x) definida positiva que satisface las condiciones de este teorema sedenomina funcion de Lyapunov asociada al sistema xk+1 = F (xk). Ası, el teorema an-terior se puede reescribir como: un sistema es estable si tiene una funcion de Lyapunovasociada.

Por el lema A.4, la condicion

V (x) ≤ α2(‖x‖)

se satisface si la funcion definida positiva V (x) es continua.

La estabilidad de Lyapunov esta ıntimamente ligada al concepto de invarianciapositiva.

Definicion A.10 (Conjunto invariante positivo) Un conjunto Ω ⊂ IRn se diceque es un conjunto invariante positivo, si para todo x0 ∈ Ω, la evolucion del sistema estal que xk ∈ Ω para todo k ≥ 0.

Por tanto, si un sistema en su evolucion alcanza un invariante positivo, entonces laevolucion del sistema permanecera en dicho conjunto.

La estabilidad de Lyapunov se deriva del hecho que ∆V (x) es negativa, y por lotanto la secuencia de valores V (xk) es decreciente en toda trayectoria que no salga deBr, por lo que V (xk) ≤ V (x0) para todo k. Se puede comprobar que todo conjunto

Ω = x ∈ IRn : V (x) ≤ µ3En adelante se denotara Br como la vecindad del origen x ∈ IRn : ‖x‖ ≤ r.4En lo que sigue, la estabilidad se considera local, es decir, en una vecindad del origen, salvo que

se indique lo contrario.

Page 266: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

250 A.2. Estabilidad de sistemas no lineales en tiempo discreto

siendo µ ≤ α1(r), es un conjunto contenido en Br, pues para todo x ∈ Ω,

α1(‖x‖) ≤ V (x) ≤ µ ≤ α1(r)

y por lo tanto ‖x‖ ≤ r. En consecuencia, Ω ⊆ Br es invariante positivo del sistema,pues para todo x0 tal que V (x0) ≤ µ ≤ α1(r), se tiene que V (xk) ≤ V (x0) ≤ µ ≤ α1(r),por lo que xk ∈ Ω.

Para demostrar la estabilidad hay que probar que para toda cota de la evoluciondel sistema δ ≤ r, existe un ε(δ) tal que para todo x0 ∈ Bε, resulta que xk ∈ Bδ. Estose puede demostrar tomando ε = α−1

2 (α1(δ)). Ası, para todo x0 ∈ Bε se tiene que

V (x0) ≤ α2(‖x0‖) ≤ α2(ε) = α1(δ) ≤ α1(r)

por lo que Ω, con µ = α1(δ), es un invariante positivo contenido en Br y que contieneBε. En consecuencia

α1(‖xk‖) ≤ V (xk) ≤ V (x0) ≤ α1(δ)

y por lo tanto xk ∈ Bδ, lo que demuestra la estabilidad. Notese que la estabilidad sebasa en la acotacion superior de la funcion de Lyapunov por una funcion K , lo quegarantiza la existencia de la vecindad Bε contenida en el invariante Ω. Esta es unacondicion blanda, pues, en virtud del lema A.4, se satisface si la funcion de Lyapunoves continua en una vecindad del origen.

Es importante resaltar que si la condicion

∆V (x) ≤ 0

se satisface en un conjunto Φ que es un invariante positivo del sistema, entoncesV (xk) ≤ V (x0) para todo x0 perteneciente al invariante, pues la trayectoria esta con-tenida en Φ para todo k. Por tanto el sistema es estable en Φ.

Teorema A.11 (Estabilidad asintotica)

(i) Sea un sistema dinamico en tiempo discreto dado por

xk+1 = F (xk)

siendo xk ∈ IRn el estado del sistema en el instante k y tal que el origen es unpunto de equilibrio.

(ii) Sea una funcion V : IRn 7→ IR+ definida positiva tal que

Existen dos funciones K , α1(·) y α2(·), tales que

α1(‖x‖) ≤ V (x) ≤ α2(‖x‖)

Page 267: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 251

Existe una funcion K , α3(·), tal que

∆V (x) ≤ −α3(‖x‖)

para todo x ∈ Br.

Entonces el origen es un punto de equilibrio asintoticamente estable del sistema. Si estascondiciones se extienden a IRn y la funcion de Lyapunov es radialmente no acotada,entonces es globalmente asintoticamente estable.

El sistema es estable, pues se satisface el teorema de estabilidad. Por otro lado, lacondicion de que ∆V (x) sea estrictamente decreciente excepto en el origen, hace quela secuencia V (xk) sea estrictamente decreciente en todo estado de la trayectoria, salvoen el origen, para todo x0 perteneciente al conjunto invariante positivo

Ω = x ∈ IRn : V (x) ≤ α1(r) ⊆ Br

Dado que la secuencia de valores V (xk) es definida positiva y estrictamente decre-ciente para todo x 6= 0, entonces, V (xk) tiende a 0, cuando k →∞ pues de lo contrario,V (x) → −∞ lo cual es una contradiccion con el caracter definido positivo de V (·). Porlo tanto xk → 0.

Si la condicion

∆V (x) ≤ −α3(‖x‖)se satisface en un conjunto invariante positivo Φ, entonces el sistema es asintoticamenteestable para todo x0 ∈ Φ.

Teorema A.12 (Estabilidad exponencial)

(i) Sea un sistema dinamico en tiempo discreto dado por

xk+1 = F (xk)

siendo xk ∈ IRn el estado del sistema en el instante k y tal que el origen es unpunto de equilibrio.

(ii) Sea una funcion V : IRn 7→ IR+ definida positiva tal que

Page 268: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

252 A.2. Estabilidad de sistemas no lineales en tiempo discreto

Existen unas constantes a > 0, b > 0 y σ > 0 5 tales que

a·‖x‖σ ≤ V (x) ≤ b·‖x‖σ

Existe una constante c > 0 tal que

∆V (x) ≤ −c·‖x‖σ

para todo x ∈ Br.

Entonces el origen es un punto de equilibrio exponencialmente estable del sistema. Siestas condiciones se extienden a IRn entonces es globalmente exponencialmente estable.

En este caso la estabilidad asintotica se deriva del teorema anterior, pues una funciondel tipo a·‖x‖σ es una funcion K . Lo unico que hay que demostrar es que el estado sepuede acotar de la forma

‖xk‖ ≤ κ·‖x0‖·λk

siendo κ > 0 y λ < 1 .

Para ello basta comprobar que existe una constante ρ ∈ [0, 1) tal que

V (F (x)) ≤ ρ·V (x)

En efecto, haciendo

V (F (x)) ≤ V (x)− c·‖x‖σ = V (x)− c

b· b‖x‖σ ≤

(1− c

b

)·V (x) = ρ·V (x)

Para demostrar que ρ ∈ [0, 1), observese que

b·‖x‖σ ≥ V (x) ≥ V (x)− V (F (x)) ≥ c·‖x‖σ

por lo que que c ≤ b. Considerando ademas que b y c son constantes positivas, se tieneque 0 ≤ ρ = 1− c/b < 1. A partir de esta propiedad se deriva que

V (xk) ≤ ρk·V (x0) ≤ b·‖x0‖σ·ρk

Dado que a·‖xk‖σ ≤ V (xk), se tiene que

‖xk‖ ≤ κ·‖x0‖·λk

siendo

κ =

(b

a

) 1σ

λ = ρ1σ ∈ [0, 1)

5En (Vidyasagar 1993) se impone que σ > 1, sin embargo en (Scokaert et al. 1997) demuestra quebasta con considerar σ > 0. El teorema aquı presentado es una sıntesis de ambos resultados.

Page 269: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 253

Por ultimo, hay que comentar que, si bien estos teoremas establecen condicionessobre la funcion de Lyapunov que son suficientes para garantizar estabilidad, bajociertas condiciones estas condiciones son tambien necesarias. Estos son los denominadosteoremas inversos de Lyapunov (Khalil 1996, Vidyasagar 1993, Scokaert et al. 1997,Jiang & Wang 2002).

A.2.4. Estabilidad de sistemas con restricciones

Sea un sistemaxk+1 = F (xk)

cuyo estado esta sujeto a las restricciones dadas por

xk ∈ X

para todo k. Dado que el punto de equilibrio debe ser admisible, por lo que 0 ∈ X.

Este tipo de sistemas incluyen el caso de un sistema no autonomo

xk+1 = f(xk, uk)

controlado por la ley de control uk = h(xk), sujeto a restricciones en las actuacionesuk ∈ U y en los estados xk ∈ X. El sistema autonomo resultante de cerrar el bucle es

xk+1 = f(xk, h(xk))

sujeto a la restriccion

xk ∈ Xh = x ∈ X : h(x) ∈ U ⊆ X

El concepto de invariancia es esencial en el analisis de sistemas con restricciones. Enefecto, un sistema autonomo sujeto a restricciones evoluciona de una forma admisible(es decir cumpliendo las restricciones en todo k) si existe un conjunto invariante positivoΩ contenido en el conjunto de restricciones X. Por tanto, si x0 ∈ Ω ⊆ X, entonces, porser Ω un conjunto invariante positivo, se tiene que xk ∈ Ω ⊆ X para todo k y por lotanto la evolucion del sistema es admisible.

La teorıa de Lyapunov demuestra que si existe una funcion de Lyapunov V (x) talque

∆V (x) ≤ 0

para todo x ∈ X, entonces todo conjunto

Ω = x ∈ IRn : V (x) ≤ α

Page 270: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

254 A.2. Estabilidad de sistemas no lineales en tiempo discreto

contenido en X es un invariante positivo del sistema, y por lo tanto para todo estadoinicial x0 ∈ Ω el sistema satisface las restricciones. Si por el contrario, x0 ∈ X \ Ω,entonces la evolucion del sistema podrıa no ser admisible.

El conjunto de estados que satisfacen las restricciones serıa por lo tanto el maximoconjunto invariante asociado al sistema contenido en X, que no tiene por que ser X.

A.2.5. Generalizacion a sistemas no autonomos: funciones deLyapunov de control

Los resultados de la teorıa de Lyapunov permiten el analisis de estabilidad de sis-temas autonomos (que incluye a los sistemas no autonomos en bucle cerrado). Dadala generalidad de la teorıa de Lyapunov resulta muy interesante trasladar todos estosresultados al analisis de sistemas no autonomos. Esto se consigue gracias al concep-to de funcion de Lyapunov de control introducido por primera vez en (Arstein 1983)para sistemas continuos. En este trabajo se demuestra que la existencia de una CLFasociada a un sistema es equivalente a la existencia de un controlador asintoticamenteestabilizable. En (Sontag 1989b), se establece una ley de control general obtenida apartir de la CLF para sistemas afines en la actuacion. En esta seccion se traslada elconcepto de CLF a sistemas en tiempo discreto.

Sea un sistema no autonomo dado por

xk+1 = f(xk, uk)

siendo xk ∈ IRn el estado del sistema y uk ∈ IRm las actuaciones aplicadas sobre elsistema. Sea el origen un punto de equilibrio del sistema, por tanto f(0, 0) = 0.

Las entradas del sistema pueden estar restringidas a un conjunto compacto U quecontiene el origen, de forma que uk ∈ U en todo instante k.

El concepto de sistema estable definido para sistemas autonomos, se transforma enestabilizable para un sistema no autonomo. Un sistema es estabilizable si existe una leyde control tal que estabilice el sistema en bucle cerrado. Ası se generalizan las distintasnociones de estabilidad anteriormente definidas.

El concepto de conjunto invariante positivo asociado al caso autonomo se puedeextender al caso de sistemas no autonomos introduciendo el concepto de conjuntoinvariante de control.

Page 271: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 255

Definicion A.13 (Conjunto invariante de control) Un conjunto Ω ⊂ IRn se diceque es un conjunto invariante de control asociado a un sistema

xk+1 = f(xk, uk)

siendo xk ∈ IRn y uk ∈ IRm, si para todo x0 ∈ Ω, existe una ley de control uk = h(xk)tal que xk ∈ Ω para todo k ≥ 0 y ademas las actuaciones son admisibles uk = h(xk) ∈U .

El concepto de funcion de Lyapunov asociado a un sistema autonomo, se puede ex-tender para el caso de un sistema no autonomo en la denominada funcion de Lyapunovde control.

Definicion A.14 (Funcion de Lyapunov de Control) Una funcion V : IRn 7→IR+ se dice que es una funcion de Lyapunov de control asociada al sistema

xk+1 = f(xk, uk)

siendo xk ∈ IRn, uk ∈ U ⊂ IRm, si es definida positiva y satisface que

∆V (x) = mınu∈U

V (f(x, u))− V (x)

≤ 0

para todo x ∈ Br.

Notese que el problema de minimizacion implicado en una funcion de control deLyapunov no es difıcil de resolver, especialmente en el caso de sistemas afines en lasactuaciones o sistemas sin restricciones en las actuaciones.

La principal diferencia es que la funcion ∆V (x) se define en terminos de la actuacion,de forma que si se satisface

mınu∈U

V (f(x, u))− V (x)

≤ 0

entonces existe una actuacion admisible asociada a cada estado xk (es decir, una leyde control uk = h(xk) ∈ U) tal que la funcion V (xk+1) ≤ V (xk).

Por lo tanto si un sistema tiene una funcion de Lyapunov de control asociada,entonces el conjunto acotado V (x) ≤ α contenido en Br es un invariante de control delsistema y por lo tanto el sistema es estabilizable. Esto permite establecer el siguienteresultado:

Teorema A.15 Si un sistema no autonomo admite una funcion de Lyapunov de con-trol asociada al sistema en Br, entonces el sistema es estabilizable.

Page 272: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

256 A.2. Estabilidad de sistemas no lineales en tiempo discreto

Analogamente se establece el siguiente resultado:

Teorema A.16 Si un sistema no autonomo tiene asociada una funcion de Lyapunovde control tal que

∆V (x) = mınu∈U

V (f(x, u))− V (x)

≤ −α(‖x‖)

para todo x ∈ Br, siendo α(·) una funcion K , entonces el sistema es asintoticamenteestabilizable.

Si la condicion anterior se satisface en el conjunto Φ, entonces el sistema serıaasintoticamente estabilizable en una region Γ ⊆ Φ tal que para todo x ∈ Γ exceptoel origen, exista una actuacion admisible u ∈ U tal que satisfaga las dos condicionessiguientes:

(i) V (f(x, u))− V (x) < 0.

(ii) f(x, u) ∈ Γ.

es decir, en todos aquellos estados tales que la CLF garantiza convergencia, mantenien-do la evolucion del sistema en Γ. El conjunto Γ serıa por tanto un conjunto invariantede control.

A.2.5.1. Sistema sujeto a restricciones en el estado

Si el sistema no autonomo esta sujeto a restricciones en el estado del tipo xk ∈ X,entonces el sistema sera estabilizable si existe una ley de control admisible tal quela evolucion del sistema es admisible, es decir, si discurre en el conjunto X en todoinstante. Esta condicion esta relacionada con el concepto de invariancia de control, puesun sistema evoluciona de forma admisible si existe un conjunto invariante de controlincluido en X.

Por tanto, si el sistema tiene asociada una funcion de Lyapunov de control en X,entonces todo conjunto Γ ⊆ X tal que para todo x ∈ Γ excepto el origen, exista unaactuacion admisible u ∈ U tal que satisfaga las dos condiciones siguientes:

(i) V (f(x, u))− V (x) < 0.

(ii) f(x, u) ∈ Γ.

Page 273: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 257

es un conjunto invariante de control contenido en X en el que, ademas, la CLF esestrictamente decreciente (en todos los estados salvo el origen). Por lo tanto, para todox0 ∈ Γ, existe una ley de control admisible tal que estabiliza asintoticamente el sistemapermaneciendo su evolucion en Γ ⊆ X, y por lo tanto satisfaciendo las restricciones.

Notese que todo conjunto

Ω = x ∈ IRn : V (x) ≤ α

contenido en X es un invariante de control del sistema.

Como se puede comprobar, el concepto de la invariancia de control es esencial enel analisis de sistemas no autonomos sujetos a restricciones. Todos estos conceptos sedesarrollan y extienden en la llamada teorıa de conjuntos invariantes que se aborda enla proxima seccion.

A.3. Teorıa de conjuntos invariantes

Como se ha podido comprobar, los conceptos tales como conjunto invariante positivoo conjunto invariante de control son trascendentales en el analisis de la estabilidad de unsistema dinamico, especialmente cuando el sistema esta sujeto a restricciones. Alrededorde estos conceptos se ha formado toda una teorıa que los desarrolla, denominada teorıade conjuntos invariantes.

Existen numerosos trabajos en este campo (Bertsekas 1972, Keerthi & Gilbert 1987,Bitsoris 1988, Gilbert & Tan 1991), si bien, esta teorıa ha experimentado un nuevo augea raız de los trabajos de Blanchini y otros autores (Blanchini 1994, Kolmanovsky &Gilbert 1998, Kerrigan & Maciejowski 2000). En (Blanchini 1999) se presenta un com-pendio de resultados en este campo, tanto en el aspecto teorico como de su aplicacional control de sistemas.

En esta seccion se sigue la lınea y notacion utilizada en (Kerrigan & Maciejowski2000), artıculo en el que se hace un balance conciso de los principales resultados enesta teorıa y los aplica al analisis de la factibilidad del control predictivo.

En lo que sigue, las definiciones se van a centrar en el caso de sistemas no autonomos.La traslacion a sistemas autonomos, o bien a sistemas en bucle cerrado, es inmediata.

Sea pues un sistema no autonomo dado por

xk+1 = f(xk, uk)

Page 274: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

258 A.3. Teorıa de conjuntos invariantes

siendo xk ∈ IRn el estado del sistema y uk ∈ IRm las actuaciones aplicadas sobre elmismo. Sea el origen un punto de equilibrio del sistema, f(0, 0) = 0. Las entradas delsistema pueden estar restringidas a un conjunto compacto U ⊂ IRm y el estado delsistema a un conjunto compacto X ⊂ IRn, ambos contiendo el origen. Por tanto

uk ∈ U xk ∈ X

para todo k.

Si el sistema estuviese controlado por una ley de control u = h(x), entonces lasrestricciones se transforman en xk ∈ Xh = x ∈ X : h(x) ∈ U.

A partir del concepto de conjunto invariante de control (e invariante positivo), seextienden estos al analisis de la region en la que un sistema puede ser admisible oestabilizable. Para ello es necesaria la introduccion de un conjunto basico: el conjuntoa un paso.

Definicion A.17 (Conjunto a un paso) El conjunto a un paso del conjunto Ω, Q(Ω),es el conjunto de estados x para los cuales existe una actuacion admisible u ∈ U(que dependera del estado x) tal que el sistema alcanza el conjunto Ω en un solo pasof(x, u) ∈ Ω.

Q(Ω) = x ∈ IRn : ∃u(x) ∈ U tal que f(x, u) ∈ Ω

Esta definicion se puede extender a un sistema controlado por una ley de controlu = h(x) de la siguiente forma

Qh(Ω) = x ∈ IRn : h(x) ∈ U y f(x, h(x)) ∈ Ω

En oposicion al conjunto Q(·), esta el conjunto de alcance.

Definicion A.18 (Conjunto de alcance) El conjunto de alcance del conjunto Ω,R(Ω), es el conjunto de estados x a los cuales puede evolucionar el sistema partiendode Ω ante una actuacion admisible u ∈ U en un solo paso.

R(Ω) = z ∈ IRn : ∃x ∈ Ω, ∃u ∈ U tal que z = f(x, u)

A partir de la definicion de conjunto a un paso se puede establecer una condicionnecesaria y suficiente para garantizar la invariancia de un conjunto.

Page 275: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 259

Teorema A.19 (Condicion geometrica de invariancia)

Un conjunto Ω es un invariante de control si y solo si

Ω ⊆ Q(Ω)

Notese que esta condicion tiene una interpretacion geometrica, pues el conjuntoQ(Ω) es un conjunto que se calcula por procedimientos geometricos (que requiere latransformacion de un conjunto a traves de un mapa y proyeccion ortogonal del mismo) yuna vez obtenido, basta con comprobar si contiene al conjunto Ω. Esta interpretaciongeometrica de los conjuntos invariantes es muy util y es la base del calculo de losconjuntos relacionados con la teorıa de invariantes, que como se vera, estan todosbasados en el conjunto a un paso Q(·).

El conjunto a un paso satisface las siguientes propiedad de monotonıa:

Propiedad A.20 Sean dos conjuntos Ω1 ⊆ Ω2, entonces

Q(Ω1) ⊆ Q(Ω2)

A partir del conjunto a un paso, se pueden analizar propiedades del sistema, talescomo la region en la que este es controlable a una determinada region.

Definicion A.21 (Conjunto controlable en i pasos) El conjunto controlable en ipasos Ki(X, Ω) es el conjunto de estados para los cuales existe una secuencia de actua-ciones admisibles tal que conduce el sistema hasta el conjunto Ω ⊆ X en i pasos conuna trayectoria admisible.

Ki(X, Ω) = x0 ∈ X : para todo k = 0, · · · , i− 1,∃uk ∈ U tal que xk ∈ X, y xi ∈ Ω

El conjunto controlable a i pasos, Ki(X, Ω), nos indica los estados que puedenalcanzar un determinado conjunto en i pasos con una evolucion admisible medianteuna secuencia de actuaciones admisibles. Este conjunto depende del numero de pasosi y representa una secuencia de conjuntos que posee una serie de propiedades:

Propiedad A.22 La secuencia Ki(X, Ω) satisface las siguientes propiedades:

El calculo de la secuencia se puede obtener haciendo

Ki+1(X, Ω) = Q(Ki(X, Ω)) ∩X

con K0(X, Ω) = Ω.

Page 276: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

260 A.3. Teorıa de conjuntos invariantes

El conjunto Ki(X, Ω) no tiene por que estar incluido en Ki+1(X, Ω), salvo en elcaso en que el conjunto Ω sea un conjunto invariante de control. Ası, si x0 ∈Ki(X, Ω)\Ki+1(X, Ω), entonces el sistema puede llevarse a Ω en i pasos, pero noen i + 1.

El conjunto K∞(X, Ω) esta finitamente determinado si existe un ındice i tal queK∞(X, Ω) = Ki(X, Ω). Al menor ındice que satisface esta propiedad i∗ se denom-ina ındice de determinacion.

Si existe un ındice j tal que Ki+1(X, Ω) = Ki(X, Ω) para todo i ≥ j entoncesK∞(X, Ω) = Kj(X, Ω) y ademas el menor j que cumple esta propiedad es elındice de determinacion.

Este conjunto se puede extender a sistemas en bucle cerrado controlados por unaley de control u = h(x), dando lugar a

Khi (X, Ω) = x0 ∈ Xh : xk ∈ Xh, ∀k = 0, · · · , i− 1 y xi ∈ Ω

siendo Xh = x ∈ X : h(x) ∈ U.

Este conjunto satisface las propiedades anteriores y ademas

Khi+1(X, Ω) = Qh(Kh

i (X, Ω)) ∩X

A la luz de la secuencia de conjuntos controlables se pueden definir dos familias deconjuntos: la secuencia de conjuntos admisibles y la secuencia de conjuntos estabiliza-bles.

La secuencia de conjuntos admisibles esta relacionado con el conjunto de estadospara los cuales el sistema es capaz de evolucionar satisfaciendo las restricciones. Da-do que, como se puso de manifiesto anteriormente, la satisfaccion de las restriccionesesta muy relacionada con los invariantes de control, resulta interesante definir antes elsiguiente conjunto:

Definicion A.23 (Maximo conjunto invariante de control) El conjunto C∞(X)es el maximo conjunto invariante de control contenido en X si y solo si todo conjuntoinvariante de control Φ del sistema satisface que

Φ ⊆ C∞(X) ⊆ X

Ası, C∞(X) es el maximo conjunto en el cual existe una ley de control admisible talque el sistema puede satisfacer las restricciones en su evolucion. Por lo tanto

Ki(X, Ω) ⊆ C∞(X)

Page 277: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 261

para todo i, y para todo conjunto Ω ⊆ X.

El maximo conjunto invariante de control se deriva del denominado conjunto ad-misible.

Definicion A.24 (Conjunto admisible en i pasos) El conjunto admisible en i pa-sos Ci(X) es el conjunto de estados para los cuales existe una secuencia de actuacionesadmisibles tal que la evolucion del sistema permanece en el conjunto X durante los iinstantes siguientes.

Ci(X) = x0 ∈ X : para todo k = 0, · · · , i− 1, ∃uk ∈ U tal que xk+1 ∈ X

El conjunto Ci(X) representa una secuencia de conjuntos que posee una serie depropiedades:

Propiedad A.25 La secuencia Ci(X) satisface las siguientes propiedades:

El conjunto Ci(X) = Ki(X, X).

Ci+1(X) ⊆ Ci(X), es decir, si un estado es tal que existen i + 1 actuaciones ad-misibles que hacen la evolucion del sistema admisible, entonces, tambien satisfaceque es admisible en i pasos.

Si x0 ∈ X \ Ci(X), entonces no existe una ley de control admisible para la cualla evolucion del sistema sea admisible por i pasos o mas.

El conjunto C∞(X) es el maximo control invariante contenido en X, es decir, elconjunto de todos los estados para los cuales existe una ley de control admisibleque garantice la satisfaccion de las restricciones.

C∞(X) esta finitamente determinado si y solo si existe un ındice i∗ tal queCi+1(X) = Ci(X) para todo i ≥ i∗. Entonces Ci(X) = C∞(X).

Es importante resaltar que los conjuntos Ci(X) no son en general conjuntos inva-riantes de control, sin embargo esta secuencia de conjuntos tiende a un conjunto quesı es un conjunto invariante de control y ademas es el maximo contenido en X.

Tambien hay que hacer notar que el hecho de que en un determinado estado inicialx0 exista una trayectoria sea admisible, puede implicar estabilidad en el sentido BIBO(siempre que el conjunto invariante de control maximo sea una conjunto acotado), perono quiere decir que el sistema sea asintoticamente estabilizable.

Page 278: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

262 A.3. Teorıa de conjuntos invariantes

El concepto de sistema estabilizable se refiere a la capacidad que tiene un sistemade evolucionar en cierto un numero de pasos hasta un conjunto en el cual, una vezalcanzado, la evolucion del sistema queda confinada. Esta propiedad viene caracterizadaen el denominado conjunto estabilizable en i pasos.

Definicion A.26 (Conjunto estabilizable en i pasos) El conjunto estabilizable eni pasos al conjunto invariante (positivo o de control) Ω ⊆ X es el conjunto de estadosSi(X, Ω) para los cuales existe una secuencia de actuaciones admisibles tal que conduceel sistema hasta el conjunto Ω en i pasos con una trayectoria admisible.

Si(X, Ω) = x0 ∈ X : para todo k = 0, · · · , i− 1,∃uk ∈ U tal que xk ∈ X, y xi ∈ Ω

Como se puede observar, la unica diferencia entre el conjunto estabilizable Si(X, Ω)y controlable Ki(X, Ω) es la condicion de que el conjunto Ω debe ser un conjuntoinvariante. Este hecho confiere una serie de propiedades adicionales a los conjuntosestabilizables, propiedades que se presentan a continuacion y que son extensamenteutilizadas a lo largo de esta tesis.

Propiedad A.27 La secuencia Si(X, Ω) satisface las siguientes propiedades:

El calculo de la secuencia se puede obtener haciendo

Si+1(X, Ω) = Q(Si(X, Ω)) ∩X

con S0(X, Ω) = Ω.

Si(X, Ω) ⊆ Si+1(X, Ω).

Todo conjunto Si(X, Ω) es un conjunto invariante de control.

Sean dos conjuntos invariantes de control Ω1 y Ω2 tales que Ω1 ⊆ Ω2, entoncesSi(X, Ω1) ⊆ Si(X, Ω2).

Si(X,Sj(X, Ω)) = Si+j(X, Ω).

El conjunto S∞(X, Ω) esta finitamente determinado si y solo si existe un ındicei∗ tal que Si+1(X, Ω) = Si(X, Ω) para todo i ≥ i∗. Ademas S∞(X, Ω) = Si(X, Ω)para i ≥ i∗.

Este conjunto se puede extender a sistemas en bucle cerrado controlados por unaley de control u = h(x), dando lugar a

Shi (X, Ω) = x0 ∈ Xh : xk ∈ Xh, ∀k = 0, · · · , i− 1 y xi ∈ Ω

Page 279: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 263

siendo Xh = x ∈ X : h(x) ∈ U. Este conjunto satisface las propiedades anteriores yen particular

Shi+1(X, Ω) = Qh(Sh

i (X, Ω)) ∩X

Ademas, todo conjunto Shi (X, Ω) es un invariante positivo del sistema.

La diferencia entre el conjunto controlable y estabilizable radica en el hecho de queel conjunto al que evolucionan es un invariante del sistema. Esta diferencia, a prioritrivial, es trascendental en la estabilidad. En efecto, si un estado x0 ∈ Si(X, Ω) entoncesexiste una secuencia de actuaciones que conducen el sistema al conjunto Ω y una vezallı, existe una ley de control admisible que lo mantiene en dicho conjunto. Por lo tantoes estable y converge al conjunto Ω. Si por el contrario, el conjunto Ω no fuese uninvariante de control, entonces, el sistema, una vez alcanzado ese conjunto en i pasos,puede no ser estabilizable en dicho conjunto y abandonarlo, perdiendo la estabilidad.

Hay que resaltar que el conjunto C∞(X) es diferente al conjunto S∞(X, Ω), de hechoS∞(X, Ω) ⊆ C∞(X). Ası, para todo estado x0 ∈ C∞(X) \ S∞(X, Ω) existe una ley decontrol admisible que hace que el sistema satisfaga las restricciones, pero no existe unaley de control que ademas conduzca el sistema al conjunto Ω.

Notese que el conjunto trivial 0 es un invariante del sistema (por ser el origenun punto de equilibrio). Por lo tanto el conjunto de estados que son asintoticamenteestabilizables al origen en i pasos sera Si(X, 0).

El conjunto S∞(X, Ω) es el maximo conjunto estabilizable al invariante Ω y esen general distinto al conjunto S∞(X, 0) que es el maximo conjunto estabilizable alorigen, es decir, el conjunto de estados que pueden ser conducidos al punto de equilibriopor una ley de control admisible satisfaciendo las restricciones6.

A raız de esto, resulta interesante establecer una condicion necesaria y suficientesobre Ω bajo la cual S∞(X, Ω) = S∞(X, 0). Esta condicion se establece en el siguienteteorema, que es original de esta tesis y cuyo resultado tendra una aplicacion inmediatasobre el control predictivo.

Teorema A.28 Los conjuntos

S∞(X, Ω) = S∞(X, 0)si y solo si el conjunto invariante Ω es tal que Ω ⊆ S∞(X, 0)

Demostracion:6 Este conjunto es una generalizacion del maximo conjunto estabilizable introducido en (Keerthi

& Gilbert 1987).

Page 280: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

264 A.3. Teorıa de conjuntos invariantes

Necesidad:Supongase que S∞(X, Ω) = S∞(X, 0), entonces se tiene que

Ω ⊆ S∞(X, Ω) = S∞(X, 0)

y por lo tanto Ω ⊆ S∞(X, 0).

Suficiencia:Supongase que Ω ⊆ S∞(X, 0), entonces:

S∞(X, Ω) ⊆ S∞(X, 0) :Dado que Ω ⊆ S∞(X, 0), se tiene que

S∞(X, Ω) ⊆ S∞(X, S∞(X, 0)) = S∞(X, 0)

S∞(X, 0) ⊆ S∞(X, Ω) :Dado que 0 ⊆ Ω, entonces de las propiedades del conjunto estabilizablese tiene que S∞(X, 0) ⊆ S∞(X, Ω).

Y por lo tanto se demuestra que S∞(X, 0) = S∞(X, Ω)

Este teorema demuestra que el maximo conjunto estabilizable al origen y a Ω co-inciden si y solo si Ω es un conjunto invariante cuyos estados son asintoticamenteestabilizables al origen.

En el corolario siguiente se establecen condiciones bajo las cuales ambos conjuntosS∞(X, 0) y S∞(X, Ω) estan finitamente determinados. Este resultado tambien esoriginal de esta tesis y tiene una aplicacion interesante en el analisis del dominio deatraccion de los controladores predictivos.

Corolario A.29 Sea Ω ⊆ Sn(X, 0) para cierto n, entonces S∞(X, 0) esta finita-mente determinado si y solo si S∞(X, Ω) tambien lo esta.Ademas si el ındice de determinacion de S∞(X, Ω) es i∗, y el de S∞(X, 0) es j∗, severifica que

i∗ ≤ j∗ ≤ i∗ + n

Demostracion:

Page 281: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 265

Si S∞(X, 0) esta finitamente determinado entonces S∞(X, Ω) tambien lo esta:

Dado que Ω ⊆ Sn(X, Ω) ⊆ S∞(X, Ω), por el teorema anterior se infiere quepara todo j ≥ j∗

S∞(X, Ω) = S∞(X, 0) = Sj(X, 0) ⊆ Sj(X, Ω)

De las propiedades de los conjuntos estabilizables se tiene que

Sj(X, Ω) ⊆ S∞(X, Ω)

y por lo tanto, para todo j ≥ j∗, se deduce que Sj(X, Ω) = S∞(X, Ω), y conse-cuentemente esta finitamente determinado con un ındice i∗ ≤ j∗.

Si S∞(X, Ω) esta finitamente determinado entonces S∞(X, 0) tambien lo esta:

Para todo i ≥ i∗ se tiene que

S∞(X, 0) = S∞(X, Ω) = Si(X, Ω) ⊆ Si+n(X, 0)

dado que Si+n(X, 0) ⊆ S∞(X, 0), se tiene que

Si+n(X, 0) = S∞(X, 0)

para todo i ≥ i∗. Por lo tanto S∞(X, 0) esta finitamente determinado con unındice de determinacion j∗ ≤ i∗ + n.

Este resultado es interesante desde un punto de vista practico, ya que, si el inva-riante Ω es tal que Ω ⊆ Sn(X, 0), que es lo habitual, entonces, S∞(X, Ω) esta fini-tamente determinado si y solo si S∞(X, 0) tambien lo esta. Por lo tanto si todoestado estabilizable a Ω lo es en N pasos (siendo N el ındice de determinacion), en-tonces sera asintoticamente estabilizable al origen N + n pasos. Esta consecuencia seutilizara en el analisis del dominio de atraccion del MPC, en la seccion 4.3.1.

A.3.1. Determinacion del conjunto a un paso

Los conjuntos anteriormente presentados caracterizan regiones en las que se verificanpropiedades tan importantes como la posibilidad de que sea controlable o que seaasintoticamente estabilizable satisfaciendo las restricciones. La posibilidad del calculode estos conjuntos es muy interesante pues permite analizar fuera de lınea todas estas

Page 282: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

266 A.3. Teorıa de conjuntos invariantes

propiedades. Ademas ofrece la posibilidad de utilizar estas regiones para el diseno decontroladores. A lo largo de la tesis, se muestran controladores que aprovechan estosconjuntos en su diseno.

La determinacion de estas regiones es un calculo puramente geometrico pues bastacon tener un algoritmo para determinar el conjunto a un paso Q(Ω) y otro para lainterseccion de dos conjuntos.

El conjunto Q(Ω) viene caracterizado por todo estado x para el cual exista unaactuacion u tal que

f(x, u) ∈ Ω ⊂ IRn

u ∈ U ⊂ IRm

La determinacion del conjunto a un paso puede hacerse trasladando el problema alespacio de estados extendido

z =

[xu

]

ası, el conjunto Q(Ω) se transforma en el espacio extendido en el conjunto

Υ =

z ∈ IRn+m :

[f(z)IU ·z

]∈ Ω× U

siendo IU =[

Ø Im

], donde Im es la matriz identidad de dimension m. Entonces, el

conjunto Q(Ω) sera la proyeccion de Υ sobre las n primeras componentes de z.

La determinacion de este conjunto no es sencilla en general. Sin embargo, en el casode sistemas lineales y los conjuntos X, U y Ω politopicos, existen algoritmos eficientespara su determinacion exacta (Keerthi & Gilbert 1987, Blanchini 1994, Kerrigan 2000).

Sea el sistema lineal xk+1 = A·xk +B·uk y sea el conjunto de restricciones sobre lasactuaciones U dado por

Au·u ≤ bu

siendo Au ∈ IRnru×m y bu ∈ IRnru . Sea el conjunto Ω otro politopo dado por

AΩ·x ≤ bΩ

siendo AΩ ∈ IRnrΩ×n y bu ∈ IRnrΩ . Entonces en el espacio extendido, el conjunto Υviene dado por [

AΩ·A AΩ·BØ Au

]·z ≤

[bΩ

bu

]

que es otro politopo. Este conjunto se puede proyectar sobre x utilizando por ejemploel algoritmo de eliminacion de Fourier-Motzkin utilizado en (Keerthi & Gilbert 1987,Kerrigan 2000), lo que da lugar a Q(Ω), que es otro politopo.

Page 283: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 267

Una vez obtenido este conjunto, la interseccion con otro politopo da como resultadootro politopo y su determinacion es sencilla. En consecuencia, los conjuntos estabiliza-bles, controlables, y admisibles en sistemas lineales sujetos a restricciones politopicasson politopos y el procedimiento por el que se obtienen estos es exacto.

En el caso de sistemas no lineales el calculo exacto es enormemente complejo. Sinembargo en ocasiones es suficiente con la determinacion de conjuntos aproximados aestos conjuntos de forma que

Ω ⊆ Qap(Ω) ⊆ Q(Ω)

Estos conjuntos aproximados pueden servir para la determinacion de conjuntos inva-riantes de control de sistemas, pues todo conjunto Φ tal que Ω ⊆ Φ ⊆ Q(Ω) es unconjunto invariante de control (si Ω es un invariante).

Un posible procedimiento para el calculo aproximado Qap(Ω) puede obtenerse tras-ladando el procedimiento seguido para sistemas lineales a sistemas no lineales. Para ellose va a considerar que los conjuntos X, U y Ω son politopos. Esto no es muy restrictivo,pues es habitual expresar las restricciones de forma politopica. Si no fuese este el caso,se pueden tomar aproximaciones politopicas no muy conservadoras, siempre que estosconjuntos sean convexos.

Ası, el conjunto Q(Ω) vendra caracterizado en el espacio extendido por el conjuntoΥ

Υ =

z ∈ IRn+m :

[AΩ·f(z)AU ·z

]≤

[bΩ

bu

]

siendo AU = [Ø, Au]. El conjunto Q(Ω) es la proyeccion de Υ sobre x. Dado que esteconjunto no tiene por que ser un politopo (ni siquiera convexo), la determinacion deesta proyeccion es difıcil.

Teniendo en cuenta que la proyeccion es una operacion monotona, es decir, quepara todo Φ ⊆ Υ, se tiene que la proyeccion de Φ esta contenida en la proyeccion deΥ, el conjunto Q(Ω) se puede aproximar por la proyeccion de un politopo contenido enΥ. Notese que la proyeccion de un politopo se puede realizar mediante procedimientosconocidos.

La aproximacion politopica de Υ se puede determinar en dos pasos: primero secalcula la envoltura convexa del conjunto Υ. De este modo, el politopo adapta suforma a la geometrıa particular de la region, que viene caracterizada por la dinamicadel sistema. Una vez hecho esto, se contrae el politopo obtenido hasta estar contenidoen Υ. Esto se puede hacer afectando el termino independiente de la inecuacion por unfactor λ ∈ (0, 1).

Este procedimiento trata de aprovechar la flexibilidad que ofrecen los politopos,

Page 284: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

268 A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado

ası como la existencia de algoritmos eficientes para realizar operaciones sobre ellos.Una restriccion fuerte que impone esta eleccion se deriva del hecho de que un politoposiempre es convexo. Ademas, es claro tambien que este procedimiento puede no ser deutilidad en caso de sistemas fuertemente no lineales. El desarrollo de este procedimientoes una de las futuras lıneas de trabajo del autor de esta tesis.

A.4. Analisis de la robustez de sistemas no lineales:

estabilidad entrada a estado

Sea un sistema autonomo cuyo comportamiento es incierto y responde a un modelodado por

xk+1 = f(xk, wk)

siendo xk ∈ IRn es estado del sistema y wk ∈ IRq el vector de incertidumbres sobreel sistema. Estas incertidumbres se suponen acotadas de forma que

wk ∈ W = w ∈ IRq : ‖w‖ ≤ µpara todo k. Se supone que, en ausencia de incertidumbres, el origen es un punto deequilibrio del sistema, ası f(0, 0) = 0.

Si las incertidumbres dependen del estado (w ∈ W (x)), de forma que w → 0 cuandox → 0, entonces el origen es un punto de equilibrio del sistema incierto. En este caso,la teorıa de Lyapunov se puede extender considerando en las condiciones de estabilidadla peor posible de las situaciones posibles, es decir

∆V (x) = maxw∈W (x)

V (f(x, w))− V (x)

Si existe una funcion de Lyapunov tal que ∆V (x) ≤ 0, el sistema sera estable a pesar delas incertidumbres. Si ademas existe una funcion K , α(·), tal que ∆V (x) ≤ −α(‖x‖),entonces el sistema incierto es asintoticamente estable en el origen.

Sin embargo, en el caso en el que las incertidumbres estan simplemente acotadas, elorigen deja de ser un punto de equilibrio del sistema incierto. Por tanto las definicionesde estabilidad al origen, ası como la teorıa de Lyapunov asociada, no se pueden aplicar.La teorıa de la estabilidad entrada a estado, basada en la de Lyapunov, ofrece un marcopara el analisis de estos sistemas.

La estabilidad entrada a estado fue formulada por primera vez en (Sontag 1989a)para sistemas en tiempo continuo, pero recientes resultados (Jiang et al. 1999, Jiang& Wang 2001) han trasladado estos conceptos a sistemas en tiempo discreto. A con-tinuacion se presentan algunas definiciones y resultados interesantes.

Page 285: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 269

Definicion A.30 (Estabilidad entrada a estado) (Jiang & Wang 2001) Un sis-tema xk+1 = f(xk, wk) es estable entrada a estado si existe una funcion KL , β(·, ·), yuna funcion K , γ(·), tal que la evolucion del sistema satisface que

‖xk‖ ≤ β(‖x0‖, k) + γ(µ)

siendo ‖wk‖ ≤ µ para todo k.

Esta definicion se puede interpretar como que el sistema en ausencia de incer-tidumbres es asintoticamente estable. Sin embargo, cuando aparecen incertidumbresacotadas, el efecto que estas tienen sobre la evolucion del sistema esta acotada, esdecir, que las incertidumbres no hacen divergir al sistema.

Asociada a este concepto de estabilidad existe la definicion de una funcion de Lya-punov entrada a estado.

Definicion A.31 (Funcion de Lyapunov entrada a estado) (Jiang & Wang 2001)Una funcion continua V : IRn 7→ IR+ se denomina funcion de Lyapunov entrada a es-tado si satisface que

Existen unas funciones K , α1(·) y α2(·), tales que

α1(‖x‖) ≤ V (x) ≤ α2(‖x‖) ∀x ∈ Br

Existe una funcion K , α3(·), y una funcion K , σ(·), tales que

V (f(x,w))− V (x) ≤ −α3(‖x‖) + σ(µ) ∀x ∈ Br, ∀w ∈ Bµ = ‖w‖ ≤ µ

La segunda propiedad de la definicion es equivalente a decir que existe una funcionK∞ , χ(·), y una funcion K , α4(·), tales que

V (f(x,w))− V (x) ≤ −α4(x) ∀x : ‖x‖ ≥ χ(‖µ‖)

es decir, que se satisface la condicion de Lyapunov tan solo fuera de una vecindad delorigen.

En el siguiente lema se establece la condicion suficiente para garantizar la estabilidadentrada a estado de un sistema.

Lema A.32 (Jiang & Wang 2001) Si un sistema xk+1 = f(xk, wk) admite una funcionde Lyapunov entrada a estado entonces el sistema es estable entrada a estado.

Page 286: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

270 A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado

La demostracion de este lema esta muy relacionada con la definicion de conjuntoinvariante robusto.

Definicion A.33 (Conjunto invariante positivo robusto) Sea un sistema incier-to dado por

xk+1 = f(xk, wk)

siendo xk ∈ IRn el estado del sistema y wk ∈ IRq el vector de incertidumbres, que sesuponen acotadas de forma que wk ∈ W .

Un conjunto Ω ⊂ IRn se dice que es un conjunto invariante positivo robusto del sis-tema si para todo x0 ∈ Ω se tiene que xk ∈ Ω para todo k ≥ 0 y para toda incertidumbrewk ∈ W .

La demostracion de este lema se basa en probar que una region dada por

Ωb = x ∈ IRn : V (x) ≤ bcontenida en Br, es un invariante robusto del sistema para un cierto grado de incer-tidumbres µ = µ(b).

La demostracion a grandes rasgos es la siguiente: de la definicion de V (x) se tieneque

V (f(x,w)) ≤ V (x)− α3(‖x‖) + σ(µ)

Dado que para todo x se tiene que ‖x‖ ≥ α−12 (V (x)), sustituyendo tenemos que

V (f(x,w)) ≤ V (x)− α3 α−12 (V (x)) + σ(µ)

Considerando que la funcion α3 α−12 es una funcion K∞ , de las propiedades de estas

funciones se tiene que existe una funcion K∞ , α4(·), tal que

α4(s) ≤ α3 α−12 (s)

con una funcion K , ρ(·), asociada tal que

ρ(s) = s− α4(s) ≥ 0

Por tanto, dado que V (x) ≥ 0, se tiene que

V (f(x,w)) ≤ V (x)− α3 α−12 (V (x)) + σ(µ)

≤ V (x)− α4 V (x) + σ(µ)

≤ ρ V (x) + σ(µ)

entonces si V (x) ≤ b, se tiene que

V (f(x,w)) ≤ ρ(b) + σ(µ)

Page 287: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 271

para garantizar que V (f(x,w)) ≤ b se debe satisfacer que

b− ρ(b) ≥ σ(µ)

Del desarrollo anterior, se tiene que la funcion α4(s) = (id − ρ)(s) es una funcionK∞ , siendo id la funcion identidad. Por lo tanto basta tomar

b ≥ (id− ρ)−1 σ(µ) = d(µ)

siendo d(·) una funcion K .

De aquı se pueden obtener 2 conclusiones: la primera es que si un sistema es estableentrada a estado y la entrada (incertidumbre) tiene una cota µ, entonces todo conjunto

Ωb = x ∈ IRn : V (x) ≤ b ⊆ Br

con b ≥ d(µ), es un conjunto invariante robusto del sistema. Ademas el sistema evolu-ciona hasta quedar confinado en b = d(µ).

Otra conclusion es la lectura inversa, todo conjunto Ωb es invariante robusto paraunas incertidumbres tales que su cota satisfaga

µ ≤ σ−1 (b− ρ(b)) (A.1)

A.4.1. Suavidad implica robustez

Sea un sistema incierto xk+1 = f(xk, wk) tal que su modelo es suave respecto a lavariacion de los parametros, es decir, que existe una funcion K , θ(·), tal que

‖f(x,w)− f(x, 0)‖ ≤ θ(‖w‖)

Notese que esta condicion se satisface bajo condiciones de diferenciabilidad de la fun-cion.

Sea el sistema sin incertidumbres xk+1 = f(xk, 0) asintoticamente estable con unafuncion de Lyapunov asociada V (x) tal que

V (f(x, 0))− V (x) ≤ −α(‖x‖)

siendo α(·) una funcion K . Supongase que V (x) una funcion suave, es decir, que existeuna funcion K γ(·) tal que

|V (x + ∆x)− V (x)| ≤ γ(‖∆x‖)

Page 288: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

272 A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado

para todo ‖∆x‖ ≤ µ.

Entonces, bajo estas hipotesis, el sistema es estable entrada a estado, es decir,admite cierto grado de incertidumbre. Para ello basta ver que

V (f(x,w))− V (x) = V (f(x,w))− V (f(x, 0)) + V (f(x, 0))− V (x)

≤ γ(‖f(x,w)− f(x, 0)‖)− α(‖x‖)≤ γ θ(‖w‖)− α(‖x‖) ≤ −α(‖x‖) + γ θ(µ)

y por lo tanto la funcion de Lyapunov es tambien una funcion de Lyapunov entrada aestado.

A.4.2. Robustez de sistemas no autonomos

El analisis anterior se puede trasladar al concepto de funcion de Lyapunov de controlpara al analisis de robustez de sistemas no autonomos. Considerese un sistema dadopor

xk+1 = f(xk, uk, wk)

siendo xk ∈ IRn el estado del sistema, uk ∈ IRm las actuaciones y wk ∈ IRq el vector deincertidumbres sobre el sistema. Estas incertidumbres se suponen acotadas de formaque

wk ∈ W = w ∈ IRq : ‖w‖ ≤ µpara todo k. Se supone que, en ausencia de incertidumbres, el origen es un punto deequilibrio del sistema, ası f(0, 0, 0) = 0.

En el caso en que las incertidumbres decaigan con el estado, entonces la funcion deLyapunov de control se puede definir como una funcion definida positiva tal que

∆V (x) = mınu∈U

max

w∈W (x)V (f(x, u, w))− V (x)

≤ −α(‖x‖)

para todo x ∈ Br, siendo α(·) una funcion K . Por tanto si un sistema tiene una funcionde Lyapunov de control asociada, entonces es estabilizable a pesar de las incertidumbresen una region

Ωb = x ∈ IRn : V (x) ≤ b

En el caso en que las incertidumbres sean meramente acotadas, se puede extenderel concepto de funcion de Lyapunov entrada a estado a una CLF. Ası, si una funciondefinida positiva satisface que

∆V (x) = mınu∈U

maxw∈W

V (f(x, u, w))− V (x)≤ −α(‖x‖)

Page 289: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 273

para todo x ∈ Br \ Bd siendo Bd una vecindad del origen que depende del grado deincertidumbres del sistema.

En este caso, la existencia de una funcion que satisfaga esta condicion garantiza queel sistema evoluciona hasta una vecindad del origen en la que la evolucion del sistemaqueda acotada. En efecto, sea una region Ωb contenida en Br tal que Bd ⊆ Ωb. Esteconjunto, Ωb es un invariante robusto del sistema. Entonces para todo x ∈ Ωb\Bd, existeuna ley de control que conduce el sistema hacia el origen a pesar de las incertidumbres(gracias a que V (xk) es estrictamente decreciente). Por lo tanto, en un determinadoinstante, el sistema entra en Bd, donde la condicion puede no satisfacerse, y entoncesla evolucion del sistema podrıa salir de dicho conjunto. Pero, dado que una vez fuera,el sistema es forzado a converger, el sistema permanecera acotado en una vecindad delorigen.

Asociado al concepto de conjunto robustamente estabilizable esta el concepto deconjunto invariante de control robusto.

Definicion A.34 (Conjunto invariante de control robusto) Sea un sistema incier-to dado por

xk+1 = f(xk, uk, wk)

siendo xk ∈ IRn el estado del sistema, uk ∈ U ⊂ IRm las actuaciones sobre el sistemay wk ∈ IRq el vector de incertidumbres sobre el sistema que se suponen acotadas deforma que wk ∈ W .

Un conjunto Ω ⊂ IRn se dice que es un conjunto invariante de control robustodel sistema si para todo x0 ∈ Ω se tiene que que existe una ley de control admisibleuk = h(xk) ∈ U tal que xk ∈ Ω para todo k ≥ 0 y para toda incertidumbre wk ∈ W .

Por ejemplo, el conjunto Ωb anteriormente definido es un conjunto invariante robus-to. Alrededor de este concepto, se extiende la teorıa de conjuntos invariantes al casode sistemas con incertidumbres, que es particularmente util para el analisis de sistemasinciertos sujetos a restricciones.

A.5. Conjuntos invariantes robustos

En el caso en el que un sistema presente incertidumbres, los conjuntos invariantesdeben considerar los efectos de las mismas para garantizar convergencia a un conjuntoy la satisfaccion de las restricciones a pesar de la incertidumbres del sistema. Estosconjuntos son de especial interes para el analisis de la robustez de sistemas sujetos a

Page 290: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

274 A.5. Conjuntos invariantes robustos

restricciones y por ello se utilizan en el desarrollo de capıtulos de esta tesis dedicadosa la robustez de los controladores predictivos.

Numerosos trabajos tratan sobre este asunto tanto para el analisis como para eldiseno de controladores, generalmente lineales en tiempo mınimo (Bertsekas 1972,Blanchini 1994, Mayne & Schroeder 1997). En (Kerrigan 2000, Kerrigan & Maciejowski2001) se utilizan estos conjuntos para el analisis de la factibilidad robusta de contro-ladores predictivos.

Considerese un sistema incierto dado por

xk+1 = f(xk, uk, wk)

siendo xk ∈ IRn el estado del sistema, uk ∈ IRm las actuaciones sobre el sistema ywk ∈ IRq el vector de incertidumbres sobre el sistema que se suponen acotadas deforma que wk ∈ W . El sistema esta sujeto a las restricciones

uk ∈ U

xk ∈ X

Estas restricciones deben satisfacerse a pesar de las incertidumbres.

A continuacion se van a extender las definiciones de los distintos conjuntos previa-mente definidos al caso robusto, que se denota por el sımbolo ∼. Ası Q(·) se refiere alconjunto a un paso robusto.

Definicion A.35 (Conjunto a un paso robusto) El conjunto a un paso robustodel conjunto Ω, Q(Ω), es el conjunto de estados x para los cuales existe una actuacionadmisible u ∈ U (que dependera del estado x) tal que el sistema alcanza el conjunto Ωen un solo paso, es decir, f(x, u, w) ∈ Ω ante cualquier incertidumbre w ∈ W .

Q(Ω) = x ∈ IRn : ∃u(x) ∈ U |f(x, u, w) ∈ Ω, ∀w ∈ W

Notese que la unica diferencia con el caso no robusto es que se debe satisfacer lacondicion para toda posible incertidumbre. En el caso en que las incertidumbres seanaditivas, de forma que

xk+1 = f(xk, uk) + wk

el conjunto robusto a un paso robusto verifica que

Q(Ω) = Q(Ω ∼ W )

siendo Ω ∼ W la diferencia de Pontryagin de ambos conjuntos. Por lo tanto, en estecaso, el conjunto robusto se calcula a partir del conjunto no robusto.

Page 291: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto 275

Definicion A.36 (Conjunto de alcance robusto) El conjunto de alcance robustodel conjunto Ω, R(Ω), es el conjunto de estados x a los cuales puede evolucionar elsistema partiendo de Ω ante una actuacion admisible u ∈ U y ante cualquier incer-tidumbre w ∈ W en un solo paso.

R(Ω) = z ∈ IRn : ∃x ∈ Ω, ∃ ∈ U, ∃w ∈ W tal que z = f(x, u, w)

A partir de la definicion de conjunto a un paso robusto, se extienden inmediatamentetodos los resultados y definiciones no robustas al caso robusto.

Teorema A.37 (Condicion geometrica de invariancia robusta)

Un conjunto Ω es un invariante de control robusto si y solo si

Ω ⊆ Q(Ω)

Definicion A.38 (Conjunto controlable en i pasos robusto) El conjunto contro-lable en i pasos Ki(X, Ω) es el conjunto de estados para los cuales existe una secuenciade actuaciones admisibles que dependen del estado, tal que conduce el sistema hastael conjunto Ω en i pasos con una trayectoria admisible y ante cualquier secuencia deincertidumbres posibles.

Ki(X, Ω) = x0 ∈ X : ∃uk(xk) ∈ U k = 0, · · · , i |xk ∈ X, xi ∈ Ω, ∀wk ∈ W

El conjunto Ki(X, Ω) presenta propiedades semejantes al caso sin incertidumbres.

Definicion A.39 (Maximo conjunto invariante de control robusto) El conjun-to C∞(X) es el maximo conjunto invariante de control robusto contenido en X si y solosi todo conjunto invariante de control robusto Ω del sistema satisface que

Ω ⊆ C∞(X) ⊆ X

Ası, C∞(X) es el maximo conjunto en el cual existe una ley de control admisible talque el sistema puede satisfacer las restricciones en su evolucion ante cualquier posibleincertidumbre.

Definicion A.40 (Conjunto admisible en i pasos robusto) El conjunto admisi-ble en i pasos robusto Ci(X) es el conjunto de estados para los cuales existe una secuen-cia de actuaciones admisibles tal que la evolucion del sistema permanece en el conjuntoX durante las i muestras siguientes ante cualquier incertidumbre posible.

Ci(X) = x0 ∈ X : ∃uk(xk) ∈ U |xk + 1 ∈ X, ∀wk ∈ W, k = 0, · · · , i− 1

Page 292: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

276 A.5. Conjuntos invariantes robustos

Definicion A.41 (Conjunto estabilizable en i pasos robusto) El conjunto esta-bilizable en i pasos robusto al conjunto invariante robusto (positivo o de control) Ω,Si(X, Ω), es el conjunto de estados para los cuales existe una secuencia de actuacionesadmisibles tal que conduce el sistema hasta el conjunto Ω en i pasos con una trayectoriaadmisible para toda posible incertidumbre.

Si(X, Ω) = x0 ∈ X : ∃uk(xk) ∈ U k = 0, · · · , i− 1 |xk ∈ X, xi ∈ Ω, ∀wk ∈ W

Todas las propiedades presentadas para los conjuntos invariantes no robustos seextienden al caso robusto, simplemente sustituyendo los conjuntos invariantes por susequivalentes robustos. Estas propiedades son de suma utilidad en el analisis y disenode controladores con incertidumbres.

Page 293: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice B

Un ejemplo ilustrativo: el reactorcontinuamente agitado (CSTR)

Para ilustrar las estrategias de control MPC que se presentan a lo largo de estatesis, se van a aplicar sobre el modelo de un sistema altamente no lineal: un reactorcontinuamente agitado de mezcla perfecta (CSTR). Este proceso ha sido extensamenteutilizado en la literatura de control pues reune las principales caracterısticas de lamayorıa de los reactores (Seborg, Edgar & Mellichamp 1989, Henson & Seborg 1997,Magni, De Nicolao, Magnani & Scattolini 2001, De Oliveira Kothare & Morari 2000).

Este sistema esta formado por un tanque en el cual tiene lugar una reaccion exo-termica irreversible de descomposicion

A → B

El caracter exotermico de la reaccion provoca una continua generacion de calor en elseno del tanque, el cual es evacuado por medio de una camisa de refrigeracion por laque circula el refrigerante, cuya temperatura Tc es manipulable.

El objetivo del control es mantener la concentracion de reactivo del producto CA

y la temperatura del tanque T en el punto de funcionamiento determinado. Para ellose actua sobre la temperatura de refrigerante Tc modificando ası la temperatura deltanque y, por lo tanto, la temperatura a la que se realiza la reaccion. En consecuenciase acelera o decelera la reaccion y por tanto se actua sobre la concentracion de reactivoy de producto.

El modelado de este sistema se puede encontrar en (Seborg et al. 1989, Ollero &Camacho 1997) y se hace bajo las siguientes hipotesis o simplificaciones:

277

Page 294: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

278

(i) Se supone mezcla perfecta, por lo que la concentracion de reactivo en el caudalde salida CA es igual a la concentracion en el seno del tanque.

(ii) La reaccion responde a una cinetica de primer orden, por lo que la velocidad dereaccion es rA = −k·CA siendo k la constante cinetica, que responde a la ley deArrhenius

k = k0· exp(− E

R·T)

siendo E la energıa de activacion de la reaccion, R la constante de los gases y k0

la constante de frecuencia.

(iii) La temperatura en el reactor es uniforme y ademas tan solo se considera latransferencia de calor con el refrigerante, despreciandose otros efectos termicoscomo la transferencia de calor con el medio o la aportacion de energıa interna delagitador.

(iv) Se supone que el sistema se halla en equilibrio en el nivel de lıquido en el tanque,de forma que el caudal de entrada al tanque de reactivo A es igual al caudal desalida de producto. En consecuencia el volumen de lıquido contenido en el tanquees constante.

Considerando estas simplificaciones se establecen las ecuaciones de balance de masasy energıa en el reactor, que dan lugar a las ecuaciones diferenciales que modelan esteproceso: (Seborg et al. 1989, Ollero & Camacho 1997):

dCA

dt=

q

V·(CAf − CA)− k0· exp

(− E

R·T)·CA

d T

dt=

q

V·(Tf − T ) +

(−∆Hr)·k0

ρ·Cp

· exp(− E

R·T)·CA +

U ·AV ·ρ·Cp

·(Tc − T )

donde CA es la concentracion del reactivo A en el tanque, T es la temperatura en elmismo y Tc es la temperatura del refrigerante, CAf , Tf y q son la concentracion de A,la temperatura y el caudal del flujo de entrada, V el volumen de lıquido contenido enel tanque.

Los parametros del sistema son:

Page 295: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice B. Un ejemplo ilustrativo: el reactor continuamente agitado (CSTR) 279

Parametro Descripcion Valor

ρ Densidad del lıquido 1000 g/l

Cp Calor especıfico medio 0,239 J/g K

(−∆Hr) Entalpıa de reaccion 5× 104 J/mol

E/R Constante de la formula de Arrhenius 8750 K

k0 Constante de frecuencia 7,2× 1010 min−1

U ·A Coeficiente de transferencia de calor 5× 104 J/min K

Las condiciones nominales de funcionamiento corresponden a q = 100 l/min, Tf = 350K, V = 100 l, CAf = 1,0 mol/l, lo que conduce al sistema a un punto de equilibriodado por

CoA = 0,5 mol/l, T o = 350 K, T o

c = 300 K

La temperatura del refrigerante esta restringida a 280 K ≤ Tc ≤ 370 K, la temperaturadel reactor a 280 K ≤ T ≤ 370 K y la concentracion a 0 ≤ CA ≤ 1mol/l.

Dada la diferencia entre las magnitudes de ambos estados, los estados del modelose ha normalizado para evitar posibles problemas de condicionamiento numerico. Losestados y la entrada considerados han sido:

x1 =CA − 0,5

0,5

x2 =T − 350

20

u =Tc − 300

20

Los parametros que definen el sistema, ası como las condiciones nominales de fun-cionamiento, se han tomado iguales a las utilizadas en (Magni, De Nicolao, Magnani& Scattolini 2001). El punto de funcionamiento elegido es inestable y ademas, el sis-tema presenta un comportamiento altamente no lineal como se puede observar en lasrespuestas en bucle abierto ante un escalon negativo (figura B.1) y ante un escalonpositivo (figura B.2).

El modelo se ha discretizado con un periodo de muestreo Tm = 0,03. El procedimien-to de discretizacion utilizado para la implementacion de los controladores predictivos esımplıcito, de forma que no se han obtenido unas expresiones en forma de ecuaciones endiferencias. El modelo continuo se ha integrado mediante un algoritmo de integracionnumerica, suficientemente preciso (alto orden y de paso variable). Ası, partiendo de lascondiciones iniciales dadas por el estado en el instante anterior xk, se integra el modeloconsiderando a lo largo del periodo de muestreo la entrada constante u(t) = uk para

Page 296: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

280

t ∈ [k·Tm, (k + 1)·Tm], tal y como hace un mantenedor de orden cero. De esta forma,el estado obtenido en t = (k + 1)·Tm es el estado xk+1.

El modelo discreto linealizado en torno al origen se ha obtenido calculando el ja-cobiano del modelo aproximado utilizando el metodo de diferencias finitas. El modelolinealizado obtenido es xk+1 = A·xk + B·uk siendo

A =

0,9385 −0,0443

0,1624 1,1365

B =

−0,0013

0,0668

que, como se puede comprobar, la matriz A tiene un autovalor fuera del disco unidad,por lo que el origen es un punto de equilibrio inestable.

0 50 100 150 200 250 300 3500

0.2

0.4

0.6

0.8

1

muestras

x 1

0 50 100 150 200 250 300 350−2

−1.5

−1

−0.5

0

muestras

x 2

Figura B.1: Respuesta en escalon del sistema con u = −0,25.

0 50 100 150 200 250 300 350−1

−0.8

−0.6

−0.4

−0.2

0

muestras

x 1

0 50 100 150 200 250 300 3500

1

2

3

4

5

muestras

x 2

Figura B.2: Respuesta en escalon del sistema con u = 0,25.

Page 297: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice C

Analisis de la continuidad del costeoptimo

C.1. El problema de programacion matematica en

el MPC

Como es bien sabido, la estrategia de horizonte deslizante con la que se aplica elcontrol predictivo en bucle cerrado, hace que en cada periodo de muestreo se resuelvaun problema de optimizacion que tiene la forma:

mınuF

JN(xk, uF ) (C.1)

s.a

x(k + j|k) ∈ X j = 0, · · · , N − 1

x(k + N |k) ∈ Ω

u(k + j|k) ∈ U j = 0, · · · , N − 1

siendo el funcional a optimizar

JN(xk, uF (k)) =N−1∑

i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

que depende del comportamiento futuro del sistema y de las actuaciones a lo largo delhorizonte de prediccion N .

Las restricciones en el estado en el instante j-esimo x(k + j|k) pueden expresarsemediante un conjunto de ecuaciones

gxj (x) ¹ 0

281

Page 298: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

282 C.1. El problema de programacion matematica en el MPC

de forma que para j = 0, · · · , N−1 representan el conjunto X y para j = N representanel conjunto Ω.

A su vez, las restricciones en las actuaciones se pueden expresar como

gu(u) ¹ 0

de forma que estas ecuaciones representan el conjunto U .

Dado que los estados predichos dependen del estado actual xk y de la secuencia deactuaciones uF , el problema de optimizacion a resolver es en general, un problema deprogramacion no lineal con la siguiente forma:

mınuF

JN(xk, uF )

s.a

G(xk, uF ) ¹ 0

donde la funcion G(·, ·) representa las restricciones sobre el estado y sobre las actua-ciones.

Otra forma de plantear este problema de programacion matematica es mediantela denominada formulacion simultanea (Biegler 1998). En esta, la prediccion de losestados futuros no se incluye implıcitamente en las restricciones y en el funcional delproblema de optimizacion. Para ello se anade como variable adicional de optimizacionla secuencia de estados futuros del sistema. Esta nueva variable debe satisfacer encada instante el modelo de prediccion, lo que anade nx·N restricciones de igualdada las restricciones de desigualdad derivadas de las restricciones en el estado y en lasactuaciones. El problema de optimizacion se formula pues de la siguiente forma:

mınuF ,xF

JN(xk, xF , uF ) (C.2)

s.a

x(k + j + 1|k) = F (x(k + j|k), u(k + j|k)) j = 0, · · · , Nx(k|k) = xk

gxj (x(k + j|k)) ¹ 0 j = 0, · · · , N

gu(u(k + j|k)) ¹ 0 j = 0, · · · , N − 1

La solucion optima de este problema de optimizacion es tambien la solucion optima delproblema no simultaneo (C.1). Esta formulacion del problema rompe la composicionsucesiva del modelo que es necesaria para la prediccion de x(k + j|k) a partir del esta-do xk. De esta forma el problema de optimizacion esta mejor condicionado, haciendosemenos sensible a errores o perturbaciones en el estado (Biegler 1998). Ademas es massencilla en su implementacion y ofrece un marco de analisis del problema de opti-mizacion mas intuitivo.

Page 299: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice C. Analisis de la continuidad del coste optimo 283

La formulacion simultanea responde a un problema de programacion no lineal dela forma:

mınuF ,xF

JN(xk, xF , uF )

s.a

H(xk, xF , uF ) = 0

G(xk, xF , uF ) ¹ 0

En ambas formulaciones, el problema de optimizacion a resolver depende del estadoen el que se encuentra el sistema, de forma que la solucion optima obtenida es unafuncion del estado u∗F = u∗F (xk). Por tanto el problema de optimizacion es un problemade programacion parametrica, dependiente del estado del sistema.

Resulta de interes analizar como varıa la solucion optima del problema, ası comoel coste optimo, al variar el estado del sistema, es decir, al variar el parametro. Esteanalisis se enmarca dentro del analisis de sensibilidad de un problema de programacionno lineal.

Esto es particularmente util para el analisis de robustez del controlador MPC quese desarrolla en el capıtulo 5, en el cual se demuestra que la suavidad del coste optimoes condicion suficiente para garantizar robustez del controlador. A continuacion sepresentan algunos resultados de sensibilidad del problema de optimizacion del MPC,orientados a garantizar suavidad del coste optimo. Primero se establecen condicionespara imponer la continuidad Lipschitz, que es la forma menos exigente de suavidad ydespues se extiende a condiciones de mayor orden.

C.2. Analisis de sensibilidad de un problema NLP

En esta seccion se presentan resultados conocidos sobre la sensibilidad de un proble-ma de programacion matematica no lineal (NLP) que seran de utilidad para el analisisde la suavidad del coste optimo del MPC. Como se ha comentado, el presente analisis secentra en la continuidad del coste optimo con respecto a la variacion de los parametrosde los que depende. Un estudio mas extenso y profundo sobre el analisis de sensibilidadde problemas de programacion matematica puede encontrarse en (Fiacco 1983) y ensus referencias.

El problema de programacion no lineal parametrica, cuyas variables de decision sonx y que depende del vector de parametros y, se formula de la siguiente forma:

Page 300: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

284 C.2. Analisis de sensibilidad de un problema NLP

mınx

f(x, y) (C.3)

s.a

h(x, y) = 0

g(x, y) ¹ 0

en el cual el vector x ∈ IRn es el conjunto de variables respecto al cual se minimiza, y elvector y ∈ IRm es el conjunto de parametros del que depende el problema. La funcionde coste f(·, ·) es una funcion escalar, la funcion h(·, ·) representa las p restricciones deigualdad y g(·, ·) representa las k restricciones de desigualdad impuestas al sistema.

La solucion optima de este problema dependera en general de los parametros, porlo que x∗ = x∗(y). En consecuencia el coste optimo tambien depende de los parametrosf ∗(y). El conjunto de puntos factibles, es decir que satisfacen las restricciones, dependetambien del valor de los parametros y se define como

S(y) = x ∈ IRn|h(x, y) = 0, g(x, y) ¹ 0

Definicion C.1 El conjunto S(y) es uniformemente compacto en una vecindad N(y)en torno a y si el cierre de

⋃y∈N(y)

S(y) es un conjunto compacto.

A continuacion se establece el primer resultado de este analisis, en el que se estable-cen condiciones para garantizar la continuidad Lipschitz del coste optimo.

Teorema C.2 (Continuidad Lipschitz) (Gauvin & Dubeau 1982)

Sea un problema de programacion parametrica (C.3) que satisface las siguientes condi-ciones:

(i) Sean las funciones que definen el problema f ,g y h funciones C1.

(ii) Sea el problema de optimizacion factible para un cierto valor de los parametrosy.

(iii) Sea x el optimo del problema para un valor de los parametros y, tal que satisfacelas condiciones de Magasarian-Fromovitz:

a) Existe una direccion d ∈ IRn tal que

∇xgi(x, y)·d < 0 si gi(x, y) = 0

∇xh(x, y)·d = 0

Page 301: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice C. Analisis de la continuidad del coste optimo 285

b) El jacobiano ∇xh(x, y) es de rango maximo.

(iv) Sea el conjunto factible S(y) uniformemente compacto en una vecindad de y.

Entonces el coste optimo f ∗(y) es localmente Lipschitz en una vecindad de los paramet-ros.

Teorema C.3 (Teorema de sensibilidad)(Fiacco 1983)

Sea un problema de programacion parametrica (C.3) que satisface las siguientes condi-ciones:

1. Sea x∗ la solucion optima del problema para un valor de los parametros y = 0.

2. Sean las funciones que definen el problema f(·, ·),g(·, ·) y h(·, ·) funciones C2

respecto a x y C1 respecto a y en un vecindad de x = x∗ e y = 0.

3. Sea x∗ una solucion optima tal que satisface las condiciones suficientes de segundoorden.

4. Sea x∗ una solucion optima tal que satisface la condicion de independencia lineal:La matriz formada por

∇xgi(x∗, 0)

∇xh(x∗, 0)

para todo i tal que gi(x∗, 0) = 0, es de rango maximo por filas.

5. Las restricciones de desigualdad activas gi(x∗, 0) = 0 son no degeneradas, es

decir, que sus multiplicadores de Lagrange asociados λ∗i son positivos.

Entonces en una vecindad de y = 0, se verifica la condicion suficiente de segundoorden en x∗(y) y ademas la solucion optima, los multiplicadores de Lagrange, ası comoel coste optimo son funciones C1 respecto a los parametros y.

Bajo las hipotesis de los dos teoremas anteriores se deduce la continuidad Lipschitzdel coste optimo en una vecindad de los parametros. Las condiciones del teoremaC.2 son menos restrictivas que las del teorema C.3. En primer lugar, las funcionesque definen el problema deben ser C1, y ademas el punto optimo debe satisfacer lacondicion de Magasarian-Fromovitz, para la cual la condicion de independencia lineales suficiente. Es decir, la condicion de independencia lineal implica la de Magasarian-Fromovitz, pero no al contrario. Tan solo cuando el problema no presenta restriccionesde igualdad, ambas son equivalentes.

Page 302: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

286 C.3. Continuidad Lipschitz del coste optimo J∗N (xk)

Ademas resulta complejo determinar cuando el mınimo obtenido para un determi-nado problema satisface las condiciones suficientes de segundo orden. En (Biegler 1998),L.T. Biegler afirma que no es frecuente que el hessiano de la lagrangiana en el puntooptimo sea definido positivo, por lo que no se satisfacen dichas condiciones. Aunqueen dicho trabajo se establece que cuando el sistema se encuentra en las proximidadesdel punto de equilibrio, los multiplicadores de Lagrange tienden a anularse, haciendosedicho hessiano definido positivo. Esta propiedad es aprovechada para aumentar la tasade convergencia del algoritmo de optimizacion.

El teorema C.3 puede extenderse para demostrar que la solucion optima x∗(y) esuna funcion Cp. Para ello basta imponer que las funciones implicadas en el problemasean de mayor orden: f(·, ·),g(·, ·) y h(·, ·) sean Cp+1 respecto a x y Cp respecto a y.

C.3. Continuidad Lipschitz del coste optimo J∗N(xk)

Como se expuso en una seccion anterior, el problema de optimizacion del MPC esun problema parametrico en el estado del sistema. Por tanto, basandose en los teoremasanteriores, es posible establecer condiciones bajo las cuales el coste optimo J∗N(x) eslocalmente Lipschitz con el estado. Para ello se va a distinguir dos casos: con y sinrestricciones en el estado.

C.3.1. MPC con restricciones en el estado

Previamente se va a analizar bajo que condiciones se satisfacen las hipotesis de losteoremas anteriores. Primero se va a comprobar que el problema de optimizacion enformulacion simultanea (C.2) verifica la condicion de Magasarian-Fromovitz si y solosi el problema (C.1) satisface la condicion de independencia lineal.

Sea el modelo de prediccion xk+1 = F (xk, uk). Se denotara en lo que sigue:

Ai = ∇xF (x(k + i|k), u(k + i|k))

Bi = ∇uF (x(k + i|k), u(k + i|k))

Cxi = ∇xg

x(x(k + i|k))

Cui = ∇ug

u(u(k + i|k))

Ası, los jacobianos de las restricciones son:

Page 303: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice C. Analisis de la continuidad del coste optimo 287

∇h(xF , uF ) =[∇xh ∇uh

]

∇xh(xF , uF ) =

I Ø Ø · · · Ø

−A1 I Ø · · · Ø...

. . . . . . · · · ...

Ø · · · −AN−2 I Ø

Ø · · · Ø −AN−1 I

∇uh(xF , uF ) =

−B0 Ø · · · Ø Ø

Ø −B1 · · · Ø Ø...

. . . . . ....

...

Ø Ø · · · −BN−2 Ø

Ø Ø · · · Ø −BN−1

∇g(xF , uF ) =

∇xg

x Ø

Ø ∇ugu

=

Cx1 · · · Ø Ø · · · Ø...

. . ....

.... . .

...

Ø · · · CxN Ø · · · Ø

Ø · · · Ø Cu1 · · · Ø

.... . .

......

. . ....

Ø · · · Ø Ø · · · CuN

Un vector de direccion d verifica la condicion de Magasarian-Fromovitz si

∇h(xF , uF )·d = 0

∇ga(xF , uF )·d ≺ 0

siendo ga el conjunto de restricciones de desigualdad que estan activas. Dividiendoel vector d = [dx, du],

∇h(xF , uF )·d = ∇xh·dx +∇uh·du = 0

Page 304: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

288 C.3. Continuidad Lipschitz del coste optimo J∗N (xk)

y teniendo en cuenta que ∇xh es invertible se tiene que

dx = −(∇xh)−1·∇uh·du = hxu·du

La matriz (∇xh)−1 es una matriz triangular inferior y la matriz ∇uh es diagonal,por lo que hxu sera una matriz triangular inferior dada por:

hxuij =

0 i < j

Bj−1 i = j(i−1∏s=j

As

)·Bj−1 i > j

siendoi−1∏s=j

As = Aj·Aj−1 · · ·Ai

Se puede observar que

hxuij =

∂x(k + i|k)

∂u(k + j − 1|k)

Sustituyendo en ∇g

∇g·d =

∇xg

x·hxu

∇ugu

·du =

∇ug

x

∇ugu

·du

La submatriz superior ∇ugx es una matriz triangular superior tal que

∇ugxij =

∂gx(x(k + i|k))

∂u(k + j − 1|k)

La submatriz inferior ∇ugu es una submatriz diagonal a bloques tal que

∇uguij =

∂gu(u(k + i− 1|k))

∂u(k + j − 1|k)

Por tanto para que se satisfaga la condicion de Magasarian-Fromovitz deben ve-rificarse dos condiciones: que el jacobiano ∇uh sea de rango maximo y que las filasde ∇g·d correspondientes a las restricciones activas sean menores que cero para algunvector d. La primera de las condiciones se satisface siempre por ser la submatriz ∇xh

Page 305: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice C. Analisis de la continuidad del coste optimo 289

de rango maximo. La segunda condicion se satisface si y solo si dichas filas de la matriz∇g son de rango maximo por filas. Es decir, siempre que las restricciones expresadasde forma no simultanea, verifiquen la condicion de independencia lineal.

Esta condicion no es muy exigente y es suficiente para la aplicacion de metodosduales de optimizacion.

Por otro lado, el conjunto de actuaciones factibles asociada a un determinado estadode la planta U(xk) debe ser uniformemente compacto. Dado que las actuaciones estanrestringidas a un conjunto compacto U , el conjunto U(xk) es acotado.

Corolario C.4 Sea el problema de optimizacion del MPC (C.1) tal que el modelo deprediccion F (x, u), la funcion de coste de etapa L(x, u), la funcion de coste terminalV (x) y las funciones que definen los conjuntos de restricciones gx(x), gu(u) son fun-ciones C1. Sea un estado actual xk tal que el conjunto de actuaciones factibles es unconjunto compacto. Sea el optimo de dicho problema tal que satisface la condicion deindependencia lineal de las restricciones activas. Entonces la funcion de coste optimoJ∗N(xk) es localmente Lipschitz en un vecindad de estados en torno a xk.

Corolario C.5 Sea el problema de optimizacion del MPC (C.1) tal que el modelo deprediccion F (x, u), la funcion de coste de etapa L(x, u), la funcion de coste termi-nal V (x) y las funciones que definen los conjuntos de restricciones gx(x), gu(u) sonfunciones C2. Sea el optimo de dicho problema tal que satisface la condicion de inde-pendencia lineal de las restricciones activas y la condicion suficiente de segundo orden.Entonces la funcion de coste optimo J∗N(xk) es localmente Lipschitz en un vecindad deestados en torno a xk.

De estos dos resultados se infiere que si las funciones que definen el problema deoptimizacion son C1, entonces es necesario comprobar la compacidad del conjunto deactuaciones factibles. En el caso en que estas funciones sean C2 entonces no es necesariodeterminar dicha compacidad.

Teorema C.6 Sea el problema de optimizacion MPC tal que el coste optimo es local-mente Lipschitz en una vecindad de x, para todo estado x en el que el problema tienesolucion factible x ∈ XN . Entonces el coste optimo es Lipschitz en todo subconjuntoconexo y compacto de XN .

Page 306: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

290 C.3. Continuidad Lipschitz del coste optimo J∗N (xk)

Demostracion:

Supongase que conjunto XN es un conjunto compacto (Mayne 2001)(si no fuese ası,el resultado es valido para un conjunto compacto incluido en XN , como por ejemploΩr = x ∈ IRn : J∗N(x) ≤ r). Sea Φ un conjunto convexo tal que Φ ⊆ XN . Entonespara todo x, y ∈ Φ existe una recta de la forma z = x+λ·(y−x) con λ ∈ [0, 1]. Sea zkuna secuencia de nz puntos de dicha recta con z1 = x y znz = y, tal que zk+1 pertenecea la vecindad de zk en la que la funcion de coste optimo es localmente Lipschitz conuna constante de Lipschitz Lk.

Entonces se tiene que

|JN(x, u∗F (x))− JN(y, u∗F (y))| = |nz−1∑

k=1

JN(zk, u∗F (zk))−

nz∑

k=2

JN(zk, u∗F (zk))|

≤nz−1∑

k=1

|JN(zk, u∗F (zk))− JN(zk+1, u

∗F (zk+1))|

≤nz−1∑

k=1

Lk·‖zk+1 − zk‖

≤ LJ ·nz−1∑

k=1

‖zk+1 − zk‖ = LJ ·‖x− y‖

La constante LJ es la mayor de las constantes de Lipschitz Lk.

En caso de que el conjunto XN sea convexo, este resultado demuestra que es Lip-schitz. En caso de que no lo sea, el conjunto XN podrıa ser no conexo. En este casoconsiderese que XN =

⋃i X

iN siendo X i

N subconjuntos conexos disjuntos de XN .

El resultado obtenido para conjuntos convexos se puede extender a conjuntos noconvexos conexos: para todo par de puntos x, y pertenecientes a X i

N existe una secuen-cia finita de nv puntos vk con v1 = x y vnv = y, tales que todos los puntos de larecta vk + λk·(vk+1 − vk) pertenecen a XN y ademas ‖vk − vk+1‖ ≤ ‖x− y‖. Entonces,se tiene que

|JN(x, u∗F (x))− JN(y, u∗F (y))| = |nv−1∑

k=1

JN(vk, u∗F (vk))−

nv∑

k=2

JN(vk, u∗F (vk))|

≤nv−1∑

k=1

LJi·‖vk+1 − vk‖ = nv·LJi·‖x− y‖

Por tanto J∗N(x) es Lipschitz en X iN .

Page 307: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice C. Analisis de la continuidad del coste optimo 291

C.3.2. MPC sin restricciones en el estado

Lema C.7 Sea la funcion de coste de etapa L(x, u) Lipschitz en x con una constanteLc. Sea el modelo del sistema F (x, u) Lipschitz en x con una constante Lf . Sea lafuncion de Lyapunov asociada al controlador local en la region terminal V (x) Lipschitzen x con una constante Lv. Entonces se verifica que

|JN(x + ∆x, uF )− JN(x, uF )| ≤ LJ ·‖∆x‖

siendo

LJ = Lc·LN

f − 1

Lf − 1+ Lv·LN

f

Demostracion:

Sea x(k + j|k) el estado predicho con el modelo tal que xk = x, y sea x(k + j|k) alestado predicho partiendo de xk = x + ∆x. Dado que el modelo es Lipschitz en x, setiene que

‖x(k + j|k)− x(k + j|k)‖ ≤ Ljf ·‖∆x‖

Segun esto se tiene que

|JN(x + ∆x, uF )− JN(x, uF )| = |N−1∑

i=0

L(x(k + i|k), u(k + i|k))

−L(x(k + i|k), u(k + i|k))

+V (x(k + N |k))− V (x(k + N |k))|

≤N−1∑

i=0

Lc·Lif ·‖∆x‖+ Lv·LN

f ·‖∆x‖

≤(Lc·

LNf − 1

Lf − 1+ Lv·LN

f

)·‖∆x‖

Teorema C.8 Sea un sistema no lineal controlado por un MPC cuyo dominio de atrac-cion es XN . Sea la funcion de coste de etapa L(x, u) Lipschitz respecto a x en el con-junto XN con una constante Lc. Sea el modelo del sistema F (x, u) Lipschitz respecto

Page 308: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

292 C.3. Continuidad Lipschitz del coste optimo J∗N (xk)

a x en el conjunto XN con una constante Lf . Sea la funcion de Lyapunov asociada alcontrolador local en la region terminal V (x) Lipschitz respecto a x en el conjunto XN

con una constante Lv. Entonces el coste optimo es Lipschitz en XN de forma que

|J∗N(y)− J∗N(x)| ≤ LJ ·‖y − x‖

para todo x, y ∈ XN , siendo

LJ = Lc·LN

f − 1

Lf − 1+ Lv·LN

f

Demostracion:

Por el principio de optimalidad se tiene que

J∗(y) < J(y, uF )

para toda secuencia de actuaciones factibles. Teniendo en cuenta que la secuenciaoptima en x, u∗F (x), es factible para todo y ∈ XN y considerando el lema anterior, sedemuestra el teorema. Para ello se distinguen dos casos:

a) J∗N(y) > J∗N(x)

J∗N(y)− J∗N(x) ≤ JN(y, u∗F (x))− JN(x, u∗F (x)) ≤ LJ ·‖y − x‖

b) J∗N(y) < J∗N(x)

J∗N(x)− J∗N(y) ≤ JN(x, u∗F (y))− JN(y, u∗F (y)) ≤ LJ ·‖y − x‖

y por tanto

|J∗N(y)− J∗N(x)| ≤ LJ ·‖y − x‖

siendo LJ la constante calculada en el lema anterior.

Page 309: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Apendice C. Analisis de la continuidad del coste optimo 293

C.4. Continuidad Lipschitz local del coste optimo

J∗N(xk) ante incertidumbres parametricas

Sea un sistema que responde a un modelo

xk+1 = f(xk, uk, wk) (C.4)

siendo xk ∈ IRn el estado del sistema en el instante k, uk ∈ IRm el vector de actuacionessobre el sistema y wk ∈ IRq las incertidumbres que afectan al sistema. Cada una deestas senales estan confinadas en una serie de restricciones a lo largo del tiempo, deforma que

xk ∈ X (C.5)

uk ∈ U (C.6)

wk ∈ W (C.7)

El sistema presenta, en ausencia de incertidumbres, un punto de equilibrio en el origen,por tanto f(0, 0, 0) = 0. En consecuencia, para que el sistema en ausencia de incer-tidumbres pueda evolucionar al punto de equilibrio, los conjuntos X, U y W debencontener el vector nulo en su interior.

En lo que sigue se denotara f(xk, uk) = f(xk, uk, 0) al modelo nominal del sistema,en ausencia de incertidumbres sobre el sistema. Al estado obtenido con el modelonominal, se denotara xk.

El problema de optimizacion del MPC es en este caso un problema NLP parametri-co que depende en general del estado actual y del valor del parametro del modelo wconsiderado en la prediccion del comportamiento del sistema. Si este se considera con-stante para toda la prediccion, entonces el coste optimo dependera de J∗N(xk, wk). Sinembargo, si se considera que el parametro del modelo varıa a lo largo de la prediccion,el coste optimo dependera de la realizacion de incertidumbres futuras que afectan alsistema wF , J∗N(xk, wF ). En lo que sigue se considera el primer caso.

La solucion optima del MPC en el caso nominal (en ausencia de incertidumbres) esJ∗(xk, 0). La variacion del coste optimo ante una variacion en wk es un problema deanalisis de sensibilidad y se puede aplicar los resultados del apartado C.2. En particular,bajo hipotesis semejantes a las obtenidas para la continuidad Lipschitz frente al estado,el coste optimo es Lipschitz ante variaciones en las incertidumbres.

Corolario C.9 Sea el problema de optimizacion del MPC (C.1) tal que el modelo deprediccion F (x, u, w), la funcion de coste de etapa L(x, u), la funcion de coste termi-nal V (x) y las funciones que definen los conjuntos de restricciones gx(x), gu(u) son

Page 310: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

294 C.4. Continuidad Lipschitz local del coste optimo J∗N (xk) ante incertidumbres parametricas

funciones C1. Sea un estado actual xk tal que el conjunto de actuaciones factibles esun conjunto compacto para un conjunto de realizaciones de las incertidumbres en unavecindad de wk = 0. Sea el optimo del problema MPC con el modelo nominal (wk = 0)tal que satisface que la condicion de independencia lineal de las restricciones activas.Entonces la funcion de coste optimo J∗(xk, wk) es localmente Lipschitz en un vecindadde incertidumbres wk en torno a wk = 0.

|J∗(xk, wk)− J∗(xk, 0)| ≤ Lw·‖wk‖

Por tanto la variacion del coste optimo por una variacion en las incertidumbres esta aco-tada, y dicha cota dependera en general del tamano del conjunto de incertidumbres W .

Este resultado es de particular interes para el analisis de robustez del MPC anteincertidumbres no aditivas.

Page 311: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

Bibliografıa

Alamir, M. & Bornard, G. (1995), ‘Stability of truncated infinite constrained recedinghorizon scheme: The gerenal discrete nonlinear case’, Automatica 31, 1353–1356.

Allgower, F., Badgwell, T. A., Qin, J. S., Rawlings, J. B. & Wright, S. J. (1999), Non-linear model predictive control and moving horizon estimation - an introductoryoverview, in P. M. Frank, ed., ‘Advances in Control’, Springer, pp. 391–449.

Arstein, Z. (1983), ‘Stabilization with relaxed controls’, Nonlinear Analysis 7, 1163–1173.

Bellman, R. (1957), Dynamic Programming, Princeton Universuty Press.

Bemporad, A. (1998), Reducing conservativeness in predictive control of constrainedsystems with disturbances, in ‘Proceedings of the CDC’.

Bemporad, A., Borrelli, F. & Morari, M. (2001), Robust model predictive control:Piecewise linear explicit solution, in ‘Proceedings of the ECC’.

Bemporad, A., Chisci, L. & Mosca, E. (1995), ‘On the stabilizing property of SIORHC’,Automatica 31, 2013–2015.

Bemporad, A., Morari, M., Dua, V. & Pistikopoulos, E. (2000), The explicit solutionof model predictive control via multiparametric quadratic programming, en ‘Pro-ceedings of the ACC’.

Bertsekas, D. M. (1972), ‘Infinite-time reachability of state-space regions by using feed-back control’, IEEE Transactions on Automatic Control 17, 604–612.

Biegler, L. T. (1998), ‘Advances in nonlinear programming concepts for process control’,International Journal of Process Control 8(5-6), 301–311.

Bitmead, R. R., Gervers, M. & Wertz, V. (1990), Adaptive optimal control - The think-ing’s man GPC, Prentice-Hall.

Bitsoris, G. (1988), ‘On the positive invariance of polyhedral sets for discrete-timesystems’, Systems & Control Letters 11, 243–248.

295

Page 312: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

296 BIBLIOGRAFIA

Blanchini, F. (1994), ‘Ultimate boundedness control for discrete-time uncertain systemvia set-induced lyapunov functions’, IEEE Transactions on Automatic Control39, 428–433.

Blanchini, F. (1999), ‘Set invariance in control’, Automatica 35, 1747–1767.

Boyd, S., Ghaoui, L. E., Feron, E. & Balakrishnan, V. (1994), Linear Matrix Inequalitiesin systems and control theory, SIAM.

Bryson, A. & Ho, Y. (1969), Applied Optimal Control, Blaisdell Publishing Company.

Camacho, E. F. & Bordons, C. (1999), Model Predictive Control, 2 edn, Springer-Verlag.

Campo, P. J. & Morari, M. (1987), Robust model predictive control, en ‘Proceedingsof the ACC’.

Chen, H. & Allgower, F. (1997), A quasi-infinite horizon nonlinear model predictivecontrol scheme for stable systems: application to a CSTR, en ‘Proceedings of theADCHEM’.

Chen, H. & Allgower, F. (1998a), Nonlinear model predictive control scheme withguaranteed stability, en R.Berber & C. Kravaris, eds, ‘Nonlinear Model BasedProcess Control’, Kluwer Academic Publisher, pp. 465–494.

Chen, H. & Allgower, F. (1998b), ‘A quasi-infinite horizon nonlinear model predictivecontrol scheme with guaranteed stability’, Automatica 34(10), 1205–1218.

Chisci, L., & Mosca, E. (1994), ‘Stabilizing i-o receding horizon control of CARMAplants’, IEEE Transactions on Automatic Control 39, 614–618.

Chisci, L., Lombardi, A. & Mosca, E. (1996), ‘Dual receding horizon control of con-strained discrete-time linear systems’, European Journal of Control 2, 278–285.

Chisci, L., Rossiter, J. A. & Zappa, G. (2001), ‘Systems with persistent disturbances:predictive control with restricted constraints’, Automatica 37, 1019–1028.

Chisci, L. & Zappa, G. (1999), Robustifying a predictive controller against persistentdisturbances, en ‘Proceedings of the ECC’.

Clarke, D. W., Mohtadi, C. & Tuffs, P. S. (1987a), ‘Generalized predictive control. PartI: The basic algorithms’, Automatica 23, 137–148.

Clarke, D. W., Mohtadi, C. & Tuffs, P. S. (1987b), ‘Generalized predictive control. PartII: Extensions and interpretations’, Automatica 23, 149–160.

Cutler, C. R. & Ramaker, B. L. (1980), Dynamic matrix control- a computer controlalgorithm, en ‘Proceedings of Automatic Control Conference’.

Page 313: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

BIBLIOGRAFIA 297

De Nicolao, G., Magni, L. & Scattolini, R. (1996), ‘On the robustness of receding hori-zon control with terminal constraints’, IEEE Transactions on Automatic Control41, 451–453.

De Nicolao, G., Magni, L. & Scattolini, R. (1998), ‘Stabilizing receding-horizon controlof non-linear time-varying systems’, IEEE Transactions on Automatic Control43, 1030–1036.

De Nicolao, G., Magni, L. & Scattolini, R. (2000), Stability and robustness of nonlin-ear receding horizon control, en F.Allgower & A.Zheng, eds, ‘Nonlinear ModelPredictive Control’, Birkhauser.

De Oliveira Kothare, S. L. & Morari, M. (2000), ‘Contractive model predictive con-trol for constrained nonlinear systems’, IEEE Transactions on Automatic Control45, 1053–1071.

Fiacco, A. V. (1983), Introduction to Sensivity and Stability Analysis in NonlinearProgramming, Vol. 165 of Mathematics in Science and Engineering, AcademicPress.

Garcıa, C. E. & Morshedi, A. M. (1986), ‘Quadratic programming solution of dynamicmatrix control (QDMC)’, Chemical Engineering Communications 46, 73–87.

Garcıa, C. E., Prett, D. M. & Morari, M. (1989), ‘Model predictive control: theory andpractice - a survey’, Automatica 25, 335–348.

Gauvin, J. & Dubeau, F. (1982), ‘Differential properties of the marginal function inmathematical programming’, Mathematical Programming Study 19, 101–119.

Genceli, H. & Nikolau, M. (1993), ‘Robust stability analysis of constrained l1-normmodel predictive control’, AIChE Journal 39, 1954–1965.

Geromel, J. C. & Da Cruz, J. J. (1987), ‘On the robustness of optimal regulatorsfor nonlinear discrete-time systems’, IEEE Transactions on Automatic Control32, 703–710.

Gilbert, E. G. & Tan, K. (1991), ‘Linear systems with state and control constraints: Thetheory and application of maximal output admissible sets’, IEEE Transactions onAutomatic Control 36, 1008–1020.

Glad, S. T. (1987), ‘Robustness of nonlinear state feedback - a survey’, Automatica23, 425–435.

Gomez Ortega, J. (1994), Navegacion en robots moviles basada en tecnicas de controlpredictivo neuronal, PhD thesis, Universidad de Sevilla.

Gomez Ortega, J., Ramırez, D. R., Limon Marruedo, D. & Camacho, E. F. (2001), Ge-netic algorithms based predictive control for mobile robot navigation in changingenvironments, en ‘Proceedings of the ECC’.

Page 314: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

298 BIBLIOGRAFIA

Hansen, E. (1992), Global optimization using interval analysis, Marcel Dekker, Inc.

Henson, M. A. & Seborg, D. E. (1997), Nonlinear process control, Prentice Hall.

Jadbabaie, A., Yu, J. & Hauser, J. (2001), ‘Unconstrained receding-horizon control ofnonlinear systems’, IEEE Transactions on Automatic Control 46(5), 776–783.

Jiang, Z.-P. & Wang, Y. (2001), ‘Input-to-state stability for discrete-time nonlinearsystems’, Automatica 37, 857–869.

Jiang, Z.-P. & Wang, Y. (2002), ‘A converse lyapunov theorem for discrete-time systemswith disturbances’, Systems & Control Letters 45, 49–58.

Jiang, Z., Sontag, E. & Wang, Y. (1999), Input-to-state stability for discrete-timenonlinear systems, en ‘Proceedings of the IFAC World Congress’.

J.Qin, S. & Badgwell, T. A. (1997), An overview of industrial model predictive controltechnology, en ‘Proceedings of the conference on Chemical Process Control’.

Keartfort, R. B. (1996), Rigorous global search: continuous problems, Kluwer AcademicPublishers.

Keerthi, S. S. & Gilbert, E. G. (1987), ‘Computation of minimum-time feedback controllaws for discrete-time systems with state-control constraints’, IEEE Transactionson Automatic Control 32, 432–435.

Keerthi, S. S. & Gilbert, E. G. (1988), ‘Optimal infinite-horizon feedback laws for ageneral class of constrained discrete-time systems: Stability and moving-horizonapproximations’, Journal of Optimization Theory and Applications 37, 265–293.

Kerrigan, E. C. (2000), Robust Constraint Satisfaction: Invariant Sets and PredictiveControl, PhD thesis, University of Cambridge.

Kerrigan, E. C. & Maciejowski, J. M. (2000), Invariant sets for constrained discrete-timesystems with application to feasibility in model predictive control, en ‘Proceedingsof the CDC’.

Kerrigan, E. C. & Maciejowski, J. M. (2001), Robust feasibility in model predictivecontrol: Necessary and sufficient conditions, en ‘Proceedings of the CDC’.

Khalil, H. (1996), Nonlinear Systems, 2 edn, Prentice-Hall.

Kolmanovsky, I. & Gilbert, E. G. (1998), ‘Theory and conmputation of disturbanceinvariant sets for discrete-time linear systems’, Mathematical Problems in Engi-neering: Theory, Methods and Applications 4, 317–367.

Kothare, M. V., Balakrishnan, V. & Morari, M. (1996), ‘Robust constrained modelpredictive control using linear matrix inequalities’, Automatica 32, 1361–1379.

Page 315: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

BIBLIOGRAFIA 299

Kwon, W. H. & Pearson, A. E. (1977), ‘A modified quadratic cost problem and feedbackstabilization of a linear system’, Automatica 22, 838–842.

Lee, E. B. & Markus, L. (1967), Foundations of optimal control theory, Wiley.

Lee, J. H. & Yu, Z. (1997), ‘Worst-case formulations of model predictive control forsystems with bounded parameters’, Automatica 33, 763–781.

Limon Marruedo, D., Alamo, T. & Camacho, E. F. (2002a), Enlarging the domain ofattraction of MPC controller using invariant sets, en ‘Proceedings of the IFACWorld Congress’.

Limon Marruedo, D., Alamo, T. & Camacho, E. F. (2002b), Input-to-state stable MPCfor constrained discrete-time nonlinear systems with bounded additive uncertain-ties, en ‘Proceedings of the CDC’.

Limon Marruedo, D., Alamo, T. & Camacho, E. F. (2002c), Stability analysis of sys-tems with bounded additive uncertainties based on invariant sets: Stability andfeasibility of MPC, en ‘Proceedings of the ACC’.

Limon Marruedo, D., Alamo, T. & Camacho, E. F. (2003), Stable constrained MPCwithout terminal constraint, en ‘Proceedings of the ACC, (pendiente de revision)’.

Limon Marruedo, D., Bravo, J. M., Alamo, T. & Camacho, E. F. (2002), Robust MPCof constrained discrete-time nonlinear systems based on uncertain evolution sets:application to a CSTR model, en ‘Proceedings of the CCA’.

Luenberger, D. E. (1989), Programacion lineal y no lineal, Addison-Wesley Iberoamer-icana.

Magni, L., De Nicolao, G., Magnani, L. & Scattolini, R. (2001), ‘A stabilizing model-based predictive control algorithm for nonlinear systems’, Automatica 37, 1351–1362.

Magni, L., Nijmeijer, H. & van der Shaft, A. (2001), ‘A receding-horizon approach tothe nonlinear H∞ control problem’, Automatica 37, 429–435.

Magni, L. & Sepulchre, R. (1997), ‘Stability margins of nonlinear receding-horizoncontrol via inverse optimality’, Systems & Control Letters 32, 241–245.

Marquis, P. & Broustail, J. P. (1988), SMOC, a bridge between state space and modelpredictive controllers: application to the automation of a hydrotreating unit, en‘Proceedings of the IFAC Workshop on model based predictive control’.

Mayne, D. Q. (2000), Nonlinear model predictive control: Challeges and opportunities,en F.Allgower & A.Zheng, eds, ‘Nonlinear Model Predictive Control’, Birkhauser,pp. 23–44.

Page 316: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

300 BIBLIOGRAFIA

Mayne, D. Q. (2001), ‘Control of constrained dynamic systems’, European Journal ofControl 7, 87–99.

Mayne, D. Q. & Michalska, H. (1990), ‘Robust horizon control of nonlinear systems’,IEEE Transactions on Automatic Control 35, 814–824.

Mayne, D. Q., Rawlings, J. B., Rao, C. V. & Scokaert, P. O. M. (2000), ‘Constrainedmodel predictive control: Stability and optimality’, Automatica 36, 789–814.

Mayne, D. Q. & Schroeder, W. R. (1997), ‘Robust time-optimal control of constrainedlinear systems’, Automatica 33(12), 2103–2118.

Michalska, H. & Mayne, D. Q. (1993), ‘Robust receding horizon control of constrainednonlinear systems’, IEEE Transactions on Automatic Control 38(11), 1623–1633.

Moore, E. (1996), Interval analysis, Prentice Hall.

Morari, M. (1994), Model predictive control: Multivariable control technique of choicein the 1990s?, en D. Clarke, ed., ‘Advances in Model-Based Predictive Control’,Oxford University Press.

Muske, K. R. (1995), Linear model predictive control of chemical processes, PhD thesis,The University of Texas at Austin.

Nevistic, V. (1997), Constrained control of nonlinear systems, PhD thesis, Swiss FederalInstitute of technology (ETH), Zurich (Suiza).

Ollero, P. & Camacho, E. F. (1997), Control e instrumentacion de procesos quımicos,Editorial Sıntesis.

Parisini, T. & Zoppoli, R. (1995), ‘A receding-horizon regulator for nonlinear systemsand a neural approximation’, Automatica 31(10), 1443–1451.

Primbs, J. A., Nevistic, V. & Doyle, J. C. (2000), ‘A receding horizon generaliza-tion of pointwise min-norm controllers’, IEEE Transactions on Automatic Control45, 898–909.

Propoi, A. I. (1963), ‘Use of linear programming methods for synthesizing sampled-dataautomatic systems’, Automation and Remote Control 24, 837–844.

Ramırez, D. R. (2002), Control Predictivo min-max: analisis, caracterizacion y tecnicasde implementacion, PhD thesis, Universidad de Sevilla.

Ramırez, D. R., Limon Marruedo, D., Gomez Ortega, J. & Camacho, E. F. (1999a),Model based predictive control using genetic algorithms: Application to a pilotplant, en ‘Proceedings of the ECC’.

Ramırez, D. R., Limon Marruedo, D., Gomez Ortega, J. & Camacho, E. F. (1999b),Nonlinear MBPC for mobile robot navigation using genetic algortihms, en ‘Pro-ceedings of the ICRA’.

Page 317: TESIS DOCTORAL - Universidad de Sevillalimon/papers/LimonPHD02.pdfF(k) Secuencia optima, soluci´on del problema de optimizaci´on del MPC con horizonte N, en el instante k. x⁄(k

BIBLIOGRAFIA 301

Rawlings, J. B. & Muske, K. R. (1993), ‘Stability of constrained receding horizoncontrol’, IEEE Transactions on Automatic Control 38, 1512–1516.

Richalet, J., Rault, A., Testud, J. L. & Papon, J. (1978), ‘Model predictive heuristiccontrol: Applications to industrial processes’, Automatica 14, 413–428.

Santos, L. O. & Biegler, L. T. (1999), ‘A tool to analyze robust stability for modelpredictive controllers’, Journal of Process Control 9, 234–246.

Scokaert, P. O. M. & Mayne, D. Q. (1998), ‘Min-max feedback model predictive con-trol for constrained linear systems’, IEEE Transactions on Automatic Control43(8), 1136–1142.

Scokaert, P. O. M., Mayne, D. Q. & Rawlings., J. B. (1999), ‘Suboptimal model pre-dictive control (feasibility implies stability)’, IEEE Transactions on AutomaticControl 44(3), 648–654.

Scokaert, P. O. M., Rawlings, J. B. & Meadows, E. S. (1997), ‘Discrete-time sta-bility with perturbations: Application to model predictive control’, Automatica33(3), 463–470.

Seborg, D. E., Edgar, T. & Mellichamp, D. (1989), Process Dynamics and Control,Wiley.

Sontag, E. D. (1989a), ‘Smooth stabilization implies coprime factorization’, IEEETransactions on Automatic Control 34, 435–443.

Sontag, E. D. (1989b), ‘A ’universal’ construction of the Arstein’s theorem on nonlinearstabilization’, Systems & Control Letters 13, 117–123.

Sznaier, M. & Damborg, M. J. (1987), Suboptimal control of linear systems with stateand control inequality constraints, en ‘Proceedings of the CDC’.

Vidyasagar, M. (1993), Nonlinear Systems Theory, 2 edn, Prentice-Hall.

Yang, T. H. & Polak, E. (1993), ‘Moving horizon control of nonlinear systems withinput saturation, disturbances and plant uncertainty’, International Journal ofControl 58, 875–903.

Zafiriou, E. (1990), ‘Robust model predictive control of systems with hard constraints’,Computers and Chemical Engineering 14, 359–371.

Zheng, A. (2000), Some practical issues and possible solutions for nonlinear modelpredictive control, en F.Allgower & A.Zheng, eds, ‘Nonlinear Model PredictiveControl’, Birkhauser.