Cap7 Flujos Optimos

22
Problema de flujos óptimos - JMRA 163 Capítulo 7 OBJETIVOS DEL PROBLEMA DE FLUJOS ÓPTIMOS 1.0 Introducción Se ha llamado flujos óptimos al problema cuyo resultado es una solución a las ecuaciones de flujos en estado estable senoidal, que maximiza o minimiza un objetivo expresado matemáticamente. Esta solución debe respetar los límites de operación de los elementos que integran el sistema de potencia, así como también satisfacer las condiciones que determinan la calidad y continuidad del suministro de energía eléctrica. Estas restricciones, expresadas matemáticamente se pueden clasificar, según se desee que se cumplan, en: restricciones de igualdad, (p. ej., las leyes de Kirchoff), y en restricciones de desigualdad, (p. ej., la potencia que genere la máquina debe estar entre sus límites). Así definido, el problema de flujos óptimos se puede formular como cualquier otro problema de programación no-lineal, de la siguiente manera: (7.1) i donde: x es el vector de variables; f(x) es la función objetivo; g (x) es la i-ésima restricción de i igualdad; h (x) es la i-ésima restricción de desigualdad. 1.1 Funciones objetivo Las funciones objetivo son la representación matemática de las políticas bajo las cuales un problema se optimiza. Aportan un índice que indica qué tan apropiada es una solución, y habitualmente, en el terreno de los sistemas eléctricos de potencia, se redenominan de acuerdo al problema que se trata de resolver, de modo que, las funciones objetivo se identifican con el campo de aplicación, independientemente de la técnica o método de solución. En sistemas de potencia se han agrupado varias de estas funciones objetivo bajo el término de “flujos óptimos”, que como se ha indicado, son soluciones a las ecuaciones de flujos en las que cada solución difiere de otra por el objetivo. A manera de ejemplo listamos las siguientes aplicaciones. (1) Despacho económico.- Dadas la cargas por nodo, deseamos determinar las potencias que se deben generar en cada nodo , de tal manera que se satisfagan las demandas y esto se logre con el mínimo costo. (2) Pérdidas mínimas de transmisión.- El planteamiento es similar al anterior, con la diferencia

Transcript of Cap7 Flujos Optimos

Problema de flujos óptimos - JMRA

163

Capítulo 7

OBJETIVOS DEL PROBLEMA DE FLUJOS ÓPTIMOS

1.0 Introducción

Se ha llamado flujos óptimos al problema cuyo resultado es una solución a las ecuaciones de flujosen estado estable senoidal, que maximiza o minimiza un objetivo expresado matemáticamente. Estasolución debe respetar los límites de operación de los elementos que integran el sistema de potencia,así como también satisfacer las condiciones que determinan la calidad y continuidad del suministrode energía eléctrica. Estas restricciones, expresadas matemáticamente se pueden clasificar, según sedesee que se cumplan, en: restricciones de igualdad, (p. ej., las leyes de Kirchoff), y en restriccionesde desigualdad, (p. ej., la potencia que genere la máquina debe estar entre sus límites).Así definido, el problema de flujos óptimos se puede formular como cualquier otro problema deprogramación no-lineal, de la siguiente manera:

(7.1)

idonde: x es el vector de variables; f(x) es la función objetivo; g (x) es la i-ésima restricción de

iigualdad; h (x) es la i-ésima restricción de desigualdad.

1.1 Funciones objetivo

Las funciones objetivo son la representación matemática de las políticas bajo las cuales un problemase optimiza. Aportan un índice que indica qué tan apropiada es una solución, y habitualmente, en elterreno de los sistemas eléctricos de potencia, se redenominan de acuerdo al problema que se tratade resolver, de modo que, las funciones objetivo se identifican con el campo de aplicación,independientemente de la técnica o método de solución. En sistemas de potencia se han agrupadovarias de estas funciones objetivo bajo el término de “flujos óptimos”, que como se ha indicado, sonsoluciones a las ecuaciones de flujos en las que cada solución difiere de otra por el objetivo. Amanera de ejemplo listamos las siguientes aplicaciones.

(1) Despacho económico.- Dadas la cargas por nodo, deseamos determinar las potencias que sedeben generar en cada nodo , de tal manera que se satisfagan las demandas y esto se logrecon el mínimo costo.

(2) Pérdidas mínimas de transmisión.- El planteamiento es similar al anterior, con la diferencia

Problema de flujos óptimos - JMRA

164

que ahora se minimizan las pérdidas en líneas. Equivale a minimizar el flujo de potenciareactiva por la red, buscando mejorar los perfiles de voltaje.

(3) Cortes óptimos de carga.- En este caso la potencia generada es conocida, pero no essuficiente para satisfacer la demanda. Se busca minimizar los cortes de las cargas queproduzcan más pérdidas en el sistema o de acuerdo a prioridades.

(4) Máximas pérdidas de transmisión.- Dadas las generaciones por nodo, se desea encontrar laconfiguración de cargas más pesimista.

(5) Minimización de la contaminación.- La generación de energía eléctrica por plantas decarbón, gas natural, etc., generan emisiones de gases que contaminan el ambiente. Se tratade minimizar la concentración de contaminantes en determinadas áreas.

(6) Optimización de capacitores y su localización.- Mantener un perfil de voltaje alto esparticularmente importante en condiciones de falla. En este caso, la función objetivo es lasuma de admitancias de los capacitores, y se analiza para cada una de las contingencias quese establezcan. El problema puede formularse para que el óptimo que se obtenga lo sea paraun período de tiempo.

1.2 De las restricciones

Cuando una solución a un problema de optimización cumple con las restricciones que se le imponen,aún sin ser óptima, se dice que es factible. La existencia de una solución factible demuestra laexistencia de un óptimo, pues en este caso, óptimo implica cumplir con las restricciones, aparte deoptimizar la función objetivo.En el caso de los sistemas de potencia, las primeras restricciones que se imponen, son las ecuacionesde flujos, que deben cumplirse en igualdad:

(7.2)

Gi Didonde: P es la potencia real generada en el i-ésimo nodo; P es la potencia real demandada en el

Gi Dii-ésimo nodo; Q es la potencia reactiva generada en el i-ésimo nodo; Q es la potencia reactiva

i ijdemandada en el i-ésimo nodo; V magnitud del voltaje del i-ésimo nodo; Y magnitud de la

i ijadmitancia de línea i-j; * ángulo de voltaje del i-ésimo nodo; 2 es el ángulo de la admitancia de lalínea i-j.

Las limitantes físicas de los equipos y de la calidad del servicio se introducen al problema deoptimización mediante restricciones de desigualdad, por ejemplo, un voltaje debe tomar un valordentro de ciertos límites:

i_m i i_MV #V #V

Problema de flujos óptimos - JMRA

165

i_m i_Mdonde: V es el voltaje mínimo que puede tomar el voltaje del i-ésimo nodo; V es el voltajemáximo que puede tomar el voltaje del i-ésimo nodo.

iLa representación de la desigualdad anterior en la forma clásica, h (x) # 0, se logradescomponiéndola en dos desigualdades del siguiente tipo:

i i_MV - V # 0

i_m iV - V # 0Aparte de las restricciones en la magnitud del voltaje nodal, en el proceso de optimización es posibleintroducir más restricciones, dentro de las cuales anotamos las siguientes.

b) de potencia real y reactiva generada por cada máquina:

g_m g g_MP # P # P

g_m g g_MQ # Q # Q

c) de potencia real transmitida por una línea:

ij ij_M| P | # | P |

d) de taps de transformadores:

i_m i i_Mt # t # t

Dentro de las restricciones de desigualdad que implícitamente manejan la seguridad, podemos listarlas siguientes:

e) mantener suficiente capacidad de reserva:

i gi 0K P + R $ R

i 0donde: K es un factor; R es la máxima capacidad disponible de las plantas generadoras en línea;R son los requerimientos de capacidad de reserva.

f) De contingencias. Esta restricción trata de evitar sobrecargas en las líneas (i, j) cuando otra línea(k, m) se abre. Esto se expresa como:

Donde se introduce el subíndice x en el límite de la potencia máxima a transmitir entre los nodos (i,

Problema de flujos óptimos - JMRA

166

j) para indicar que dicho límite es válido para un determinado intervalo de tiempo.

Por lo tanto, la formulación general puede describirse como:

Minimizar una función objetivo escalar a través del control de u

(7.3)

Sujeto a las restricciones de igualdad de las ecuaciones de flujos de potencia

jg (x, u) = 0 j = 1, 2, ..., n (7.4)

y sujeto a las restricciones de desigualdad sobre los parámetros de control

i_min i i_maxu # u # u i = 1, 2, ...m (7.5)

y sobre las variables y funciones dependientes

j_min j j_maxx # x # x j = 1, 2, ...n (7.6)

k_min k k_maxh # h (x, u) # h k = 1, 2, ...l (7.7)donde:

(7.8)

(7.9)

(7.10)

1.3 Formulación del problema de despacho económico

Problema de flujos óptimos - JMRA

167

El problema de despacho económico puede formularse como:

sujeto a:

(7.11)

i i idonde; n es el número de generadores conectados al sistema; a , b , c son los parámetros de la curva

ide entrada-salida de cada generador; I es el conjunto de nodos que conectan con el i-ésimo nodo.

1.4 De la existencia y unicidad de un óptimo

Es difícil determinar si una solución óptima (global o local) es única. Es más, el óptimo puede noestar unívocamente definido. La existencia de un mínimo global puede garantizarse si la funciónobjetivo es al menos pseudo convexa, y las restricciones son convexas generalizadas (convexa,pseudo convexa, cuasiconvexa).En nuestro caso la función objetivo es convexa, con lo que cumplimos con la primera parte, pero lasexpresiones completas de las ecuaciones de flujos son difíciles de analizar para determinar si sonconvexas generalizadas. De hecho, por su estructura, no parecen tener ninguna de las característicasde convexidad para todo el dominio. Como sólo nos interesa la región factible de estas ecuaciones,procede entonces un análisis de convexidad local, que es más difícil pues es necesario imponerlímites y dependencias entre las variables.

Abandonando un poco el rigor matemático, se pueden hacer aproximaciones a las ecuaciones deflujos. Es de notarse que estas aproximaciones pueden presentar características de convergenciamejores que las propias ecuaciones de flujos. Estas aproximaciones aprovechan el desacoplamientoque existe entre las potencias reales y los voltajes nodales, y entre las potencias reactivas y losángulos nodales.

Problema de flujos óptimos - JMRA

168

2.0 Introducción al problema de programación no-lineal

Se desea introducir en forma breve algunos conceptos de optimización de problemas no-lineales.El problema de programación no-lineal consiste en seleccionar los valores de algunas variables,generalmente no negativas, de manera que se maximice o minimice una función dada, sujeta a unconjunto de restricciones de igualdad y/o desigualdad.

En general la función por optimizar puede representar un beneficio o un costo debido al desarrollode alguna(s) actividad(es), mediante lo cual se busca cumplir algún objetivo o alcanzar alguna metao definir el proceso de operación de algún sistema, etc.

Analíticamentem el problema de programación no-lineal puede expresarse como:

(7.1)

Escrito en forma detallada,

(7.1')

1 2 ngeneralmente z $ 0, z $ 0, ..., z $ 0.

1 2 nLas n variables z , z , ..., z se definen como las n componentes reales del vector columna z. Lafunción objetivo f(z) representa el criterio para el cual se requiere encontrar su valor mínimo. Las

1 2 mfunciones de restricción g (z), g (z), ..., g (z) son representadas por el vector columna g(z), así como

1 2 plas h (z), h (z), ..., h (z) involucradas en las restricciones de desigualdad se representan por el vector

1 2 m 1 2 pcolumna h(z). Las constantes b , b , ..., b y c , c , ..., c se denominan las constantes o términosderechos de las restricciones y se representan por los vectores columna b y c, respectivamente.

1 2 m 1 2 pSe acepta que las m+p+1 funciones f(z), g (z), g (z), ..., g (z), h (z), h (z), ..., h (z) son funcionesdadas, contínuamente diferenciables, que no contienen elementos aleatorios; b y c están formados

Problema de flujos óptimos - JMRA

169

por números reales, y que z puede ser cualquier vector con n componentes reales, sujeto únicamentea las m+p+n restricciones definidas en (7.1); n, m y p son finitas.

Es común designar a las variables z como los instrumentos del proceso que se requiere optimizar.Las restricciones de desigualdad representan generalmente limitaciones físicas o de operación dealgún elemento dentro del sistema o limitaciones del proceso. Cuando se trata de un sistema físico,por ejemplo, aparecen comúnmente restricciones de igualdad, las que normalmente representan leyesfísicas del comportamiento del sistema. En el caso de un sistema eléctrico, éstas últimas pueden serlas leyes de Kirchoff y las primeras pueden ser voltajes o capacidades de generadores. Cuando seinvolucran en el problema restricciones de igualdad (leyes físicas o de comportamiento), enocasiones es conveniente subdividir las variables z en dos tipos de variables: variables de control yvariables de estado del sistema. Ya que en condiciones normales es posible ejercer algún tipo decontrol sobre el sistema para conducirlo a un estado determinado. Es conveniente notacionalmentesustituir la variable z por el par de vectores (x, u), con lo cual el problema (1) queda como sigue:

(7.2)

Nótese que el conjunto de restricciones g(x,u) = b y h(x,u) # c es la intersección de los conjuntos(x, u) para los cuales se cumplen simultáneamente el conjunto de restricciones:

Este conjunto (x, u) se denomina el conjunto de soluciones factibles o conjunto de oportunidadesdel problema.

2.1 Optimización clásica

Con el fin de iniciar en forma sencilla el análisis de las condiciones necesarias o requisitos para que(x, u) sea un punto óptimo se supondrá que m = p = 0. Es decir, que no existen restricciones para zsino que únicamente se desea encontrar un vector z real que haga mínima a la función f(z). A estecaso y al caso con restricciones de igualdad se acostumbra llamarlos como al problema deoptimización clásica. La solución se encuentra al obtener el punto z , tal que para cualquier cambio*

)z en el vector z se cumple:*

f( z ) # f( z + )z ) (7.3)* *

Problema de flujos óptimos - JMRA

170

(En todo lo que sigue se supondrá que f es doblemente diferenciable y con derivadas finitas ycontinuas). Desarrollando en serie de Taylor alrededor de z :*

(7.4)

Entonces se obtiene de (7.2) y (7.3):

(7.5)

en donde

es el vector gradiente de f(z)

es la matriz Hessiana o de segundas derivadas

Esta desigualdad se acostumbra llamar desigualdad fundamental, la cual debe cumplirse paracualquier variación arbitraria )z. En particular, si se toma la componente i-ésima del vector )z

negativa y todas las demás nulas, tomando límites se implica . Si por el contrario se toma

i)z > 0 y todas las demás cero, tomando límites se implica que . Por lo tanto,

(7.6)

Ahora, usando (7.6), la desigualdad fundamental implica:

(7.7)

Es decir, la matriz Hessiana debe ser positiva semidefinida para que z sea un punto extremo*

(mínimo o punto de inflexión) o estrictamente positiva definida para garantizar un mínimolocalmente en la vecindad de z .*

2.2 Optimización con restricciones de igualdad

El problema consiste en encontrar z tal que se tenga min f(z ) y al mismo tiempo se cumplan las* *

Problema de flujos óptimos - JMRA

171

restricciones de igualdad g( z ) = b. Es decir:

(7.8)

Para que exista solución a este problema se requiere imponer algunas condiciones más fuertes queen el caso anterior, las cuales permiten tomar en cuenta las características de las restricciones deigualdad. La condición fundamental requerida es que sea posible aplicar el teorema de la funciónimplícita al conjunto de restricciones de igualdad. Esto implica que si existen m restricciones, esposible efectuar una partición de las n variables o componentes de z, en un vector x con mcomponentes, y un vector u con n-m componentes, y que además sea posible resolver para x a partirde las m restricciones en la vecindad de la solución z = (x , u ), es decir:* * *

x = x(u) (7.9)

En otras palabras, las relaciones funcionales (7.9) son equivalentes a las restricciones (7.8). {Paragarantizar la existencia de (7.9), es necesario que el Jacobiano de las restricciones con respecto a xsea de rango m}. Sustituyendo entonces (7.9) en la función objetivo por minimizar, el problemapuede escribirse como:

(7.10)

Este último problema expresado en (7.10) es un problema sin restricciones que implícitamenteinvolucra a las restricciones g( z ) = b, y que su espacio de soluciones se ha reducido al espacio delas n-m variables de control u. Entonces las condiciones de óptimo pueden obtenerse enformasencilla como sigue: la condición necesaria para un mínimo local es

(7.11)

Puesto que las restricciones g( z ) = b se pueden escribir como una identidad:

g( x, u) / b (7.12)derivando,

(7.13)

Como la matriz es no-singular, se puede resolver para la matriz :

Problema de flujos óptimos - JMRA

172

(7.14)

y la condición (7.11) se puede escribir como,

(7.15)

Obviamente también:

(7.16)

Se puede definir el vector 8 llamado de multiplicadores de Lagrange como sigue:

(7.17)

Por lo tanto, las condiciones necesarias (7.15) y (7.16) se pueden escribir como sigue,

(7.15'-16')

o en forma global con z en lugar de (x, u):

(7.18)

Si se considera la condición (7.18), puede observarse que las condiciones necesarias junto con lasrestricciones originales g( z ) = b pueden obtenerse derivando la función f(z) + 8 [ g(z) - b ] conT

respecto a las variables z y 8. Este último resultado corresponde a la técnica de los multiplicadoresde Lagrange aplicada al problema general de optimización clásica. Esta técnica consiste en laaplicación de los tres pasos siguientes:

1. Se introduce un nuevo vector de variables 8 con m componentes.2. Se define la función de Lagrange formada por la suma de la función objetivo f y el productointerno del vector 8 de los multiplicadores de Lagrange por las restricciones de igualdad g(z) - b =0.

L(z) = f(z) + 8 [ g(z) - b ] (7.19)T

Problema de flujos óptimos - JMRA

173

ó L(x, u) = f(x, u) + 8 [ g(x, u) - b ] (7.19')T

3. Se encuentra el punto (z , 8 ) ó (x , u , 8 ) para el cual se anulan todas las derivadas parciales de* * * * *

primer orden, es decir:

(7.20)

Al analizar estas últimas condiciones debe notarse que las primeras n condiciones implican que elgradiente de la función objetivo evaluado en el punto óptimo, es una combinación lineal de losgradientes de las funciones de restricción, en la cual los coeficientes constituyen los multiplicadoresde Lagrange. Las últimas m condiciones simplemente representan a las restricciones de igualdad. Porlo tanto, las condiciones (7.20) implican que z está en el conjunto factible de las restricciones o*

conjunto de oportunidades del problema, y que la dirección preferente de variación para la funciónobjetivo es una combinación lineal de los vectores normales (gradientes) a las curvas derestricciones. Esta interpretación geométrica puede observarse a partir de la diferencial de las

i iecuaciones de restricción g (z) - b = 0 ya que:

(7.21)

k iy puesto que los dz están en la dirección tangente a la curva, el vector es normal a la curva g (z)

i- b = 0.Las condiciones de segundo orden establecen que la matriz Hessiana del Lagrangeano debe serpositiva definida cuando se evalúa en el punto mínimo local, sujeta a las condiciones de que ladirección de evaluación se encuentre sobre el hiperplano tangente a las superficies de restricción, locual analíticamente puede expresarse según (7.22-2.23):

Problema de flujos óptimos - JMRA

174

(7.22)

sujeta a: (7.23)

cuando la matriz Hessiana es positiva definida , sujeta a las condiciones (7.23), las condiciones(7.20) son suficientes. Nótese que las condiciones de segundo orden no implican que la matrizHessiana de la función objetivo sea positiva definida, sino que esto debe cumplirse para la matrizHessiana de la función de Lagrange.

2.3 Interpretación de los multiplicadores de Lagrange

Se ha visto que la solución del problema de optimización nos proporciona además de los valores delas vaiables z, los valores de los multiplicadores de Lagrange 8, que tienen mucha importancia yaque proporcionan una medida de la sensitividad del valor óptimo de la función objetivo f a pequeñas*

variaciones en las constantes b y c de las restricciones, es decir:

(7.24)

Para probar lo anterior debe probarse antes que si se tratan las b’s como variables, es posible resolvera partir de las condiciones de primer orden (7.20), para las variables z y 8 en función de las variablesb. Para esto, se pueden considerar las condiciones (7.20) como sigue:

(7.20')

Las que forman m+n ecuaciones con 2m+n variables (b, 8, z), entonces la matriz Jacobiana delsistema es:

Problema de flujos óptimos - JMRA

175

(7.25)

La cual, aceptando la no singularidad impuesta a , es de rango m+n. Por lo tanto, por el teorema

de la función implícita es posible resolver para 8 y z enfunción de b:

8 = 8( b )z = z( b ) (7.26)

Sustituyendo en la función de Lagrange:

L( b ) = f( z ( b ) ) + 8 ( b ) [ g( z( b ) ) - b ] (7.27)T

derivando respecto a b:

(7.28)

En el punto de la solución óptima (8 , z ) los dos primeros términos se anulan, por lo tanto:* *

(7.29)

Debido a (7.29), al obtener la solución óptima a un problema de la forma (7.8), se obtiene ademásuna medida de la sensitividad, ya que los multiplicadores de Lagrange indican qué tan sensible esel valor óptimo de la función objetivo a los cambios en las constantes de las restricciones. Estasconstantes generalmente representan la cantidad de recursos disponibles o requeridos para laoperación de un sistema. El significado anterior de los multiplicadores también es válido para lasconstantes c de las restricciones de desigualdad en el problema (7.1).

2.4 Problema general de programación no-lineal

Este caso está representado por el problema (7.1), que además de m restricciones de igualdadcontiene p restricciones de desigualdad. El establecimiento de las condiciones que se deben cumplir

Problema de flujos óptimos - JMRA

176

en el punto óptimo o en la solución, requiere de una generalización de la aplicación de losmultiplicadores de Lagrange, la cual conduce a la obtención del teorema de Kuhn y Tucker, el quenos introduce al problema general de programación no-lineal en variables reales (o en el espacioeuclideano n-dimensional). Existen diversas teorías sobre este problema, las que se encaminan a laobtención de proposiciones generales y definitivas de las condiciones necesarias y suficientes en lasolución. Dado el caracter introductorio de estas notas, la incorporación de las restricciones dedesigualdad se hará en forma sencilla para facilitar el desarrollo del tema.Si se observa el problema (7.1), las restricciones de desigualdad pueden convertirse a restriccionesde igualdad mediante la adición de un término positivo en cada restricción de desigualdad definidocomo:

i i is = c - h (z) (7.30)2

iDebe notarse que para que el vector z esté contenido en el conjunto factible, se debe cumplir que s 2

i i i$ 0 , ya que h (z) # c . Es decir, las componentes s deben ser reales.Entonces el problema (7.1) puede expresarse como:

(7.31)

Este problema con p variables adicionales de holgura contiene únicamente resticciones de igualdad,por lo tanto se puede aplicar la técnica de los multiplicadores de Lagrange. Los problemas (7.1) y(7.31) son equivalentes aún cuando éste último contiene p variables adicionales.

Se forma la función de Lagrange:

(7.32)

cuyas variables son (z, 8, :, s) ó (x, u, 8, :, s).

Las condiciones de primer orden son:

Problema de flujos óptimos - JMRA

177

(7.33-2.35)

(7.36)

iEliminando la variable s de las condiciones(7.35) y (7.36), estas se pueden englobar en una solacondición, llamada de exclusión o de holgura complementaria, y se puede expresar como:

i i iµ [ h (z) - c ] = 0 i = 1, 2, ..., p (7.37)

iEs posible probar que los multiplicadores µ de Kuhn y Tucker asociados a las restricciones dedesigualdad están restringidos en su signo mediante condiciones de no negatividad. Tomando encuenta la condición (7.33), la ecuación (7.23) y la desigualdad fundamental, así como el hecho deque para una restricción de desigualdad activa (en su límite) se cumple que para un movimientofactible )z:

(7.38)

se obtiene en el punto óptimo:

(7.39)

de (7.38) y (7.39) se concluye que:

iµ $ 0 (7.40)

Resumiendo los resultados anteriores se puede enunciar el:Teorema de Kuhn y Tucker. Sea z un punto mínimo local regular (la regularidad de z implica la no*

singularidad de la matriz cuyos renglones son los gradientes de h y g) del problema (7.1), entoncesexiste un vector 8, m-dimensional, y un vector µ $ 0, p-dimensional tal que:

(7.41-2.42)

Problema de flujos óptimos - JMRA

178

Si se comparan (7.41) y (7.42) y la formulación del problema (7.1) con las condiciones de Lagrange,nótese la similitud existente a través de las condiciones (7.41), ya que estas pueden obtenerse a partirde la función de Kuhn y Tucker definida como:

T( z, 8, : ) = f( z ) + 8 [ g( z ) - b ] + : [ h( z ) - c ] (7.43)T T

Sin embargo, existe una diferencia muy importante a través de las condiciones (7.42), así como lano negatividad de los multiplicadores : de Kuhn y Tucker, ya que esto no se presenta en el caso deLagrange.

2.5 Métodos de solución.

El método del gradiente

El concepto de dirección

Cualquier vector n-dimensional puede servir como una dirección. Dado un punto x, se puede generar

1 2 nuna línea recta que pasa por x si se aplica una dirección d (vector con n componentes d , d , ..., d )y un escalar J tal que - 4 # J # 4. Es decir, si

y = x + Jd (7.44)

y recorre la línea recta en la dirección ±d, que pasa por x cuando J = 0.Puede demostrarse que si no es nulo, el gradiente mismo apunta en una dirección tal, que un pequeñomovimiento en esa dirección aumenta a la función. Sea,

(7.45)

si la dirección d se selecciona igual al gradiente:

(7.46)

entonces, en la vecindad de x para J > 0:

(7.47)

Este último resultado sugiere un procedimiento para la búsqueda de la solución óptima al problemade programación no lineal sin restricciones. Si se trata de un problema en el que se requiere encontrarel máximo, dado un punto en la vecindad del óptimo se efectúa una corrección )z tal que:

Problema de flujos óptimos - JMRA

179

z + )z = z + JLf(z) (7.48)

se aproxime al punto óptimo z mediante la selección de un valor adecuado de J, el cual se obtiene*

de:

Jmax f( z + JLf(z) ) (7.49)

En cambio, como -Lf(z) apunta en la dirección en que la función f(z) disminuye, si se trata deencontrar un mínimo, se efectúa una corrección )z en la dirección -Lf(z) seleccionando el valoradecuado de J para obtener:

Jmin f( z - JLf(z) ) (7.50)

Como esta corrección se hace a lo largo de una línea recta y la función f(z) que nos interesa es nolineal, se genera un proceso iterartivo para la búsqueda de la solución óptima z . Este procedimiento*

se conoce como el método del gradiente, y se puede resumir como sigue:

0Paso 0: Se asignan valores de arranque z = zPaso 1: se calcula el gradiente Lf(z). Si la magnitud del gradiente tiende a cero, el proceso terminay la solución es z = z*

JPaso 2: se obtiene J tal que J = { J; min f( z - JLf(z) ) }* *

Paso 3: se calcula un nuevo valor de z con la expresión

nuevaz = z + )z = z - J Lf(z)*

y se repite el proceso aplicando de nuevo los pasos 1, 2 y 3 hasta lograr la convergencia.

Método del gradiente reducido

Este método es directamente aplicable al problema de programación no lineal con restricciones deigualdad. Su nombre proviene de la forma particular que toma la expresión (7.15), ya que alrepresentar a las variables z como variables x y u (de estado y de control respectivamente),implícitamente las variables de control u toman el papel de variables del problema y este reduce sudimensionalidad a n-m variables.Bajo otro punto de vista, este enfoque también puede visualizarse como una técnica dedescomposición no lineal.

El procedimiento puede visualizarse fácilmente a partir del método del gradiente ya establecido yde las relaciones (7.15-2.16) o (7.15'-2.16'), así como del cumplimiento de las restricciones en elpunto óptimo (condiciones de Lagrange).

Problema de flujos óptimos - JMRA

180

Esquema del método del gradiente reducido paraobtener el mínimo de f(z)Paso 0: Se supone un conjunto de valores para u (valores de arranque)Paso 1: Se calculan los valores de x a partir de:

g(x, u) - b = 0

Paso 2: Se calculan los valores de 8 a partir de la ec (7.16'):

Paso 3: Se calculan los valores del gradiente reducido que en general no serán nulos, a partir de

(15) o (15'):

Paso 4: Se toma la dirección del gradiente reducido con signo negativo y se calcula el escalar J tal*

Jque J = { J; min L( x + J)x, u + J)u ) } con*

Paso 5: Se calculan los nuevos valores de u aplicando el valor de J*

unuevau = u + J )u = u - J LL* *

Paso 6: Se prueba la convergencia del proceso: si la magnitud del gradiente reducido tiende a cero,el proceso termina, en caso contrario se repite el proceso con los nuevos valores de u a partir de paso1.

Geométricamente, en el espacio de las variables de control u, el proceso puede visualizarse comose muestra en la figura siguiente.

Problema de flujos óptimos - JMRA

181

Fig. : Representación geométrica del proceso de disminución de la función f(z)

Método de penalización

Un método comúnmente usado para el manejo tanto de las restricciones de igualdad como dedesigualdad, es el conocido como el método de la función de penalización.Supóngase que se quiere resolver el problema (7.1). La idea del método de la función depenalización consiste en reemplazar el problema (7.1) por un problema no restringido de la forma:

min f(z) + (p(z) (7.51)

en donde ( es una constante positiva y p(z) es una función real de n variables reales que satisface:i) p(z) es continuaii) p(z) $ 0, � z con componentes realesiii) p(z) = 0 iff z está en la región factibleEn el caso del problema (7.1), una función de penalización útil es:

(7.52)

Problema de flujos óptimos - JMRA

182

Fig.: Aproximación de la función p(z) a las restricciones verdaderas

La siguiente figura muestra (p(z) para el caso unidimensional de z, en el que se tienen dosrestricciones de desigualdad: z - b # 0, a - z # 0.

Para valores grandes de ( es claro que el punto mínimo del problema (7.51) se localizará en unaregión en donde p(z) se haga pequeña, por lo que para valores crecientes de ( se espera que lospuntos correspondientes a la solución se aproximarán a la región factible, lo cual tenderá a minimizara la función f(z).

Es fácil visualizar que para el caso de restricciones de igualdad, en caso de existir un mínimofactible, la función de penalización del tipo cuadrática tenderá a satisfacer las restricciones deigualdad, ya que:

i imin [ g (z) - b ] = 0 (7.53)2

Existen técnicas que permiten generar una secuencia creciente de valores para (, los cuales seasocian a una secuencia de problemas cuya solución tiende a la solución de (7.1).

El método extendido del gradiente reducido

Es posible adaptar la técnica del gradiente reducido para manipular las restricciones de desigualdadmediante dos formas distintas: i) agregando variables de holgura (términos positivos) a cadarestricción de desigualdad para convertirla en igualdad, lo que en general no es eficiente ya queaumenta el número de variables y aumenta el número de restricciones de igualdad, o ii) manejando

Problema de flujos óptimos - JMRA

183

las variables de control en forma directa en sus restricciones de cotas superiores o inferiores, ymanejando mediante técnicas de penalización a las variables de estado y las restricciones dedesigualdad asociadas a ellas. Esta última opción ha sido utilizada en forma similar con cierto éxitoen la optimización de la operación, en el cálculo de flujos óptimos y en la planeación de sistemaseléctricos. Es sencillo visualizar esta extensión al procedimiento del gradiente reducido y acontinuación se presenta un posible esquema para la búsqueda de la solución, en el cual, si secompara con el esquema anterior, pueden observarse las diferencias importantes entre ambos.

Esquema extendido del método del gradiente reducido para mínimo de f(z)

paso 0: se supone un conjunto factible de valores de arranque para upaso 1: se calculan los valores de x a partir de:

g(x, u) - b = 0

paso 2: se detectan las restricciones de desigualdad, h(x, u) - c # 0, que se violan y se incluyen enla función objetivo como funciones de penalización:

pse calculan los valores del gradiente de 8 aplicando la nueva función f (x, u),

ppaso 3: se calculan los valores del gradiente reducido aplicando la nueva función penalizada f (x,u),

paso 4: se toma la dirección del gradiente reducido y se calcula el escalar J tal que:*

J pJ = { J; min L ( x + J)x, u + J)u ) }*

con

paso 5: se calculan los nuevos valores de u aplicando el valor de J , sosteniendo las componentes*

en sus límites si es que la corrección tiende a violar sus cotas. Se calculan los valores de x en lamisma forma que en paso 1.

Problema de flujos óptimos - JMRA

184

paso 6: se realizan las siguientes pruebas: si el proceso obtiene convergencia mediante la magnituddel gradiente pero las restricciones de desigualdad violadas no se aproximan a sus límites, sereestablecen los factores de penalización, y se repite el proceso a partir del paso 2. Cuando secumplen ambas tolerancias, el proceso termina. En caso contrario, el proceso se repite a partir delpaso 2 con los nuevos valores de x.