El Gradiente y Los Multiplicadores de Lagrange

Post on 01-Dec-2015

35 views 5 download

Transcript of El Gradiente y Los Multiplicadores de Lagrange

El gradiente y el método de los multiplicadores de Lagrange.

Wilman García

David Fernández Arenas

Licenciatura en Matemáticas y Física.

Universidad de Antioquia.

2

Resumen:

En este trabajo se presenta un conjunto de conceptos como lo son: campo vectorial, gradiente,

derivada direccional, y el método de los multiplicadores de Lagrange para obtener máximos y/o

mínimos de funciones sometidas a ciertas restricciones; se busca que sea visto desde un punto

de vista intuitivo, haciendo uso histórico de la noción de campo vectorial con el fin de reconocer

su importancia en el desarrollo de la física, de igual manera se presentan notas históricas del

concepto de gradiente y la relación existente entre éstos dos últimos. Por otra parte se intenta

dar una visualización del resultado del método de los multiplicadores de Lagrange, con el fin de

ofrecer una mayor claridad y detalles, para entender dicho concepto se han restringido las

funciones a R2 y R3, y no se han tratado demostraciones rigurosas. Por ultimo se pretende tratar

de relacionar dichos temas con algunas cuestiones de la geometría vectorial tales como vectores

libres, de posición.

Nota: cuando se indique un punto en negrita se hace referencia a un conjunto de puntos por

ejemplo x puede indicar la terna ordenada (x, y, z).

Para comenzar a hablar del gradiente y los multiplicadores de Lagrange es bueno tomar en

cuenta algunas consideraciones previas, como lo son algo de historia y lo referente al operador

diferencial nabla.

El gradiente fue denotado Δ por Hamilton en 1846, hacia 1870 se denoto ∇ la letra delta

invertida, que se llamó “atled”. En 1871 Maxwell escribió “la cantidad ∇P es un vector”. El

nombre de “pendiente” como se conocía en un principio pasó de uso y se reemplazó por la de

“gradiente”; se refiere a la palabra grado, el peralte de un camino o una superficie. El nombre de

(nabla apareció impreso por vez primera en 1901 en Vector Analysis, un libro para uso de

estudiantes de matemáticas y física.

Ahora bien en cuanto al operador nabla ∇ ≡ para el caso de una superficie de

en coordenadas cartesianas, ∇ no es un vector, sino un operador, puede considerarse como

un vector simbólico; así si ϕ es un campo escalar, entonces ϕ∇ es un operador, por tanto

colocando ∇ a la izquierda da operadores, mientras que aplicado a la derecha ∇ϕ da la

importante función vectorial llamada gradiente, por lo tanto a la derecha entrega funciones

vectoriales o escalares, en el caso de tener ϕ una función real definida en un conjunto abierto S

de , el gradiente de ϕ designado por ∇ϕ o por gradϕ, es una función vectorial definida por

∇ϕ =(D1 ϕ(x),…,Dn ϕ(x)) donde D1 ,D2,… Dn son las derivadas parciales; a lo anterior se le conoce

como campo gradiente de ϕ, pero entonces surge un nuevo concepto a tratar aunque de manera

algo vaga, el de campo vectorial, para conocer algo acerca de éste remitámonos nuevamente a

un poco de historia, el concepto de campo, entendido como campo de vectores, tuvo un gran

3

impacto en el desarrollo de las bases conceptuales de la física y la ingeniería, es realmente una

de las ideas que supusieron un avance significativo en la historia del pensamiento humano.

Es la noción que permite describir de modo sistemático las influencias sobre objetos y entre

objetos que están separados espacialmente. La idea de campo comenzó con el concepto de

Newton de campo gravitacional en este caso, dicho campo describe la atracción de un cuerpo o

grupo de cuerpos sobre otro. Análogamente el campo eléctrico producido por un objeto o grupo

de objetos cargados crea una fuerza sobre otro objeto cargado eléctricamente. El uso de campos

vectoriales para describir este tipo de fuerzas ha conducido a una misma comprensión mas

profunda de las fuerzas atractivas y repulsivas en la naturaleza. Sin embargo fue el monumental

descubrimiento de las ecuaciones de Maxwell que describen la propagación electromagnética,

las que consolidaron el concepto de campo en el pensamiento científico. Este ejemplo es

especialmente interesante teniendo en cuenta que los campos se pueden propagar. El contraste

entre campos electromagnéticos que se pueden propagar y el campo gravitacional que implica

una acción a distancia, ha originado gran interés entre los filósofos de la ciencia. La idea de

Einstein es que la gravitación puede describirse en términos de las propiedades métricas del

espacio-tiempo y que en esta teoría los campos asociados también pueden propagarse,

exactamente como el campo electromagnético, proporcionando por lo tanto una profunda

evidencia filosófica de que la versión de Einstein de la gravitación debería ser correcta. La idea

de campo también se usa en ingeniería para describir sistemas elásticos e interesantes

propiedades micro-estructurales de los materiales, con la teoría de la física moderna, el concepto

de campo se usa para describir partículas elementales, además es una herramienta fundamental

en los esfuerzos de los físicos teóricos modernos para unificar la gravedad con la mecánica

cuántica de las partículas elementales.

“Es imposible imaginar un marco teórico moderno que no incorpore algún tipo de concepto de

campo como ingrediente central. En las aplicaciones matemáticas a la física y a ciertas ramas de

la ingeniería como la mecánica de fluidos por ejemplo, se maneja con frecuencia el concepto de

campo vectorial.”1

Ahora matemáticamente un campo vectorial no es otra cosa que una función vectorial definida

en un cierto conjunto. Por ejemplo si a cada punto x de la atmosfera asignamos un vector V(x)

que representa la velocidad del viento, queda definido un campo vectorial. Si V(x) se expresa en

función de sus tres componentes de una cierta base por ejemplo { base ortonormal

derecha para R3, entonces se define una función vectorial:

1 Cálculo Vectorial, Jerrald E. Marsden, Anthony J. Tromba.

4

Las componentes V1, V2, V3, son tres funciones reales por lo

tanto un estudio de los campos vectoriales equivale en cierto sentido al de estudiar en este caso

ternas de funciones reales. Para distinguir entre campos vectoriales y funciones reales, a estas

ultimas se les suele llamar campos escalares. Por ejemplo la temperatura en cada punto de la

atmosfera define un campo escalar.

Uno de los modelos físicos más útiles de campo vectorial se presenta al considerar el

movimiento de un fluido. A cada punto x (o partícula del fluido) atribuimos un vector V(x) que

representa la velocidad de aquella partícula. Naturalmente el campo puede o no cambiar con el

tiempo. El flujo estacionario V(x) esta completamente determinado por x y no depende del

tiempo. En problemas físicos que incluyan campos vectoriales es importante conocer no

solamente el vector V(x) en cada punto x, sino también como varia dicho vector al pasar de un

punto a otro. Para estudiar este cambio disponemos del mecanismo de la diferenciación parcial

que puede aplicarse a los componentes de V. en general las derivadas parciales de estos

componentes dependerán de la elección de la base con relación a la que los componentes han

sido determinados. Por eso las derivadas parciales son un tanto insatisfactorias para describir

ciertas magnitudes físicas, mientras que ciertas combinaciones de derivadas parciales, como la

divergencia, el rotacional, entre otras, se usan para describir mejor el comportamiento de los

campos vectoriales, la divergencia de un campo vectorial por ejemplo es un campo escalar que

en el uso de una corriente de fluido, mide la proporción en la que el fluido fluye del entorno

inmediato a cada punto.

Ahora retomando nuevamente el campo gradiente este es un ejemplo claro de la relación

existente de un campo vectorial con el estudio de la derivación parcial. Si ϕ es una función (un

campo escalar) definida en un conjunto abierto de Rn, el gradiente de ϕ, designado por gradϕ, y

definida por la relación anterior gradϕ(x) = (D1 ϕ(x),…,Dn ϕ(x)) en cada punto x de S en que

existan las derivadas parciales.

Interpretaciones del campo gradiente.

Para el caso de R3, se tiene una interesante interpretación.

Sea c una constante y consideremos el conjunto de superficies en donde ϕ(x)=c si alguna de

estas superficies tiene un plano tangente en a= (a1, a2, a3) la ecuación de dicho plano esta dada

por esto significa que ∇ϕ (a) es

normal al plano en el punto a. Por tanto el plano tangente existe siempre que ∇ϕ (a)≠ .

5

El campo escalar ϕ cuyo gradiente es ∇ϕ se llama función potencial del campo vectorial ∇ϕ. Las

correspondientes distintas superficies se denominan superficies equipotenciales (o superficies

de nivel) ahora si se trata de campos bidimensionales cada conjunto de superficies son ahora

conjuntos de curvas planas que se llaman curvas equipotenciales o de nivel. Las superficies o

curvas de nivel dependiendo del caso son ortogonales al vector gradiente en cada punto a en el

que ∇ϕ ≠ 0.

De forma geométrica el gradiente evaluado en un punto es un vector que se encuentra normal a

una superficie en el espacio a la cual se le esta estudiando en dicho punto, bien sea (x,y) o de

coordenadas(x,y,z); por ejemplo: supóngase que se considera la temperatura en un lugar

determinado, la cual se define a través de un campo escalar de tal manera que en cualquier

punto (x,y,z) la temperatura esta dada por T(x,y,z). Asumiendo que no varia con respecto al

tiempo. Ahora el gradiente en un punto (x,y,z), y la magnitud de este nos dará cuan rápido se

calienta un fluido en una dirección cuya temperatura este regida por la función T(x,y,z).

Otro ejemplo interesante es el relacionado con una montaña en la cual su altura en un punto

(x,y) esta definida por un campo escalar H(x,y), el gradiente de H, en ese punto estará en la

dirección del punto a mayor grado de inclinación, la magnitud del gradiente nos mostrará que

tan empinada se encuentra la pendiente.

Con respecto a la física ya antes mencionado el gradiente posee bastantes aplicaciones

especialmente en electromagnetismo y mecánica de fluidos. En particular existen muchos

campos vectoriales que pueden escribirse como el gradiente de una función potencial escalar,

uno de ellos por ejemplo es el campo electrostático que deriva del potencial eléctrico .

Ahora bien todo campo que pueda escribirse como el gradiente de un campo escalar, se

denomina potencial conservativo o irrotacional. Asi por ejemplo una fuerza conservativa deriva

de la energía potencial , y como ya antes mencionado los gradientes también aparecen

en procesos de difusión que verifican ciertas leyes como la de Fourier para la temperatura. Así

por ejemplo, el flujo de calor de un material es proporcional al gradiente de temperatura

siendo k una constante de conductividad térmica.

He aquí la grafica de algunos campos gradientes en R3 y de una taraza en particular asociada a la

función potencial del campo sobre una pequeña región del espacio, funciones que utilizaremos

posteriormente:

6

h(x,y,z)= yz-2

Figura 1

Figura 1.1

∇ f(x,y,y) f(x,y,y)=xz +yz xz +yz=3

∇ g(x,y,z) g(x,y,z)= x^2+z^2-2 x^2+z^2=2

7

Figura 1.2

Las pequeñas flechas de colores representan el campo gradiente evaluado en algunos puntos y la

superficie representa una superficie de nivel de la función que se esta tratando.

En los ejemplos anteriores se ha tratado el gradiente y algo relacionado con la dirección es por

ello que se hace necesario mencionar algunas cuestiones sobre la derivada direccional, es decir

como es la variación de determinada función con respecto a una dirección especifica, en una

función de dos variables cuando estamos hablando de derivadas parciales de ,

estamos indicando solamente como esta variando la función en dirección del vector

respectivamente pero surge la pregunta como esta variando en otras direcciones.

Es fácil mostrar que esta variación esta dada por:

Donde representa la variación de la función en la dirección

de un vector unitario en la dirección de de esta relación anterior se deducen varias cosas:

a) El máximo valor de la derivada direccional esta dado por ‖ ∇f(x,y) ‖

b) El mínimo será entonces -‖ ∇f(x,y) ‖

∇ h(x,y,z) h(x,y,z)= yz-2 yz=2

8

De lo dicho anteriormente podemos sacar algunas conclusiones previas o más bien algunas

propiedades que verifica el vector gradiente:

Es ortogonal a las superficies escalares.

Apunta en la dirección en que la derivada direccional es máxima.

Se anula en los puntos críticos (máximos, mínimos y puntos silla).

Esta última propiedad mencionada no es más que una extensión a la definición de punto crítico

de una variable, para el caso de dos variables que se dice si existe en todos los puntos de

algún subconjunto de R2 el punto (x0 , y0) es un punto crítico de f si una de las siguientes

condiciones se cumple:

i)

ii)

Es decir que es un punto crítico si no existe.

Hasta este punto hemos hablado de campo vectorial, derivada direccional, gradiente y puntos

críticos, entremos ahora en una segunda parte, una pequeña introducción a lo que se denomina

el método de los multiplicadores del Lagrange.

MÉTODO DE LOS MULTIPLICADORES DE LAGRANGE

Cuando se quiere determinar los máximos o mínimos de una función sometida a una o mas

restricciones por ejemplo el de encontrar la distancia mínima que hay de una superficie

y el origen no siempre es posible resolver la restricción para alguna de las variables en

términos de las otras, pero se puede seguir un método para determinar dichos puntos máximos

o mínimos ; dicho procedimiento se denomina Método de los Multiplicadores de Lagrange en

honor al matemático francés Joseph L. Lagrange y consiste en lo siguiente:

Si un campo escalar tiene un extremo relativo cuando esta sometido a un

conjunto de condiciones siendo m<n, existen

entonces escalares tales que:

9

Para el caso de funciones de dos variables cuyas primeras derivadas parciales son continuas,

si tiene un extremo relativo en el punto sujeta a la condición y

∇ g≠ 0, entonces existe una constante λ talque:

El método de los multiplicadores de Lagrange nos permite encontrar los puntos

Que optimizan (producen máximos y/o mínimos) una función dada , sujeta a la restricción

.

Esta idea es esencialmente la extensión natural del método usual para funciones de una variable,

buscar máximos o mínimos entre sus puntos críticos, es decir los puntos en donde .

Este caso consideramos . Es claro que , así basta

buscar valores en los cuales , es decir

Para la demostración de la validez del método para funciones de dos variables puede observarse

en: “El CALCULO 7 ed.” Dicha demostración esta basada en algunas concepciones geométricas

que se presentan a continuación:

Antes de comenzar con algún ejemplo ilustrativo es conveniente tener en cuenta algunas

observaciones acerca del método:

La condición del método de Lagrange es una condición necesaria pero no suficiente, para

la determinación de puntos máximos o mínimos.

El método es valido si el numero de condiciones m, es menor que el numero de variables

n.

Por ejemplo en una variable la condición es necesaria pero no suficiente para que f

posea un máximo o un mínimo en , por ejemplo la función

10

Es tal que sin embargo el origen no es punto de máximo ni de mínimo para .

Figura 2 Figura 2.1

Considérese la función sujeta a la restricción , es decir considérese la

función . Encontrar los máximos y/o mínimos de

Aplicando el método de los multiplicadores de Lagrange, es decir encontrar un λ tal que:

Para hallar dicho punto hay que considerar lo siguiente:

Ahora bien tenemos lo siguiente pero en este punto tenernos 3 variables y solo dos

ecuaciones por lo que introducimos una nueva ecuación que no es más que la

restricción, así obtenemos un sistema de ecuaciones:

11

Resolviendo el sistema encontramos los valores para λ =±1 y sin embargo la

función no tiene ni máximo ni mínimo sobre esta restricción.

Figura 3

Veamos otro ejemplo: encontrar la distancia mínima en el plano de la función . Aquí surge

una pregunta ¿Cuál es la función a optimizar?, la función a optimizar es una función distancia

dada por:

12

Sometida a la restricción de

Tenemos que:

Luego el sistema esta dado por:

Resolviendo el sistema encontramos los puntos , este λ en economía

tiene una interpretación especial.

Luego un que a su vez representa una curva de nivel sobre el plano

, obsérvese nuevamente que la curda de nivel de la función es

tangente a la restricción en el punto si consideramos toda la circunferencia

completa es decir .

13

Desde el punto de vista grafico:

Figura 4 Figura 4.1

Figura 4.2

Gráficamente vemos que la curva de nivel de la

función que se va a optimizar es precisamente

tangente a la curva de nivel de la restricción, la

figura 4.1 muestra una el primer octante sobre el

cual se visualizan las funciones, con en el fin de

mayor claridad.

Veamos ahora con el ejemplo anterior una forma algo intuitiva de mostrar que realmente las

curvas son tangentes en este punto.

14

Consideremos la traza de la función =2 es decir una parametrización

bastante simple de estas curva esta dada por:

Es claro que un vector tangente esta dado por

.

Ahora bien tenemos que el gradiente de en términos de esta parametrización:

luego luego el gradiente es ortogonal a la curva de nivel como ya antes se había

mencionado.

Similarmente para la restricción tenemos que una simple parametrización consisten en:

sea luego un conjunto de ecuaciones paramétricas que me representan dicha función esta

dada por de manera que y además el gradiente de en

términos de esta parametrización viene dada por luego nuevamente

vemos que el gradiente es ortogonal a la curva de nivel. Ahora bien existe un punto en que el

cual son paralelos y mediante las relaciones anteriores esto implica que

también lo sean luego las dos curvas en este punto son tangentes entre si. Teniendo

en cuenta las restricciones que y sean diferentes del vector nulo.

Por otra parte el hecho que:

Indican que se esta encontrando un punto sobre el cual el vector gradiente es

múltiplo escalar del vector , por lo que si tomamos el producto punto entre los dos

vectores obtenemos que:

Siendo θ el ángulo entre dichos vectores pero dado que los vectores son paralelos entonces

tenemos que el ángulo formado entre ellos es 0° ó 180° por lo tanto dicho producto punto

queda determinado por:

Ó

15

Y retomando la derivada direccional que:

El máximo valor de la derivada direccional esta dado por ‖ ∇f(x,y) ‖

El mínimo será entonces -‖ ∇f(x,y) ‖ análogamente estamos encontrando, como esta variando la

función en la dirección del vector ∇g(x,y) y dicha variación estará relacionada con las

expresiones anteriores.

Para el caso de dos restricciones se esta considerando que:

Análogamente en el caso de una restricción se considera un vector múltiplo escalar de otro

ahora aquí se esta considerando al como una combinación lineal de los gradientes de

y se busca un punto en donde dicha relación se cumpla, a modo de ejemplo

tomado de “El CALCULO 7 ed.” Aunque el objetivo en este caso es ver un poco la forma gráfica

del problema, considérese el siguiente conjunto de restricciones , y y se busca

optimizar la función sobre dichas restricciones.

Por lo tanto tenemos que:

Luego el sistema de ecuaciones queda determinado por:

Y resolviendo el sistema encontramos los puntos (1, 2, 1); (-1, -2, -1); (-1,- 2, -1); (-1, 2, 1)

los cuales nos entregan un máximo y un mínimo son respectivamente (1, 2, 1) y (-1,- 2, -1), en

donde , para tratar de hacer un poco mas claros se tratara de

16

mostrar el caso para el punto (1, 2, 1), pero recuérdese que por algo de simetría en el problema

es análogo el análisis para el punto (-1, -2, -1).

Gráficamente:

Figura 5 Figura 5.1

Figura 6 Figura 6.1

17

Figura 7 Figura 7.1

Figura 8 Figura 8.1

18

z

Y

x

(x0, y0, z0)

∇ f(x0, y0, z0)

z

Y

x

(x0, y0, z0)

∇ f(x0, y0, z0)

Las figuras 5, 5.1, 6, 6.1, 7, 7.1 hacen referencia a los gradientes:

Y a las superficies de nivel respectivamente.

Ahora surge una pregunta como es posible graficar los vectores gradientes evaluados en un

punto, una idea algo intuitiva que intenta dar respuesta, consiste en ver al gradiente evaluado en

un punto como un vector en R3 el cual tiene un origen móvil dado por el punto , y a

partir de allí graficar un vector de posición determinado por el gradiente evaluado en dicho

punto, siguiendo este procedimiento podríamos hallar varios vectores representativos y

hacernos a una idea de cómo se comporta el campo gradiente en algunos puntos, aunque

graficar esto en el espacio es algo complicado similarmente podemos aplicar el procedimiento

en el plano siendo allí mucho mas sencillo.

Figura 9

Desde un punto de vista mas geométrico es el de tratar al vector gradiente como un vector libre

en el espacio, si tomamos el punto de coordenadas , considerándolo como el punto

terminal del vector de posición , a dicho vector le podemos sumar el vector

gradiente evaluado en dicho punto obteniendo así un nuevo vector de posición determinado por

ya que la suma de un vector libre mas un vector de posición es un nuevo vector de

posición, así el vector queda determinado mediante la siguiente relación:

19

Luego el gradiente de la función puede ser despejado de la relación anterior

obteniendo así:

Lo cual indica la diferencia de dos vectores de posición la cual esta definida y es un nuevo vector

libre, recuérdese que la suma de dos vectores de posición no esta definida, por lo tanto seguimos

acorde con la teoría considerando el vector gradiente evaluado en un punto como un vector

libre, por lo cual conociendo el gradiente evaluado en un punto, graficarlo es fácil:

Figura 10

20

Por ultimo consideremos nuevamente el problema de optimización sometido a las dos

restricciones analíticamente se ha encontrado que efectivamente el se puede

expresar como combinación lineal de los vectores , una forma de mostrarlo

geométricamente es haciendo referencia a lograr encontrar un plano, ¿cual plano será? , veamos:

tenemos claramente que <2, 0, 2> y <0, 2, 1> son Linealmente independientes por lo tanto

forman una base que genera un espacio consideremos dicho espacio como el plano que forman

los dos vectores, fácilmente se puede llegar a que la ecuación del plano esta dada por:

y se puede comprobar que los puntos asociados a los vectores de posición con

los que podemos graficar están efectivamente contenidos en dicho plano.

Figura 11 Figura 11.1

Las figuras 11 y 11.1 muestran el plano generado por los dos vectores <2, 0, 2> y <0, 2, 1> y el

vector <1, 3, 3>, y una perspectiva del grafico muestra que los tres vectores efectivamente están

sobre un mismo plano por lo tanto cualquiera de ellos es combinación lineal del resto.

21

Bibliografía:

Marsden, Jerrold Eldon, Tromba, Anthony J. Calculo vectorial. - 5. Ed. Pearson Educación. España. 2004

Apóstol, Tom M. Análisis matemático: introducción moderna al cálculo superior. - 01.ED, Reverte. España. 1950.

Apóstol, Tom M. Calculo con funciones de varias variables y algebra lineal con aplicaciones a las ecuaciones diferenciales y a las probabilidades: v2. - 2. ed. Reverte. España. 1975.

Leithold, Louis. El calculo. - 7. Ed. Oxford University Press. Mexico. 1998 Caicedo Contreras, José Francisco. Calculo avanzado: introducción, Universidad Nacional

de Colombia. Bogotá. 2005. Phillips, Henry Bayard. Análisis vectorial. Uteha. Mexico. 1956