Programación dinamica

15
Ing. Miguel Jiménez C. M.Sc. 2 S 4 = S 3 - D 3 S 3 = S 2 - D 2 S 2 = S 1 - D 1 S 1 =6 Región 1 Región 2 Región 3 D 1 ¿Cuántos agentes asignar? D 2 ¿Cuántos agentes asignar? D 3 ¿Cuántos agentes asignar? R 1 (D 1, S 2 ) R 2 (D 2, S 3 ) R 3 (D 3, S 4 ) SOLUCIONARIO Sobre Programación Dinámica por Ing. Miguel Jiménez Carrión M.Sc [email protected] [email protected] Modelo de la Diligencia Asignación de Recursos El modelo de la mochila Producción e Inventario Confiabilidad 2004 “En algún punto de la línea de desarrollo descubrimos lo que somos en realidad, y luego tomamos nuestra verdadera decisión por la cual somos responsables. Tome esa decisión principalmente por usted, ya que nunca se puede vivir realmente la vida de otra persona.” Eleanor Roosevelt

description

Ayuda para resolver.

Transcript of Programación dinamica

Page 1: Programación dinamica

Ing. Miguel Jiménez C. M.Sc.

2

S4 = S3 - D3S3 = S2 - D2S2 = S1 - D1S1=6 Región 1

Región 2

Región 3

D1¿Cuántos agentes asignar?

D2¿Cuántos agentes asignar?

D3¿Cuántos agentes asignar?

R1 (D1, S2) R2 (D2, S3) R3 (D3, S4)

SOLUCIONARIO

Sobre Programación Dinámica

por

Ing. Miguel Jiménez Carrión M.Sc [email protected]

[email protected]

Modelo de la Diligencia Asignación de Recursos El modelo de la mochila Producción e Inventario

Confiabilidad

2004

“En algún punto de la línea de desarrollo descubrimos lo que somos en realidad, y luego tomamos nuestra verdadera decisión por la cual somos responsables. Tome esa decisión principalmente por usted, ya que nunca se puede vivir realmente la vida de otra persona.”

Eleanor Roosevelt

Page 2: Programación dinamica

Programación Dinámica. PROGRAMACIÓN DINÁMICA

La programación dinámica es un método para resolver ciertos problemas de programación matemática, cuya característica de estos problemas es que los modelos matemáticos que los representan son complejos y por tanto requieren mucho procesamiento de cómputo para encontrar su solución, además pueden ser divididos en problemas más pequeños. Esta característica del problema de dividirse en subproblemas es aprovechada por la programación dinámica para encontrar la solución. La forma de operar de la programación dinámica es dividir el problema en problemas más pequeños llamados subproblemas, luego inicia el proceso de solución por etapas; en donde cada etapa del proceso resuelve un subproblema y al finalizar con todas las etapas, el problema es completamente resuelto. Entre una etapa y la siguiente existe una liga que permite el nexo entre etapas esta liga se llama función recursiva. Los ejemplos que siguen muestran el proceso de solución describiendo al mismo tiempo la notación de la función recursiva, explicándose lo esencial y las características particulares de cada problema: Caso1: Problema de la Diligencia 1) Este problema está referido a encontrar la ruta óptima (ruta mínima o ruta más confiable), para viajar desde un punto llamado nodo inicial o fuente hacia otro llamado nodo final o destino a través de una red de caminos que los conecta dados los retornos (costos beneficios tiempo, etc), asociados con los arcos o ramas de la red.

En este caso lo primero que hay que reconocer es, que al tomar una decisión para decidir que ruta seguir en forma general para todo el problema, involucra analizar toda la red esto hace que el problema sea complejo, por cuanto del nodo 1 al 14 existen múltiples alternativas en las que se encuentran varias ramas en la ruta. En segundo lugar, ver si es posible dividir el problema en subproblemas o etapas de manera que la decisión en cada subproblema sea más fácil; en este sentido se ha dividió el problema en 5 etapas, de la 1 a la 5 conforme se aprecia en la parte inferior de la red. Obsérvese que es más fácil tomar una decisión en cada etapa pues la decisión será directa; por ejemplo si estamos en la etapa 3 (subproblema 3) al inicio nos podemos encontrar en los nodos 5 , 6 ó 7 y podemos ir a los nodos 8, 9, 10 ú 11 la decisión es inmediata, pues solo existe una rama en cada alternativa. Esta característica es importante reconocer para tomar la decisión de aplicar la metodología de la programación dinámica.

5 4 3 2 1

3

4

6

3

9

9

11

2 8

69

112 5

8

3

4

6

7

9

10

1

11

12

13

14

5

2

3

8

4

6

3

5

4

7

8

5

Ing. Miguel Jiménez C. M.Sc.

4

)](),([)( 1*

11*

+++ += nnnnnnn SfSDRgSf

)](),([)( 15*

151555,5*

5155

+++ +=+

SfSDRMinSfSD

)( 4*4 SD

)( 5*

5f )( 5*5D

)( 4*

4 Sf

Ahora es posible usar la función general de la programación dinámica y luego representar esa función en términos del problema como sigue: Función Recursiva General de PD. Función Recursiva para el Problema Donde:

Representa la distancia por tomar la decisión Dn en la etapa n, para pasar del estado Sn al estado Sn+1 Representa el mejor valor en la etapa n+1, cuando el estado es Sn+1 Representa el mejor valor en la etapa n, cuando el estado es Sn

Nota: debe notar que tanto Sn, como Sn+1 toman un conjunto de valores, por ejemplo S3 toma los valores:

(5, 6 y 7) y S3+1 = S4, toma los valores (8, 9, 10 y 11). Utilizando la forma tabular de la PD tenemos, para las diferentes etapas: Para n = 5

S SDECISIÓN (D5) Estado S5 14

12 4 4 1413 3 3 14

Para n = 4

)](),([)( 1*

11,

*+++ += nnnnnSDnn SfSDRMinSf

nn

=+ ),( 1nnn SDR

=++ )( 1*

1 nn Sf

=)(*nn Sf

)](),([)( 5*

5544,4*

454

SfSDRMinSfSD

+=

DECISIÓN (D4) Estado S4 12 13

8 9 + 4 =13 - 13 12 9 3 + 4 = 7 6 + 3 = 9 7 12

10 7 + 4 = 11 8 + 3 = 11 11 12,13 11 - 5 + 3 = 8 8 13

3

Page 3: Programación dinamica

Programación Dinámica.

)( 3*3 S)( 3

*3 S

)( 1*

1 Sf )( 1*1 SD

)( 2*

2 S )( 2*2 SD

D f

f

Para n = 3

DECISIÓN (D3) Estado S3

8 9 10 115 3 + 13 =16 2 + 7 = 9 - - 9 9 6 8 + 13 = 24 11 + 7 = 18 5 + 11 = 16 9 + 8 = 17 16 10 7 - - - 4 + 8 = 12 12 11

Para n=2

DECISIÓN (D2) Estado S2 5 6 7

2 11+9=20 - - 20 53 8+9=17 4+16=20 9+12=21 17 54 - 6+16=22 6+12=18 18 7

Para n=1

DECISIÓN (D1) Estado S1 2 3 4

1 5+20=25 2+17=19 3+18=21 19 3 ¿cómo se obtiene el recorrido mas corto? Esto se logra comenzando desde la etapa 1, de la siguiente manera: Si se está en el nodo 1 la decisión óptima es ir al nodo 3, luego se pasa a la etapa 2. Si se está en el nodo 3 la decisión óptima es ir al nodo 5, luego se pasa a la etapa 3. Si se está en el nodo 5 la decisión óptima es ir al nodo 9, luego se pasa a la etapa 4. Si se está en el nodo 9 la decisión óptima es ir al nodo 12, luego se pasa a la etapa 5 Si se está en el nodo 12 la decisión óptima es ir al nodo 14. . La distancia total recorrida se obtiene sumando las distancias de las ramas involucradas en el recorrido en este caso es: 1 – 3 – 5 – 9 – 12 – 14 2 + 8 + 2 + 3 + 4 = 19.

)](),([)( 4*

4433,3*

343

SfSDRMinSfSD

+=

)](),([)( 3*

3322,2*

232

SfSDRMinSfSD

+=

)](),([)( 2*

2211,1*

121

SfSDRMinSfSD

+=

Ing. Miguel Jiménez C. M.Sc.

6

Caso 2: Asignación de recursos con retornos tabulados 2) Problema de Presupuesto de Capital Una compañía tiene tres fábricas existentes, y en cada una se está considerando una posible expansión. El capital total asignado para expansión es 5 millones de soles. El número de planes alternativos para la fábrica i,(i = 1,2,3) incluyendo la posibilidad de ninguna expansión, el costo esperado adicional de cada alternativa para la fábrica i y el retorno correspondiente se tabulan en la siguiente tabla. Fábrica 1 Fábrica 2 Fábrica 3 Alternativa C R C R C R 1 0 0 0 0 0 0

2 1 5 2 8 1 3 3 2 6 3 9 - - 4 - - 4 12 - - El objetivo del problema de decisión es seleccionar un plan factible para cada fábrica i tal que se maximice el ingreso total resultante. La solución de este problema siguiendo la metodología de programación dinámica es dividir el problema en tres etapas en el cual cada etapa constituye una fábrica, el estado del sistema es el dinero disponible para cada etapa o fábrica y la decisión que se toma en cada etapa es ¿cuanto invertir?. Procediendo de la siguiente manera: Se grafica las etapas del problema para una mejor ilustración y se aplica el método de solución de derecha a izquierda.

S4=S3-D3 S3=S2-D2S2=S1-D1S1= 5

Fábrica 1

Fábrica 2

Fábrica 3

R1(D1,S2) R2(D2,S3) R3(D3,S4)

¿Cuánto Invertir? ¿Cuánto Invertir? ¿Cuánto Invertir? Rn (Dn,Sn) : representa la confiabilidad por tomar la decisión Dn (instalar 1, 2,ó 3); unidades en paralelo en la etapa n ( componente 1, 2 ó 3) para pasar del estado Sn (dinero disponible al inicio de la etapa n) al estado Sn+1. Para n=3 (fábrica 3)

ƒ*3 (S3) = Max [R3 (D3,S4) + ƒ*

4(S4)] 0≤ D3 ≤ 1 0≤ S3 ≤ 5

Decisión (D3) Estado S3 0 1 ƒ*3(S3) D*3(S3)

0 0 - 0 01 0 3 3 12 0 3 3 13 0 3 3 14 0 3 3 15 0 3 3 1

5

Page 4: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

8

Rn (Dn,Sn) : representa las ventas por tomar la decisión Dn (asignar 1, 2, 3, ó 4); agentes en la etapa n ( región 1, 2 ó 3) para pasar del estado Sn (agentes disponibles al inicio de la etapa n) al estado Sn+1.

Para n =2 (fábrica 2) ƒ*

2 (S2) = Max [R2 (D2,S3) + ƒ*3(S3)]

0≤ D2 ≤ 4 0≤ S 2≤ 5

Decisión (D2) Estado S2 0 2 3 4 ƒ*2(S2) D*3(S2)

0 0+0=0 ---- ---- ---- 0 01 0+3=3 ---- ---- ---- 3 02 0+3=3 8+0= 8 ---- ---- 8 2

Solución Obsérvese que solo se cuenta con 6 agentes y que por lo menos debe asignarse uno a cada región, lo que significa que cada ves que se evalúa una región debe de los seis reservarse 2 para las otras dos regiones con lo cual lo máximo disponible para cada región es 4, por eso en la tabla se tiene asignaciones de 1 a 4. El diagrama de bloques es:

3 0+3=3 8+3=11 9+0= 9 ---- 11 2 4

S4 = S3 - D3S3 = S2 - D2S2 = S1 - D1S1=6Región 1 Región 2 Región 3

R1 (D1, S2) 3) R3 (D3, S4) R2 (D2, S

D3¿Cuántos agentes asignar?

D2¿Cuántos agentes asignar?

D1¿Cuántos agentes asignar?

0+3=3 8+3=11 9+3=12 12+0=12 12 3, 45 0+3=3 8+3=11 9+3=12 12+3=15 15 4

Para n = 1 (fábrica 1)

ƒ*1 (S1) = Max [R1 (D1,S2) + ƒ*

2 (S2)] 0≤ D1 ≤ 1 0≤ S1 ≤ 5

Decisión (D1) Estado S1 0 1 2 ƒ*1(S1) D*1(S1)

5 0+15=15 5+12=17 6+11=17 17 1 Ahora antes de evaluar la función recursiva se deben determinar para cada etapa los intervalos de variación tanto de la decisión como del estado de los agentes disponibles, así tenemos:

El problema tiene soluciones óptimas alternativas: Etapa 1: Invertir 1 Millón de soles en la fábrica 1 5 1≤ D1 ≤4 o se decide asignar 1 agente que es el mínimo o se asigna hasta 4 que es el máximo. Invertir 3 Millones de soles en la fábrica 2 9 3≤ S1 ≤6 la cantidad mínima para del recurso vendedores que deben haber para todas las etapas Invertir 1 Millón de soles en la fábrica 3 3 17 y cumplir con los requisitos mínimos es 3; pues son 3 regiones, dado que por lo menos

debe asignarse 1 vendedor en cada región; y lo máximo que debe asignarse para las tres etapas es lo que se tenga disponible (este mismo razonamiento vale para las etapas siguientes).

Invertir 1 Millón de soles en la fábrica 1 5 Invertir 4 Millones de soles en la fábrica 2 12 Invertir 0 Millones de soles en la fábrica 3 0 17 Etapa 2: Invertir 2 Millones de soles en la fábrica 1 6 1≤ D2 ≤4 o se decide asignar 1 agente que es el mínimo o se asigna hasta 4 que es el máximo. Invertir 2 Millones de soles en la fábrica 2 8 2≤ S2 ≤5 porqué son 2 regiones, y por lo menos debe asignarse 1 a cada región o el máximo Invertir 1 Millón de soles en la fábrica 3 3 17 existente al inicio de la etapa 1 menos 1, que es lo mínimo que requiere la etapa1. Etapa 3: 3) Asignar Agentes Vendedores

1≤ D3 ≤4 o se decide asignar 1 agente que es el mínimo o se asigna hasta 4 que es el máximo. El gerente de ventas de una editorial de libros de texto universitarios tiene 6 agentes de ventas que puede asignar a tres regiones distintas del país. Ha decidido que cada región debe tener por lo menos un agente y que cada agente individual debe quedar restringido a una de estas regiones, pero ahora quiere determinar cuántos agentes debe asignar a las respectivas regiones con el fin de maximizar las ventas. La siguiente tabla da el incremento estimado en las ventas de cada

región (en las unidades apropiadas) si se le asignan diferentes cantidades de agentes.

1≤ S3 ≤4 porqué es una región, y por lo menos debe asignarse 1 a esta región o el máximo existente al inicio de la etapa 1 menos 2 (1 agente para la región 1 y un agente para la región 2).

Ahora si queremos generalizar el intervalo Sn, para cualquier valor de n entre 1,2, y 3, tenemos:

Utilizando la programación dinámica determine: a) La función recursiva asociada al problema indicando los límites máximos y mínimos de la variable de estado y de la decisión para cualquier etapa “n”.

Región 1 2 3

número 1 35 21 28 de 2 48 42 41 agentes 3 70 56 63 4 89 70 75

3 – n + 1 ≤ Sn ≤ 6 – n + 1

La función recursiva es:

fn (Sn) =Max {Rn(Dn,Sn) + f*n+1(Sn-Dn)} 1≤Dn ≤4

b) La solución del problema. 3-n+1≤Sn≤6-n+1

7

Page 5: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

10

Ahora se utiliza la forma tabular del método de programación dinámica para su solución comenzando por la etapa 3:

Notas estimadas Curso No DE DÍAS DE ESTUDIO IOII SO RM Mat.

1 09 07 08 12 2 10 08 11 143 12 12 14 184 14 18 16 19

n=3

f3 (S3) =Max {R3(D3,S4) + 0 } 1≤ D3 ≤4 1≤ S3 ≤4

Decision D3 S3 1 2 3 4 F3 (S3) D3 (S3)

1 28 - - - 28 12 28 41 - - 41 23 28 41 63 - 63 34 28 41 63 75 75 4

En este caso se divide el problema en 4 etapas, cada etapa representa un curso y para cada uno se decide cuantos días estudiar, al inicio de la etapa 1, tenemos 7 días que serán asignados a todas las etapas, como se requiere las notas mínimas especificadas se debe tomar la decisión de estudiar por lo menos un día cada curso y como máximo 4 días, para lo cual la cantidad de tiempo disponible al inicio de cada etapa n es: 4 – n + 1 ≤ Sn ≤ 7 – n + 1. El diagrama de bloques de este problema es: n=2 f2 (S2) =Max {R2(D2,S3) + f*3(S2-D2) }

S3 = S2 - D2

R3 (D3, S4) R3 (D3, S4)

S2 = S1 - D1S1 = 7

Curso IOII

Curso SO

Curso RM

S4 = S3 - D3

R2 (D2, S3) R1 (D1, S2)

S5 = S4 - D4Curso Mat.

D3¿Cuántos días

asignar?

D3¿Cuántos días

asignar?

D2¿Cuántos días

asignar?

D1¿Cuántos días

asignar?

1≤ D2 ≤4 2≤ S2 ≤5

Decisión D2 F2(S2) D2(S2) S2 1 2 3 4 2 21 + 28 = 49 - - - 49 1 3 21 + 41 = 62 42 + 28 = 70 - - 70 2 4 21 + 63 = 84 42 + 41 = 83 56 + 28 = 84 - 84 1, 3 5 21 + 75 = 96 42 + 63 = 105 56 + 41 = 97 70 + 28 = 98 105 2

n=1 Rn (Dn,Sn) : representa la nota que se obtiene por tomar la decisión Dn (asignar 1, 2, 3, ó 4); días en la etapa n (curso IOII, SO, RM ó Mat.) para pasar del estado Sn (días disponibles al inicio de la etapa n) al estado Sn+1.

f1 (S1) =Max {R1(D1,S2) + f*2(S1-D1) } 1≤ D1 ≤4 1≤ S1 ≤4 Decisión D1 F1 (S1) D1 (S1) Función Recursiva: S1 1 2 3 4

6 35 + 105 =140 48 + 84 = 132 70 + 70 = 140 89 + 49 = 138 140 1, 3 fn (Sn) =Max {Rn(Dn,Sn+1) + f*n+1(Sn-Dn)} 1≤Dn ≤4

4 – n + 1≤Sn≤ 7 – n + 1. Solución óptima: Alternativa 1 Para n = 4 Asignar 1 agente a la región 1: ventas obtenidas 35

f4 (S4) =Max {R4(D4,S5) + 0 } 2 agentes a la región 2: ventas obtenidas 42 1≤ D4 ≤4 3 agentes a la región 3: ventas obtenidas 63 total ventas 140

1≤S4≤ 4. Alternativa 2 Decisión D4S4 1 2 3 4 F4(S4) D4(S4)

1 12 12 12 12 14 14 23 12 14 18 18 34 12 14 18 19 19 4

Asignar 3 agentes a la región 1 ventas obtenidas 70 2 agentes a la región 2 ventas obtenidas 42 3 agentes a la región 3 ventas obtenidas 23 total ventas 140 4) Asignar el recurso Tiempo Usted cuenta con 7 días antes de que se inicien los exámenes finales de sus cuatro cursos y desea asignar este tiempo de estudio de la manera más efectiva que le sea posible. Usted necesita al menos las notas mínimas que se indican para cada curso y quiere concentrarse en un solo curso cada día de modo que desea asignar uno, dos, tres o cuatro días a cada curso. Usted estima que las asignaciones alternativas para cada curso le proporcionaría la nota que se muestran en la tabla siguiente. Resuelva este problema usando programación dinámica de manera que maximice el promedio que obtenga de los cuatro cursos e indique su respuesta.

9

Page 6: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

12

Número de Área Comerciales 1 2 3 4

0 0 0 0 0 1 4 6 5 3 2 7 8 9 7 3 7 10 11 12 4 12 11 10 14 5 15 12 9 16

Para n = 3 f3 (S3) =Max {R3(D3,S4) + f*4(S3-D3) }

1≤ D3 ≤4 2≤ S3 ≤ 5 Decisión D3S3 1 2 3 4 F3 (S3) D3 (S3)

2 08+12=20 20 13 08+14=22 11+12=23 23 24 08+18=26 11+14=25 14+12=26 26 1,35 08+19=27 11+18=29 14+14=28 16+12=28 29 2

El recurso escaso que tiene que distribuirse en las diferentes estaciones ubicadas en diferentes áreas, es el número de comerciales y del cual se dispone un máximo de 5; la tabla muestra el número de votos ganados si se asignan entre 0 y 5 comerciales en las diferentes áreas de modo que el estado al inicio de cada etapa es el número de comerciales disponibles y la decisión puede variar entre no asignar ningún comercial o asignar como máximo los 5 comerciales, en donde cada etapa representa una estación televisiva ubicada en una área determinada.

Para n = 2

f2 (S2) =Max {R2(D2,S3) + f*3 (S2-D2) } El diagrama de bloques correspondiente es 1≤ D2 ≤4 3≤ S2 ≤ 6 Decisión D2S2 1 2 3 4 F2 (S2) D2 (S2)

3 07+20=27 27 14 07+23=30 08+20=28 30 15 07+26=33 08+23=31 12+20=32 33 16 07+29=36 08+26=34 12+23=35 18+20=38 38 4

S3 = S2 - D2

R3 (D3, S4) R3 (D3, S4)

S2 = S1 - D1S1 = 5

Estación en área1

Estación en área2

Estación en área3

S4 = S3 - D3

R2 (D2, S3) R1 (D1, S2)

S5 = S4 - D4Estación en área4

D3¿Cuántos comer- ciales asignar?

D3¿Cuántos comer- ciales asignar?

D2¿Cuántos comer- ciales asignar?

D1¿Cuántos comer- ciales asignar?

Para n = 2 f2 (S2) =Max {R2(D2,S3) + f*3 (S2-D2) }

1≤ D2 ≤4 3≤ S2 ≤ 6 Donde Rn (Dn,Sn+1), representa el número de votos ganados por asignar Dn comerciales en la

estación del área “n” de manera que el número disponible de comerciales para el área que le sigue sea (Sn – Dn).

Decisión D1S1 1

2 3 4F1 (S1) D1 (S1)

7 09+38=47 10+33=43 12+30=42 14+30=44 47 1 Función Recursiva: fn (Sn) =Max {Rn(Dn,Sn+1) + f*n+1(Sn-Dn)} Respuesta Nota 0≤Dn ≤5 Asignar al curso IOII 1 día 09 0≤Sn≤ 5 Asignar al curso SO 4 días 18

Asignar al curso RM3 1 día 08 Para n=4 Asignar al curso Mat. 1 día 12 f4 (S4) =Max {R4(D4,S5) + 0 } 47 0≤Dn ≤5 0≤Sn≤ 5 5) Estrategia para campaña electoral. D4

S40 1 2 3 4 5

f4(S4) D4(S4)

0 0 0 0

1 0 3 3 1

2 0 3 7 7 2

3 0 3 7 12 12 3

4 0 3 7 12 14 14 4

5 0 3 7 12 14 16 16 5

Una campaña política se encuentra en su última etapa y las preliminares indican que la elección está pareja. Uno de los candidatos del cual usted es asesor, tiene suficientes fondos para comprar tiempo de TV por un total de cinco comerciales en horas de mayor audiencia en estaciones localizadas en cuatro áreas diferentes. Con base en la información de las preliminares se hizo una estimación del número de votos adicionales que se pueden ganar en las diferentes áreas de difusión según el número de comerciales que se compren. Estas estimaciones se dan en la siguiente tabla en miles de votos: Utilice la programación dinámica para diseñar una estrategia respecto a cómo deben distribuirse los cinco comerciales entre las cuatro áreas con el fin de maximizar el número estimado de votos ganados.

11

Page 7: Programación dinamica

Programación Dinámica. Para n =3

f3 (S3) =Max {R3(D3,S4) + f*4(S3-D3) } 0≤D3 ≤5

0≤S3≤ 5 D3

S30

Ing. Miguel Jiménez C. M.Sc.

14

1 2 3 4 5f3(S3) D3(S3)

0 0+0=0 0 0

1 0+3=3 5+0=5 5 1

2 0+7=7 5+3=8 9+0=9 9 2

3 0 +12=12 5+7=12 9+3=12 11+0=11 12 0,1,2

4 0+14=14 5+12=17 9+7=16 11+3=14 10+0=10 17 1

5 0+16=16 5+14=19 9+12=21 11+7=18 10+3=13 9+0=9 21 2

6) Determinar políticas y estrategias en el juego. Usted cree haber desarrollado un sistema para ganar un juego. Sus colegas no piensan que este sistema sea tan bueno, por lo que le apuestan que si comienza con 3 fichas, usted no tendrá cinco fichas después de tres jugadas. Cada jugada incluye apostar cualquier cantidad de las fichas disponibles y ganar o perder este mismo número de fichas. Usted cree que su sistema le dará una probabilidad de 2/3 de ganar una jugada dada. Suponiendo que usted está en lo correcto, se quiere determinar su política óptima respecto a cuantas fichas apostar (si apuesta) en cada una de las tres jugadas. La decisión en cada jugada deberá tomar en cuenta los resultados de las jugadas anteriores. El objetivo es maximizar la probabilidad de ganar la apuesta hecha a sus colegas. Conjeturas: El estado en cada etapa estará representado por el número de fichas a jugar, o sea que el recurso escaso son las fichas disponibles en cada etapa. En la última jugada (Jugada3) usted debe tener por lo menos 3 fichas, para poder continuar con el juego, si tiene 2 o menos ya no puede jugar en consecuencia perdió la apuesta con su amigo, por que aunque juegue 2 fichas y gana no alcanzaría la meta de 5 fichas; sin embargo si tiene 3 fichas la única alternativa es jugar 2 fichas para poder llegar a la meta de 5, si tiene 4 fichas puede jugar ó 1 ficha para alcanzar 5 o jugar 2 fichas para llegar a 6. Si por el contrario usted tiene ya en ésta etapa, 5 o más fichas ya no debe jugar porque ya ganó la apuesta a su amigo. Resumiendo en esta etapa tiene: D3 = (0, 1, 2) y S3 = (3, 4, ≥5)

Para n =2

f2 (S2) =Max {R2(D2,S3) + f*3(S2-D2) } 0≤D2 ≤5

0≤S2≤ 5 D2

S20 1 2 3 4 5

f2(S2) D2(S2)

0 0+0=0 0 0

1 0+5=5 6+0=6 6 1

2 0+9=9 6+5=11 8+0=8 11 1

3 0+12=12 6+9=15 8+5=13 10+0=10 15 1

4 0+17=17 6+12=18 8+9=17 10+5=15 11+0=11 18 1

5 0+21=21 6+17=23 8+12=20 10+9=19 11+5=15 12+0=12 23 1

En la segunda jugada (jugada 2) usted debe tener por lo menos 2 fichas para tener chance de ganar, porque si tiene 1 ficha y la apuesta y asumiendo que gana, solo tendría dos fichas para apostar en la jugada3 y aunque gane en esta jugada, perderá la apuesta con su amigo porque solo tendrá 4 fichas al final. Además lo máximo que podría tener es 6 fichas si apostó todo en la primera jugada y ganó; sin embargo como solo interesa conseguir 5 fichas se considera como límite ≥ 5. Con respecto a la decisión de cuantas fichas jugar en esta etapa, se puede no jugar ninguna ficha si tiene ya 4 fichas y sigue con chance de ganar el juego o jugar todas las fichas. Resumiendo D2 = (0, 1, 2, 3, 4) y el estado del número de fichas será S2 = (2, 3, 4, ≥ 5) Finalmente en la primera jugada (jugada1), se tienen cuatro alternativas de juego a saber: jugar 1, 2 ó 3 fichas y cualquier alternativa se puede tomar como decisión en esta etapa; y el estado al inicio de esta etapa o puede ser como mínimo 1 ficha o menos de cinco para estar involucrado en el problema. D1 = (0, 1, 2, 3) y S1 = (1, 2, 3, 4). Sin embargo para dar respuesta al caso se utilizará S1= 3.

Para n =1

f1 (S1) =Max {R1(D1,S2) + f*2(S1-D1) } 0≤D1 ≤5

0≤S1≤ 5 Al final de cada jugada (etapa n), el número esperado de fichas es : Sn+1 = 1/3(Sn-Dn)+2/3(Sn+Dn), los valores de Sn, se definen en la forma tabular: D2

S20 1 2 3 4 5

f2(S2) D2(S2)

5 0+23=23 4+18=22 7+15=22 7+11=18 12+6=18 15+0=15 23 0

El diagrama de bloques es: R1(D1,S2) = 2/3 R2(D2,S3) = 2/3 R3(D2,S4) = 2/3 Respuesta:

No asignar ningún comercial a la estación ubicada en le área 1 votos ganados: 0 Asignar 1 comercial a la estación ubicada en el área 2 votos ganados: 6

Asignar 1 comercial a la estación ubicada en el área 3 votos ganados: 5 Asignar 3 comerciales a la estación ubicada en el área 4 votos ganados: 12 Total de votos que se esperan se ganen: 23

D3 ¿cuántas fichas jugar?

D2 ¿cuántas fichas jugar?

D1 ¿cuántas fichas jugar?

S1=3 S4=1/3(S3-D3)+2/3(S3+D3) S3=1/3(S2-D2)+2/3(S2+D2)

S2=1/3(S1-D1)+2/3(S1+D1) Jugada1 Jugada2 Jugada3

13

Page 8: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

16

7) Problema de corte La función recursiva es: Una fábrica de papel ha recibido solicitudes de cuatro diferentes litografías (imprentas), de la

siguiente manera: fn (Sn) =Max {Rn(Dn,Sn+1) x f*n(1/3(Sn-Dn)+2/3(Sn+Dn)} beneficio por rollo Dn variable. solicitud 1: 6 rollos de 2,5 mts de ancho b1 = $3,10/rollo Sn variable. solicitud 2: 5 rollos de 4,0 mts de ancho b2 = $5,25/rollo solicitud 3: 4 rollos de 3,0 mts de ancho b3 = $4,40/rollo Para n = 3 f3 (S3) =Max {R3(D3,S3)} solicitud 4: 8 rollos de 2,0 mts de ancho b4 = $2,50/rollo 0 ≤D3 ≤2. La fábrica tiene un rollo de 7 metros de ancho de papel para atender estas ordenes. Ordenes

parciales pueden ser satisfechas. ¿cuáles ordenes y cuanto de cada una se deben satisfacer para maximizar el beneficio total?.

S3 =3, 4 ó ≥5. D3 S3 0 1 2 f3*(S3) D3*(S3) 3 - - 2/3 2/3 2 El diagrama de bloques: 4 - 2/3 2/3 2/3 1 ≥5 1 - - 1 0 Para n = 2 f2 (S2) =Max {R2(D2,S2) x f*3(1/3(S2-D2)+2/3(S2+D2)} 0 ≤D2≤4.

S2 =2, 3, 4 ó ≥5. D2 S2 0 1 2 3 4 f2*(S2) D2*(S2) 2 - 2/3*2/3 2/3*2/3 - - 4/9 1 ó 2 3 2/3 2/3*2/3 2/3*1 2/3*1 - 2/3 0, 2 ó 3 4 2/3 2/3*1+1/3*2/3 2/3*1 2/3*1 2/3*1 8/9 1 ≥5 1 - - - - 1 0 Para n = 1 f1 (S1) =Max {R1(D1,S1) x f*2(1/3(S1-D1)+2/3(S1+D1)} 0 ≤D1≤3.

S1 =3. D1 S1 0 1 2 3 f1*(S1) D1*(S1) 3 2/3*2/3 2/3*8/9+1/3*4/9 2/3*1 2/3*1 20/27 1 Respuesta: Estrategia En la 1ra jugada la decisión debe ser jugar 1 ficha (D1=1), y si gana la primera jugada entonces en la segunda jugada jugar 1 ficha (D2=1); pero si pierde la 1ra jugada, entonces en la segunda jugada la decisión debe ser jugar 1 ficha o dos fichas (D2= 1 ó 2), pues es indiferente. Si se gana la 1ra jugada y gana en la 2da jugada entonces en la tercera jugada ya no debe jugar (D3=0). Por el contrario si gana en la 1ra jugada y pierde en la 2da jugada entonces en la tercera jugada debe jugar 2 fichas (D3=2). Si pierde en 1ra jugada y gana la 2da jugada entonces en la tercera jugada tiene la opción de jugar 1 ó 2 fichas (D3=1 ó 2) dependiendo si se juega 2 ó 1 en la 2da jugada Finalmente si pierde en 1ra jugada y pierde la 2da jugada entonces la apuesta estará perdida.

a) Etapa n: Solicitud a la que asignara una cantidad de rollos (n = 1,2,3,4). b) Variable de estado Sn: Cantidad de metros disponibles al inicio de cada etapa. c) Variable de decisión Dn : Cantidad de rollos, a entregar en cada etapa d) Estado al final de la etapa n: S n +1 = Sn- - rnDn. rn = ancho del rollo pedido e) Función de retorno: Ventas máximas = Rn (Dn, Sn+1) f) La cantidad de rollos que se pueden despachar de cada solicitud es: como mínimo cero (0) y como máximo {Min (soicitud n , entero (7 / ancho n)) }; es decir: 0 ≤ D1 ≤ min (6, 7/2.5 ) 0 ≤ D1 ≤ 2 0 ≤ D2 ≤ min (5, 7/4.0 ) 0 ≤ D2 ≤ 1 0 ≤ D3 ≤ min (4, 7/3.0 ) 0 ≤ D3 ≤ 2 0 ≤ D4 ≤ min (8, 7/2.0 ) 0 ≤ D4 ≤ 3 g) La función de retorno inmediato Rn (Dn, Sn+1) = Dn x bn Función Recursiva:

fn (Sn) =Max {Dn x bn + f*n+1(Sn-rnDn)} 0≤ Dn ≤ min (soicitud n , entero (7 / rn))

0≤Sn≤ 7 Para n=4

f4 (S4) =Max { D4 x b4 + 0 } 0≤D4 ≤3

0≤S4≤ 7 D4 S4 0 1 2 3 f4(S4) D4(S4)

0 0x2,5=0 0 01 0x2,5=0 0 02 0x2,5=0 2,5 13 0x2,5=0 1x2,5=2,5 2,5 14 0x2,5=0 1x2,5=2,5 2x2,5=5 5 25 0x2,5=0 1x2,5=2,5 2x2,5=5 5 26 0x2,5=0 1x2,5=2,5 2x2,5=5 3x2,5=7,5 7.5 37 0x2,5=0 1x2,5=2,5 2x2,5=5 3x2,5=7,5 7,5 3

S3 = S2 - 4D2

R3 (D3, S4) R3 (D3, S4)

S2 = S1 – 2.5D1S1 = 7 Solicitud 1 Solicitud 2 Solicitud 3

S4 = S3 - 3D3

R2 (D2, S3)R1 (D1, S2)

S5 = S4 - 2D4Solicitud 4

D4¿Cuántos rollos

atender?

D3¿Cuántos rollos

atender?

D2¿Cuántos rollos

atender?

D1¿Cuántos rollos

atender?

15

Page 9: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

18

Caso 3: El modelo de la mochila Para n=3 f3 (S3) =Max { D3 x b3 + f*4 (S3-3D3) } 8) Modelo general sin restricciones

Un camionero que trabaja por su cuenta tiene 8m3 de espacio disponible en un camión que saldrá para la ciudad de Lima. Un distribuidor que tiene grandes cantidades de tres artículos diferentes, todos destinados para esa ciudad, ha ofrecido al camionero los siguientes pagos por transportar tantos artículos como quepan en el camión:

0≤D3 ≤2 0≤S3 ≤7

D3 S3 0 1 2 f3(S3) D3(S3)

0 0x4,4+0=0 0 01 0x4,4+0=0 0 02 0x4,4+2,5=2,5 2,5 03 0x4,4+2,5=2,5 1x4,4+0=4,4 4,4 14 0x4,4+5=5 1x4,4+0=4,4 5 05 0x4,4+5=5 1x4,4+2,5=6,9 6,9 16 0x4,4+7,5=7,5 1x4,4+2,5=6,9 2x4,4+0=8,8 8.8 27 0x4,4+7,5=7,5 1x4,4+5=9,4 2x4,4+0=8,8 9,4 1

Pago. Volumen.(Vn) Artículo $/art. m3/art. I 11 1 II 32 3 III 58 5 ¿Cuántas unidades de cada artículo deberá aceptar el camionero a fin de maximizar los pagos de embarque, sin exceder la capacidad del camión?. En este caso si quisiéramos construir el modelo matemático de este problema las variables de decisión representarían la cantidad de artículos que se deben de embarcar de cada tipo de artículo, en consecuencia hay tres variables de decisión a saber:

Para n=2

f2 (S2) =Max { D2 x b2 + f*3 (S2-4D2) } X1 = la cantidad de artículos tipo I a embarcar en el camión. X2 = la cantidad de artículos tipo II a embarcar en el camión. 0≤D2 ≤2 X3 = la cantidad de artículos tipo III a embarcar en el camión. 0≤S2≤ 7 La función objetivo será maximizar el beneficio total que estará representado por la suma de los beneficios parciales. El modelo matemático será:

D2 S3 0 1 f2(S2) D2(S2)

0 0x5,25+0=0 0 01 0x5,25+0=0 0 02 0x5,25+2,5=2,5 2,5 03 0x5,25+4,4=4,4 4,4 04 0x5,25+5=5 1x5,25+0=5,25 5,25 15 0x5,25+6,9=6,9 1x5,25+0=5,25 6,9 06 0x5,25+8,8=8,8 1x5,25+2,5=7,75 8.8 07 0x5,25+9,4=9,4 1x5,25+4,4=9,65 9,65 1

Max Bt = 11X1 + 32X2 + 58X3

s.a X1 + 3X2 + 5X3 ≤ 8

Xj ≥ 0 y entero Ahora como deseamos aplicar la metodología de programación dinámica, debemos dividir el problema en tres etapas (subproblemas), uno para cada tipo de artículo y el estado al inicio de cada etapa es la capacidad de volumen disponible aún en el camión. En cada etapa debe decidirse cuantas unidades se deben embarcar.

Diagrama de bloques: Para n=1

f1 (S1) =Max { D1 x b1 + f*2 (S1-2.5D1) } 0≤D1 ≤2

S1= 7 D3 S3 0 1 2 f3(S3) D3(S3)

7 0x3,1+9,65=9,65 1x3,1+5,25=8,35 2x3,1+2,5=8,7 9,65 0 Respuesta: beneficio Atender con 0 rollos a la solicitud 1 0x3,10 = 0,00 Atender con 1 rollo a la solicitud 2 1x5,25 = 5,25 Atender con 1 rollo a la solicitud 3 1x4,40 = 4,40 Atender con 0 rollos a la solicitud 4 0x2,50 = 0,00 Beneficio total = 9,65

Rn (Dn,Sn+1) = Pagon x Dn donde: Pagon = 11, 32 y 58 para n = 1, 2 y 3 respectivamente Función Recursiva:

fn (Sn) =Max { Pagon x Dn + f*n+1(Sn-VnDn)} 0≤ Dn ≤ (entero (8 / Vn)

0≤ Sn ≤ 8 Vn = El volumen del artículo n

S4 = S3 - 5D3S3 = S2 -3D2S2 = S1 - D1S1=8Artículo I Artículo II Artículo III

D1¿Cuántos Artículos embarcar?

D2¿Cuántos Artículos embarcar?

D3¿Cuántos Artículos embarcar?

R1 (D1, S2) R2 (D2, S3) R3 (D3, S4)

17

Page 10: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

20

Para n = 3 Respuesta: embarcar 3 unidades del artículo I con beneficio 3 x11 = 33 f3 (S3) =Max { Pago3 x D3 + 0 } embarcar 0 unidades del artículo II con beneficio 0 x32 = 0

embarcar 1 unidades del artículo III con beneficio 1 x58 = 58 Total 91 0≤ D3 ≤ 1 0≤ S3 ≤ 8 9) Modelo particular (con restricciones)

D3S30

1

f3(D3) D3(S3)

0 58x0+0=0 0 01 58x0+0=0 0 02 58x0+0=0 0 03 58x0+0=0 0 04 58x0+0=0 0 05 58x0+0=0 58x1+0=58 58 16

Un camionero que trabaja por su cuenta tiene 10m3 de espacio disponible en un camión que saldrá para la ciudad de Lima. Un distribuidor que tiene grandes cantidades de tres artículos diferentes, todos destinados para esa ciudad, ha ofrecido al camionero los siguientes pagos por transportar tantos artículos como quepan en el camión: Pago. Volumen. Artículo $/art. m3/art. I 11 1 II 27 2 III 43 4 ¿Cuántas unidades de cada artículo deberá aceptar el camionero a fin de maximizar los pagos de embarque, con la condición de embarcar por lo menos un artículo de cada tipo y sin exceder la capacidad del camión?. 58x0+0=0 58x1+0=58 58 1

7 58x0+0=0 58x1+0=58 58 18 58x0+0=0 58x1+0=58 58 1

Para este caso hay dos caminos para dar respuesta al modelo, pero en ambos casos el diagrama de bloques es el mismo: Camino 1 La función recursiva no cambia, pero sin embargo el rango de variación de la decisión y del estado en cada etapa varía completamente a saber:

Para n = 2 f2 (S2) =Max { Pago2 x D2 + f*3(S2-V2D2)}

0≤ D2 ≤ 2 1≤D3≤Entero((10 –V1 – V2)/ V3) ; 1≤D2≤Entero((10 –V1 – V3)/ V2); 1≤D1≤Entero((10 – V2 – V3)/ V1) 0≤ S2 ≤ 8 V3 ≤S3 ≤10 – V1 – V2; V2 + V3 ≤ S2 ≤ 10 – V1; V1 + V2 + V3≤ S1≤ 10

D2S20

1 2

f2(D2) D2(S2)

0 32x0+0=0 0 01 32x0+0=0 0 02 32x0+0=0 0 03 32x0+0=0 32x1+0=32 32 14 32x0+0=0 32x1+0=32 32 15 32x0+58=58 32x1+0=32 58 06 32x0+58=58 32x1+0=32 32x2+0=64 64 27 32x0+58=58 32x1+0=32 32x2+0=64 64 28 32x0+58=58 32x1+58=90 32x2+0=64 90 1

Si deseamos generalizar el rango de variación para cualquier número de etapas, de los parámetros Dn y Sn tendremos:

ninV

N

i iV

nD ≠∀

∑=

≤≤ );110

Entero(1

∑∑−

==

−≤≤1

110

n

iin

N

nii VSV

; donde N representa el número total de etapas.

para n=1 Vi no existe y como tal no hay que restar

Ahora bien aplicando la forma tabular y manteniendo la función recursiva con los rangos de variación encontrados se tiene los siguiente: Para n = 3

f3 (S3) =Max { 43 x D3 + 0 } Para n = 2 f1 (S1) =Max { Pago1 x D1 + f*2(S1-V1D1)} 1≤ D3 ≤ 1

4≤ S3 ≤ 7 0≤ D1 ≤ 8 D3S31

f3(D3) D3(S3)

4 43x1+0=43 43 15 43x1+0=43 43 16 43x1+0=43 43 17 43x1+0=43 43 1

S1 = 8 D1

S1 0

1 2 3 4 5 6 7 8

f1(D1) D1(S1)

8 11x0+90=90

11x1+64=75

11x2+64=86

11x3+58=91

11x4+32=76

11x5+32=87

11x6+0=66

11x7+0=77

11x8+0=88 91 3

19

Page 11: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

22

Para n = 2 El costo por unidad producida con tiempo extra a la semana es $100 más que en las horas normales. El costo de almacenamiento es $50 por unidad por cada semana que se guarda. Existe un inventario de dos dispositivos, pero la compañía no desea quedarse con ninguno después de tres semanas. Utilice programación dinámica para determinar cuántas unidades debe producir cada semana con el fin de minimizar los costos de producción e inventarios.

f2 (S2) =Max { 27 x D2 + f*3(S2-V2D2)} 1≤ D2 ≤ 2

6≤ S2 ≤ 9 D2 f2(D2) D2(S2) S2

1 2 6 27+43 = 70 70 1 7 27+43= 70 70 18 27+43= 70 54+43= 97 97 2 9 27+43= 70 54+43= 97 97 2

Solución: En primer lugar el acuerdo asumido por la BUILD-EM-FAST COMPANY y su Cliente, no admite pedidos pendientes por tanto tiene que abastecerlo con sus tres unidades por mes. El problema es factible dividirlo en tres etapas (dado que son tres semanas de producción) para tomar decisiones de cuanto producir por semana y en consecuencia cada subproblema es más fácil de resolver. El Retorno inmediato asociado con la decisión en cada etapa está relacionado con los costos de producción tanto en tiempo normal cómo en tiempo extra más el costo de inventario tal como se indica:

Para n = 1

f1 (S1) =Max { 11 x D1 + f*2(S1-V1D1)} Rn(Dn,Sn+1) = Cpein = CnnPnn + CenPen + 50(Sn + Pnn + Pen – 3) 1≤ D1 ≤ 4 Donde:

S1 = 10 Cpein = Costo de Producción e inventario en la etapa n D1

S1 1

2 3 4

f1(D1) D1(S1)

10 11 + 97 = 108 22 + 97 = 119 33 + 70 = 103 44 + 70 = 114 119 2

CnnPnn = Costo normal de Producción en la etapa n x Cantidad producida en tiempo normal en la etapa n CenPen = Costo Producción en tiempo extra en la etapa n x Cantidad producida en tiempo extra en la etapa n Dn = Decisión en la etapa n, referida a determinar cuántas unidades producir en tiempo normal y en tiempo extra.

El estado al inicio de cada etapa(semana), está dado por: S1 = 2; Respuesta: embarcar 2 unidades del artículo I con beneficio 2 x11 = 22 S2 = S1 + Pn1 + Pe1 – 3; los valores que puede tomar son: 0, 1, 2 y 3 embarcar 2 unidades del artículo II con beneficio 2 x27 = 54 S3 = S2 + Pn2 + Pe2 – 3; los valores que puede tomar son: 0, 1, 2 y 3 embarcar 1 unidades del artículo III con beneficio 1 x43 = 43 Total 119 S4 = 0; Estado al final de la semana 3 Camino 2 La decisión al inicio de cada etapa (semana), está dado por: En este caso lo más práctico es de la capacidad total 10 m3, reservar 7 m3 para cumplir con el requerimiento de llevar una unidad de cada tipo de artículo y el resto de capacidad 3 m3 disponibles se le da el tratamiento que se le dio al ejemplo 1 (modelo general sin restricciones), el resultado debe ser el mismo; se deja al alumno para que compruebe lo manifestado. Obsérvese que con el restante de 3 m3 pude llevar 1 unidad del artículo 1 y 1 unidad del artículo 2 adicionales; logrando en total llevar:

1≤D1≤4 : Se debe producir por lo menos 1 para satisfacer la demanda puesto que se tiene 2 unidades en inventario y como máximo la suma de la capacidad de producción en tiempo normal y en tiempo extra 0≤D2≤3 : Se puede dejar de producir si en la etapa anterior se produjo 4, y lo máximo que se puede producir es la suma de la capacidad de producción en tiempo normal y en tiempo extra. 0≤D3≤3 : Se puede dejar de producir si en la etapa anterior se produjo 3, y lo máximo que se puede producir es la suma de la capacidad de producción en tiempo normal y en tiempo extra.

embarcar 2 unidades del artículo I con beneficio 2 x11 = 22 embarcar 2 unidades del artículo II con beneficio 2 x27 = 54 embarcar 1 unidades del artículo III con beneficio 1 x43 = 43 Total 119 Diagrama de Bloques: Cpei1 Cpei2 Cpei3Y se llega al mismo resultado Caso 4: Producción e Inventario 10) La BUILD-EM-FAST COMPANY ha acordado con su mejor cliente abastecerlo con un dispositivo especial con 3 unidades durante cada una de las tres semanas siguientes, aun cuando producirlos va a requerir horas extra de mano de obra. Los datos de producción concernientes son como se indica en la tabla: Producción máxima Producción máxima Costo de Producción Semana tiempo normal tiempo extra por unidad tiempo normal 1 2 2 $300 2 2 1 $500 3 1 2 $400

S4 = 0 S3 =S2 + Pn2 + Pe2 -3S2=S1 + Pn1 +Pe1 -3S1 =2 Semana3

Semana2

Semana1

D3D1 D2(Pn3 + Pe3) (Pn1 + Pe1) (Pn2 + Pe2)

21

Page 12: Programación dinamica

Programación Dinámica. Función recursiva:

[)(* = MinSf )3()3(50 *1 −+++−++++ + nnnnnnnnnnnnn PePnSfPePnSPeCePnCn

Ing. Miguel Jiménez C. M.Sc.

24

11) La Northern Airplane Co. construye aviones comerciales para varias líneas aéreas en todo el mundo. La última etapa del proceso de producción consiste en fabricar los motores de turbina e instalarlos (operación sumamente rápida) en la estructura del avión terminado. La compañía tiene varios contratos de trabajo para entregar un gran número de aviones en un futuro cercano, y en este momento debe programarse la producción de los motores de turbina durante los próximos cuatro meses.

Dn, Sn variable Nota: únicamente la producción en tiempo extra tiene lugar cuando con la producción en tiempo normal no alcanza. En la segunda columna de la Tabla 1, se indica la cantidad de motores que debe estar lista para

su instalación, a fin de cumplir con las fechas de entrega contratadas. Así, el número acumulado de motores que deben producirse para fines de los meses 1, 2, 3 y 4 debe ser por lo menos 10, 15, 25 y 20, respectivamente.

Para n =3

Las instalaciones disponibles para producir los motores varían de acuerdo con otros programas de producción, mantenimiento y renovación durante este período. Las diferencias mensuales que resultan en cuanto al número máximo que se puede producir y el costo unitario de producción (en millones de dólares) se dan en la tercera y cuarta columnas de la tabla.

f3(S3) = Min[400Pn3 + 500Pe3 + 50(S3 + Pn3 + Pe3 – 3 ) + 0 ] 0≤D3≤3 0≤S3≤3

D3 Dadas las variaciones de los costos de producción, podría valer la pena producir algunos motores un mes o dos antes de su fecha de instalación y se está estudiando esta posibilidad. El inconveniente es que esos motores deberán almacenarse hasta que sean instalados (la estructura de los aviones no estará lista antes). El costo de almacenaje para cada motor es de $15 000/mes (se incluye el interés sobre el capital invertido), como se ilustra en la última columna de la tabla.

S3 0 1 2 3 f3*(S3) D3*(S3) 0 -- -- -- 1400 1400 3 1 -- -- 900 -- 900 2 2 -- 400 -- -- 400 1 3 0 -- -- -- 0 0

Utilice programación dinámica para determinar la programación del número de motores que se deben fabricar en cada uno de los cuatro meses, de manera que se minimicen los costos totales de producción y almacenaje. Suponga que las cantidades producidas deben ser enteros múltiplos de cinco.

Nota: En la celda donde no existe asignación es porqué ésta no es factible.

Para n =2

Mes Instalaciones programadas

Producción máxima

Costo unitario de producción*

Costo unitario de almacenaje*

1 10 25 1.08 0.0152 15 35 1.11 0.0153 25 30 1.10 0.0154 20 10 1.13 0.015

f2(S2) = Min[500Pn3 + 600Pe3 + 50(S3 + Pn3 + Pe3 – 3 ) + f3 (S2 + Pn2 + Pe2 –3) ] 0≤D2≤3 0≤S2≤3

D2S2 0 1 2 3 f2*(S2) D2*(S2) 0 3000 3000 3 1 2400 2550 2400 2

Tabla 1 2 1900 1950 2100 1900 1 * El costo está expresado en millones de dólares. 3 1400 1450 1500 1750 1400 0 Solución Para n =1 f1(S1) = Min[500Pn1+ 600Pe1 + 50(S1 + Pn1 + Pe1 – 3 ) + f2 (S1 + Pn1 + Pe1 –3) ]

Mes Demanda dn

Prod. Máx Pn

Cup Cn

Cua In

1 10/5=2 25/5=5 1.08*5=5.40 0.015*5=0.0752 15/5=3 35/5=7 1.11*5=5.55 0.015*5=0.0753 25/5=5 30/5=6 1.10*5=5.50 0.015*5=0.0754 20/5=4 10/5=2 1.13*5=5.65 0.015*5=0.075

0≤D1≤3 S1=2 D1

S1 1 2 3 4 f1*(S1) D1*(S1) 2 3300 3050 3000 2950 2950 4

Respuesta: Producir: 4 unds. en el período 1: 2 En tiempo normal y 2 en tiempo extra 0 en el período 2: no hay producción

3 en el periodo 3: 1 en tiempo normal 2 en tiempo extra )]()( x [)( *1

*nnnnnnnnnnnn dDSfdDSIDCMinSf −++−++= +

Con un costo total mínimo en las tres semanas de $ 2950. Dn,Sn variable

23

Page 13: Programación dinamica

Programación Dinámica. Para n=4

]0)4(075.0 x 65.5[)( 4444*

4 +−++= DSDMinSf

)]5()5(075.0 x 50.5[) 33*

433333 −++−++= DSfDSDMinS

)]3()3(075.0 x 55.5[) 22*

322222 −++−++= DSfDSDMinS

Ing. Miguel Jiménez C. M.Sc.

26

)]2()2(075.0 x 40.5[) 11*

211111 −++−++= DSfDSDMin

2≤S4≤4 0≤D4≤2 S4 Debe ser tal que sumado a la capacidad de producción alcance para atender la demanda de 4 unidades (es decir a 4 múltiplos de 5), en consecuencia al inicio del cuarto mes debe haber por lo menos 2 unidades porque la capacidad de producción en el cuarto mes está limitada a 2 unidades; y como máximo S4 debe ser 4 unidades dado que con ello se satisface la demanda de ese mes y el stock final será cero (0), no hay restricción de dejar al final algún inventario. D4 Si el estado del inventario al inicio del cuarto mes es 4 la decisión factible es no producir, sin embargo si el estado inicial es 2 unidades lo máximo que se puede producir es 2 unidades. D4S4 0 1 2 f*4(S4) D*4(S4) 2 -- -- 11.30 11.30 2 3 5.65 5.65 1 4 0 -- -- 0.00 0 Para n=3

(*f

1≤S3≤7 0≤D3≤6 S3 Puede comenzar en 1 y utilizar la máxima capacidad de producción de este mes (D3 =6), para poder abastecer la demanda de este mes y quede en inventario 2 unidades para el siguiente mes; y lo máximo que puede ser S3 al inicio de esta etapa es 7 de manera que aunque no se produzca ninguna unidad (D3=0), aún queden 2 unidades en inventario para el siguiente mes y satisfacer la demanda. D3S3 0 1 2 3 4 5 6 f*3(S3) D*3(S3) 1 44.45 44.45 6 2 38.95 38.875 38.875 6 3 33.45 38.375 33.30 33.30 6 4 27.95 27.875 27.80 27.80 5 5 22.45 22.375 22.30 22.30 4 6 16.95 16.875 16.80 16.80 3 7 11.45 11.375 11.30 11.30 2 Para n=2

(*f

0≤S2≤3 1≤D2≤7 S2 Puede ser 0, pues la capacidad de producción de este mes con exceso puede satisfacer la demanda y lo máximo que puede ser es 3, que corresponde a la capacidad máxima de producción en la 1ra etapa menos su demanda esto es: (5 – 2 = 3); el nivel mínimo de producción en este mes debe ser 1 aún cuando S3 = 3 y se satisfaga la demanda de este mes; sin embargo si no se

produce no alcanzaría a cubrirse toda la demanda de los meses siguientes. El nivel máximo que pude tomar D2 es 7, equivalente a la capacidad máxima de producción. D2S2 1 2 3 4 5 6 7 f*2(S2) D*2(S2) 0 66.725 66.715 66.825 66.95 66.725 4 1 61.175 61.225 61.275 61.40 61.175 61.175 3 2 55.625 55.675 55.725 55.85 55.975 55.625 55.625 2 3 50.085 50.125 50.175 50.30 50.425 50.55 50.625 50.075 1 Para n = 1

(* Sf

S1=0 2≤D1≤5 En este caso el inventario inicial es cero (0). Por tanto, la decisión que se tome debe ser por lo menos 2 unidades para atender la demanda (D1=2), y el nivel máximo de producción es equivalente a la capacidad de producción de este mes (D1=5). D1S1 2 3 4 5 f*1(S1) D*1(S1) 0 77.525 77.45 77.375 77.30 77.30 5 Producir 5 en el período 1 1 en el período 2 6 en el periodo 3 2 en el periodo 4 Caso 5: Modelo de Confiabilidad 12) Considere un sistema electrónico que consta de cuatro componentes, cada uno de los cuales debe funcionar para que el sistema también lo haga. La confiabilidad de éste se puede mejorar si se instalan varias unidades paralelas en una o más de las componentes. La siguiente tabla muestra la probabilidad de que las respectivas componentes funcionen si consisten en una , dos o tres unidades en paralelo, así como sus respectivos costos en cientos de dólares. Dadas las limitaciones de presupuesto se pueden gastar un máximo de $1000. utilice los modelos de redes para determinar cuantas unidades paralelas deben instalarse en cada una de las cuatro componentes para maximizar la probabilidad de que el sistema funcione.

Probabilidad y costo de funcionamiento Nro de unidades Comp. 1 Comp. 2 Comp.3 Comp. 4 paralelas prob costo prob. Costo prob costo prob. costo 1 0.5 1 0.6 2 0.7 1 0.5 2 2 0.6 2 0.7 4 0.8 3 0.7 3 3 0.8 3 0.8 5 0.9 4 0.9 4

Este modelo fue visto en el capítulo de redes en el cual se construyó el modelo matemático y se diseñó la red que representaba el problema. Ahora se aplicará la metodología de la programación dinámica para resolverlo. Solución:

25

Page 14: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

28

En este caso como se tiene que tomar la decisión de cuantas unidades instalar de cada tipo de componente, se divide el problema en 4 etapas (una etapa por cada tipo de componente).

Para n=4 f4 (S4) =Max {R4(D4,S5)}

El estado del sistema al inicio de cada etapa está dado por el dinero disponible; sin embargo lo que hay que tener presente es que al inicio de cada etapa el dinero disponible debe ser de tal manera que por lo menos alcance para instalar una unidad de esa etapa y una unidad de cada una de las etapas restantes. Esto sugiere que en la etapa 4 lo mínimo que puede ser S4 es 200 dólares, para la etapa 3 lo mínimo debe ser S3 = 300 (100 para la etapa 3 y 200 para la etapa 4), en la etapa 2 debe garantizarse por lo menos 500 dólares (D2=500), y finalmente para poder diseñar el circuito por lo menos se necesita 600 dólares al inicio de la 1ra Etapa para instalar una unidad de cada tipo de componente (S1≥600 .

1≤D4 ≤3 2≤S4≤6

D4S4 1 2 3 f*4(S4) D*4(S4) 2 0.5 -- -- 0.5 1 3 0.5 0.7 -- 0.7 2 4 0.5 0.7 0.9 0.9 3 5 0.5 0.7 0.9 0.9 3

Las cantidades máximas de dinero disponible se obtienen de la siguiente manera: 6 0.5 0.7 0.9 0.9 3 S4≤1000 – costo de 1 und. del comp.1 – costo de 1 und. del comp.2 – costo 1 und. del comp.3 S3≤1000 – costo de 1 und. del comp.1 – costo de 1 und. del comp.2 Para n=3 S2≤1000 – costo de 1 und. del comp.1 f3 (S3) =Max {R3(D3,S4 x f*4(S3-c(D3)) )} S1≤1000 1≤D3 ≤3 3≤S3≤7 Generalizando para cualquier valor de n tenemos: D3 S3 1 2 3 f*3(S3) D*3(S3)

Aplicando la forma tabular de solución de la programación dinámica tenemos:

27

∑∑−

==

−≤≤1

1i 10 i

n

in

N

niS componente del unidad 1instalar por costocomponente del unidad 1instalar por costo

niic )1( ∑

=1)1(

iic

3 0.7x0.5=0.35 -- -- 0.35 1 4 0.7x0.7=0.49 -- -- 0.49 1 5 0.7x0.9=0.63 0.8x0.5=0.40 -- 0.63 1

6 0.7x0.9=0.63 0.8x0.7=0.56 0.9x0.5=0.45 0.63 1 Con respecto a la decisión en cada etapa, en todas las etapas es la misma es decir instalar 1, 2 ó 3 unidades con lo cual 1≤Dn≤3.

7 0.7x0.9=0.63 0.8x0.9=0.72 0.9x0.7=0.63 0.72 2

Para n=2 Diagrama de Bloques: f2 (S2) =Max {R2(D2,S2 x f*3(S2-c(D2)) )} 1≤D2≤3 5≤S2≤9

Rn(Dn,Sn+1) : representa la confiabilidad que se alcanza por instalar Dn unidades del componente n cn(Dn) : representa el costo por instalar D unidades en la etapa n. Función recursiva:

fn (Sn) =Max {Rn(Dn,Sn+1) x f*n+1(Sn-c(Dn))} 1≤Dn ≤3

N −1n

≤S∑=

n≤

En esta función recursiva los elementos de la función se multiplican por estar en serie los componentes del circuito.

S3 =S2-c2(D2)

R3 (D3, S4) R3 (D3, S4)

S2=S1– c1(D1) S1 = 10 Comp. 1 Comp..2

Comp. 3

S4=S3-c3(D3)

R2 (D2, S3) R1 (D1, S2) D2

S2 1 2 3 f*2(S2) D*2(S2)

D1¿Cuántas unidades

instalar?

D2¿Cuántas unidades

instalar?

D3¿Cuántas unidades

instalar?

D3¿Cuántas unidades

instalar?

S5=S4-c4(D4) 5 0.6x0.35=0.210 -- -- 0.210 1 Comp. 4 6 0.6x0.49=0.294 -- -- 0.294 1

7 0.6x0.63=0.378 0.7x0.35=0.245 -- 0.378 1 8 0.6x0.63=0.378 0.7x0.49=0.343 0.8x0.35=0.280 0.378 1 9 0.6x0.72=0.432 0.7x0.63=0.441 0.8x0.49=0.392 0.441 2 Para n=1

f1 (S1) =Max {R1(D1,S1 x f*2(S1-c(D1)) )} 1≤D1≤3

S1=10 D1

S1 1 2 3 f*1(S1) D*1(S1) 10 0.5x0.441=0.2205 0.6x0.378=0.2268 0.8x0.378=0.3024 0.3024 3

Respuesta: costo confiabilidad Instalar 3 unidades del componente 1 3 0.8 Instalar 1 unidad del componente 2 2 0.6 Instalar 1 unidad del componente 3 1 0.7 Instalar 3 unidades del componente 4 4 0.9

Confiabilidad del circuito ==> 0.8x0.6x0.7x0.9 = 0.3024

Page 15: Programación dinamica

Programación Dinámica. Ing. Miguel Jiménez C. M.Sc.

30

PROBLEMAS PROPUESTOS DE PROGRAMACIÓN DINÁMICA 1) Una compañía ha averiguado que un competidor está planeando sacar un nuevo tipo de producto con ventas potenciales muy grandes. Esta compañía ha estado trabajando en un producto similar y la investigación está casi terminada. Ahora se quiere sacar el producto más rápidamente para alcanzar a la competencia. Se tienen que lograr cuatro etapas independientes (o sin traslape) incluyendo lo que falta de la investigación que por el momento se lleva a cabo a paso normal. Sin embargo, cada etapa se puede realizar en un nivel de prioridad o de quiebre para acelerar la terminación. Los tiempos requeridos (en meses) y el costo (en millones de dólares) para los distintos niveles son:

Tiempo y Costo IR D SDM IPD

Nivel t c t c t c t c Normal 5 3 Prioridad 4 6 3 6 5 5 2 3 Quiebre 2 9 2 9 3 10 1 6

IR = Investigación Restante D = Desarrollo

SDM = Sistemas de Diseño y Manufactura IPD = Inicio de Producción y Distribución.

Se dispone de $30 000 000 para estas cuatro etapas. Utilice la programación dinámica para determinar el nivel a que debe conducirse cada etapa para minimizar el tiempo total hasta que se pueda comercializar el producto sujeto a las restricciones de presupuesto.

2) Una empresa sabe que la demanda de su producto durante cada uno de los cuatro meses siguientes será como sigue: mes1, 1 unidad; mes2, 3 unidades; mes3, 2 unidades; mes4, 4 unidades. Al principio de cada mes, la empresa debe determinar cuántas unidades se deben producir durante ese mes. Durante un mes en el que se produce cualquier número de unidades, se incurre en un costo de preparación de 3 dólares. Además, hay un costo variable de 2 dólares por cada unidad producida. Al final de cada mes, se incurre en un costo de 0.75 dólares por unidad en inventario. Las limitaciones de capacidad permiten la producción de un máximo de 5 unidades durante cada mes. El tamaño de la bodegas de la empresa restringe el inventario final de cada mes a 4 unidades cuando mucho. La empresa desea determinar un calendario de producción para cada mes considerando que la no atención de una demanda determinada no le significa perjuicio debido a la gran demanda de su producto, y además que reduzca al mínimo la suma de los costos de producción y de almacenamiento durante los cuatro meses. Suponer que hay 2 unidades a mano a principio del primer mes y se requiere que al final de los 4 períodos haya 1 unidad.

3) Una empresa sabe que la demanda de su producto durante cada uno de los cuatro meses siguientes será como sigue: mes1, 1 unidad; mes2, 3 unidades; mes3, 2 unidades; mes4, 4 unidades. Al principio de cada mes, la empresa debe determinar cuántas unidades se deben producir durante ese mes. Durante un mes en el que se produce cualquier número de unidades, se incurre en un costo de preparación de 3 dólares. Además, hay un costo variable de 2 dólares por cada unidad producida. Al final de cada mes, se incurre en un costo de 0.75 dólares por unidad en inventario. Las limitaciones de capacidad permiten la producción de un máximo de 5 unidades durante cada mes. El tamaño de la bodegas de la empresa restringe el inventario final de cada mes a 4 unidades cuando mucho. La empresa desea determinar un calendario de producción para cada mes considerando que la no atención de una demanda determinada le significa perjuicio debido a la poca demanda de su producto, y además que reduzca al mínimo la suma de los costos de producción y de almacenamiento durante los cuatro meses. Suponer que hay 2 unidades a mano a principio del primer mes y se requiere que al final de los 4 períodos haya 1 unidad.

Ing. Miguel Jiménez C. M.Sc.

Profesor Investigador

Espero que este módulo ayude a los estudiantes a comprender los modelos de Programación Dinámica Determinística. Este módulo muestra paso a paso la metodología de la Programación Dinámica de ciertos problemas de Programación Matemática que son vistos en el curso de Investigación de operaciones II. .

29