PDP_T - copia

16
PROGRAMACIÓN DINÁMICA PROBABILÍSTICA Investigación de Operaciones II Érika López Sánchez.

Transcript of PDP_T - copia

Page 1: PDP_T - copia

PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

Investigación de Operaciones II

Érika López Sánchez.

Page 2: PDP_T - copia

Programación Dinámica Probabilística• La PDP difiere de la determinística en que el estado en la

siguiente etapa no está completamente determinado por el estado y la política de decisión de la etapa actual.

• Existe una distribución de probabilidad para determinar cuál será el estado en la siguiente etapa.

• Esta distribución de probabilidad sí queda bien determinada por el estado y la política de decisión en la etapa actual.

Page 3: PDP_T - copia

Estructura básica para PDP

𝑓 ∗𝑛+1❑ (1)

𝑓 ∗𝑛+1❑ (2)

𝑓 ∗𝑛+1❑ (𝑁 )

N

2

1

𝑠𝑛 𝑥𝑛EstadoDecisión

𝑓 𝑛¿

Etapa n Probabilidad

Contribución de la etapa n

…Etapa n + 1

Page 4: PDP_T - copia

• N= número de estados posibles en la etapa n + 1

• = distribución de probabilidad para el estado que ocurrirá, dado y la decisión en la etapa n.

• = contribución a la F.O. que se obtiene de la etapa n si resulta que el estado es i.

• Árbol de decisión, se obtiene cuando se expande la estructura básica para PDP para incluir todos los estados y las decisiones posibles en todas las etapas.

Page 5: PDP_T - copia

• La forma exacta de la relación entre y dependerá de la forma global de la función objetivo.

• Supóngase que el objetivo es minimizar la suma esperada de las contribuciones de las etapas individuales.

• En este caso representa la suma esperada mínima de la etapa n en adelante, dado que en la etapa n, el estado es sn y la política de decisión es xn.

Page 6: PDP_T - copia

• Entonces,

• con

x n+1

En donde la minimización se toma sobre todos los valores factibles de xn+1.

Page 7: PDP_T - copia

EJEMPLO: COMPAÑÍA MANUFACTURERA HIT-AND-MISS.• La compañía manufacturera Hit-and-Miss ha recibido un

pedido para surtir un artículo de un tipo especial. El cliente ha especificado requerimientos de calidad muy rigurosos, de manera que es posible que el fabricante tenga que producir más de un artículo para obtener uno aceptable.

• El fabricante estima que cada unidad producida de este tipo tiene una probabilidad de ½ de ser aceptable y una probabilidad de ½ ser defectuosa (sin posibilidad de corrección).

Page 8: PDP_T - copia

• Entonces, el número de unidades aceptables producidas en un lote de tamaño L tendrá una distribución binomial, es decir, la probabilidad de producir cero artículos aceptables en ese lote es (½) L.

• Los costos marginales de producción se estiman en $100 por unidad (incluso las defectuosas), y los artículos adicionales se desperdician.

• Además, se incurre en costos fijos de $300 siempre que se pone en marcha el proceso de producción para este artículo. Si la inspección revela que no se obtuvo un producto aceptable en un lote completo, el proceso de producción debe ponerse en marcha de nuevo con lo que se incurre en un costo fijo adicional de $300.

Page 9: PDP_T - copia

• El fabricante tiene tiempo para realizar hasta tres corridas de producción. Si al final de la tercera corrida no obtiene un artículo aceptable, el costo ocasionado por la venta perdida y las multas será de $1600.

• El objetivo es determinar la política que se debe seguir en cuanto al tamaño del lote en las corridas de producción que se requieran de manera que se minimice el costo total esperado para el fabricante.

Page 10: PDP_T - copia

Solución:Se puede formular el problema como un modelo de programación dinámica con las siguientes definiciones:

• Etapas : corridas de producción, n= 1, 2, 3.

• Variables de decisión xn : tamaños de lote correspondiente a cada etapa n.

• Estado: número de productos aceptables por obtener (uno o cero).

• mínimo costo total esperado de la etapa n en adelante, dado que en la etapa n el estado es s y la política de decisión es xn.

 x n= 0,1,…

Page 11: PDP_T - copia

• Donde . Si se toma $100 como unidad monetaria, la contribución de la etapa n al costo es (K + xn) independientemente del siguiente estado, donde

Para s = 1,

Page 12: PDP_T - copia

• , costo terminal por no haber obtenido artículos aceptables.

• Relación recursiva :

para n= 1, 2, 3.

Page 13: PDP_T - copia

Estructura básica para el problema de la compañía Hit-and-Miss

𝑓 ∗𝑛+1❑ (1)

𝑓 ∗𝑛+1❑ (1)

1

0

1 𝑥𝑛EstadoDecisión

𝑓 𝑛¿

Etapa nProbabilidad

Contribución de la etapa n

¿𝐾 +𝑥𝑛+( 12 )

𝑥𝑛

𝑓 𝑛+1∗ (1 )

1−( 12 )

𝑥𝑛

( 12 )

𝑥𝑛

𝐾 +𝑥𝑛

𝐾 +𝑥𝑛

Page 14: PDP_T - copia

n = 3

x3

s

𝑓3ሺ1,𝑥3ሻ= 𝐾+ 𝑥3 + 16൬12൰𝑥3 𝑓3∗(𝑠) 𝑥3∗ 0 1 2 3 4 5

0 0 0 0

1 16 12 9 8 8 8.5 8 3 ó 4

n = 2

x2

s

𝑓2ሺ1,𝑥2ሻ= 𝐾+ 𝑥2 +൬12൰𝑥2 𝑓3∗(1) 𝑓2∗(𝑠) 𝑥2∗ 0 1 2 3 4 5

0 0 0 0

1 8 8 7 7 7.5 8.25 7 2 ó 3

n = 1

x1

s

𝑓1ሺ1,𝑥1ሻ= 𝐾+ 𝑥1 +൬12൰𝑥1 𝑓2∗(1) 𝑓1∗(𝑠) 𝑥1∗ 0 1 2 3 4

0 0 0 0

1 7 7.5 6.75 6.875 7.4375 6.75 2

Page 15: PDP_T - copia

La política óptima es producir 2 artículos en la 1ª corrida de producción; si ninguno es aceptable, se deberán producir 2 ó 3 artículos en la 2ª corrida; si ninguno es aceptable, se tendrán que producir 3 ó 4 artículos en la 3ª corrida. Es decir,

El costo total esperado, si se sigue esta política es $ 675.

CORRIDAS

I II III2 2 32 2 42 3 32 3 4

Page 16: PDP_T - copia

Bibliografía• Hillier – Liberman. Introducción a la investigación de

operaciones, México. Editorial Mc Graw Hill. 1986.