Sie sind auf Seite 1von 14

21/04/2015

Investigacin de
Operaciones II

Ing. Enrique M. Avendao Delgado


eavendano@hotmail.com

Unidad 1
PROGRAMACION DINMICA

Ing. Enrique M. Avendao Delgado


eavendano@hotmail.com

21/04/2015

PDP
La Programacin Dinmica , se utiliza para resolver
problemas en los que el costo del perodo actual o el
estado del siguiente perodo son aleatorios. A estos
problemas se les conoce como problemas de
Programacin Dinmica Probabilstica (PDP). El
objetivo por lo general es minimizar el costo esperado
obtenido en un determinado horizonte de tiempo.

Ing. Enrique Avendao Delgado

Ejemplo 1:
Por un precio de un $1/galn, la cadena Safeco
Supermarker compr 6 galones de leche de
una lechera local. Cada galn de leche se
vende en las tres tiendas de la cadena en
$2/galn. La lechera debe comprar de nuevo
en 0.50/galn la leche que se queda al final del
da. Infortunadamente para Safeco, la demanda
para cada una de las tres tiendas de la cadena
es incierta. Los datos pasados indican que la
demanda diaria en cada tienda es como se
ilustra en la tabla. Safeco quiere asignar los 6
galones de leche a las tres tiendas para
maximizar la ganancia diaria neta esperada
(ingresos menos costos) obtenida de la leche.
Utilice la PDP para determinar cmo Safeco
debe asignar los 6 galones de leche entre las
tres tiendas.

Tienda 1

Tienda 2

Tienda 3

Demanda
diaria
(galones)

Probabilidad

0.60

0.00

0.40

0.50

0.10

0.40

0.40

0.30

0.30

Ing. Enrique Avendao Delgado

21/04/2015

Ejemplo 1: Solucin:
Con excepcin del hecho de que la demanda es incierta.
Los costos de diarios de Safeco son siempre $ 6.00, concentremos la
atencin en el problema de distribuir la leche para maximizar el
ingreso diario esperado obtenido de los 6 galones.
Variables:
rt(gt) : ingreso esperado obtenido de gt galones asignados a la tienda
t
ft(x) : ingreso esperado mximo obtenido de x galones asignados a
las tiendas t, t+1, , 3.

Ing. Enrique Avendao Delgado

Ejemplo 1: Solucin:
Para la tienda 3:
El ingreso esperado para obtenido de asignar x galones de leche a la tienda 3, se ve que :

f3(x) = r3(x)
Para t = 1 y 2 podra escribirse:

ft x max rt gt ft 1 x gt
gt

Donde gt es: (0, 1, ,x). De la ecuacin que, debido a que para cualquier eleccin de gt (el
nmero de galones asignados a la tienda t), el ingreso esperado obtenido de la tienda t,
t+1,,3 ser la suma del ingreso esperado obtenido de la tienda t si gt galones se asignan a la
tienda t ms el ingreso mximo esperado que se puede obtener de las tienda t+1, t+2,,3
cuando se asignan x-gt galones a estas tiendas. Para calcular la asignacin ptima de leche a las
tiendas, se empieza por calcular f3(0), f3(1),,f3(6). Luego, se utiliza la ecuacin para calcular
f2(0), f2(1),, f2(6). Por ltimo, se determina f1(6).

Ing. Enrique Avendao Delgado

21/04/2015

Ejemplo 2:
Suponga que $4 millones estn disponibles para invertir en tres proyectos. La distribucin de
probabilidades del valor presente neto obtenido de cada proyecto depende de cunto se invierta en cada
proyecto. Sea I, la variable aleatoria que denota el valor presente neto obtenido de cada proyecto depende
de cunto se invierta en cada proyecto.
Sea I, la variable aleatoria que
denota el valor presente neto
que obtiene el proyecto t. La
distribucin de I, depende de
la cantidad de dinero invertido
en el proyecto t, como se
ilustra en la tabla (una
inversin cero en un proyecto
siempre gana un VPN cero).
Por medio de la PDP
determine una asignacin de
inversin que maximiza el VPN
esperado obtenido de las tres
inversiones

Inversin
(Millones)
Proy 1

Proy 2

Proy 3

Probabilidad

$1

P(I1 = 2) = 0.6

P(I1 = 4) = 0.3

P(I1 = 5) = 0.1

$2

P(I1 = 4) = 0.5

P(I1 = 6) = 0.3

P(I1 = 8) = 0.2

$3

P(I1 = 6) = 0.4

P(I1 = 7) = 0.5

P(I1 = 10) = 0.1

$4

P(I1 = 7) = 0.2

P(I1 = 9) = 0.4

P(I1 = 10) = 0.4

$1

P(I2 = 1) = 0.5

P(I2 = 2) = 0.4

P(I2 = 4) = 0.1

$2

P(I2 = 3) = 0.4

P(I2 = 5) = 0.4

P(I2 = 6) = 0.2

$3

P(I2 = 4) = 0.3

P(I2 = 6) = 0.3

P(I2 = 8) = 0.4

$4

P(I2 = 3) = 0.4

P(I2 = 8) = 0.3

P(I2 = 9) = 0.3

$1

P(I3 = 0) = 0.2

P(I3 = 4) = 0.6

P(I3 = 5) = 0.2

$2

P(I3 = 4) = 0.4

P(I3 = 6) = 0.4

P(I3 = 7) = 0.2

$3

P(I3 = 5) = 0.3

P(I3 = 7) = 0.4

P(I3 = 8) = 0.3

$4

P(I3 = 6) = 0.1

P(I3 = 8) = 0.5

P(I3 = 9) = 0.4

Ing. Enrique Avendao Delgado

Ejemplo 3:
Un proyecto de investigacin sobre cierto problema de ingeniera tiene 3 equipos de
investigadores que buscan resolver el problema desde 3 puntos de vista diferentes. Se
estima que en las circunstancias actuales la probabilidad de que los equipos A, B, C
fracasen es de: 0.40, 0.60 y 0.80 respectivamente. As, la probabilidad de que los 3
equipos fracasen es de: (0.40)(0.6)(0.8) = 0.192. (Un 19.2%). El objetivo es minimizar la
probabilidad de fracaso de los 3 equipos, y por ello, se asignaran al proyecto 2 nuevos
cientficos de alto nivel.
Segn la asignacin a los equipos, la probabilidad de fracaso cambia segn lo indicado en
la tabla siguiente:
# de cientficos
adicionales
asignados
0
1
2

Probabilidad de fracaso de los equipos


A

0.40
0.20
0.15

0.60
0.40
0.20

0.80
0.50
0.30

Ing. Enrique Avendao Delgado

21/04/2015

Ejemplo 3:
Chip Bilton vende sudaderas en los juegos de ftbol de la
universidad estatal. Tiene las mismas probabilidades de
vender 200 o 400 sudaderas en cada juego. Cada vez que
Chip hace un pedido, paga 500 dlares ms 5 dlares por
cada sudadera que pide. Vende cada sudadera en 8
dlares. Por cada sudadera que no vende al final de un
juego, estima un costo de retencin de 2 dlares (debido al
costo de oportunidad del capital invertido en las sudaderas,
as como los costos de almacenamiento). Despus de cada
juego, Chip puede almacenar a lo sumo 400 sudaderas.
Suponiendo que el nmero de sudaderas que pide Chip
debe ser un mltiplo de 100, determine una poltica de
pedidos que maximice las ganancias esperadas obtenidas
durante los prximos tres juegos de la temporada. Suponga
que las sudaderas sobrantes tienen un valor de 6 dlares.
Ing. Enrique Avendao Delgado

Ejemplo 5:
Considere el siguiente problema de inventario de tres periodos. Al comienzo de cada
periodo, una empresa debe determinar cuntas unidades debe producir durante el
periodo actual. Durante un perodo en el que se producen x unidades, se incurre en
un costo de produccin c(x), donde c(0)=0 y para x>0, c(x)=3+2x. La produccin
durante cada perodo est limitada a lo sumo a 4 unidades, Despus que ocurre la
produccin, se observa la demanda aleatoria del perodo. La demanda de cada
perodo tiene las mismas probabilidades de que sean 1 o 2 unidades. Despus de
satisfacer la demanda del perodo actual de la produccin e inventario actuales, se
evala el inventario de fin de perodo de la empresa, y se estima un costo de
retencin de 1 dlar por unidad. Como resultado de la capacidad limitada , el
inventario al final de cada periodo no puede exceder 3 unidades. Se requieren que
toda la demanda se satisfaga a tiempo. Cualquier inventario disponible al final del
periodo se puede vender en 2 dlares por unidad. Al comienzo del perodo 1, la
empresa tiene 1 unidad de inventario. Utilice la programacin dinmica para
determinar la poltica de produccin que minimiza el costo neto esperado en que se
incurre durante los tres periodos.

Ing. Enrique Avendao Delgado

21/04/2015

Solucin:
Se define ft(i) como es costo neto mnimo esperado en que se incurre durante los periodos 1, 2 y 3
cuando el inventario al comienzo del perodo t es i unidades.

f3 (i) min c( x) 0.5(i x 1) 0.5(i x 2) 0.5(2)(i x 1) 0.5(2)(i x 2)


Donde x debe se un miembro de (0, 1, 2, 3 y 4) y x debe satisfacer:

Inventario Final: i+x-1<=3

Satisfacer la demanda: i+x>=2

De la ecuacin f3(i), se deduce que, debido a que si se producen x unidades durante el perodo 3, el
costo neto durante el perodo 3 es:
Costo de Produccin esperado + Costo de retencin esperado Costo de Salvamento esperado
Si se producen x unidades, el costo de produccin esperado es c(x) y hay una probabilidad de 0.5 de
que el costo de retencin del perodo 3 sea i+x-1, y una probabilidad de 0.5 de que sea i+x-2. Por
consiguiente, el costo de retencin del perodo 3 ser: (1/2)(i+x-1) + (1/2)(i+x-2) = i + x -3/2. Un
razonamiento similar muestra que el valor de salvamento esperado (un costo negativo) al final del
perodo 3 ser: (1/2)2(i+x-1) + (1/2)2(i+x-2) = 2i+2x-3. Para asegurar que se satisface la demanda del
perodo 3, se debe tener: i+x>=2. De manera similar para asegurar el inventario final de tres perodos
no excede 3 unidades, se debe tener que i+x-1<=3.
Ing. Enrique Avendao Delgado

Solucin:
Para t=1, 2, se puede derivar la relacin recursiva para ft(i) al observar que para cualquier nivel de
produccin x del mes t, los costos esperado en que se incurre durante los perodos t, t+1,3, son la
suma de los costos esperado en que se incurre durante los perodos t+1,t+2,,3. Como antes, si se
producen x unidades durante el mes t, el costo esperado durante el mes t ser c(x) + (1/2)(i+x-1) +
(1/2)(i+x-2). (Observe que durante los perodos 1 y 2 no se recibe valor de salvamento). S durante el
mes t se producen x unidades, el costo esperado durante los perodos t+1, t+2,,3 se calcula como
sigue. La mitad del tiempo, la demanda durante el perodo t ser 1 unidad, y el inventario al comienzo
del perodo t+1 ser i+x-1. En esta situacin, los costos esperados en que se incurre durante los
perodos t+1, t+2,3 (suponiendo que actuamos de manera ptima durante estos perodos) es
ft+1(i+x-1). De manera similar, hay una probabilidad 0.5 de que el inventario al comienzo del perodo
t+1 sea i+x-2, En este caso, el costo esperado en que se incurre durante los perodos t+1, t+2,,3 ser
ft+1(i+x-2). En resumen, el costo esperado durante los perodos t+1, t+2,,3 ser (1/2) ft+1(i+x-1) +
(1/2) ft+1(i+x-2). Con esto se podra escribir para t=1,2
= +

1
2

+1 +

1
2

+2 +

1
1

+1 +

+2
2 +1
2 +1

Donde x debe se un miembro de (0, 1, 2, 3 y 4) y x debe satisfacer:

Satisfacer la demanda: i+x>=2

Inventario Final: i+x-1<=3

Ing. Enrique Avendao Delgado

21/04/2015

Ejemplo 2:

Satisfacer la demanda: i+x>=2

Clculos para f3(i)

Inventario Final: i+x-1<=3

C(x)

Costo de
retencin
esperada
(i+x-3/2)

Valor de
salvamento
esperado
(2i+2x-3)

Costo total
esperado

f3(i)
X3(i)

3/2

-3/2*

5/2

5/2

f3(3)=-3/2
X3(3)=0

-1/2*

3/2

7/2

5/2

9/2

9/2*

3/2

11/2

5/2

13/2

13/2*

3/2

15/2

11

5/2

17/2

f3(2)=-1/2
X3(2)=0

f3(1)=9/2
X3(1)=1

f3(0)=13/2
X3(0)=2

Ing. Enrique Avendao Delgado

Clculos
para5:
f2(i)
Ejemplo

Satisfacer la demanda: i+x>=2

Inventario Final: i+x-1<=3

C(x)

Costo de
retencin
esperada
(i+x-3/2)

Costo futuro
esperado
(1/2)f3(i+x-1) +
(1/2)f3(i+x-2)

Costo total
esperado
Perodos 2
y3

f2(i)
X2(i)

3/2

5/2

7/2*

-1

13/2

f2(3)=7/2
X2(3)=0

11/2

6*

3/2

17/2

5/2

-1

17/2

11/2

11

3/2

21/2*

5/2

-1

21/2*

11/2

13

3/2

25/2*

11

5/2

-1

25/2*

f2(2)=6
X2(2)=0

f2(1)=21/2
X2(1)=2
X2(1)=3
f2(0)=25/2
X2(0)=3
X2(1)=4

Ing. Enrique Avendao Delgado

21/04/2015

Ejemplo
Clculos
para5:
f1(i)

Satisfacer la demanda: i+x>=2

C(x)

Inventario Final: i+x-1<=3

Costo de
retencin
esperada
(i+x-3/2)

Costo futuro
esperado
(1/2)f2(i+x-1) +
(1/2)f2(i+x-2)

Costo total
esperado
Perodos 2
y3

f2(i)
X2(i)

3/2

23/2

17

33/4

67/4

f1(2)=65/4
X1(1)=3

5/2

19/4

65/4*

Ing. Enrique Avendao Delgado

Ejemplo
5:producir xt(1) = 3 unidades durante el perodo 1. Sin embargo, no se puede
Se
empieza por
determinar el nivel de produccin del perodo 2 hasta que se observa la demanda del
perodo 1. Tambin, no es posible determinar el nivel de produccin del perodo 3 hasta
que se observa la demanda del perodo 2. Para ilustrar la idea, se determina el programa
ptimo de produccin si tanto la demanda del perodo 1 y como la del perodo 2 son dos
unidades. Puesto que xt(1) = 3, durante el perodo 1 se producirn 3 unidades. Entonces
el perodo 2 comenzar con un inventario de 1 + 3 2 = 2 unidades, as que se deben
producir x2(2) = 0 unidades. Despus que se satisface la demanda de dos unidades del
perodo 2, el perodo 3 comienza con 2-2 = 0 unidades disponibles. Por consiguiente,
durante el perodo 3 se producirn x3(0) = 2 unidades.
Plan de Produccin:

Mes

Unid

Ing. Enrique Avendao Delgado

21/04/2015

Ejemplo 3
Suponga que el permetro de la rueda de la ruleta rusa est marcado con los nmeros 1
a 5. La probabilidad de detenerse en el nmero i es p1 = 0.3, p2 = 0.25, p3 = 0.2, p4 =
0.15 y p5 = 0.1. El jugador paga $5 para hacer un mximo de cuatro giros. Determine la
estrategia ptima para cada uno de los cuatro giros, y el ingreso neto esperado
correspondiente.

Ing. Enrique Avendao Delgado

Ejemplo 3
En una variacin del juego de la ruleta rusa, se hace girar una rueda con marcas de n
nmeros consecutivos: 1 a n, en su periferia. La probabilidad de que la rueda se detenga
en el nmero i despus de un giro es pi. Un jugador paga $x por el privilegio de hacer girar
la rueda un mximo de m giros. La recompensa para el jugador es el doble de la cantidad
obtenida en el ltimo giro. Suponiendo que el juego se repite (hasta con m giros cada vez)
una cantidad razonablemente grande de veces, propone una estrategia ptima para el
jugador.
Se puede formular el problema como un modelo de programacin dinmica con las
siguientes definiciones:
1. La etapa i se representa con el giro i, i = 1, 2, ..., m
2. Las alternativas en cada etapa incluyen hacer girar la rueda una vez ms o terminar el
juego.
3. El estado j del sistema en la etapa i se representa con uno de los nmeros de 1 a n que se
haya obtenido en el ltimo giro.

Ing. Enrique Avendao Delgado

21/04/2015

Ejemplo 3 - Solucin
Sea: fi(j) = Ingreso mximo esperado cuando el juego est en la etapa (el giro) i y el
resultado del ltimo giro fue j
En este caso se tiene que:

=

2,

+1 ,

=1

Entonces, la ecuacin recursiva se puede escribir como sigue:


+1 = 2

: 2,
=mx

1 0 =

+1 +1

= 2, 3, ,

=1

La lgica de la ecuacin recursiva es que en el primer giro (i = 1), el estado del sistema es j= 0, porque acaba de
comenzar el juego. En consecuencia, f1(0)=p1f2(1)+p2f2(2)+ +pnf2(n). Despus del ltimo giro (i = m), el juego
debe terminar independientemente del resultado j del m-simo giro. Por tanto, fm+1=(j)=2j.
Los clculos recursivos comienzan con fm+1 y terminan con , f1(0), produciendo m + 1 etapas de cmputo. Como
f1(0) es el ingreso esperado por los m giros, y dado que el juego cuesta $x, el ingreso neto es f1(0)-x.
Ing. Enrique Avendao Delgado

Solucin:
Etapa 5
f5(j)=2j

Resultado j del giro 4

Solucin ptimo
f5(j)

Decisin

Terminar

Terminar

Terminar

Terminar

10

Terminar

Ing. Enrique Avendao Delgado

10

21/04/2015

Solucin:
Etapa 4

f4(j)=mx {2j, p1f5(1) + p2f5(2) + p3f5(3) + p4f5(4) + p5f5(5) }


f4(j)=mx {2j, 0.3*2 + 0.25*4 + 0.2*6 + 0.15*8 + 0.1*10 }
f4(j)=mx {2j, 5}
Ingreso esperado

Solucin ptimo

Resultado j del
giro 3

Terminar

Girar

f4(j)

Decisin

Girar

Girar

Terminar

Terminar

10

10

Terminar

Ing. Enrique Avendao Delgado

Solucin:
Etapa 3

f3(j)=mx {2j, p1f4(1) + p2f4(2) + p3f4(3) + p4f4(4) + p5f4(5) }


f3(j)=mx {2j, 0.3*5 + 0.25*5 + 0.2*6 + 0.15*8 + 0.1*10 }
f3(j)=mx {2j, 6.15}
Ingreso esperado

Solucin ptimo

Resultado j del
giro 2

Terminar

Girar

f3(j)

Decisin

6.15

6.15

Girar

6.15

6.15

Girar

6.15

6.15

Girar

6.15

Terminar

10

6.15

10

Terminar

Ing. Enrique Avendao Delgado

11

21/04/2015

Solucin:
Etapa 2

f2(j)=mx {2j, p1f3(1) + p2f3(2) + p3f3(3) + p4f3(4) + p5f3(5) }


f2(j)=mx {2j, 0.3*6.15 + 0.25*6.15 + 0.2*6.15 + 0.15*8 + 0.1*10 }
f2(j)=mx {2j, 6.8125}
Ingreso esperado

Solucin ptimo

Resultado j del
giro 2

Terminar

Girar

f3(j)

Decisin

6.8125

6.8125

Girar

6.8125

6.8125

Girar

6.8125

6.8125

Girar

6.8125

Terminar

10

6.8125

10

Terminar

Ing. Enrique Avendao Delgado

Solucin:
Etapa 1

f2(0)= p1f2(1) + p2f2(2) + p3f2(3) + p4f2(4) + p5f2(5)


f2(0)= 0.3*6.8125 + 0.25*6.8125 + 0.2*6.8125 + 0.15*8 + 0.1*10
f2(0)= 7.31

La nica opcin disponible al iniciar el juego es girar.


De acuerdo con los cuadros anteriores, la solucin ptima es
Giro Nm

Estrategia ptima

Comienza el juego, girar

Continuar si el giro 1 produce 1, 2 o 3. Si no, terminar el juego

Continuar si el giro 2 produce 1, 2 o 3. Si no, terminar el juego

Continuar si el giro 3 produce 1 o 2. Si no, terminar el juego


Ingreso neto esperado = $7.31 - $5.00 = $2.31

Ing. Enrique Avendao Delgado

12

21/04/2015

Ejemplo 6:
Petrolium inc. Pretende perforar en tres lugares en busca de petrleo, espera invertir 5 millones de
dlares, la probabilidad de encontrar petrleo es Pt y la rentabilidad se muestran en la tabla
adjunta, Utilice un PDP para elaborar una estrategia de perforacin de pozos petroleros.
Pozo

Inversin

Probabilidad

Rentabilidad

0.50

12

0.35

15

0.47

20

0.35

15

0.48

35

0.55

18

0.25

10

0.78

0.23

50

Ing. Enrique Avendao Delgado

Ejemplo 7:
Una cadena de tiendas de polleras La
Taberna de Trujillo, compra diariamente
8 pollos para distribuirlos en sus 3
tiendas. Cada pollo a la brasa lo vende en
las tres tiendas de la cadena en 18
soles/pollo. La demanda para las tres
tiendas de la cadena de polleras es
incierta y los pollos que sobran al final
del da lo puede vender a una chanchera
local a 5 soles/pollo. Utilice la PDP para
determinar cmo La Taberna debe
asignar los 8 pollos entre las tres tiendas
y as maximizar sus ganancias

Tienda 1

Tienda 2

Tienda 3

Demanda
diaria
(Pollos)

Probabilidad

0.40

0.20

0.35

0.40

0.50

0.60

0.10

0.40

0.30

0.35

0.42

0.30

Ing. Enrique Avendao Delgado

13

21/04/2015

Ejemplo 8:
Carlos Tapia vende sudaderas en los juegos de ftbol de la universidad Privada
del Norte, Tiene la mismas probabilidades de vende 200 o 400 sudaderas en
cada juego. Cada vez que Tapia hace un pedido, paga 500 dlares ms 5
dlares por cada sudadera que pide. Vende cada sudadera a 8 dlares. Por
cada sudadera que no venda al final del juego, estima un costo de retencin
de 2 dlares (debido al costo de oportunidad del capital invertido en
sudaderas, as como los costos de almacenamiento). Despus de cada juego,
Tapia puede almacenar a lo sumo 400 sudaderas, Suponiendo que el nmero
de sudaderas que pide Tapia debe ser un mltiplo de 100, determine una
poltica de pedidos que maximice las ganancias esperadas obtenidas durante
los tres primeros juegos de la temporada. Suponga que las sudaderas
sobrantes puede venderlas en 3 dlares.

Ing. Enrique Avendao Delgado

14