Sie sind auf Seite 1von 118

Teoría de Juegos

M. En C. Eduardo Bustos
Farías

1
¿Qué es un juego?

• Un juego es un problema de toma de decisiones en


el que participan dos o más individuos
(≡ decisores, jugadores, agentes, controladores).
• Es una herramienta matemática que analiza las
interrelaciones entre dos o mas individuos, y busca
un modelo de actuación óptimo.
Con un individuo el problema es un
problema de control.
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 2
¿Qué tipos de juegos hay?
• Juegos estáticos o de una tirada (one-shot games).

• Juegos repetidos.

• Juegos dinámicos.
Juego diferencial

Juego diferencial estocástico

Juegos de saltos (tipo cadenas de Markov), juegos híbridos, …

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 3
„ Juegos cooperativos:
• los jugadores deciden cooperar entre ellos para
alcanzar un resultado que sea “benéfico” para ellos.
„ Problema:
encontrar equilibrios cooperativos
conocidos también como equilibrios de Pareto.

„ Juegos de Stackelberg:
• uno de los jugadores es el líder (tira primero) y
• el resto de los jugadores son seguidores…
… etc, etc, etc,…
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 4
Generalmente, en un juego hay un
conflicto de intereses

− los objetivos de los jugadores pueden oponerse


unos contra otros.
Por lo tanto, los jugadores tienen que
negociar,
es decir,
ponerse de acuerdo cómo “jugar el juego”.
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 5
¿Como se juega un juego?

„ Juegos no cooperativos:
• los jugadores no cooperan entre ellos;
• actúan independientemente,
• cada uno tratando de satisfacer su propio objetivo.

Problema:
encontrar equilibrios no-cooperativos
también conocidos como Equilibrios de Nash.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías
Elementos del juego
„ Jugadores
„ No jugadores (“naturaleza”)
„ Acciones
„ Información
„ Estrategias
„ Resultados
„ Equilibrio
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 7
Supuestos

Los participantes en la relación:

• Son conscientes de ésta


• Buscan el máximo provecho
• Actúan racionalmente
• Existe un costo de la relación y se obtiene un
beneficio de ella.
• Se supone que el jugador escogerá la elección
óptima

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 8
Juegos
„ Un juego es una situación competitiva entre n
personas o grupos, denominados jugadores
„ Se realiza bajo un conjunto de reglas
previamente establecidas con consecuencias
conocidas
„ Las reglas definen las actividades elementales o
movimientos del juego.
„ Pueden permitirse diferentes movimientos para
los distintos jugadores , pero cada jugador
conoce los movimientos de que dispone cada
jugador
„ Si un jugador gana lo que otro jugador pierde el
juego se le denomina de suma cero

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 9
„ Un juego de 2 personas es un juego que tiene
solo dos jugadores
„ Cada jugador tiene un número finito de
elecciones o infinito llamadas estrategias.
„ Los resultados o pagos de un juego se resumen
como funciones de las diferentes estrategias para
cada jugador
„ Un juego con 2 jugadores, donde la ganancia de
un jugador es igual a la perdida de otro se
conoce como un juego de 2 persona y de suma
cero
„ En tal juego es suficiente expresar los resultados
en términos del pago a un jugador.
„ Se emplea una matriz para resumir los pagos al
jugador cuyas estrategias
Investigació
Investigación de Operaciones
est
M. En C. Eduardo Bustos Farí
án dadas por los
Farías 10
renglones de la matriz
„ Una estrategia pura es un plan
previamente determinado, que establece
la secuencia de movimientos y contra
movimientos que un jugador realiza
durante un juego completo.

„ La matriz de consecuencias o pagos


proporciona una caracterización completa
del juego al que corresponde.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 11
Juegos en Forma Normal
„ Un Juego en Forma Normal
consiste en:
• Jugadores
• Estrategias de acciones factibles.
• Matriz de Pagos (“Payoffs”)

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 12
Juegos de suma cero
„ Se dice que un juego es de “suma cero”
cuando lo que gana un jugador lo pierde el
otro, como en ajedrez, poquer, etc.

„ Todos los ejemplos que hemos visto de


juegos son de suma cero, por eso en las
celdas de la matriz del juego un mismo
número es la ganancia para el jugador de
los renglones y la pérdida para el de las
columnas.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 13
Ejemplo 1
„ Construya la matriz de pagos para el
siguiente juego.
„ Considere un juego de “igualar” monedas
en el cual cada uno de 2 jugadores A y B
elige sol (S) ó águila (A).
„ Si son iguales los 2 resultados (S y S) ó (A
y A) el jugador A gana 1 peso al jugador
B, de otra manera A pierde un peso que
paga a B

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 14
Solución
1.- Son dos jugadores
2.- Lo que uno gana el otro lo pierde
3.- Cada jugador tiene 2 estrategias
puras
4.- La matriz de juegos es de 2x2
expresado en términos del pago al
jugador
Jugador A
A S
Jugador B A 1 -1
S -1 1
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 15
Ejemplo 2
„ Construya la matriz de juegos para el
siguiente juego
„ Considere un juego en el cual 2 jugadores
muestran simultáneamente 1, 2 ó 3 dedos
uno al otro. Si la suma de dedos
mostrados, es par, el jugador II paga al
jugador I esta suma en pesos.
„ Si la suma es non, el jugador I paga esa
cantidad al jugador II.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 16
Solución
„ Son dos jugadores
„ Lo que gana 1 el otro lo pierde por lo que es de
suma cero
„ Cada jugador tiene 3 estrategias puras, mostrar 1,
2, 3 dedos
„ La matriz de juegos es de 3x3 expresada en
términos del pago del jugador I
Jugador II
1 2 3
Jugador I 1 2 -3 4
2 -3 4 -5
3 4 -5 6
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 17
10 kms B 15 kms
A
C Ejemplo 3
20 kms

„ Construya una matriz de consecuencias para el


siguiente juego.
„ Dos cadenas de supermercados se proponen
construir, cada una, una tienda en una región
rural en donde se encuentran 3 pueblos.
„ 45% de la población vive cerca del pueblo A

„ 35% de la población vive cerca del pueblo B

„ 20% de la población vive cerca del pueblo C

„ Debido a que la cadena I es más grande que la


cadena II, la cadena I controlará la mayoría de
los negocios, siempre que sus ubicaciones sean
comparativas.
„ Ambas cadenas conocen los intereses de la otra
en la región y ambas han terminado estudios de
mercado
Investigació
Investigaci que danM.proyecciones
ón de Operaciones En C. Eduardo Bustos Farí
Farías idénticas. 18
„ Si ambas cadenas se sitúan en el mismo pueblo o
los equidistantes de un pueblo, la cadena I
controlará el 65% de los negocios en ese pueblo.
„ Si la cadena I está más cercana a un pueblo que
la cadena II, la cadena I controlará 90% de los
negocios en este pueblo.
„ Si la cadena I está más alejada de un pueblo que
la cadena II, atraerá a 40% de los negocios de
este pueblo.
„ El resto de las operaciones, bajo cualquier
circunstancia, irán a la cadena II.
„ Además ambas cadenas saben que la política de
la cadena I es no ubicarse en pueblos que sean
demasiado pequeños, y el pueblo C cae dentro de
esta categoría. M. En C. Eduardo Bustos Faríías
Investigació
Investigación de Operaciones 19
Far
Solución
„ Hay 2 jugadores.
„ El jugador I tiene 2 estrategias puras
y el II tiene 3 estrategias puras.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 20
I II
B
A
C
I

„ Si I se ubica en A y II en B entonces
I tendrá (0.9)(0.45) + (0.4)(0.35) +
(0.4)(0.2) = 0.625
„ O sea el 62.5% de los negocios de la
región.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 21
I
B
A II
C

„ Si I se ubica en B y II en C, entonces
I tendrá (0.9)(0.45) + (0.9)(0.35) +
(0.4)(0.2) = 0.8
„ O sea el 80% de los negocios de la
región.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 22
II I
B
A
C

„ Si I se ubica en B y II en A entonces
I tendrá (0.9)(0.35) + (0.4)(0.45) +
(0.9)(0.2) = 0.575
„ O sea un 57%

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 23
I I
B
A II
C
II

„ Si ambas cadenas se ubican en el


mismo pueblo I recibirá 65% de los
negocios de toda la región.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 24
Tabla de pagos o consecuencias

Jugador II
A B C
Jugador I A 65 62.5 80
B 67.5 65 80

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 25
DOMINANCIA

26
Estrategia dominante
„ Se dice que una estrategia es
“dominante” cuando es la mejor
opción del jugador para todas las
posibles opciones del contrincante
(similarmente para varios
contrincantes).

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 27
Dominancia
„ Algunas veces una fila o columna de la matriz de
pagos carece de efectividad para influir sobre las
estrategias óptimas y el valor del juego
„ Una estrategia pura P es dominada por una
estrategia pura Q si, para cada estrategia pura
del oponente, el pago asociado con P no es mejor
que el pago asociado con Q.
„ Ya que una estrategia pura dominada no puede
ser nunca parte de una estrategia óptima, el
renglón o columna correspondiente en la matriz
del juego debe ser eliminada

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 28
Ejemplo 1. Dominancia

II
1 2 3 4
I 1 4 -8 7 -2
2 3 -9 2 -3
3 2 6 8 2

Observe que entre las filas 1 y 2, la 2 no desempeña ningún papel


de importancia en la estrategia del jugador I.
4>3
-8 > -9
7>2
-2 > -3
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 29
„ Por lo tanto la probabilidad asociada a
ella será cero.
„ La solución del juego anterior sería la
misma si la matriz de pago fuera:

II
1 2 3 4
I 1 4 -8 7 -2
3 2 6 8 2

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 30
Estrategia débilmente
dominante
„ Decimos que una estrategia es
“débilmente dominante” cuando no es
peor que ninguna otra estrategia.
„ Es lo mismo que decir que es la mejor o al
menos igual a otra.
„ Ojo: Una estrategia dominante es también
débilmente dominante; lo contrario no es
cierto.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 31
Estrategia dominante, ejemplo (cont)

Análisis de casos para ver si B tiene estrategia dominante


Si A elige 1 (renglón sup.), la mejor opción de B es 2 (u=-2).
Si A elige 2 (renglón cen.), la mejor opción de B es 2 (u=0).
Si A elige 3 (renglón inf.), las mejores opciones de B son 1 y
2 (u=-5).
b1 b2 b3
a1 0 -2 4
a2 2 0 10
a3 -5 -5 0

B tiene una estrategia débilmente dominante


Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 32
Ejemplo 2. Dominancia
„ Determine si alguna de las estrategias
puras del problema de la ubicación de los
supermercados en los pueblos A, B y C
pueden descartarse por dominación. La
matriz del juego era:

II
A B C
I A 65 62.5 80
B 67.5 65 80

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 33
Solución
El jugador I puede descartar ubicarse en A, ya que
las consecuencias de esta estrategia siempre son
menores o iguales a las consecuencias de B
„ 67.5 > 65

„ 65 > 62.5

„ 80 = 80

II
A B C
I A 65 62.5 80
Investigació
Investigación de Operaciones
B 67.5 Farías
M. En C. Eduardo Bustos Farí
65 80 34
El jugador II puede descartar A y C, ya que
son inferiores a B. La matriz es:
II
A B C
I A 65 62.5 80
B 67.5 65 80

I
A B
II A 35 32.5
B 37.5 35
C 20 20
I
A B
II A 35 32.5
B 37.5 35
C 20 20
La matriz de consecuencias se reduce al valor en que coinciden ambas tablas B.
Lo que indica que el supermercado I debe ubicarse en el pueblo B y controlar
elInvestigació
65% de los negocios y la cadena
Investigación de Operaciones
II ubicarseFar en
M. En C. Eduardo Bustos Farí
ías
el mismo pueblo y manejar 35
el 35% de los negocios restantes
VALOR DEL JUEGO
„ EL PAGO QUE SE OBTIENE PARA EL
JUGADOR 1 CUANDO AMBOS
JUEGAN DE MANERA OPTIMA.
„ JUEGO JUSTO: EL VALOR DEL JUEGO
ES 0.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 36
CRITERIO MINIMAX
JUGADOR 2
ESTRATEGIA
1 2 3

1 -3 -2 6
JUGADOR 1 2 2 0 2
3 5 -2 -4
¿QUE OPCION ESCOGE CADA JUGADOR DE MANERA
QUE LA MAYOR PERDIDA POSIBLE SEA MINIMIZADA?
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 37
CRITERIO MINIMAX
JUGADOR 2

ESTRATEGIA
1 2 3 MÍNIMO

1 -3 -2 6 -3
JUGADOR 1 2 2 0 2 0 VALOR MAXIMIN
3 5 -2 -4 -4
MÁXIMO 5 0 6 PUNTO SILLA

VALOR MINIMAX
SE SELECCIONA LA OPCION 2
VALOR DEL JUEGO= 0 (JUEGO JUSTO).
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 38
PUNTO SILLA

„ MINIMAX= MAXIMIN
„ PUNTO SILLA ->NINGUN JUGADOR
PUEDE APROVECHAR LA
ESTRATEGIA CONOCIDA DE SU
OPONENTE ->
„ SOLUCION ESTABLE

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 39
SOLUCIONES SIN PUNTO
SILLA
JUGADOR 2

ESTRATEGIA
1 2 3 MÍNIMO

1 0 -2 2 -2 maximin
JUGADOR 1 2 5 4 -3 -3
3 2 3 -4 -4
MÁXIMO 5 4 2
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías
minimax 40
Solución Óptima de juegos de 2
personas y suma cero
- Juegos estables (Valor de juego,
estrategias minimax y maximin).
Puntos silla
- Juegos Inestables (estrategias
mixtas)

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 41
Juegos inestables o estrategias
mixtas
„ El objetivo en la teoría de juegos es determinar
una estrategia “mejor” para un jugador dado,
bajo la consideración de que el oponente es
racional y realizará movimientos inteligentes en
contra.
„ En consecuencia si un jugador siempre selecciona
la misma estrategia pura o selecciona estrategias
puras en un orden fijo, su oponente reconocerá a
tiempo el patrón y tratará de vencerlo, si es
posible.
„ Por esto, la estrategia más efectiva es una
estrategia mixta, definida por una distribución
probabilística sobre un conjunto de estrategias
puras.
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 42
Ejemplo 1: Estrategias mixtas.
„ En el juego de mostrar 1,2 ó 3 dados
se puede construir una estrategia
mixta
„ X=[1/6, 1/3, ½],
„ que significa que el jugador uno,
planea mostrar el dedo 1 1/6 de
veces, 2 dedos 1/3 de veces, 3
dedos ½ de las veces.
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 43
Ejemplo 2: Estrategias Mixtas.

„ Sea la siguiente matriz de pagos para un


juego de 2 jugadores de suma cero
„ Este juego no tiene punto de silla, ni se
puede calcular el valor de juego. Se dice
que es un juego inestable.

Jugador B
1 2 3 4
Jugador A 1 5 -10 9 0
2 6 7 8 1
3 8 7 15 2
Investigació
Investigación de Operaciones
4 3 4
M. En C. Eduardo Bustos Farí
Farías
-1 4 44
Solución del problema de
estrategias mixtas
„ Se basa en el criterio mínimax. La única
diferencia es que A (ó jugador I) elije Xi,
la cual maximiza el pago esperado más
pequeño en una columna, en tanto que B
(ó jugador II) selecciona Yj, la cual
minimiza el pago esperado en un renglón.
„ Igual que en estrategias puras se verifica
la relación:
pago esperado minimo < pago esperado maximin

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 45
„ Cuando Xi y Yj corresponden a la solución
óptima, se cumple la igualdad y los
valores resultantes llegan a ser iguales al
valor esperado (óptimo) del juego.
„ Si Xi* y Yj* son las soluciones óptimas
para ambos jugadores, cada elemento de
pago Aij estará asociado a la probabilidad
(Xi*, Yj*). Por consiguiente, el valor
esperado óptimo del juego es:

„ En otras palabras cualquier juego matricial


tiene un valor
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 46
Métodos para resolver juegos
Métodos para resolver juegos (2xn) ó
(mx2)

„ Gráfico
„ De programación lineal

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 47
Solución gráfica de juegos de
(2xN) y (Mx2)
„ Las soluciones gráficas son
únicamente aplicables a juegos en
los cuales, por lo menos uno de los
jugadores, tiene solamente 2
estrategias.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 48
Solución gráfica de
juegos (mx2)

49
Ejemplo 1
„ Considere el siguiente juego:

B
1 2
1 2 4

A
2 2 3

3 3 2

Investigació
4
Investigación de Operaciones
-M.2En C. Eduardo Bustos
6 Farí Farías 50
SOLUCIÓN

51
El juego no tiene un punto silla. Sean y1 y
y2 (=1- y1) dos estrategias mixtas de B.

Estrategia Pagos
pura de A esperados
para B
1 -2y1 + 4

2 -y1 + 3

3 y1 + 2

4
Investigació
Investigación de Operaciones
-8y1 + 6
M. En C. Eduardo Bustos Farí
Farías 52
El juego no tiene punto silla.
Sean Y1 y Y2 (Y2 = 1-Y1) dos estrategias mixtas de B
Estrategias puras Pagos esperados Y1 = 0 Y1 = 1
de A de B
1 -2Y1 + 4 4 2
2 -Y1 + 3 3 2
3 Y1 + 2 2 3
4 -8Y1 + 6 6 -2

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 53
El punto minimax se determina como el
punto mas bajo de la envolvente superior
El valor de Y1* se obtiene como el punto de
intersección de las líneas 1 y 3
-2Y1 + 4 = Y1 + 2
-3Y = -2
Y = 2/3 (Esta es la estrategia óptima para A)
Sustituyendo en 1 y en 3
V* = -2(2/3) + 4 = 8/3
2/3 + 2 = 8/3
El valor del juego es 8/3
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 54
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 55
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 56
POR WINQSB

ESTRATEGIA ÓPTIMA PARA


EL JUGADOR A

ESTRATEGIA ÓPTIMA PARA


EL JUGADOR B

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 57
Ejemplo2: Considere el siguiente
juego (2x4)

1. Encuentre el punto máximo


2. Calcule la estrategia optima de A
3. Calcule el valor del juego

B
1 2 3 4
A 1 2 2 3 -1
2 4 3 2 6

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 58
Solución
„ El juego no es estable ya que las
estrategias puras maximin = 2 es
diferente a la mínimax = 3
„ Por lo que los pagos esperados de A
corresponden a las estrategias
puras de B son:

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 59
Estrategias puras Pagos esperados X1 = 0 X1 = 1
de B de A
1 -2X1 + 4 4 2
2 -X1 + 3 3 2
3 X1 +2 2 3
4 -7X1 + 6 6 -1

Resolviendo 2 y 3
-X1 + 3 = X1 +2
-2X1 = -1
X1 = ½ (maximin)

La estrategia óptima es
(½ , ½)
V* = - ½ +3 = 5/2
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 60
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 61
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 62
Ejemplo 3: Considere el juego
(2x4)

„ Encuentre el punto maximin


„ Calcule la estrategia óptima
„ Calcule el valor de juego

P2
1 2 3 4
P1 1 19 15 17 16
2 0 20 15 5

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 63
Solución

„ El juego no es estable ya que las


estrategias puras maximin = 15 es
diferente a mínimax = 16
Estrategias puras Pagos esperados X1 = 0 X1 = 1
de P2 de P1
1 (19-0)X1 + 0 = 0 19
19X1
2 (15-20)X1 + 20 = 20 15
-5X1 + 20
3 (17-15)X1 + 15 = 15 17
2X1 +15
4 (16-5)X1 + 5 = 5 16
11X1 + 5
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 64
Resuélvalo por winqsb

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 65
Método simplex

66
Solución de juegos (mxn) por
programación lineal
„ Se trata de Maximizar el valor del
juego (representado por las
estrategias de un jugador). Sujeto a
la combinación lineal por renglón de
la matriz de juego.
„ Si el valor maximin es positivo se
procede de este modo, si es negativo
se agrega a la matriz de juego una
constante k
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 67
Ejemplo 1.
„ Sea la matriz de consecuencias para el
juego (2x2):

Jugador 2
B1 B2
Jugador 1 A1 0 ½
A2 1 0

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 68
Solución por programación
lineal
Como el valor maximin = 0, se
procede a resolver:
MAX Z = Y1 + Y2
S.A. B1
Jugador 2
B2
Jugador 1
0Y1 + 0.5Y2 <= 1
A1 0 ½
A2 1 0

1Y1 + 0Y2 < = 1


Y1, Y2 >= 0

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 69
Solución por Winqsb:
planteamiento
Jugador 2
B1 B2
Jugador 1 A1 0 ½
A2 1 0

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 70
Datos importantes

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 71
Estrategias óptimas
Estrategias óptimas del jugador 2
„ V* = 1/3

„ Y1* = 1/3

„ Y2* = 2/3

„ (.3, .6) Estrategias para uno de los jugadores

Para obtener las estrategias óptimas del jugador 1


resolvemos por simplex dual y se tiene:
„ X1* = 2/3

„ X2* = 1/3

„ (0.66, 0.33), véase que suman 1.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 72
Ejemplo 2. Solución por PL
„ Considere el juego (4x2)

B
1 2
1 2 4
2 2 3
A 3 3 2
4 -2 6

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 73
Solución: planteamiento
„ Como el valor maximin = 2 >= 0, la estrategia
óptima del jugador B se obtiene resolviendo el
siguiente problema de programación lineal.
MAX z = Y1 + Y2
s.a. B
2Y1 + 4Y2 <= 1 1 2
1 2 4
2Y1 + 3Y2 <= 1
2 2 3
3Y1 + 2Y2 <= 1 A 3 3 2
-2Y1 + 6Y2 <= 1 4 -2 6
Y1, Y2 >= 0

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 74
Método simplex
Resolviendo por el método simplex
„ Z = 0.375

„ Y1 = 0.257/ 0.375

„ Y2 = 0.125/ 0.375

„ Valor de juego V* = 1/Z = 2.66

La estrategia óptima de B es:


„ (Y1/V1* , Y2/V2*) = (0.66, 0.33)

Para el jugador A su estrategia óptima resulta al


resolver el problema dual:
(0.33, 0, 0.66, 0)

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 75
Ejemplo 3:

Considere el siguiente juego

Resolver por el método simplex

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 76
Solución

Como el valor maximin = 15 >= 0, la estrategia óptima del


jugador P2 se obtiene resolviendo el siguiente sistema.
MAX Z = Y1 + Y2 + Y3 +Y4 s.a.
19Y1 + 15Y2 + 17Y3 + 16Y4 <= 1
0Y1 + 20Y2 + 15Y3 + 5Y4 <= 1
Y1, Y2, Y3, Y4 >= 0
Resolviendo por el método simplex
Z = 0.06530612
Y1 = Y3 = 0
Y2 = 0.044
Y4 = 0.204
El valor del juego V* = 1/Z = 15.3
La estrategia óptima del jugador P2 es:
(Y1*, Y2*, Y3*, Y4*) = (0, 0.68, 0, 0.32)
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Faríías
M. En C. Eduardo Bustos Far as 77
Puntos de equilibrio

78
Puntos de equilibrio
„ En muchos juegos ningún jugador tiene
una estrategia dominante.
„ Sin embargo, hay combinaciones de
estrategias que son “razonables” para los
jugadores, en el sentido de que a ninguno
le conviene cambiar su estrategia.
„ A estas celdas de la matriz del juego se
les llama “equilibrio de Nash”

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 79
Ejemplo de juego con punto de
equilibrio (cont)
„ Se supone que las compañías A y B consideran las tres mismas
estrategias para ganar una mayor parte relativa del mercado
como sigue:

„ a1 o b1: Sirve refrescos durante el viaje.


„ a2 o b2: Introduce autobuses con aire acondicionado.
„ a3 o b3: Anuncia diariamente en estaciones de televisión

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 80
Ejemplo de juego con punto de
equilibrio (cont)
„ Cambiamos los puntos de la tabla de modo que ningún jugador
tiene una estrategia dominante:

b1 b2 b3 Mínimo de fila
a1 -10 -11 -1 -11
a2 9 -8 -6 -8 Maximin
-13
a3 20 -10 -13
Máximo de columna 20 -8 -1

Minimax
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 81
Puntos de- equilibrio.- ejemplo

Sin embargo, el punto (a2,b2)


b1 b2 b3 es de equilibrio:
a1 -10 -11 -1 Al jugador A no le conviene
a2 9 -8 -6
a3 20 -10 -13
cambiar de a2 (u=-8) a a3
(u=-10) o a a1 (u=-11).
Al jugador B no le conviene
cambiar de b2 (u=-8) a b1
(9) o a b3 (u=-6)
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 82
El otro jugador (A) escogería a3 para contrarrestar su estrategia
Ejemplo de juego de suma cero con
mas de un equilibrio
„ Considérese la siguiente matriz:

b1 b2 b3 Mínimo de la fila
a1 2 -3 7 -3
a2 5 5 6 5 Maximin
a3 1 4 -4 -4
Máximo de la 5 5 7
columna
Minimax
„ Es un juego con dos puntos silla.
„ Aquí se tienen dos puntos de equilibrio; uno corresponde a
a2 y b1, y el otro corresponde a a2 y b2.
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 83
JUEGOS DE DOS
PERSONAS QUE NO
SON DE SUMA CERO

84
JUEGOS Y DECISIONES
ESTRATÉGICAS
Juegos que no son de suma cero
Pueden ser:
„ Cooperativos. Si los jugadores pueden negociar
contratos obligatorios que les permitan planear
estrategias conjuntas
„ No Cooperativos: Si no son posibles la
negociación y la aplicación de un contrato
obligatorio.

Equilibrio en juegos que no son de suma cero


Tipos de Equilibrio:
„ De estrategia dominante

„ De Nash

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 85
El equilibrio de estrategias
Dominantes
„ “Estoy haciendo lo mejor que puedo
sin importar lo que tu hagas
„ Tu estas haciendo lo mejor que
puedes sin importar lo que yo haga.”

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 86
El equilibrio de Nash
„ “Yo estoy haciendo lo mejor que
puedo dado lo que tu estas haciendo
„ Tu estas haciendo lo mejor que
puedes dado lo que yo estoy
haciendo.”

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 87
Juegos no cooperativos de dos personas
de suma no cero
„ En los juegos de suma no cero las celdas de la
matriz tienen dos números, uno para la
ganancia del jugador de los renglones y el otro
para la ganancia del jugador de las columnas.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 88
Un Juego en Forma Normal

Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 89
Un Juego en Forma Normal:
Análisis de Escenarios
„ Supongamos que 1 piensa que 2 escogerá
“A”.
Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 90
Un Juego en Forma Normal:
Análisis de Escenarios
„ Entonces 1 debería escoger “a”.
• La mejor respuesta de 1 a “A” es “a”.
Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 91
Un Juego en Forma Normal:
Análisis de Escenarios
„ Supongamos que 1piensa que 2 escogerá
“B”.

Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 92
Un Juego en Forma Normal:
Análisis de Escenarios
„ Entonces 1 debería escoger “a”.
• La mejor respuesta de1a “B” es “a”.

Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 93
Un Juego en Forma Normal:
Análisis de Escenarios
„ De forma similar, si 1 cree que 2 escogerá
C…
• La mejor respuesta de 1 a “C” es “a”.
Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 94
Estrategia Dominante
„ Independientemente de si el Jugador 2
escoge A, B, o C; la mejor respuesta del
Jugador 1 es escoger “a”
„ “a” es la Estrategia Dominante para el
Jugador 1
Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 95
Póngase en la posición de su
Rival
„ ¿Qué debería hacer el Jugador 2?
• 2 no tiene una estrategia dominante
• Pero 2 debería razonar que 1 va a escoger “a”.
• Por tanto, 2 debe escoger “C”.

Jugador 2
Strategy A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 96
El Resultado

Jugador 2

Estrategia A B C
Jugador 1

a 12,11 11,12 14,13


b 11,10 10,11 12,12
c 10,15 10,13 13,14

„ Este resultado se conoce como Equilibrio de Nash:


• “a” es la mejor respuesta del jugador 1 a “C”
• “C” es la mejor respuesta del Jugador 2 a “a”.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 97
Ejemplo 2. Juegos que no son
de suma cero
Dos empresas A y B venden productos
competidores están decidiendo si han de
emprender campañas de publicidad o no.
No negocian entre ellos, pero ambas se
verán afectadas por la decisión de su
competidora.
Analizar:
„ Si es un juego cooperativo o no

„ El equilibrio de estrategia dominante

„ El o los equilibrios de Nash

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 98
Matriz de pagos del ejemplo 2

Empresa B
Hacer No Hacer
Publicidad Publicidad
Hacer 10, 5 15, 0
Empresa A Publicidad
No Hacer 6, 8 10, 2
Publicidad

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 99
Solución
„ Es no cooperativo, ya que las empresas no negocian
„ Para la empresa A la estrategia pura dominante es
hacer publicidad, (No importa lo que haga B, tiene
pagos mayores a lo de B 10 > 5 y 15 > 0). Para la
empresa B una estrategia pura dominante es hacer
publicidad ya que sus pagos 5 y 8 son mayores a los
de no hacer publicidad 0 y 2. Como ambas
estrategias coinciden para este juego no cooperativo
la estrategia dominante es hacer publicidad.

Empresa B
Hacer No Hacer
Publicidad Publicidad
Hacer 10, 5 15, 0
Empresa A Publicidad
Investigació
Investigación de Operaciones No M. En
Hacer
C. Eduardo 6, 8 Farí
Bustos Farías 10, 2 100

Publicidad
„ El equilibrio de Nash se obtienen en
aquellos puntos donde cada jugador
esta haciendo lo mejor que puede
dadas las acciones del oponente.
También coincide con la estrategia de
que ambas empresas hagan
publicidad, cada empresa esta
satisfecha y no tiene ningún incentivo
para cambiarla.
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 101
Ejemplo 3. Juegos que no son
de suma cero
Dos jugadores eligen águila o sol en su
moneda y la muestran al oponente.
Analizar:
„ Si es un juego cooperativo o no

„ La estrategia dominante

„ El equilibrio de Nash

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 102
Jugador B
A S
A 1, -1 -1, 1
Jugador A S -1, 1 1, -1

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 103
Solución
„ No es un juego cooperativo ya que cada
jugador elige que mostrar y ello le de una
ganancia o una perdida. No pueden ponerse de
acuerdo los jugadores ya que cada uno busca
su beneficio
„ Las estrategias puras dominantes para A son
obtener AA ó SS. Las estrategias puras
dominantes para B son obtener AS ó SA. No
hay equilibrio de estrategias dominantes en
este juego.
Jugador B
A S
A 1, -1 -1, 1
Jugador A S -1, 1 1, -1
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 104
„ No hay un equilibrio de Nash en
estrategias puras ya que ninguna
combinación de A ó S dejan
satisfechos simultáneamente a
ambos jugadores.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 105
Ejemplo 4. Juegos que no son
de suma cero
Dos prisioneros son atrapados “in
fraganti”. Son encerrados en celdas
separadas, no pueden comunicarse.
No saben que hará el otro.
Analizar
„ Si el juego es cooperativo o no

„ El equilibrio de estrategias
dominantes
„ El equilibrio de Nash

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 106
El dilema de los prisioneros

“El dilema de los


prisioneros” es un juego
que se usa para producir
predicciones.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 107
El dilema de los prisioneros
Arturo y Roberto fueron capturados
robando un automóvil.
El Ministerio Público sospecha que
son responsables de un robo
cometido hace unos meses.
El Ministerio Público decide hacerlos
participar en un juego.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 108
El dilema de los prisioneros

Reglas del juego


• A los prisioneros se les coloca en
habitaciones separadas y no pueden
comunicarse entre sí.
• Se les informa que son sospechosos del robo
anterior.
• Si ambos confiesan, serán sentenciados a
cinco años.
• Si uno confiesa y el otro no, el que confiese
será sentenciado a 2 años y el otro a 10
Investigació
años.
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 109
El dilema de los prisioneros

Estrategias (posibles acciones)


Ambos pueden:

„ Confesar el robo anterior

„ Negar haber cometido el robo anterior

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 110
El dilema de los prisioneros
Recompensas
Existen cuatro resultados posibles:
„ Ambos confiesan.

„ Ambos lo niegan.

„ Arturo confiesa y Roberto lo niega.

„ Roberto confiesa y Arturo lo niega.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 111
Matriz de Pagos del Dilema de los Prisioneros
Estrategias de Arturo
Confesar Negar

5 años 10 años
Confesar
Estrategias 5 años 5 años
de Roberto

5 años 2 años

Negar
10 años 2 años
Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 112
Otra presentación de la matriz de
pagos

Prisionero A
Confiesa No
Confiesa
Prisionero Confiesa -5, -5 -5, -10
B No -10, -5 -2, -2
Confiesa

El primer número en cada lugar de esta matriz es la recompensa (negativa, ya


Que los años de prisión no se desean) al prisionero B, y el segundo elemento
De cada elemento es la recompensa del prisionero A.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 113
El dilema de los prisioneros
Surge una estrategia dominante.
Ambos deberían negarlo porque:
„ Si ambos lo niegan, serán sentenciados
solamente a 2 años; pero no saben si el
otro lo negará.
„ Si Arturo lo niega pero Roberto no,

Arturo recibirá solamente 5 años.


„ Si Arturo lo niega, pero Roberto confiesa,

Arturo recibirá 10 años.


„ Al final, ambos deciden que les conviene

confesar— equilibrio de Nash.


Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 114
Solución
„ Es no cooperativo ya que no
pueden ponerse de acuerdo
„ La estrategia dominante para cada
prisionero es confesar sin importar
lo que haga el otro
„ El equilibrio de Nash también seria
confesar, considerando lo que haga
el otro prisionero (-5,-5).

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 115
„ Como en un juego de 2 personas de
suma cero, la elección de la
estrategia por parte de cada jugador
(prisionero) es un punto de equilibrio
si ningún jugador puede sacar
provecho de un cambio unilateral de
estrategia.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 116
Dilema del prisionero (cont)

„ Como vemos la estrategia de traicionar es una estrategia


dominante para ambos, aunque terminan peor que si
ambos se hubieran puesto de acuerdo para no confesar.
„ Dos individuos que persiguen sus intereses personales, se
ven guiados a un resultado adverso para ambos salvo que
existan normas que impidan la traición.
„ El resultado es una solución de equilibrio.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 117
¿Qué tipo de estrategias garantizan la
cooperación entre individuos que persiguen su
propio interés?

„ Las estrategias que priorizaron la cooperación en


lugar de tratar de aprovecharse del otro jugador
generan mejores resultados, demostrando que aun
cuando dos jugadores tienen en cuenta solamente sus
intereses, les conviene cooperar entre sí.

Investigació
Investigación de Operaciones M. En C. Eduardo Bustos Farí
Farías 118

Das könnte Ihnen auch gefallen