Beruflich Dokumente
Kultur Dokumente
Hay dos clases de juegos que plantean una problemtica muy diferente y
requieren una forma de anlisis distinta. Si los jugadores pueden comunicarse
entre ellos y negociar los resultados se tratar de juegos con transferencia de
utilidad (tambin llamados juegos cooperativos), en los que la problemtica se
concentra en el anlisis de las posibles coaliciones y su estabilidad. En los juegos
sin transferencia de utilidad, (tambin llamados juegos no cooperativos) los
jugadores no pueden llegar a acuerdos previos; es el caso de los juegos
conocidos como "la guerra de los sexos", el "dilema del prisionero" o el modelo
"halcn-paloma".
En 1944, John von Neumann y Oskar Morgenstern publicaron su libro "Theory of Games and Economic Behavior" iniciando as la aplicacin de la
Teora de Juegos al anlisis econmico.
John C. Harsanyi
1920 -2000
John F. Nash Reinhard Selten
1928 - 1930 -
En 1994 se concedi el Premio Nobel de Economa a Harsanyi, Nash y Selten por sus pioneros anlisis del equilibrio en la teora de los juegos no
cooperativos.
Aumann, Robert J. (1930-) Schelling, Thomas C.
1921-
En 2005 se concedi el Premio Nobel de Economa a Rober J. Aumann y Thomas C. Schelling "por haber ampliado nuestra comprensin del
conflicto y la cooperacin mediante el anlisis de la Teora de los Juegos".
Para citar este artculo en cualquier documento puede utilizar el siguiente formato:
---------
Martnez Coll, Juan Carlos (2001): "Introduccin a la Teora de Juegos" en La Economa de Mercado, virtudes
e inconvenientes http://www.eumed.net/cursecon/juegos/ consultado el (poner fecha de consulta).
La estrategia Maximn
Consideremos un juego de suma cero en el que lo que
yo gano lo pierde el otro jugador. Cada jugador dispone de
tres estrategias posibles a las que designaremos como A,
juego de suma cero
estrategias B, y C (supongamos que son tres tarjetas con dichas
pago letras impresas). Los premios o pagos consisten en la
matriz de pagos distribucin de diez monedas que se repartirn segn las
punto de silla estrategias elegidas por ambos jugadores y se muestran
solucin estable en la siguiente tabla llamada matriz de pagos. Mis
minimax
estrategias mixtas ganancias, los pagos que puedo recibir, se muestran en
teorema del minimax verde, a la izquierda de cada casilla. Los pagos al otro
jugador se muestran en rosa, a la derecha de cada casilla.
Para cualquier combinacin de estrategias, los pagos de ambos jugadores suman
diez.
MATRIZ DE PAGOS
Las estrategias
del otro jugador
A B C
A 9|1 1|9 2|8
B 6|4 5|5 4|6
Mi estrategia
C 7|3 8|2 3|7
ste es por tanto un juego de suma cero. Se llama juego de suma cero aqul en
el que lo que gana un jugador es exactamente igual a lo que pierde o deja de
ganar el otro.
En efecto,
Podemos prever la estrategia del otro jugador? Supongamos que el otro jugador
quiere elegir tambin su estrategia MAXIMIN. Mostramos ahora slo los pagos
asignados al otro jugador en los que destacamos el pago mnimo que puede
obtener para cada una de sus estrategias. Subrayamos el mximo de los mnimos
y su estrategia maximin.
En efecto,
No todos los juegos tienen un punto de silla, una solucin estable. La estabilidad
del juego anterior desaparece simplemente trastocando el orden de las casillas BB
y BC:
El teorema del maximin afirma que en todo juego bipersonal de suma cero en el
que sea posible jugar estrategias mixtas adems de las puras, las estrategias
maximin de cada jugador coincidirn siempre en una solucin estable, un punto de
silla. Este teorema fue demostrado matemticamente por John von Neumann en
un artculo publicado en 1928
La estrategia maximn
pgina interactiva de ejercicios
Este es un ejercicio interactivo. Bajo este prrafo debe aparecer un marco con una
hoja de clculo EXCEL que permite modificar los valores de la matriz de pagos del
jugador Amarillo y actualizar automticamente los pagos del jugador Azul y los
valores de pagos mnimos y maximn. Este marco slo aparece en los
ordenadores que tengan una versin avanzada del software de MS Office. Los que
no puedan ver este marco, encontrarn al final de los ejercicios una imagen no
interactiva del mismo.
A B C D E F G H I J K L
1 Matriz de pagos Matriz de pagos
2 Jugador Amarillo (filas) Jugador Azul (columnas)
3
4 pagos Estrategias
5 mnimos A B C
6 A 2 3 5 2 8 7 5
7 Estrategias B 1 9 8 1 9 1 2
8
9
C 4 6 7 4 6 4 3
Ejercicio de MAXIMN
Ejercicios
1. Modificando solo los pagos del jugador amarillo, realice los cambios
necesarios para obtener los siguientes resultados:
1-a) Consiga que el maximin de Amarillo sea 7
1-b) Consiga que el maximin de Azul sea 3
1-c) Consiga los dos resultados anteriores simultneamente
1-d) Consiga el resultado c) cuando ambos jugadores eligen la
estrategia C
1-e) Consiga el resultado d) manteniendo la caracterstica de que
todos los pagos de la matriz sean diferentes.
1-f) Consiga el resultado e) simplemente intercambiando la posicin
de los pagos de cuatro casillas.
2. Modificando solo los pagos del jugador amarillo, consiga que cuando
Azul elija la estrategia A tenga garantizado obtener un pago de 14 o
superior.
El dilema del prisionero
El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula,
bipersonal, biestratgico y simtrico. Fue formalizado y analizado por primera vez
por A. W. Tucker en 1950. Es posiblemente el juego ms conocido y estudiado en
la teora de juegos. En base a l se han elaborado multitud de variaciones,
muchas de ellas basadas en la repeticin del juego y en el diseo de estrategias
reactivas.
El modelo halcn-paloma
HALCN-PALOMA:
MATRIZ DE PAGOS
Jugador Y
Paloma Halcn
*
Paloma 2,2 3,1
Jugador X
*
Halcn 1,3 4,4
Hay aqu dos resultados que son equilibrios de Nash: cuando las
estrategias elegidas por cada jugador son diferentes; en la matriz aqu
representada esas soluciones estn marcadas con un asterisco.
Comprubese, por el contrario, que en el Dilema del Prisionero el
equilibrio de Nash est en el punto en que ambos jugadores traicionan.
Otra notable diferencia de este juego con otros es la importancia que
aqu adquiere el orden en que los jugadores eligen sus estrategias.
Como tantas veces en la vida real, el primero que juega, gana. El
primero elegir y manifestar la estrategia Halcn con lo que el segundo
en elegir se ver obligado a elegir la estrategia Paloma, la menos mala.
ELLA
Ftbol Discoteca
Ftbol 1\2 3 \ 3*
L
Discoteca 4 \ 4 2\1
ELLA
Discotec
Ftbol
a
*
Ftbol 1\2 2\3
L Discotec
4\4 3\1
a
Juego 1.- Empecemos con el ejemplo ms sencillo. Supongamos que tres jugadores,
Ana, Benito y Carmen, tienen que repartirse entre s cien euros. El sistema de reparto
tiene que ser adoptado democrticamente, por mayora simple, una persona un voto.
Hay cuatro posibles coaliciones vencedoras: ABC, AB, BC y AC, pero hay infinitas
formas de repartir los pagos entre los tres jugadores.
En el juego 1, el valor del juego es cero para los tres jugadores. En el juego 2 el valor
del juego para Ana es cien y para Benito y Carmen es cero.
Juego 3.- Pongamos un ejemplo algo ms realista y, por tanto, un poco ms complejo.
Supongamos un municipio en el que cinco partidos polticos se han presentado a las
elecciones: el Partido Austero (PA), el Partido Benefactor (PB), el Partido Comunal
(PC), el Partido Democrtico (PD) y el Partido de la Esperanza (PE). En las elecciones,
han obtenido el siguiente nmero de concejales:
PA=11
PB=8
PC=5
PD=2
PE=1
Como ningn partido ha conseguido la mayora absoluta, es necesario que se forme
una coalicin para gobernar el municipio. El presupuesto anual del municipio es de 520
millones de euros. La coalicin gobernante debe asignar los cargos y las
responsabilidades del ayuntamiento a los diferentes partidos. En las negociaciones se
debe acordar el reparto del presupuesto, cargos y responsabilidades entre los partidos.
Suponemos que no hay simpatas ni antipatas ideolgicas y que los cargos y
responsabilidades son valorados exclusivamente segn el presupuesto econmico que
controlan. Supondremos, para simplificar, que hay disciplina de voto y que no son
posibles las traiciones internas
Anlisis del juego 3. Como el nmero total de concejales es 27, la coalicin vencedora
debe disponer al menos de 14 votos. A diferencia del juego 2, no hay ningn jugador
imprescindible para ganar. Si utilizamos la definicin que dimos arriba, el valor del
juego para todos los jugadores es cero ya que ninguno tiene garantizada su
pertenencia a la coalicin vencedora.
Como hay cinco partidos polticos, las posibles coaliciones son 31. De ellas, 16 son
vencedoras. Las coaliciones perdedoras estn en rojo. En las coaliciones vencedoras se
han marcado en amarillo los jugadores redundantes.
B no es redundante en 6 coaliciones
ABDE ACD BCE
vencedoras
ACDE BCD
C no es redundante en 6 coaliciones
vencedoras
BCDE
AB BC CD DE A D no es redundante en 2 coaliciones
CE vencedoras
AC BD B
E no es redundante en 2 coaliciones
AD BE C vencedoras
AE D Si se formara un "gobierno de
concentracin", una coalicin de
E
Nmero de representantes
en el Parlamento Europeo
a partir de enero de 2004
Austria 17
Juego 4.
Ejercicio. En el Tratado
de la Unin Europea
aprobado en Niza en
diciembre de 2000 se
acord que a partir del 1
de enero de 2004, el
nmero de
representantes de cada
pas miembro en el
Parlamento Europeo ser
el fijado en el cuadro
adjunto. Intente estimar
la asignacin de un
presupuesto de un billn
Hemiciclo del Parlamento Europeo en su sede de Estrasburgo de euros entre todos los
pases miembros para
que sea aprobado por unanimidad por el Parlamento, de forma que cada pas miembro
reciba el valor de Shapley. (Propuesta de solucin a este ejercicio)
Estrategias reactivas
Cuando un juego se repite varias veces, cada jugador puede adoptar su estrategia
en funcin de las decisiones que haya adoptado antes su oponente. Las
estrategias reactivas son las que se adoptan en los juegos con repeticin y se
definen en funcin de las decisiones previas de otros jugadores.
El ejemplo ms conocido es la estrategia OJO POR OJO (en ingls TIT FOR TAT).
Supongamos que dos jugadores repiten de forma indefinida una situacin con
pagos de forma del Dilema del Prisionero:
Jugador columna
Cooperar Traicionar
En esta situacin la estrategia OJO POR OJO puede quedar definida de la forma
siguiente: "En la primera jugada eligir la estrategia COOPERAR. En las jugadas
siguientes elegir la misma estrategia que haya elegido mi oponente en la jugada
anterior". En otras palabras, si el otro coopera, yo cooperar con l. Si el otro es
un traidor, yo ser un traidor".
La estrategia TIT FOR TAT fue definida y denominada as por el psiclogo experto en teora de
juegos Anatol Rapoport, en el marco de los experimentos del politlogo canadiense Robert Axelrod.
A comienzos de la dcada de 1980, Robert Axelrod organiz un concurso mundial sobre un dilema del
prisionero con repeticin. Los concursantes deban proponer estrategias para obtener la mxima ganancia
posible al someterse un nmero indeterminado de veces al Dilema del
Prisionero.
En el ambiente del Dilema del Prisionero, la estrategia OJO POR OJO ofrece muy
buenos resultados mientras que la estrategia TORITO proporciona pagos medios
muy bajos. En cambio, en el ambiente del juego Halcn-Paloma sucede
precisamente lo contrario: TORITO obtiene buenos resultados mientras que OJO
POR OJO proporciona pagos medios inferiores.
(Mateo 5: 38-39)
HALCN-PALOMA:
MATRIZ DE PAGOS
Jugador columna
Cooperar Traicionar
*
Cooperar 2,2 3,1
Jugador
fila
*
Traicionar 1,3 4,4
El equilibrio de Nash
y las polticas macroeconmicas
Tabla 1
Juego Monetario- Fiscal
Banco Central
Contractiva Expansiva
Estructura de preferencias
Inflacin Baja Media Alta
Banco Central 6 4 1
Autoridad
3 2 1
Fiscal
Banco Central 1 2 3
Autoridad
1 4 6
Fiscal
Fuente: H. Bennett y N. Loayza. Sesgos de poltica econmica cuando las autoridades monetarias fiscales tienen objetivos
diferentes. Banco Central de Chile. 2.000.
Las autoridades monetarias y fiscales tienen dos opciones cada una: pueden
elegir tanto una poltica contractiva como expansiva. Cuando ambos juegan de
manera contractiva, la inflacin y el empleo es bajo. Cuando ambos eligen
expansiva, la inflacin y el empleo son altos y; cuando slo uno de ellos juega de
forma contractiva, el resultado es inflacin y empleo medios.
Se puede observar que ambos jugadores tienen preferencias diferentes sobre los
niveles de empleo e inflacin, se puede observar en la estructuras de preferencias.
Mientras el BC considera importante disminuir la inflacin, el Gobierno tiene como
prioridad aumentar el empleo. Es por ello, que el nico equilibrio de Nash que se
puede conseguir es una poltica monetaria contractiva y una poltica fiscal
expansiva (NOTA: Esto se debe al supuesto de que las diferencias en las preferencias de ambas
autoridades son tan grandes como para obtener los resultados que se desean ), las otras
alternativas presentan beneficios particulares para las autoridades. Por ejemplo, si
el BC accede optar por una poltica monetaria expansiva, aceptando una promesa
del Gobierno de ser estrictamente restrictiva, a este le resultara ptimo romper su
promesa y llevar a cabo una poltica fiscal expansiva. De igual forma sucede con
las dems opciones no ptimas. Sin embargo, a largo plazo en trminos de
resultados una poltica monetaria expansiva y una fiscal restrictiva son ms
saludables que el equilibrio de Nash, porque no compromete la sustentabilidad
fiscal y no debilita la capacidad de inversin del sector privado.
John F. Nash
1928 -