Introduccion A La Teoria de Juegos y Ejercicios

Introduccin a la teora de juegos
Los psiclogos destacan la importancia del juego en la infancia como medio de

formar la personalidad y de aprender de forma experimental a relacionarse en
sociedad, a resolver problemas y situaciones conflictivas. Todos los juegos, de
nios y de adultos, juegos de mesa o juegos deportivos, son modelos de
situaciones conflictivas y cooperativas en las que podemos reconocer
situaciones y pautas que se repiten con frecuencia en el mundo real.
El estudio de los juegos ha inspirado a cientficos de todos los tiempos para el

desarrollo de teoras y modelos matemticos. La estadstica es una rama de las
matemticas que surgi precisamente de los clculos para disear estrategias
vencedoras en juegos de azar. Conceptos tales como probabilidad, media
ponderada y distribucin o desviacin estndar, son trminos acuados por la
estadstica matemtica y que tienen aplicacin en el anlisis de juegos de azar o
en las frecuentes situaciones sociales y econmicas en las que hay que adoptar
decisiones y asumir riesgos ante componentes aleatorios.
Pero la teora de juegos tiene una relacin

muy lejana con la estadstica. Su objetivo no es
el anlisis del azar o de los elementos
aleatorios sino de los comportamientos
estratgicos de los jugadores. En el mundo
real, tanto en las relaciones econmicas como
en las polticas o sociales, son muy frecuentes
las situaciones en las que, al igual que en los
juegos, su resultado depende de la conjuncin
de decisiones de diferentes agentes o
jugadores. Se dice de un comportamiento que es estratgico cuando se adopta
teniendo en cuenta la influencia conjunta sobre el resultado propio y ajeno de las
decisiones propias y ajenas.
La tcnica para el anlisis de estas situaciones fue puesta a punto por un

matemtico, John von Neumann. A comienzos de la dcada de 1940 trabaj con
el economista Oskar Morgenstern en las aplicaciones econmicas de esa teora.
El libro que publicaron en 1944, "Theory of Games and Economic Behavior",
abri un insospechadamente amplio campo de estudio en el que actualmente
trabajan miles de especialistas de todo el mundo.
La Teora de Juegos ha alcanzado un alto grado de sofisticacin matemtica y ha

mostrado una gran versatilidad en la resolucin de problemas. Muchos campos de
la Economa Equilibrio General, distribucin de costes, etc. se han visto
beneficiados por las aportaciones de este mtodo de anlisis. En el medio siglo
transcurrido desde su primera formulacin el nmero de cientficos dedicados a su
desarrollo no ha cesado de crecer. Y no son slo economistas y matemticos sino
socilogos, politlogos, bilogos o psiclogos. Existen tambin aplicaciones
jurdicas: asignacin de responsabilidades, adopcin de decisiones de pleitear o
conciliacin, etc.
Hay dos clases de juegos que plantean una problemtica muy diferente y
requieren una forma de anlisis distinta. Si los jugadores pueden comunicarse
entre ellos y negociar los resultados se tratar de juegos con transferencia de
utilidad (tambin llamados juegos cooperativos), en los que la problemtica se
concentra en el anlisis de las posibles coaliciones y su estabilidad. En los juegos
sin transferencia de utilidad, (tambin llamados juegos no cooperativos) los
jugadores no pueden llegar a acuerdos previos; es el caso de los juegos
conocidos como "la guerra de los sexos", el "dilema del prisionero" o el modelo
"halcn-paloma".
Los modelos de juegos sin transferencia de utilidad suelen ser bipersonales, es

decir, con slo dos jugadores. Pueden ser simtricos o asimtricos segn que
los resultados sean idnticos desde el punto de vista de cada jugador. Pueden ser
de suma cero, cuando el aumento en las ganancias de un jugador implica una
disminucin por igual cuanta en las del otro, o de suma no nula en caso
contrario, es decir, cuando la suma de las ganancias de los jugadores puede
aumentar o disminuir en funcin de sus decisiones. Cada jugador puede tener
opcin slo a dos estrategias, en los juegos biestratgicos, o a muchas. Las
estrategias pueden ser puras o mixtas; stas consisten en asignar a cada
estrategia pura una probabilidad dada. En el caso de los juegos con repeticin,
los que se juegan varias veces seguidas por los mismos jugadores, las estrategias
pueden ser tambin simples o reactivas, si la decisin depende del
comportamiento que haya manifestado el contrincante en jugadas anteriores.
Oskar Morgenstern
1902-1976
John von Neumann
1903-1957
En 1944, John von Neumann y Oskar Morgenstern publicaron su libro "Theory of Games and Economic Behavior" iniciando as la aplicacin de la
Teora de Juegos al anlisis econmico.
John C. Harsanyi
1920 -2000
John F. Nash Reinhard Selten
1928 - 1930 -
En 1994 se concedi el Premio Nobel de Economa a Harsanyi, Nash y Selten por sus pioneros anlisis del equilibrio en la teora de los juegos no
cooperativos.
Aumann, Robert J. (1930-) Schelling, Thomas C.
1921-
En 2005 se concedi el Premio Nobel de Economa a Rober J. Aumann y Thomas C. Schelling "por haber ampliado nuestra comprensin del
conflicto y la cooperacin mediante el anlisis de la Teora de los Juegos".
Esta pgina ha sido actualizada por ltima vez el
Para citar este artculo en cualquier documento puede utilizar el siguiente formato:
---------
Martnez Coll, Juan Carlos (2001): "Introduccin a la Teora de Juegos" en La Economa de Mercado, virtudes
e inconvenientes http://www.eumed.net/cursecon/juegos/ consultado el (poner fecha de consulta).
La estrategia Maximn
Consideremos un juego de suma cero en el que lo que
yo gano lo pierde el otro jugador. Cada jugador dispone de
tres estrategias posibles a las que designaremos como A,
juego de suma cero
estrategias B, y C (supongamos que son tres tarjetas con dichas
pago letras impresas). Los premios o pagos consisten en la
matriz de pagos distribucin de diez monedas que se repartirn segn las
punto de silla estrategias elegidas por ambos jugadores y se muestran
solucin estable en la siguiente tabla llamada matriz de pagos. Mis
minimax
estrategias mixtas ganancias, los pagos que puedo recibir, se muestran en
teorema del minimax verde, a la izquierda de cada casilla. Los pagos al otro
jugador se muestran en rosa, a la derecha de cada casilla.
Para cualquier combinacin de estrategias, los pagos de ambos jugadores suman
diez.
MATRIZ DE PAGOS
Las estrategias
del otro jugador
A B C
A 9|1 1|9 2|8
B 6|4 5|5 4|6
Mi estrategia
C 7|3 8|2 3|7
Por ejemplo. Si yo juego la tarjeta C y el otro jugador elige su tarjeta B entonces yo

recibir ocho monedas y el otro jugador recibir dos.
ste es por tanto un juego de suma cero. Se llama juego de suma cero aqul en
el que lo que gana un jugador es exactamente igual a lo que pierde o deja de
ganar el otro.
Para descubrir qu estrategia me conviene ms vamos a analizar la matriz que

indica mis pagos, la de fondo verde. Ignoro cul es la estrategia (la tarjeta) que va
a ser elegida por el otro jugador. Una forma de analizar el juego para tomar mi
decisin consiste en mirar cul es el mnimo resultado que puedo obtener con
cada una de mis cartas. En la siguiente tabla se ha aadido una columna
indicando mis resultados mnimos.
MATRIZ DE MIS PAGOS

La estrategia del otro jugador
A B C mnimos
A 9 1 2 1
B 6 5 4 4
Mi estrategia
C 7 8 3 3
En efecto,
Si yo elijo la tarjeta A, puedo obtener 9, 1 o 2, luego como

mnimo obtendr un resultado de 1.
Si elijo la tarjeta B, puedo obtener 6, 5 o 4, luego como
mnimo obtendr 4.
Si elijo la tarjeta C, puedo obtener 7, 8 o 3, luego como
mnimo obtendr 3.
De todos esos posibles resultados mnimos, el que prefiero es 4 ya que es el

mximo de los mnimos. La estrategia MAXIMIN consiste en elegir la tarjeta B ya
que esa estrategia me garantiza que, como mnimo, obtendr 4.
Podemos prever la estrategia del otro jugador? Supongamos que el otro jugador
quiere elegir tambin su estrategia MAXIMIN. Mostramos ahora slo los pagos
asignados al otro jugador en los que destacamos el pago mnimo que puede
obtener para cada una de sus estrategias. Subrayamos el mximo de los mnimos
y su estrategia maximin.
MATRIZ DE PAGOS AL OTRO JUGADOR

La estrategia del otro jugador
A B C
A 1 9 8
B 4 5 6
Mi estrategia C 3 2 7
mnimos 1 2 6
En efecto,
Si l elige A, su peor resultado sera si yo elijo A con lo que yo

obtendra 9 y l 1.
Si l elige B, su peor resultado sera si yo elijo C con lo que yo
obtendra 8 y l 2.
Si l elige C, su peor resultado sera si yo elijo B con lo que yo
obtendra 4 y l 6.
Su estrategia MAXIMIN consiste por tanto en jugar la carta C con lo que se

garantiza que, al menos, obtendr 6.
ste es un juego con solucin estable. Ninguno de los jugadores siente la

tentacin de cambiar de estrategia. Supongamos que se empieza a repetir el
juego una y otra vez. Yo jugar siempre mi estrategia maximin (B) y el otro jugar
siempre su estrategia maximin (C). Cada uno sabe lo que jugar el otro la
siguiente vez. Ninguno estar tentado de cambiar su estrategia ya que el que
decida cambiar su estrategia perder.
Se llama punto de silla al resultado en el que coinciden las estrategias maximin

de ambos jugadores.
No todos los juegos tienen un punto de silla, una solucin estable. La estabilidad
del juego anterior desaparece simplemente trastocando el orden de las casillas BB
y BC:
MATRIZ DE PAGOS AL OTRO JUGADOR

MATRIZ DE MIS PAGOS
La estrategia del La estrategia del
otro jugador otro jugador
A B C A B C
A 9 1 2 A 1 9 8
Mi B 6 4 5 Mi estrategia B 4 6 5
estrategia C 7 8 3 C 3 2 7
En esta nueva tabla mi estrategia maximin sigue siendo la B y la estrategia

maximin del otro jugador sigue siendo la C. Pero la solucin ahora ya no es
estable. Si jugamos repetidas veces y yo repito mi estrategia maximn, B, el otro
estar tentado de cambiar su estrategia, pasando de la C a la B con lo que
obtendr un pago mayor, 6 en vez de 5.
Claro que si el otro empieza a elegir sistemticamente la estrategia B yo preferir

cambiar mi estrategia a la C para as obtener 8. Entonces el querr volver a su
estrategia C y as sucesivamente.
Realice ahora estos

Ejercicios MAXIMN
Cuando se repiten juegos que no tienen solucin estable interesa utilizar

estrategias mixtas. Las estrategias mixtas consisten en asignar a cada una de
las estrategias una probabilidad. En el juego que estamos analizando una
estrategia mixta podra describirse de la forma siguiente: "Para elegir la tarjeta que
voy a jugar lanzar un dado. Si el dado muestra un 1, elegir la tarjeta A; si el
dado muestra un 2 o un 3, elegir la tarjeta B; si el dado muestra un 4, un 5 o un 6,
elegir la tarjeta C". En otras palabras, elegir la tarjeta A con una probabilidad de
1/6, la tarjeta B con una probabilidad de 1/3 y la tarjeta C con una probabilidad de
1/2.
El teorema del maximin afirma que en todo juego bipersonal de suma cero en el
que sea posible jugar estrategias mixtas adems de las puras, las estrategias
maximin de cada jugador coincidirn siempre en una solucin estable, un punto de
silla. Este teorema fue demostrado matemticamente por John von Neumann en
un artculo publicado en 1928
La estrategia maximn
pgina interactiva de ejercicios
Este es un ejercicio interactivo. Bajo este prrafo debe aparecer un marco con una
hoja de clculo EXCEL que permite modificar los valores de la matriz de pagos del
jugador Amarillo y actualizar automticamente los pagos del jugador Azul y los
valores de pagos mnimos y maximn. Este marco slo aparece en los
ordenadores que tengan una versin avanzada del software de MS Office. Los que
no puedan ver este marco, encontrarn al final de los ejercicios una imagen no
interactiva del mismo.
A B C D E F G H I J K L
1 Matriz de pagos Matriz de pagos
2 Jugador Amarillo (filas) Jugador Azul (columnas)
3
4 pagos Estrategias
5 mnimos A B C
6 A 2 3 5 2 8 7 5
7 Estrategias B 1 9 8 1 9 1 2
8
9
C 4 6 7 4 6 4 3
10 MAXIMN: 4 pagos mnimos 6 1 2

(El mximo de sus mnimos)
11 MAXIMN: 6
Ejercicio de MAXIMN
Antes de empezar con los ejercicios responda:
Es ste es un juego de suma nula?

Porqu?
Qu ventajas tiene elegir la estrategia maximn?
Ejercicios
1. Modificando solo los pagos del jugador amarillo, realice los cambios
necesarios para obtener los siguientes resultados:
1-a) Consiga que el maximin de Amarillo sea 7
1-b) Consiga que el maximin de Azul sea 3
1-c) Consiga los dos resultados anteriores simultneamente
1-d) Consiga el resultado c) cuando ambos jugadores eligen la
estrategia C
1-e) Consiga el resultado d) manteniendo la caracterstica de que
todos los pagos de la matriz sean diferentes.
1-f) Consiga el resultado e) simplemente intercambiando la posicin
de los pagos de cuatro casillas.
2. Modificando solo los pagos del jugador amarillo, consiga que cuando
Azul elija la estrategia A tenga garantizado obtener un pago de 14 o
superior.
El dilema del prisionero
Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma

que no pueden comunicarse entre ellos. El alguacil sospecha que han participado
en el robo del banco, delito cuya pena es diez aos de crcel, pero no tiene
pruebas. Slo tiene pruebas y puede culparles de un delito menor, tenencia ilcita
de armas, cuyo castigo es de dos aos de crcel. Promete a cada uno de ellos
que reducir su condena a la mitad si proporciona las pruebas para culpar al otro
del robo del banco.
Las alternativas para cada prisionero pueden representarse en forma de matriz de

pagos. La estrategia "lealtad" consiste en permanecer en silencio y no
proporcionar pruebas para acusar al compaero. Llamaremos "traicin" a la
estrategia alternativa.
Dilema del prisionero

Matriz de Pagos
(aos de crcel)
Preso Y
lealtad traicin
lealtad 2 \ 2 10 \ 1
Preso X
traicin 1 \ 10 5\5
Los pagos a la izquierda o a la derecha de la barra indican los aos de crcel a los
que es condenado el preso X o Y respectivamente segn las estrategias que
hayan elegido cada uno de ellos.
En vez de expresar los pagos en aos de crcel, podramos indicar simplemente

el orden de preferencia de cada preso de los correspondientes resultados, con lo
que el modelo pasa a tener aplicacin ms general.
Dilema del prisionero

Matriz de Pagos
(orden de preferencias)
Preso Y
lealtad traicin
lealtad 2 \ 2 4\1
Preso X
traicin 1 \ 4 3 \ 3*
La aplicacin de la estrategia maximn conduce en este juego a un resultado

subptimo. Al no conocer la decisin del otro preso, la estrategia ms segura es
traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos
hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y est
sealado en la matriz mediante un asterisco.
El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula,
bipersonal, biestratgico y simtrico. Fue formalizado y analizado por primera vez
por A. W. Tucker en 1950. Es posiblemente el juego ms conocido y estudiado en
la teora de juegos. En base a l se han elaborado multitud de variaciones,
muchas de ellas basadas en la repeticin del juego y en el diseo de estrategias
reactivas.
El modelo halcn-paloma
En el lenguaje ordinario entendemos por "halcn" a los polticos

partidarios de estrategias ms agresivas mientras que identificamos
como "paloma" a los ms pacifistas. El modelo Halcn-Paloma sirve para
analizar situaciones de conflicto entre estrategias agresivas y
conciliadoras. Este modelo es conocido en la literatura anglosajona como
el "hawk-dove" o el "chicken" y en espaol es conocido tambin como
"gallina".
En la filmografa holywoodiense se han
representado en varias ocasiones desafos de
vehculos enfrentados que siguen este modelo. Los
dos vehculos se dirigen uno contra otro en la
misma lnea recta y a gran velocidad. El que frene
o se desve ha perdido. Pero si ninguno de los dos
frena o se desva...
Tambin se ha utilizado este modelo

abundantemente para representar una guerra fra
entre dos superpotencias. La estrategia Halcn
consiste en este caso en proceder a una escalada
armamentstica y blica. Si un jugador mantiene la
estrategia Halcn y el otro elige la estrategia
Paloma, el Halcn gana y la Paloma pierde. Pero la
situacin peor para ambos es cuando los dos
jugadores se aferran a la estrategia Halcn. El resultado puede
modelizarse con la siguiente matriz de pagos.
HALCN-PALOMA:
MATRIZ DE PAGOS
Jugador Y
Paloma Halcn
*
Paloma 2,2 3,1
Jugador X
*
Halcn 1,3 4,4
Obsrvense las sutiles pero importantes diferencias de este modelo con

el Dilema del Prisionero. En principio la matriz es muy parecida,
simplemente se han trocado las posiciones de los pagos 3 y 4, pero la
solucin y el anlisis son ahora muy diferentes.
Hay aqu dos resultados que son equilibrios de Nash: cuando las
estrategias elegidas por cada jugador son diferentes; en la matriz aqu
representada esas soluciones estn marcadas con un asterisco.
Comprubese, por el contrario, que en el Dilema del Prisionero el
equilibrio de Nash est en el punto en que ambos jugadores traicionan.
Otra notable diferencia de este juego con otros es la importancia que
aqu adquiere el orden en que los jugadores eligen sus estrategias.
Como tantas veces en la vida real, el primero que juega, gana. El
primero elegir y manifestar la estrategia Halcn con lo que el segundo
en elegir se ver obligado a elegir la estrategia Paloma, la menos mala.
La guerra de los sexos
El modelo de "La guerra de los sexos" es un ejemplo muy

sencillo de utilizacin de la teora de juegos para analizar
un problema frecuente en la vida cotidiana.
juegos sin repeticin
juegos sin transferencia
de utilidad Hay dos jugadores: "L" y "ELLA". Cada uno de ellos
resultado subptimo puede elegir entre dos posibles estrategias a las que
juego simtrico llamaremos "Ftbol" y "Discoteca".
juego asimtrico
punto de silla
solucin estable Supongamos que el orden de preferencias de L es el
maximn siguiente:
dominacin
1 (lo ms preferido) L y ELLA eligen Ftbol.
2 L y ELLA eligen Discoteca.
3 L elige Ftbol y ELLA elige Discoteca.
4 (lo menos preferido) l elige Discoteca y ELLA elige Ftbol.
Supongamos que el orden de preferencias de ELLA es el siguiente:
1 (lo ms preferido) L y ELLA eligen Discoteca.
2 L y ELLA eligen Ftbol.
3 L elige Ftbol y ELLA elige Discoteca.
4 (lo menos preferido) l elige Discoteca y ELLA elige Ftbol.
La matriz de pagos es como sigue:
ELLA
Ftbol Discoteca
Ftbol 1\2 3 \ 3*
L
Discoteca 4 \ 4 2\1
Los pagos representan el orden de preferencias.

En verde y a la izquierda de la barra, los pagos a L.
En violeta y a la derecha de la barra los pagos a ELLA.
Este juego, tal como lo hemos descrito, es un juego sin repeticin y sin
transferencia de utilidad. Sin repeticin significa que slo se juega una vez por lo
que no es posible tomar decisiones en funcin de la eleccin que haya hecho el
otro jugador en juegos anteriores. Sin transferencia de utilidad significa que no hay
comunicacin previa por lo que no es posible ponerse de acuerdo, negociar ni
acordar pagos secundarios ("Si vienes al ftbol te pago la entrada").
El problema que se plantea es simplemente un problema de coordinacin. Se trata

de coincidir en la eleccin. Al no haber comunicacin previa, es posible que el
resultado no sea ptimo. Si cada uno de los jugadores elige su estrategia
maximn el pago que recibirn (3\3) es subptimo. Esa solucin, marcada en la
matriz con un asterisco, no es un punto de equilibrio de Nash ya que los jugadores
estn tentados de cambiar su eleccin: cuando ELLA llegue a la discoteca y
observe que L se ha ido al ftbol, sentir el deseo de cambiar de estrategia para
obtener un pago mayor.
El modelo que hemos visto es un juego simtrico ya

que jugadores o estrategias son
intercambiables sin que los resultados
varen. Podemos introducir una interesante
modificacin en el juego convirtindolo en
asimtrico a la vez que nos aproximamos
ms al mundo real. Supongamos que las
posiciones 2 y 3 en el orden de
preferencias de L se invierten. L prefiere
ir solo al Ftbol ms que ir con ELLA a la
Discoteca. La matriz de pagos queda como
sigue:
ELLA
Discotec
Ftbol
a
*
Ftbol 1\2 2\3
L Discotec
4\4 3\1
a
Si ELLA conoce la matriz de pagos, es decir,

las preferencias de L, el problema de
coordinacin desaparece. Est muy claro
que L elegir siembre la estrategia Ftbol,
sea cual sea la eleccin de ELLA. Sabiendo esto ELLA elegir siempre
la estrategia Ftbol tambin, ya que prefiere estar con L aunque sea
en el Ftbol que estar sola aunque sea en la Discoteca. La estrategia maximn de
ambos jugadores coincide. El resultado, marcado con un asterisco, es un ptimo,
un punto de silla, una solucin estable, un punto de equilibrio de Nash. Obsrvese
que esta solucin conduce a una situacin estable de dominacin social del
jugador que podramos calificar como el ms egosta.
Juegos con transferencia de utilidad

(Juegos cooperativos)
Si los jugadores pueden comunicarse entre s y negociar un acuerdo ANTES de los
pagos, la problemtica que surge es completamente diferente. Se trata ahora de
analizar la posibilidad de formar una coalicin de parte de los jugadores, de que esa
coalicin sea estable y de cmo se deben repartir las ganancias entre los miembros de
la coalicin para que ninguno de ellos est interesado en romper la coalicin.
Juego 1.- Empecemos con el ejemplo ms sencillo. Supongamos que tres jugadores,
Ana, Benito y Carmen, tienen que repartirse entre s cien euros. El sistema de reparto
tiene que ser adoptado democrticamente, por mayora simple, una persona un voto.
Hay cuatro posibles coaliciones vencedoras: ABC, AB, BC y AC, pero hay infinitas
formas de repartir los pagos entre los tres jugadores.
Supongamos que Ana propone un reparto de la forma A=34, B=33 y C=33.

Benito puede proponer un reparto alternativo de la forma A=0, B=50 y C=50
Carmen estar ms interesada en la propuesta de Benito que en la de Ana. Pero puede
proponer una alternativa an mejor para ella: A=34, B=0 y C=66.
A Benito es posible que se le ocurra alguna propuesta mejor para atraer a Ana.
El juego puede continuar indefinidamente. No tiene solucin. No hay ninguna coalicin
estable. Sea cual sea la propuesta que se haga siempre habr una propuesta
alternativa que mejore los pagos recibidos por cada jugador de una nueva mayora.
Definicin: En los juegos con transferencia de utilidad se llama solucin a una

propuesta de coalicin y de reparto de los pagos que garantice estabilidad, es
decir, en la que ninguno de los participantes de una coalicin vencedora pueda
estar interesado en romper el acuerdo.
Juego 2.- Modifiquemos ahora el ejemplo. En vez de "un hombre un voto"

consideremos que hay voto ponderado. Ana tiene derecho a seis votos, Benito a tres y
Carmen a uno. Las posibles mayoras son las siguientes: ABC, AB, AC, A.
En esta situacin Ana propondr un reparto de la

siguiente forma: A=100, B=0 y C=0. Ese reparto
se corresponde con una coalicin estable en la que
los seis votos de Ana estarn a favor. Es una
solucin nica. Ana no aceptar ningn reparto en
el que ella obtenga menos de 100 euros y sin la
participacin de Ana no hay ninguna coalicin
vencedora.
Definicin: Se llama "valor del juego" al pago

que un jugador tiene garantizado que puede
recibir de un juego si toma una decisin
racional, independientemente de las
decisiones de los dems jugadores. Ningn
jugador aceptar formar parte de una
coalicin si no recibe como pago al menos el
valor del juego.
En el juego 1, el valor del juego es cero para los tres jugadores. En el juego 2 el valor
del juego para Ana es cien y para Benito y Carmen es cero.
Juego 3.- Pongamos un ejemplo algo ms realista y, por tanto, un poco ms complejo.
Supongamos un municipio en el que cinco partidos polticos se han presentado a las
elecciones: el Partido Austero (PA), el Partido Benefactor (PB), el Partido Comunal
(PC), el Partido Democrtico (PD) y el Partido de la Esperanza (PE). En las elecciones,
han obtenido el siguiente nmero de concejales:
PA=11
PB=8
PC=5
PD=2
PE=1
Como ningn partido ha conseguido la mayora absoluta, es necesario que se forme
una coalicin para gobernar el municipio. El presupuesto anual del municipio es de 520
millones de euros. La coalicin gobernante debe asignar los cargos y las
responsabilidades del ayuntamiento a los diferentes partidos. En las negociaciones se
debe acordar el reparto del presupuesto, cargos y responsabilidades entre los partidos.
Suponemos que no hay simpatas ni antipatas ideolgicas y que los cargos y
responsabilidades son valorados exclusivamente segn el presupuesto econmico que
controlan. Supondremos, para simplificar, que hay disciplina de voto y que no son
posibles las traiciones internas
Anlisis del juego 3. Como el nmero total de concejales es 27, la coalicin vencedora
debe disponer al menos de 14 votos. A diferencia del juego 2, no hay ningn jugador
imprescindible para ganar. Si utilizamos la definicin que dimos arriba, el valor del
juego para todos los jugadores es cero ya que ninguno tiene garantizada su
pertenencia a la coalicin vencedora.
Definicin: Se llama "valor de Shapley" a la asignacin que recibe cada jugador

en una propuesta de reparto segn un criterio de arbitraje diseado por Lloyd
S. Shapley. El criterio consiste en asignar un pago a cada jugador en
proporcin al nmero de coaliciones potencialmente vencedoras en las que el
jugador participa de forma no redundante.
Un jugador es redundante en una coalicin si no es imprescindible para que esa

coalicin resulte vencedora.
Propuesta arbitral de Shapley para el juego 3.
Como hay cinco partidos polticos, las posibles coaliciones son 31. De ellas, 16 son
vencedoras. Las coaliciones perdedoras estn en rojo. En las coaliciones vencedoras se
han marcado en amarillo los jugadores redundantes.
ABCDE Por tanto:

ABCD ABC ABE ADE CDE
BDE A no es redundante en 10
coaliciones vencedoras
ABCE ABD ACE
B no es redundante en 6 coaliciones
ABDE ACD BCE
vencedoras
ACDE BCD
C no es redundante en 6 coaliciones
vencedoras
BCDE
AB BC CD DE A D no es redundante en 2 coaliciones
CE vencedoras
AC BD B
E no es redundante en 2 coaliciones
AD BE C vencedoras
AE D Si se formara un "gobierno de
concentracin", una coalicin de
E
Nmero de representantes
en el Parlamento Europeo
a partir de enero de 2004
Austria 17
todos los partidos, podramos repartir el presupuesto de 520 Alemania 99

millones de euros en proporcin al valor de Shapley Blgica 22
obteniendo los siguientes valores para cada uno de los Dinamarca 13
partidos:
Espaa 50
A= 200; B= 120; C= 120; D= 40; E= 40 Finlandia 13
Francia 72
En cualquier coalicin formada por menos de cinco partidos,
Grecia 22
ninguno de los coaligados debera aceptar un presupuesto
inferior al indicado. Sea cual sea la coalicin vencedora que Holanda 25
se forme, el presupuesto puede ser repartido conforme al Irlanda 12
criterio del valor de Shapley.
Italia 72
Obsrvese que la propuesta de arbitraje de Shapley no Luxemburgo 6
conduce a una solucin nica ni absolutamente estable. Portugal 22
Sigue habiendo varias soluciones posibles. Pero en cualquier
coalicin que se forme, si el reparto se hace conforme al Reino Unido 72
criterio de Shapley, no habr una coalicin alternativa ms Suecia 18
estable que ofrezca a los jugadores un pago superior.
Juego 4.
Ejercicio. En el Tratado
de la Unin Europea
aprobado en Niza en
diciembre de 2000 se
acord que a partir del 1
de enero de 2004, el
nmero de
representantes de cada
pas miembro en el
Parlamento Europeo ser
el fijado en el cuadro
adjunto. Intente estimar
la asignacin de un
presupuesto de un billn
Hemiciclo del Parlamento Europeo en su sede de Estrasburgo de euros entre todos los
pases miembros para
que sea aprobado por unanimidad por el Parlamento, de forma que cada pas miembro
reciba el valor de Shapley. (Propuesta de solucin a este ejercicio)
Estrategias reactivas
Cuando un juego se repite varias veces, cada jugador puede adoptar su estrategia
en funcin de las decisiones que haya adoptado antes su oponente. Las
estrategias reactivas son las que se adoptan en los juegos con repeticin y se
definen en funcin de las decisiones previas de otros jugadores.
El ejemplo ms conocido es la estrategia OJO POR OJO (en ingls TIT FOR TAT).
Supongamos que dos jugadores repiten de forma indefinida una situacin con
pagos de forma del Dilema del Prisionero:
DILEMA DEL PRISIONERO

MATRIZ DE PAGOS
Jugador columna
Cooperar Traicionar
Cooperar 2,2 4,1

Jugador
fila
*
Traicionar 1,4 3,3
En esta situacin la estrategia OJO POR OJO puede quedar definida de la forma
siguiente: "En la primera jugada eligir la estrategia COOPERAR. En las jugadas
siguientes elegir la misma estrategia que haya elegido mi oponente en la jugada
anterior". En otras palabras, si el otro coopera, yo cooperar con l. Si el otro es
un traidor, yo ser un traidor".
La estrategia TIT FOR TAT fue definida y denominada as por el psiclogo experto en teora de
juegos Anatol Rapoport, en el marco de los experimentos del politlogo canadiense Robert Axelrod.
A comienzos de la dcada de 1980, Robert Axelrod organiz un concurso mundial sobre un dilema del
prisionero con repeticin. Los concursantes deban proponer estrategias para obtener la mxima ganancia
posible al someterse un nmero indeterminado de veces al Dilema del
Prisionero.
Algunas estrategias en el concurso consistan en siempre traicionar. Otras en

siempre cooperar (ser leal) lo que equivaldra al principio de tica cristiana de
"poner la otra mejilla".
Otras estrategias se apuntaron a la picarda. En general actuaban con la lealtad,

pero de vez en cuando sorprendan traicionando al contrario para obtener ms
ganancias. Esta picarda no obtuvo buenos resultados porque era represaliada
por estrategias ultravengativas, que jams perdonaban la traicin.
La estrategia vencedora absoluta del concurso mundial fue la propuesta por

Anatol Rapoport, la ley del talin: ojo por ojo y diente por diente. Axelrod la
defini como una estrategia colaboradora, dispuesta siempre a pactar, pero
justiciera. Si la otra parte le traicionaba una vez, devolva exactamente la misma medida, otra traicin, pero
slo una vez. Era por tanto capaz de perdonar. Generaba confianza, era justiciera, pero no rencorosa y obtena
buenos resultados (o no peores) cualquiera que fuese su oponente.
Otra posible estrategia reactiva es la TORITO (tambin llamada "GALLITO" en

ingls "BULLY"). Esta estrategia consiste en hacer lo contrario que haga el
oponente: "Si el otro jugador es leal en una jugada, yo le traicionar en la
siguiente; si el otro jugador me ha traicionado, yo le ser leal a la siguiente
oportunidad".
En el ambiente del Dilema del Prisionero, la estrategia OJO POR OJO ofrece muy
buenos resultados mientras que la estrategia TORITO proporciona pagos medios
muy bajos. En cambio, en el ambiente del juego Halcn-Paloma sucede
precisamente lo contrario: TORITO obtiene buenos resultados mientras que OJO
POR OJO proporciona pagos medios inferiores.
"Habis odo que fue

dicho a los antiguos:
Ojo por ojo y diente
por diente. Pero yo os
digo: No resistis al
malo. Ms bien, a
cualquiera que te
golpea en la mejilla
derecha, vulvele
tambin la otra."
(Mateo 5: 38-39)
HALCN-PALOMA:
MATRIZ DE PAGOS
Jugador columna
Cooperar Traicionar
*
Cooperar 2,2 3,1
Jugador
fila
*
Traicionar 1,3 4,4
En la vida real es fcil descubrir situaciones y personas (incluyndonos a nosotros

mismos) en las que se muestran comportamientos fcilmente identificables con las
estrategias OJO POR OJO o TORITO.
"No me hago al lao de la geya En el primer caso son los comportamientos

Aunque vengan degollando descritos por la Ley del Talin. En el despacho de
Con los blandos yo soy blando un abogado, negociador profesional,
Y soy duro con los duros
Y ninguno en un apuro
Me ha visto andar titubiando" haba un letrero que deca "Por las buenas soy
muy bueno, por las malas soy an mejor". Al fin y
(Jos Hernndez: Martn Fierro, 1872) al cabo, todos los humanos en alguna ocasin nos
hemos comprometido con nosotros mismos a
mantener esta estrategia en una situacin difcil en la que un oponente poda
elegir entre hacernos dao o respetarnos, y preveamos oportunidades para
"devolverle la jugada".
El segundo caso tambin es muy frecuente. Se trata de ese tipo de personas o

comportamientos que en Latinoamrica llaman "ser un torito" y en Espaa "ser un
gallito"; es decir, alguien que se muestra muy agresivo pero al que "se le bajan los
humos" si se le responde tambin con agresividad.
El equilibrio de Nash
y las polticas macroeconmicas
por Lisbeht Zerpa Denirce (CV)
Mediante un ejemplo sencillo y aplicando la Teora del equilibrio de Nash a las

decisiones de las autoridades fiscales y monetarias, podremos observar como se
puede presentar situaciones donde los jugadores sienten la tentacin de cambiar
las estrategias pero no lo hacen porque ello implica una disminucin desmejora
para ambos. Es de esta forma como en la mayora de los pases desarrollados se
ha resuelto dicho problema. A modo de ilustracin se presenta este modelo de
juegos simple para la relacin entre las autoridades monetarias y fiscales
Tabla 1
Juego Monetario- Fiscal
Banco Central
Contractiva Expansiva
(7) Inflacin baja (6) Empleo medio

Contractiva
Autoridad (4) Empleo bajo (6) Inflacin media
(6) Empleo medio (4) Inflacin alta
Fiscal Expansiva
(6) Inflacin media (7) Empleo alto
Estructura de preferencias
Inflacin Baja Media Alta
Banco Central 6 4 1
Autoridad
3 2 1
Fiscal
Empleo Bajo Medio Alto
Banco Central 1 2 3
Autoridad
1 4 6
Fiscal
Fuente: H. Bennett y N. Loayza. Sesgos de poltica econmica cuando las autoridades monetarias fiscales tienen objetivos
diferentes. Banco Central de Chile. 2.000.
Las autoridades monetarias y fiscales tienen dos opciones cada una: pueden
elegir tanto una poltica contractiva como expansiva. Cuando ambos juegan de
manera contractiva, la inflacin y el empleo es bajo. Cuando ambos eligen
expansiva, la inflacin y el empleo son altos y; cuando slo uno de ellos juega de
forma contractiva, el resultado es inflacin y empleo medios.
Se puede observar que ambos jugadores tienen preferencias diferentes sobre los
niveles de empleo e inflacin, se puede observar en la estructuras de preferencias.
Mientras el BC considera importante disminuir la inflacin, el Gobierno tiene como
prioridad aumentar el empleo. Es por ello, que el nico equilibrio de Nash que se
puede conseguir es una poltica monetaria contractiva y una poltica fiscal
expansiva (NOTA: Esto se debe al supuesto de que las diferencias en las preferencias de ambas
autoridades son tan grandes como para obtener los resultados que se desean ), las otras
alternativas presentan beneficios particulares para las autoridades. Por ejemplo, si
el BC accede optar por una poltica monetaria expansiva, aceptando una promesa
del Gobierno de ser estrictamente restrictiva, a este le resultara ptimo romper su
promesa y llevar a cabo una poltica fiscal expansiva. De igual forma sucede con
las dems opciones no ptimas. Sin embargo, a largo plazo en trminos de
resultados una poltica monetaria expansiva y una fiscal restrictiva son ms
saludables que el equilibrio de Nash, porque no compromete la sustentabilidad
fiscal y no debilita la capacidad de inversin del sector privado.
John F. Nash
1928 -

Introduccion A La Teoria de Juegos y Ejercicios

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Introduccion A La Teoria de Juegos y Ejercicios

Hochgeladen von

Copyright:

Verfügbare Formate

Introduccin a la teora de juegos

Los psiclogos destacan la importancia del juego en la infancia como medio de

El estudio de los juegos ha inspirado a cientficos de todos los tiempos para el

Pero la teora de juegos tiene una relacin

La tcnica para el anlisis de estas situaciones fue puesta a punto por un

La Teora de Juegos ha alcanzado un alto grado de sofisticacin matemtica y ha

Los modelos de juegos sin transferencia de utilidad suelen ser bipersonales, es

Esta pgina ha sido actualizada por ltima vez el

Por ejemplo. Si yo juego la tarjeta C y el otro jugador elige su tarjeta B entonces yo

Para descubrir qu estrategia me conviene ms vamos a analizar la matriz que

MATRIZ DE MIS PAGOS

Si yo elijo la tarjeta A, puedo obtener 9, 1 o 2, luego como

De todos esos posibles resultados mnimos, el que prefiero es 4 ya que es el

MATRIZ DE PAGOS AL OTRO JUGADOR

Si l elige A, su peor resultado sera si yo elijo A con lo que yo

Su estrategia MAXIMIN consiste por tanto en jugar la carta C con lo que se

ste es un juego con solucin estable. Ninguno de los jugadores siente la

Se llama punto de silla al resultado en el que coinciden las estrategias maximin

MATRIZ DE PAGOS AL OTRO JUGADOR

En esta nueva tabla mi estrategia maximin sigue siendo la B y la estrategia

Claro que si el otro empieza a elegir sistemticamente la estrategia B yo preferir

Realice ahora estos

Cuando se repiten juegos que no tienen solucin estable interesa utilizar

10 MAXIMN: 4 pagos mnimos 6 1 2

Antes de empezar con los ejercicios responda:

Es ste es un juego de suma nula?

Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma

Las alternativas para cada prisionero pueden representarse en forma de matriz de

Dilema del prisionero

En vez de expresar los pagos en aos de crcel, podramos indicar simplemente

Dilema del prisionero

La aplicacin de la estrategia maximn conduce en este juego a un resultado

En el lenguaje ordinario entendemos por "halcn" a los polticos

Tambin se ha utilizado este modelo

Obsrvense las sutiles pero importantes diferencias de este modelo con

La guerra de los sexos

El modelo de "La guerra de los sexos" es un ejemplo muy

2 L y ELLA eligen Discoteca.

3 L elige Ftbol y ELLA elige Discoteca.

4 (lo menos preferido) l elige Discoteca y ELLA elige Ftbol.

Supongamos que el orden de preferencias de ELLA es el siguiente:

1 (lo ms preferido) L y ELLA eligen Discoteca.

2 L y ELLA eligen Ftbol.

3 L elige Ftbol y ELLA elige Discoteca.

4 (lo menos preferido) l elige Discoteca y ELLA elige Ftbol.

La matriz de pagos es como sigue:

Los pagos representan el orden de preferencias.

El problema que se plantea es simplemente un problema de coordinacin. Se trata

El modelo que hemos visto es un juego simtrico ya

Si ELLA conoce la matriz de pagos, es decir,

Juegos con transferencia de utilidad

Supongamos que Ana propone un reparto de la forma A=34, B=33 y C=33.

Definicin: En los juegos con transferencia de utilidad se llama solucin a una

Juego 2.- Modifiquemos ahora el ejemplo. En vez de "un hombre un voto"

En esta situacin Ana propondr un reparto de la

Definicin: Se llama "valor del juego" al pago

Definicin: Se llama "valor de Shapley" a la asignacin que recibe cada jugador

Un jugador es redundante en una coalicin si no es imprescindible para que esa

Propuesta arbitral de Shapley para el juego 3.

ABCDE Por tanto:

todos los partidos, podramos repartir el presupuesto de 520 Alemania 99

DILEMA DEL PRISIONERO

Cooperar 2,2 4,1