Monografia 3raPC

FACULTAD DE INGENIERIA ECONOMICA, ESTADISTICA Y CIENCIAS
SOCIALES
UNI
TEORIA DE JUEGOS EVOLUTIVOS

Apolinario Huaman Axel
Durand Ortega Juan
Giron Bautista Anjal
Lazo Venturo Richard
Regalado Montoya Jose
Curso:
Teora de Juegos
Profesor:
Luis Mu
noz Ramos
JUEGOS SOBRE LA POBLACION

(CONCEPTOS PREVIOS)
1.1 Teora de Juegos Evolutivos

Hasta ahora hemos considerado un juego de dos-jugadores basados en la Teora
de Juegos Cl
asica en donde el resultado depende de las elecciones hechas por
los individuos racionales. La solucion para este tipo de juego (el Equilibrio de
Nash)se basa en la idea que cada jugador usa una estrategia que es la mejor
respuesta a la estrategia elegida por la otra persona, de tal manera que ninguno
de los dos pueda cambiar lo que este haciendo.
Para un equilibrio de Nash simetrico, ( , ), podemos dar una interpretacion
alternativa del equilibrio de Nash en una contexto de juegos poblacionales. En
una poblaci
on en donde cada individuo usa una estrategia , la mejor opcion
es seguir a la masa, si la poblacion empieza donde cada uno usa una estrategia
, entonces se mantendr
a con esas estrategias - la poblacion esta en equilibrio.
A
un Nash introdujo este punto de vista, denominandolo interpretacion de la
acci
on en masa. Una pregunta inherente es : Que ocurrira si la poblacion esta
cercana a su equilibrio?, poblacion llega al equilibrio o se mueve de una forma
diferente?. Este tipo de preguntas pueden ser respondidas usando la teora de
juegos evolutivos, la cual fue inventada para su aplicacion en modelos biologicos
y ahora esta siendo usada por algunos economistas.
La teora de juegos evolutivos considera una poblacion de agentes que deciden.En la Poblaci
on, la frecuencia con que una decision es tomada puede variar
en respuesta a las decisiones hechas por todos los individuos en la poblacion.
Una interpretaci
on biol
ogica de esta evolucion, consiste en una poblacion de
animales los cuales son geneneticamente programados para usar estrategias que
son heredadas por su descendencia. Inicialmente, la poblacion puede consistir
en animales usando diferentes estrategias. La ganancia o pago a un individuo
que adopt
o la estrategia est
a identificada con la aptitud (n
umero esperado de
descendencia) para esa especie en la poblacion actual. Animales con mayor aptitud o capacidad poseen mayor n
umero de descendencia por lo que la coposicion
de la descendencia, para la siguiente generacion, cambiara. En la interpretacion
econ
omica, la poblaci
on cambia debido a que la gente juega muchas veces y
conscientemente cambian de estrategias. Las personas tienden a escoger las estrategias que le generan mayores pagos en lugar de las que le otorgan menores
pagos.
1.2 Estrategias estables evolutivas

Como con una sistema din
amico, una pregunta interesante es Cuales son los
puntos finales de la evoluci
on? Un tipo de punto final evolutivo es llamado Estrategia Evolutivamente Estable (ESS- siglas en ingles).
Definici
on 1.1
Considere una poblaci
on infinita de individuos que pueden usar un conjunto de
estrategias puras, S. Un perfil de la poblacion es un vector x que genera una
probabilidad de x(s), en donde cada estrategia s S es realizada o jugada en
la poblaci
on.
Un perfil de la poblaci
on no necesita corresponder a una estrategia adoptada
por alg
un miembro de la poblacion.
Definicon 1.2
Un juego contra el campo es uno en el cual no hay un oponente especfico
para un individuo - su pago depende de lo que los demas estan haciendo en la
poblaci
on. Este tipo de juegos son un poco diferentes de los juegos considerados
en la Teora Cl
asica de Juegos, una consecuencia de la gran interaccion entre
la poblaci
on es que los pagos no necesariamente dependen linealmente de las
probabilidades x(s) en donde las estrategias puras son jugadas por los miembros
de la poblaci
on
Definici
on 1.3
Un juegos de pareja describe una situacion en donde un individuo juega contra un oponente que ha sido escogido aleatoriamente (por la Naturaleza)de la
poblaci
on y su pago depende de lo que hagan ambos. Estos juegos se parecen
mucho m
as a los de la Teora Clasica de Juegos, por lo que podemos escribir
XX
(, x) =
p(s)x(s0 )(s, s0 )
sS s0 S
para un pago acorde a la pareja (s, s0 ).

Algunas veces los juegos contra el campo son denominados seleccion dependiente de la frecuencia y la palabra juego esta reservada para los juegos de
pareja en los cuales hay una interaccion que se puede percibir entre los individuos. Muchas veces los juegos de poblacion en general incluyen ambos tipos de
interacciones por lo que nos referiremos a ambos como juegos. esto nos ayuda
a mantener la distinci
on entre la Teora Clasica de Juegos y los Juegos Evolutivos. Estamos interesados en los puntos finales de la evolucion de la poblacion.
En otras palabras deseamos encontrar las condiciones por las cuales la poblacion
es estable. Denotemos x como el perfil generado por la poblacion de individuos los cuales todos adoptan una estrategia . Una condicion necesaria para la
estabilidad es:
argmax (, x )
Por lo que en el equilibrio la estrategia adoptada por los individuos debe ser la
mejor respuesta al perfil de la poblacion que ha generado.
Teorema 1.1
Denotemos la estrategia que genera un perfil poblacional x y a S el soporte
de . Si la poblaci
on es estable, luego (s, x ) = ( , x )s S .
Si es la u
nica mejor respuesta a x , entonces la evolucion de la poblacion
se detiene. Sin embargo, si hay otra estrategia que es igualmente buena en
2
poblaci
on con el perfil x , luego la poblacion puede desviarse en la direccion de
la otra estrategia y su correspondiente perfil de poblacion, al menos que no sea
prevenida de no hacerlo.
Definici
on 1.4
Considere una poblaci
on en donde inicialmente todos los individuos adoptan alguna estrategia . Ahora supongamos que una mutacion ocurre y una peque
na
proporcion de todos los individuos usa otra estrategia . La nueva poblacion
es llamada poblaci
on post-entrada y se denota como x
Definici
on 1.5
Una estrategia mixta es un ESS si existe un que para cada 0
y cada
6=
( , x ) > (, x )
En otras palabras, una estrategia es un ESS si las mutaciones que adoptan cualquier otra estrategia dejan menos descendencia en las poblacion postentrada, dado que la proporci
on de mutantes es lo suficientemente peque
na.
1.3 Juegos contra el campo

Alguna vez se ha preguntado por que la proporcion entre hombres y mujeres
en los animales y humanos es casi siempre 50:50? Una respuesta es debido a
que esta proporci
on es un ESS.
Ejemplo
Considere el juego definido por las siguientes condiciones:
1. La proporci
on de machos en la poblacion es y la proporcion de hembras
es 1-
2. Cada hembra se aparea una vez y produce una descendencia de n
3. Los machos se aparean (1 )/ veces en promedio.
4. Solo las hembras toman la decision
Por simplicidad, se asume que las estrategias puras posibles para las hembras
son o bien no producir una descendencia de hembra (s1 ) o no producir una
descendencia de machos (s2 ). Con este conjunto de estrategias, la estrategia
general = (p, 1 p) produce una proporcion p de descendencia de macho.
Un perfil poblacional x= (x, 1 x) produce un ratio de sexo = x por lo que
podemos escribir el perfil en terminos del ratio de sexo como x=(, 1). Debido
a que el n
umero de descendientes es constante en n, esto no puede ser usado
como pago para las estrategias. Sin embargo, el n
umero de nietos vara por lo
que eso ser
a usado como pago. Entonces un perfil de la poblacion,x=(, 1 ),
tendr
a como pagos:
(s1 , x) = n2 1
(s2 , x) = n2
El pago de la estrategia mixta = (p, 1 p) es:
(, x) = n2 ((1 p) + p( 1
))
Debido a que n es independiente de las estrategias elegidas, podemos establecer
n = 1 para facilitar los c
alculos debido a que finalmente estamos interesados en
el ratio de sexo. En este punto, es tentador escribir una matriz de pagos para
el juego, como la siguiente:
Hembras
s1
s2
Poblacion
x=1
(s1 , x = 1)
(s2 , x = 1)
x=0
(s1 , x = 0)
(s2 , x = 0)
Hembras
Poblacion
s1
s1 (s1 , s1 )
s2 (s2 , s1 )
s2
(s1 , s2 )
(s2 , s2 )
Sin embargo,no debemos hacer esto por dos razones. La primera, el perfil
(x0 = (0, 1)) tiende a = 0 que significa un pago para s1 indefinido. Segundo,
puede ser tentativo para nosotros creer que la estrategia pura en la poblacion
en general es:
(si , x) = x(si , s1 ) + (1 x)(si , s2 )
lo cual es incorrecto,pues el pago para la estrategia s1 no es lineal al perfil
de la poblaci
on.
El primero de estos problemas es la forma simple en la cual hemos construido nuestro modelo. Sin embargo, debido a que una poblacion evolutivamente
estable llegar
a a un estado diferente a este, podemos ignorar el problema y
poder continuar el uso de este modelo simple. Un alcance alternativo es el de
especificar las estrategias que siempre producen una proporcion distinta de cero
de machos. Ahora, econtremos el ESS, considerando los siguientes tres casos.
1. si < 1/2, las hembras que juegan s1 (toda descendencia macho)tienen
m
as nietos, lo que genera que se eleve. Por lo que s1 no es un ESS
2. si > 1/2, las hembras que juegan s2 (toda descendencia hembra) tienen
m
as nietos, lo que genera que decline. Por lo que s2 no es un ESS.
3. = ( 21 , 12 ) es una ESS potencial.
(s1 , x ) = (s2 , x ) = ( .x )
si el perfil de la poblaci
on es x = (1/2, 1/2).
Necesitamos verificar que = ( 21 , 12 ) es un ESS, denotemos = (p, 1 p)
luego,
4
x = (1 ) +
y
= 21 (1 ) + p = 12 + (p 21 )
La condici
on ESS es
( , x ) > (, x )
donde
( , x ) =
1
2

+ 21 ( 1
)
y

(, x ) = (1 p) + p( 1

La diferencia entre los pagos es:

1
1

( , x ) (, x ) = (p 12 ) + ( 21 p)( 1
) = ( 2 p)( 1)

= ( 12 p)( 12
)
Si esta diferencia es positiva para cualquier = (p, 1 p) con p 6= 1/2 luego

es un ESS, por que
p < 1/2 = < 1/2 = ( , x ) > (, x )
y
p > 1/2 = > 1/2 = ( , x ) > (, x )
por lo que la estrategia mixta = ( 21 , 12 ) es un ESS.
N
otese que hemos demostrado que una poblacion monomorfica (una sola forma)
donde cada uno usa una estrategia es evolutivamente estable con un perfil
x . Sin embargo, en esta poblacion los individuos usan s1 y s2 tienen la misma
capacidad que si cada uno usa la estrategia . De tal manera nos podemos
praguntar que si una poblaci
on polimorfica (muchos tipos) en donde, por ejemplo, el 50% usa s1 y el otro 50% usa s2 , la respuesta es que a
un generando un
perfil x , ninguna de estas estrategias es un ESS por s misma, el equilibrio ESS
no puede lidiar con una poblacion polimorfica.
1.4 Juegos de Competencia por Parejas

Como ejemplo de competencia por parejas, echemos un vistazo a uno de los
primeros juegos evolutivos que se invento para modelar el conflicto entre los animales. Las dos categoras b
asicas son halcones y palomas. La terminologa
proviene de la conducta humana, donde los que abogan por soluciones militares
preventivas a los problemas internacionales son los llamados halcones, mientras que aquellos que prefieren un enfoque mas diplomatico son llamados palomas.
El significado biol
ogico del juego del halcon - paloma es que ofrece una
alternativa a los argumentos del grupo-seleccionista que abogan por la persistencia de las especies cuyos miembros tienen atributos potencialmente letales.
La pregunta que hay que responder es la siguiente. Debido a que es obviamente
5
ventajoso luchar por un recurso (suponiendo que es mejor que compartir), por
que los animales no acaban siempre matandose (o al menos seriamente mutil
andose) unos a otros? La respuesta del grupo -seleccionista es que cualquier
especie que siguen esta estrategia moriran con bastante rapidez, por lo que los
animales se contienen de todos estas competencias para el bien de la especie.
As que, si la selecci
on de grupo es la u
nica respuesta posible, entonces eso sera
un resultado muy importante. Sin embargo, el juego del halcon - paloma muestra que hay una alternativa - una que se basa de manera justa y de lleno en la
acci
on de la selecci
on natural sobre los individuos. As, aplicando la navaja de
Occam, no hay necesidad de invocar a la seleccion de grupo.
Ejemplo(El juego del halc

on y la paloma)
Los individuos pueden usar uno de las dos posibles estrategias:
H: Ser agresivo (ser un halcon).
D: No ser agresivo (ser una paloma).
En general, un individuo puede usar una estrategia aleatoria, el cual es ser
agresivo con probabilidad p, es decir = (p,1-p). Una poblacion consiste de
animales que son agresivos con probabilidad x, es decir x = (x, 1 x), el cual
puede surgir porque:
En una poblaci
on mono morfica, todo el mundo utiliza la estrategia =
(x, 1 x).
En una poblaci
on polim
orfica una fraccion x de la poblacion utiliza H =
(1, 0) y una fracci
on 1 x uso D = (0, 1).
Tendremos en cuenta s
olo a las poblaciones mono morficas por el momento.
En varias ocasiones, los individuos de esta poblacion pueden entrar en conflicto
por un recurso de valor v. Esta podra ser la comida, un lugar de reproduccion,
etc. El resultado de un conflicto depende de las categoras de los dos individuos
que pelean. Si un halc
on y una paloma se pelean, a continuacion, el Halcon
gana el recurso sin luchar. Si dos palomas se encuentran, entonces ellos compartir
an el recurso. Si dos halcones se encuentran, entonces hay una lucha y
cada individuo tiene la misma oportunidad de ganar. El ganador obtendra el
recurso y el perdedor paga un costo (por ejemplo, lesiones) de c. Los beneficios
para un individuo focal son entonces:
v
vc
+ p(1 x)v + (1 p)(1 x)
2
2
Para hacer las cosas interesantes, suponemos v < c. Es facil ver que no hay
estrategias puras ESS. En una poblacion de palomas, x = 0, y:
(, x) = px
(, xD )
pv + (1 p)
(1 + p)
v
2
v
2
As que la mejor respuesta a esta poblacion es jugar Halcon (es decir, las
personas que utilizan la estrategia H = (1, 0) hara lo mejor en esta poblacion).
Como consecuencia de ello, la proporcion de individuos mas agresivos aumentar
a (es decir, que aumenta x). En una poblacion de halcones, x = 1, y:
(, xH )
vc
2
As que la mejor respuesta a esta poblacion es jugar Paloma (es decir, p =

0; recuerde que hemos asumido v<c).
Hay un ESS en estrategias mixtas, = (p , 1 p )? Para sea una ESS,
debe ser una mejor respuesta a la poblacion x = (p , 1 p ) que genera. En la
poblaci
on de x , la recompensa a una estrategia arbitraria = (p, 1 p) es:
(, x )
=
=
vc
v
+ p(1 p )v + (1 p)(1 p )
2
2
v pc v
(1 p ) + [ p ]
2
2 c
pp
Si p < v/c entonces mejor respuesta es p

=1 (es decir, p
6= p ). Si p > v/c,
entonces la mejor respuesta es p

= 0 (es decir, p
6= p ). Si p = v/c, a contin
uaci
on, cualquier elecci
on de p (incluyendo p ) da la misma ganancia (es decir,
( , x ) = (, x )) y es una mejor respuesta a x .
As que tenemos:
v
v
= ( , 1 )
c
c
(Es decir, ser agresivo con probabilidad v/c) como candidato a un ESS.
Recordemos que v<c, por lo que esta es una estrategia mixta adecuada.
Para confirmar que es un ESS, debemos demostrar que para cualquier 6= ,
( , x ) > (, x )
Donde el perfil de la poblacion post-entry es:
x
((1 )p + p, ((1 )(1 p ) + (1 p ))
(p + (p p ), 1 p + (p p))
Ahora:
( , x )
vc
+ p (1 p + (p p))v
2
v
+(1 p )(1 p + (p p))
2
= p (p + (p p ))
Y:
(, x )
vc
+ p(1 p + (p p))v
2
v
+(1 p)(1 p + (p p))
2
= p(p + (p p ))
As que mediante el
algebra (usando p = v/c), encontramos:
(, x ) (, x
c
(p p)2
2
> 0 p 6= p (es decir, 6= )
Lo que prueba que es una ESS.
1.5 ESSs y el Equilibrio de Nash

En esta secci
on, se muestra que la ESSs en un juego poblacional de concurso
en parejas corresponde a un (posiblemente vaca) subconjunto del conjunto de
equilibrios de Nash de un juego de dos jugadores asociado. Limitaremos nuestra atenci
on a los juegos de competencias por parejas, ya que el concepto de
equilibrio de Nash no tiene sentido para un juego contra el campo.
En un juego poblacional de concurso en parejas, el pago a una persona focal
utilizando en una poblaci
on con un perfil de x es:
XX
(, x) =
p(s)x(s0 )(s, s0 )
(8.4)
sS s0 S
Este pago es el mismo que se obtendra en un juego de dos jugadores contra

un oponente usando una estrategia 0 que asigna p0 (s) = x(s) s S, por lo que
siempre se puede asociar un juego de dos jugadores con un juego poblacional
que incluye competencias por parejas.
Definici
on 1.6
Si un juego poblacional de concurso por parejas tiene beneficios dados por la
ecuaci
on (8.4), entonces el juego de dos jugadores asociado es el juego con pagos
dadas por los n
umeros 1 (s, s0 ) = (s, s0 ) = 2 (s, s0 ).
En una poblaci
on mono morfica, si es una ESS, entonces x = . Por
lo tanto, si hay un equilibrio de Nash en el juego asociado que corresponde a
la ESS en el juego de la poblacion, entonces debe ser de la forma ( , ). Es
decir, un equilibrio de Nash simetrico puede ser asociado a un ESS, pero un
asimetrico no puede.
Teorema 1.2
Dejemos que sea un ESS en un concurso por parejas entonces, 6= , ya
sea:
1. ( , ) > (, ), o:
2. ( , ) = (, ) y (, ) > ( , )
Por el contrario, si bien (1) o (2) se cumple para cada 6= en un juego de
dos jugadores, entonces es un ESS en el juego de la poblacion correspondiente.
Observaci
on
La condici
on de equilibrio de Nash es ( , ) (, ) 6= , lo que la
condici
on ( , ) > (, ) en (2) es un requisito adicional que elimina algunos equilibrios de Nash que se consideraron. En otras palabras, puede haber
un equilibrio de Nash en el juego de dos jugadores, pero no ESS correspondiente
en el juego poblaci
on. La condicion suplementaria es particularmente relevante
en el caso de Equilibrio de Nash en estrategias mixtas.
El teorema 8.14 nos da un procedimiento alternativo para encontrar un ESS
en un juego poblacional de concurso en parejas:
1. Anote el juego de dos jugadores asociado;
2. Encontrar el equilibrios de Nash simetrico de este juego;
3. Probar los equilibrios de Nash usando las condiciones (1) y (2) anteriores.
Cualquier estrategia de equilibrio de Nash que pasa estas pruebas es una
ESS, lo que lleva a un perfil poblacional x = .
1.6 Competencia de pares asim

etricos
Hay muchas situaciones en las que los jugadores que participan en una competencia pueden ser distinguidos. En contextos economicos, ellos pueden ser un
vendedor y un comprador o ellos pueden ser una empresa que posee un monopolio en un mercado y una empresa buscando entrar en ese mercado. En problemas
biol
ogicos, ellos pueden ser p
ajaros machos o hembras que dividen el cuidado
de sus hijos o pueden ser machos mas grandes y peque
nos que compiten por el
dominio de un haren de hembras. Estas diferencias entre los individuos pueden
conducir a un cuadro de pagos asimetrica: los jugadores pueden tener diferente
acciones disponibles para ellos o los pagos pueden ser diferente en funcion de si
el jugador es hombre o mujer, un comprador o un vendedor. Pero incluso si no
surgen los pagos asimetricos, la posibilidad de que los jugadores puedan ocupar
diferentes roles nos plantea un problema. Por ejemplo, puede ser razonable para
un hombre hacer una cosa y una mujer hacer otra. Como podemos permitir tal
comportamiento dado que nuestra formulacion de estabilidad evolutiva requiere
9
un juego simetrico?
En una poblaci
on, un individuo puede encontrarse jugando un rol particular en
un juego y jugar otro rol en un encuentro posterior. Una estrategia general debe
especificar el comportamiento de todos los roles: use s en el rol r, use s en el
rol r, etc. Al especificar las estrategias roles-condicionados, nosotros obtenemos
un juego de poblaci
on simetrica. (A primera vista, puede parecer extra
no para
especificar estrategias como el cuidado de los hijos si es hombre, dejar si es mujer porque cualquier individuo dado es por lo general, ya sea hombre o mujer a
lo largo de toda su vida. En terminos geneticos, sin embargo, los genes que se
asumen para controlar el comportamiento seran transmitidos a los que cuidan
que pueden ser hombre o mujeres, cualquiera que sea el sexo del progenitor.)
Pagos pueden ser calcularse si se conoce la frecuencia con la que un individuo
asume un papel particular y con que frecuencia las personas que cumplan estan
jugando en cualquiera de los dos roles especficos. Por simplicidad, supondremos
que solo hay dos roles de interes en cualquier juego y que un jugador en un papel siempre se encuentra con un jugador en el otro rol. Dicho juego se dice que
posee la rol asimetrico. Tambien podemos suponer, como suele ser el caso,
que cada individuo se encuentra jugando cada rol con la misma probabilidad.
Por ejemplo, en una competencia entre hombre y mujeres, un gen tiene un 50%
de probabilidad de encontrarse controlando el comportamiento de cuerpo masculino, si la proporci
on de sexos es 1:1.
La ausencia de estrategia mixta ESS es una caracterstica general de los
juegos con rol asimetrico, como se demostro por Selten en 1980. Su demostracion
es m
as f
acil si tenemos en cuenta la conducta en lugar de estrategias mixtas.
Vamos a considerar s
olo los juegos con dos roles y las mismos dos acciones en
cada rol. En un juego de este tipo, una estrategia de comportamiento general
puede ser expresada como uso A con probabilidad p1 en rol 1, uso A con
probabilidad p2 en rol 2. Si denotamos una estrategia de comportamiento por
entonces podemos escribir
= (1 , 2 )
donde i = (pi , 1 pi ) es el comportamiento especificado para el rol i. El pago
por contra 0 es entonces:
(, 0 ) =
1
1
(1 , 20 ) + (2 , 10 )
2
2
Teorema 1.3
En un juego de competencia de pares que posee roles asimetricos, todas las
estrategias evolutivamente estables son puras.
Observaci
on
Una versi
on mas general de este teorema- para los juegos con mas de dos acciones y m
as de dos papeles- fue estalecido por Selten en 1980. Sin embargo,
es importante tener en cuenta que solo se aplica a los juegos de competencia de
pares. No se mantiene en en general para juegos populares que pueden tener un
amplio componente de poblacion no lineal.
10
1.7 Existencia de ESSs

Desafortunadamente, no es verdad que todos los juegos tengan un ESS, como
est
a demostrado por el siguiente ejemplo.
Ejemplo
Considerando el juego de dos jugadores (ni
nos) Piedra-Tijera-Papel. Los
ni
nos al mismo tiempo hacen la forma de uno de los elementos con la mano,
Roca (R) gana a Tijera (S); Tijera gana a Papel (P); Papel gana a Roca. Si
ambos jugadores eligen el mismo elemento, el juego es un empate. Una tabla
de pagos que corresponde a este juego es:
R
0,0
-1,1
1,-1
R
S
P
S
1,-1
0,0
-1,1
P
-1,1
1,-1
0,0
Estos dos jugadores tienen un Equilibrio de Nash unico [ , ] con =

(f rac13, f rac13, f rac13 pero esta estrategia no es un ESS en el correspondiente
juego popular, ya que(por ejemplo)
( , R) = 0 = (R, R)
Sin embargo, una clase importante de juegos siempre tiene al menos un ESS.
Teorema 1.4
Todos, de dos acciones, competencia de pares simetricos genericos tienen un
ESS.
Demostraci
on
Un juego simetrico de dos jugadores tiene la siguiente forma
P1
P2
A
A a,a
B c,b
B
b,c
d,d
Mediante la aplicaci
on de transformaciones afines (Ver Definicion 4.34),
podemos convertir esto en el juego equivalente
P1
A
B
P2
A
a-c,a-c
0,0
11
B
0,0
d-b,b-d
Es f
acil ver que las consideraciones del ESS dadas en el teorema 8.14 no se
ven afectadas por esta transformacion.
Debido a que estamos considerando juegos genericos, tenemos a 6= c and b 6= d.
Hay 3 posibilidades a considerar.
1. Si a c > 0, entonces (A, A) > (B, A) y por lo tanto A = (1, 0) es un
ESS, por la condici
on (1) en el Teorema 8.14
2. Si d b > 0, entonces (B, B) > (A, B) y por lo tanto B = (0, 1) es un
ESS, por la condici
on (1) en el Teorema 8.14
3. Si a c < 0 y d b < 0, entonces hay una estrategia mixta simetrica en
el equilibrio de Nash [ , ] con = (p , 1 p ) y
p =
db
ac+db
En este equilibrio, ( , ) = (, ) para cualquier estrategia , asi que

tenemos que considerar la desigualdad en la condicion (2) del teorema 8.14.
Ahora
( , ) = pp (a c) + (1 p)(1 p )(d b)
y
(, ) = p2 (a c) + (1 p)2 (d b)
asi
( , ) (, ) = p(p p)(a c) + (1 p)(p p )(d b)
= (p p)[p(a c + d b) (d b)]
= (a c + d b)(p p)2
>0
Asi es una ESS.
Por lo tanto, siempre hay un ESS en el juego de competencia de pares populares que corresponde a este juego de dos jugadores.
Adem
as de la posibilidad de que un ESS pueda no existir para un determinado juego, tambien es cierto que las interesantes estrategias de equilibrio de
Nash en algunos juegos din
amicos resultan no ser ESSs. Por ejemplo, en los
iteraci
on del dilema de los prisioneros, el equilibrio de Nash de estrategias que
se introducen para garantizar el comportamiento cooperativo - Tit-for-Tat,
estrategias Grim, y similares - no son ESSS. Por ejemplo, tenemos:
i (C , C ) = i (G , C )
i (C , G = i (G , G )
12
Lo que significa que las condiciones del ESS en el teorema 8.4 no se mantiene.
Este problema se debe a que la forma estrategica del Dilema de juego dinamico
de los Prisioneros iteradas no es generico y muchos de los equilibrios de Nash,
por lo tanto, se producen en grupos continuos que proporcionan la misma recompensa por todos los puntos en el conjunto. Debido a que un ESS debe tener
una recompensa mayor que cualquier otra estrategia en todas las poblaciones
cercanas, ninguna de estas estrategias de equilibrio de Nash puede ser un ESS. El
fracaso de muchos juegos a tener (interesante) ESSS ha llevado a la b
usqueda
de conceptos de estabilidad alternativos que son mas debiles: estos incluyen
Neutral Estabilidad, Evolutivamente Conjuntos estables y Lmite ESSS. Sin
embargo, ninguno de estos conceptos ha ganado renombre universal. As que,
en cambio, nuestra atenci
on se centrara ahora pasar de las estrategias para la
evoluci
on de la estructura de la poblacion en s.
REPLICADORES DINAMICOS
2.1 Din
amica Evolutiva
En el captulo anterior, hemos investigado el concepto de estrategia evolutiva
estable. Aunque este concepto supone la existencia de alg
un tipo de dinamica
evolutiva. Primero, un ESS no puede existir-en cuyo caso no nos dice nada
acerca de la evoluci
on del sistema descrito por el juego. Segundo, la definicion
de un ESS trata solamente con las poblacione monomorficas en el que cada
individuo utiliza la misma estrategia. Pero, si la ESS es una estrategia mixta,
entonces todas las estrategias en el apoyo de la ESS obtienen los mismos pagos
como la estrategia evolutivamente estable. Por lo tanto es pertinente preguntar
si una poblaci
on si una poblacion polimorfica con el mismo perfil de poblacion
como la generada por el ESS puede ser estable. Para abordar estas cuestiones,
vamos a ver a un tipo especfico de la dinamica evolutiva, llamada dinamica del
replicador.
Consideremos una poblaci
on en la que los individuos, llamados replicadores,
existen en varios tipos diferentes. Cada tipo de individuo utiliza una estrategia
programa previamente ( para el juego que se considera de forma explcita) y
pasa este comportamiento a sus descendientes sin modificacion. En la dinamica
del replicador, se supone que los individuos estan programados para utilizar
s
olo estrategias puras a partir de un conjunto finito S = {s1 , s2 , ..., sk } ni sera
el n
umero de individuos usando si ; entones el tama
no de la poblacion total es
N=
K
X
ni
i=1
y la proporci
on de individuos usando si , es
xi =
ni
N
13
El estado de la poblaci
on puede entonces ser descrito por un vector X =
(x1 , x2 , ..., xk ) (junto con el tama
no total de la poblacion Nm que no nos va
a interesar). y los antecedentes del nacimiento per capita y las tasas de
mortalidad en la poblaci
on. Es decir, y representan las contribuciones a
las tasas de aparici
on y desaparicion de los individuos de la poblacion que son
independientes del juego en cuestion. Los antecedentes per capita de la tasa
de cambio de los n
umeros, , es modificado por el pago por el uso de la
estrategia si en el juego poblacional en estudio. La tasa de cambio del n
umero
de personas que utilizan si es
n i = ( + (si , x))ni
y el ratio de cambio de el tama
no de la poblacion esta dador por
N =
K
X
n i
i=1
= ( )
K
X
ni +
i=1
K
X
(si , x)ni
i=1
= ( )N + N
K
X
xi (si , x)
i=1
= ( +
(x))N,
donde hemos definido el pago promedio en la poblacion por
(X) =
K
X
xi (si , x)
i=1
Asi la poblaci
on aumenta o disminuye de manera exponencial. Esto puede
ser no muy realista, pero podemos mejorar la descripcion dejando y dependan de N. En tanto que los incrementos del estado fsico = (si , x) dependen
s
olo de las proporciones xi y no sobre el n
umero real ni , la dinamica del juego
se mantendr
an sin cambios.
Desde el punto de vista de teora de juegos, estamos mas interesados en como
las proporciones de cada tipo cambian en el tiempo. Ahora
n i = N x i + xi N
Asi
N x i = n i + xi N
= ( + (si , x))xi N xi ( +
(X))N
Cancelando y dividiendo por N, tenemos:
x i = ((si , x)
(x))xi
14
En otras palabras, la proporci

on de individuos utilizando la estrategia si incrementa(disminuye) si los pagos son mayores (menores) que los pagos medios en
la poblaci
on.
Definici
on 2.1
Un punto fijo de los replicadores dinamicos es una poblacion que satisface x i =
0, i. Puntos fijos describen poblaciones que ya no estan en evolucion.
Ejemplo
Considerando una competencia de pares de un juego poblacional con accion
A = {E, F } y pagos
(E, E) = 1
(E, F ) = 1
(F, E) = 2
(F, F ) = 0
Asi (E, x) = x1 + x2 y (F, x) = 2x1 , lo que da
(x) = x1 (x1 + x2 ) + x2 (2x1 )

= x21 + 3x1 x2
La din
amica del replicador para este juego es
x 1 = x1 (x1 + x2 x21 3x1 x2 )
x 2 = x2 (2x1 x21 3x1 x2
Asi los puntos fijos seran (x1 = 0, x2 = 1), (x1 = 1, x2 = 1) y (x1 = 21 , x2 = 21 ).
2.2 Dos-estrategias de competencia por parejas

Tratar con juegos en general requiere de algunas tecnicas matematicas con las
que no todos estar
an familiarizados. As que,vamos a hacer temporalmente una
mayor simplificaci
on y considerar los juegos de competencia por parejas que solo
tienen dos estrategias puras.
Supongamos que que S = {s1 , s2 } y sea x x1 Entonces x2 = 1x y x2 = x1 .
As, que s
olo tenemos que pensar en una sola ecuacion diferencial:
x = ((s1 , X)
(X))x.
Podemos simplificarla sustituyendo:
(X) = x(s1 , X) + (1 x)(s2 , X)

Lo que nos da:
x = x(1 x)((s1 , X) (s2 , x)).
15
2.1
Ejemplo
Considere un Dilema del Prisionero de competencia por parejas. Las estrategias

puras son {C,D} y los beneficios para el individuo focal en el juego de 2 jugadores
correspondientes son (C, C) = 3, (C, D) = 0, (D, C) = 5 y (D, D) = 1.
Sea x la proporci
on de individuos usando C, entonces:
(C, X) = 3x + 0(1 x) = 3x
y
(D, X) = 5x + 1(1 x) = 1 + 4x
La tasa de cambio de la proporcion de las personas usando C es:
x = x(1 x)((C, X) (D, X))
= x(1 x)(3x (1 + 4x))
= x(1 x)(1 + x)
Los puntos fijos de este sistema dinamico son x = 0 y x = 1. Sabemos que el
u
nico equilibrio de Nash para el juego del dilema del prisionero es para todos
desertar (jugar D). Esto significa que x = 0 corresponde a un equilibrio de
Nash, pero x = 1 no. Tambien vemos que x < 0 para x (0, 1). Esto significa
que cualquier poblaci
on que no esta en un punto fino de la dinamica va a evolucionar hacia el punto fijo que se corresponde con el equilibrio de Nash y alejar
del otro.
Parece que cada equilibrio de Nash corresponde a un punto fijo en la dinamica
del replicador pero no cada punto fijo corresponde a un equilibrio de Nash. El
siguiente teorema demuestra esta conjetura para los juegos de la competencia
por parejas con dos estrategias puras.
Teorema 2.1
Sea S = {s1 , s2 } y dejar que = (p , 1 p ) sea la estrategia que utiliza s1
con probabilidad p . Si ( , ) es un equilibrio de Nash simetrico, entonces la
poblaci
on x = (x , 1 x ) con x = p es un punto fijo de la dinamica del
replicador x = x(1 x)((s1 , X) (s2 , X)).
Demostraci
on
Si es una estrategia pura, entonces x = 0 o x = 1. En cualquier caso,
tenemos x = 0. Si es una estrategia mixta, entonces Teorema 4.27 dice que
(s1 , ) = (s2 , ). Ahora, para una competencia por parejas,
(si , ) = p (si , s1 ) + (1 p )(si , s2 )
= (si , X )
16
As que tenemos (s1 , x ) = (s2 , x ) y, en consecuencia x = 0. Hemos demostrado que los equilibrios de Nash en juegos de dos jugadores y los puntos
fijos en la din
amica del replicador estan relacionados. Hay una relacion consistente entre las ESSs (Estrategias evolutivamente estables) en un juego de la
poblaci
on y los puntos fijos?
Ejemplo
Considere la posibilidad de una competencia por parejas con las acciones A y
B y los siguientes pagos en el juego de dos jugadores asociados: (A, A) = 3,
(B, B) = 1 y (A, B) = (B, A) = 0. Las ESSs son para todos jugar A o
para todos jugar B. La estrategia mixta = (1/4, 3/4) no es una EEE. Sea x la
proporci
on de individuos usando A, entonces la tasa de cambio de la proporcion
de personas que utilizan A es:
x = x(1 x)((A, X) (B, X))
= x(1 x)(3x (1 x))
= x(1 x)(4x 1).
Los puntos fijos de este sistema dinamico son x = 0, x = 1 y x = 1/4. Sin
embargo, podemos ver que x > 0 si x > 14 y x < 0 si x < 1/4, por lo que solo
los comportamientos de estrategias puras son puntos extremos evolutivos. Si la
poblaci
on se inicia en un estado donde mas del 25% de las personas utilizan la
estrategia A, entonces la poblacion evoluciona hasta que todo el mundo utiliza
A. Por otro lado, si la poblacion se inicia en un estado donde menos del 25%
de las personas utilizan la estrategia A, a continuacion, la poblacion evoluciona
hasta que todo el mundo utiliza B. Esto significa que solo los puntos finales
evolutivos corresponden a un ESS.
En el juego Hawk-Dove (del halcon-paloma), la correspondencia entre el punto

final de la evoluci
on de la din
amica del replicador y la ESS es un poco menos
directa (vease el ejercicio 9.4). La ESS es para cada individuo jugar Halcon
con probabilidad v / c. Sin embargo, en la dinamica del replicador, los individuos pueden no utilizar estrategias mixtas: un individuo debe ser o un Halcon
usuario pre-programado o una paloma usuario pre-programado. Sin embargo, la
poblaci
on evoluciona hacia un estado en el que la proporcion de usuarios Halcon
es v / c, que es el equivalente polimorfica de la ESS monomorfica.
2.3 Estabilidad Asint

otica y Linealizaci
on
En el ejemplo considerado en la seccion previa, un ESS siempre corresponde a
un punto final evolucionario in el replicador dinamico.Todos los ESS tienen un
correspondiente punto final y todos los puntos finales evolucionarios tienen un
correspondiente ESS?. En esta seccion, continuaremos considerando un caso especial de juego de concurso de parejas con 2 estrategias. Luego consideraremos
juego general de n-estrategias y llegaremos a una conclusion parecida. Porque la
definici
on de un ESS considera peque
nas desviaciones de una especifica poblacion, esto tiene sentido para hacer lo mismo en el replicador dinamico.
17
Definici
on 2.2
Un punto fijo del replicador dinamico (o cualquier sistema dinamico) se dice
que sera asimptoticamente estable si cualquier peque
na desviacion del equilibrios son eliminados por la dinamica de t
Ejemplo
Considere un concurso de pareja con estrategias puras A y B y los siguientes
payoffs in la asociacion del juego de 2 jugadores.
(A, A) = 3, (B, B) = 1, (A, B) = (B, A) = 0
Conocemos que los ESS para este juego son para cada uno de los que jugaron
A o todos los que jugaron B. La estrategia mixta = ( 14 , 34 ) es un Equilibrio de
Nash pero no un ESS. Sea x la proporcion de individuos que usan A, entonces
el replicador dinamico es
x=x(1
x)(1 4x)
con puntos fijos x = 1 y x = 21 .
Primero, considerar una poblacion cercana a x = 0. Sea x = x + =
donde debemos tener que > 0 para asegurar que x > 0. Entonces x =
porque x es una constante. Asi tenemos
= (1 )(1 4)
Porque se asume que 1, podemos ignorar terminos proporcionales a n
donde n > 1. Este procedimiento es llamado linealizacion. Tenemos

el cual tiene la soluci
on
(t) = 0 et
Esto nos dice que la din
amica reduce las peque
nas desviaciones de la poblacion
dada x = (0, 1)(i.e, 0ast ). En otras palabras, el punto fijo x = 0 es
asimptoticamente estable.
Ahora considere una poblaci
on cercana a x = 1. Dado x = x = 1 con
> 0 (para asegurar x < 1). Siguiendo el proceso de linealizacion encontramos
que:
3
El cual tiene la soluci
on:
(t) = 0 e3t
18
i.e., x = 1 es asimptoticamente estable.

Finalmente, considerando una poblacion cercana a x = 41 . Dadox = x + =
1
on en ). Tenemos
4 + (con ninguna restricci

1
16
Con soluci
on:
t
(t) = 0 e 16
Para x3 =
1
4
no es asimptoticamente estable. (por tanto inestable)
Entonces en este caso encontramos que una estrategia es ESS si y solo si

el correspondiente punto fijo en el replicador dinamico es asimptoticamente
estable.
Teorema 2.2
Para cualquier Dos-estrategias concurso de parejas, una estrategia es ESS si y
solo si el correspondiente punto fijo en el replicador dinamico es asimptoticamente estable
Demostraci
on
Considere un concurso de parejas con estrategias A y B. Dado que x es la proporci
on de individuos usando A, luego el replicador dinamico esta dado por
x = x(1 x)[(A, x) (B, x)].
Hay 3 casos posibles a considerar: una sola estrategia pura ESS o poblacion
estable monoformica, y una estrategia mixta ESS o poblacion poliformica.
1. Dado = (1, 0). Entonces (para = (y, 1 y) con y 6= 1) es un
ESS si y solo si
(A, x ) (, x ) > 0
(A, x ) y(A, x ) (o y)(B, x ) > 0
(1 y)[(A, x ) (B, x )] > 0
(A, x ) (B, x ) > 0
dado x = 1 con > 0. Entonces
= [(A, x ) (B.x )].
Entonces = (1, 0) es un ESS si y solo si la correspondiente poblacion x = 1
es asimt
oticamente estable 2. Dado = (0, 1). Entonces, usando un similar
argumento para el anterior caso, es un ESS si y solo si
(A, x ) (B, x ) < 0
19
Dado x = con > 0. Entonces

= [(A, x ) (B, x )].
Entonces = (0, 1) es un ESS si y solo si la correspondiente poblacion x = 0
es asimptoticamente estable.
3. Dado = (p , 1 p ) con 0 < p < 1. Entonces es un ESS si y solo
si ( , ) > (, ). Tomando = A y = B en turno, esta condicion llega a
2 condiciones
(A, A) < (B, A) y (B, B) < (A, B)
Dado x = x + . Entonces, para un concurso de parejas, la ecuacion del replicador din
amico
x = x(1 x)[(A, x ) (B, x )]
llega a ser
= x (1 x )([(A, A) (B, A)] + [(B, B) (B, A)])
usando el supuesto que x es un punto fijo. Entonces x es asimtoticamente
estable si y solo si es un ESS.
Sea F el conjunto de puntos fijos y Sea A el conjunto de puntos fijos
asint
oticamente estables en replicador dinamico. Sea N el conjunto de estrategias simetricas equilibrio de Nash y sea E el conjunto de ESSS en el juego
simetrico correspondiente al replicador dinamico. Entonces hemos demostrado
que, para cualquier juego de dos estrategias por concurso de parejas, las siguientes relaciones son v
alidas para una estrategia sigma y el correspondiente
estado de la poblaci
on x :
1. E x A;
2. x A N ;
3. N x F .
Permitiendo que nuestro acostumbrado abuso de la notacion que identifica a
una estrategia con esta correspondiente poblacion dada, podemos escribir esta
relaci
on mas consistentemente como
E = A N F
Como podemos ver, para juegos de concursos de parejas con mas de 2 estrategias
esta relaci
on llega a ser
E A N F
20
2.4 Juegos con mas de 2 estrategias

Si incrementamos el numero de estrategias puras a n, tendremos n ecuaciones
a manejar con
xi = fi (x) i = 1, ...., n
Pn
Usando la restricci
on
i=1 xi = 1, podemos introducir un vector espacio
reducido (x1 , x2 , ...., xn1 ) y reducir el n
umero de ecuaciones a n-1
xi = fi (x1 , x2 , ...., xn1 ) i = 1, ...., n
Podemos escribir este sistema dinamico de una forma mas compacta como 1
x = f(x)
No existe confusi
on al referirnos a ambos tipos de estado con el mismo
smbolo, x. De acuerdo al contexto sera claro a que tipo de notacion nos estamos
refiriendo.
Definicion 2.3
El replicador din
amico est
a definido en el simplex
= {x1 , x2 , ...., xn1 /0 <= xi <= 1 i &
n
X
= 1}
i=1
Un colector invariante es un subconjunto M tal que si x(0) M , entonces x(t) M para todo t > 0
De la definici
on se obtiene inmediatamente que los puntos fijos de un sistema
din
amico son colectores invariantes. Restricciones del simplex (subconjuntos
donde uno o m
as tipos de poblacion estan ausentes) son tambien invariantes ya
que xi = 0 xi = 0.
Ejemplo
Para el sistema din
amico:
x =
x(1 x + 2y
(x, y))
y(1 + 2x y
(x, y))
Los colectores invariantes obvios son los puntos fijos (vease el ejercicio anterior) y las fronteras x = 0 y y = 0. La frontera x + y 1 = 0 es invariante
porque (en esa recta):
dx
(x + y)
dy
= x + y
=
(x + y 1)(1 (x, y))
1 los
lectores que no esten familiarizados con la teora b

asica de los sistemas din
amicos
pueden encontrar u
til leer el ap
endice B
21
La recta x = y es tambien invariante porque en esa recta x = y

Para obtener una representaci
on cualitativa de las soluciones del sistema dinamico,
consideramos el comportamiento de las soluciones sobre (o cerca a) los colectores
invariantes. Primero consideramos un punto fijo x . Usando una aproximacion
de Taylor del sistema din
amico alrededor de este punto fijo, obtenemos una
aproximaci
on lineal del sistema dinamico (recuerdese que f(x )=0, por lo que
los terminos constantes desaparecen):
xi =
n1
X
(xj xj )
j=1
Defnase i = xi
xi ,
fi
(x )
xj
entonces tenemos:
i =
n1
X
(j )
j=1
fi
(x )
xj
el cual es un sistema lineal con un punto fijo en el origen. La matriz L tiene

elementos constantes:
fi
Lij =
(x )
xj
Y sus valores propios determinan el comportamiento del sistema linealizado en
el punto fijo. Siempre que el punto fijo sea hiperbolico (es decir todos los valores
propios tienen parte real distinta de cero), el comportamiento del sistema completo no lineal es el mismo que el del linealizado. 2 Combinar esta informacion
con el comportamiento de las soluciones en otros colectores invariantes suele ser
suficiente para determinar una completa representacion cualitativa del sistema
din
amico.
Ejemplo
Regresando al ejemplo , consideremos el punto fijo (x , y ) = ( 12 , 12 ). Cerca a
este punto se tiene la aproximacion lineal:

1 12
= 1
2
Los valores propios son obtenidos de la ecuacion caracterstica det(L I) =0,
3
con races 1 = 1
2 y 2 = 2 . Ya que las partes reales de ambos valores propios
son negativas el punto de fijo es un nodo estable. Al resolver la ecuacion:

1 12
=
1
1
2
Se obtienen los vectores propios correspondientes a cada valor propio. En
este caso, se encuentra que el vector propio correspondiente a = 3
2 es = ,
que se encuentra sobre la frontera x + y = 1. Este vector propio tambien pasa
a traves del punto fijo (x , y ) =(0,0), lo cual es una buena s
nal de que la recta
x = y puede ser la invariante para este sistema dinamico, como, en efecto, hemos
mostrado que es.
2 Teorema
Hartman-Grobman
22
Los puntos fijos (x , y )=(1,0) y (x , y ) =(0,1), tienen ambos valores propios 1 =3 y 2 = 1, por lo que ambos puntos son nodos inestables. Alrededor
del punto (x , y ) = (0, 0) la aproximacion lineal es:

0 0
=
0 0
Figure 1: El comportamiento del replicador del sistema dinamico del ejemplo

9.9 puede ser construido al unir los puntos fijos mediante trayectorias suavizadas
que son consistente con el comportamiento del sistema o cerca de los colectores
invariantes (puntos fijos y rectas invariantes)
La cual no es hiperb
olica (1 = 2 = 0). Por lo tanto la linealizacion no nos
dice nada sobre la estabilidad de este punto fijos.
Analizemos ahora el sistema sobre las rectas invariantes. Sobre la recta y = 0
tenemos x = x2 (x 1)por lo que x < 0 para 0 < x < 1. Similarmente,sobre
la recta x = 0 tenemos y < 0 para 0 < y < 1. Sobre la recta x = y tenemos
x = x2 (1 2x), por lo que x y y aumentan para 0 < x, y < 21 . Sobre la recta
x + y 1 = 0 tenemos:
x
= x(3 3x
(x, 1 x))
= x(3 9x + 6 x2 )
Por lo tanto x aumenta (y decrece) para 0 < x < 21 y x decrece (y aumenta)

para 12 < x < 1 3
Combinando toda la informacion podemos realizar una representacion cualitativa la din
amica mostrada en la figura anterior.
3 Debido a que el punto x es un nodo estable, cualquier otro resultado indicar
a que se ha
cometido un error
23
2.5 Equilibrio y estabilidad

Denotemos como F al conjunto de puntos de equilibrio y como A el conjunto de
puntos de equilibrio asint
oticamente estables en el replicador dinamico. Ademas
N es el conjunto de estrategias de equilibrio de Nash (simetricas) y E es el
conjunto de ESSs en el juego simetrico correspondiente al replicador dinamico.
Mostraremos que, para cualquier juego de parejas, las siguientes relaciones se
mantienen para una estrategia y el correspondiente estado poblacional x :
1. E x A
2. x A N
3. N x A
Permitiendo nuestro habitual abuso de la notacion que identifica una estrategia con su correspondiente estado poblacional, podemos escribir estas relaciones
m
as concisas como:
EANF
Primero consideramos la inclusion N F
Teorema 2.3
Si ( , ) es un equilibrio de Nash simetrico, el estado poblacional x = es
un punto de equilibrio del replicador dinamico
Demostraci
on
Suponiendo que la estrategia de equilibrio de Nash es pura, as cada jugador en la poblaci
on usa alguna estrategia sj . Luego xi = 0 para i 6= j y
(x ) = (sj , x )
Por lo tanto x = 0 i
Suponiendo que la estrategia de equilibrio de Nash es mixta y denotando
S como el soporte de (p.e. S contiene solo esas estrategias puras que son
jugadas con una probabilidad diferente de cero debajo de . ). La igualdad
del teorema de pagos (Teorema 4.27) es:
(s, ) = ( , ) s S
Esto implica que, en una poblacion polimorfica con x = , debemos tener
para todo si S
(si , x )
k
X
(si , sj )xj
j=1
k
X
(si , sj )pj
j=1
= (si , )
= constante
24
Para estrategias si
/ S , la condicion x = nos da xi = 0 y por lo tanto
x = 0
Para estrategias sj S tenemos:
x j
xj ((sj , x )
k
X
xi (sj , x ))
i=1
xj ((sj , x ) (sj , x )
k
X
xj )
j=1
Observaci
on
El Teorema 9.13 muestra que un proceso evolucionario puede producir aparentemente comportamiento racional (Equilibrio de Nash) en una poblacion compuesta por individuos que no estan obligados a tomar decisiones conscientemente
racionales. En poblaciones donde se supone que los agentes tienen algunas facultades crticas como poblaciones humanas las obligaciones de racionalidad
son mucho menos rigurosas que las que hay en la teora de juegos clasica. Las
personas ya no est
an obligadas a ser capaces de trabajar a traves de la (posiblemente infinita) secuencia de la reaccion y contra reaccion a los cambios en el
comportamiento. Ellos simplemente tienen que ser capaces de evaluar las consecuencias de sus acciones, compararlas con los resultados obtenidos por otros
quienes se comportaron diferentes e intercambiar para una mejor (no necesariamente la mejor) estrategia para la situacion actual. La poblacion es estable
cuando, dado lo que todos los demas hacen,ning
un individuo obtendra un mejor
resultadotomando una estrategia diferente. Este punto de vista poblacional de
un equilibrio de Nash primero fue adelantado por el propio Nash, quien lo llamo
la interpretaci
on de acci
on de masas.
Luego consideramos la inclusion A N
Teorema 2.4
Si x es un punto de equilibrio estable asintoticamente del replicador dinamico,
entonces el par de estrategias simetricas [ , ] con = x es un equilibrio
de Nash
Demostraci
on
Primero, observamos que si x es un punto fijo con xi > 0 i (p.e.,todos los
tipos de estrategias puras estan presentes en la poblacion), as todas las estrategias puras deben ganar el mismo beneficio en esa poblacion. Se deduce
a partir de la correspondencia de y x que 1 (s, ) = (s, x ) es tambien
25
constante para todas las estrategias puras s. Por lo tanto [ , ] es un equilibrio de Nash. S
olo queda considerar poblaciones estacionarias donde uno o
m
as tipos de estrategias puras estan ausentes. Se denota el conjunto de estrategias puras que est
an presentens como S S (p.e.,S es el soporte del
punto de equilibrio x y la estrategia postulada como equilibrio de Nash).
Debido a que x es un punto fijo, debemos tener (s, x ) = (x ) s S
y 1 (s, ) = 1 ( , ) s S . Ahora suponemos que [ , ] no es un
equilibrio de Nash. Entonces debe haber alguna estrategia s0
/ S para la cual
0
0
1 (s , ) > 1 ( , )y consecuentemente para la cual (s , x ) > (x ). Considerando una poblaci
on x que es cercana al estado x pero tiene una peque
na
0
proporci
on de s jugadores. Luego:
As la proporci
on de jugadores-s0 incrementa, contradiciendo el supuesto de
que x es asint
oticamente estable.
Finalmente consideramos la inclusion E A
Definici
on 2.4
Denotemos x = f (x) como un sistema dinamico con un punto fijo en x . Luego
una funci
on escalar V (x), definida para estados posibles del sistema cercanos a
x , tales como
1.V (x ) = 0
2.V (x) > 0parax 6= x
3. dV
dt < 0parax 6= x
es llamada una Funci
on de Lyapounov (estricta). Si esta funcion existe,
entonces el punto fijo x es asintoticamente estable.
Teorema 2.5
Todo ESS correponde a un punto fijo asintoticamente estable en el replicador
din
amico. Esto es, si es un ESS, entonces la poblacion con x = es
asint
oticamente estable.
Demostraci
on
Si es un ESS entonces, por definicion, existe un para el cual <
( , > (,
0
6=
donde = (1 ) + . En particular, esto es valido para = , as

( , > ( , ). Esto implica que en el replicador dinamico tenemos,para
26
x = , x = (1 )x + x0 y todo <
( , x) > (x).
Ahora oconsideramos la funci
on relativa de entropa
V (x) =
k
X
xi ln
i=1
xi
xi
Claramente V (x ) = 0 y (usando la desigualdad de Jensen Ef (x) f (Ex)

para cualquier funci
on convexa, como el logaritmo)
La derivada de V (x) respecto del tiempo a lo largo de las trayectorias de

soluci
on del replicador din
amico es:
d
V (x)
dt
k
X
V
x i
x
i
i=1
k
X
x
i
i=1
k
X
x
i
i=1
xi
xi
x i
xi ((si , x) (x))
[( , x) (x)]
Si es un ESS, entonces establecimos anteriormente que hay una region

cerca a x donde [( , x) (x)] > 0 para x 6= x . Por lo tanto
dV
<0
dt
para los estados de poblaci
on suficientemente cerca al punto fijo. V (x) es por
lo tanto una funci
on de Lyapunov estricta en esta region, y el punto fijo x es
asint
oticamente estable. Los tres teoremas precedentes establecen la relacion
anunciada entre los conjuntos de ESSs (E), los equilibrios de Nash simetricos
(N), los puntos fijos (F), y los puntos fijos asintoticamente estables (A):
EANF
27
En general, debe haber puntos fijos asintoticamente estables en el replicador

din
amico que no corresponden a un ESS.
Si la derivada de la funci
on relativa de entropa para un punto fijo (tomada
a traves de las trayectorias de solucion) es positiva, entonces el punto fijo es
inestable. Si la derivada es cero, entonces el punto fijo es entonces el punto
fijo no es asint
oticamente estable ni inestable: la evolucion de la poblacion es
peri
odica alrededor del punto fijo.
Ejemplo
Considerar el juego de Piedra-Papel-Tijera. x1 es la proporcion de jugadores que
eligen Piedra,x2 la proporci
on de jugadores que eligen Tijera y x3 la proporcion
de jugadores que eligen Papel. Entonces el replicador dinamico es:
x 1 = x1 (x2 x3 )
x 2 = x2 (x3 x1 )
x 3 = x3 (x1 x2 )
1 1 1
con los puntos fijos (1, 0, 0), (0, 1, 0), (0, 0, 1), y( , , ). Es facil de ver con3 3 3
siderando los lmites que los primeros tres puntos no son estables. Por ejemplo,
considerando la lnea invariante x1 = 0 donde, para 0 < x2 , x3 < 1, tenemos
x 2 > 0 y x 3 < 0. Los resultados de las tres lneas invariantes juntas implican que hay alg
un tipo de comportamiento oscilatorio del punto fijo polimofico
1 1 1
( , , ): si el punto fijo es asintoticamente estable, entonces las trayectorias
3 3 3
ser
an espiral hacia dentro de este; si es inestable, entonces las trayectorias seran
espiral fuera de el. La tercera posibilidad es que las trayectorias de solucion formen bucles cerrados alrededor del punto fijo. Esto es, de hecho, el caso puede
ser confirmado observando que la derivada en el tiempo de la entropa relativa
a lo largo de trayectorias solucion del replicador dinamico es
d
1
1
1
V (x) = (x2 x3 ) (x3 x1 ) (x1 x2 ) = 0
dt
3
3
3
Figure 2: Una imagen cualitativa del replicador dinamico para el juego de

Piedra-Papel-Tijera analizado en el ejemplo 9.18. Se ha usado la descripcion
del vector de estados reducido con x3 = 1 x1 x2 .
28
EJERCICIOS
Ejercicio 3.1
Est
a claro que en todo momento debemos tener
k
X
xi = 1
i=1
Demostrar que si se cumple esta condicion en el momento t = 0, entonces se

cumple para todo t > 0
Soluci
on
Debido a que
k
X
x i = ((si , x) (x))xi
i=1
k
X
((si , x) (x))
k
X
xi
i=1
i=1
= (x) (x)
k
X
x i = 0
i=1
Conclusi
on: Debido a que la poblacion no crece, es decir, se mantiene estatico
sera inapropiado decir que
Pk
i=1 xi = 1, para todo t 0.
Ello tambien corrobora la Definicion 9.1 del libro.
Ejercicio 3.2
Demostrar que la din
amica evolutiva no se modifica bajo una transformacion
afn de los pagos, siempre que el parametro de tiempo sea medida apropiadamente.(Una transformaci
on afn cambia los pagos por + donde es
un n
umero real y ces un n
umero real positivo)
Soluci
on
Bajo la transformaci
on afn por lo que la ecuacion 9.1 se convierte
en:
dxi
= ((si , x) (x))xi
dt
29
.
Introduciendo un ajuste en el parametro tiempo = t, podemos escribir esto
como:
dxi
= ((si , x) (x))xi
d
que es exactamente la misma forma que la ecuacion original.
Ejercicio 3.3
Considere el concurso por parejas con pagos que figuran en la tabla de abajo
(donde a < b).
A
B
A
a-b,a-b
0,2a
B
2a,0
a,a
Deducir las ecuaciones din

amicas del replicador para este juego y encontrar todos los puntos fijos.
Soluci
on
Dada el cuadro, podremos hallar los pagos gracias a las estrategias para cada
jugador de acuerdo a su acci
on y as hallar su funcion de pagos de dichos jugadores:
(A, x) = (a b)x1 + 2ax2
(B, x) = ax2
Hallando la media de los pagos
(x) = (A, x)x1 + (B, x)x2
(x) = ((a b)x1 + 2ax2 )x1 + (ax2 )x2
la media de los pagos ser
a: (x) = (a b)x21 + 2ax1 x2 + ax22
Hallando los replicadores din
amicos
Los replicadores din
amicos son representados por la formula:
x i = ((si , x)
(x))xi
para el problema reemplazando los pagos individuales y la media, quedara los
replicadores para cada jugador as:
x1 = x1 ((a b)x1 + 2ax2 (x))
x1 = x1 ((a b)x1 + 2ax2 ((a b)x21 + 2ax1 x2 + ax22 ))
30
x2 = x2 (ax2 (x))
x2 = x2 (ax2 ((a b)x21 + 2ax1 x2 + ax22 ))
.
Dada la definici
on de punto fijo es decir xi = 0, las poblaciones (x1 = 1, x2 = 0)
y (x1 = 0, x2 = 1) son puntos fijos.
En punto fijo polim
orfico se define como:
(si , x)
(x) = 0
para todo i = 1, n
El punto fijo polim
orfico para el problema dado i = 1, 2:
(s1 , x)
(x) = 0 = (s2 , x)
(x)
(a b)x1 + 2ax2 (x) = 0 = ax2 (x)
Donde dar
a (a b)x1 = ax2 . Sustituyendo el resultado anterior dentro de la
ecuaci
on:
ax2 (x) = 0
ax2 (a b)x21 + 2ax1 x2 + ax22 = 0
Se obtendr
a: x1 =
a
b
y x2 =
ba
b .
Ejercicio 3.4
Derivar el replicador din
amico del juego Hawk-Dove (Halcon-Paloma) y demostrar que cualquier poblaci
on que no esta en un punto fijo evolucionara hacia
el punto que corresponde al u
nico equilibrio de Nash simetrico.
En el juego Hawk-Dove (Halcon-Paloma) los individuos solo pueden usar una
de las dos posibles estrategias puras
H: Ser agresivo (ser una Halcon)
D: No ser agresivo (ser una Paloma)
Soluci
on
En general, un individuo puede utilizar una estrategia aleatoria que ha de ser
agresivo con probabilidad p, es decir, = (p, 1 p). Una poblacion se compone de animales que son agresivos con una probabilidad de x, por ejemplo,
x = (x, 1 x), que puede surgir porque (i) en una poblacion monomorfica,
todo el mundo utiliza la estrategia = (x, 1 x), o (ii) en una poblacion
polim
orfica una fracci
on x de la poblacion utiliza H = (1, 0) y una fraccion 1-x
usa D = (0, 1).
31
Sea x la proporci
on de jugadores H, as:
x =
c
v
x(1 x)( x)
2
c
con puntos fijos x = 0, x = 1 y x = vc . Si x < v/c, entonces x > 0 y si

x > v/c, x < 0. Entonces x vc para cualquier poblacion inicial que no es un
punto fijo.
Ejercicio 3.5
Una poblaci
on de aves se distribuye de manera que en cualquier area solo hay dos
hembras y dos
arboles adecuados para anidar (T1 y T2 ). Si las dos las hembras
escogen el mismo sitio de anidacion,entonces cada una de ellas anidan 2 cras.
Si optan por diferentes sitios, entonces son mas vulnerables a los depredadores y
s
olo anidan 1 cra cada una. Esta situacion se puede modelar como un juego de
concurso por parejas. Deducir la ecuacion del replicador dinamico y demostrar
que s
olo los puntos fijos que corresponden a un ESS son puntos extremos evolutivos.
Soluci
on
La din
amica del replicador para la proporcion de jugadores T1 es:
x =
=
x(1 x)((T1 , x) (T2 , x))
(1)
x(1 x)(2x 1)
(2)
Si x < 21 entonces x 0. Del ejercicio 8.7 las estrategias evolutivas estables

son T1 y T2 , las cuales corresponden a los puntos finales evolutivos.
Ejercicio 3.6
Cuando a > 0, ambos A y B son ESSs. Para a < 0, el juego tiene un u
nico ESS,
1 1
= ( , ). La ecuaci
on del replicador dinamico es
2 2
x = ax(1 x)(2x 1)
1
con el punto fijo x = 0, x = 1 y x = .
2
Primero, consideramos una poblacion cerca a x = 0. Denotemos x = x + = .
Entonces tenemos
= a(1 )(2 1) a
Entonces el punto fijo x = 0 es asintoticamente estable si a > 0 e inestable si
a < 0.
Ahora consideraremos una poblacion cerca a x = 1. Denotemos x = x =
1 . Entonces tenemos
32
= a(1 )()(2(1 ) 1) a
Entonces x = 1 es asint
oticamente estable si a > 0 e inestable si a < 0.
1
Finalmente, consideramos una poblacion cerca a x = .Denotemos x = x +
2
1
= + . Entonces tenemos
2
1
1
1
= a( + )(1 )(1 + 2 1) a
2
2
2
Entonces x = 12 es asint
oticamente estable si a < 0 e inestable si a > 0.
En general, un punto fijo es asintoticamente estable si y solo si la estrategia
correspondiente es un ESS.
Ejercicio 3.7
Considere el siguiente concurso por parejas. El juego tiene la siguiente matriz
de pagos:
A
B
C
A
0,0
3,3
1,1
B
3,3
0,0
1,1
C
1,1
1,1
1,1
Encuentrar todos los equilibrios de Nash y estrategias evolutivas estables.

Demostrar que el conjunto de puntos fijos para el replicador dinamico es el
mismo ya sea considerando el sistema completo o el reducido.
Soluci
on
El replicador din
amico para el de este juego es:
x1 =
x1 (3x2 + x3
(x))
x2 =
x2 (3x1 + x3
(x))
x3 = x3 (1
(x))
Con
(x) = 6x1 x2 + x1 x3 + x2 x3 + x3 . Escribiendo x1 = x, x2 = y y
x3 = 1 x y, el sistema puede ser reducido al siguiente sistema dinamico en
dos variables:
x = x(1 x + 2y
(x, y))
y =
y(1 + 2x y
(x, y))
con
(x,y)=1+4xy x2 y 2
Los puntos fijos son (1, 0, 0), (0, 1, 0), y (0, 0, 1) en ambos casos. Ya sea que
consideremos el sistema completo o el reducido.
33
Ejercicio 3.8
Graficar una representaci
on cualitativa de la dinamica del replicador para el
siguiente juego por parejas con la matriz de pagos mostrada:
A
B
C
A
3,3
0,0
1,1
B
0,0
3,3
1,1
C
1,1
1,1
1,1
Soluci
on
Las ecuaciones de din
amica del replicador son:
x = x(1 + 2x y
(x, y))
y = y(1 x + 2y
(x, y))
con
(x, y) = 1 + 2x2 + 2y 2 2xy

Los puntos fijos son (0, 0), (0, 1), (1, 0), y (12, 12). Los puntos (0, 1) y (1, 0)
son nodos estables (valores propios -2 y -3 en ambos casos). El punto (12, 12)
es un punto de silla (valores propios 12 y -32 con vectores propios x + y = 1
y x = y, respectivamente). El punto (0, 0) no es hiperbolico. En las lneas de
invariantes x = 0, y = 0 y x = y, la poblacion se aleja de (0, 0). As que un
cuadro cualitativo de la din
amica del replicador se parece a la figura de abajo.
Ejercicio 3.9
Considere el juego de concurso de parejas con la tabla de pagos debajo. Muestre
1 1 1
que la poblaci
on polim
orfica x = ( , , ) es asintoticamente estable en el
3 3 3
1 1 1
replicador din
amico, pero que la estrategia = ( , , ) no es un ESS. [Indi3 3 3
1 1
caci
on: considerar la estrategia = (0, , )].
2 2
34
A
0,0
-2,1
1,1
A
B
C
B
1,-2
0,0
1,3
C
1,1
3,1
0,0
Soluci
on
Dado que x es la proporcion de A-jugadores y dado y la proporcion de Bjugadores. Establecemos x = 13 + y y = 13 + y linealiza sobre el punto fijo
x = y = 13 para conseguir

=L
con
L=
1
9
1
8
2
7
Los valores propios de la matriz L son ambos 31 .Por lo tanto el punto fijo es
asimptoticamente estable. Porque = ( 31 , 13 , 13 ) es una estrategia de equilibrio
mixto de Nash, tenemos, para = (0, 12 , 12 ),
(, ) = ( , ) =
Pero
( , ) =
2
3
5
6
(3)
<1
(4)
= (, )
(5)
Entonces no es un ESS.
Ejercicio 3.10
Considere la posibilidad de una variacion del juego Piedra-Papel-Tijera en la
que hay un costo para ambos jugadores (rentabilidad = -c) solo si el resultado
es un empate. Demostrar que x = ( 31 , 13 , 31 ) es asintoticamente estable en el
replicador din
amico.
Soluci
on
La tabla de pagos es (c > 0)
Sea x, y y z las proporciones de R-, S-, y P-jugadores. Entonces el sistema
din
amico del replicador es:
x = x(cx + y z
(X))
y = y(x cy + z
(X))
z = z(x y cz
(X))
35
con
(X) = c(x2 + y 2 + z 2 ) Es facil comprobar que el punto x = y = z =
un punto fijo. Sea V la funci
on de entropa relativa, entonces
dV
= [( , X)
(X)]
dt
=
c
c(x2 + y 2 + z 2 )
3
< 0 para X 6= ( 31 , 13 , 31 )
36
1
3
es

Monografia 3raPC

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Monografia 3raPC

Hochgeladen von

Copyright:

Verfügbare Formate

FACULTAD DE INGENIERIA ECONOMICA, ESTADISTICA Y CIENCIAS

TEORIA DE JUEGOS EVOLUTIVOS

JUEGOS SOBRE LA POBLACION

1.1 Teora de Juegos Evolutivos

1.2 Estrategias estables evolutivas

para un pago acorde a la pareja (s, s0 ).

1.3 Juegos contra el campo

La diferencia entre los pagos es:

Si esta diferencia es positiva para cualquier = (p, 1 p) con p 6= 1/2 luego

1.4 Juegos de Competencia por Parejas

Ejemplo(El juego del halc

As que la mejor respuesta a esta poblacion es jugar Paloma (es decir, p =

Si p < v/c entonces mejor respuesta es p

entonces la mejor respuesta es p

((1 )p + p, ((1 )(1 p ) + (1 p ))

Lo que prueba que es una ESS.

1.5 ESSs y el Equilibrio de Nash

Este pago es el mismo que se obtendra en un juego de dos jugadores contra

1.6 Competencia de pares asim

1.7 Existencia de ESSs

Estos dos jugadores tienen un Equilibrio de Nash unico [ , ] con =

En este equilibrio, ( , ) = (, ) para cualquier estrategia , asi que

En otras palabras, la proporci

(x) = x1 (x1 + x2 ) + x2 (2x1 )

2.2 Dos-estrategias de competencia por parejas

(X) = x(s1 , X) + (1 x)(s2 , X)

Considere un Dilema del Prisionero de competencia por parejas. Las estrategias

En el juego Hawk-Dove (del halcon-paloma), la correspondencia entre el punto

2.3 Estabilidad Asint

i.e., x = 1 es asimptoticamente estable.

no es asimptoticamente estable. (por tanto inestable)

Entonces en este caso encontramos que una estrategia es ESS si y solo si

Dado x = con > 0. Entonces

2.4 Juegos con mas de 2 estrategias

(x + y 1)(1 (x, y))

lectores que no esten familiarizados con la teora b

La recta x = y es tambien invariante porque en esa recta x = y

el cual es un sistema lineal con un punto fijo en el origen. La matriz L tiene

Figure 1: El comportamiento del replicador del sistema dinamico del ejemplo

Por lo tanto x aumenta (y decrece) para 0 < x < 21 y x decrece (y aumenta)

2.5 Equilibrio y estabilidad

Luego consideramos la inclusion A N

donde = (1 ) + . En particular, esto es valido para = , as

Claramente V (x ) = 0 y (usando la desigualdad de Jensen Ef (x) f (Ex)

La derivada de V (x) respecto del tiempo a lo largo de las trayectorias de

Si es un ESS, entonces establecimos anteriormente que hay una region

En general, debe haber puntos fijos asintoticamente estables en el replicador

Figure 2: Una imagen cualitativa del replicador dinamico para el juego de

Demostrar que si se cumple esta condicion en el momento t = 0, entonces se

Deducir las ecuaciones din

con puntos fijos x = 0, x = 1 y x = vc . Si x < v/c, entonces x > 0 y si

x(1 x)((T1 , x) (T2 , x))

Si x < 21 entonces x 0. Del ejercicio 8.7 las estrategias evolutivas estables

Encuentrar todos los equilibrios de Nash y estrategias evolutivas estables.

(x, y) = 1 + 2x2 + 2y 2 2xy

Das könnte Ihnen auch gefallen