Beruflich Dokumente
Kultur Dokumente
SOCIALES
UNI
Curso:
Teora de Juegos
Profesor:
Luis Mu
noz Ramos
Definici
on 1.1
Considere una poblaci
on infinita de individuos que pueden usar un conjunto de
estrategias puras, S. Un perfil de la poblacion es un vector x que genera una
probabilidad de x(s), en donde cada estrategia s S es realizada o jugada en
la poblaci
on.
Un perfil de la poblaci
on no necesita corresponder a una estrategia adoptada
por alg
un miembro de la poblacion.
Definicon 1.2
Un juego contra el campo es uno en el cual no hay un oponente especfico
para un individuo - su pago depende de lo que los demas estan haciendo en la
poblaci
on. Este tipo de juegos son un poco diferentes de los juegos considerados
en la Teora Cl
asica de Juegos, una consecuencia de la gran interaccion entre
la poblaci
on es que los pagos no necesariamente dependen linealmente de las
probabilidades x(s) en donde las estrategias puras son jugadas por los miembros
de la poblaci
on
Definici
on 1.3
Un juegos de pareja describe una situacion en donde un individuo juega contra un oponente que ha sido escogido aleatoriamente (por la Naturaleza)de la
poblaci
on y su pago depende de lo que hagan ambos. Estos juegos se parecen
mucho m
as a los de la Teora Clasica de Juegos, por lo que podemos escribir
XX
(, x) =
p(s)x(s0 )(s, s0 )
sS s0 S
Si es la u
nica mejor respuesta a x , entonces la evolucion de la poblacion
se detiene. Sin embargo, si hay otra estrategia que es igualmente buena en
2
poblaci
on con el perfil x , luego la poblacion puede desviarse en la direccion de
la otra estrategia y su correspondiente perfil de poblacion, al menos que no sea
prevenida de no hacerlo.
Definici
on 1.4
Considere una poblaci
on en donde inicialmente todos los individuos adoptan alguna estrategia . Ahora supongamos que una mutacion ocurre y una peque
na
proporcion de todos los individuos usa otra estrategia . La nueva poblacion
es llamada poblaci
on post-entrada y se denota como x
Definici
on 1.5
Una estrategia mixta es un ESS si existe un que para cada 0
y cada
6=
( , x ) > (, x )
En otras palabras, una estrategia es un ESS si las mutaciones que adoptan cualquier otra estrategia dejan menos descendencia en las poblacion postentrada, dado que la proporci
on de mutantes es lo suficientemente peque
na.
(s1 , x) = n2 1
(s2 , x) = n2
El pago de la estrategia mixta = (p, 1 p) es:
(, x) = n2 ((1 p) + p( 1
))
Debido a que n es independiente de las estrategias elegidas, podemos establecer
n = 1 para facilitar los c
alculos debido a que finalmente estamos interesados en
el ratio de sexo. En este punto, es tentador escribir una matriz de pagos para
el juego, como la siguiente:
Hembras
s1
s2
Poblacion
x=1
(s1 , x = 1)
(s2 , x = 1)
x=0
(s1 , x = 0)
(s2 , x = 0)
Hembras
Poblacion
s1
s1 (s1 , s1 )
s2 (s2 , s1 )
s2
(s1 , s2 )
(s2 , s2 )
Sin embargo,no debemos hacer esto por dos razones. La primera, el perfil
(x0 = (0, 1)) tiende a = 0 que significa un pago para s1 indefinido. Segundo,
puede ser tentativo para nosotros creer que la estrategia pura en la poblacion
en general es:
(si , x) = x(si , s1 ) + (1 x)(si , s2 )
lo cual es incorrecto,pues el pago para la estrategia s1 no es lineal al perfil
de la poblaci
on.
El primero de estos problemas es la forma simple en la cual hemos construido nuestro modelo. Sin embargo, debido a que una poblacion evolutivamente
estable llegar
a a un estado diferente a este, podemos ignorar el problema y
poder continuar el uso de este modelo simple. Un alcance alternativo es el de
especificar las estrategias que siempre producen una proporcion distinta de cero
de machos. Ahora, econtremos el ESS, considerando los siguientes tres casos.
1. si < 1/2, las hembras que juegan s1 (toda descendencia macho)tienen
m
as nietos, lo que genera que se eleve. Por lo que s1 no es un ESS
2. si > 1/2, las hembras que juegan s2 (toda descendencia hembra) tienen
m
as nietos, lo que genera que decline. Por lo que s2 no es un ESS.
3. = ( 21 , 12 ) es una ESS potencial.
(s1 , x ) = (s2 , x ) = ( .x )
si el perfil de la poblaci
on es x = (1/2, 1/2).
Necesitamos verificar que = ( 21 , 12 ) es un ESS, denotemos = (p, 1 p)
luego,
4
x = (1 ) +
y
= 21 (1 ) + p = 12 + (p 21 )
La condici
on ESS es
( , x ) > (, x )
donde
( , x ) =
1
2
+ 21 ( 1
)
y
(, x ) = (1 p) + p( 1
ventajoso luchar por un recurso (suponiendo que es mejor que compartir), por
que los animales no acaban siempre matandose (o al menos seriamente mutil
andose) unos a otros? La respuesta del grupo -seleccionista es que cualquier
especie que siguen esta estrategia moriran con bastante rapidez, por lo que los
animales se contienen de todos estas competencias para el bien de la especie.
As que, si la selecci
on de grupo es la u
nica respuesta posible, entonces eso sera
un resultado muy importante. Sin embargo, el juego del halcon - paloma muestra que hay una alternativa - una que se basa de manera justa y de lleno en la
acci
on de la selecci
on natural sobre los individuos. As, aplicando la navaja de
Occam, no hay necesidad de invocar a la seleccion de grupo.
(, xD )
pv + (1 p)
(1 + p)
v
2
v
2
As que la mejor respuesta a esta poblacion es jugar Halcon (es decir, las
personas que utilizan la estrategia H = (1, 0) hara lo mejor en esta poblacion).
Como consecuencia de ello, la proporcion de individuos mas agresivos aumentar
a (es decir, que aumenta x). En una poblacion de halcones, x = 1, y:
(, xH )
vc
2
=
=
vc
v
+ p(1 p )v + (1 p)(1 p )
2
2
v pc v
(1 p ) + [ p ]
2
2 c
pp
(p + (p p ), 1 p + (p p))
Ahora:
( , x )
vc
+ p (1 p + (p p))v
2
v
+(1 p )(1 p + (p p))
2
= p (p + (p p ))
Y:
(, x )
vc
+ p(1 p + (p p))v
2
v
+(1 p)(1 p + (p p))
2
= p(p + (p p ))
As que mediante el
algebra (usando p = v/c), encontramos:
(, x ) (, x
c
(p p)2
2
> 0 p 6= p (es decir, 6= )
Definici
on 1.6
Si un juego poblacional de concurso por parejas tiene beneficios dados por la
ecuaci
on (8.4), entonces el juego de dos jugadores asociado es el juego con pagos
dadas por los n
umeros 1 (s, s0 ) = (s, s0 ) = 2 (s, s0 ).
En una poblaci
on mono morfica, si es una ESS, entonces x = . Por
lo tanto, si hay un equilibrio de Nash en el juego asociado que corresponde a
la ESS en el juego de la poblacion, entonces debe ser de la forma ( , ). Es
decir, un equilibrio de Nash simetrico puede ser asociado a un ESS, pero un
asimetrico no puede.
Teorema 1.2
Dejemos que sea un ESS en un concurso por parejas entonces, 6= , ya
sea:
1. ( , ) > (, ), o:
2. ( , ) = (, ) y (, ) > ( , )
Por el contrario, si bien (1) o (2) se cumple para cada 6= en un juego de
dos jugadores, entonces es un ESS en el juego de la poblacion correspondiente.
Observaci
on
La condici
on de equilibrio de Nash es ( , ) (, ) 6= , lo que la
condici
on ( , ) > (, ) en (2) es un requisito adicional que elimina algunos equilibrios de Nash que se consideraron. En otras palabras, puede haber
un equilibrio de Nash en el juego de dos jugadores, pero no ESS correspondiente
en el juego poblaci
on. La condicion suplementaria es particularmente relevante
en el caso de Equilibrio de Nash en estrategias mixtas.
El teorema 8.14 nos da un procedimiento alternativo para encontrar un ESS
en un juego poblacional de concurso en parejas:
1. Anote el juego de dos jugadores asociado;
2. Encontrar el equilibrios de Nash simetrico de este juego;
3. Probar los equilibrios de Nash usando las condiciones (1) y (2) anteriores.
Cualquier estrategia de equilibrio de Nash que pasa estas pruebas es una
ESS, lo que lleva a un perfil poblacional x = .
un juego simetrico?
En una poblaci
on, un individuo puede encontrarse jugando un rol particular en
un juego y jugar otro rol en un encuentro posterior. Una estrategia general debe
especificar el comportamiento de todos los roles: use s en el rol r, use s en el
rol r, etc. Al especificar las estrategias roles-condicionados, nosotros obtenemos
un juego de poblaci
on simetrica. (A primera vista, puede parecer extra
no para
especificar estrategias como el cuidado de los hijos si es hombre, dejar si es mujer porque cualquier individuo dado es por lo general, ya sea hombre o mujer a
lo largo de toda su vida. En terminos geneticos, sin embargo, los genes que se
asumen para controlar el comportamiento seran transmitidos a los que cuidan
que pueden ser hombre o mujeres, cualquiera que sea el sexo del progenitor.)
Pagos pueden ser calcularse si se conoce la frecuencia con la que un individuo
asume un papel particular y con que frecuencia las personas que cumplan estan
jugando en cualquiera de los dos roles especficos. Por simplicidad, supondremos
que solo hay dos roles de interes en cualquier juego y que un jugador en un papel siempre se encuentra con un jugador en el otro rol. Dicho juego se dice que
posee la rol asimetrico. Tambien podemos suponer, como suele ser el caso,
que cada individuo se encuentra jugando cada rol con la misma probabilidad.
Por ejemplo, en una competencia entre hombre y mujeres, un gen tiene un 50%
de probabilidad de encontrarse controlando el comportamiento de cuerpo masculino, si la proporci
on de sexos es 1:1.
La ausencia de estrategia mixta ESS es una caracterstica general de los
juegos con rol asimetrico, como se demostro por Selten en 1980. Su demostracion
es m
as f
acil si tenemos en cuenta la conducta en lugar de estrategias mixtas.
Vamos a considerar s
olo los juegos con dos roles y las mismos dos acciones en
cada rol. En un juego de este tipo, una estrategia de comportamiento general
puede ser expresada como uso A con probabilidad p1 en rol 1, uso A con
probabilidad p2 en rol 2. Si denotamos una estrategia de comportamiento por
entonces podemos escribir
= (1 , 2 )
donde i = (pi , 1 pi ) es el comportamiento especificado para el rol i. El pago
por contra 0 es entonces:
(, 0 ) =
1
1
(1 , 20 ) + (2 , 10 )
2
2
Teorema 1.3
En un juego de competencia de pares que posee roles asimetricos, todas las
estrategias evolutivamente estables son puras.
Observaci
on
Una versi
on mas general de este teorema- para los juegos con mas de dos acciones y m
as de dos papeles- fue estalecido por Selten en 1980. Sin embargo,
es importante tener en cuenta que solo se aplica a los juegos de competencia de
pares. No se mantiene en en general para juegos populares que pueden tener un
amplio componente de poblacion no lineal.
10
Ejemplo
Considerando el juego de dos jugadores (ni
nos) Piedra-Tijera-Papel. Los
ni
nos al mismo tiempo hacen la forma de uno de los elementos con la mano,
Roca (R) gana a Tijera (S); Tijera gana a Papel (P); Papel gana a Roca. Si
ambos jugadores eligen el mismo elemento, el juego es un empate. Una tabla
de pagos que corresponde a este juego es:
R
0,0
-1,1
1,-1
R
S
P
S
1,-1
0,0
-1,1
P
-1,1
1,-1
0,0
Teorema 1.4
Todos, de dos acciones, competencia de pares simetricos genericos tienen un
ESS.
Demostraci
on
Un juego simetrico de dos jugadores tiene la siguiente forma
P1
P2
A
A a,a
B c,b
B
b,c
d,d
Mediante la aplicaci
on de transformaciones afines (Ver Definicion 4.34),
podemos convertir esto en el juego equivalente
P1
A
B
P2
A
a-c,a-c
0,0
11
B
0,0
d-b,b-d
Es f
acil ver que las consideraciones del ESS dadas en el teorema 8.14 no se
ven afectadas por esta transformacion.
Debido a que estamos considerando juegos genericos, tenemos a 6= c and b 6= d.
Hay 3 posibilidades a considerar.
1. Si a c > 0, entonces (A, A) > (B, A) y por lo tanto A = (1, 0) es un
ESS, por la condici
on (1) en el Teorema 8.14
2. Si d b > 0, entonces (B, B) > (A, B) y por lo tanto B = (0, 1) es un
ESS, por la condici
on (1) en el Teorema 8.14
3. Si a c < 0 y d b < 0, entonces hay una estrategia mixta simetrica en
el equilibrio de Nash [ , ] con = (p , 1 p ) y
p =
db
ac+db
y
(, ) = p2 (a c) + (1 p)2 (d b)
asi
( , ) (, ) = p(p p)(a c) + (1 p)(p p )(d b)
= (p p)[p(a c + d b) (d b)]
= (a c + d b)(p p)2
>0
Asi es una ESS.
Por lo tanto, siempre hay un ESS en el juego de competencia de pares populares que corresponde a este juego de dos jugadores.
Adem
as de la posibilidad de que un ESS pueda no existir para un determinado juego, tambien es cierto que las interesantes estrategias de equilibrio de
Nash en algunos juegos din
amicos resultan no ser ESSs. Por ejemplo, en los
iteraci
on del dilema de los prisioneros, el equilibrio de Nash de estrategias que
se introducen para garantizar el comportamiento cooperativo - Tit-for-Tat,
estrategias Grim, y similares - no son ESSS. Por ejemplo, tenemos:
i (C , C ) = i (G , C )
i (C , G = i (G , G )
12
Lo que significa que las condiciones del ESS en el teorema 8.4 no se mantiene.
Este problema se debe a que la forma estrategica del Dilema de juego dinamico
de los Prisioneros iteradas no es generico y muchos de los equilibrios de Nash,
por lo tanto, se producen en grupos continuos que proporcionan la misma recompensa por todos los puntos en el conjunto. Debido a que un ESS debe tener
una recompensa mayor que cualquier otra estrategia en todas las poblaciones
cercanas, ninguna de estas estrategias de equilibrio de Nash puede ser un ESS. El
fracaso de muchos juegos a tener (interesante) ESSS ha llevado a la b
usqueda
de conceptos de estabilidad alternativos que son mas debiles: estos incluyen
Neutral Estabilidad, Evolutivamente Conjuntos estables y Lmite ESSS. Sin
embargo, ninguno de estos conceptos ha ganado renombre universal. As que,
en cambio, nuestra atenci
on se centrara ahora pasar de las estrategias para la
evoluci
on de la estructura de la poblacion en s.
REPLICADORES DINAMICOS
2.1 Din
amica Evolutiva
En el captulo anterior, hemos investigado el concepto de estrategia evolutiva
estable. Aunque este concepto supone la existencia de alg
un tipo de dinamica
evolutiva. Primero, un ESS no puede existir-en cuyo caso no nos dice nada
acerca de la evoluci
on del sistema descrito por el juego. Segundo, la definicion
de un ESS trata solamente con las poblacione monomorficas en el que cada
individuo utiliza la misma estrategia. Pero, si la ESS es una estrategia mixta,
entonces todas las estrategias en el apoyo de la ESS obtienen los mismos pagos
como la estrategia evolutivamente estable. Por lo tanto es pertinente preguntar
si una poblaci
on si una poblacion polimorfica con el mismo perfil de poblacion
como la generada por el ESS puede ser estable. Para abordar estas cuestiones,
vamos a ver a un tipo especfico de la dinamica evolutiva, llamada dinamica del
replicador.
Consideremos una poblaci
on en la que los individuos, llamados replicadores,
existen en varios tipos diferentes. Cada tipo de individuo utiliza una estrategia
programa previamente ( para el juego que se considera de forma explcita) y
pasa este comportamiento a sus descendientes sin modificacion. En la dinamica
del replicador, se supone que los individuos estan programados para utilizar
s
olo estrategias puras a partir de un conjunto finito S = {s1 , s2 , ..., sk } ni sera
el n
umero de individuos usando si ; entones el tama
no de la poblacion total es
N=
K
X
ni
i=1
y la proporci
on de individuos usando si , es
xi =
ni
N
13
El estado de la poblaci
on puede entonces ser descrito por un vector X =
(x1 , x2 , ..., xk ) (junto con el tama
no total de la poblacion Nm que no nos va
a interesar). y los antecedentes del nacimiento per capita y las tasas de
mortalidad en la poblaci
on. Es decir, y representan las contribuciones a
las tasas de aparici
on y desaparicion de los individuos de la poblacion que son
independientes del juego en cuestion. Los antecedentes per capita de la tasa
de cambio de los n
umeros, , es modificado por el pago por el uso de la
estrategia si en el juego poblacional en estudio. La tasa de cambio del n
umero
de personas que utilizan si es
n i = ( + (si , x))ni
y el ratio de cambio de el tama
no de la poblacion esta dador por
N =
K
X
n i
i=1
= ( )
K
X
ni +
i=1
K
X
(si , x)ni
i=1
= ( )N + N
K
X
xi (si , x)
i=1
= ( +
(x))N,
donde hemos definido el pago promedio en la poblacion por
(X) =
K
X
xi (si , x)
i=1
Asi la poblaci
on aumenta o disminuye de manera exponencial. Esto puede
ser no muy realista, pero podemos mejorar la descripcion dejando y dependan de N. En tanto que los incrementos del estado fsico = (si , x) dependen
s
olo de las proporciones xi y no sobre el n
umero real ni , la dinamica del juego
se mantendr
an sin cambios.
Desde el punto de vista de teora de juegos, estamos mas interesados en como
las proporciones de cada tipo cambian en el tiempo. Ahora
n i = N x i + xi N
Asi
N x i = n i + xi N
= ( + (si , x))xi N xi ( +
(X))N
Cancelando y dividiendo por N, tenemos:
x i = ((si , x)
(x))xi
14
Definici
on 2.1
Un punto fijo de los replicadores dinamicos es una poblacion que satisface x i =
0, i. Puntos fijos describen poblaciones que ya no estan en evolucion.
Ejemplo
Considerando una competencia de pares de un juego poblacional con accion
A = {E, F } y pagos
(E, E) = 1
(E, F ) = 1
(F, E) = 2
(F, F ) = 0
Asi (E, x) = x1 + x2 y (F, x) = 2x1 , lo que da
15
2.1
Ejemplo
y
(D, X) = 5x + 1(1 x) = 1 + 4x
La tasa de cambio de la proporcion de las personas usando C es:
x = x(1 x)((C, X) (D, X))
= x(1 x)(3x (1 + 4x))
= x(1 x)(1 + x)
Los puntos fijos de este sistema dinamico son x = 0 y x = 1. Sabemos que el
u
nico equilibrio de Nash para el juego del dilema del prisionero es para todos
desertar (jugar D). Esto significa que x = 0 corresponde a un equilibrio de
Nash, pero x = 1 no. Tambien vemos que x < 0 para x (0, 1). Esto significa
que cualquier poblaci
on que no esta en un punto fino de la dinamica va a evolucionar hacia el punto fijo que se corresponde con el equilibrio de Nash y alejar
del otro.
Parece que cada equilibrio de Nash corresponde a un punto fijo en la dinamica
del replicador pero no cada punto fijo corresponde a un equilibrio de Nash. El
siguiente teorema demuestra esta conjetura para los juegos de la competencia
por parejas con dos estrategias puras.
Teorema 2.1
Sea S = {s1 , s2 } y dejar que = (p , 1 p ) sea la estrategia que utiliza s1
con probabilidad p . Si ( , ) es un equilibrio de Nash simetrico, entonces la
poblaci
on x = (x , 1 x ) con x = p es un punto fijo de la dinamica del
replicador x = x(1 x)((s1 , X) (s2 , X)).
Demostraci
on
Si es una estrategia pura, entonces x = 0 o x = 1. En cualquier caso,
tenemos x = 0. Si es una estrategia mixta, entonces Teorema 4.27 dice que
(s1 , ) = (s2 , ). Ahora, para una competencia por parejas,
(si , ) = p (si , s1 ) + (1 p )(si , s2 )
= (si , X )
16
As que tenemos (s1 , x ) = (s2 , x ) y, en consecuencia x = 0. Hemos demostrado que los equilibrios de Nash en juegos de dos jugadores y los puntos
fijos en la din
amica del replicador estan relacionados. Hay una relacion consistente entre las ESSs (Estrategias evolutivamente estables) en un juego de la
poblaci
on y los puntos fijos?
Ejemplo
Considere la posibilidad de una competencia por parejas con las acciones A y
B y los siguientes pagos en el juego de dos jugadores asociados: (A, A) = 3,
(B, B) = 1 y (A, B) = (B, A) = 0. Las ESSs son para todos jugar A o
para todos jugar B. La estrategia mixta = (1/4, 3/4) no es una EEE. Sea x la
proporci
on de individuos usando A, entonces la tasa de cambio de la proporcion
de personas que utilizan A es:
x = x(1 x)((A, X) (B, X))
= x(1 x)(3x (1 x))
= x(1 x)(4x 1).
Los puntos fijos de este sistema dinamico son x = 0, x = 1 y x = 1/4. Sin
embargo, podemos ver que x > 0 si x > 14 y x < 0 si x < 1/4, por lo que solo
los comportamientos de estrategias puras son puntos extremos evolutivos. Si la
poblaci
on se inicia en un estado donde mas del 25% de las personas utilizan la
estrategia A, entonces la poblacion evoluciona hasta que todo el mundo utiliza
A. Por otro lado, si la poblacion se inicia en un estado donde menos del 25%
de las personas utilizan la estrategia A, a continuacion, la poblacion evoluciona
hasta que todo el mundo utiliza B. Esto significa que solo los puntos finales
evolutivos corresponden a un ESS.
Definici
on 2.2
Un punto fijo del replicador dinamico (o cualquier sistema dinamico) se dice
que sera asimptoticamente estable si cualquier peque
na desviacion del equilibrios son eliminados por la dinamica de t
Ejemplo
Considere un concurso de pareja con estrategias puras A y B y los siguientes
payoffs in la asociacion del juego de 2 jugadores.
(A, A) = 3, (B, B) = 1, (A, B) = (B, A) = 0
Conocemos que los ESS para este juego son para cada uno de los que jugaron
A o todos los que jugaron B. La estrategia mixta = ( 14 , 34 ) es un Equilibrio de
Nash pero no un ESS. Sea x la proporcion de individuos que usan A, entonces
el replicador dinamico es
x=x(1
x)(1 4x)
con puntos fijos x = 1 y x = 21 .
Primero, considerar una poblacion cercana a x = 0. Sea x = x + =
donde debemos tener que > 0 para asegurar que x > 0. Entonces x =
porque x es una constante. Asi tenemos
= (1 )(1 4)
Porque se asume que 1, podemos ignorar terminos proporcionales a n
donde n > 1. Este procedimiento es llamado linealizacion. Tenemos
el cual tiene la soluci
on
(t) = 0 et
Esto nos dice que la din
amica reduce las peque
nas desviaciones de la poblacion
dada x = (0, 1)(i.e, 0ast ). En otras palabras, el punto fijo x = 0 es
asimptoticamente estable.
Ahora considere una poblaci
on cercana a x = 1. Dado x = x = 1 con
> 0 (para asegurar x < 1). Siguiendo el proceso de linealizacion encontramos
que:
3
El cual tiene la soluci
on:
(t) = 0 e3t
18
1
16
Con soluci
on:
t
(t) = 0 e 16
Para x3 =
1
4
Teorema 2.2
Para cualquier Dos-estrategias concurso de parejas, una estrategia es ESS si y
solo si el correspondiente punto fijo en el replicador dinamico es asimptoticamente estable
Demostraci
on
Considere un concurso de parejas con estrategias A y B. Dado que x es la proporci
on de individuos usando A, luego el replicador dinamico esta dado por
x = x(1 x)[(A, x) (B, x)].
Hay 3 casos posibles a considerar: una sola estrategia pura ESS o poblacion
estable monoformica, y una estrategia mixta ESS o poblacion poliformica.
1. Dado = (1, 0). Entonces (para = (y, 1 y) con y 6= 1) es un
ESS si y solo si
(A, x ) (, x ) > 0
(A, x ) y(A, x ) (o y)(B, x ) > 0
(1 y)[(A, x ) (B, x )] > 0
(A, x ) (B, x ) > 0
dado x = 1 con > 0. Entonces
= [(A, x ) (B.x )].
Entonces = (1, 0) es un ESS si y solo si la correspondiente poblacion x = 1
es asimt
oticamente estable 2. Dado = (0, 1). Entonces, usando un similar
argumento para el anterior caso, es un ESS si y solo si
(A, x ) (B, x ) < 0
19
20
Definicion 2.3
El replicador din
amico est
a definido en el simplex
= {x1 , x2 , ...., xn1 /0 <= xi <= 1 i &
n
X
= 1}
i=1
Un colector invariante es un subconjunto M tal que si x(0) M , entonces x(t) M para todo t > 0
De la definici
on se obtiene inmediatamente que los puntos fijos de un sistema
din
amico son colectores invariantes. Restricciones del simplex (subconjuntos
donde uno o m
as tipos de poblacion estan ausentes) son tambien invariantes ya
que xi = 0 xi = 0.
Ejemplo
Para el sistema din
amico:
x =
x(1 x + 2y
(x, y))
y(1 + 2x y
(x, y))
Los colectores invariantes obvios son los puntos fijos (vease el ejercicio anterior) y las fronteras x = 0 y y = 0. La frontera x + y 1 = 0 es invariante
porque (en esa recta):
dx
(x + y)
dy
= x + y
=
1 los
21
n1
X
(xj xj )
j=1
Defnase i = xi
xi ,
fi
(x )
xj
entonces tenemos:
i =
n1
X
(j )
j=1
fi
(x )
xj
Ejemplo
Regresando al ejemplo , consideremos el punto fijo (x , y ) = ( 12 , 12 ). Cerca a
este punto se tiene la aproximacion lineal:
1 12
= 1
2
Los valores propios son obtenidos de la ecuacion caracterstica det(L I) =0,
3
con races 1 = 1
2 y 2 = 2 . Ya que las partes reales de ambos valores propios
son negativas el punto de fijo es un nodo estable. Al resolver la ecuacion:
1 12
=
1
1
2
Se obtienen los vectores propios correspondientes a cada valor propio. En
este caso, se encuentra que el vector propio correspondiente a = 3
2 es = ,
que se encuentra sobre la frontera x + y = 1. Este vector propio tambien pasa
a traves del punto fijo (x , y ) =(0,0), lo cual es una buena s
nal de que la recta
x = y puede ser la invariante para este sistema dinamico, como, en efecto, hemos
mostrado que es.
2 Teorema
Hartman-Grobman
22
Los puntos fijos (x , y )=(1,0) y (x , y ) =(0,1), tienen ambos valores propios 1 =3 y 2 = 1, por lo que ambos puntos son nodos inestables. Alrededor
del punto (x , y ) = (0, 0) la aproximacion lineal es:
0 0
=
0 0
= x(3 3x
(x, 1 x))
= x(3 9x + 6 x2 )
23
Teorema 2.3
Si ( , ) es un equilibrio de Nash simetrico, el estado poblacional x = es
un punto de equilibrio del replicador dinamico
Demostraci
on
Suponiendo que la estrategia de equilibrio de Nash es pura, as cada jugador en la poblaci
on usa alguna estrategia sj . Luego xi = 0 para i 6= j y
(x ) = (sj , x )
Por lo tanto x = 0 i
Suponiendo que la estrategia de equilibrio de Nash es mixta y denotando
S como el soporte de (p.e. S contiene solo esas estrategias puras que son
jugadas con una probabilidad diferente de cero debajo de . ). La igualdad
del teorema de pagos (Teorema 4.27) es:
(s, ) = ( , ) s S
Esto implica que, en una poblacion polimorfica con x = , debemos tener
para todo si S
(si , x )
k
X
(si , sj )xj
j=1
k
X
(si , sj )pj
j=1
= (si , )
= constante
24
Para estrategias si
/ S , la condicion x = nos da xi = 0 y por lo tanto
x = 0
Para estrategias sj S tenemos:
x j
xj ((sj , x )
k
X
xi (sj , x ))
i=1
xj ((sj , x ) (sj , x )
k
X
xj )
j=1
Observaci
on
El Teorema 9.13 muestra que un proceso evolucionario puede producir aparentemente comportamiento racional (Equilibrio de Nash) en una poblacion compuesta por individuos que no estan obligados a tomar decisiones conscientemente
racionales. En poblaciones donde se supone que los agentes tienen algunas facultades crticas como poblaciones humanas las obligaciones de racionalidad
son mucho menos rigurosas que las que hay en la teora de juegos clasica. Las
personas ya no est
an obligadas a ser capaces de trabajar a traves de la (posiblemente infinita) secuencia de la reaccion y contra reaccion a los cambios en el
comportamiento. Ellos simplemente tienen que ser capaces de evaluar las consecuencias de sus acciones, compararlas con los resultados obtenidos por otros
quienes se comportaron diferentes e intercambiar para una mejor (no necesariamente la mejor) estrategia para la situacion actual. La poblacion es estable
cuando, dado lo que todos los demas hacen,ning
un individuo obtendra un mejor
resultadotomando una estrategia diferente. Este punto de vista poblacional de
un equilibrio de Nash primero fue adelantado por el propio Nash, quien lo llamo
la interpretaci
on de acci
on de masas.
Teorema 2.4
Si x es un punto de equilibrio estable asintoticamente del replicador dinamico,
entonces el par de estrategias simetricas [ , ] con = x es un equilibrio
de Nash
Demostraci
on
Primero, observamos que si x es un punto fijo con xi > 0 i (p.e.,todos los
tipos de estrategias puras estan presentes en la poblacion), as todas las estrategias puras deben ganar el mismo beneficio en esa poblacion. Se deduce
a partir de la correspondencia de y x que 1 (s, ) = (s, x ) es tambien
25
constante para todas las estrategias puras s. Por lo tanto [ , ] es un equilibrio de Nash. S
olo queda considerar poblaciones estacionarias donde uno o
m
as tipos de estrategias puras estan ausentes. Se denota el conjunto de estrategias puras que est
an presentens como S S (p.e.,S es el soporte del
punto de equilibrio x y la estrategia postulada como equilibrio de Nash).
Debido a que x es un punto fijo, debemos tener (s, x ) = (x ) s S
y 1 (s, ) = 1 ( , ) s S . Ahora suponemos que [ , ] no es un
equilibrio de Nash. Entonces debe haber alguna estrategia s0
/ S para la cual
0
0
1 (s , ) > 1 ( , )y consecuentemente para la cual (s , x ) > (x ). Considerando una poblaci
on x que es cercana al estado x pero tiene una peque
na
0
proporci
on de s jugadores. Luego:
As la proporci
on de jugadores-s0 incrementa, contradiciendo el supuesto de
que x es asint
oticamente estable.
Finalmente consideramos la inclusion E A
Definici
on 2.4
Denotemos x = f (x) como un sistema dinamico con un punto fijo en x . Luego
una funci
on escalar V (x), definida para estados posibles del sistema cercanos a
x , tales como
1.V (x ) = 0
2.V (x) > 0parax 6= x
3. dV
dt < 0parax 6= x
es llamada una Funci
on de Lyapounov (estricta). Si esta funcion existe,
entonces el punto fijo x es asintoticamente estable.
Teorema 2.5
Todo ESS correponde a un punto fijo asintoticamente estable en el replicador
din
amico. Esto es, si es un ESS, entonces la poblacion con x = es
asint
oticamente estable.
Demostraci
on
Si es un ESS entonces, por definicion, existe un para el cual <
( , > (,
0
6=
x = , x = (1 )x + x0 y todo <
( , x) > (x).
Ahora oconsideramos la funci
on relativa de entropa
V (x) =
k
X
xi ln
i=1
xi
xi
d
V (x)
dt
k
X
V
x i
x
i
i=1
k
X
x
i
i=1
k
X
x
i
i=1
xi
xi
x i
xi ((si , x) (x))
[( , x) (x)]
Ejemplo
Considerar el juego de Piedra-Papel-Tijera. x1 es la proporcion de jugadores que
eligen Piedra,x2 la proporci
on de jugadores que eligen Tijera y x3 la proporcion
de jugadores que eligen Papel. Entonces el replicador dinamico es:
x 1 = x1 (x2 x3 )
x 2 = x2 (x3 x1 )
x 3 = x3 (x1 x2 )
1 1 1
con los puntos fijos (1, 0, 0), (0, 1, 0), (0, 0, 1), y( , , ). Es facil de ver con3 3 3
siderando los lmites que los primeros tres puntos no son estables. Por ejemplo,
considerando la lnea invariante x1 = 0 donde, para 0 < x2 , x3 < 1, tenemos
x 2 > 0 y x 3 < 0. Los resultados de las tres lneas invariantes juntas implican que hay alg
un tipo de comportamiento oscilatorio del punto fijo polimofico
1 1 1
( , , ): si el punto fijo es asintoticamente estable, entonces las trayectorias
3 3 3
ser
an espiral hacia dentro de este; si es inestable, entonces las trayectorias seran
espiral fuera de el. La tercera posibilidad es que las trayectorias de solucion formen bucles cerrados alrededor del punto fijo. Esto es, de hecho, el caso puede
ser confirmado observando que la derivada en el tiempo de la entropa relativa
a lo largo de trayectorias solucion del replicador dinamico es
d
1
1
1
V (x) = (x2 x3 ) (x3 x1 ) (x1 x2 ) = 0
dt
3
3
3
28
EJERCICIOS
Ejercicio 3.1
Est
a claro que en todo momento debemos tener
k
X
xi = 1
i=1
Soluci
on
Debido a que
k
X
x i = ((si , x) (x))xi
i=1
k
X
((si , x) (x))
k
X
xi
i=1
i=1
= (x) (x)
k
X
x i = 0
i=1
Conclusi
on: Debido a que la poblacion no crece, es decir, se mantiene estatico
sera inapropiado decir que
Pk
i=1 xi = 1, para todo t 0.
Ello tambien corrobora la Definicion 9.1 del libro.
Ejercicio 3.2
Demostrar que la din
amica evolutiva no se modifica bajo una transformacion
afn de los pagos, siempre que el parametro de tiempo sea medida apropiadamente.(Una transformaci
on afn cambia los pagos por + donde es
un n
umero real y ces un n
umero real positivo)
Soluci
on
Bajo la transformaci
on afn por lo que la ecuacion 9.1 se convierte
en:
dxi
= ((si , x) (x))xi
dt
29
.
Introduciendo un ajuste en el parametro tiempo = t, podemos escribir esto
como:
dxi
= ((si , x) (x))xi
d
que es exactamente la misma forma que la ecuacion original.
Ejercicio 3.3
Considere el concurso por parejas con pagos que figuran en la tabla de abajo
(donde a < b).
A
B
A
a-b,a-b
0,2a
B
2a,0
a,a
Soluci
on
Dada el cuadro, podremos hallar los pagos gracias a las estrategias para cada
jugador de acuerdo a su acci
on y as hallar su funcion de pagos de dichos jugadores:
(A, x) = (a b)x1 + 2ax2
(B, x) = ax2
Hallando la media de los pagos
(x) = (A, x)x1 + (B, x)x2
(x) = ((a b)x1 + 2ax2 )x1 + (ax2 )x2
la media de los pagos ser
a: (x) = (a b)x21 + 2ax1 x2 + ax22
Hallando los replicadores din
amicos
Los replicadores din
amicos son representados por la formula:
x i = ((si , x)
(x))xi
para el problema reemplazando los pagos individuales y la media, quedara los
replicadores para cada jugador as:
x1 = x1 ((a b)x1 + 2ax2 (x))
x1 = x1 ((a b)x1 + 2ax2 ((a b)x21 + 2ax1 x2 + ax22 ))
30
x2 = x2 (ax2 (x))
x2 = x2 (ax2 ((a b)x21 + 2ax1 x2 + ax22 ))
.
Dada la definici
on de punto fijo es decir xi = 0, las poblaciones (x1 = 1, x2 = 0)
y (x1 = 0, x2 = 1) son puntos fijos.
En punto fijo polim
orfico se define como:
(si , x)
(x) = 0
para todo i = 1, n
El punto fijo polim
orfico para el problema dado i = 1, 2:
(s1 , x)
(x) = 0 = (s2 , x)
(x)
(a b)x1 + 2ax2 (x) = 0 = ax2 (x)
Donde dar
a (a b)x1 = ax2 . Sustituyendo el resultado anterior dentro de la
ecuaci
on:
ax2 (x) = 0
ax2 (a b)x21 + 2ax1 x2 + ax22 = 0
Se obtendr
a: x1 =
a
b
y x2 =
ba
b .
Ejercicio 3.4
Derivar el replicador din
amico del juego Hawk-Dove (Halcon-Paloma) y demostrar que cualquier poblaci
on que no esta en un punto fijo evolucionara hacia
el punto que corresponde al u
nico equilibrio de Nash simetrico.
En el juego Hawk-Dove (Halcon-Paloma) los individuos solo pueden usar una
de las dos posibles estrategias puras
H: Ser agresivo (ser una Halcon)
D: No ser agresivo (ser una Paloma)
Soluci
on
En general, un individuo puede utilizar una estrategia aleatoria que ha de ser
agresivo con probabilidad p, es decir, = (p, 1 p). Una poblacion se compone de animales que son agresivos con una probabilidad de x, por ejemplo,
x = (x, 1 x), que puede surgir porque (i) en una poblacion monomorfica,
todo el mundo utiliza la estrategia = (x, 1 x), o (ii) en una poblacion
polim
orfica una fracci
on x de la poblacion utiliza H = (1, 0) y una fraccion 1-x
usa D = (0, 1).
31
Sea x la proporci
on de jugadores H, as:
x =
c
v
x(1 x)( x)
2
c
Ejercicio 3.5
Una poblaci
on de aves se distribuye de manera que en cualquier area solo hay dos
hembras y dos
arboles adecuados para anidar (T1 y T2 ). Si las dos las hembras
escogen el mismo sitio de anidacion,entonces cada una de ellas anidan 2 cras.
Si optan por diferentes sitios, entonces son mas vulnerables a los depredadores y
s
olo anidan 1 cra cada una. Esta situacion se puede modelar como un juego de
concurso por parejas. Deducir la ecuacion del replicador dinamico y demostrar
que s
olo los puntos fijos que corresponden a un ESS son puntos extremos evolutivos.
Soluci
on
La din
amica del replicador para la proporcion de jugadores T1 es:
x =
=
(1)
x(1 x)(2x 1)
(2)
Ejercicio 3.6
Cuando a > 0, ambos A y B son ESSs. Para a < 0, el juego tiene un u
nico ESS,
1 1
= ( , ). La ecuaci
on del replicador dinamico es
2 2
x = ax(1 x)(2x 1)
1
con el punto fijo x = 0, x = 1 y x = .
2
Primero, consideramos una poblacion cerca a x = 0. Denotemos x = x + = .
Entonces tenemos
= a(1 )(2 1) a
Entonces el punto fijo x = 0 es asintoticamente estable si a > 0 e inestable si
a < 0.
Ahora consideraremos una poblacion cerca a x = 1. Denotemos x = x =
1 . Entonces tenemos
32
= a(1 )()(2(1 ) 1) a
Entonces x = 1 es asint
oticamente estable si a > 0 e inestable si a < 0.
1
Finalmente, consideramos una poblacion cerca a x = .Denotemos x = x +
2
1
= + . Entonces tenemos
2
1
1
1
= a( + )(1 )(1 + 2 1) a
2
2
2
Entonces x = 12 es asint
oticamente estable si a < 0 e inestable si a > 0.
En general, un punto fijo es asintoticamente estable si y solo si la estrategia
correspondiente es un ESS.
Ejercicio 3.7
Considere el siguiente concurso por parejas. El juego tiene la siguiente matriz
de pagos:
A
B
C
A
0,0
3,3
1,1
B
3,3
0,0
1,1
C
1,1
1,1
1,1
Soluci
on
El replicador din
amico para el de este juego es:
x1 =
x1 (3x2 + x3
(x))
x2 =
x2 (3x1 + x3
(x))
x3 = x3 (1
(x))
Con
(x) = 6x1 x2 + x1 x3 + x2 x3 + x3 . Escribiendo x1 = x, x2 = y y
x3 = 1 x y, el sistema puede ser reducido al siguiente sistema dinamico en
dos variables:
x = x(1 x + 2y
(x, y))
y =
y(1 + 2x y
(x, y))
con
(x,y)=1+4xy x2 y 2
Los puntos fijos son (1, 0, 0), (0, 1, 0), y (0, 0, 1) en ambos casos. Ya sea que
consideremos el sistema completo o el reducido.
33
Ejercicio 3.8
Graficar una representaci
on cualitativa de la dinamica del replicador para el
siguiente juego por parejas con la matriz de pagos mostrada:
A
B
C
A
3,3
0,0
1,1
B
0,0
3,3
1,1
C
1,1
1,1
1,1
Soluci
on
Las ecuaciones de din
amica del replicador son:
x = x(1 + 2x y
(x, y))
y = y(1 x + 2y
(x, y))
con
Ejercicio 3.9
Considere el juego de concurso de parejas con la tabla de pagos debajo. Muestre
1 1 1
que la poblaci
on polim
orfica x = ( , , ) es asintoticamente estable en el
3 3 3
1 1 1
replicador din
amico, pero que la estrategia = ( , , ) no es un ESS. [Indi3 3 3
1 1
caci
on: considerar la estrategia = (0, , )].
2 2
34
A
0,0
-2,1
1,1
A
B
C
B
1,-2
0,0
1,3
C
1,1
3,1
0,0
Soluci
on
Dado que x es la proporcion de A-jugadores y dado y la proporcion de Bjugadores. Establecemos x = 13 + y y = 13 + y linealiza sobre el punto fijo
x = y = 13 para conseguir
=L
con
L=
1
9
1
8
2
7
Los valores propios de la matriz L son ambos 31 .Por lo tanto el punto fijo es
asimptoticamente estable. Porque = ( 31 , 13 , 13 ) es una estrategia de equilibrio
mixto de Nash, tenemos, para = (0, 12 , 12 ),
(, ) = ( , ) =
Pero
( , ) =
2
3
5
6
(3)
<1
(4)
= (, )
(5)
Entonces no es un ESS.
Ejercicio 3.10
Considere la posibilidad de una variacion del juego Piedra-Papel-Tijera en la
que hay un costo para ambos jugadores (rentabilidad = -c) solo si el resultado
es un empate. Demostrar que x = ( 31 , 13 , 31 ) es asintoticamente estable en el
replicador din
amico.
Soluci
on
La tabla de pagos es (c > 0)
Sea x, y y z las proporciones de R-, S-, y P-jugadores. Entonces el sistema
din
amico del replicador es:
x = x(cx + y z
(X))
y = y(x cy + z
(X))
z = z(x y cz
(X))
35
con
(X) = c(x2 + y 2 + z 2 ) Es facil comprobar que el punto x = y = z =
un punto fijo. Sea V la funci
on de entropa relativa, entonces
dV
= [( , X)
(X)]
dt
=
c
c(x2 + y 2 + z 2 )
3
< 0 para X 6= ( 31 , 13 , 31 )
36
1
3
es