Teoria Dos Jogos Resumo

UnB- Universidade de Braslia
Projeto: Jogos Aplicados Promoo do Desempenho Cognitivo de dosos (ProDC)

Professora: Lourdes Mattos Brasil
Aluna: Dandara Pereira Aranha
Resumo
Livro: Teoria dos Jogos 2 Edio . Editora: Pearson
Autores: H. Scott Bierman , Luis Fernandez
ntroduo
Embora dirigido a estudantes de graduao em economia, este livro pode
ser til para quem quiser aprender a linguagem e as idias da teoria dos jogos em
um nvel de introduo. O livro d nfase na aplicao de um conjunto
relativamente pequeno de ferramentas da teoria dos jogos para entender
fenmenos econmicos importantes.
Ele seleciona exemplos de uma ampla gama de reas para que os
estudantes possam perceber o poder da teoria dos jogos para quem estuda
economia. Podemos encontrar aplicaes da teoria na economia do trabalho, na
economia do setor pblico, no comrcio internacional, na economia de recursos
naturais, na macroeconomia, e finanas corporativas, em atividades bancrias e,
claro na organizao industrial, citando apenas algumas. Lendo o livro inteiro,
alm de aprender muito sobre teoria dos jogos, v-se muita coisa sobre a
moderna modelagem em economia.
Parte Jogos Estticos com informao Completa
Teoria dos jogos
A teoria dos jogos preocupa-se com o modo como indivduos tomam
decises quando esto cientes de que suas aes afetam uns aos outros e
quando cada indivduo leva isso em conta. a interao entre tomadores de
decises individuais, todos eles com um propsito em vista, cuja decises tem
implicaes para outras pessoas,o que torna as decises estratgicas diferentes
de outras decises.
uma teoria matemtica criada para se modelar fenmenos que podem
ser observados quando dois ou mais "agentes de deciso interagem entre si. Ela
fornece a linguagem para a descrio de processos de deciso conscientes e
objetivos envolvendo mais do que um indivduo.
A Teoria dos jogos usada para se estudar assuntos tais como eleies,
leiles, balana de poder, evoluo gentica, etc. Ela tambm uma teoria
matemtica pura, que pode e tem sido estudada como tal, sem a necessidade de
relacion-la com problemas comportamentais ou jogos per se.
Algumas pessoas acreditam que a Teoria dos Jogos formar em algum dia
o alicerce de um conhecimento tcnico estrito de como decises so feitas e de
como a economia funciona. O desenvolvimento da teoria ainda no atingiu este
patamar e, hoje, a Teoria dos Jogos mais estudada em seus aspectos
matemticos puros e, em aplicaes, ela usada como uma ferramenta ou
alegoria que auxiliam no entendimento de sistemas complexos.
Assim conclumos que a teoria dos jogos pode ser definida como a teoria
dos modelos matemticos que estuda a escolha de decises timas sob
condies de conflito. O elemento bsico em um jogo /e o conjunto de jogadores
que dele participam. Cada jogador tem um conjunto de estratgias. Quando cada
jogador escolhe sua estratgia, temos ento uma situao ou contigncia no
espao de todas as situaes (contigncias) possveis. Cada jogador tem
interesse ou preferncias para cada situao no jogo. Em termos matemticos,
cada jogador tem uma funo utilidade que atribui um nmero real (o ganho ou
payoff do jogador) a cada situao do jogo.
Mais especificamente, um jogo tem os seguintes elementos bsicos: existe
um conjunto finito de jogadores, representado por G = {g1, g2, . . . , gn}. Cada
jogador gi G possui um conjunto finito Si = {si1, si2, . . . , simi} de opes,
denominadas estratgias puras do jogador gi (mi 2).
Um vetor s = (s1j1, s2j2, . . . , snjn), onde siji uma estratgia pura para o
jogador gi G, denominado um perfil de estratgia pura. O conjunto de todos
os perfis de estratgia pura formam, portanto, o produto cartesiano:
denominado espao de estratgia pura do jogo. Para jogador gi G, existe uma
funo utilidade
ui : S ! R
s " ! ui(s)
que associa o ganho (payoff) ui(s) do jogador gi a cada perfil de estratgia pura s
S.
Um exemplo: Dilema do prisioneiro
Possivelmente o exemplo mais conhecido na teoria dos jogos o dilema
do prisioneiro. Ele foi formulado por Albert W. Tucker em 1950, em um seminrio
para psiclogos na Universidade de Stanford, para ilustrar a dificuldade de se
analisar certos tipos de jogos.
A situao a seguinte: dois ladres, Al e Bob, so capturados e acusados
de um mesmo crime. Presos em selas separadas e sem poderem se comunicar
entre si, o delegado de planto fez a seguinte proposta: cada um pode escolher
entre confessar ou negar o crime. Se nenhum deles confessar, ambos sero
submetidos a uma pena de 1 ano. Se os dois confessarem, ento ambos tero
pena de 5 anos. Mas se um confessar e o outro negar, ento o que confessou
ser libertado e o outro ser condenado a 10 anos de priso.
Neste contexto, temos
G = {Al, Bob}, SAl = {confessar, negar}, SBob = {confessar, negar},
S={(confessar,confessar),(confessar, negar),(negar, confessar),(negar, negar)}.
As duas funes utilidade
uAl : S ! R e uBob : S ! R
so dadas por
uAl(confessar, confessar) = #5, uAl(confessar, negar) = #10,
uAl(negar, confessar) = 0, uAl(negar, negar) = #1,
(que representam os ganhos (payoffs) de Al) e
uBob(confessar, confessar) = #5, uBob(confessar, negar) = 0,
uBob(negar, confessar) = #10, uBob(negar, negar) = #1
(que representam os ganhos (payoffs) de Bob). uma prtica se representar os
payoffs dos jogadores atravs de uma matriz, denominada matri$ de payoffs.
%&%
'((
)onfessar *egar
)onfessar +,-,,-. +/,,0/.
*egar +,0/,/. +,0,,0.
Nesta matriz, os nmeros de cada clula representam, respectivamente, os
payoffs de Al e Bob para as escolhas de Al e Bob correspondentes a clula.
!"uil#rio de $ash
Diz-se que uma combinao de estratgias constitui um equilbrio de Nash
quando cada estratgia a melhor resposta possvel s estratgias dos demais
jogadores, e isso verdade para todos os jogadores. Ou seja, cada um dos
jogadores que fazem parte do jogo, ao definir sua estratgia, estar fazendo o
melhor que pode, levando em conta o que seus oponentes esto fazendo.
Definio: em um jogo simultneo, as estratgias (a*1,....,a*n) constituem
um Equilbrio de Nash se, para todo jogador i, a*i a melhor resposta s
estratgias especificadas dos outros (N-1) jogadores, a*-i , isto , se:
ui(a*i, a*-i) < ui(ai,a*-i)
para todo aiC Ai , para todo jogador i = 1,......,N.
De forma equivalente, podemos definir as estratgias (a*1,...,a*n) como um
Equilbrio de Nash caso, para todo jogador i, a estratgia a*i resolver o problema
de max ui(ai, a-i*), escolhendo entre todos aiC Ai
.
Podemos, ainda, dizer que um conjunto de estratgias constitui um
"Equilbrio de Nash se, caso todos os jogadores N - 1 (menos um), joguem as
estratgias definidas pelo E.N, de modo que, para o N-simo jogador no exista
nada melhor a fazer a no ser, tambm, escolher a estratgia para ele definida no
"Equilbrio de Nash. sso deve valer para todos os jogadores tomados
individualmente.
Para encontrar um Equilbrio de Nash, basta identificar a(s) melhor(es)
resposta(s) de um jogador, diante de cada estratgia escolhida pelo(s) outro(s)
jogador(es). Ao proceder assim para todos eles, quando houver uma coincidncia
entre as melhores respostas para todos os envolvidos, esse conjunto de
estratgias ser identificada como um %e"uil#rio de $ash&
Uma forma de fazer isso seria:
Primeiro: indicar a estratgia que resulta na "maior recompensa para o jogador
que est situado nas linhas, para cada uma das estratgias escolhidas pelo
jogador que se encontra nas colunas. Podemos fazer isso colocando a letra "l no
lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida
pelo jogador da linha.
Segundo: indicar a estratgia que resulta na "maior recompensa para o jogador
que est situado nas colunas, para cada uma das estratgias escolhidas pelo
jogador que se encontra nas linhas. Podemos fazer isso colocando a letra "c no
lado da recompensa, bem como, sublinhando ou circulando a recompensa obtida
pelo jogador da coluna.
Este processo se repete para cada uma das linhas, bem como, para
cada uma das colunas.
Aps aplicarmos o mtodo de assinar a melhor resposta do jogador nas
linhas para cada estratgia do jogador nas colunas, bem como, assinalar a
melhor resposta do jogador nas colunas para cada estratgia do jogador nas
linhas, sempre que uma combinao de estratgias estiver assinalada
"simultaneamente, essa combinao de estratgias ser um "Equilbrio de Nash.
'ligop(lios

Muitos mercados importantes no so nem perfeitamente competitivos nem
perfeitamente monopolizados. Citamos, como alguns exemplos, automveis,
redes de transmisses televisivas, servios telefnicos de longa distncia,
aeronaves militares de auto desempenho e equipamentos de gerao de
eletricidade. Esses mercados so geralmente denominados &ligopolistas ou
1mperfeitamente competiti2os. Em mercados oligopolistas, as decises de
precificao e produo de cada empresa no setor tem um efeito significativo
sobre a lucratividade de seus competidores. Essas empresas nem so
competitivas tomadoras de preos, nem so monopolistas definidoras de preos.
Seus preos e nveis de produo so escolhas estratgicas em um jogo de
oligop3lio.
'ligop(lio de )ournot
Um oligoplio uma estrutura de mercado intermediria entre os casos
limites de monoplio e de competio perfetia. Nesse sentido a definio decorre
de imediato: em um oligoplio h um nmero de firmas n > 1 tal que nenhuma das
firmas capaz, sozinha, de determinar o preo do produto no mercado (como
seria o caso de um ambiente monopolista) mas no entanto cada uma dessas
firmas capaz de influenciar em alguma medida o preo que se estabelecer.
O modelo de Cournot um dos mais tradicionais modelos de oligoplios
existentes na literatura. Embora originalmente, no trabalho de Cournot (1897, com
a primeira edio em 1838), no tenha sido utilizado o conceito de equilbrio de
Nash (dado que esse no havia nem mesmo sido definido), a abordagem
necessariamente de teoria dos jogos - assim como a maior parte da literatura
moderna de organizao industrial. A hiptese bsica do modelo que os
jogadores (as firmas envolvidas) escolhem isoladamente a quantidade a se
produzir, ignorando a escolha da(s) outra(s) firma(s).
O preo de mercado torna-se, portanto, endgeno: dada a quantidade total
produzida no mercado, ele definido com base na demanda agregada do setor.
Outra hiptese que os produtos de cada firma no so diferenciados pelos
consumidores, i.e., so homogneos. Definiremos as funes de custo de cada
firma e a de demanda do mercado da maneira mais simples possvel, assim como
faz Gibbons (1992), de modo a evitar .algebrismos desnecessrios e a destacar o
mais importante, que o processo de resoluo do modelo.
Segue ento que o modelo de Cournot diz respeito a um jogo esttico onde
as firmas escolhem simultaneamente o quanto produzir. Ainda que numa primeira
aproximao possa parecer estranho conceber firmas decidindo
simultneamente, como num jogo de par ou mpar, isso tem uma apelo intuitivo
imediato: significa apenas que cada firma, ao fazer a sua escolha, no sabe qual
foi a escolha da rival, situao essa que extremamente comum no mundo real.
Cada firma sabe apenas que a rival sabe que ela tambm no conhece a sua
escolha e que a rival sabe que ela sabe que a rival no conhece
a sua escolha e assim infinitamente. Como habitual, o problema da firma
consiste em fazer suas escolhas de forma a obter o maior lucro possvel. No
entanto - e distintamente do modelo competitivo - a firma toma sua escolha
considerando o fato de que as escolhas alheias (no caso as decises de
produo de suas competidoras) vo afetar o seu payo, caracterizando um
elemento estratgico. Basicamente, ao tomar suas decises, as firmas vo
considerar um conjunto de restries dadas pelas demanda dos consumidores do
bem (especificada pela curva de demanda pelo produto), por restries
tecnolgicas (que sero incorporadas na estrutura de custo de cada firma) e por
restries de competio dadas pelo nmero e pelas caractersticas dos seus
competidores.
Vamos considerar um modelo simples onde duas firmas, 1 e 2, produzem
um bem homogneo cuja demanda dada por
P (Q) = a Q
onde a > 0 e Q = q1 + q2 a oferta da indstria, dada pela soma do produto das
firmas que compes essa indstria. Vamos considerar que para ambas as firmas
o custo fixo nulo que o custo marginal (aqui ao custo mdio) constante e
idntico para as empresas,
C1 (q1) = cq1
C2 (q2) = cq2
onde C pertence (0; a] por um motivo que ficar claro adiante. Podemos ento
representar esse jogo na forma normal
G = (S1; S2; u1; u2)
tal que temos
1. os jogadores: as firmas 1 e 2;
2. os espaos de estratgias dos jogadores, S1e S2 onde vamos supor que
Si = [0; qi], i = 1; 2 . Note que nesse caso os conjuntos de escolhas das firmas
dado pelo espao aonde as firmas podem escolher produzir: no mnimo zero e no
mximo uma quantidade muito grande porm finita;
3. a funo de ganho dos jogadores, u1 e u2. No caso de firmas, essas funes
de ganhos so exatamente a funo de lucro de cada uma delas, dadas por
1 (q1; q2) = P (Q) q1 - cq1
2 (q1; q2) = P (Q) q2 - cq2
que se expressa na diferena entre a receita e o custo da firma. Note que, como
esperado, a funo de ganho caracteriza o elemento de comportamento
estratgico.O ganho de cada firma determinado no s pela sua escolha - pela
quantidade que ela resolveu produzir - como tambm pela escolha da
concorrente.
Como dito anteriormente, no modelo de Cournot o problema das firmas
escolher quantidades simultaneamente, procurando maximizar seus respectivos
lucros. Tomemos o caso da firma 1 inicialmente. O seu problema :
de modo que as condies de primeira ordem do problema acima nos mostram
que
tal que, resolvendo,
o que nos d exatamente a melhor resposta que a firma 1 pode dar para toda
conjectura a respeito da produo da firma 2. Chamamos essa expresso de
funo de reao da firma 1 e colocamos o termo entre aspas pelo fato de se
tratar de um jogo de escolha simultnea: as firmas no esto reagindo
exatamente uma ao que elas observaram, mas sim uma ao esperada
da(s) concorrente(s). No entanto essa expectativa no tomada aleatoriamente,
mas assumindo que a .rma rival est operando tambm na
sua funo de reao correspondente.
Uma outra observao relevante diz respeito inclinao da .funo de
reao.. Observe que
o que nos mostra que a melhor reao que uma firma pode tomar em relao
variaes na oferta da concorrente seguir na direo contrria.
Procedendo da mesma forma para a firma 2, decorre (faa as contas) que
ser a .funo de reao. da firma 2, a melhor resposta que ela pode dar s
escolhas da rival. Uma vez que temos em mos as respectivas melhores
respostas das firmas, fica trivial determinar o equilbrio de Nash desse jogo: como
definimos anteriormente, esse dado pela interseo das melhores respostas.
Substituindo q2 (q1) em q1 (q2), fcil verificar que
q1 = (a - c)
de modo que o equilbrio de Nash desse jogo dado por
(q*1; q*2) = ( (a - c); (a - c))
Como qi [0; qi], conclumos que a < c. A oferta da indstria
e o preo de mercado
de modo que o lucro da firma 1 seria
Analogamente,
2=
Por fim note que as hipteses utilizadas de que h apenas duas firmas com
estruturas de custos idnticos produzindo so apenas para simplificar a nossa
anlise. Na verdade, no h problemas algum em relax-las. Mostraremos abaixo
o caso onde existem n oligopolistas e manteremos a hiptese de custos marginais
iguais entre as firmas, apenas para obter um resultado de comparao mais fcil
com o caso inicial, com duas firmas. Resolva como exerccio o duoplio de
Cournot onde, por exemplo, o custo marginal das duas firmas se diferem,
comparando os resultados com os obtidos acima.
Utilizando a mesma estrutura anterior, teremos certamente quantidades
produzidas idnticas para todas as n firmas, uma vez que suas estruturas de
custos so as mesmas, o que de resto vai caracterizar um equilbrio simtrico.
Segue o problema de uma firma i qualquer
de modo que as CPO.s nos mostram que
A .funo de reao do jogador i dada por
onde, notemos, ; a funo de reao, como usual em
Cournot, tem inclinao negativa. Nesse ambiente, com bens homogneos e
tecnologias similares (funo custo), a implicao imediata de um equilbrio
simtrico que, em equilbrio, q1 = q2 = ::: = qn, de modo que
Segue que a expresso acima fica
Logo, em equilbrio,
O equilbrio de Nash desse jogo portanto cada firma produzir (a - c). A
oferta da indstria e o preo do produto sero, respectivamente,
.
Segue que o lucro da i-sima firma em equilbrio ser
Se n , ento podemos verificar (L.Hopital) que a oferta da indstria e o preo
sero, respectivamente,
e o lucro de equilbrio
i = 0, i = 1; 2; :::; n
caracterizando um equilbrio em competio perfeita (veri.que). Se n = 1, ento
como esperaramos em um monoplio.
Dito de outra maneira, quanto maior for o nmero de firmas do mercado, n,
menor ser a produo de cada firma. Particularmente, se existirem apenas duas
firmas, voltaramos ao caso anterior, como mostramos. Por outro lado, se n tende
a infinito, a produo tende a zero, denotando o reduzido espao que cada uma
teria no mercado. Note por fim que o resultado acima nos d outra interpretao
genrica para esse ambiente: se a estrutura da indstria for um duoplio, o
mercado corresponder a apenas 2/3 do mercado de concorrncia perfeita. Para
uma indstria com 3 firmas, seria 3/4. Para 4 firmas, 4/5 e assim sucessivamente
dado pelo termo .
'ligop(lio de Bertrand
Betrand (1883): como Cournot, trata-se de um jogo de escolha simultnea
e de informao completa, mas aqui as firmas competem entre si via
escolha de preo, no de quantidade.
Hipteses:
- duas firmas, 1 e 2, que produzem um bem homogneo.
- custo fixo nulo e o custo marginal constante e idntico para ambas as
firmas, c > 0.
- assuma uma curva de demanda linear (para compararmos com Cournot) no
produto total
Q = a p
onde p o preo de mercado.
as firmas declaram simultaneamente os preos e se dispem a ofertar tudo
o que for demandado queles preos.
- os consumidores compram da firma que cobra mais barato: segue que a firma
anuncia o menor preo detm todo o mercado enquanto a outra firma fica
forma do mercado.
- se ambas as firmas declaram o mesmo preo, ento elas dividem o mercado
igualmente, cada uma com metade.
o lucro de cada firma, como habitual, depende no apenas de sua prpria
escolha mas tambm afetado pela escolha da rival. Tome o caso da firma
1, por exemplo, seu lucro ser
- note que o lucro de 1 positivo se p1 > c. Alm disso, ele ser tanto maior se
seu preo for menor do que o da rival e apenas a metade se for igual. Por fim o
lucro nunca ser negativo na medida em que cada firma tem a prerrogativa de
cobrar um preo igual ao custo marginal e assegurar lucro 0 na pior das
hipteses.
- como a situao a mesma para a firma 2, vamos restringir nossa ateno para
preos tais que
pi < c, i = 1; 2
qual o equilbrio de Nash desse mercado?
- paradoxo de Bertrand: o nico equilbrio de Nash ser ambas as firmas
cobrarem um preo igual ao custo marginal e ambas terem lucro zero.
- como a funo lucro descontnua, ns no podemos mostrar esse resultado
pelos argumentos padres, diferenciando e resolvendo as condies de primeira
ordem.
- ento, o que fazer???
observe que a firma com o menor preo detm todo o mercado. Segue que
cada firma tem um incentivo a anunciar um preo menor do que o da rival.
Em ltima instncia, isso direcionar o preo de equilbrio para baixo, at o
custo marginal.
Vejamos agora o argumento formal para isso.
1. note que um equilbrio de Nash do jogo cada firma cobrar o custo marginal:
nesse caso cada firma tem metade do mercado e aufere lucro zero porque cada
unidade vendida ao seu custo de produo.
- porque um equilbrio? Se ela elevar seu preo, ela perder toda a demanda
que tinha posto que o preo da rival ser estritamente menor! nenhuma firma tem
incentivos a desviar.
- segue que no possvel que nenhuma firma tenha lucro maior do que zero, de
modo que a escolha de preo de cada firma tima dada a escolha alheia
(melhor resposta).
2. agora vamos mostrar que no h outro equilbrio de Nash. Como cada firma
i = 1; 2 escolhe pi < c, suficiente mostrar que no h equilbrio para pi > c.
Ento, deixe (p1; p2) ser um equilbrio.
- se p1 > c, ento porque p2 maximiza o lucro de 2 dada a escolha de 1, teremos
p2 C (c; p1], de modo a ter um lucro estritamente positivo fora desse intervalo
seria nulo.
- alm disso, p1 p2, pois se firma 2 pode ter lucro positivo escolhendo p2 = p1 e
dividindo o mercado com 1, ela pode ter um lucro maior ainda cobrando um preo
um pouco abaixo de p1 e desfrutando de todo mercado quase ao mesmo preo.
Logo
p1 > c p2 > c e p2 < p1
- mas para uma estria similar para as firmas com os papis trocados
p2 > c p1 > c e p1 < p2
de modo que se o preo de uma firma est acima do custo marginal, ambos os
preo devem estar acima do custo marginal e cada firma deve anunciar um preo
um pouco menor do que a rival, o que impossvel.
no modelo de Bertrand, o preo ser igual ao custo marginal com apenas
duas firmas. sso est em forte contraste com o que ocorre em Cournot,
onde a diferena entre o preo e o custo marginal cai apenas na medida
em que o nmero de firmas no mercado aumenta.
Parte Jogos Dinmicos com nformao Completa
Na parte , consideramos situaes nas quais os jogadores se moviam
"simultaneamente , isto , sem saber quais eram os movimentos dos outros
participantes do jogo. Na parte , analisamos jogos nos quais os jogadores se
movimentam em uma sequncia fixa . Em tais jogos dinmicos , os jogadores que
se movem mais tarde sabem quais movimentos os demais fizeram antes deles.
Os que se movem mais ced0 devem levar isso em conta quando projetam a sua
estratgia tima. Um exemplo bem conhecido de jogo dinmico o xadrez. sso
deve servir como uma advertncia de que prever comportamento em jogos
dinmicos nem sempre direto. Muitas vezes a barganha por um contrato de
trabalho ou por um carro novo desenvolve-se com ofertas e contraofertas
seqenciais . Decidir onde comprar uma casa muitas vezes depende de quem
tomou a deciso de morar em um bairro antes e quem se pode esperar que se
mudar pra l . Por conseqncia, esse tambm um jogo dinmico.
A questo central nos jogos dinmicos diz respeito credibilidade das
ameaas e promessas dos agentes. s vezes, por exemplo, pode ser timo saber
que o outro jogador observa sua atitude antes de tomar suas decises.
Ns representamos os jogos at agora apenas pela forma normal (ou
estratgica). Veremos, entretanto, que h uma outra forma de representao: a
forma extensiva, uma forma mais detalhada do que a forma normal. Segue da
que um jogo na forma extensiva em geral sofre perdas de informao quando o
passamos para a forma normal, enquanto o inverso nem sempre possvel de se
fazer. Nos jogos estticos, no h problemas em trat-lo apenas na forma
estratgica, sendo inclusive mais conveniente. Todavia, isso com certeza
ocorreria nos jogos dinmicos. Por isso, os abordaremos utilizando a forma
extensiva.
Um jogo (de informao completa e perfeita) na forma extensiva nos d as
seguintes informaes:
quais so os jogadores participantes,
quais so as aes possveis para cada jogador em cada vez em que ele
for chamado a decidir,
a ordenao do jogo: quem age e quando,
toda a histria pregressa do jogo quando cada jogador tem de tomar uma
deciso,
os payoffs dos jogadores para cada conjunto possvel de aes que
tenham sido tomadas, at o final do jogo.
Exemplo
Na figura acima temos a representao de um jogo na forma extensiva. Por
conveno (mas, novamente, nem sempre) o jogador 1 (j.1) o primeiro a jogar.
Esse ponto dito "n inicial"e nico, no sentido a ficar claro ao longo do texto.
Esse jogador pode jogar duas estratgias, ou e ou d. Diferentemente de jogos
estticos, agora o jogador 2 observa a escolha de 1 e s ento faz a sua escolha.
Ele tambm ou joga e ou joga d. No entanto fundamental dizer que em jogos
dinmicos a noo de estratgia (e de conjunto de estratgias) de um jogador
mais complexa do que a mesma noo em jogos de escolha simultnea. Aqui
uma estratgia deve ser vista como "um plano completo de ao", deve
especificar para o jogador em questo as suas possibilidades de ao
contingentes todas as aes possveis dos jogadores que jogaram antes dele.
No jogo acima, por exemplo, o espao de estratgias do jogador 2
Uma vez que os jogadores 1 e 2 fizeram as suas escolhas, o payoffs so
dados pelos nmeros situados aps os ltimos ns de deciso, ditos ns
terminais. Por conveno, o primeiro nmero se refere ao payoffs do jogador que
jogou primeiro, o segundo nmero ao payoff do jogador que jogou em segundo
lugar e assim sucessivamente no caso de jogos com mais de dois jogadores.
Logo, lendo o jogo acima na forma extensiva, temos
1. os jogadores: 1 e 2,
2. os espaos de estratgias, S1 = fe; dg e S2 como acima exposto,
3. a ordenao: 1 joga primeiro, 2 observa a escolha de 1 e ento faz a sua
escolha,
4. a histria pregressa do jogo: quando 2 chamado a jogar ele sabe
inequivocadamente qual foi a escolha de 1,
5. os payoffs: os ganhos dos jogadores para toda combinao possvel de
escolhas dos jogadores.
Note ento que a representao na forma extensiva apresenta todas as
caractersticas destacadas acima. Ela possui em geral (mas nem sempre, como
veremos em exemplos abaixo) o formato de "rvores crescendo para baixo E a
ttulo de curiosidade - discutiremos isso logo - o resultado desse jogo ser "o
jogador 1 jogar d e o jogador 2 jogar e se 1 jogou e, jogar d se 1 jogou d". Os
payoffs sero (4; 1).
*ndu+,o Retroativa: jogos de informa+,o -ompleta e perfeita
Os jogos de informao completa e perfeita podem ser sintetizados da
seguinte forma (para o caso de dois jogadores; com mais de dois, no h
mudana significativa):
1. o jogador 1 escolhe uma ao entre as suas possibilidades delimitadas pelo
conjunto de possibilidades de estratgias,
2. o jogador 2 observa a escolha do jogador 1 e ento escolhe uma ao no seu
conjunto de estratgias factveis, que agora depende da ao que o jogador 1
tomou,
3. o jogo termina e os payoffs cada jogador so determinados em funo da sua
escolha e tambm do elemento de interao estratgica, a escolha do outro
jogador.
Essa definio simples segue a apresentao de Gibbons (1992), mas
pode ser muito ampliada. Alm da possibilidade de existncia de mais de dois
jogadores, poderia ocorrer que dentro de um mesmo jogo um ou mais jogadores
pudessem vir a jogar mais de uma vez. Alm de diversas situaes mais
relevantes, inclusive de natureza econmica, mesmo outras mais simples se
adaptariam claramente a esses casos. Pense, por exemplo, na maior parte dos
jogos de cartas ou de tabuleiros: em geral, jogam de duas a seis pessoas, uma
aps a outra, com aes tomadas um grande nmero de vezes durante o jogo.
Normalmente, pelo menos a maioria deles pode ser analisada como
jogos dinmicos de informao perfeita e completa.
A forma de se resolver situaes dessa natureza a descrita a seguir.
Assim como em jogos estticos, solucionar jogos dinmicos tambm um
exerccio de previso em que o analista busca antever o comportamento dos
jogadores envolvidos tendo em mente algumas premissas sobre a postura geral
dos jogadores. Mas se antes os jogadores consideravam estratgias que fossem
racionalizveis apenas, agora eles tm de trabalhar com estratgias que sejam
sequencialmente racionais. sto , aquelas que no envolvam
promessas/ameaas no crveis (como a do sequestrador que ameaa explodir a
granada e se matar).
Defini+,o - Uma estratgia que seja sequencialmente racional deve prescrever
formas de agir que sejam racionais em cada ponto de deciso que o jogador
possa estar. Ou seja, o jogador no joga apenas estratgias racionalizveis, ele
jogar estratgias racionalizveis sempre que for chamado a jogar. Ou seja, caso
o jogador esteja em determinado ponto na rvore de deciso, ele deve ter
estratgias que so timas a partir da, dadas as possveis estratgias e escolhas
futuras dos outros jogadores.
Trabalhando inicialmente apenas com o exemplo mais simples de jogos de
informao perfeita e completa dado acima (com apenas dois jogadores fazendo
uma escolha cada um durante o desenrolar do jogo), o procedimento que
adotamos para resolv-lo dito induo retroativa ("backward induction") e
descrito da seguinte forma. Comeamos sempre pelo final do jogo, analisando o
jogador que joga por ltimo, no caso o jogador 2. Esse jogador j observou a
escolha do jogador 1 e deve escolher uma estratgia tal que, condicional
escolha de 1, lhe d o maior payoff possvel. O jogador 2 faz ento a sua escolha.
Passamos a seguir para a anlise do problema de escolha do jogador 1. O
fundamental aqui entender que, como se trata de um ambiente de informao
completa, o jogador 1 tambm sabe qual ser a melhor atitude que o jogador 2
pode tomar para cada escolha que ele, jogador 1, venha a fazer. O jogador 1, por
isso, no escolher aleatoriamente sua estratgia ficando, depois, "torcendo para
que o outro jogador faa algo que tambm seja favorvel a ele. Na verdade, no
momento de fazer a opo da melhor estratgia a se tomar ele j considerar
que, dependendo do que ele escolher, isso afetar a escolha do jogador 2 e esse
pensar apenas no seu prprio bem-estar no momento de definir sua estratgia.
Procedendo assim, e dado que a forma de resposta do jogador 2 dada pela sua
escolha condicional deciso de 1, o seu problema o problema de escolher
uma estratgia que lhe d o maior payoff possvel dado que o jogador 2 reagir
de forma tima sua tomada de deciso. Da soluo desse conjunto de tomadas
de deciso, do jogador 1 e do jogador 2, teremos um (ou mais) par de estratgias
que caracterizar o resultado de induo retroativa desse jogo. Esse
resultado elimina qualquer tipo de ameaa ou promessa que no sejam crveis,
pois o jogador 1 antecipa o que o jogador 2 far em cada uma das situaes
possveis, buscando o seu prprio bem-estar. Assim, jogador 1 no acredita em
eventuais ameaas que possam ser feitas pelo jogador 2 e que incorporem
atitudes desse ltimo que no sejam timas para ele mesmo, uma vez que o
jogador 1 j fez a sua ao.
Exemplo1
Qual o resultado de induo retroativa do jogo acima? Vejamos o que o jogador 2
deve fazer em cada uma das situaes possveis:
se o jogador 1 joga e, o jogador 2 deve jogar e tambm e obter payoff de 3
unidades (dando 1 para o jogador 1), pois a alternativa seria obter apenas
2 unidades, caso escolhesse d.
se o jogador 1 joga d, o jogador 2 deve tambm jogar d e obter payoff de 1
unidade (gerando 2 para o jogador 1), prefervel a zero, que o que seria
obtido se nesse caso ele escolhesse e.
Como o jogador 1 antecipa isso perfeitamente, ele sabe que as opes
efetivamente alcanveis so apenas (e; e) e (d; d). Diante disso, ir jogar d e
assim garantir utilidade de 2 unidades. O resultado de induo retroativa ,
portanto, (d; jogar d dado que 1 jogou d).
Note, por outro lado, que esse resultado est longe de constituir algo prximo
do que se poderia denominar .socialmente timo., eficiente ou afim. Se ele fosse,
por exemplo, (e; d), ambos os jogadores estariam melhor. Sendo assim, por que
no sugerir um acordo entre os jogadores que possa levar a esse resultado?
Porque o jogador 1 sabe que, uma vez que ele cumprisse sua parte no acordo, o
jogador 2 no teria incentivos em mant-lo, pois poderia obter um payoff superior.
Ciente disso, o jogador 1 no se deixa levar por promessas como essas, por no
serem crveis. Da mesma forma, mesmo que o jogador 2 ameace jogar e, caso o
jogador 1 jogue d, esse ltimo sabe que tal ameaa tambm no crvel, e
portanto no a aceita. Tudo isso simples consequncia do pleno conhecimento
de racionalidade (sequencial) entre os jogadores. Nesse caso, no se requer
muito, bastando que ambos os indivduos sejam racionais e que o jogador 1 saiba
que o jogador 2 tambm o seja.
importante lembrar tambm que no necessrio que cada jogador jogue
apenas uma vez durante o jogo, como j comentamos antes. Cada um deles pode
ser chamado a escolher mais de uma vez, sendo que a lgica de resoluo no
se altera. Sempre se olhar inicialmente para o .m do jogo, destacando as
respostas timas em cada situao, e se encontrar o resultado de induo
retroativa tomando como base tais possibilidades.
Exemplo 2
Considere o tradicional jogo onde uma firma est instalada () em um mercado
enquanto monopolista e uma outra firma (E) est considerando entrar nesse
mercado. Ela escolhe entre entrar ou no. Caso entre, a antiga monopolista
escolhe entre lutar (fazer uma guerra de preos, por exemplo) ou acomodar-se
(constituir um duoplio, um mercado onde apenas duas firmas produzem).
Vejamos a forma extensiva deste jogo :
Na forma extensiva teramos:
1. os jogadores: as firmas E e ,
2. os espaos de estratgia:
SE = (fora, entra)
S = (luta se a firma E entra, acomoda se a firma E entra)
3. ordenao: a firma E decide se entra ou no, a firma observa a deciso de E e
ento decide se reage ou se acomoda,
4. a histria pregressa: , ao fazer sua escolha, sabe o que E jogou,
5. os payoffs.
O resultado por induo retroativa ser a firma E entrar no mercado e a
firma acomodar-se. sto porque, se E entra, o payoff de maior caso ela
acomode.
Como E sabe disso, ela ir entrar, apesar de uma eventual ameaa da
firma de lutar caso ela faa isso.
Podemos representar o jogo acima tambm na forma normal:
Nota-se, portanto, que h dois equilbrios de Nash no jogo acima: o
resultado por induo retroativa e o conjunto de estratgias onde E no entra e
luta se E entra. A questo central aqui que essa ltima ameaa no crvel e
portanto no deveria ser considerada. Temos, portanto, que o conceito de
equilbrio de Nash no elimina tais possibilidades, pois ele no incorpora a idia
de que as estratgias devem ser sequencialmente racionais. Apenas um equilbrio
de Nash no jogo acima pode ser obtido via induo retroativa e, portanto, apenas
esse equilbrio um resultado sequencialmente racional.
Um outro resultado muito importante na teoria de jogos dinmicos o
chamado Teorema de Zermelo. Ele nos diz que todo jogo finito de informao
perfeita possui um equilbrio de Nash em estratgias puras que pode ser obtido
via induo retroativa (e que ser, portanto, sequencialmente racional). Alm
disso, se nenhum jogador possui payoffs iguais em pontos terminais distintos,
ento existe apenas um equilbrio de Nash que pode ser derivado dessa forma.
Barganha se".en-ial
Barganha algum tipo de situao que encontramos corriqueiramente no
dia-a-dia.Observamos desde situaes muito simples, quando um filho
adolescente barganha com o pai o horrio que ele pode chegar em casa nas
noites de sexta-feira e sbado, em que ele prope chegar mais tarde em troca de
algum tempo a mais de estudo dirio, at situaes complexas, em que
presidirios barganham com os representantes do Estado o fim de uma rebelio,
ou pases que barganham tarifas comerciais sobre o conjunto de produtos que
eles comercializam. Na verdade, exemplos de situaes de barganha so
extremamente fceis de encontrar e ns de fato nos deparamos com tais
situaes em todos os momentos - ainda que no tenhamos em mente que tal
caso especfico possa ser analisado teoricamente como um jogo dinmico de
informao completa.
O processo de barganha geralmente interpretado como o processo de
construo de um acordo mtuo sobre a proviso de um contrato. No mundo real,
o prottipo bsico a negociao entre um vendedor e um comprador sobre um
bem em troca de dinheiro: o contrato especifica o preo a ser pago pelo tem. Em
uma negociao salarial, por exemplo, o sindicato o vendedor, a firma o
comprador e o preo o salrio-base.
Tanto em contextos econmicos quanto legais, um acordo pode ser
retardado na medida em que as partes prolonguem a negociao. Eventualmente
pode acontecer de as partes interessadas nunca chegarem a um acordo. Via de
regra esse atraso implica em algum tipo de custo s partes interessadas: um
custo de oportunidade da negociao, ou seja, dos ganhos que cada parte
poderia estar obtendo se o acordo j tivesse sido fechado, e um custo pecunirio
inerentes negociao, como por exemplo custos processuais. Esses custos de
oportunidade podem ser representados pela produo que no se realizou e os
custos pecunirios pelos gastos com a intermediao do acordo. Tais custos
podem ser significativos em casos importantes, como aquisies corporativas,
greves patrocinadas por sindicatos de trabalhadores e em diversos litgios civis.
Se no se chega a um acordo, ento em algum perodo de tempo as partes
param de barganhar, como no caso em que comprador e vendedor buscam
parceiros alternativos para fazer seus negcios. Nesse caso, se pensarmos no
contexto legal, uma corte impe alguma regra que as partes devem seguir. Nesse
sentido, essas cortes legais so um exemplo de resoluo judicial de impasses.
No que se segue vamos analisar o modelo terico de barganha tendo como
pano de fundo um processo de negociao entre um sindicato de trabalhadores e
uma entidade patronal, representante das empresas na quais esses trabalhadores
so funcionrios. No custa uma palavra de precauo aqui: como em todo
modelo terico, essa representao uma simplificao das negociaes que de
fato ocorrem no mundo real e nesse sentido no buscamos generalizar os
resultados que obtivermos para enriquecer a nossa compreenso de negociaes
como um todo, mas to somente entender esses
processos de negociaes como jogos dinmicos de informao completa.
O jogo se d como se segue. H, dois jogadores, 1 e 2, onde vamos
considerar que 1 representa uma associao patronal e que 2 representa um
sindicato de trabalhadores.
Eles esto a negociar sobre a diviso dos benefcios da produo de um
determinado perodo, um ano por exemplo. Esse benefcio de conhecimento
comum e, obviamente, sua totalidade soma 100%. A negociao se d entre as
partes de forma a decidir o percentual que cada um dos interessados tem direito
sobre essa totalidade. Ambas as associaes desejam obter o mximo possvel
para os seus associados e a dinmica da negociao se d do seguinte modo:
1. a associao patronal prope uma diviso;
2. o sindicato pode aceitar ou rejeitar a proposta: se o sindicato aceita, o jogo
termina e cada jogador obtm o acordado. Caso contrrio, ele no aceita, o jogo
continua;
3. o sindicato prope uma diviso;
4. a associao patronal pode aceitar ou rejeitar a proposta: se aceita o jogo
termina e cada parte recebe o combinado. Se rejeita a proposta, ento a Justia
do Trabalho impem uma diviso de 50% para cada uma das partes e o jogo
tambm termina.
necessrio algum tempo para preparar cada proposta e contra proposta.
Por isso, se o acordo for fechado em 2, ento os jogadores tm 1 (100%) para
repartir. Se terminar com a associao patronal aceitando a proposta no quaem 4,
os benefcios sero apenas de (0; 1); e se a barganha terminar com a
interveno da Justia, ento os benefcios so apenas de . Esse termo
dito taxa de desconto intertemporal e reflete o fato de que as pessoas (e
instituies) avaliam de maneira distinta uma mesma quantia monetria em
diferentes perodos de tempo, captando portanto o custo de oportunidade acima
discutido. Ou seja, reflete o custo de oportunidade de no receber o valor
imediatamente. Em geral essa taxa de desconto determinada pela taxa de juros
da seguinte forma,
onde r a taxa de juros de mercado. Observe que quanto maior r, menor a taxa
de desconto, de forma que os agentes estariam descontando com peso maior o
tempo. Observe ainda que essa taxa pode refletir caractersiticas especficas das
partes engajadas na barganha. magine por exemplo o custo de uma greve seja
maior para uma das partes. Ou que um trabalhador especfico assumiu
compromissos tais com sua renda que uma paralisao no seu fluxo de renda
nesse perodo especfico pode lhe ser particularmente custosa. Para facilitar a
nossa anlise e sem perda de generalidade, vamos considerar que ambas as
partes tm a mesma taxa de desconto.
Logo h dois jogadores (1 e 2), as estratgias so as descritas na rvore,
assim como a ordenao e os payoffs. Como trata-se de um ambiente de
memria perfeita, os movimentos dos jogadores em cada n de deciso de
conhecimento comum em cada um desses ns.
Sendo mais especfico, observe o que acontece no primeiro movimento: o
jogador 1 diz ao jogador 2 que do total que eles esto barganhando, ele quer x C
[0; 1], ou x%, de forma que ele est oferecendo a 2 (1 - x)%. Como dito, 2 pode
ou no aceitar. Se aceita a barganha termina e os ganhos so dados. Caso
contrrio 2 faz a contraproposta ao jogador 1: do total a ser dividido, ele que (1 -
y)%, de modo que oferece a 1 y%.
Da mesma forma o jogador 1 pode aceitar ou rejeitar. Se 1 aceita o jogo
termina e os ganhos so dados. Note porm que agora j estamos no segundo
estgio do jogo, de forma que as partes j incorreram em algum custo decorrente
do fato de que elas no chegaram a um acordo no primeiro perodo.
De
Pede-se:
1. Taxa de desconto intertemporal (j est feita em jogos repetidos, mas ter em
mente a questo da in.ao, taxa de juros, reputao e o exemplo do sorvete
derretendo).
2. Represente o jogo na sua forma extensiva.
Os payoffs so (x; 1 - x) no primeiro estgio, no
segundo estgio caso seja necessria a interveno da Justia
do Trabalho.
2. Quanto cada jogador vai obter em equilbrio perfeito.
Por induo retroativa, no segundo (e ltimo) estgio da barganha, o
sindicato oferece (y) aos empresrios, que aceitam se e somente se
Logo a proposta ser
e os ganhos nesse estgio seriam No
primeiro estgio do jogo os empresrios ofertam (1 - x) aos trabalhadores que
aceitam se e somente se
de modo que a oferta tima ser
e os ganhos
Logo o equilbrio de Nash perfeito em subjogos (o que nesse jogo equivale ao
resultado por induo retroativa) ser a associao patronal ofertar
aos trabalhadores no primeiro estgio, os trabalhadores
aceitarem a proposta feita, o jogo terminarbe os ganhos sero dados por
3. Se voc representasse os trabalhadores, voc preferiria fazer a proposta em
primeiro lugar ou ouvir primeiro a oferta dos empresrios?
A primeira coisa a ser feita representar o jogo na forma extensiva
supondobque o sindicato de trabalhadores faa a oferta em primeiro lugar,
no primeiro estgio. Nesse caso os payos seriam (1 - x; x) no primeiro
estgio, no segundo estgio e
caso fosse necessria a interveno da Justia do Trabalho. Resolvemos o jogo
da mesma maneira, de modo que no segundo estgio da barganha, os
empresrios oferecem (1 - y) aos trabalhadores, que aceitam se e somente se
Logo a proposta ser
e os ganhos nesse estgio seriam
No primeiro estgio do jogo os trabalhadores ofertam x aos empresrios. Estes
aceitam se e somente se
de modo que a oferta tima ser
e os ganhos seriam
Segue que o equilbrio de Nash perfeito em subjogos ser o sindicato dos
trabalhadores ofertar aos patres no primeiro estgio, os
empresrios aceitarem essa proposta o jogo terminar ali. Os ganhos seriam
dados por .
Note que os trabalhadores estaro melhor fazendo a oferta no primeiro estgio se
ou seja, se
o que sempre verdade para todo
!"uil#rio Perfeito em /u#jogos
At agora estudamos separadamente jogos dinmicos e jogos estticos.
Entretanto, bastante usual trabalharmos com jogos que tenham partes
simultneas e outras no simultneas, i.e., que tenham informao imperfeita em
pelo menos algum de seus estgios. A forma de resoluo segue a mesma lgica
anterior: comear de trs para diante at chegarmos no incio do jogo. Entretanto,
sempre quando nos depararmos com um "mini-jogo com lances simultneos (ou,
no mesmo sentido, que tenha informao imperfeita), devemos resolv-lo como
visto anterioriormente e ento tomarmos seu resultado (o equilbrio de Nash
encontrado) como os payoffs a serem distribudos caso o jogo atinja essa parte
simultnea. Vamos a uma definio:
Um subjogo de um jogo J na forma extensiva um subconjunto do jogo
que tem as seguintes propriedades:
inicia-se em um ponto de deciso nico (no ligado a nenhum outro por
.linhas tracejadas.)
contm todos os pontos de deciso que o sucedem, e apenas esses
pontos;
no divide nenhum subjogo, no sentido de que se um determinado ponto
de deciso pertence a um subjogo, ento todo ponto ligado a ele por
alguma "linha tracejada, tambm pertence, i.e., os subjogos no cortam
tais linhas.
Vimos em geral que quando analisamos equilbrios de Nash de jogos em
forma extensiva estes podem conter muitos equilbrios. Muitos desses equilbrios
podem parecer no razoveis pois so baseados em ameaas inacreditveis.
Equilbrio de Subjogo Perfeito um refinamento de equilbrio de Nash que no
permite ameaas inacreditveis.
Induo Reversa
A tcnica mais comum para encontrar os equilbrios de subjogo perfeito de
um jogo finito F conhecida como induo re2ersa. ntuitivamente, temos que a
tcnica sugere que se comece pelo fim do jogo e v resolvendo at chegar ao
comeo do jogo. Podemos descrever mais formalmente esta tcnica nos
seguintes passos:
1. Seja 4 = 1 e F(4) = F.
2. Seja 5#1 o conjunto de todas as histrias que so antecessoras imediatas das
histrias terminais do jogo F(4). Para todo i * e 6 5#1 7 8i, o jogador i
enfrenta um problema de deciso aps histria 6, e portanto deve escolher a ao
que maximiza sua utilidade esperada. Se houver mais de uma ao que produza
a mesma utilidade esperada, existir um equilbrio de subjogo perfeito contendo
cada uma dessas aes. Escolha uma delas para ser a ao escolhida por i
segundo a estratgia s, isto , faa si(6) = a argma9:;6ui(6 < +:.). Passe ao
passo seguinte.
3. Defina o jogo F(4 + 1) da seguinte maneira:
(a) Para todo 6 5# 7(i *8i), substitua as aes em ;6 do jogo F(4), pelo
vetor de utilidades que corresponde a histria terminal atingida pela ao
escolhida no passo anterior. Passe ao passo seguinte.
(b) Para todo 6 5#1 7 (i*8i)c, isto uma histria imediatamente
antecessora a uma histria terminal do jogo F(4) onde chance se move, substitua
as aes em ;6, pelo vetor de utilidades que corresponde a utilidade esperada
dos jogadores de acordo com a distribuio de probabilidade que descreve as
probabilidades do jogador chance escolher cada uma das aes em ;6. Passe
ao passo seguinte.
4. Se o conjunto de todas as histrias de F(4+1) em que algum jogador i * se
move for vazio. Pare a iterao e temos que s um equilbrio de subjogo perfeito
em estratgias puras de F. Caso contrrio, passe ao passo seguinte.
5. Faa 4 = 4 + 1. Volte ao passo 2.
fcil ver que como o jogo finito, aps um nmero finito de iteraes o
algoritmo acima descrito produzir um equilbrio de subjogo perfeito em
estratgias puras. Desta forma, provamos construtivamente o seguinte teorema:
Teorema: =ual>uer jogo em forma e9tensi2a com informao perfeita finito tem
um e>uil?:rio de su:jogo perfeito puro.
0ogos Repetidos
Nesse tpico analisaremos novamente se ameaas e promessas em
relao ao futuro podem influenciar o comportamento atual dos agentes. Ao fazer
isso, buscamos mostrar o que muda em uma anlise de previso do resultado de
jogos quando esses so jogados mais de uma vez. Uma das principais idias a
de cooperao: ser possvel obt-la caso o jogo se repita? ntuitivamente,
poderamos pensar que sim, pois um jogador poderia cooperar "hoje para que os
outros cooperem com ele "amanh, e isso poderia valer para todos os
envolvidos. Deve-se, portanto, verificar quando e sob que condies essa intuio
de fato poder se manifestar na realidade.
Os jogos repetidos so divididos em dois grupos: aqueles repetidos um nmero
finito de vezes e aqueles repetidos "infinitamente. Em relao ao primeiro grupo,
a intuio fundamental pode ser apreendida apenas analisando-se o caso de
jogos repetidos duas vezes, o que iremos fazer a seguir.

0ogos repetidos finitos
A caracterstica fundamental dos jogos repetidos finitos que todos os
jogadores envolvidos sabem, antecipadamente, quantas vezes aquele jogo se
repetir. Pense, por exemplo, em um Congresso X de trs dias que ocorrer em
um determinado hotel. Existindo dois vendedores de pipoca naquela regio, eles
sabem que esse jogo (o mercado que vende pipocas na porta do hotel naqueles
dias com demanda especialmente ampliada) durar exatamente trs dias, e com
base nessa informao que definem suas estratgias. A questo a se verificar
o que muda no caso onde o jogo jogado apenas uma vez, como visto at agora,
e quando se repete um nmero especfico de vezes.
Como sempre, vamos iniciar a exposio atravs do um exemplo do
"dilema dos prisioneiros. Suponha ento que o jogo fosse jogado duas vezes,
sendo que, quando se reinicia o jogo, o resultado do primeiro estgio j
conhecimento comum. Os payoffs dos jogadores sero tidos como simplesmente
a soma dos payoffs nas duas vezes em que se joga.
Na forma de resoluo de jogos de tal natureza deve-se analisar de trs
para frente. No caso especfico citado acima, os jogadores, uma vez que se
iniciar a segunda rodada do dilema dos prisioneiros, sabem que o resultado do
primeiro estgio j foi consolidado e, portanto, no tm mais como mud-lo.
Sendo assim, eles se preocupam apenas com o que vir, ou seja, a segunda
rodada do jogo em questo. Pensando dessa forma, o que eles iro fazer no
segundo estgio do jogo? ro proceder como fariam se o jogo fosse jogado
apenas uma vez (pois, afinal, o que ocorreu na primeira rodada no poder mais
ser mudado): como ambos tm uma estratgia dominante, que confessar, a
jogaro na segunda vez.
Como dito acima, a idia por trs dos jogos repetidos que, como ele ser
jogado mais de uma vez, pode ser que valha a pena cooperar no incio para que o
outro tambm coopere com voc nos estgios subsequentes. Todavia, perceba
que uma vez que se saiba que se alcanou o ltimo estgio do jogo, ningum
mais ir cooperar, pois no mais se necessitar que o outro tambm coopere no
futuro, uma vez que o futuro, para tal jogo, no existir - pois aquela a ltima
rodada. Portanto, podemos concluir que:
&:ser2ao @m um jogo repetido um nAmero finito de 2e$es, onde os payoffs
dos jogadores so a soma dos payoffs o:tidos em cada 2e$ >ue o jogo
repetido, na Altima rodada serB jogado um *as6 do jogo no repetido em
>uesto, ainda >ue e9ista uma com:inao de estratgias >ue d payoffs
maiores para todos os jogadores mas >ue no seja em e>uil?:rio de *as6. @sta
seria ating?2el apenas 2ia cooperao, mas essa no e9istirB na Altima 2e$ em
>ue o jogo repetido.
No dilema dos prisioneiros jogado duas vezes, no primeiro estgio, os
jogadores, portanto, sabem que na rodada seguinte ambos iro confessar e,
assim, obter um payoff de -6 cada. Eles podem ento pensar o jogo repetido duas
vezes apenas como o jogo em seu primeiro estgio acrescido de -6 para ambos
nos payoffs referentes a todos os resultados possveis, uma vez que eles
antecipam que esse ser o ganho de cada um na ltima rodada. O jogo original ,
portanto, encarado como se fosse o seguinte:
O que se fez acima foi simplesmente adicionar .6.em todos os payos
possveis de todos os jogadores. Visualizando esse jogo, eles devem ento
novamente confessar, dado que essa permanece sendo uma estratgia
dominante para ambos. Conclui-se que o resultado do dilema dos prisioneiros
repetido duas vezes ser os dois jogadores confessarem em todas elas. A
cooperao no pode, portanto, ser atingida em nenhum estgio, ainda que
houvesse a promessa de um deles de que iria cooperar na primeira vez, por
exemplo. Ainda assim o outro no cooperaria, porque ele saberia que, agindo
assim, uma vez que o resultado do primeiro estgio emergisse, no segundo
ningum iria cooperar. E ento no cooperar no primeiro daria um payoff total
superior a ele, independente do que o outro fizesse, sendo, pois, uma estratgia
dominante. Essas concluses permanecem inalteradas mesmo se mudssemos
apenas o nmero de vezes em que o jogo repetido. sto , o resultado vlido
mesmo para o "dilema - ou qualquer outro jogo de informao completa - jogado
n vezes, sendo n um nmero finito. magine que ele fosse repetido quatro vezes.
Na ltima ningum cooperaria, pois no haveria um "futuro para o jogo que
justificasse essa atitude. Na penltima rodada, tambm ningum cooperaria,
porque todos saberiam que na ltima no haveria cooperao. O mesmo
ocorreria na segunda rodada: cooperar para qu, dado que na terceira e na
quarta ningum o far? Na primeira, o mesmo raciocnio se manteria. O resultado
geral pode ser apresentado da seguinte maneira:
Observao Definindo um jogo repetido T vezes como J (T), sendo J o jogo si-
multneo de informao completa que repetido e tendo que, quando se reinicia
um estgio de J (T), todos sabem quais so os resultados dos estgios anteriores;
e definindo-se os payoffs dos jogadores como simplesmente a soma dos payoffs
obtidos nos T estgios de J (T), se cada um dos estgios (J) de J (T) possui um
equilbrio de Nash nico, J (T) possui um nico ENPS, qual seja, o equilbrio de
Nash de J em todo estgio de J (T). Se o jogo J dinmico (mas tambm com
informao completa) e possui um nico ENPS, o ENPS do jogo repetido, J (T)47,
ser tambm o ENPS de J em cada estgio. Em suma, se um jogo com apenas
um Nash - ou ENPS - (e com informao completa, como todos os que vimos at
agora) for repetido um nmero finito de vezes, o ENPS
do jogo repetido ser o equilbrio de Nash - ou ENPS - sendo jogado em todos os
seus estgios - desde que os payoffs do jogo repetido seja apenas a soma dos
payoffs obtidos em cada estgio.
Apesar do resultado "desanimador visto acima, de que mesmo se o jogo
for repetido n vezes a cooperao no ser atingida em nenhum estgio - dadas
nossas hipteses adicionais -, um caso diferente emerge se existem mais de um
Nash no jogo que ser jogado mais de uma vez.
Parte Jogos com resultados incertos
Todos os jogos que analisamos at aqui eram determinsticos. sso
significa que todos os jogadores sabem com certeza o resultado de qualquer perfil
de estratgia. claro que o mundo muito mais complicado do que isso.
Empresas nunca sabem exatamente quanto vendero a mais quando reduzem
seus preos. Negociadores de sindicatos de trabalhadores nunca sabem ao certo
quais contratos sero aceitos por seus afiliados. Operadores de bolsas de valores
no sabem o valor de liquidao de todas as empresas cujas aes negociam .
Nesta parte mostraremos como incorporar incerteza em um jogo.
Ou seja, quando um jogador escolhe entre suas estratgias, ele no sabe
quais estratgias os outros jogadores escolheram, por isso no tem certeza
quanto s consequncias de suas escolhas. Para analisar as decises dos
jogadores em um jogo, seria til ento ter uma teoria de tomada de deciso que
nos permita expressar as preferncias de um agente sobre escolhas com
consequncias incertas em termos de sua atitude perante as consequncias.
Existem muitas regras de deciso que podem ser adotadas dependendo da
situao por um agente que tem que realizar uma escolha sob incerteza.
Assumiremos que o agente escolhe aes que so funes do estado da
natureza para consequncias ou prmios e que o agente capaz de determinar
qual a utilidade dessas consequncias, onde um estado da natureza uma
descrio de todos os aspectos do mundo relevantes ao problema de deciso.
Algumas regras requerem que o agente seja capaz de determinar uma
probabilidade sobre o espao dos estados da natureza, outras no precisam
desta descrio probabilstica e podem ser usadas em casos onde tal informao
no disponvel ao agente.
Teoria da Utilidade !sperada
A Teoria da Utilidade ou Teoria da Preferncia surge como um mtodo de
anlise de investimentos capaz de considerar as preferncias individuais dos
decisores em relao ao risco. Esta importante ferramenta deve ser sempre
aplicada em situaes onde esto envolvidos riscos e incertezas. A grande
vantagem da Teoria da Utilidade que sua aplicao possvel no apenas em
anlises de decises que envolvam resultados quantitativos, mas tambm
qualitativos. A quantificao realizada pela associao de um valor abstrato de
utilidade para cada uma das situaes possveis. Portanto, um evento que no
tem correspondente numrico ou monetrio pode ser transformado em valores de
utilidade.
A primeira apresentao de utilidade como unidade para medir
preferncias foi realizada por Daniel Benoulli em um artigo publicado em 1738, no
qual esto descritas idias bsicas como: quantificao do quanto gostamos mais
de um bem do que de outro, e quanto maior quantidade temos de algo, menos
estamos dispostos a pagar mais por ele. No entanto, o grande marco na Teoria da
Utilidade foi a publicao de Theory of games and economic behaviour por John
von Neumann e Oskar Morgenstern em 1944, quando houve a associao da
Teoria da Utilidade com a Teoria da Deciso e a Teoria dos Jogos.
Prefer1n-ia ao Ris-o
O nvel de averso ao risco de determinada empresa pode ser definido
atravs de entrevistas, visando determinao da utilidade que cada valor
monetrio representa para os tomadores de deciso. Ela fundamental para
modelarmos a melhor deciso a ser tomada pelos gerentes, atravs da definio
dos projetos a serem priorizados em um ambiente de recursos limitados.
Durante as entrevistas, deve ficar claro ao tomador de deciso que o
analista deseja conhecer suas reais preferncias e esperanas, e que isso
fundamental para o sucesso do processo. Deve haver cincia de que no existem
utilidades corretas ou incorretas, mas utilidades que representem realmente os
sentimentos subjetivos do indivduo.
Normalmente, os investidores buscam oportunidades de negcio com
maior retorno esperado diante de um mesmo risco ou de menor risco, quando
apresentam o mesmo retorno. Portanto, este o comportamento racional no
mundo dos negcios, onde empresrios sempre procuram maximizar o retorno
esperado e minimizar o risco do empreendimento.
No entanto, a situao crtica a que se tem que decidir entre um investimento de
elevado retorno monetrio, mas alto risco e um de menor retorno, porm de baixo
risco. E, na realidade, so estes os tipos de decises de investimento que
definem o sucesso ou o fracasso da maioria dos empresrios. Portanto,
focaremos nossa anlise no comportamento dos gerentes em situaes onde eles
devem ponderar suas preferncias individuais e subjetivas entre o retorno e o
risco dos projetos.
Este tipo de ponderao bastante conhecido como "tradeoff entre risco e
retorno, e ocorre quando o investidor abre mo de um maior retorno para evitar
maior exposio ao risco ou d prioridade ao projeto mais atrativo
financeiramente apesar de seu elevado risco. O primeiro tipo de comportamento
tpico do gerente avesso ao risco, e o segundo caracteriza um indivduo propenso
ao risco, ou seja, aquele que se arrisca sem temer o fracasso, colocando tudo a
perder, pois sempre acredita que alcanar o atraente resultado de sucesso.
Dessa forma, este novo modelo decisrio ser capaz de determinar a melhor
estratgia a ser tomada levando em considerao a disposio do investidor em
assumir riscos.
Por fim, o ltimo tipo de indivduo o indiferente ao risco, que baseia suas
decises apenas no critrio de maximizao do valor monetrio esperado, sem
considerar sua limitao de recursos.
Abaixo esto ilustradas as funes-utilidade dos trs tipos de
comportamento frente ao risco.
A partir de agora iremos concentrar nossa discusso em como se define a
utilidade de cada valor monetrio para os tomadores de deciso.
2un+,o-Utilidade
A forma mais conveniente de expressar a preferncia de um indivduo ao
risco atravs da construo de sua funo-utilidade, tambm conhecida como
funo de preferncia. Conforme apresentado na Figura , os mais variados
comportamentos dos indivduos frente ao risco so apresentados atravs dessas
funes
As funes-utilidade foram primeiramente definidas por Von Neumann,em
1953. Posteriormente, foram aprimoradas e desenvolvidas por vrios outros.
Elas podem ser determinadas analiticamente atravs do uso de funes
matemticas, que tm seus parmetros ajustados de modo a melhor se
adequarem ao comportamento da organizao. As mais usualmente aplicadas
so a linear, exponencial, logartmica e quadrada.

O coeficiente de averso ao risco est sempre presente nas funes-utilidade.
Trata-se de um valor individualizado e nico para cada empresa, que reflete
quantitativamente seu comportamento mais ou menos avesso ao risco. Ele
inversamente proporcional tolerncia ao risco:
A funo-utilidade exponencial a mais aplicada devido facilidade de
modelagem do coeficiente de averso ao risco, que coincide exatamente com o
parmetro c da funo, como pode ser verificado pela formulao:
Essas funes so obtidas atravs da definio da utilidade para o tomador
de deciso de cada um dos possveis resultados do evento incerto. Como no
poderia ser diferente, o melhor resultado tem mxima utilidade e o pior, mnima.
A utilidade um valor abstrato que serve para quantificar o quo desejvel
cada uma das ocorrncias para determinada pessoa. Portanto, flagrante o
elevado grau de subjetividade envolvido na definio das funes-utilidade. E, por
esta razo, elas so absolutamente especficas para determinada pessoa em
determinada situao, no podendo jamais serem extrapoladas para outro decisor
ou outro cenrio.
3alor !sperado da Utilidade
A melhor deciso a ser tomada definida com auxlio da funo utilidade
atravs do critrio de maximizao do Valor Esperado da Utilidade (VEU).
O Valor Esperado da Utilidade de um projeto dado por
Onde

VPL
s
Valor Presente Lquido do Sucesso; p
s
Probabilidade de Sucesso;
VPL
f
Valor Presente Lquido do Fracasso; e p
f
Probabilidade de Fracasso.
Assim como a metodologia do VME, a tomada de deciso atravs do Valor
Esperado da Utilidade (VEU) estabelece que o projeto deve ser aceito e
empreendido se apresentar um VEU positivo; do contrrio, deve ser abandonado.
Vamos resolver o mesmo exemplo ilustrado na Figura , s que, dessa vez,
atravs da maximizao do Valor Esperado da Utilidade (VEU) que,
diferentemente da resoluo anterior pelo critrio do VME, leva em considerao
a preferncia do decisor frente ao risco financeiro.
nicialmente, vamos obter junto ao tomador de deciso fictcio sua opinio
pessoal a respeito da utilidade de cada um dos resultados possveis nas duas
loterias oferecidas, considerando uma escala de utilidade de (-100) a 100:
Para a Loteria A:
U(R$ 1.200.000,00) = 80
U( - R$ 200.000,00) = -90
Para a Loteria B:
U(R$ 12,00) = 20
U( - R$ 2,00) = - 5
Vamos agora calcular o valor esperado da utilidade:
VEU
A
= 0,5(80)+0,5(-90) VEU
A
= -5
VEU
B
= 0,5(20)+0,5(-5) VEU
B
= 7,5
Portanto, o decisor, assim como a maioria dos brasileiros, nem se arriscaria
na Loteria A tem utilidade negativa , pois no seria capaz de suportar a perda
de R$ 200.000,00. A loteria de valores de menor vulto seria aceita, tendo utilidade
positiva para o indivduo.
Atravs deste exemplo fica ntida a vantagem de se utilizar a Teoria da
Utilidade como ferramenta de suporte tomada de deciso, que sempre se d de
maneira individual e subjetiva.
!"uivalente )erto
Outro conceito fundamental para a aplicao da Teoria da Utilidade o de
Equivalente Certo. Ele corresponde ao menor valor monetrio certo e seguro que
o investidor aceita para deixar de se aventurar em uma determinada situao
incerta, tambm conhecida como loteria.
O Equivalente Certo surge da comparao entre uma opo de
investimento incerto e arriscado, com possibilidade de perdas, e outra sem
incertezas ou risco, bastando colocar o dinheiro no bolso. Ento ele o valor
certo oferecido para o qual ficamos indiferentes entre receb-lo ou participar de
um determinado jogo.
No que diz respeito a um projeto em que estejam envolvidos riscos e
incertezas, o Equivalente Certo o valor mnimo que estaramos dispostos a
receber para nos desfazermos dele, ou seja, o valor justo de venda do projeto.
Em uma deciso de investimentos sob incertezas, podemos definir o
comportamento do indivduo frente ao risco atravs da comparao entre o
Equivalente Certo (EqC) e o Valor Monetrio Esperado (VME) do negcio.
Vejamos:
ndiferente ao Risco: EqC = VME
Propenso ao Risco: EqC > VME
Avesso ao Risco: EqC < VME
Alguns autores gostam de apresentar a averso ao risco como um temor
do desconhecido e incerto, um sentimento de estar fora do controle da situao.
Nesses casos de averso ao risco, a diferena entre o Valor Monetrio Esperado
e o Equivalente Certo do investidor chamada de "Prmio de Risco. Assim
sendo, o tomador de deciso ser recompensado com este prmio pelo risco de
perda ao decidir pela opo arriscada em detrimento ao ganho certo, dado pelo
EqC. De maneira anloga, seria o valor que o indivduo avesso ao risco abre mo
para se prevenir do risco de perder.
O melhor entendimento do que realmente o Equivalente Certo na prtica
ser possvel com o exemplo apresentado: Um milionrio excntrico prope a
referida Loteria , incluindo em seu jogo o risco financeiro de perdas. Ele lanar
uma moeda no viciada ao ar e, no caso de a face que estiver voltada para cima
ser cara, lhe paga R$ 1.200,00 e, se for coroa, lhe exige R$ 200,00. Qual seria o
mnimo valor monetrio certo que voc aceitaria dele para no entrar neste jogo?
Ou seja, qual o menor valor que o torna indiferente entre receb-lo com certeza
ou arriscar-se no jogo proposto pelo milionrio?
Ressaltemos que o milionrio far ofertas partindo de R$ 50,00, e
crescentes de forma aritmtica em R$ 50,00 at que o indivduo abordado aceite
o montante oferecido para abandonar a loteria.
Sabemos que o Valor Monetrio Esperado (VME) deste jogo de R$ 500,00.
No entanto, como j vimos anteriormente, o comportamento dos indivduos frente
ao risco muito varivel, e influenciado principalmente por suas capacidades
financeiras. O milionrio oferece a loteria a trs pessoas bem diferentes:
Maurcio: Engenheiro com renda mensal de R$ 2.000,00;
Alexandre: Presidente de uma corretora com renda mensal de R$ 40.000,00;
e
Joo: Assalariado com renda mensal de R$ 200,00.
Maurcio, que estava estacionando seu carro quando encontrou o
milionrio, usaria seu raciocnio lgico, tendo um comportamento frio, sem se
deixar levar muito pela emoo, frente a essa boa oportunidade de
complementao do oramento mensal. A perda de R$ 200,00 no seria bem-
vinda, mas em nada mudaria o rumo de sua vida. De forma que se portou de
forma indiferente ao risco e aceitou no jogar quando o milionrio lhe ofereceu R$
500,00 o Valor Monetrio Esperado da loteria.
Alexandre, que estava apressado nas ruas do centro da cidade quando
reencontrou um antigo amigo o milionrio excntrico , no pde perder muito
tempo com a loteria oferecida. No entanto, como comumente se arrisca em jogos
de azar

porque sempre acredita ser possvel ganhar o maior prmio, apostava que
iria conseguir os R$ 1.200,00, at porque passar aquele encontro perdendo
somente R$ 200,00 lhe faria pouca falta. Dessa forma, se comportou como
propenso ao risco e s aceitou deixar a loteria quando lhe foram oferecidos R$
700,00.
Joo tinha acabado de sacar da agncia bancria todo o seu salrio
quando foi abordado pelo milionrio excntrico. Ponderando bastante os efeitos
negativos da opo arriscada, percebeu que a perda dos R$ 200,00 seria trgica
para toda a sua famlia, cuja subsistncia no ms dependia de seus rendimentos.
Apesar da probabilidade de ganhar uma quantia maior ser a mesma da de perder
uma menor, as pessoas avessas ao risco temem mais a segunda situao do que
acreditam na primeira. Ele acabou tendo um comportamento avesso ao risco,
bastante comedido, aceitando abandonar o jogo quando a oferta alcanou R$
300,00, valor que representava o salrio de um ms e meio de trabalho duro.
O milionrio, que tinha por "hobby analisar o complexo comportamento
dos seres humanos em relao ao dinheiro, resolveu refinar um pouco seu jogo
pedindo para os trs participantes relacionarem utilidades, em uma escala
definida entre (-100) e 100, para cada um dos valores monetrios oferecidos.
Veremos como cada um dos trs considerou as utilidades para cada um dos
resultados:
Maurcio (EqC = R$ 500,00):
U
M
(R$1.200,00) = 30 e U
M
( - R$200,00) = -10.
VEU
M
= 0,5(30)+ 0,5(-10) VEU
M
= 10.
U
M
(EqC) = U
M
(R$500,00) = 10.
Alexandre (EqC = R$ 700,00):
U
A
(R$1.200,00) = 10 e U
A
( - R$200,00) = -2.
VEU
A
= 0,5(10)+ 0,5(-2) VEU
A
= 4.
U
A
(EqC) = U
A
(R$700,00) = 4.
Joo (EqC = R$ 300,00):
U
J
(R$1.200,00) = 90 e U
J
(- R$200,00) = -50.
VEU
J
= 0,5(90)+ 0,5(-50) VEU
J
= 20.
U
J
(EqC) = U
J
(R$300,00) = 20.
Apresentamos plotada na Figura a funo-utilidade de cada um dos trs
participantes, que nos permite concluir graficamente como cada um se comporta
frente ao risco. A funo-utilidade linear de Maurcio explicita seu comportamento
indiferente ao risco. Joo nitidamente se comporta com averso ao risco, como
mostra sua funo-utilidade convexa. A curva de Alexandre a mais difcil de ser
interpretada, pois o jogo oferecido apresenta baixa utilidade para ele. Se os
valores monetrios fossem superiores, perceberamos com maior clareza a forma
cncava de sua funo-utilidade.
Atravs deste exemplo simples e descontrado pudemos verificar como o
dinheiro apresenta utilidades variadas para os indivduos. E comprovamos atravs
de uma ferramenta quantitativa sem grandes complexidades matemticas, aquilo
que j espervamos: a loteria oferecida pelo milionrio excntrico apresenta maior
utilidade para Joo que para Mauro, e muito pouca utilidade para Alexandre.
Conforme apresentado anteriormente, a capacidade de absorver perdas
financeiras um dos critrios principais que definem o comportamento frente ao
risco. A tolerncia ao risco destes trs personagens pode ser vista de forma
anloga a das companhias de petrleo. Quanto maior a renda mensal, no caso
das pessoas fsicas, ou maior o capital exploratrio das empresas de petrleo,
maior a capacidade financeira de suportar perdas, e, conseqentemente, maior
tolerncia ao risco.
A apresentao terica e a aplicao prtica do conceito de Equivalente
Certo nos permite concluir que para determinado indivduo ou organizao existe
a mesma preferncia ou utilidade entre o recebimento da quantia do Equivalente
Certo e a participao no evento incerto e arriscado. Dessa forma:
Verificamos anteriormente que o decisor racional em condies de risco e
incerteza deixa de lado o critrio de maximizao do VME, que apresenta
limitaes, passando a adotar o de maximizao do VEU. Mas observamos pela
definio acima que atingiremos este objetivo atravs da maximizao da
utilidade do EqC, ou simplesmente pela prpria maximizao dele, uma vez que
quanto maior ele for, maior sempre ser sua utilidade para o tomador de deciso.
Portanto, no processo de tomada de deciso em investimentos sob risco e
incerteza devemos sempre buscar a maximizao do Equivalente Certo atravs
da definio do nvel timo de participao no projeto.
Parte V- Jogos Estticos com nformao ncompleta
Uma das novas idias mais importantes na economia que informao
privada constitui um recurso valioso cujo uso pode afetar o bem-estar econmico
e social tanto quanto o uso de trabalho, terra ou tecnologia. Aqui , "informao
privada quer dizer conhecimento sobre o estado do mundo que alguns jogadores
possuem, mas outros no. Exemplos de informao privada so a financeira de
uma empresa que alguns acionistas sabem qual e outros no; a disposio de
um candidato a um novo emprego tem de fazer horas extras de ltima hora que
no do conhecimento de seu empregador potencial; e os resultados de um
levantamento entre afiliados de um sindicato trabalhista sobre um novo contrato
de trabalho proposto por uma empresa e que no compartilhado com o
negociador da empresa. Tais casos so conhecidos como jogos com *nforma+,o
*n-ompleta4 tambm ditos jogos #a5esianos. Lembre-se que em jogos,
estticos e dinmicos, de informao completa, por definio, a funo de ganho
dos jogadores era de conhecimento comum. Em contraste, nos jogos de
informao incompleta, a funo payoff de pelo menos um dos jogadores no
ser de conhecimento comum, o que denota um elemento de incerteza na medida
em que pelo menos um jogador estar incerto sobre a funo payoff dos outros
jogadores.
Manteremos o formato que estamos seguindo desde o comeo e
apresentaremos primeiro jogos bayesianos estticos e posteriormente trataremos
de jogos dinmicos.
Um exemplo padro de jogos estticos de informao incompleta so
leiles fechados. Cada participante ("bidder) sabe a sua prpria avaliao do
bem leiloado mas no conhece as avaliaes dos demais participantes. O lances
("bids) so submetidos em envelopes fechados, de modo que os movimentos dos
jogadores podem ser considerados simultneos. No entanto, a maioria dos jogos
bayesianos interessantes economicamente so dinmicos. Como ns veremos no
prximo tpico, a existncia de informao privada leva naturalmente tentativas
da parte informada de se comunicar (ou enganar) e tentativas da parte no
informada de aprender e responder. Essas questes so inerentemente
dinmicas.
Na prxima seo vamos definir a forma de representar de um jogo
bayesiano esttico e a noo de equilbrio correspondente, qual seja equilbrio
bayesiano de Nash.
Como tais noes so mais complexas e abstratas do que as vistas at
aqui, faremos isso atravs de um exemplo, um oligoplio de Cournot sob
informao incompleta.
)ournot so# informa+,o in-ompleta
Considere um duoplio de Cournot padro em que as firmas escolhem
simultaneamente o quanto produzir. A curva de demanda inversa
P (Q) = a - Q e Q = q1 + q2
A funo custo da firma 1 dada por
C1 (q1) = cq1
e isso de conhecimento comum. J a funo custo da firma 2 no. Ela dada
por
A firma 1 no sabe ao certo qual a funo custo da firma 2 (essa firma
pode ser uma firma nova no mercado ou pode ter inventado uma nova
tecnologia): o que de conhecimento comum aqui a distribuio de
probabilidades sobre a eficincia da firma 2 e a prpria estrutura de informao,
no sentido de que a firma 1 sabe que 2 tem informao superior, a firma 2 sabe
que a firma 1 sabe isso e assim sucessivamente.
Como resolver esse jogo? Considere primeiro o caso da firma 2, a firma
que tem mais informao. Caso ela seja ineficiente, o seu problema ser
E analogamente, caso ela seja mais eficiente, vai
Decorre das CPOs dos problemas acima que
que so as melhores respostas que a firma 2 pode dar s escolhas de 1 caso ela
seja de custo alto ou de custo baixo.
J o problema da firma 1, a firma no informada, maximizar o seu ganho
esperado em funo da chance de 2 ser ou no eficiente. Ou seja, a firma 1
tal que as CPOs implicam que
tal que
ser a melhor resposta (esperada) que a firma 1 pode dar s escolhas de 2. Da
interseo dessas 3 equaes de melhores respostas segue que
Substituindo essa expresso acima em q2 (cH) e em q2 (cL), teremos as
demais ex- presses de equilbrio,
Analogamente, a firma 2 de custo baixo produzir
Logo em equilbrio as firmas produziro
A oferta esperada da indstria ser
Ou seja,
Logo
ou ainda,
tal que
O preo esperado por sua vez ser
J com relao aos lucros das firmas em equilbrio, observe que o lucro da firma 1
ser
Para mostrarmos que o raciocnio acima est correto, tome a funo lucro
da firma1 um pouco mais "aberta,
Ou seja,
tal que
exatamente a mesma expresso inicial. Como comum em Cournot, repare que
O lucro da firma 2 ineficiente, de custo alto, ser por sua vez
e portanto agora teremos , o que bastante comum em
Cournot.
Para podermos ter uma interpretao mais direta do lucro da firma 2 de
custo alto, considere a expresso abaixo
Logo
Analogamente para a firma 2 de custo baixo, teremos
de modo que o lucro dessa firma no ser negativo se e somente se
C ' representao na forma normal de um jogo :ayesiano estBtico com n
jogadores especifica os espaos das aDes dos jogadores '0 , 'E , F, 'n , os
espaos dos tipos dos jogadores T0 , TE , F, Tn , suas crenas p0, pE , F, pn ,
e suas funDes de gan6os u0, uE , F, un. & tipo ti do jogador i uma informao
pri2ada deste jogador, determina sua funo de gan6os ui+a0 , F, an G ti. , e
elemento do conjunto Ti dos poss?2eis tipos para este jogador. ' crena pi+t,iH ti.
do jogador i descre2e a incerte$a de i a respeito dos tipos poss?2eis t,i dos n,0
outros jogadores dado o tipo ti de i . @ste jogo denotado por G I { '0, 'E , F,
'n G T0 , TE , F, Tn G p0 , pE , F, pn G u0, uE , F, un }.J
Conforme Harsanyi, supe-se que inicialmente a natureza sorteia um vetor
de tipos ti Ti , segundo uma distribuio a priori de probabilidades p(t). A
natureza revela a cada jogador i seu tipo i, ignorado pelos outros jogadores. A
seguir os jogadores escolhem simultaneamente suas aes ai Ai . Finalmente
os ganhos ui(a1, ., an; ti) so distribuidos. Observe que desta maneira,
introduzindo o jogador fictcio natureza, um jogo com informao incompleta
transformado em jogo com informao imperfeita. Note que quando a natureza
revela ao jogador i seu tipo i, este e os outros jogadores podem calcular sua
crena pi(t-i| ti) segundo a regra de Bayes:
Note tambm que um jogador i pode dispor de informaes privadas
relativas as funes de payoff dos outros jogadores alm daquelas relativas a sua
funo de payoff. Neste caso sua funo de ganho depende dos tipos t1 , ., tn e
a escrevemos ui(a1 , ., an ; ti , ., tn ).
Defini+,o de um e"uil#rio de $ash #a5esiano: Uma estratgia pura para o
jogador i num jogo bayesiano esttico deve contemplar uma ao para cada tipo ti
possvel. Os conjunto Si das estratgias possveis o conjunto de todas as
funes com domnio Ti e contradomnio Ai :
*o jogo :ayesiano estBtico G I { '0, 'E , F, 'n G T0 , TE , F, Tn G p0 , pE , F, pn
G u0, uE , F, un } uma estratgia do jogador i uma funo si+ti. onde para cada
tipo ti Ti , si+ti. determina a ao pertecente ao conjunto das aDes poss?2eis 'i
>ue o tipo ti escol6eria se sorteado pela nature$a. 's estratgias sK I +s0K, F,
snK. so um e>uil?:rio de *as6 :ayesiano +em estratgias puras. se para cada
jogador i e para cada ti Ti , siK +ti. soluo de
Em outras palavras, a estratgia de cada jogador (ateno: uma estratgia
agora uma funo) deve ser a melhor resposta s estratgias dos outros.
67 Apli-a+8es
3.2.A Reinterpretando a estratgia mista (Harsanyi)
Um NE em estratgias mistas num jogo com informao completa pode ser
reinterpretando enquanto BNE em estatgias puras num jogo semelhante com um
pouco de informao incompleta. Exemplo: batalha dos sexos
3.2.B Leiles de primeiro preo, envelopes fechados com valores privados vi
distribuidos uniformamente e se as estratgias bi(vi) forem estritamente
crescentes e diferencaveis o nico BNE simtrico bi(vi) = vi /2.
3.2.C Jogos de dupla oferta
Neste jogo o vendedor e o comprador simultaneamente propem um preo de
venda pv e um preo de compra pc. A venda realizada a um preo p = (pv +
pc) / 2 somente se pc < pv.
Myerson e Satterthwaite obtiveram um importante resultado negativo: no
existe BNE onde uma troca voluntria ser realizada se ela for eficiente; por
exemplo se uma firma possui uma informao privada sobre a produtividade
marginal m de seu empregado e se este empregado possui uma informao
privada sobre seu salrio v de reservao, nenhum acordo voluntrio ocorrer se
for eficiente (i.e. se v > m).
Parte V Jogos Dinmicos com nformao ncompleta
Em um jogo dinmico, jogadores mal informados podem aprender alguma
coisa sobre o jogo observando os movimentos de oponentes mais bem
informados. Visto que incorporar tal aprendizado anlise difcil, comeamos
esta parte apresentando conceitos importantes, como o teorema de Bayes.
Teorema de Ba5es: Suponha que os eventos A1, ., Ak formem uma partio do
espao S de maneira que P(Ai) > 0, i , e seja B um evento tal que P(B) >0.
Ento
O teorema de Bayes oferece uma regra simples para calcular a
probabilidade condicional de cada evento Aj dado B a partir da probabilidade
condicional de B dado cada evento Aj e da probabilidade no condicionada
de cada evento Aj.
Exemplo: suponha que, conforme as estatsticas do ministrio da sade, a
probabilidade de ser portador de um virus seja de 1 / 10 000. Um teste permite
detectar esta doena com um grau de confiabilidade de 90 %(i.e. caso um
indivduo seja portador da doena e faa o teste, o resultado ser positivo em 90
% dos casos;enquanto que caso um indivduo no seja portador da doena e faa
o teste, o resultado ser positivo em 10% dos casos). Voc realiza o teste e o
resultado positivo. Qual agora sua probabilidade de ter esta doena (no 90
% !)? A resposta 9 / 10 000 .
!"uil#rio Ba5esiano
Para um jogo bayesiano, define-se um e>uil?:rio %ayesiano como sendo
um equilbrio de Nash da representao tipo-agente do jogo bayesiano em forma
normal. Portanto, um equilbrio bayesiano especifica uma ao pura ou uma
distribuio de probabilidades sobre as aesbpara cada tipo de cada jogador de
forma que cada um desses tipos maximiza sua utilidade esperada quando ele
sabe o seu tipo mas no sabe o tipo dos demais jogadores. Note que em um
equilbrio bayesiano, a estratgia de um jogador depende apenas do seu tipo mas
no dos tipos dos outros jogadores. Conforme explicamos, uma estratgia deve
especificar uma ao para cada tipo de jogador no apenas para o verdadeiro
tipo, pois caso contrrio no poderamos determinar a utilidade esperada dos
outros jogadores que no sabem qual o verdadeiro tipo dos demais.
Formalmente, um equilbrio bayesiano em estratgias mistas de um jogo
bayesiano F: qualquer perfil de estratgias L M i* MtiTi A()i) tal que para
todo i * e ti Ti,
onde Lj(cj Htj) a probabilidade com que o tipo tj do jogador j escolhe ao cj .
Exemplo: Considere um jogo bayesiano com dois jogadores, suponha que
)1={91, y1}, )2 = {92, y2}, T1 = {1}, T2 = {2.1, 2.2}, p1(2.1H1) = 0,6, e as utilidades
so dadas nas tabelas a seguir:
Para o tipo 2.1:
Para o tipo 2.2:
Neste jogo, y2 uma estratgia fortemente dominada para o tipo 2.1 e 92
fortemente dominada para o tipo 2.2, ento 2.1 deve escolher 92 e 2.2 deve
escolher y2. Portanto, para o tipo 1, temos que a utilidade esperada de 91 0,6 e
a utilidade esperada de y1 0,4. Portanto, o nico equilbrio bayesiano deste jogo
: L1(91H1) = 1, L2(92H2.1) = 1, e L2(y2H2.2) = 1.
Exemplo: Considere o seguinte jogo Bayesiano no qual o jogador 1 pode ter tipo
N ou O, onde segundo o nico tipo do jogador 2, jogador 1 do tipo N com
probabilidade 0,9. As utilidades dos jogadores so dadas de acordo com o as
tabelas a seguir:
Para o tipo N:
Para o tipo O:
Note que existem trs equilbrios Bayesianos neste jogo: (1) L2(92) = 1, L1(91HN)
= 1, e L1(y1HO) = 1; (2) L2(y2) = 1, L1(y1HN) = 1, e L1(y1HO) = 1; e (3) L2(92) = 1P2,
L1(91HN) = 5P9, e L1(y1HO) = 1.
Exemplo: Suponha que duas pessoas esto envolvidas em uma disputa. Pessoa
1 no sabe se a pessoa 2 forte ou fraca; ela associa probabilidade N a pessoa 2
ser forte. Pessoa 2 est perfeitamente informada. Cada pessoa pode lutar ou se
entregar. Cada pessoa recebe uma utilidade 0 se ela se entregar no importa o
que a outra pessoa faa. Alm disso, cada pessoa recebe uma utilidade 1 se ela
lutar e seu adversrio se entregar. Se ambas pessoas lutarem, ento suas
utilidades so (#1; 1) se a pessoa 2 for forte e (1;#1) se a pessoa 2 for fraca.
Formulando esta situao como um jogo Bayesiano e encontrando os equilbrios
bayesianos se N Q 1 2 e se N R 1 2 .
Soluo: O jogo Bayesiano : * = {1, 2}; )i = {(,@}, i *; T1 = {1}; T2 = {St,Sr};
p(StH1) = N; e as utilidades so dadas por:
T se o jogador 2 for forte:
T se o jogador 2 for fraco:
Seja L1((), L2((HSt), e L2((HSr) o perfil de estratgias misto. Ento, a
utilidade esperada do jogador 2 forte de lutar 1, e de se entregar 0. Logo, este
tipo do jogador 2 sempre luta, isto em qualquer equilbrio Bayesiano L2((HSt) =
1. A utilidade esperada do jogador 2 fraco de lutar #L1(() + (1 # L1(()), e de se
entregar 0. Portanto, ele ir lutar se L1(() Q 1 2 ; se entregar se L1(() R 1 2 ; e
indiferente se L1(() = 1 2 . A utilidade esperada do jogador 1 de lutar N[L2((HSt)
M (#1) + (1 # L2((HSt))] + (1 # N) = 1 # 2NL2((HSt), e de se entregar 0. Portanto,
ele ir lutar se NL2((HSt) Q 1 2 ; se entregar se NL2((HSt) R 1 2 ;
e est indiferente se NL2((HSt) = 1 2 . Como j vimos que em todo equilbrio
Bayesiano L2((HSt) = 1, ento o jogador 1 ir lutar se N Q 1 2 , e se entregar se N
R 1 2 . Logo, se N Q 1 2 ; ento o nico equilbrio bayesiano dado por L1(() = 1;
L2((HSt) = 1; e L2((HSr) = 0.
Se N R 1 2 ; ento o nico equilbrio bayesiano dado por L1(() = 0; L2((H
St) = 1; e L2((HSr) = 1.
Em um problema de deciso ter mais informao nunca prejudicial, pois o
tomador de deciso pode sempre ignorar a informao recebida. Em um jogo, isto
nem sempre verdade. Se um jogador possui mais informao e os outros
jogadores souberem disso, ento o jogador pode estar numa situao pior como
mostra o seguinte exemplo.
Exemplo: Considere que ambos jogadores consideram igualmente provveis que
esto participando dos seguintes jogos, onde 0 Q Q 1 2 :
Ou
Ento, a estratgia ( estritamente dominante para o jogador 2, pois se 1
escolher T, ( ter uma utilidade esperada de 2 enquanto ; e U tero utilidade
2 , e se 1 escolher %, ( ter utilidade esperada 2, enquanto ; e U tero
utilidade esperada 3 2 . Sabendo disto, 1 ento escolher % e no nico equilbrio
de Nash, teremos que ambos jogadores recebem 2.
Suponha agora que o jogador 2, antes do jogo recebe um sinal indicando
qual o verdadeiro jogo. Neste caso, a estratgia U estritamente dominante
para o tipo do jogador 2 que acredita que o jogo o primeiro, enquanto que a
estratgia ; estritamente dominante para o tipo do jogador 2 que acredita que o
jogo o segundo. Sabendo disto, o jogador 1, escolher T. Ento, neste equilbrio
o jogador 1 recebe 1 enquanto o jogador 2 recebe 3 Q 2.
Ento, ambos os jogadores saem perdendo com a informao extra
adquirida pelo jogador 2.

Teoria Dos Jogos Resumo

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Teoria Dos Jogos Resumo

Hochgeladen von

Copyright:

Verfügbare Formate

UnB- Universidade de Braslia

Projeto: Jogos Aplicados Promoo do Desempenho Cognitivo de dosos (ProDC)

Das könnte Ihnen auch gefallen